Laufende Promotionen

Promotion Matthias Müller


Titel: Heterogenität in verteilten Digitalen Bibliotheken
Eine Potentialanalyse semantischer Transformationen


Bei der Integration unterschiedlicher Datenbestände zu einer verteilten digitalen Bibliothek sind vorwiegend zwei Problembereiche zu lösen: zum einen heterogene Informationsstrukturen und zum anderen heterogene Informationserschließungen. Während das Problem heterogener Informationsstrukturen seit vielen Jahren behandelt wird und auch erste Erfolge in Form von standardisierten Metadatenschemata zu verzeichnen sind, fand der Bereich heterogener Informationserschließung bislang wenig Beachtung. Erst das Konzept semantischer Transformationen ermöglicht eine integrierte Recherche in unterschiedlich erschlossenen Datenbeständen mit praktikablem Aufwand. Semantische Transformationen sind automatische 'Übersetzungen' zwischen verschiedenen Thesauri oder Klassifikationen, die es dem Benutzer erlauben, mit nur einer Anfrage unterschiedlich erschlossene Datenbestände sinnvoll zu durchsuchen. Ziel der Arbeit ist die Untersuchung und Aufarbeitung dieses wenig erschlossenen Konzepts. Dazu sind Grundlagen u. a. aus den Bereichen 'allgemeine Eigenschaften', 'Einsatzgebiete' und 'Systemarchitekturen' zu erarbeiten. Schwerpunkt der Arbeit ist die Bestimmung der Leistungsfähigkeit unterschiedlicher Realisierungen semantischer Transformationen. Zur Durchführung der hierzu erforderlichen Evaluationen ist die Entwicklung entsprechender Methoden, Verfahren und Programme notwendig.

Promotion Heiko Hellweg


Titel: DocTask


Ziel dieser Arbeit ist die Identifikation von angemessenen Abstraktionsebenen und die Entwicklung geeigneter Beschreibungsmittel zur Konzeption und zur Umsetzung von organisatorischen und technischen Lösungen für die Unterstützung dokumentarischer Aufgaben im Rahmen von internetbasierten Informationsdiensten für die wissenschaftliche Informations- und Literaturversorgung.

In einer Zusammenführung existierender Konzepte und praktischer Projektergebnisse wird das DocTask Modell entwickelt, in dem die Aspekte der Dokumentenmodellierung, der Zuständigkeitsbeschreibung sowie der Kontrollflussbeschreibung als gleichberechtigte Standbeine in der Modellierung von Informationserschließungsprozessen genutzt werden. Die hier entwickelten Konzepte und Sprachen dienen der Beschreibung eines dynamischen Objektmodells, in dem Prozesse der Arbeitsteilung und Kooperation gleichberechtigt mit Prozessen im Sinne der Komposition komplexer Abläufe aus wiederverwendbaren Bausteinen (programming at the large) repräsentiert werden, um dokumentenabhängige Vorgänge zu realisieren.

Das DokTask Modell ist im IZ Sozialwissenschaften im Kontext des DFG-geförderten Projektes "DBClear" entstanden, in dem ein generisches System für Aufbau und Pflege fachwissenschaftlicher "Subject Gateways" konzipiert und implementiert wurde.

Promotion Xueying Zhang


Titel: Rough Set Theorie-basierte Textrepräsentation und Textklassifikation Zusammenfassung


Die großen Mengen an Information in Form elektronisch verfügbarer Texte wie zum Beispiel die Webdokumente wachsen ständig. Eine der geläufigsten Techniken zur automatischen Handhabung großer Sammlungen von Textdokumenten ist die automatische Textklassifikation. Die Lernmaschine wird jetzt weithin in diesem Gebiet angewendet. Diese Dissertation behandelt verschiedene Teilaufgaben der automatischen Textklassifikation von Webdokumenten, die auf der Rough Set Theorie basieren. Zuerst wird ein effektives Rough Set Theorie-basiertes Modell zur Konzeptintegration unterschiedlich erschlossener Dokumentsysteme vorgestellt. Zweitens wird ein neues Modell zur Textpräsentation über Sätze entwickelt. Ohne relevante Dokumentsätze kann das Modell die Indexierungsterme eines Webdokuments direkt extrahieren. Drittens werden neue Rough Set Theorie-basierte Klassifikationsalgorithmen eingesetzt, die Entscheidungsregeln, Approximationsregeln und Matchingregeln in wirksamer Weise formulieren können. Dabei dienen die Support Vector Machine und die vorgeschlagenen Klassifikationsalgorithmen in dieser Dissertation als Vergleichsbasis. Dann wird die Verbindung zwischen der Konzeptintegration und dem Klassifikationssystem im Experiment untersucht, um die Klassifikationsqualität zu verbessern. Schließlich wird die Performanz des Klassifikationssystems anhand verschiedener Maße wie Recall, Precision, F-Maß und E-Maß evaluiert.