Multilinguales Retrieval mit Konkordanzinformationen
Laufzeit: März 2010 bis Juni 2010
Beteiligte Personen
Geldgeber
Deutsche Nationalbibliothek
Kurzbeschreibung
Das Projekt verfolgt das Ziel, mit Hilfe semantischer Technologien Verknüpfungen zwischen Sachschlagwörtern der Schlagwortnormdatei (SWD) und Klassen der Dewey-Dezimalklassifikation (DDC) zu repräsentieren. Die SWD und DDC werden von deutschen und internationalen Bibliotheken dafür verwendet, ihre Bestände zu erschließen. Die Verknüpfung von SWD und DDC soll später dafür genutzt werden, DDC-erschlossene Bestände mit Hilfe von SWD-Schlagwörtern durchsuchen zu können und umgekehrt.
Um eine hohe Qualität der Verknüpfungen sicherzustellen, wurden diese manuell im Rahmen des DFG-geförderten CrissCross-Projekts erstellt. Da die Bedeutungsumfänge von SWD-Schlagwörtern und DDC-Klassen aber nur selten exakt aufeinander abgebildet werden können, wurden die Verknüpfungen mit Determiniertheitsgraden versehen. Der Determiniertheitsgrad gibt Auskunft über die Stärke der Beziehung zwischen Schlagwort und DDC-Klasse. Er kann somit durch ein Retrievalsystem für ein Ranking sowie zur Steuerung von Precision und Recall genutzt werden.
Diese Verknüpfungen sollen nun im Rahmen der Linked Data-Aktivitäten der Deutschen Nationalbibliothek einer breiteren Öffentlichkeit zur Verfügung gestellt werden. Als Grundlage soll dabei die SKOS-Spezifikation dienen. Allerdings entsteht dabei das Problem, dass die in CrissCross verwendeten Determiniertheitsgrade nicht ohne weiteres auf die in SKOS definierten Verknüpfungstypen abgebildet werden können.
Im Rahmen des Projekts sollen deswegen die verwendeten Determiniertheitsgrade und deren Auswirkungen auf das Information Retrieval genauer analysiert werden. Außerdem soll ein Vorschlag erarbeitet werden, wie die Determiniertheitsgrade im Rahmen einer Erweiterung der SKOS-Spezifikation repräsentiert werden können.
Kontakt