Semantik skaliert in der Cloud: Universität Koblenz gewinnt Billion Triples Challenge
Der Weg zum Web 3.0 wurde eröffnet
Das Web 2.0 kennt jeder: Wikipedia, Google Maps, Verzeichnisstrukturen wie in WordNet, Flickr, Sammlung von Ortsnamen und vieles mehr ist mittels weniger Klicks sichtbar. Die Verknüpfung dieser Informationen ist aber schwierig und zeitaufwändig und nicht mit klassischen Informationssystemen zu leisten. Abhilfe verspricht das Semantic Web, das Informationen verknüpfen kann und damit komplizierte Anfragen erlaubt. Zum Beispiel: Wo finde ich Streetart in Berlin und wie sieht diese auf Fotos aus?
Bisher aber hatten semantische Technologien einen bestenfalls bescheidenen Ruf: zu kompliziert, zu langsam, zu teuer lautete das Credo vieler IT-Experten. Um zu demonstrieren, wie weit der Ruf der rasanten Entwicklung des Semantic Web hinterherhinkt, initiierten Peter Mika (Yahoo!) und Jim Hendler (RPI) die Billion Triples Challenge auf der siebten Internationalen Semantic Web Konferenz. Die Aufgabe bestand darin, eine große Menge von mehr als einer Milliarde (amerik. „billion“) schlecht strukturierter Fakten, die aus öffentlichen Quellen wie Wikipedia und semantischen Homepages gesammelt wurden, hocheffizient zu verwalten und interessante Beziehungen dem Nutzer intuitiv zugänglich zu machen.
Am Besten löste das Forscherteam um Prof. Steffen Staab von der Universität Koblenz-Landau diese Aufgabe. Ihr System „Semaplorer“ bietet sowohl eine klassische Suche nach Stichworten als auch eine inhaltsbasierte Navigation durch Verknüpfung von Fakten. Zum Beispiel öffnet die Suche nach „Berlin“
als erstes einen passenden Stadtplan, in dem wiederum weitere Informationen, wie Berliner Persönlichkeiten, Sehenswürdigkeiten oder Spezialitäten dargestellt werden. An dieser Stelle lässt sich die Suchanfrage sowohl schlagwortbasiert als auch semantisch verfeinern: der „Reichstag“ liefert sowohl passende Fotos im Umfeld dieses Bauwerks samt deren Fotographen als auch aktuelle Informationen aus Wikipedia.
Damit diese Vielzahl von Informationen und Querbeziehungen interaktiv dargestellt und genutzt werden konnten, wurde die Informationssuche mittels der speziell entwickelten semantischen Technologie der „Networked Graphs“ auf 25 Rechner verteilt. Da dies die verfügbaren Rechenresourcen der Arbeitsgruppe „ISWeb – Informationssysteme und Semantic Web“ bei weitem überstieg, hat man sich der Amazon Cloud bedient und das Computing teilweise in Koblenz und teilweise in den USA durchgeführt.
Prof. Staab kommentiert den Erfolg so: „Wir haben mit der Entwicklung des Semaplorer-Systems erstmals gezeigt, dass die Vision des Web 3.0 – also die Weiterentwicklung von Web 2.0 zu einem System mit Semantik – funktioniert. Bisher gab es dies nur für Spielbeispiele.“ Auch erste kommerzielle Interessenten gab es, z.B. auf der Koblenzer LocalBit, auf der das System zeitgleich zum Billion Triples Wettbewerb der Öffentlichkeit präsentiert wurde.
Zum Projektteam „Semaplorer“ gehörten neben dem Leiter der Forschungsgruppe, Prof. Dr. Steffen Staab, der Projektkoordinator und Multimedia-Experte Dr. Ansgar Scherp, die Semantik-Experten Dipl.-Wirtinf. Simon Schenk, Dipl.-Inf. Carsten Saathoff und die Informatikstudenten Anton Baumesberger, Frederic Jochum und Alexander Kleinen. Die Auszeichnung wurde von einer internationalen Jury auf der mit über 620 Teilnehmern bislang erfolgreichsten Semantic Web Konferenz verliehen und ist mit einem Preisgeld von 1000 Euro verbunden.
Die Forschungsarbeit wurde von der EU gefördert im Rahmen der ICT Projekte NeOn, k-space und WeKnowIt.
Weitere Informationen:
http://btc.isweb.uni-koblenz.de
Date of news 2008-10-30 08:00
last modified 2010-02-18 17:17
Kontakt