4Cats - Special Interest Group on Web Science
Koordinator: Dr. Dr. Sergej Sizov
Teilnehmer: Klaas Dellschaft, Rabeeh Abbasi, Nasir Naveed, Antje Schultz
Unsere Motivation:
Web 2.0 ist ein Sammelbegriff für zahlreiche kollaborative Online-Anwendungen, die seit einigen Jahren das Web erobern. Ob Content Sharing (YouTube, Flickr, del.icio.us), Question Answering (Lycos IQ, Yahoo! Answers), Blogs oder Tweets - einiges haben die sozialen Medien gemeinsam:
- viele / zahlreiche Benutzer (tendenz steigend)
- viel Inhalt (Millionen von Bildern, Videos)
- spärliche, unvollständige, teilweise verzerrte und verrauschte Metadaten (z.B. Tags, User-Bewertungen, etc.)
Fazit: es gibt im Web 2.0 viel zu entdecken.. aber die Entdeckungsreise kann manchmal weit und langwierig werden!
Unsere Mission:
- Die Inhalte besser verstehen! Und zwar durch multi-modale Interpretation der Web 2.0 Inhalte, die verschiedene Aspekte (z.B. low-level Bilddaten, tags, Geokoordinaten, Timestamps) in einem Modell integriert. Dadurch ergeben sich interessante Anwendungen: bessere Suchmaschinen für Web 2.0, persönliche Recommender, oder auch automatisiertes Tagging von neuen Inhalten.
- Die Community besser verstehen! Durch mathematische Modellierung und Simulation versuchen wir, globale Entwicklungsmuster der Folksonomien zu beschreiben. Was motiviert die Menschen, Inhalte mit anderen zu teilen? Wie sucht der Mensch passende Tags zu seinen Bookmarks aus?
Aus unserem Kochbuch:
man vermische im Bayesian Modell geeignete Verteilungen, füge reale Daten hinzu, führe im offenen Modellierungs-Framework (z.B. JAGS) bei hoher Prozessortemperatur 3-4 Stunden lang die Parameterschätzung mittels Gibbs Sampling, zwischendurch kontrolliere Konvergenz der Schätzer. Die Resource-spezifischen Themen-Verteilungen in geeigneter Anwendung (thematische Suche, Tag recommendation) cool servieren.
Übrigens: wir kochen im thematisch fokussierten sozialen Netzwerk! Zu unseren engen Verbündeten gehören renommierte Forschungspartner (U Southampton, L3S Hannover), etliche "big player" der Industrieforschung (Yahoo! Research, IBM Research, SAP Research). Unsere Arbeit ist in mehrere DFG- und EU-Forschungsprojekte (Tagora, WeKnowIt, Multipla) integriert. Das bedeutet:
- spannende interdisziplinäre Zusammenarbeit
- Forschungsaufenthalte bei den Partnern (und der Partner bei uns)
- erlesene Zutaten (ähm Datensätze), die hat wirklich nicht jeder
Sei dabei: wir bieten interessante Themen für Master- und Diplomarbeiten (sowie ggf. Bachelor und Praktika) in den Bereichen: multimodale Web 2.0 Inhaltsanalyse, Simulation von Folksonomien, Skalierbarkeit der Suche und der Datenverwaltung im Web 2.0.
Kontakt
