Data Mining

Zielgruppe

  • Master Informationsmanagement
  • Master Wirtschaftsinformatik

Dozent

  • Michael Möhring

Leistungsnachweis

  • Klausur + Übungen (6 ECTS-Punkte)

Überblick

Data Mining bezeichnet ein aktuelles, stark expandierendes Forschungs- und Anwendungsfeld, das sich mit der Entwicklung und Anwendung von Methoden und Softwaresystemen zur Extraktion von Informationen aus großen Datenmengen befaßt:

Data Mining, is the exploration and analysis, by automatic or semiautomatic means, of large quantities of data in order to discover meaningful patterns and rules (Berry/Linoff, 1997)

Hintergrund hierfür ist das starke Anwachsen digital verfügbarer Daten, verursacht insbesondere durch den hohen Anstieg automatisierter Datenerfassung von elektronisch unterstützten Transaktionen in Wirtschaft, Wissenschaft und Verwaltung (z.B. Kundenverwaltung, POS-Daten, Telekommunikationsprotokolle). Die Aufbereitung und Extraktion ,,nützlicher'' Informationen aus diesen sehr großen Datenmengen für dispositive Zwecke, d.h. zur Entscheidungsunterstützung bei Planungs- und Kontrollaufgaben, hat insbesondere zur Entwicklung neuer Analysemethoden und -werkzeugen geführt, wie zum Beispiel aus dem Bereich des maschinellen Lernens (Neuronale Netze, Entscheidungsbäume, etc.), mit denen die klassischen Methoden der Statistik (Clusteranalyse, Diskriminanzanalyse etc.) ergänzt und erweitert werden.

Ausgehend von Prozessmodellen für die Durchführung vollständiger Data Mining Projekte im betrieblichen Umfeld, liegt der Schwerpunkt von Data Mining I in der Vorstellung und Diskussion grundlegender Techniken des Data Mining und ihre beispielhafte Anwendung an konkreten Datensätzen unter Verwendung spezieller Data Mining Werkzeuge (z.B.PASW Modeler, SAS Enterprise Miner)

Gliederung

  • Grundlagen
    • Einleitung/Motivation
    • Entwicklung/ Data Mining vs. Statistik
    • Prozessmodelle (-> CRISP-DM)
    • Data Warehouse & Data Mining, Business Intelligence
  • Data Mining Aufgaben/Techniken
    • Datenbeschreibung/Visualisierung
    • Segmentierung
      • Clusteranalyse
      • Self-Organizing Maps
    • Linkanalyse/Sequence Pattern Detection
      • Assoziationsregeln
      • Sequence Pattern
    • Klassifikation
      • Entscheidungsbäume
      • Diskriminanzanalyse
      • Lineare/Logistische Regression
      • Feedforward Backpropagation Networks
      • Support Vector Machine, ...

Literatur (zum Teil im "Semesterapparat Möhring" in der Bibliothek)