Datenbanken und Informationsverarbeitung

Vorlesungs- & Prüfungsinhalte zu Datenbanken und Informationsverarbeitung

Die Vorlesung bereit die Nutzung von Datenbanksystemen auf zwei Ebenen vor:

  • Statistische Nutzung von Daten: Daten sollen von Studierenden aus einem Datenbanksystem für bestimmte Forschungsfragen in Hausarbeiten, Fallstudien oder Abschlussarbeiten extrahiert werden können, um diese mit statistischen Methoden (Inhalte der Statistikvorlesung) bearbeiten und analysieren zu können.
  • Geoinformationssysteme: Räumliche Analysen für umweltwissenschaftlichen Fragestellungen werden z.B. mit Geoinformationssystemen bearbeitet (z.B. GRASS-GIS, Quantum-GIS, SAGA-GIS, ...). Hinter einem Geoinformationssystem liegt ein Datenbanksystem (PostGIS, MySQL, ....). Um die Daten für die räumliche Darstellung vorzubereiten und räumliche Daten mit Daten aus anderen Quellen zu verschneiden, sind Datenbankoperation erforderlich.

Aus den oben genannt (nicht notwendigerweise vollständigen Anwendungsfällen ergeben sich die notwendigen Konsequenzen für Prüfungsinhalte und die Nachbereitung der Vorlesungsinhalte:

  1. Datenbanksysteme: Welche Datenbanksysteme gibt es und für welches Einsatzgebiet werden diese verwendet? Angefangen von der Tabellenkalkulation (z.B. LibreOffice Calc, Excel,....) über Datenbanksystem (LibreOffice Base, Access...), die am Einzelplatzrechner bearbeitet werden und Datenbanken mit Nutzermanagement und guter Nutzrbarkeit in einem Netzwerk, das mehreren Benutzern den Zugriff auf bestimmte Datenbanken für bestimmte Fragenstellungen erlaubt. Abschließend werden Objektorientierten Datenbanksystemen behandelt, bei denen Datenstrukturen und Prozesse (Methoden) in einem Objekt abgespeichert werden.
  2. Relationale Datenbanksysteme - Grundstruktur: Wie sind relationale Datenbanksysteme grundlegend aufgebaut (Datenbank - Tabelle - Datensatz - einzelnes Datum und Relationen zwischen Daten) und welche Gemeinsamkeiten und Unterschiede bestehen zwischen den Datenbanksystemen. Wie kann man relationale Beziehung in PostGIS, MySQL, .... aufbauen und welche Möglichkeiten gibt es diese Datenstrukturen z.B. auch in einer Tabellenkalkulation abzubilden.
  3. Datenbankentwurf: Ausgehend von einer inhaltichen Beschreibung einer Forschungsfrage ist die Datenbankstruktur zu entwickeln. Z.B. werden Agrochemikalien an unterschiedlichen Orten unterschiedlich stark eingesetzt. Ferner treten Krankheiten in bestimmten räumlichen Mustern bei Planzen, Tieren und/oder Menschen auf. Bei einer Untersuchung soll der Zusammenhang zwischen der Nutzung von Argochemikalien und der Verbreitung von Krankheiten untersucht werden. Von den Studierenden soll ein umweltwissenschaftliches Scenario in einen Datenbankentwurf übertragen werden.  D.h. z.B.: welche Tabellen und Relationen sind für diese Fragestellung notwendig Ein Objektorientierter Datenbankentwurf kann z.B. mit ArgoUML erstellt werden und in eine SQL-Datenbank abgebildet werden. In den Umweltwissenschaften treten immer wieder graphentheoretische Bäume (z.B. phylogenetischer Baum) oder Netzwerke zwischen trophischen Stufen auf. Ein Datenbankentwurf kann diese Netzwerke in Relationale Datenbanken oder auch in eine Tabellenkalkulation mit SVERWEIS abbilden. 
  4. SQL-Befehle: Um einen Datenbankentwurf aus 3. in eine real existieren Datenbank überführen und auch gezielt Informationen aus den Datenbanken herauslesen zu können, ist i.d.R. SQL erforderlich. Dies ist zum Beispiel erforderlich, wenn Sie aus einer Daten alle Orte herausfiltern wollen, in den eine Grenzwertüberschreitung von bestimmten Argochemikalien aufgetreten ist und aus einer anderen Tabelle die Orte aus der Datenbank extrahieren, an denen bestimmte Krankheitsbilder bei Menschen, Tieren und/oder Pflanzen aufgetreten sind. Strukturgleich kann man, wie in der Vorlesung behandelt, die Datenbankrelation auch in Tabellenkalkulation abbilden.

Interaktive DB-Übungen: Falls Sie den Umgang mit relationalen Datenbanksystemen für die Klausur üben wollen, müssen Sie (wie bereits in der Vorlesung angegeben) nicht notwendigerweise einen PostGIS-Server oder einen MySQL-Server installieren.

  • Online MySQL-Übungen: In dem Online-Tutorial können Sie sich die einzelnen Befehle noch einmal ansehen (z.B. SELECT, INNER JOIN, ...) ansehen, deren Funktionsweise mit "Try It" auf einer Beispieldatenbank überprüfen und sich am Ende auch selbst in einem SQL-Quiz testen.
  • Post-GIS Übungen: In den Online-Übungen finden Sie auf der linken Seite im Fenster, die schrittweisen HInweise, wie man mit den vorinstallierten Karten arbeiten kann. Neben den SQL-Befehlen kann man in dieser Online-Lernumgebung auch die Wirkung von SQL-Befehlen auf Karten ansehen. Diese Online-Übungen stellen die Beziehung zu räumlichen Karten her.

Die Übungen helfen Ihnen dabei, Datenbanken und SQL gezielt für umweltwissenschaftliche Fragenstellungen und auch Klausurfragen einzusetzen.

Da den Studierenden in der Klausur i.d.R. kein Rechner zur Verfügung steht, haben die Klausurfragen die folgende Struktur:

  • Qualifzierte Begründung für die Auswahl eines Datenbanksystems: Begründen Sie, warum Sie für die Fragenstellung ein bestimmtes Datenbanksystem einsetzen und nennen Sie die Vorteile und Nachteile für das Anwendungsbeispiel im Vergleich zu den anderen nicht gewählten Systemen. Daran kann man erkennen, ob Sie die die Vorteile und Nachteile kennen und miteinandere abgleichen können. Nicht die abschließende Entscheidung für oder gegen ein Datenbanksystem wird bewertet, sondern die qualifizierte Einbeziehung der Vor- und Nachteile für das Anwendungsbeispiel.
  • Fachliche umweltwissenschaftliche Fehler im Datenbankdesign: Wenn Sie einen Datenbankentwurf mit Beispieldaten erläutern, wird in der Klausur die umweltwissenschaftliche Korrektheit der Beispiele nicht bewertet. Ob z.B. eine bestimmte genannte Vernetzung zwischen trophischen Stufen tatsächlich in einem Ökosystem auch existiert, wird nicht bewertet, sondern die logische Konsistenz des Datenbankentwurf, ob tatsächlich mit dem vorgeschlagenen Datenbankentwurf eine trophische Vernetzung abgebildet werden kann.
  • Konkrete Umsetzung z.B. in SQL: Mit einzelnen gegebenen Teilaspekten in einem Datenbankentwurf sollen bestimmte Lösungen z.B. in SQL oder einer Tabellenkalkulation angegeben werden. Neben den grundlegenden Operation in den Datenbanksystemen geht es insbesondere darum, wie aus einem relationalen Datenbankentwurf Relationen verwendet werden, um daraus wieder eine Tabelle für die Anwendung zu generieren. Z.B. sollen zum allen Grenzwertüberschreitungen an einem Areal A die prozentualen Krankheitsfällen bezogen auf die Gesamtzahl in dem Areal A lebenden Individuen in einer Tabelle angegeben werden. Dazu muss z.B. die Gesamtzahl aus einer Individuen in dem Areal A aus einer Tabelle extrahiert werden und die Anzahl der erkrankten Individuen in dem Areal aus einer Tabelle mit den Krankheitsfällen aus einer Erhebung. Verwendung findet dabei der Befehl INNER JOIN mit Bezügen zu den in der Aufgaben genannten Tabellen).

Videohilfen: Falls Sie die Übungen aus der Vorlesung noch einmal in Ruhe mit HIlfe von Screencast-Videos nachvollziehen möchten, helfen Ihnen vielleicht die folgende Links: