htw saar
Zurück zur Hauptseite

Version des Moduls auswählen:

flag

Data Engineering

Modulbezeichnung: Data Engineering
Modulbezeichnung (engl.): Data Engineering
Studiengang: Kommunikationsinformatik, Master, ASPO 01.10.2017
Code: KIM-DE
SWS/Lehrform: 3V+1U (4 Semesterwochenstunden)
ECTS-Punkte: 6
Studiensemester: 2
Pflichtfach: ja
Arbeitssprache:
Deutsch
Erforderliche Studienleistungen (gemäß ASPO):
Übungen
Prüfungsart:
Klausur
Zuordnung zum Curriculum:
KIM-DE Kommunikationsinformatik, Master, ASPO 01.10.2017, 2. Semester, Pflichtfach
PIM-DE Praktische Informatik, Master, ASPO 01.10.2017, 2. Semester, Pflichtfach
Arbeitsaufwand:
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
Empfohlene Voraussetzungen (Module):
Keine.
Als Vorkenntnis empfohlen für Module:
Modulverantwortung:
Prof. Dr. Klaus Berberich
Dozent: Prof. Dr. Klaus Berberich

[letzte Änderung 27.09.2016]
Lernziele:
Nach erfolgreichem Absolvieren dieses Moduls sind Studierende in der Lage große Mengen strukturierter und unstrukturierter Daten zu beherrschen. Sie kennen den grundsätzlichen Aufbau eines (relationalen) Datenbanksystems und sind mit Implementierungstechniken (z.B. Indexstrukturen und Sperrmechanismen) sowie deren Nutzen (z.B. Anfragebeschleunigung und Transaktionsisolation) vertraut. Die Studierenden können transaktionsorientierte (OLTP) und analytischen (OLAP) Anwendungsszenarien voneinander abgrenzen. Sie kennen die Grundbegriffe sogenannter Data Warehouses und können analytische Informationsbedürfnisse in einer geeigneten Anfragesprache (z.B. SQL und MDX) ausdrücken. Zur Beherrschung unstrukturierter Daten (z.B. Textdokumente) kennen die Studierenden grundlegende Modelle des Information Retrievals (z.B. Vektorraummodell) und können diese auf Beispieldaten anwenden. Sie kennen Gütemaße (z.B. Präzision und Ausbeute) und können diese für ermittelte Ergebnisse berechnen. Als Mittel zum Erkenntnisgewinn aus Daten kennen die Studierenden Verfahren des Data Minings, beispielsweise zur Analyse von Warenkörben. Die Studierenden sind in der Lage, die Parameter solcher Verfahren systematisch festzulegen und die zurückgelieferten Ergebnisse kritisch zu beurteilen. Zur verteilten Verarbeitung großer Datenmengen kennen die Studierenden verschiedene verfügbare Plattformen (z.B. MapReduce und Spark). Sie sind in der Lage für eine gegebene analytische Aufgabe eine geeignete Plattform auszuwählen und die Aufgabe mit Hilfe dieser zu implementieren.

[letzte Änderung 18.10.2016]
Inhalt:
1. Einführung
 
2. Datenbanksysteme
2.1 Architektur
2.2 Pufferverwaltung
2.3 Zugriffsstrukturen
2.4 Anfragebearbeitung
2.5 Transaktionsverwaltung
 
3. Data Warehouses
3.1 Modellierung
3.2 Datenintegration
3.3 Anfragesprachen
3.4 Implementierungsaspekte
 
4. Information Retrieval
4.1 Retrievalmodelle
4.2 Gütemaße und Evaluation
4.3 Implementierungsaspekte
 
5. Data Mining
5.1 Klassifikation
5.2 Clusteranalyse
5.3 Assoziationsanalye
 
6. Big Data
6.1 Plattformen (z.B. MapReduce und Spark)
6.2 Schnittstellen (z.B. Pig und Hive)
6.3 Umsetzung ausgewählter Verfahren (z.B. k-Means und PageRank)

[letzte Änderung 18.10.2016]
Lehrmethoden/Medien:
Folien, vorlesungsbegleitende praktische und theoretische Übungen.

[letzte Änderung 18.10.2016]
Literatur:
Kemper Alfons und Eickler André: Datenbanksysteme - Eine Einführung, De Gruyter, 2015
 
Saake Gunter und Sattler Kai-Uwe: Datenbanken: Implementierungstechniken, mitp Professional, 2011
 
Garcia-Molina Hector, Widom Jennifer, Ulmman Jeffrey D.: Database Systems: The Complete Book, Pearson Education, 2013
 
Leskovec Jure, Rajaraman Anand und Ullman Jeffrey D.: Mining of Massive Datasets, Cambridge University Press, 2014

[letzte Änderung 18.10.2016]
Modul angeboten in Semester:
SS 2020, SS 2019, SS 2018
[Tue Jun  2 03:48:30 CEST 2020, CKEY=kde, BKEY=kim2, CID=KIM-DE, LANGUAGE=de, DATE=02.06.2020]