htw saar
Zurück zur Hauptseite

Version des Moduls auswählen:

flag

Data Science

Modulbezeichnung: Data Science
Modulbezeichnung (engl.): Data Science
Studiengang: Praktische Informatik, Master, ASPO 01.10.2017
Code: PIM-DS
SWS/Lehrform: 3V+1U (4 Semesterwochenstunden)
ECTS-Punkte: 6
Studiensemester: 1
Pflichtfach: ja
Arbeitssprache:
Deutsch
Erforderliche Studienleistungen (gemäß ASPO):
Übungen
Prüfungsart:
Klausur
Zuordnung zum Curriculum:
KIM-DS Kommunikationsinformatik, Master, ASPO 01.10.2017, Wahlpflichtfach, informatikspezifisch
PIM-DS Praktische Informatik, Master, ASPO 01.10.2017, 1. Semester, Pflichtfach
Arbeitsaufwand:
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 6 Creditpoints 180 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 135 Stunden zur Verfügung.
Empfohlene Voraussetzungen (Module):
Keine.
Als Vorkenntnis empfohlen für Module:
PIM-DL Deep Learning


[letzte Änderung 01.04.2020]
Modulverantwortung:
Prof. Dr. Klaus Berberich
Dozent:
Prof. Dr. Klaus Berberich


[letzte Änderung 27.10.2016]
Lernziele:
Studierende sind nach erfolgreichem Absolvieren dieses Moduls in der Lage, geeignete Verfahren der Datenanalyse einzusetzen, um Erkenntnisse zur Entscheidungsfindung bei praktischen Fragestellungen zu gewinnen. Die Studierenden erlangen Kenntnisse über wichtige Verfahren der Datenanalyse. Die Studierenden kennen verschiedene Merkmalsarten (z.B. nominal, ordinal, metrisch) und können gegebene Daten geeignet vorverarbeiten (z.B. durch Normalisierung oder Standardisierung). Für eine gegebene Fragestellung erkennen sie, welche Art von Verfahren (z.B. Regression oder Klassifikation) zur Entscheidungsfindung geeignet ist. Die Studierenden können die erlernten Verfahren in einer geeigneten Programmiersprache (z.B. Python oder R) implementieren oder eine zur Verfügung stehende Implementierung sinnvoll einsetzen. Parameter der eingesetzten Verfahren können die Studierenden systematisch anhand zur Verfügung stehender Daten festlegen und die Güte der erlangten Resultate kritisch beurteilen. Ihre aus den Daten gewonnen Erkenntnisse können die Studierenden geeignet aufbereiten (z.B. in Form einer Visualisierung), um sie einem technischen oder nicht-technischen Publikum (z.B. Entscheidungsträger im Unternehmen) verständlich zu machen.

[letzte Änderung 09.10.2017]
Inhalt:
1. Einführung
 
2. Regression
2.1 Lineare Regression
2.2 Merkmalstransformation
2.3 Regularisierung
 
3. Klassifikation
3.1 Logistische Regression
3.2 Entscheidungsbäume
3.3 Naive Bayes
3.4 Support Vector Machines
 
4. Clusteranalyse
4.1 Repräsentantenverfahren (k-Means und k-Medoids)
4.2 Hierarchische Verfahren
4.3 Dichtebasierte Verfahren
 
5. Neuronale Netze
5.1 Perzeptron
5.2 Mehrschichtige Neuronale Netze (MLPs)
5.3 Faltende Neuronale Netze (CNNs)
5.4 Rekurrente Neuronale Netze (RNNs)
 
6. Assoziationsanalyse
6.1 Finden häufiger Mengen (Apriori und FP-Growth)
6.2 Bestimmen von Assoziationsregeln
6.3 Finden häufiger Sequenzen (GSP und PrefixSpan)
6.4 Finden häufiger Zeichenketten
6.5 Finden häufiger Teilgraphen
 
7. Datenvisualisierung


[letzte Änderung 17.10.2017]
Lehrmethoden/Medien:
Folien, vorlesungsbegleitende praktische und theoretische Übungen

[letzte Änderung 18.10.2016]
Literatur:
Aggarwal C.: Data Mining - The Textbook, Springer, 2015
 
Harrington P.: Machine Learning In Action, Manning, 2012
 
Kelleher J., Mac Namee B. und D´Arcy A.: Fundamentals of Machine Learning for Predictive Data Analytics, MIT Press, 2015
 
Provost F. und Fawcett T.: Data Science for Business, O´Reilly, 2013
 
Raschka S.: Machine Learning mit Python, mitp, 2017
 
Zaki Mohammed J. und Meira Wagner Jr: Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014

[letzte Änderung 09.10.2017]
Modul angeboten in Semester:
WS 2019/20, WS 2018/19, WS 2017/18
[Sun May 31 02:43:41 CEST 2020, CKEY=pds, BKEY=pim2, CID=PIM-DS, LANGUAGE=de, DATE=31.05.2020]