htw saar Piktogramm QR-encoded URL
Back to Main Page Choose Module Version:
emphasize objectives XML-Code

flag flag

Machine Learning

Modulbezeichnung:
Bezeichnung des Moduls innerhalb des Studiengangs. Sie soll eine präzise und verständliche Überschrift des Modulinhalts darstellen.
Machine Learning
Modulbezeichnung (engl.): Machine Learning
Studiengang:
Studiengang mit Beginn der Gültigkeit der betreffenden ASPO-Anlage/Studienordnung des Studiengangs, in dem dieses Modul zum Studienprogramm gehört (=Start der ersten Erstsemester-Kohorte, die nach dieser Ordnung studiert).
Praktische Informatik, Bachelor, ASPO 01.10.2011
Code: PIBWI19
SAP-Submodul-Nr.:
Die Prüfungsverwaltung mittels SAP-SLCM vergibt für jede Prüfungsart in einem Modul eine SAP-Submodul-Nr (= P-Nummer). Gleiche Module in unterschiedlichen Studiengängen haben bei gleicher Prüfungsart die gleiche SAP-Submodul-Nr..
P610-0536
SWS/Lehrform:
Die Anzahl der Semesterwochenstunden (SWS) wird als Zusammensetzung von Vorlesungsstunden (V), Übungsstunden (U), Praktikumsstunden (P) oder Projektarbeitsstunden (PA) angegeben. Beispielsweise besteht eine Veranstaltung der Form 2V+2U aus 2 Vorlesungsstunden und 2 Übungsstunden pro Woche.
2V+2U (4 Semesterwochenstunden)
ECTS-Punkte:
Die Anzahl der Punkte nach ECTS (Leistungspunkte, Kreditpunkte), die dem Studierenden bei erfolgreicher Ableistung des Moduls gutgeschrieben werden. Die ECTS-Punkte entscheiden über die Gewichtung des Fachs bei der Berechnung der Durchschnittsnote im Abschlusszeugnis. Jedem ECTS-Punkt entsprechen 30 studentische Arbeitsstunden (Anwesenheit, Vor- und Nachbereitung, Prüfungsvorbereitung, ggfs. Zeit zur Bearbeitung eines Projekts), verteilt über die gesamte Zeit des Semesters (26 Wochen).
5
Studiensemester: 6
Pflichtfach: nein
Arbeitssprache:
Englisch
Prüfungsart:
Klausur, Dauer 90 min.

[letzte Änderung 29.07.2024]
Verwendbarkeit / Zuordnung zum Curriculum:
Alle Studienprogramme, die das Modul enthalten mit Jahresangabe der entsprechenden Studienordnung / ASPO-Anlage.

KI575 Kommunikationsinformatik, Bachelor, ASPO 01.10.2014 , 6. Semester, Wahlpflichtfach, technisch
KIB-MLRN (P221-0085) Kommunikationsinformatik, Bachelor, ASPO 01.10.2021 , 6. Semester, Wahlpflichtfach, technisch
KIB-MLRN (P221-0085) Kommunikationsinformatik, Bachelor, ASPO 01.10.2022 , 6. Semester, Wahlpflichtfach, technisch
PIBWI19 (P610-0536) Praktische Informatik, Bachelor, ASPO 01.10.2011 , 6. Semester, Wahlpflichtfach, informatikspezifisch
PIB-MLRN (P221-0085) Praktische Informatik, Bachelor, ASPO 01.10.2022 , 6. Semester, Wahlpflichtfach, informatikspezifisch

geeignet für Austauschstudenten mit learning agreement
Arbeitsaufwand:
Der Arbeitsaufwand des Studierenden, der für das erfolgreiche Absolvieren eines Moduls notwendig ist, ergibt sich aus den ECTS-Punkten. Jeder ECTS-Punkt steht in der Regel für 30 Arbeitsstunden. Die Arbeitsstunden umfassen Präsenzzeit (in den Vorlesungswochen), Vor- und Nachbereitung der Vorlesung, ggfs. Abfassung einer Projektarbeit und die Vorbereitung auf die Prüfung.

Die ECTS beziehen sich auf die gesamte formale Semesterdauer (01.04.-30.09. im Sommersemester, 01.10.-31.03. im Wintersemester).
Die Präsenzzeit dieses Moduls umfasst bei 15 Semesterwochen 60 Veranstaltungsstunden (= 45 Zeitstunden). Der Gesamtumfang des Moduls beträgt bei 5 Creditpoints 150 Stunden (30 Std/ECTS). Daher stehen für die Vor- und Nachbereitung der Veranstaltung zusammen mit der Prüfungsvorbereitung 105 Stunden zur Verfügung.
Empfohlene Voraussetzungen (Module):
PIB115 Informatikgrundlagen
PIB120 Programmierung 1
PIB125 Mathematik 1
PIB215 Mathematik 2
PIB315 Mathematik 3
PIB330 Datenbanken


[letzte Änderung 02.03.2017]
Als Vorkenntnis empfohlen für Module:
Modulverantwortung:
Prof. Dr. Klaus Berberich
Dozent/innen: Prof. Dr. Klaus Berberich

[letzte Änderung 10.02.2017]
Lernziele:
Students know about fundamental supervised and unsupervised methods from machine learning. This includes methods for regression, classification (e.g., logistic regression and decision trees), and clustering. Students understand how these methods work and know how to use existing implementations (e.g., in libraries such as scikit-learn). Given a practical problem setting, students can choose a suitable method, apply it to the dataset at hand, and assess the quality of the determined model. Students are aware of typical data-quality issues and know how to resolve them.
 
[OE+0+0+0+0+0+0=0]


[letzte Änderung 04.07.2024]
Inhalt:
Machine learning plays an increasingly important role with applications ranging from recognizing handwritten digits, via filtering out unwanted span e-mails, to ranking of results in modern search engines. This course covers fundamental supervised and unsupervised methods from machine learning. We will look into how these methods are defined formally, including the mathematics behind them. Moreover, we will apply all methods on concrete datasets to solve practical problems. For this, we will rely on existing libraries (e.g., scikit-learn) that provide efficient implementations of the methods. The course is accompanied by theoretical exercises and project assignments. The former help students to deepen their understanding of the methods; the latter encourage students to solve practical problems by applying what they learnt in the course on real-world datasets.
 
1. Introduction
- What is Machine Learning?
- Applications
- Libraries
- Literature
 
2. Working with Data
- Typical data formats (e.g., CSV, spreadsheets, databases)
- Data quality issues (e.g., outliers, duplicates)
- Scales of measures (i.e., nominal, ordinal, numerical)
- Data pre-processing (in Python and using UNIX commandline tools)
 
3. Regression
- Ordinary least squares
- Multiple linear regression
- Non-linear regression
- Evaluation
 
4. Classification
- Logistic regression
- k-Nearest Neighbors
- Naive Bayes
- Decision Trees
- Neural Networks
- Evaluation
 
5. Clustering
- k-Means
- Hierarchical agglomerative/divisive clustering
- Density-Based Clustering
- Evaluation
 
6. Outlook
- Ongoing research
- Competitions (e.g., Kaggle and KDD Cup)
- Other resources (e.g., KDnuggets)


[letzte Änderung 04.07.2024]
Literatur:
A. Burkov: The Hundred-Page Machine Learning Book,
self published, 2019
http://themlbook.com
 
G. James, D. Witten, T. Hastie, R. Tibshirani, Jonathan Taylor: An Introduction to Statistical Learning - with Applications in Python,
Springer, 2023
 
S. Raschka and V. Mirjalili: Python Machine Learning,
Packt Publishing, 2019
 
M. J. Zaki und W. Meira Jr.: Data Mining and Analysis: Fundamental Concepts and Algorithms,
Cambridge University Press, 2020

[letzte Änderung 04.07.2024]
Modul angeboten in Semester:
SS 2024, SS 2023, SS 2022, SS 2021, SS 2020, ...
[Sat Oct  5 19:54:49 CEST 2024, CKEY=kml, BKEY=pi, CID=PIBWI19, LANGUAGE=en, DATE=05.10.2024]