Bezeichnung |
Sprache |
Lehrform |
ECTS
SWS |
Angewandte Mathematik (MOD12)
German /
iMod
|
Deutsch |
iMod |
5.00
- |
Angewandte Mathematik (MAT)
German /
ILV, FL
|
Deutsch |
ILV, FL |
5.00
3.00 |
Kurzbeschreibung
Die Lehrveranstaltung „Angewandte Mathematik“ hat das Ziel, grundlegende im Data Science Kontext benötigte mathematische Konzepte und Methoden, vor allem im Zusammenhang mit Optimierung, zu vermitteln.
Methodik
Vortrag und Übungen.
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
Grundbegriffe und Methoden der linearen Algebra, insbesondere im Zusammenhang mit inneren Produkten, Orthogonalität, Eigenwerttheorie und linearer Optimierung zu erklären und im Data Science Kontext anzuwenden
-
Grundbegriffe und Methoden der mehrdimensionalen Analysis, insbesondere Gradientenabstiegsverfahren und Optimierung mit Nebenbedingungen zu erklären und im Data Science Kontext anzuwenden
Lehrinhalte
-
Lineare Algebra: inneres Produkt, Orthogonalität; Eigenwert- bzw. Singulärwertzerlegung; lineare Optimierung
-
Analysis von Funktionen mehrerer Veränderlicher: partielle Ableitungen, totale Differenzierbarkeit; Gradienten, Richtungsableitung, lineare und quadratische Approximation, lokale Extrema; Optimierungsverfahren: Gradientenabstiegsverfahren, Lagrange-Verfahren
Vorkenntnisse
Grundkenntnisse der Analysis und linearen Algebra (siehe Ausgleichsmodule)
Literatur
-
G. Teschl und S. Teschl, Mathematik für Informatiker, Band 1 (4. Auflage, 2013) und Band 2 (3. Auflage, 2013), Springer Verlag
-
P. Hartmann: Mathematik für Informatiker, 6. Auflage 2014, Springer Verlag
-
P. Stingl: Mathematik für Fachhochschule: Technik und Informatik, 8. Auflage 2009, Hanser Verlag
-
Drmota et al, Mathematik für Informatik, 4. Auflag 2014, Berliner Studienreihe zur Mathematik. Band 17, Heldermann Verlag
Leistungsbeurteilung
-
Leistungsbeurteilung erfolgt während der LV und im Rahmen der Modulprüfung
|
Ausgleichsmodul (MOD11)
German /
kMod
|
Deutsch |
kMod |
5.00
- |
Analysis (ANY)
German /
ILV, FL
|
Deutsch |
ILV, FL |
3.00
2.00 |
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
grundlegende Rechenoperationen mit komplexen Zahlen durchzuführen, Zahlen von einem Stellenwertsystem in ein anderes zu konvertieren, grundlegende Konvergenzkriterien für Folgen und Reihen anzuwenden
-
grundlegende Rechenoperationen der Differentialrechnung durchzuführen und Funktionen mithilfe der Differentialrechnung zu analysieren, insbesondere hinsichtlich Extremwerten
-
bestimmte, unbestimmte und uneigentliche Integrale zu berechnen
Lehrinhalte
-
Zahlenmengen, Stellenwertsysteme, Folgen, Reihen
-
Differential- und Integralrechnung von Funktionen einer Veränderlicher
Vorkenntnisse
Mittelschulstoff
Literatur
-
G. Teschl und S. Teschl, Mathematik für Informatiker, Band 1 (4. Auflage, 2013) und Band 2 (3. Auflage, 2013), Springer Verlag.
-
M. Drmota et al, Mathematik für Informatik, 4. Auflage, 2014, Heldermann Verlag.
Leistungsbeurteilung
-
LV-immanente Leistungsbeurteilung und Abschlussprüfung
|
Angewandte Statistik (AWS)
German /
ILV, FL
|
Deutsch |
ILV, FL |
3.00
2.00 |
Kurzbeschreibung
Dieser Kurs vermittelt Methoden für die Auswertung von quantitativen Erhebungen (zB Umfragen, Firmendaten oder technischen Messungen). Inhalte sind gängige Analysemethoden der beschreibenden und schließenden Statistik, die mittels der Standardsoftware R umgesetzt werden.
Methodik
Vortrag
Übungen (am Computer)
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
univariate Tests für ein kategoriales oder ein metrisches Merkmal durchzuführen
-
Zusammenhänge zwischen zwei kategorialen oder zwei metrischen Merkmalen zu testen
-
Regressionsmodelle für metrische Variablen aufzustellen und zu prüfen
-
einfache Zeitreihenanalysen durchzuführen
Lehrinhalte
-
Eine kategoriale Variable: absolute und relative Häufigkeiten, Balkendiagramme, Binomialtest, Chi-Quadrat-Test
-
Zwei kategoriale Variablen: Kontingenztabellen, gruppierte Balkendiagramme, Spineplot, Chi-Quadrat-Test auf Unabhängigkeit und Homogenität, Paarvergleiche
-
Eine metrische Variable: Histogramm, Lage- und Streumaße, Boxplot, t-Test
-
Zwei metrische Variablen: Streudiagramm, Korrelationsrechnung, partielle Korrelation, einfache und multiple Regressionsrechnung
-
Zeitreihenanalyse: Zeitreihendiagramm, Kurzfristprognosen
-
Reproducible Scientific Research: Literate Programming mit R Markdown
-
Bestimmung der korrekten statistischen Methode für ein konkretes Problem
Vorkenntnisse
Wahrscheinlichkeitsrechnung & Angewandte Statistik (insbesondere Verteilungen, Konfidenzintervalle und statistische Tests)
Literatur
-
R. Hatzinger, K. Hornik, H. Nagel, M. Maier: R – Einführung durch angewandte Statistik (2. Auflage), Springer, 2014
-
Skriptum
Leistungsbeurteilung
-
LV-immanente Leistungsbeurteilung und Abschlussprüfung
Anmerkungen
-
|
Datenbanken (DB)
German /
ILV, FL
|
Deutsch |
ILV, FL |
3.00
2.00 |
Grundzüge Algorithmen & Datenstrukturen (ALD)
German /
ILV, FL
|
Deutsch |
ILV, FL |
2.00
1.00 |
Grundzüge der Wahrscheinlichkeitsrechnung & Statistik (GWS)
German /
ILV, FL
|
Deutsch |
ILV, FL |
2.00
1.00 |
Kurzbeschreibung
Dieser Kurs vermittelt elementare Kenntnisse der Wahrscheinlichkeitsrechnung und angewandten Statistik mit Hilfe der Statistik-Software R.
Methodik
Integrierte Lehrveranstaltung, Fernlehre
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
den Zusammenhang zwischen Zufallsvariablen und Wahrscheinlichkeitsverteilungen zu erklären
-
die Bedeutung spezieller Verteilungen für die Durchführung statistischer Tests zu erklären
-
die grundlegenden Funktionsweisen statistischer Tests zu verstehen sowie einfache statistische Tests durchzuführen und zu interpretieren
-
ntervall- und Punktschätzungen sowie Hypothesentests für ein kategoriales und ein metrisches Merkmal durchzuführen
Lehrinhalte
-
Zufallsvariablen
-
Diskrete und stetige Verteilungen
-
Statistische Tests
-
Konfidenzintervalle
Vorkenntnisse
Mittelschulstoff
Literatur
-
Teschl, G., Teschl S.: Mathematik für Informatiker Band 2: Analysis und Statistik, 4. Auflage, 2013, Springer.
Leistungsbeurteilung
Anmerkungen
-
|
Lineare Algebra (LIAG)
German /
ILV, FL
|
Deutsch |
ILV, FL |
2.00
1.00 |
Kurzbeschreibung
In der Lehrveranstaltung „Lineare Algebra“ werden die Grundbegriffe und -konzepte der linearen Algebra erarbeitet und an Beispielen angewandt.
Methodik
Die Lehrveranstaltung besteht aus einem Vorlesungs- und einem Übungsteil.
Die Vorlesung wird nach der Methode des "Inverted Classrooms" gehalten. Das heißt Studierende bereiten sich anhand von zur Verfügung gestellter Literatur auf die Präsenzeinheiten vor. Vor den Einheiten absolvieren sie einen kurzen Moodle-Test über die vorzubereitenden Inhalte. In den Präsenzeinheiten werden entstandene Fragen geklärt und die Inhalte vertieft.
Im Übungsteil werden die Kenntnisse durch das eigenständige Bearbeiten von Beispielen gefestigt.
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
grundlegende Aufgabenstellungen in allgemeinen Vektorräumen, sowie einfache geometrische Problemstellungen im zwei- und dreidimensionalen euklidischen Raum zu lösen.
-
elementare Rechenoperationen mit Matrizen bzw. linearen Abbildungen durchzuführen sowie Determinanten und Inverse zu berechnen.
-
lineare Gleichungssysteme in Matrixschreibweise mit Hilfe des Gaußalgorithmus zu lösen.
Lehrinhalte
-
Vektorräume
-
Matrizen und lineare Abbildungen
-
lineare Gleichungssysteme
Vorkenntnisse
Mittelschulstoff
Literatur
-
G. Teschl und S. Teschl, Mathematik für Informatiker, Band 1, 4. Auflage, 2013, Springer Verlag
-
M. Drmota et al, Mathematik für Informatik, 4. Auflage, 2014, Heldermann Verlag
-
T. Arens et al, Mathematik, 4. Aufl. 2018,Springer Spektrum
Leistungsbeurteilung
-
LV-immanente Leistungsbeurteilung und Abschlussprüfung
-
Zwei Teile:
-
1.Beurteilung während der LV:
-
a) Moodle-Tests zu den vorbereiteten Themen – 25% der Gesamtpunkte
-
b) Übungsbeispiele – 25% der Gesamtpunkte
-
2. Abschlussprüfung: 50% der Gesamtpunkte
-
Um die LV positiv abschließen zu können, müssen in beide Teilen der Beurteilung jeweils min. 50% der Punkte des jeweiligen Teilbereichs erreicht werden (dh. min. 50% der Punkte aus Moodle-Tests und Übungsbeispielen und zusammen sowie min. 50% der Punkte der Abschlussprüfung).
|
Data Engineering (MOD14)
German /
iMod
|
Deutsch |
iMod |
5.00
- |
Data Engineering (DE)
German /
ILV, FL
|
Deutsch |
ILV, FL |
5.00
3.00 |
Kurzbeschreibung
Dieses Modul adressiert die praktischen Herausforderungen eines der wichtigsten Prozessschritte eines jeden Data Science-Projekts: die Datenaufbereitung - sowohl in R, wie auch in Python.
Methodik
Workshops
Diskussion
Übungen
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
den Workflow eines Data Science-Projekts zu beschreiben
-
auf unterschiedliche Datenquellen (z.B. relationale Datenbanken, Web-Daten, Text, Bilder, Videos, Streams) zum Datenimport zuzugreifen
-
Data Wrangling zu betreiben (import, tidy, transform)
-
Daten zu explorieren und zu visualisieren
-
Daten hinsichtlich Plausibilität und Qualität zu bewerten
-
Relevante Tools wie TidyVerse (R) und Pandas (Python) zu verwenden
-
die Verwendung von R und Python bewerten
Lehrinhalte
-
Design von Data Science Projekten
-
Datenformate für strukturierte und nicht-strukturierte Daten (insb. Data Frames)
-
Datenimport, Datenbereinigung
-
Datenvisualisierung
-
TidyVerse, ggplot2; Pandas, Numpy
-
Vergleich von R und Python
Vorkenntnisse
Scripting mit R und Python,
Deskriptive Statistik
Literatur
-
Grolemund, Wickham, 2016. R for Data Science, O‘Reilly
-
Baumer, Kaplan, Horton, 2017. Modern Data Science with R. CRC Press.
-
VanderPlas, 2017. Python Data Science Handbook. O'Reilly
Leistungsbeurteilung
-
LV-immanente Leistungsbeurteilung und Abschlussprojekt
|
Data Science Infrastructure (MOD16)
German /
iMod
|
Deutsch |
iMod |
5.00
- |
Data Science Infrastructure (DSI)
German /
ILV, FL
|
Deutsch |
ILV, FL |
5.00
3.00 |
Kurzbeschreibung
Dieser Kurs adressiert unterschiedliche Aspekt von IT-Infrastruktur, die für Data Science Aktivitäten relevant sind. Neben einem Überblick von algorithmischen Problemen und Technologien im Umfeld von Data Science lernen die Teilnehmer*innen, wie unterschiedliche Datenarten mit zeitgemäßen Softwarewerkzeugen abgespeichert und mit aktuellen Machine Learning Bibliotheken verarbeitet werden. Die Themen in diesem Kurs umfassen unter anderem diverse Arten von Datenspeicher (NoSQL-Datenbanken, hdfs), verschiedene Ansätze bzw. Werkzeuge zur effizienten Datenverarbeitung (Python Bibliotheken, Hadoop, Spark), Performanceoptimierung von Berechnungen, Streamdatenverarbeitung oder die Nutzung von Cloud-Diensten für große Datenmengen.
Methodik
In den Präsenzeinheiten werden Impulsvorträge zu den jeweiligen Themen abgehalten. Die Teilnehmer*innen müssen sich auf die bevorstehende Einheit vorbereiten und erarbeiten sich praktische Fertigkeiten im Umgang mit Infrastrukturen für Data Science Aktivitäten. In weiterer Folge sind diese Fertigkeiten in einem Gruppenprojekt anzuwenden. Am Ende des Kurses muss jeder Teilnehmer*in eine praktische Aufgabe in Form eines computerbasierten Tests bewältigen.
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
einen Überblick über algorithmische Aufgabenstellungen im Rahmen von Data Science und Big Data geben sowie relevante Technologien in diesem Umfeld erklären.
-
strukturierte, semi-strukturierte und unstrukturierte Daten mittels NoSQL-Datenbanktechnologien abspeichern und abrufen.
-
datenbasierte Berechnungen auf einen oder mehreren Prozessoren bzw. unter Verwendung unterschiedlicher Python Bibliotheken (pytorch, sklearn, mxnet, tensorflow) ausführen.
-
einen Überblick über die Dimensionen und Herausforderungen großer Datenmengen geben sowie verteilt Daten mit dem Hadoop Ecosystem (hdfs, map/reduce) speichern und verarbeiten.
-
einen Spark Rechencluster konfigurieren und die Performance-Verbesserungen bei Algorithmen des maschinellen Lernens auf dieser Infrastruktur messen.
-
Datenstreams, wie etwa Sensordaten, mittels InfluxDB, Kafka und Spark verwalten und verarbeiten.
-
einen Cloud-Service nutzen, um große Datenmengen zu speichern, verarbeiten und verwerten.
Lehrinhalte
-
Computing Infrastruktur für Data Science
-
Datenspeicher: Von Datenbanken bis zu Data Lakes
-
Datenverarbeitung: Von verteilten Berechnungen zu Machine Learning Frameworks
-
Big Data (Hadoop)
-
Analytics Engine (Spark)
-
Streamdatenverarbeitung
-
Cloud Services für große Datenmengen (Azure, Colab)
Vorkenntnisse
Datenbanken (SQL, NoSQL)
Programmieren (Python/R)
Betriebssysteme (Linux)
Literatur
-
White, 2015. Hadoop: The Definitive Guide, O’Reilly
-
Seidman, Shapira, Malaska, Grover, 2015. Hadoop Application Architectures.
-
Vohra, 2016. Practical Hadoop Ecosystem: A Definitive Guide to Hadoop-Related Frameworks and Tools, Apress
-
Simon, 2015. Too Big To Ignore: The Business Case for Big Data , Wiley
-
Kleppmann, 2017. Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems, O’Reilly
-
Harrisons Guy, 2015, Next Generation Databases: NoSQL, NewSQL, and Big Data, Apress
Leistungsbeurteilung
-
Wöchentliche Zwischentests zur Beurteilung des Lernfortschritts (20%)
-
Computerbasierte Abschlussprüfung zur Beurteilung der praktischen Fertigkeiten (40%)
-
Gruppenprojekt für ein realistisches Data Science Szenario (40%)
|
Data Warehouse & BI (MOD15)
English /
iMod
|
Englisch |
iMod |
5.00
- |
Data Warehouse & BI (DWBI)
English /
ILV, FL
|
Englisch |
ILV, FL |
5.00
3.00 |
Kurzbeschreibung
Dieser Kurs führt in grundlegende Konzepte, Technologien und Methoden von Data Warehousing und Business Intelligence ein. Unter anderem wird ein Überblick über Analytics und Data Warehousing gegeben (Modellierung und Umsetzung einer DWH-Lösung). Zudem werden die Planung von BI-bezogenen Projekten, relevante Techniken der Datenmodellierung und -präsentation sowie ausgewählte Aspekte des Datenmanagements behandelt. Hinsichtlich praktischer Fertigkeiten lernen die Kursteilnehmer, wie ein ETL-Prozess zur Generierung eines Data Warehouses implementiert wird. Basierend darauf wird ein OLAP-Würfel aufgesetzt und mittels einer BI-Anwendung analysiert.
Methodik
- Vortrag
- Interaktive Tutorials
- Praktische Gruppenarbeit (vor Ort und in Fernlehre)
- Gruppenpräsentationen
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
einen Überblick über Business Intelligence und Data Warehousing zu geben bzw. einen BI-bezogenen Geschäftsfall projektmäßig zu planen
-
Anforderungen an eine BI Lösung für einen gegebenen Geschäftsfall abzuleiten
-
ein für einen BI-Ansatz notwendiges Datenmodell zu erstellen und einen Datensatz vorzubereiten
-
Datenquellen handzuhaben, die Qualität der Daten abzuschätzen und Daten aus Datenbanksystemen zu beziehen
-
wesentliche BI Operationen zu erklären, passende BI Werkzeuge auszuwählen auf Echtdaten anzuwenden
-
ein multidimensionales Analysemodel (OLAP) praktisch umzusetzen und damit Daten auszuwerten
-
ein komplettes DWH-Projekt (Planung, Implementierung, Berichte) auf Basis von Daten eines ERP-Systems umzusetzen
Lehrinhalte
-
Einführung zu Business Intelligence (BI) und Data Warehousing (DW)
-
Entwicklung von Geschäftsfällen und BI-bezogenen Projekten
-
Geschäftsmodell für und Anforderungen an Business Intelligence
-
Datenmodellierung für DWHs (Dimensional Fact Modeling, Galaxy Schema)
-
Datenmanagement (Datenquellen, Datenqualität und Datenbanken)
-
Extract-Transform-Load-Prozess
-
BI Operationen, Werkzeuge und Methoden
-
Datenpräsentation (Scorecards, Dashboards)
Vorkenntnisse
Kenntnisse zu Datenmodellierung, Datenbanken, Projektmanagement und statistischen Methoden
Literatur
-
Haertzen, D., 2012. The Analytical Puzzle: Profitable Data Warehousing, Business Intelligence and Analytics. 1. Ausgabe. Technics Publications.
-
Kimball, R., Ross, M., 2013. The Datawarehouse Toolkit (2nd Ed., Chapters 1-6)
Leistungsbeurteilung
-
LV-immanente Leistungsbeurteilung und Abschlussprüfung
|
Scripting (MOD13)
English /
iMod
|
Englisch |
iMod |
5.00
- |
Scripting (SCR)
English /
ILV, FL
|
Englisch |
ILV, FL |
5.00
3.00 |
Kurzbeschreibung
In diesem Kurs geht es darum, R und Python als vollständige Programmiersprachen zu verstehen und die Programmierkenntnisse in R und Python zu vertiefen, um damit dessen Nutzung über die reine Verwendung vorgefertigter Funktionen hinaus zu ermöglichen.
Methodik
R: Vortrag, Übungen (am Computer)
Python: Vortrag, Übungen vor Ort und Remote
Lernergebnisse
Nach erfolgreichem Abschluss sind die Studierenden in der Lage, ...
-
Daten mit den verfügbaren Datenstrukturen zu verwalten
-
Daten einzulesen und auszugeben (Konsole, Dateien)
-
Elemente der strukturierten Programmierung (Schleifen, Bedingungen) anzuwenden
-
eigene Funktionen zu erstellen
-
Bibliotheken einzubinden und zu verwenden
-
die jeweiligen objektorientierten Konzepte anzuwenden
-
Grafiken zu erzeugen
-
Schnittstellen von und zu externen Systemen zu benutzen
Lehrinhalte
-
R: Vektoren, Arrays, Tabellen, Listen, Data Frames. Fehlende Werte, Strings. Schleifen, Bedingungen. Funktionen, Vektorisierung. Objektorientierung: S3/S4/R6-Systeme. Input und Output. Grafiken: base graphics; grid. Grundlegende Diagramme.
-
Python: Elementare Datentypen (Tuples, Lists, Dictionnaries, Strings). NumPy und Pandas: Arrays, Aggregationen, Indexing, Datenmanipulation, Umgehen mit fehlenden Daten, kombinieren von Data Sets. Pivottabellen, Zeitreihen. Klassen. Input und Output. MatPlotLib: Grafiken.
Vorkenntnisse
Grundlegende (auch objektiorientierte) Programmierkenntnisse
Literatur
-
Wickham, 2019: Advanced R. CRC Press.
-
Lutz, 2015. Learning Python. O’Reilly
-
McKinney, 2017. Python for Data Analysis, O’Reilly
Leistungsbeurteilung
-
Leistungsbeurteilung erfolgt während der LV und im Rahmen der Modulprüfung
|