Algorithmic Foundations of Data Science
Inhalt
Im Zeitalter von "big data" und "advanced analytics" ergeben sich einige Herausforderungen für die Datanverarbeitung. Anfragen werden immer komplexer und benötigen oft "data mining" und "machine learning" Algorithmen. Auch die Größe der Datensätze erfordern neue und effizientere Ansätze.
In dieser Vorlesung behandeln wir die "theoretischen Grundlagen" der modernen Datenverarbeitung und Analyse. Dies beinhaltet Themen aus dem Bereich der Datenbaken-Theorie, wie zum beispiel "data models", die Analyse von query-Sprachen, sowie grundlegende algorithmische und komplexitätstheoretische Fragestellungen der Datenverarbeitung. Außerdem befassen wir uns mit der Theorie des algorithmischen Lernens und behandeln neben den grundlegenden "machine learning" Algorithmen auch "support vector machines", das PAC Modell, und VC-Dimensionnen. Zusätzlich dazu behandeln wir auch neue berechnungsmodelle für sehr große Datensätze, wie zum beispiel das streaming-Modell und das map-reduce Paradigma.
Hierbei liegt der Schwerpunkt der Vorlesung bei den "berechenbarkeits Aspekten" dieser Theorien. Statistik, was zweifelsfrei ein wichtiger Bestandteil der Datenwissenschaften ist, wird keine zentrale Rolle in dieser Veranstaltung spielen.
Voraussetzungen
Es werden keine besonderen Vorkenntnisse benötigt.
Organisatorisches
Alle wichtigen Informationen sind in RWTHmoodle zu finden.
Die Vorlesung wird in Englisch gehalten.
Dozent