Algorithmic Foundations of Data Science

 
Datenstrom von Nullen und Einsen Urheberrecht: © Lehrstuhl i7
 
 

Inhalt

Im Zeitalter von "big data" und "advanced analytics" ergeben sich einige Herausforderungen für die Datanverarbeitung. Anfragen werden immer komplexer und benötigen oft "data mining" und "machine learning" Algorithmen. Auch die Größe der Datensätze erfordern neue und effizientere Ansätze.

In dieser Vorlesung behandeln wir die "theoretischen Grundlagen" der modernen Datenverarbeitung und Analyse. Dies beinhaltet Themen aus dem Bereich der Datenbaken-Theorie, wie zum beispiel "data models", die Analyse von query-Sprachen, sowie grundlegende algorithmische und komplexitätstheoretische Fragestellungen der Datenverarbeitung. Außerdem befassen wir uns mit der Theorie des algorithmischen Lernens und behandeln neben den grundlegenden "machine learning" Algorithmen auch "support vector machines", das PAC Modell, und VC-Dimensionnen. Zusätzlich dazu behandeln wir auch neue berechnungsmodelle für sehr große Datensätze, wie zum beispiel das streaming-Modell und das map-reduce Paradigma.

Hierbei liegt der Schwerpunkt der Vorlesung bei den "berechenbarkeits Aspekten" dieser Theorien. Statistik, was zweifelsfrei ein wichtiger Bestandteil der Datenwissenschaften ist, wird keine zentrale Rolle in dieser Veranstaltung spielen.

Voraussetzungen

Es werden keine besonderen Vorkenntnisse benötigt.

 

Organisatorisches

Alle wichtigen Informationen sind in RWTHmoodle zu finden.

Die Vorlesung wird in Englisch gehalten.

Dozent

Martin Grohe

 

Externe Links