Foundations of Data Science
Vorlesung im Wintersemester 2015/2016
Inhalt
Im Zeitalter von "Big Data" und "advanced analytics", trifft die Datenverarbeitung auf neue Herausforderungen. Abfragen werden komplexer und erfordern häufig Daten Mining, Maschine Learning Aufgaben und die Größe der Datensätze benötigt neue algorithmische Herangehensweisen.
Dieser Kurs wird die theoretischen Grundlagen der modernen Datenverarbeitung und Analyse behandeln. Dies beinhaltet die Themen Datenbank Theorie, wie Datenmodelle, Analyse von Abfragesprachen, Grundalgorithmen und komplexitätstheoretische Fragen bezüglich Abfragebearbeitung. Es beinhaltet auch Themn der Algorithmischen Lerntheorie, wie Grundlagen der Maschinenlern Algorithmen, unterstützenden Vektormaschinen, das PAC Modell und die VC-Dimension. Im weiteren werden auch neue Modelle von Bearbeitung massiver Datensätze, wie das Streamingmodell und "map-reduce paradigm" und Algorithmen für diese Modell behandelt.
Wir werden den Fokus auf die berechenbaren Aspekte der Theorie legen. Statistik, mit Sicherheit Grundpfeiler der Wissenschaft von Daten, wird eine Nebenrolle in diesem Kurs einnehmen.
References
S. Abiteboul, R. Hull, V. Vianu. Foundations of Databases. Addison Wesley 1995.
J. Hopcroft, R. Kannan. Foundations of Data Science. Unveröffentlicht, Entwurf online verfügbar.
M. Kearns, U. Vazirani. An Introduction to Computational Learning Theory. MIT Press 1994.
J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets. Cambridge University Press 2014.
S.J. Russell, P. Norvig. Artificial Intelligence: A Modern Approach. 3rd Edition, Pearson 2014.
Organisation
Vortragssprache in Englisch.
Dozent