Foundations of Data Science

 

Vorlesung im Wintersemester 2015/2016

 
Datenstrom von Nullen und Einsen Urheberrecht: © Lehrstuhl i7
 
 

Inhalt

Im Zeitalter von "Big Data" und "advanced analytics", trifft die Datenverarbeitung auf neue Herausforderungen. Abfragen werden komplexer und erfordern häufig Daten Mining, Maschine Learning Aufgaben und die Größe der Datensätze benötigt neue algorithmische Herangehensweisen.

Dieser Kurs wird die theoretischen Grundlagen der modernen Datenverarbeitung und Analyse behandeln. Dies beinhaltet die Themen Datenbank Theorie, wie Datenmodelle, Analyse von Abfragesprachen, Grundalgorithmen und komplexitätstheoretische Fragen bezüglich Abfragebearbeitung. Es beinhaltet auch Themn der Algorithmischen Lerntheorie, wie Grundlagen der Maschinenlern Algorithmen, unterstützenden Vektormaschinen, das PAC Modell und die VC-Dimension. Im weiteren werden auch neue Modelle von Bearbeitung massiver Datensätze, wie das Streamingmodell und "map-reduce paradigm" und Algorithmen für diese Modell behandelt.

Wir werden den Fokus auf die berechenbaren Aspekte der Theorie legen. Statistik, mit Sicherheit Grundpfeiler der Wissenschaft von Daten, wird eine Nebenrolle in diesem Kurs einnehmen.

References

S. Abiteboul, R. Hull, V. Vianu. Foundations of Databases. Addison Wesley 1995.

J. Hopcroft, R. Kannan. Foundations of Data Science. Unveröffentlicht, Entwurf online verfügbar.

M. Kearns, U. Vazirani. An Introduction to Computational Learning Theory. MIT Press 1994.

J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets. Cambridge University Press 2014.

S.J. Russell, P. Norvig. Artificial Intelligence: A Modern Approach. 3rd Edition, Pearson 2014.

 

Organisation

Vortragssprache in Englisch.

Dozent

Martin Grohe