Datenorientierte Programmierparadigmen

Submitted by webmaster on Mon, 01/15/2018 - 16:33
Course No: 
188995
Course Type: 
VU
Term: 
2017W
Weekly Hours: 
2.0
Lecturer: 
Sebastian Böck
Elmar Kiesling
Allan Hanbury
Language: 
German
Objective: 

Diese Lehrveranstaltung vermittelt die grundlegende Programmieransätze in Data Science. Der Schwerpunkt liegt auf Computational Thinking, die Formulierung von Problemen und ihre Lösungsformen, sodass ein Computer sie ausführen können. Methoden für die Erhöhung der Effizienz der Lösungen werden auch besprochen. Fallbeispiele zeigen die praktische Umsetzung von Data Science Lösungen.

Content: 

Die folgende Themen werden in den Vorlesungen behandelt:

  • Einführung in Data-Oriented programming Paradigms
  • Python
  • SciPy, NumPy, Vectorisierung, execution performance measurement
  • Daten Vorbereitung, Strukturierung, Fusionierung
  • Data Science Lösungsansätze und Fallstudien
  • Einführung in die Skalierung von Data Science

Zwei praktische Übungen sind Teil vom Kurs.
 
Aufwand:
Python Tutorial: 4h6 2-Stunden Vorlesungen: 12hÜbungsbeispiel 1: 15hÜbungsbeispiel 2: 44hSUMME: 75h

  • SciPy, NumPy, vectorisation, execution performance measurement
  • Data preparation, structuring, fusion
  • Data Science solution approaches and case studies
  • Introduction to scaling Data Science
Information: 

Termine
Alle Vorlesungen am Dienstag 11:00-13:00, Seminarraum Gödel, Favoritenstraße 9
BLOCK 1

  1. Introduction to DOPP, Text stream processing (|, awk, regex, sed)  [Böck] (7.11)
  2. Python [Böck] (14.11)
  3. SciPy, NumPy, vectorisation, Execution performance measurement - benchmarking [Böck] (21.11)
  4. Data preparation, Structuring - Data Fusion of Data of Different Types and Quality - Pandas [Kiesling] (28.11)


Exercise

BLOCK 2

  1. Data science solution approaches: fusion of techniques from multiple areas, data science case studies [Hanbury] (12.12)


Big Exercise: Solve a data science problem and implement the solution efficiently (solved individually)

BLOCK 3

  1. introductory scaling algorithms to big data (which architecture is needed for which problem?); Evaluation for selecting the optimal tools satisfying a set of requirements;  Scaling Data Science to multiple application areas [Kiesling] (9.1)


Presentations of Big Exercise solutions and code (16.1)

Notes: 
Examination: 

Ex1, Ex2: 1..100 points. Minimum 35.
Grade=0.25*Ex1+0.75*Ex2. Minimum 50.

Recommendation: