Grundlagen des Information Retrieval

Submitted by webmaster on Fri, 11/22/2019 - 15:57
Course No: 
188977
Course Type: 
VU
Term: 
2019W
Weekly Hours: 
2.0
Lecturer: 
Allan Hanbury
Sebastian Hofstätter
Language: 
German
Objective: 

Ziel dieser LVA ist die Vermittlung folgender Punkte:

  • Grundlegendes Verständnis was hinter einer Suchmaschine wie Google, Bing, Lucene, Elasticsearch, etc… steht
  • Wie man effizient viele Dokumente anhand einer Suchanfrage in eine Relevanz-Reihenfolge bringt und diese evaluiert
  • Wie man zusätzlich zum einfachen Text weiteren Kontext für bessere Ergebnisse verwendet (z.B. PageRank für Webseiten)
  • Außerdem wie man Audio und Bilder vergleicht und danach suchen kann
Content: 
  • Grundlagen des Information Retrieval
    • Inverted Index
    • Textverarbeitung: Tokenization, Stemming, etc..
    • Suche mit dem Inverted Index (Dokumente nach enthaltenen Wörtern finden)
  • Effiziente IO-intensive Programme (inklusive Profiler, memory access optimizations)
  • Scoring und Ranking
    • Relevanz Formeln
  • Evaluierung von Suche
    • Metriken zur IR Evaluierung: MAP, NDCG, etc...
  • Websuche
    • PageRank
  • Bild und Musik Suche
Information: 

Wir verwenden TUWEL für Termine, Slides, und die Übungsbeispiele.

Notes: 
Examination: 

Zwei praktische Übungen und eine Prüfung

Recommendation: 

Gute Programmierkenntnisse einer statischen Programmiersprache