Kurs: 1879 Information Retrieval
Formalia
Zielgruppe
- Master: Studiengänge: B (über Katalog M), D, M, MC
- Bachelor: Studiengänge: B (über Katalog M), D, M, MC
Virtuelle Universität (LVU)
Beschreibung
Beständig- und in zunehmendem Maße werden Informationen direkt in digitaler Form erzeugt oder nachträglich in ein digitales Format überführt. Ein Grund dafür ist die schnelle und einfache Verarbeitung und eine damit einhergehende bessere Wiederverwendbarkeit. Einen umfangreichen digitalen Datenbestand jedoch manuell und gezielt nach einer bestimmten Information zu durchsuchen ist ab einer bestimmten Menge an Daten nicht mehr effektiv möglich und der tatsächliche Nutzen des Bestands damit zumindest fraglich. Ein plakatives Beispiel für einen multimedialen Datenbestand ist das Internet, welches massive Mengen an digitalen Daten vorhält. Wohlbekannte Suchmaschinen helfen hier dem suchenden, um sich in diesem Bestand zurechtzufinden. Große Datenbestände entstehen jedoch auch in spezielleren Bereichen, wie z.B. in Behörden, Krankenhäusern oder Verlagen. Auch hier muss ein effektives Auffinden gesuchter Informationen gewährleistet werden. Die Forschung im Umfeld des Information Retrieval (IR) befasst sich daher mit der Modellierung und Umsetzung von Anwendungen die automatisiert digitale Datenbestände, für den einfachen Zugriff und Nachnutzung aufbereiten. Die Forschung an effektiven IR-Verfahren ist hinreichend komplex und obwohl das IR auf eine lange Historie zurückblick sind insbesondere mit Hinblick auf anwachsende Datenmengen, mit zunehmend heterogener und verteilter Natur, Fragestellungen offengeblieben und neue Anforderungen hinzugekommen.
Dieser Kurs wird sich zunächst mit klassischen Themen des IR in Dokumentdatenbeständen befassen, um die Grundlegendem Eigenschaften einzuführen. Darunter fallen Themen wie die Indexierung von Text und Verfahren zu Gewichtungen von Indexeinheiten, die Einführung etablierter IR-Klassen und Modelle, sowie Verfahren zu Evaluation von IR-Verfahren. Über die klassischen IR-Verfahren hinaus wird sich dieser Kurs dann noch den Themen der semantischen Suche und der verteilten Suche widmen.