Fachpraktikum 01589 Natural Language Processing, Information Extraction und Retrieval
Veranstalter: Lehrgebiet Multimedia und Internetanwendungen
Veranstaltungsart: Fachpraktikum
Prüfer: Dr.-Ing. Christian Nawroth
Titel: 63485 Natural Language Processing, Information Extraction und Retrieval (01589)
Termin: wird noch bekannt gegeben
Ort: Online-Fachpraktikum über ein Online-Konferenz-System der FernUniversität in Hagen
Abgabetermin der schriftlichen Ausarbeitung: wird noch bekanntgegeben
Ansprechpartner:
Prof. Dr.-Ing. Matthias Hemmje
E-Mail: matthias.hemmje
Dr.-Ing. Christian Nawroth
E-Mail: christian.nawroth
Inhalte und Qualifikationsziele:
Die Forschung und Lehre des Lehrgebietes bewegt sich in den Bereichen Daten- und Dokumentenmanagement im Internet, Informations- und Wissensmanagement im Internet, Multimedia-Informationssysteme und Datenbanken, Informationsvisualisierung im Internet. Dazu gehören des Weiteren die Forschung, Lehre und Entwicklung in den folgenden Bereichen der Informatik und ihren Anwendungsgebieten: Informationsvisualisierung im Internet, Information Retrieval, Visuelle Mensch-Maschine- Interaktion, Content- und Wissensmanagement im Internet, Semantic Web, Digitale Langzeitarchivierung, Virtuelle Forschungsumgebungen, Big Data Analyse, Analyse natürlicher Sprache, Berufliche Weiterbildung und E-Learning, Industrie 4.0 und „Factories of the Future". Neben der Kooperation mit nationalen und internationalen Forschungs-/Entwicklungs- und industriellen Endanwendungspartnern unterstützt das Lehrgebiet in Kooperation mit dem An-Institut FTK, Forschungsinstitut für Telekommunikation und Kooperation in Dortmund, auch den Transfer der Forschungsergebnisse in innovative Prototypen, Produkte und Dienste.
Die Teilnehmerinnen und Teilnehmer des Praktikums dürfen zunächst aus einer Menge an Aufgabenstellungen, gemäß ihres Interesses, eine Auswahl für die weitere Bearbeitung treffen. Die Bearbeitung der gestellten Aufgabe erfolgt dann modular als Einzelarbeit oder in kooperierenden Kleingruppen. Das Fachpraktikum „Natural Language Processing, Information Extraction und Retrieval“ fokussiert hier insbesondere auf den Bereich der praktischen Anwendung aktueller Verfahren aus dem Bereich des Natural Language Processing und deren Einsatzmöglichkeiten in der Praxis insbesondere für die weitere Nutzung im Bereich Information Extraction und Information Retrieval. Hierbei werden Aufgabenstellungen aus den Bereichen Algorithmik (z. B. der Transfer erprobter Verfahren auf Textueller-Inhalte), Engineering (z. B. die Integration oder Anbindung existierender Standard-Komponenten), Forschung (z. B. die Erprobung neuester Forschungserkenntnisse) und Technik (z. B. die Evaluation spezieller Hard- und Softwareumgebungen) zur Bearbeitung vorgeschlagen. Die Bearbeitung der gestellten Aufgabe erfolgt über die Moodle-Instanz der FernUniversität in Hagen. Online-Konferenzen finden über ein Online-Konferenz-System der FernUniversität in Hagen statt.
Nach erfolgreicher Teilnahme am Fachpraktikum beherrschen Studierende den praktischen Umgang mit neuesten Technologien aus den Bereichen Natural Language Processing und Information Extraction and Retrieval und sind in der Lage, die Erfahrungen und Kompetenzen direkt in einer wissenschaftlich-technischen Softwareentwicklung einzusetzen. Zudem erwerben die Teilnehmerinnen und Teilnehmer Erfahrungen und Kompetenzen in Teamarbeit und Aufgabenorganisation im Team. Sie wissen, wie man Ziele eigenständig definiert und wie diese durch kollaborative Arbeits- und Zeitplanung erreicht werden. Sie können die geplanten Arbeiten in einem Exposé beschreiben und die Ergebnisse in einer Abschlussdokumentation vorstellen und vertreten. Sie können schriftliche Planungen und Dokumentationen anfertigen sowie die implementierten Komponenten in einer Software-Entwicklungsumgebung ablegen. Darüber hinaus werden der praxisorientierte Einsatz von Werkzeugen und die typischen Herangehensweisen zur Softwareentwicklung im Projekt verinnerlicht.
Inhaltliche Voraussetzungen:
Gute Kenntnisse in JAVA, Python und objektorientierter Softwareentwicklung werden vorausgesetzt. Von Vorteil, aber nicht zwingend, sind Kenntnisse in den Plattformen spaCy und Elastic Search. Der Umgang mit Entwicklungsumgebungen wie Jupyter Notebook und Eclipse sollte bekannt sein bzw. im Rahmen des Praktikums erworben werden.
Formal nach Prüfungsordnung:
- B.Sc. Informatik
- M.Sc. Informatik
- M.Sc. Praktische Informatik
- M.Sc. Wirtschaftsinformatik
Für alle bereits seit dem Sommersemester 2019 oder früher eingeschriebenen Studierenden in Studiengängen der Informatik gelten Übergangsbestimmungen gemäß der Prüfungsordnung.
Geforderte Leistungen:
- Ein Exposé zur Beschreibung der Vorgehensweise
- Eine State-Of-The-Art-Recherche zum Thema
- Die Modellierung (z. B. mit der UML) der geplanten Lösung
- Eine prototypische Implementierung inklusive Dokumentation
- Testfälle und Experimente, um die Implementierung zu prüfen
- Bewertung und Präsentation der Ergebnisse