Modul 63487 Fachpraktikum Cloud-based Information Extraction
Veranstalter: Lehrgebiet Multimedia und Internetanwendungen
Veranstaltungsart: Fachpraktikum
Prüfer: Dr.-Ing. Philippe Tamla
Titel: 63487 Fachpraktikum Cloud-based Information Extraction
Termin: wird noch bekannt gegeben
Ort: Online-Fachpraktikum über ein Online-Konferenz-System der FernUniversität in Hagen
Abgabetermin der schriftlichen Ausarbeitung: wird noch bekanntgegeben
Ansprechpartner:
Prof. Dr.-Ing. Matthias Hemmje
E-Mail: matthias.hemmje
Dr.-Ing. Philippe Tamla
E-Mail: philippe.tamla
Inhalte und Qualifikationsziele:
Die Forschung und Lehre des Lehrgebietes bewegt sich in den Bereichen Daten- und Dokumentenmanagement im Internet, Informations- und Wissensmanagement im Internet, Multimedia-Informationssysteme und Datenbanken, Informationsvisualisierung im Internet. Dazu gehören des Weiteren die Forschung, Lehre und Entwicklung in den folgenden Bereichen der Informatik und ihren Anwendungsgebieten: Informationsvisualisierung im Internet, Information Retrieval, Visuelle Mensch-Maschine-Interaktion, Content- und Wissensmanagement im Internet, Semantic Web, Digitale Langzeitarchivierung, Virtuelle Forschungsumgebungen, Big Data Analyse, Analyse natürlicher Sprache, berufliche Weiterbildung und E-Learning, Industrie 4.0 und „Factories of the Future". Neben der Kooperation mit nationalen und internationalen Forschungs-/Entwicklungs- und industriellen Endanwendungspartnern unterstützt das Lehrgebiet in Kooperation mit dem An-Institut FTK, Forschungsinstitut für Telekommunikation und Kooperation in Dortmund, auch den Transfer der Forschungsergebnisse in innovative Prototypen, Produkte und Dienste.
Das Fachpraktikum „Cloud-basierte Informationsextraktion (CIE)“ konzentriert sich auf die Anwendung einer wissenschaftlich-technischen Methodik sowie die praktische Umsetzung aktueller Verfahren im Bereich Cloud Computing und Micro-Service-basierter Architekturen. Es untersucht insbesondere deren Anwendbarkeit in den Bereichen Information Extraction, Natural Language Processing, Named Entity Recognition, Dokument Classification und Information Retrieval. Die Teilnehmerinnen und Teilnehmer des Praktikums dürfen zunächst aus verschiedenen Aufgabenstellungen, gemäß ihres Interesses, eine Auswahl für die weitere Bearbeitung treffen. Die Bearbeitung der gestellten Aufgabe erfolgt dann modular. Das bedeutet, die Teilnehmerinnen und Teilnehmer wählen zunächst eine Aufgabe aus, verfassen dann ein Exposé mit einer wissenschaftlich-technischen Methodik zur Lösung der identifizierten Probleme. Das Fachpraktikum fokussiert also hier insbesondere auf die Anwendung einer systematischen wissenschaftlich-technischen Forschungsmethodik als Vorbereitung auf mögliche Abschlussarbeiten. Inhaltlich kommen die Aufgabenstellungen dabei aus der praktischen Anwendung aktueller Verfahren z. B: aus dem Bereich des Natural Language Processing und deren Einsatzmöglichkeiten in der Praxis, insbesondere für die weitere Nutzung im Bereich Information Extraction, Information Retrieval und dabei insbesondere auch die Nutzung von Cloud-Ressourcen. Hierbei werden Aufgabenstellungen aus den Bereichen Algorithmik (z. B. der Transfer erprobter Verfahren auf textuelle Inhalte), Software Engineering (z. B. die Integration oder Anbindung existierender Standard-Komponenten), Forschung und Entwicklung (z. B. die Erprobung neuester Forschungserkenntnisse) und Technologie (z. B. die Evaluation spezieller Hard- und Softwareumgebungen) zur Bearbeitung vorgeschlagen. Die Bearbeitung der gestellten Aufgabe erfolgt über die Moodle-Instanz der FernUniversität in Hagen. Anschließend entwickeln die Teilnehmenden einen Prototyp und präsentieren ihre Ergebnisse. Online-Konferenzen finden über ein Online-Konferenz-System der FernUniversität in Hagen statt.
Nach erfolgreichem Abschluss des Fachpraktikums sind die Studierenden in der Lage, Abschlussarbeiten unter Anwendung einer wissenschaftlich-technischen Methodik zu erarbeiten und die schriftliche Ausarbeitung dazu zu verfassen. Sie beherrschen den Umgang mit modernsten Technologien im Bereich Cloud Computing und Micro Service-basierter Architekturen und können diese für die Entwicklung von Anwendungssystemen im Bereich Natural Language Processing, insbesondere Named Entity Recognition sowie Information Retrieval nutzen. Des Weiteren sind sie in der Lage, ihre Erfahrungen und Kompetenzen direkt in die wissenschaftlich-technische Softwareentwicklung einzubringen. Sie können geplante Arbeiten in einem Exposé darlegen und die Ergebnisse in einer Abschlussdokumentation präsentieren und verteidigen. Die Fähigkeit zur Erstellung schriftlicher Planungen und Dokumentationen sowie die Integration der implementierten Komponenten in einer Software-Entwicklungsumgebung werden ebenfalls erworben. Zudem werden praxisorientierte Werkzeugnutzung und typische Herangehensweisen zur Softwareentwicklung im Projektverlauf verinnerlicht.
Inhaltliche Voraussetzungen:
Für eine erfolgreiche Bearbeitung der Aufgabenstellungen sind Vorkenntnisse in folgenden Bereichen notwendig:
- Information Extraction / Natural Language Processing, Named Entity Recognition
- Information Retrieval / Search Engine
- Cloud Computing sowie Micro Service Architecture
- Machine Learning
- Java, Python
- Webentwicklung: Java Script, HTML5
- UML
- Prozessdesign
- Visualisierungsverfahren
Formal nach Prüfungsordnung:
- B.Sc. Informatik
- M.Sc. Informatik
- M.Sc. Praktische Informatik
- M.Sc. Wirtschaftsinformatik
Für alle bereits seit dem Sommersemester 2019 oder früher eingeschriebenen Studierenden in Studiengängen der Informatik gelten Übergangsbestimmungen gemäß der Prüfungsordnung.
Geforderte Leistungen:
- Ein Exposé zur Beschreibung der Vorgehensweise
- Eine State-Of-The-Art-Recherche zum Thema
- Die Modellierung (z. B. mit der UML) der geplanten Lösung
- Eine prototypische Implementierung inklusive Dokumentation
- Testfälle und Experimente, um die Implementierung zu prüfen
- Bewertung und Präsentation der Ergebnisse