Abschlussarbeit

Masterarbeit: "Leveraging Synthetic Datasets for Enhanced Optimization of Mask R-CNNs through Comparative Analysis"

Verfasser/in:
Tobias Wolf
Ansprechperson:
Prof. Dr. Matthias Thimm
Status:
abgeschlossen
Jahr:
2024
Download:
Master.Wolf

Beschreibung:

Die Verfügbarkeit ausreichender und vielfältiger Datensätze stellt eine entscheidende Herausforderung für die Entwicklung von effektiven Machine-Learning- Modellen im Bereich der Computer Vision dar. Diese Studie untersucht den Einfluss von synthetischen Daten auf die Leistung eines Mask R-CNN-Modells für die Detektion von Hautkrebs.

Um diesen Einfluss zu untersuchen, wurden synthetische Daten in das vorhandene Datenset integriert. Zwei verschiedene Ansätze wurden dabei verwendet: Zum einen wurden klassische Data-Augmentation-Techniken angewendet, bei denen Krebszellen als Vordergrund auf entsprechenden Hintergründen platziert wurden. Zum anderen wurden synthetische Bilder mithilfe von Generative Adversarial Networks (GANs) generiert.

Das Mask R-CNN-Modell wurde anschließend mit verschiedenen Datensätzen und Verhältnissen von synthetischen zu echten Daten trainiert. Die Leistung der trainierten Modelle wurde anhand eines separaten Testsets bewertet. Die Ergebnisse zeigen, dass die Ergänzung des Datensets mit synthetischen Daten die Leistung der Modelle verbessert. Besonders bemerkenswert ist, dass Modelle, die ausschließlich mit synthetischen Daten aus GANs erweitert wurden, die besten Leistungen erzielten.

Diese Erkenntnisse tragen dazu bei, das Verständnis dafür zu verbessern, wie synthetische Daten das Training von Machine-Learning-Modellen beeinflussen können, insbesondere im Bereich der medizinischen Bildgebung. Darüber hinaus legen sie nahe, dass die Verwendung von GANs eine vielversprechende Strategie für die Datenaugmentation in ähnlichen Anwendungen darstellen könnte.

Die Ergebnisse dieser Studie haben potenziell weitreichende Auswirkungen auf die Entwicklung von effektiven und robusten Machine-Learning-Modellen für die medizinische Diagnostik und anderer Einsatzgebiete.

20.06.2024