Vollautomatische Untertitelung im Videoportal der FernUni

Die letzten Tests laufen noch. Der Übergang in den Produktivbetrieb ist in greifbare Nähe gerückt. Lisa Beckmann und Oliver Renić von Team Barrierefreie Medien des Zentrums für Lernen und Innovation wollen den Moment nutzen, um vorab ein paar Fragen zur vollautomatischen Untertitelung zu beantworten.

Automatisch erstellte Untertitel? Das gibt es doch schon länger an der FernUni, oder?

Ja, nur bislang wurden KI-generierte Untertitel auf Anfrage an uns und unter Auflistung der zu untertitelnden Videos erstellt. Das wird zukünftig alles nicht mehr nötig sein.

Was müssen Lehrkräfte zukünftig machen, damit Videos mit KI-generierten Untertiteln ausgestattet werden?

Da alles automatisch läuft, eigentlich nichts. Die im Videoportal MEDIAL hochgeladenen Videos erhalten, insofern nicht bereits Untertitel eingebunden worden sind,  KI-generierte Untertitel. Seitens der Lehrgebiete sollte das Ergebnis idealerweise kurz gesichtet und ggf. rückgemeldet werden, insofern Probleme auffallen.

Wie lange dauert es, bis die Videos automatisch untertitelt werden?

Die Untertitel sollten innerhalb eines 24-Stunden-Zeitfensters nach Upload zur Verfügung stehen.

Welche Software wird dafür genutzt?

Wir nutzen das multilinguale Sprachmodell Whisper large-V2 von OpenAI, die Source-Separation-Software Demucs sowie einen Voice ActivityDetector, um das whisper-spezifische Problem des „Halluzinierens“ bei Stille zu minimieren. Die genutzte Software ist open source und steht unter MIT-Lizenz. Des Weiteren nutzen wir unsere eigenen Skripte, um u. a. automatische Anpassungen im Hinblick auf unsere Untertitelrichtlinien vorzunehmen, Hinweistexte in die Untertitel zu integrieren oder eine Wort-/Zeichenfilterung vorzunehmen.

Was ist mit Datenschutz?

Alle Prozesse laufen auf einem Server der FernUni. Die zwischengespeicherte Dateien werden unmittelbar nach Untertitelerstellung automatisch gelöscht.

Wie sieht es mit der Qualität der automatischen Untertitel aus?

Was die Wortgenauigkeit und Interpunktion angeht, lässt sich sagen, dass die Qualität im Vergleich zu anderen, auch kommerziell vertriebenen Spracherkennungsmodellen sehr hoch ist. Nichtsdestotrotz dürfen auch Schwächen des Modells nicht unter den Tisch gekehrt werden – so etwa die merkliche Fehlerquote bei Eigennamen. Es gibt auch keine automatische Stimmzuordnung und Kennzeichnung von Sprecher*innen, was es Gehörlosen erschweren kann, Dialogen zu folgen. Wir haben diesbezüglich zwar Tests vorgenommen, aber ohne zufriedenstellendes Ergebnis. Des Weiteren ist die Einhaltung der Untertitelrichtlinien im Hinblick auf Standzeiten, maximale Zeilenlänge, Bildung von Sinneinheiten bei der Auto-Untertitelung nicht immer ideal. Zwar können auch bei der manuellen Untertitelung nicht immer alle Regeln gleichermaßen einhalten werden. Damit die automatische Untertitelung aber einigermaßen gut funktioniert, mussten wir den Spielraum zur Regelbrechung deutlich erhöhen.

Untertitel beim Video zur Villa Bechem
Untertitel beim Video zur Villa Bechem

Das heißt, die Auto-Untertitel sind nicht barrierefrei?

In der Regel müssen noch Korrekturen vorgenommen werden, bevor wir mit guten Gewissen die Untertitel als barrierefrei bezeichnen können. Tatsächlich gibt es Fälle, wo eine Nachbearbeitung nicht wirklich mehr erforderlich ist. Genauso gibt es aber Fälle, wo die Nachbearbeitung noch viel Kapazitäten bindet.

Welche Möglichkeiten gibt es, Korrekturen an den Untertiteln vorzunehmen?

Insofern nur kleinere inhaltliche Korrekturen vorgenommen werden müssen, bietet sich der Untertitel-Editor im Videoportal MEDIAL als die schnellste und einfachste Möglichkeit an, Untertitel zu bearbeiten. Bei größeren Eingriffen, die z. B. auch Zeitmarkenkorrekturen umfassen, melden sich die Lehrkräfte am besten an unseren Untertitel-Lektorats-Service: inklusive-videos@fernuni-hagen.de

Können neben Untertiteln auch Transkripte erstellt werden?

Ja, wir stellen neben den Untertiteln auch ein auto-generiertes Transkript als Fließtext bereit.

Wie sieht es mit automatischen Übersetzungen aus?

Bislang umfasst das Angebot keinen Übersetzungs-Service. Wir empfehlen, das erstellte und korrigierte Auto-Transkript mit einem Übersetzungsdienst wie DeepL übersetzen zu lassen.



Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert