Genial YouTube bietet automatische Transkription von Filmen an

Was viele nicht wissen: Die Google-Tochter YouTube bietet eine automatisierte Transkription von dort hochgeladenen Filmen an, also eine Abschrift dessen, was im Film gesagt wird. Das Tool ist einfach genial und zeigt, wie rasant die technische Entwicklung auch mit Hilfe Künstlicher Intelligenz (AI) voranschreitet und das wirklich zum Nutzen von Firmen und Verbrauchern.

Genial: Mühevolles Abtippen ganzer Filme wird zunehmend unnötig - Dank YouTubes automatischer Transkription.

Die automatische Transkription funktioniert zwar nicht bei allen Filmen, wie ein Test von Netz-trends.de zeigt, aber häufig. Um sich die Genialität dieses automatisierten Systems vor Augen zu führen, muss man wissen:

Eine manuelle Abschrift eines 45-minütigen Films, der beispielsweise auf YouTube oder einem anderen Videoportal hochgeladen wurde, würde leicht bis zu 10 Stunden Arbeit kosten. Ständiges vor- und zurückspulen und nochmals anhören kostet irre viel Zeit. Zudem sind manuelle Abschriften mindestens so fehlerbehaftet, wie automatisierte Systeme.

Doch Google wäre nicht Google, wenn der Superkonzern Nutzer nicht mit noch mehr Features in sein Bett locken würde, als die pure automatisierte Transkription von Filmen.

Für 45 Minuten Film braucht man bis zu über 1000 Untertitel

So stellt YouTube die Transkription nicht nur einfach als Text da, sondern gleich in Form von Zeitabschnitten des Films. Also in Hunderten kleinen Happen, sofern die Filmlänge das hergibt. Das ermöglicht wiederum Untertitel im Film, die man selber pro Film in YouTube ein- oder ausschalten kann.

Klassiker unter den Tools für die Erstellung von Untertiteln in Filmen: Aegisub. Allerdings kostet das Tool sehr viel Mühe und Zeit, bis die Untertitel erstellt sind.

Um sich das Ausmaß dieser genialen Technik zu verdeutlichen, muss man sich zudem die schiere Anzahl von eingeblendeten Untertiteln vor Augen führen, die man früher manuell als Filmanbieter erstellen musste:

Eine 45-Minütige ARD-Dokumentation kommt beispielsweise nach Recherche von Netz-trends leicht auf 1060 einzelne Untertitel. Wollte man so etwas manuell machen, würde man wahrscheinlich gut ein oder zwei Wochen fulltime dran sitzen. Wenn das reicht.

So gibt es zwar Programme, wie beispielsweise das «open-source tool for creating and modifying subtitles», «Aegisub». Doch ist die Arbeit damit etwas mühevoll. Das Copyright an Aegisub liegt seit 2005 bei Rodrigo Braz Monteiro, Niels Martin Hansen, Thomas Goyne und einigen anderen.

In Programmen wie Aegisub muss Szene für Szene der Untertitel manuell im Tool eingetragen werden Das Ergebnis ist dann zwar, wenn man es gut macht, perfekt, ist aber extrem zeitaufwendig. Setzen Firmen ihre Mitarbeiter für die Entwicklung von Subtiteln hin, kostet das natürlich entsprechend Geld.

Die in Tools wie Aegisub eingetragenen Subtitles müssen dann in Formaten wie «ASS File» Extension heruntergeladen werden. Dann lädt man die ASS-Datei entweder in seinem Schnittprogramm wieder hoch, oder importiert diese über sein YouTube-Backend in den dazugehörigen Film.

Geht alles, ist aber irre aufwendig. Mit Hilfe von künstlicher Intelligenz liest YouTube immer besser das gesprochene Wort aus Filmen aus und transkribiert es. Doch damit nicht genug. Obendrein können Nutzer die Subtitles in auf YouTube hochgeladenen Filmen in ihrer jeweiligen Sprache abrufen. Damit wird auch der Schritt der manuellen Übersetzung überflüssig.

Noch Schönheitsfehler in der YouTube-Technik

Einziger Schönheitsfehler noch: YouTube, beziehungsweise Google, sind derzeit nicht in der Lage zwischen einem beim Sprecher gedachten Satz-Punkt und einer normalen Sprechpause zu unterscheiden. Deshalb werden die so automatisiert hergestellten Untertitel in den YouTube-Filmen eher wie Bandwurmsätze eingeblendet. Das verändert dann leider schon so manches Mal etwas den eigentlichen Sinn.

Auf dem Rädchen unter den YouTube-Videos gelangt man auf den Punkt Einstellungen. Dort auf Untertitel gehen und dort dann die Sprache aussuchen, die man wünscht.

Wenn es jetzt noch gelingt, auch hier besser zu werden, steht der weltweiten mehrsprachigen Kommunikation und des Teilens von Wissen und Informationen irgendwann wirklich nichts mehr entgegen.

Auch andere Anbieter

Neben YouTube gibt es noch andere Anbieter, die automatisiert das in Filmen gesprochene Wort auslesen und in Text umwandeln. Wir machten beispielsweise den Test mit 360converter.com. Blöd nur, dass dieses Tool nicht erkannte, dass das gesprochene Wort Deutsch war. Das Resultat war, dass das Tool den Film gar nicht auslesen konnte. Stattdessen lieferte uns 360converter wirre englische Sätze ab, die gar nichts mit dem eigentlichen Inhalt zu tun hatten.

Zudem mussten wir gut eine Stunde warten, ehe unser Film überhaupt angeblich transkribiert wurde. Denn in der Warteschleife waren gut 25 andere Projekte. Warum eine Abschrift des gesprochenen Filmworts nicht parallel möglich war, lässt sich auf 360converter nicht so einfach herausfinden.

Auch externe Tools, wie dieses hier, bieten Abschriften an - dieses allerdings noch nicht in allen Sprachen.

Dann stießen wir während unserer Recherche noch auf den Film Abschriften Converter «DIYCaptions», der sich selbst als "YouTube Video To Text Converter" nennt. Zwar wird in einer Onlinebesprechung behauptet, dieses automatische Abschrift Tool von Filmen sei kostenlos. Allerdings stellten wir bei dem Test fest, dass die Kreditkarte abgefragt wurde.

Da wir von Netz-trends grundsätzlich empfehlen, einem Onlineshop keine Kreditkartendaten anzuvertrauen, über den es keine weiteren transparenten Kundenbesprechungen im Netz gibt, oder weitere Besprechungen, beispielsweise auf Blogs, sind wir etwas zurückhaltend, da unsere Kreditkartendaten einzugeben. Paypal wäre da besser gewesen.

Schreibt auch automatisch das in Filmen gesprochene Wort in Textform ab: www.diycaptions.com/. Wie gut das Tool funktioniert, haben wir nicht getestet. Über Leserkommentare dazu, freuen wir uns.

Stutzig machte uns auch, dass wir für DIYCaptions nicht mal ein Impressum auf der Seite finden konnten. Dennoch: Wer risikofreudiger ist, kann es mal ausprobieren. Man gibt die Browser-Adresszeile des Videos, dessen gesprochenes Wort man abgeschrieben haben möchte, in den dafür vorgesehenen Schlitz auf DIYCaptions ein. Kurz darauf wird die Eingabe der Kreditkartennummer erbeten.

Sollte jemand den Test machen und gute Erfahrungen damit gemacht haben, teilt euer Wissen bitte in Form eines Kommentars unterhalb unseres Textes mit anderen Nutzern.