Angebot-Anfrage

Voiceover

Videos dank KI in beliebig viele Sprachen vertonen

Transkribieren mit computergestützter Transkription (Computer Aided Transcription) – Fluch und Segen zugleich

Die Entwicklung von auf künstlicher Intelligenz (KI) basierenden Computertools zur Spracherkennung macht riesige Fortschritte. Es scheint, als wäre die Lösung für all unsere Sprachbarrieren gefunden. Aber stimmt das wirklich?

Künstliche Intelligenz kann einen kurzen, perfekt ausgesprochenen Satz ebenso perfekt wiedergeben. Aber, Hand aufs Herz, wie oft hören Sie solche Sätze an einer Konferenz oder in einem Meeting? In 20 bis 25 % der Fälle fehlt das Verb, oder Subjekt oder der Satz ist in einer anderen Form unvollständig.

Unser Gehirn ist dagegen ein Meister im Zusammenstückeln, Interpretieren und im Überhören von Fehlern. So füllt es Lücken und vervollständigt Sätze, ohne dass wir überhaupt darüber nachdenken müssen. Und was noch wichtiger ist, die Bedeutung entgeht uns nicht.

Die Computertools stehen hingegen vor einer schier unlösbaren Herausforderung. Denn ohne Kontext, Hintergrundwissen und Entscheidungskompetenz haben sie keine Möglichkeit, die sprachlichen Defizite zu kompensieren und produzieren darum ein Kauderwelsch, das ohne menschliche Intervention nicht zu entziffern ist.

Die Transkriptionssoftware ist also noch immer auf uns angewiesen. Wie Sie dazu beitragen können, um bei der Transkription möglichst genaue Treffer zu landen, finden Sie in unserem Ratgeber zur Untertitelung. Denn wussten Sie, dass die ersten Schritte für das Voiceover und die Untertitelung dieselben sind?

Googelt man CAT tool findet man Computer Assisted/Aided Translation… zumindest auf den ersten 6 Seiten (weiter habe ich nicht gesucht). Auch wenn es ein korrektes Akronym ist, würde ich hier darauf verzichten und es wenn nötig ausschreiben.

Schlechte Tonaufnahmen

Es reicht nicht aus, die Ohren zu spitzen, wenn ein Redner sich zu weit vom Mikrofon entfernt. Ein oder zwei Worte, die verloren gehen, reichen aus, um den Sinn eines Satzes zu verlieren. Für die künstliche Intelligenz, die in keiner Weise realisiert, was gerade passiert ist, ist es so, als ob es eine Unterbrechung gegeben hätte. Aber Unterbrechung bedeutet das Ende des Satzes, also Punkt! Die maschinelle Transkription kann bei schlechter Tonaufnahme weitere 20% an Verständlichkeit verlieren.

Gegenmassnahmen ergreifen

Glücklicherweise gibt es Möglichkeiten, diese Hemmnisse auszuräumen. Mit den folgenden Tipps können Sie mit einer modernen AI (CAT) Ergebnisse von 95% und mehr erzielen. Das bedeutet weniger Kosten und kürzere Lieferzeiten.

Ein Beispiel: Bei einer Transkriptionsqualität von mehr als 95 % gewähren wir einen Rabatt von 25 %. Sollte die Qualität unter 90 % liegen, multiplizieren wir die Pauschale mit 150 %.

Kostensparmassnahmen:

  • Stellen Sie sicher, dass die Aufnahmequalität perfekt ist. Jeder Redner und jede Rednerin sollten ein professionelles Headset verwenden. (Bild)
  • Führen Sie eine Generalprobe durch und bitten Sie Redner und Rednerin, in kurzen und präzisen Sätzen zu sprechen. Verbessern Sie, falls erforderlich.
  • Um die Phrasierung zu perfektionieren, verwenden Sie bei der Aufnahme einen Teleprompter.
  • Stellen Sie uns das Originalskript mit einer Liste der Abkürzungen, Akronyme und Schlüsselwörter Ihrer Organisation zur Verfügung.

Und zu guter Letzt können wir Ihnen das gesamte Aufnahmematerial einschliesslich der Techniker zur Verfügung stellen oder sogar die Audio-Video-Aufzeichnung in einem Studio für Sie durchführen.