Mit dem Senden der Anfrage stimmen Sie unseren Datenschutzbestimmungen zu.
Zwei Gründe für professionelle Vertonungen und Voice-Over
Kundenorientierung. Maximale Reichweite.
Zwei Gründe, warum Vertonungen und Voice-Over an Bedeutung gewinnen:
1. Ein kundenzentriertes Mindset legt nahe, den Arbeitsaufwand des Kunden so weit wie möglich zu reduzieren. Dazu gehört auch, dem Kunden Optionen anzubieten, sodass er die ihm genehmste Option wählen kann. Darum lohnt es sich zum Beispiel, Dokumente und Webseiten mehrsprachig anzubieten, selbst in Märkten, in denen die meisten Menschen Englisch sprechen. Schließlich fällt es uns einfacher, Inhalte in unserer Muttersprache zu verarbeiten.
2. Audio- und Video-Content explodiert geradezu. Die Menschen schauen bereits jetzt 17 Stunden pro Woche Onlinevideos – Tendenz steigend. Und da Videoinhalte deutlich häufiger geteilt werden als Text, sind sie ein wichtiger Bestandteil erfolgreicher Marketingstrategien.
Untertitel sind eine Möglichkeit, diese Audio- und Video-Inhalte mehrsprachig anzubieten, Vertonungen und Voice-Over eine andere. Das Gute: Sie schließen sich nicht aus. Die maximale Reichweite, etwa auf YouTube, sichern Sie sich, indem Sie beide Technologien kombinieren.
Klar, für die Übersetzung mehrsprachiger Inhalte beauftragt man in der Regel ein professionelles Übersetzungsbüro. Aber es lohnt sich, dieses auch für die technische Umsetzung inklusive Vertonung zu nutzen, sofern es das nötige Know-How denn mitbringt – wie eben DialogTicket. Sicher, Ihre Werbeagentur könnte das auch. Aber es spart Zeit und Geld, die Anzahl der Glieder in Ihren Lieferantenketten gering zu halten. Zudem ersparen Sie sich unnötiges Hin und Her bei der Kommunikation zwischen verschieden Lieferanten. Die Konsequenz: Ihre Inhalte gehen schneller online.
Was kostet eine Vertonung?
Zur ersten Orientierung.
Der Preis für eine Vertonung inklusive Übersetzung hängt einerseits von den Zielsprachen, dem Textvolumen und der Textart ab, andererseits von der Art der Vertonung sowie den Projektanforderungen. Ein einheitlicher Minutenpreis ist daher nicht möglich. Gern sichten wir Ihr Material und machen Ihnen dann ein Angebot. Um Ihnen eine erste Idee zu geben, in welchem Rahmen sich die Kosten* bewegen, hier ein paar erste Informationen:
-
Erstellung der Untertitel € 6 / Minute
Notwendig als Grundlage für die Übersetzung und Vertonung
Ist eine Optimierung notwendig: € 70 / Arbeitsstunde -
Übersetzung des Ausgangsmaterials ab € 12 / Minute
Preis abhängig von Sprache und Fachgebiet
Normale Redegeschwindigkeit (ca. 100 Wörter / Minute) -
Menschliche Vertonung € 50-200 / Minute
Preis abhänging vom Sprecher und der Sprache
-
Vertonung mit KI-Stimmen € 30 / Minute
Inklusive Anpassung und Editieren
Basierend auf den Timestamps der Untertitel
-
KI-Synchronisation € 10 / Minute
Alles inklusive, da Untertitelung und Übersetzung durch Fachübersetzer entfallen
Keine Anpassungen möglich
*Alle Preise zzgl. MwSt.
Vertonung, Voice-Over und Synchronisation
Was ist denn da der Unterschied?
Der Begriff der Vertonung ist mehrdeutig. Einerseits bezeichnet er den Prozess der Überführung eines literarischen Textes in ein akustistisches Medium, andererseits bezieht er sich im Rahmen der Medienproduktion auf das Hinzufügen von Audioinhalten jeglicher Art. Dabei kann es sich um gesprochene Sprache handeln, aber auch um Hintergrundmusik, akustische Effekte usw.
Als Übersetzungsbüro konzentrieren wir uns natürlich auf die Übersetzung von bestehendem Audio- und Videomaterial. Diese Übersetzung lassen wir dann wahlweise durch menschliche Sprecher einsprechen oder via Text-to-Speech-Tools generieren. In der Regel ersetzen wir dabei die ursprüngliche Sprachspur der Ausgangsdatei.
Das Voice-Over ist eine spezielle Art der Vertonung. Dabei wird ebenfalls eine Stimme über die Originalaudiospur eines Videos oder einer Sendung gelegt. Aber die ursprüngliche Spur wird dabei nicht vollständig entfernt; sie bleibt also hörbar. Allerdings wird dessen Lautstärke meist reduziert.
Sie kennen das bestimmt aus Dokumentarfilmen, Nachrichtensendungen und Bildungsmaterialien. Dort liefert das Voice-Over in der Regel zusätzliche Informationen oder Kommentare. Voice-Over werden außerdem bei der Übersetzung von Inhalten in andere Sprachen eingesetzt, wobei die Originalstimme leise im Hintergrund bleibt, etwa damit der Zuhörer oder Zuschauer den Ton oder die Stimmung eines Interviews nachvollziehen kann.
Bei der Synchronisation wird der Originaldialog eines Videos oder Films durch eine neue Audioaufnahme in einer anderen Sprache ersetzt. Ziel ist es, die Lippenbewegungen der Personen so genau wie möglich mit der übersetzten Sprache zu synchronisieren. Im deutschen Fernsehen werden die meisten internationalen Filme synchronisiert. Ziel ist es, dem Publikum ein nahtloses Seherlebnis in der eigenen Sprache zu ermöglichen. Im Gegensatz zum Voice-Over wird die Originalstimme hier vollständig durch die neue Aufnahme ersetzt. Synchronisationen bieten wir nur KI-basiert an.
Vertonung durch menschliche Sprecher
Für die besten Ergebnisse.
Ob im Fernsehen, Internet oder Radio, menschliche Sprecher sind nach wie vor der Goldstandard – aus gutem Grund. Ein Sprecher kann sich nahezu beliebig an die Anforderungen eines Projektes anpassen, Nuancen mit seiner Stimme herausarbeiten und so die Botschaft effektiv vermitteln. Bei Übersetzungen kann er sich dem Stil des Ausgangsmaterials anpassen und so dafür sorgen, dass Ihre Unternehmenskommunikation über verschiedene Sprachen hinweg konsistent bleibt. Ein menschlicher Sprecher ist daher oft die beste Wahl, wenn Sie eine hochwertige, professionelle Vertonung benötigen.
Vorteile einer
menschlichen Vertonung
- Professionellstes Ergebnis
- Menschliche Muttersprachler ohne Akzent
- Hohe Flexibilität, da Aussprache, Ton und Geschwindigkeit an das Projekt angepasst werden
- Von Zuhörern als natürlich empfunden
- Ausgabequalität hängt nicht vom Umfang des Ausgangsmaterials ab
- Eignet sich besonders für hochwertige Produktionen im TV- und Marketing-Bereich
Nachteile einer
menschlichen Vertonung
- Verfügbarkeit der Sprecher kann variieren
- Mehr Aufwand vor Projektbeginn, z. B. bei der Suche und Wahl des bestgeeigneten Sprechers
- Aufnahme und Umsetzung dauert länger (weniger für Projekte mit engen Deadlines geeignet)
- Korrekturschleifen sind aufwändig
- Keine Lippensynchronisation
- Preise variieren mit den Sprechern
- Nicht so kostengünstig wie KI-Alternativen
Musik oder Geräuschkulisse im Hintergrund?
Drei Möglichkeiten, damit umzugehen.
Die bestmögliche Audioqualität bei einer Vertonung und einem Voice-Over erzielen wir, wenn Sie die Spracheaufnahme und eventuelle Hintergrundmusik oder -geräusche auf separaten Audiospuren liefern. So können wir die Sprachspur einfach durch unser Voice-Over ersetzen, die Hintergrundmusik oder -geräusche aber unangetastet lassen. Der Gesamteindruck des Originals bleibt erhalten.
Getrennte Audiospuren liegen aber nicht immer vor. Sei es, weil die original Audio- oder Video-Projektdatei nicht mehr vorliegt. Sei es, weil der Sprecher in der Natur oder in der Stadt aufgenommen wurde, sodass die Hintergrundgeräusche Teil der Sprachspur sind.
Im Wesentlichen gibt es drei Ansätze, mit solchen Projekten umzugehen:
1. Wir reduzieren die Lautstärke des Originals und legen die Übersetzung als Voice-Over darüber. So etwas kennen Sie sicherlich aus dem Fernsehen, wenn im Hintergrund zum Beispiel das Originalinterview läuft, die Übersetzung aber gut verstehbar darübergelegt wurde.
2. Wir eliminieren die Audiospur ganz und ersetzen sie durch die eingesprochene Übersetzung. Das bietet sich zum Beispiel bei Aufnahmen von Vorträgen und Präsentationen an, da die Publikumsgeräusche meist nicht wesentlich sind.
3. Wir filtern die Originalstimme so gut wie möglich heraus, sodass man sie nicht oder kaum mehr hört. Das funktioniert nicht immer, abhängig vom Geräuschpegel oder der Art der Geräusche, aber dank KI erstaunlich gut. Das bietet sich zum Beispiel bei Unternehmensfilmen mit Hintergrundmusik an.
KI-basierte Vertonung
Günstig und gut, aber weniger flexibel.
Vorbei sind die Zeiten, in denen Computer-generierte Stimmen wie Roboter klingen. Sie klingen natürlicher, emotionaler, und überzeugender denn je. Es gibt allerdings eine Vielzahl von unterschiedlichen Systemen, jeweils mit ihren eigenen Stärken und Schwächen. Manche Systeme klingen so gut, dass man sie kaum von Menschen unterscheiden kann, bieten aber nur eine kleine Auswahl an Stimmen, unterstützunge nur wenige Sprachen oder lassen sich kaum anpassen. Andere Systeme wiederum bieten maximale Flexibilität, sind aber nicht ganz so überzeugend. Die Sprechgeschwindigkeit lässt sich beinahe beliebig ändern. Die Betonung einzelner Wörter lässt sich festlegen. Sätze können freudig, traurig, oder ärgerlich vorgetragen werden. Solche Systeme sind aufwändiger in der Bearbeitung, dafür lassen sie sich aber auch für Projekte mit sehr speziellen Anforderungen nutzen. Ein Ansprechpartner, der die besten Systeme kennt und das für Ihr Projekt geeignetste nutzt, lohnt sich also.
Originaltonspur mit menschlichem deutschen Sprecher
Übersetzung der Originalspur und Vertonung mit einer männliche amerikanische KI-Stimme
Übersetzung der Originalspur und Vertonung mit einer männlichen britischen KI-Stimme
Übersetzung der Originalspur und Vertonung mit einer weiblichen amerikanischen KI-Stimme
Übersetzung der Originalspur und Vertonung mit einer weiblichen amerikanischen KI-Stimme
Vorteile einer KI-Sprachsynthese
- Günstig
- Schnelle Umsetzung Ihrer Projekte möglich
- Stimmen sind weitgehend akzentfrei
- Einige Systeme erlauben das Anpassen der Aussprache, z. B. via Lautschrift (besonders bei Produkt- und Unternehmensnamen wichtig)
- Übersetzungen lassen sich editieren
- Ausgabequalität hängt nicht vom Umfang des Ausgangsmaterials ab
- Eignet sich besonders für Videos, in denen der Sprecher nicht zu sehen ist, wie etwa Marketing-Material, Schulungen, usw.
Nachteile einer KI-Sprachsynthese
- Stimmcharakteristik der Originalstimme bleibt nicht erhalten
- Die Stimmen klingen zwar gut, aber nicht immer 100% menschlich
- Die Stimmen lassen sich teilweise anpassen, aber die Nuancen menschlicher Kommunikation können sie nicht einfangen
- Lippenbewegungen von Sprechern werden nicht berücksichtigt
- Nicht alle Sprachen werden unterstützt
- Die Qualität des Outputs variiert von Stimme zu Stimme und von Sprache zu Sprache
KI-Synchronisation
Wenn es schnell gehen muss.
Moderne KI-Systeme können Stimmen klonen und sie als Grundlage für eine synchronisierte Übersetzung verwenden. Dabei wird versucht, einerseits die Stimmcharakteristik der Sprecher soweit wie möglich in der Zielsprache zu erhalten, andererseits die Übersetzung so zu gestalten, dass sie bestmöglich mit den Lippenbewegungen des Ausgangsvideos synchron läuft. Das funktioniert nicht immer perfekt, aber das Resultat wirkt oft natürlicher und weniger irritierend als eine vom Bild unabhängige Vertonung.
Vorteile einer KI-Synchronisation
- Sehr günstig
- Schnelle Vertonung auch längerer Videos
- Stimmcharakteristik der Sprecher bleibt in der Zielsprache weitgehend erhalten
- Lippenbewegungen werden bei der Übersetzung berücksichtigt
- Eignet sich besonders für Interviews und Vorträge, bei denen die Sprecher zu sehen sind
Nachteile einer KI-Synchronisation
- Stimmen haben manchmal einen starken Akzent in der Zielsprache
- Übersetzungen sind verständlich, wirken aber oft holprig und nicht muttersprachlich
- Fehler lassen sich nicht korrigieren, da Übersetzung und Vertonung gleichzeitig erfolgen
- Ausgabequalität hängt von der Länge und Qualität des Ausgangsmaterials ab
Von der Anfrage zur Vertonung
Wie läuft es ab?
Angenommen, Sie haben Audio- oder Videomaterial und wünschen nun eine Vertonung oder vielleicht auch spezifisch ein Voice-Over. Wie läuft so etwas dann ab?
Zunächst sichten wir Ihr Material und hören rein. Wichtig ist nicht nur, wie umfangreich das Material ist, sondern auch, wie gut die Audioqualität ist, ob es Hintergrundgeräusche oder Musik gibt und ob mit Akzent gesprochen wird. Generell gilt: Je besser die Qualität des Ausgangsmaterials, desto einfacher ist es, eine Transkription oder Untertitel zu erstellen, welche wir dann im Anschluss übersetzen und schließlich vertonen. Mit anderen Worten, die Ausgangsqualität wirkt sich auf den nötigen Aufwand und damit auch auf den Preis aus.
An dieser Stelle suchen wir in der Regel das Gespräch mit den Kunden, um Details zu besprechen und um sie zu beraten.
Was ist der Zweck der Vertonung? Wo soll sie präsentiert werden? Haben Sie bestimmte Vorstellung und Wünsche zur Stimme? Eignet sich das Material besser für eine menschliche Vertonung oder sind auch von einer KI-Vertonung gute Resultate zu erwarten? Welche Formate benötigen Sie? Gibt es separate Tonspuren?
Sind Ihre Anforderungen und Präferenzen geklärt, erstellen wir das Angebot. Sagt Ihnen dieses zu, machen wir uns an die Arbeit.
An dieser Stelle passen wir uns gern an Ihre Unternehmensprozesse an. Einige Kunden möchten zum Beispiel zunächst die Übersetzung sichten und freigeben, bevor es an die Vertonung geht. Kein Problem. Sie wünschen zunächst ein paar Stimmproben für Ihre Texte? Auch kein Problem.
Kostenlose Beratung
Sie haben Fragen zur Umsetzung Ihres Projektes oder möchten ein Angebot einholen? Wunderbar! Unsere Projektmanager beraten Sie gern.
Ihr kostenloses Angebot
Sie haben Fragen zur Umsetzung Ihres Audioprojektes oder möchten ein Angebot einholen?
Wunderbar! Unsere Projektmanager beraten Sie gern.