Rosa Sala - Nubart

Dr. Rosa Sala

CEO von Nubart

Was Sie von KI-Simultanübersetzer erwarten können (und was nicht)

Interpreter in a booth performing simultaneous interpretation during a conference, with headphones and microphone.

Das Ende der Nachsicht: Warum wir von KI Perfektion verlangen, die wir von Menschen nie erwartet haben. Aus der Perspektive einer professionellen Übersetzerin, die jahrzehntelang in Simultandolmetscherkabinen gearbeitet hat und nun führend bei der Entwicklung von KI-Dolmetschsystemen tätig ist.


Inhalt dieses Artikels


Die Perspektive eines menschlichen Dolmetschers

Aus familiären Gründen bin ich zweisprachig in Deutsch und Spanisch groß geworden. Bevor ich Nubart gründete, widmete ich mein Leben anderen Tätigkeiten, von denen eine der erfolgreichsten und, warum sollte ich es leugnen, lukrativsten die des Dolmetschers war. Ich begann im Alter von 16 Jahren, während ich als Sekretärin für eine Immobilienfirma arbeitete: Ich musste meinen spanischen Chef begleiten und sprachlich unterstützen, wenn er deutschen Kunden Wohnungen an der Küste zeigte. Ich erkannte schnell, dass ich meinen Arbeitstag viel früher beenden und zum Mittagessen gehen konnte, wenn ich nicht jeden Satz nacheinander übersetzte, sondern simultan, indem ich meinem Chef oder dem Kunden die Übersetzung ins Ohr flüsterte. Es dauerte Jahre, bis ich herausfand, dass diese Technik, die ich für meine Erfindung hielt, „Chuchotage” heißt.

Kurz darauf professionalisierte ich diese Nebentätigkeit. Ich arbeitete bei Unternehmenssitzungen, auf internationalen Kongressen und bot meine Dienste in allen erdenklichen Formen des Dolmetschens an: simultan in einer Kabine, konsekutiv, als Relais für andere Übersetzer...

Interpreter in simultaneous translation booth
Die Autorin wartet in einer schalldichten Übersetzungskabine auf den Beginn der Präsentation

Häufig erhielt ich vom Kunden Kontextdokumente zur Vorbereitung: Glossare oder sogar – in seltenen Fällen – das vollständige Manuskript des Redners. Doch selbst bei gewissenhafter Vorbereitung Tage vor der Veranstaltung kann ein Dolmetscher niemals eine perfekte Verdolmetschung erzielen.

Doch wie kann man die Qualität einer Verdolmetschung messen, die in Echtzeit, mit hoher Geschwindigkeit und ohne die Möglichkeit, ein Wörterbuch zu konsultieren, durchgeführt wird? Vielleicht, indem man sie mit der schriftlichen Übersetzung derselben Rede vergleicht, die der Dolmetscher zu Hause, mit Zeit und Ressourcen und ohne den Druck der Echtzeit erreicht hätte. Wenn wir diese schriftliche Übersetzung als theoretischen Maßstab (100 %) nehmen, ist die Genauigkeit einer professionellen Echtzeit-Dolmetschleistung zwangsläufig geringer. Ein erfahrener Dolmetscher kann diesem Idealwert bemerkenswert nahe kommen (im Bereich von 90 %), während es unter realen Bedingungen immer einen unvermeidlichen Verlust gibt.

Diese kleine Lücke, die mich und meine besten Kollegen von der Perfektion trennte, schien niemanden zu stören. Meine Kunden bewunderten die menschliche Fähigkeit, mit rasender Geschwindigkeit zwischen Sprachen zu wechseln, und waren immer mit dem Ergebnis zufrieden. Sie bezahlten Tagessätze von 500 Euro ohne mit der Wimper zu zucken – und bedachten mich zusätzlich mit herzlichen Komplimenten. Es war eine anstrengende Arbeit, aber sehr befriedigend.

Die Schwächen des menschlichen Dolmetschens im Vergleich zur KI

Heute arbeite ich hauptberuflich als CEO und Mitbegründerin von Nubart. Im Sommer 2025 haben wir Nubart TRANSLATE eingeführt, ein KI‑basiertes Simultandolmetschsystem mit Audio‑ und Textausgabe. In Wirklichkeit handelt es sich um ein Produkt, das technologisch dem entspricht, was ich seit Jahrzehnten als Dolmetscherin leiste. Meine Erfahrung hat positiv zur Entwicklung dieses Produkts beigetragen. Allerdings hat sich die Situation grundlegend verändert.

Ich habe nicht den Eindruck, dass KI‑Systeme wie Nubart TRANSLATE mehr oder weniger Fehler enthalten als ein guter menschlicher Dolmetscher. Einfach ausgedrückt: KI-Fehler sind anderer Natur.

KI-Sprachmodelle verfügen beispielsweise über ein übermenschliches Gedächtnis und sind in der Lage, Fachbegriffe wesentlich besser zu übersetzen als jeder menschliche Dolmetscher. Sie sind äußerst effektiv, wenn ein Redner Zahlenkolonnen herunterrattern, ein klassischer Albtraum für menschliche Dolmetscher.

Manchmal versagen sie jedoch dort, wo ein Mensch keine Probleme hätte: beispielsweise bei der Unterscheidung zwischen der Stimme des Sprechers und einer anderen Stimme im Hintergrund, die nicht übersetzt werden sollte. Oder sie haben Schwierigkeiten, Punkte und Kommas korrekt zu setzen. Oder sie sind „zu präzise“ und wiederholen mögliche Fehler des Sprechers, die ein menschlicher Dolmetscher fast ohne nachzudenken sofort erkannt und korrigiert hätte. Tatsächlich ist übermäßige Präzision oft die Schwachstelle einer KI-Übersetzung. Der Mensch dagegen glättet das Gesagte, macht es idiomatischer und fasst es oft zusammen, indem er unnötige Redundanzen entfernt.

KI-Dolmetschen kostet nur einen Bruchteil dessen, was der Einsatz eines Teams von menschlichen Dolmetschern kosten würde, sowohl in rein wirtschaftlicher Hinsicht als auch in Bezug auf den logistischen und koordinativen Aufwand. Bei jedem anderen Produkt oder jeder anderen Dienstleistung bestimmt der Preis das Niveau der Erwartungen. Autofahrer erwarten von einem Porsche Carrera eine höhere Leistung als von einem Volkswagen Polo oder von einem Senior-Berater bei McKinsey mehr als von einem MBA-Studenten.

Die inkongruenten Erwartungen, die durch KI-Simultandolmetschen geweckt werden

Beim Simultandolmetschen scheint diese Logik außer Kraft gesetzt. Die Erwartungen der Kunden von Nubart TRANSLATE übertreffen bei weitem diejenigen, die ich in meiner Karriere als menschlicher Dolmetscher erlebt habe.

Sowohl meine Kunden als auch meine Berufskollegen hätten es als unhöflich empfunden, mich mit einer Aufzeichnung meiner Arbeit zu konfrontieren und mir nacheinander Interpretationsfehler aufzuzeigen oder mir eine Liste mit Verbesserungsvorschlägen für zukünftige Dienstleistungen zu präsentieren. Seltsamerweise sind Verhaltensweisen, die bei menschlichen Dolmetschern undenkbar waren, mittlerweile gang und gäbe, wenn die Verdolmetschung von einem KI-System durchgeführt wird.

Einige Kunden von Nubart TRANSLATE senden uns lange, detaillierte Listen, wie bestimmte Begriffe übersetzt werden sollen, einschließlich „bevorzugter Ausdrücke” für Übersetzungen, die objektiv korrekt sind. Sie nehmen Ausschnitte aus Übersetzungen auf, die sie durch unseren kostenlosen 30-minütigen Test erhalten haben, und vergleichen diese mit einer korrigierten Version, „für das nächste Mal”.

Warum sind die Erwartungen an KI-Übersetzungen so radikal anders? Das ist eine faszinierende Frage, die viel über unsere Beziehung zur Technologie verrät.

Erster Irrtum: Mathematische Präzision

Menschen gehen unbewusst davon aus, dass eine Maschine genau sein muss. Wir können einem Schüler verzeihen, der sich beim Kopfrechnen verrechnet, aber einem Taschenrechner verzeihen wir das nicht. Die Arbeit mit menschlicher Sprache ist jedoch viel subjektiver und komplexer als die Arbeit mit Zahlen. Zwei plus zwei ist immer vier, aber wie viele verschiedene Möglichkeiten gibt es, einen Vers zu übersetzen? Was ist die „richtige“ Vorgehensweise?

Zweiter Irrtum: Software unterliegt keinen Bedingungen

Menschliche Dolmetscher werden wie Bühnenkünstler geschätzt. Ihre Leistung wird anhand verschiedener Bedingungen bewertet: Komplexität, Stress, Erschöpfung, kognitive Belastung und Konzentrationsbedarf.

Bei einer Dolmetschsoftware neigen wir dazu zu denken, dass externe Bedingungen keinen Einfluss darauf haben, aber das stimmt nur teilweise. Auch KI benötigt, dass der Sprecher in der richtigen Geschwindigkeit spricht, dass seine Sätze verständlich sind, dass gute Mikrofone verwendet werden und der Ton sauber und frei von Echo und Störgeräuschen ist.

Dritter Irrtum: Die unsympathische, perfekte Maschine

Wir sind bereit, einem Menschen Fehler zu verzeihen. Aber niemand empfindet Empathie oder Mitgefühl für eine Maschine. Dies gilt umso mehr, wenn diese Maschine mit KI betrieben wird, die von vielen – nicht ohne Grund – als Bedrohung für traditionell menschliche Fähigkeiten angesehen wird. Es gibt eine gewisse Schadenfreude und einen „Stolz der Spezies", wenn wir Fehler bei einem „Konkurrenten" wie der künstlichen Intelligenz entdecken. Wenn das System einen Fehler macht, wird es als ein Produkt angesehen, das „debuggt" werden muss.

Vierter Irrtum: Simultandolmetschen ist dasselbe wie maschinelle Übersetzung

Viele Kunden erwarten von der KI-Simultanübersetzung die gleichen Ergebnisse wie beim Kopieren und Einfügen eines Textes in DeepL oder Google Translate, oder beim Übersetzen eines Dokuments mit ChatGPT. Dieser Vergleich beruht auf einem grundlegenden Missverständnis.

Die traditionelle maschinelle Übersetzung arbeitet mit vollständigen Texten. Das System kennt das Ende jedes Satzes, bevor es ihn übersetzt, und kann das Ergebnis mit dieser Information optimieren. Simultandolmetschen – ob von Menschen oder KI – funktioniert grundlegend anders: Es erfolgt live, ohne zu wissen, wie der Satz weitergeht, und erfordert sprachliche Entscheidungen in Echtzeit, basierend auf Antizipation und Wahrscheinlichkeit.

Hinzu kommt eine zusätzliche Schwierigkeit, die oft übersehen wird: Bevor die KI übersetzen kann, muss sie den Sprecher verstehen. Gesprochene Sprache in Echtzeit zuverlässig in Text umzuwandeln – mit Akzenten, Hintergrundgeräuschen und unvollkommenen Mikrofonen – ist eine enorme technische Herausforderung, mitunter ebenso komplex wie die Übersetzung selbst.

Simultandolmetschen mit einer zeitversetzten Textübersetzung zu vergleichen ist wie eine Live-Übertragung mit einem im Studio bearbeiteten Video zu vergleichen: Beides kann hervorragend sein, aber sie folgen völlig unterschiedlichen Regeln.

Warum übermäßig lange Glossare die Übersetzung verschlechtern

Aber kann das Ergebnis der KI nicht durch ein Glossar perfektioniert werden?

Durch die Integration des Glossars kann die KI in den meisten Fällen darauf trainiert werden, die vom Kunden bevorzugte Terminologie zu verwenden, ähnlich wie dies bei einem menschlichen Dolmetscher der Fall wäre. Diese Terminologielisten entstehen aus einem echten Interesse an der Verbesserung der Qualität, manchmal aber auch aus dem Wunsch des Veranstalters nach Kontrolle und der Vorstellung, dass Veranstaltungen perfekt vorhersehbar sind.

Als menschliche Dolmetscherin habe ich Tage damit verbracht, ganze Vokabeln auswendig zu lernen, die mir vom Kunden geschickt wurden und die letztendlich kaum verwendet wurden. Wenn diese Glossare sehr lang waren (z. B. 200 spezifische Begriffe zu einer Roboter-Priming-Anwendung), empfand ich das als kognitiven Lärm, der meinen Stresspegel erheblich erhöhte und die Arbeit eher eingeschränkt und starr als flüssig erscheinen ließ. Eine kurze Liste mit wichtigen Begriffen und einem erklärenden Text, der mir geholfen hätte, den technologischen Kontext zu verstehen, hätte zu einer wesentlich besseren Verdolmetschung geführt. Kein professioneller Dolmetscher verwendet zu einem bestimmten Zeitpunkt mehr als eine begrenzte Anzahl aktiver Begriffe. Darüber hinaus wird die Vorbereitung kontraproduktiv.

Neuronale Übersetzungssysteme berechnen Wahrscheinlichkeiten zwischen Wörtern: welches Wort erscheint normalerweise neben welchem anderen Wort. Jedes Mal, wenn ein Glossar die Übersetzung eines bestimmten Begriffs erzwingt, ändert sich nicht nur dieser Begriff, sondern auch die Übersetzungswahrscheinlichkeiten aller anderen Wörter im Satz. Dies wird von OneWord bestätigt, einem deutschen Unternehmen, das sich auf die Optimierung maschineller Übersetzungen spezialisiert hat. Es hat festgestellt, dass „ein überladenes Glossar aufgrund dieses Kaskadeneffekts bei den Wahrscheinlichkeiten des neuronalen Systems sogar zu mehr Fehlern führen kann”.

Eine Sprache funktioniert nicht wie eine mathematische Gleichung, die immer denselben Regeln folgt. Ein Kunde möchte vielleicht, dass wir „market-driven sustainability strategy” mit „marktgetriebene Nachhaltigkeitsstrategie” übersetzen. Aber was der Redner letztendlich sagt, ist: „the tactic we use to be sustainable is always based on the impulses that the market has provided us.” Dieselbe Idee, nur anders ausgedrückt.

Nun muss die KI das Glossar konsultieren, einen ähnlichen, aber nicht identischen Ausdruck finden und entscheiden, ob sie ihn gemäß den Anweisungen übersetzt oder sich wörtlich an die Formulierung des Redners hält. Hier liegt jedoch das technische Problem: Wenn die KI eine Übersetzung aus dem Glossar erzwingt, verändert sie das Wahrscheinlichkeitsmodell für den Rest des Satzes. Es ist, als würde man einen Dominostein verschieben: Die anderen Steine bewegen sich ebenfalls.

Darüber hinaus enthalten umfangreiche Glossare zwangsläufig mehrdeutige Begriffe: Wörter, die je nach Kontext unterschiedlich übersetzt werden sollten. Die meisten Glossarsysteme können diese kontextuelle Mehrdeutigkeit jedoch nicht bewältigen. Sie wenden einfach die erste oder letzte Übersetzung in der Liste an oder ignorieren den Begriff vollständig. Das Ergebnis ist unvorhersehbar: erzwungene Übersetzungen, die in der Hälfte der Fälle falsch sind.

Das Paradoxon ist offensichtlich: Ein prägnantes Glossar mit 15 bis 20 Schlüsselbegriffen verbessert die Übersetzung. Ein umfassendes Glossar mit 200 Begriffen verschlechtert sie.

Die eigentliche Herausforderung ist nicht technologischer, sondern pädagogischer Natur.

Diese Erwartungslücke lässt sich nicht durch eine fortschrittlichere KI schließen. Sie lässt sich durch ein besseres Verständnis dessen schließen, was Dolmetschen – ob menschlich oder künstlich – wirklich ist: eine außerordentlich komplexe Echtzeit-Übersetzungsaufgabe, die mit hochgradig fließendem Material wie Sprache arbeitet und innerhalb der Grenzen professioneller Exzellenz, nicht Perfektion, funktioniert.

Simultandolmetschungen mit KI wie Nubart TRANSLATE bieten in der Regel eine Qualität, die mit der der besten menschlichen Dolmetscher vergleichbar ist, und verfügen darüber hinaus über die transformativen Vorteile der KI: erschwingliche Kosten, sofortige Verfügbarkeit und unbegrenzte Skalierbarkeit.

Ist sie perfekt? Nein. Ist sie professionell, wirksam und revolutionär? Absolut. Ist sie verbesserbar? Natürlich, und bei Nubart arbeiten wir täglich daran.

Die Technologie hat etwas demokratisiert, das zuvor ein Luxus war, der nur Organisationen mit großem Budget vorbehalten war. Lassen Sie uns diese Revolution feiern, aber mit realistischen Erwartungen daran, was Dolmetschen – ob menschlich oder künstlich – wirklich leisten kann.

Wenn Sie erwägen, bei Ihrer nächsten Veranstaltung KI-Dolmetschen anzubieten, unterstützen wir Sie gerne dabei, es mit realistischen Erwartungen und maximaler Wirkung für Ihr Publikum zu gestalten.