Rosa Sala - Nubart

Dra. Rosa Sala

CEO de Nubart

Qué podemos esperar (y qué no) de la interpretación por IA frente a la interpretación humana

Intérprete en cabina realizando interpretación simultánea durante una conferencia, con auriculares y micrófono.

El fin de la benevolencia: por qué exigimos a la IA la perfección que nunca pedimos a los humanos. Desde la perspectiva de una intérprete profesional que ha trabajado en cabinas de traducción simultánea durante décadas y ahora lidera el desarrollo de sistemas de interpretación por IA.


Contenido de este artículo


La perspectiva de una intérprete humana

Por motivos familiares, soy bilingüe alemán-español. Antes de fundar Nubart en el 2013, dediqué mi vida a otras actividades, siendo una de lás más exitosas (y, por qué negarlo, también de las más lucrativas), la de intérprete. Me inicié en esta tarea a los 16 años, cuando trabajaba de secretaria en una promotora inmobiliaria: tenía que acompañar y apoyar lingüísticamente a mi jefe español cuando mostraba pisos en la costa a clientes alemanes. Ahí me di cuenta de que podía terminar mi jornada e irme a comer mucho antes si, en lugar de traducir cada frase de forma consecutiva, lo hacía de manera simultánea, susurrando la traducción al oído de mi jefe o del cliente. Tardé muchos años en averiguar que esa técnica que creí haber inventado se llama "chuchotage".

Poco después profesionalicé esta actividad colateral. Trabajé en reuniones de empresa, en congresos internacionales y ofrecí mis servicios en todas las modalidades imaginables de la interpretación: simultánea en cabina, consecutiva, susurrada, en relé para otros traductores…

Intérprete en cabina de traducción simultánea
La autora esperando el arranque de la ponencia en una cabina insonorizada de traducción

Muchas veces recibí del cliente documentos de contexto para prepararme: glosarios o incluso -raras veces- el manuscrito completo del texto del ponente. Pero aunque estudie concienzudamente todo esto días antes del evento, un intérprete nunca podrá realizar una interpretación perfecta.

Aunque, ¿qué podemos considerar "perfecto"? ¿Cómo medir la calidad de una interpretación que se realiza en tiempo real, a enorme velocidad y sin posibilidad de consultar un diccionario? Quizá podamos aproximarnos comparando el resultado de una interpretación simultánea con la calidad que habría alcanzado ese mismo intérprete traduciendo esa misma ponencia por escrito, en su casa, con tiempo y recursos, y sin la presión del tiempo real. Si tomamos esa traducción escrita como referencia teórica (100 %), el nivel de exactitud de una interpretación profesional en tiempo real se sitúa necesariamente por debajo. Un intérprete con experiencia puede acercarse de forma notable a esa referencia ideal (en el orden del 90 %), pero en condiciones reales siempre existe un margen inevitable de pérdida.

Ese salto que nos separaba a mí y a mis mejores colegas de la perfección no parecía molestar a nadie. Mis clientes admiraban la capacidad humana de alternar a velocidad de vértigo entre idioma e idioma y siempre quedaban satisfechos con el resultado. No solo premiaban mis jornadas con 500 € al día sin rechistar, sino con calurosas felicitaciones. Era un trabajo agotador, pero altamente satisfactorio.

Los fallos de la interpretación humana versus interpretación por IA

Entretanto soy CEO y co-fundadora de Nubart. En el verano del 2025 lanzamos Nubart TRANSLATE, un sistema de interpretación simultánea (con voz y texto) a través de AI. En realidad se trata de un producto tecnológicamente equivalente a lo que ha sido mi trabajo de intérprete durante décadas. Mi experiencia ha contribuido positivamente al desarrollo de este producto. Sin embargo, la situación ha cambiado de forma radical.

Por lo que respecta al nivel de perfección, no tengo la sensación de que la traducción por IA, como Nubart TRANSLATE, en condiciones comparables y bien definidas, tenga más o menos fallos que un buen intérprete humano. Simplemente, los fallos de la IA son de otra naturaleza.

Los modelos lingüísticos de la IA, por ejemplo, tienen una memoria sobrehumana y son capaces de traducir terminología técnica mucho mejor que cualquier intérprete de carne y hueso. También son tremendamente efectivas cuando el ponente enumera un listado de cifras (una clásica pesadilla para un intérprete humano).

Pero a veces fallan ahí donde un ser humano no tendría mayor problema: en distinguir la voz del ponente de otra voz que suena en el fondo y que no se debe traducir, por ejemplo. O tienen dificultades para colocar correctamente los puntos y comas. O son "demasiado precisos", replicando posibles errores del ponente que un intérprete humano habría identificado y corregido enseguida, sin pararse siquiera a pensar. De hecho, el exceso de precisión es a menudo el talón de Aquiles de una traducción por IA. El intérprete humano, en cambio, suaviza el discurso, lo vuelve más idiomático y a menudo lo resume eliminando redundancias innecesarias.

La interpretación por IA cuesta una pequeña fracción de lo que costaría implementar a un equipo de intérpretes humanos, tanto en términos puramente económicos como de esfuerzo de logística y de coordinación. En cualquier otro producto o servicio, el precio determina el grado de exigencia. Los conductores esperan un rendimiento mayor en un Porsche Carrera que en un Volkswagen Polo, o de un consultor senior de MacKinsey que de un estudiante de grado.

Las expectativas incongruentes que genera la traducción simultánea por IA

Y aquí es donde nos acercamos al tema de este artículo: Eso no así en la traducción simultánea. Las expectativas de los clientes de Nubart TRANSLATE superan con creces las que yo he experimentado en mi trayectoria como intérprete humana.

Tanto mis clientes como mis colegas de profesión habrían considerado de mala educación confrontarme con una grabación de mi trabajo y señalar uno a uno los fallos de interpretación o presentarme una lista de mejoras para que pueda tenerlas en cuenta en mis futuros servicios. Curiosamente, comportamientos que eran impensables con intérpretes humanos se han vuelto habituales cuando la interpretación la realiza un sistema de IA.

Algunos clientes de Nubart TRANSLATE nos envían largas listas detalladas de cómo deben traducirse determinados términos, incluso con "expresiones preferentes" para traducciones que son objetivamente correctas. Graban pedazos de traducción obtenidos a través de nuestro test gratuito de 30 minutos, lo comparan con la versión corregida y nos envían todo ese material, "para la próxima vez".

¿Por qué las expectativas son tan radicalmente diferentes cuando se trata de una traducción por IA?

Es una pregunta fascinante con derivas psicológicas que revelan mucho sobre nuestra relación con la tecnología.

Primera falacia: La precisión matemática

Los seres humanos asumen inconscientemente que si es una máquina, debe ser exacta. Podemos perdonar a un estudiante que se equivoque al sumar de memoria, pero no se lo perdonaremos a una calculadora. Pero trabajar con lenguaje humano es mucho más subjetivo y complejo que trabajar con números. Dos y dos siempre va a ser cuatro, pero ¿cuántas formas distintas hay de traducir un verso? ¿Cuál es la manera correcta de hacerlo?

Segunda falacia: El software no está sometido a condiciones

A los intérpretes humanos se les valora como a intérpretes escénicos. Se valora su actuación en función de diversas condiciones: la complejidad, el estrés, el agotamiento, la carga cognitiva, la necesidad de concentración.

Con el software de interpretación tendemos a pensar que las condiciones externas no le influyen, pero eso solo es cierto en parte. También una AI necesita necesita que el ponente hable con el ritmo adecuado, que sus frases sean inteligibles, que el micrófono sea de buena calidad y que el audio llegue bien aislado, sin ecos y sin interferencias.

Tercera falacia: La máquina antipática

A un humano estamos dispuestos a perdonarlo. Pero nadie siente empatía ni compasión con una máquina. Menos todavía si esa máquina está activada por AI, percibida por muchos, no sin motivos, como una amenaza a las habilidades tradicionalmente humanas. Hay cierta alegría maliciosa y orgullo de especie cuando detectamos errores en un "competidor" como la inteligencia artificial. Cuando el sistema comete un error, lo que se ve es un producto que debe ser depurado.

Por qué los glosarios demasiado largos empeoran la traducción

¿Se puede perfeccionar el resultado de la AI mediante un glosario?

La integración del glosario puede entrenar a la IA para que utilice la terminología preferida del cliente en la mayoría de los casos, de forma similar a como se procedería con un intérprete humano. Estas listas de términos nacen de un interés genuino por mejorar la calidad, pero a veces también de un deseo de control por parte del organizador y de la fantasía de que un evento es un acontecimiento perfectamente predecible.

Como intérprete humana he memorizado durante días vocabularios enteros enviados por el cliente que finalmente apenas fueron utilizados. Cuando esos glosarios eran muy largos (200 términos específicos sobre una aplicación robótica de imprimación, por ejemplo) mi cerebro percibía todo eso como ruido cognitivo. Esos glosarios inflados que trataban de cubrir todas y cada una de las posibles casuísticas de un evento incrementaban sensiblemente mi nivel de estrés y mi sensación de trabajar encorsetada. Una lista breve de términos de alto impacto con un texto explicativo que me hubiera ayudado a comprender el contexto tecnológico habrían redundado en una interpretación mucho mejor. Ningún intérprete profesional utiliza más que un número limitado de términos activos en un momento dado. Más allá de eso, la preparación se vuelve contraproducente.

Los sistemas de traducción neuronal funcionan calculando probabilidades entre palabras: qué palabra suele aparecer junto a qué otra palabra. Cada vez que un glosario fuerza la traducción de un término específico, no solo cambia ese término—cambia las probabilidades de traducción de todas las demás palabras de la frase. Esto lo confirma OneWord, empresa alemana especializada en optimización de traducción automática, que descubrió que "un glosario sobrecargado puede incluso conducir a más errores" debido a este efecto cascada en las probabilidades del sistema neuronal.

Un idioma no funciona como una ecuación matemática que siempre obedece las mismas reglas. Un cliente puede querer que traduzcamos "market-driven sustainability strategy" como "estrategia de sostenibilidad impulsada por el mercado". Pero lo que el ponente termina diciendo es "the tactic we use to be sustainable is always based on the impulses that the market has provided us." La misma idea, expresada de forma diferente.

Ahora la IA tiene que consultar el glosario, identificar que contiene una frase similar, pero no idéntica, y decidir si traducirla según las instrucciones o seguir literalmente la formulación del ponente. Pero aquí está el problema técnico: cuando la IA fuerza una traducción de glosario, altera el modelo de probabilidades para el resto de la frase. Es como cambiar una pieza en un dominó: las demás piezas también se mueven.

Además, los glosarios largos inevitablemente contienen términos ambiguos: palabras que deberían traducirse de forma diferente según el contexto. Pero la mayoría de sistemas de glosarios no pueden manejar esta ambigüedad contextual. Simplemente aplican la primera traducción de la lista, o la última, o ignoran el término por completo. El resultado es impredecible: traducciones forzadas que están equivocadas la mitad del tiempo.

La paradoja es clara: un glosario conciso con 15-20 términos clave mejora la traducción. Un glosario exhaustivo con 200 términos la degrada.

El verdadero reto no es tecnológico. Es educativo.

Esta brecha de expectativas no la solucionará una IA más avanzada. La solucionará una mejor comprensión de lo que la interpretación humana o artificial realmente es: un ejercicio extraordinariamente complejo de traducción en tiempo real que trabaja con una materia altamente difusa como los idiomas y que funciona dentro de márgenes de excelencia profesional, no de perfección.

Las interpretaciones simultáneas por IA como Nubart TRANSLATE tienden a ofrecer un nivel de calidad equiparable al de los mejores intérpretes humanos, con las ventajas transformadoras de la IA: coste accesible, disponibilidad inmediata, escalabilidad ilimitada.

¿Es perfecta? No. ¿Es profesional, efectiva y revolucionaria? Absolutamente. ¿Es mejorable? Sin duda también. Y en Nubart trabajamos incansablemente en ello.

La tecnología ha democratizado algo que antes era un lujo reservado para organizaciones con grandes presupuestos. Celebremos esa revolución, pero con expectativas realistas sobre lo que la interpretación —humana o artificial— realmente puede lograr.


Esperamos que este artículo te haya resultado útil. Suscríbete a nuestro boletín para no perderte ninguna de nuestras publicaciones.