Rosa Sala - Nubart

Rosa Sala

CEO da Nubart

O que podemos esperar (e o que não) da interpretação por IA em comparação com a interpretação humana

Intérprete en cabina realizando interpretación simultánea durante una conferencia, con auriculares y micrófono.

O fim da benevolência: por que exigimos da IA uma perfeição que nunca exigimos dos seres humanos. Da perspectiva de uma intérprete profissional que trabalhou em cabines de tradução simultânea por décadas e agora lidera o desenvolvimento de sistemas de interpretação por IA.


Conteúdo deste artigo


A perspectiva de uma intérprete humana

Por motivos familiares, sou bilíngue em alemão e espanhol. Antes de fundar a Nubart em 2013, dediquei minha vida a outras atividades, sendo uma das mais bem-sucedidas (e, por que negá-lo, também das mais lucrativas) a de intérprete. Comecei nessa função aos 16 anos, quando trabalhava como secretária em uma empresa imobiliária: eu precisava acompanhar e dar apoio linguístico ao meu chefe espanhol quando ele mostrava apartamentos no litoral a clientes alemães. Foi aí que percebi que poderia terminar meu expediente e sair para almoçar muito mais cedo se, em vez de traduzir cada frase de forma consecutiva, o fizesse de maneira simultânea, sussurrando a tradução ao ouvido do meu chefe ou do cliente. Levei muitos anos para descobrir que essa técnica que eu acreditava ter inventado se chama“chuchotage”.

Pouco depois, profissionalizei essa atividade paralela. Trabalhei em reuniões empresariais, em congressos internacionais e ofereci meus serviços em todas as modalidades imagináveis de interpretação: simultânea em cabine, consecutiva, sussurrada, em revezamento para outros tradutores…

Intérprete en cabina de traducción simultánea
A autora aguardando o início da palestra em uma cabine de tradução à prova de som

Muitas vezes recebi do cliente documentos de contexto para me preparar: glossários ou até mesmo — em raras ocasiões — o manuscrito completo do texto do palestrante. Mas, mesmo que estude minuciosamente tudo isso dias antes do evento, um intérprete nunca conseguirá realizar uma interpretação perfeita.

No entanto, o que podemos considerar “perfeito”? Como medir a qualidade de uma interpretação realizada em tempo real, a uma velocidade enorme e sem a possibilidade de consultar um dicionário? Talvez possamos nos aproximar comparando o resultado de uma interpretação simultânea com a qualidade que esse mesmo intérprete teria alcançado traduzindo essa mesma palestra por escrito, em casa, com tempo e recursos, e sem a pressão do tempo real. Se tomarmos essa tradução escrita como referência teórica (100%), o nível de exatidão de uma interpretação profissional em tempo real situa-se necessariamente abaixo disso. Um intérprete experiente pode aproximar-se notavelmente dessa referência ideal (na ordem dos 90%), mas em condições reais existe sempre uma margem inevitável de perda.

Esse salto que nos separava, a mim e aos meus melhores colegas, da perfeição não parecia incomodar ninguém. Meus clientes admiravam a capacidade humana de alternar a uma velocidade vertiginosa entre um idioma e outro e sempre ficavam satisfeitos com o resultado. Não apenas remuneravam meus dias de trabalho com 500 € por dia sem questionar, mas também com calorosos parabéns. Era um trabalho exaustivo, mas altamente gratificante.

As falhas da interpretação humana versus a interpretação por IA

Atualmente, sou CEO e cofundadora da Nubart. No verão de 2025, lançamos o Nubart TRANSLATE, um sistema de interpretação simultânea (com voz e texto) por meio de IA. Na verdade, trata-se de um produto tecnologicamente equivalente ao que tem sido meu trabalho como intérprete ao longo de décadas. Minha experiência contribuiu positivamente para o desenvolvimento desse produto. No entanto, a situação mudou radicalmente.

No que diz respeito ao nível de perfeição, não tenho a impressão de que a tradução por IA, como o Nubart TRANSLATE, em condições comparáveis e bem definidas, cometa mais ou menos erros do que um bom tradutor humano. Simplesmente, os erros da IA são de outra natureza.

Os modelos linguísticos da IA, por exemplo, possuem uma memória sobre-humana e são capazes de traduzir terminologia técnica muito melhor do que qualquer intérprete de carne e osso. Também são extremamente eficazes quando o palestrante enumera uma lista de números (um pesadelo clássico para um intérprete humano).

Mas, às vezes, falham onde um ser humano não teria grande problema: em distinguir a voz do palestrante de outra voz que soa ao fundo e que não deve ser traduzida, por exemplo. Ou têm dificuldades para colocar corretamente os sinais de pontuação. Ou são “precisos demais”, repetindo possíveis erros do palestrante que um intérprete humano teria identificado e corrigido imediatamente, sem sequer parar para pensar. De fato, o excesso de precisão é frequentemente o calcanhar de Aquiles de uma tradução por IA. O intérprete humano, por outro lado, suaviza o discurso, torna-o mais idiomático e, muitas vezes, o resume, eliminando redundâncias desnecessárias.

A interpretação por IA custa uma pequena fração do que custaria contratar uma equipe de intérpretes humanos, tanto em termos puramente econômicos quanto de esforço logístico e de coordenação. Em qualquer outro produto ou serviço, o preço determina o grau de exigência. Os motoristas esperam um desempenho superior de um Porsche do que de um Volkswagen Polo, ou de um consultor sênior da McKinsey do que de um estudante de graduação.

As expectativas incongruentes geradas pela tradução simultânea por IA

E é aqui que chegamos ao tema deste artigo: isso não acontece no mundo da interpretação simultânea. As expectativas dos clientes da Nubart TRANSLATE superam em muito as que eu experimentei ao longo da minha trajetória como intérprete humano.

Tanto meus clientes quanto meus colegas de profissão teriam considerado falta de educação confrontar-me com uma gravação do meu trabalho e apontar, um a um, os erros de interpretação, ou apresentar-me uma lista de melhorias para que eu as levasse em conta em meus serviços futuros. Curiosamente, comportamentos que eram impensáveis com intérpretes humanos tornaram-se comuns quando a interpretação é realizada por um sistema de IA.

Alguns clientes da Nubart TRANSLATE nos enviam longas listas detalhadas de como determinados termos devem ser traduzidos, incluindo até mesmo “expressões preferenciais” para traduções que são objetivamente corretas. Eles gravam trechos de tradução obtidos por meio de nosso teste gratuito de 30 minutos, comparam-nos com a versão corrigida e nos enviam todo esse material, “para a próxima vez”.

Por que as expectativas são tão radicalmente diferentes quando se trata de uma tradução por IA?

É uma questão fascinante com implicações psicológicas que revelam muito sobre nossa relação com a tecnologia.

Primeira falácia: a precisão matemática

Os seres humanos assumem inconscientemente que, se é uma máquina, ela deve ser exata. Podemos perdoar um aluno que cometa um erro ao somar de cabeça, mas não perdoaremos uma calculadora. No entanto, trabalhar com a linguagem humana é muito mais subjetivo e complexo do que trabalhar com números. Dois mais dois sempre será quatro, mas quantas formas diferentes existem de traduzir um verso? Qual é a maneira correta de fazê-lo?

Segunda falácia: O software não está sujeito a condições

Os intérpretes humanos são avaliados como intérpretes de palco. Sua atuação é avaliada em função de diversas condições: a complexidade, o estresse, o cansaço, a carga cognitiva, a necessidade de concentração.

Com o software de interpretação, tendemos a pensar que as condições externas não o influenciam, mas isso só é verdade em parte. Também uma IA precisa que o orador fale no ritmo adequado, que suas frases sejam inteligíveis, que o microfone seja de boa qualidade e que o áudio chegue bem isolado, sem ecos e sem interferências.

Terceira falácia: a máquina antipática

Estamos dispostos a perdoar um ser humano. Mas ninguém sente empatia nem compaixão por uma máquina. Menos ainda se essa máquina for baseada em IA, percebida por muitos, não sem motivos, como uma ameaça às habilidades tradicionalmente humanas. Há uma certa alegria maliciosa e orgulho da espécie quando detectamos erros em um concorrente representado pela inteligência artificial. Quando o sistema comete um erro, o que se vê é um produto que precisa ser aperfeiçoado.

Quarta falácia: a interpretação simultânea é como a tradução automática

Muitos clientes esperam da tradução simultânea por IA os mesmos resultados que obtêm ao copiar e colar um texto no DeepL ou no Google Translate, ou ao enviar um documento ao ChatGPT para tradução. Essa comparação parte de um equívoco fundamental.

A tradução automática tradicional trabalha com textos completos. O sistema conhece o final de cada frase antes de traduzi-la e pode otimizar o resultado com essa informação. A interpretação simultânea — humana ou por IA — funciona de maneira radicalmente diferente: é realizada ao vivo, sem saber como a frase continuará, e obriga a tomar decisões linguísticas em tempo real, com base na antecipação e na probabilidade.

A isso se soma uma dificuldade adicional que costuma ser ignorada: antes de traduzir, a IA precisa entender quem está falando. Converter a voz humana em texto confiável, em tempo real, com sotaques, ruídos de fundo e microfones imperfeitos, é um enorme desafio técnico, às vezes tão complexo quanto a própria tradução.

Comparar uma interpretação simultânea com uma tradução de texto é como comparar uma transmissão ao vivo com um vídeo editado em estúdio: ambos podem ser excelentes, mas seguem regras completamente diferentes.

Por que glossários excessivamente longos prejudicam a tradução

É possível aperfeiçoar o resultado da IA por meio de um glossário?

A integração do glossário pode treinar a IA para que utilize a terminologia preferida do cliente na maioria dos casos, de forma semelhante ao que se faria com um intérprete humano. Essas listas de termos nascem de um interesse genuíno em melhorar a qualidade, mas, às vezes, também de um desejo de controle por parte do organizador e da fantasia de que um evento é um acontecimento perfeitamente previsível.

Como intérprete humana, passei dias memorizando vocabulários inteiros enviados pelo cliente que, no fim das contas, quase não foram utilizados. Quando esses glossários eram muito longos (200 termos específicos sobre uma aplicação robótica de primer, por exemplo), meu cérebro percebia tudo isso como ruído cognitivo. Esses glossários inflados, que tentavam cobrir todas e cada uma das possíveis situações de um evento, aumentavam sensivelmente meu nível de estresse e minha sensação de estar trabalhando de forma limitada. Uma lista breve de termos de alto impacto, acompanhada de um texto explicativo que me ajudasse a compreender o contexto tecnológico, teria resultado em uma interpretação muito melhor. Nenhum intérprete profissional utiliza mais do que um número limitado de termos ativos em um determinado momento. Além disso, a preparação torna-se contraproducente.

Os sistemas de tradução neural funcionam calculando probabilidades entre palavras: quais palavras costumam aparecer juntas. Sempre que um glossário força a tradução de um termo específico, ele não apenas altera esse termo — ele altera as probabilidades de tradução de todas as outras palavras da frase. Isso é confirmado pela OneWord, empresa alemã especializada em otimização de tradução automática, que descobriu que “um glossário sobrecarregado pode até mesmo levar a mais erros” devido a esse efeito em cascata nas probabilidades do sistema neural.

Uma língua não funciona como uma equação matemática que sempre obedece às mesmas regras. Um cliente pode querer que traduzamos “market-driven sustainability strategy” como “estratégia de sustentabilidade impulsionada pelo mercado”. Mas o que o palestrante acaba dizendo é “a tática que usamos para sermos sustentáveis baseia-se sempre nos impulsos que o mercado nos proporcionou”. A mesma ideia, expressa de forma diferente.

Agora, a IA precisa consultar o glossário, identificar que ele contém uma frase semelhante, mas não idêntica, e decidir se deve traduzi-la de acordo com as instruções ou seguir literalmente a formulação do palestrante. Mas eis o problema técnico: quando a IA impõe uma tradução do glossário, ela altera o modelo de probabilidades para o restante da frase. É como mover uma peça em um dominó: as outras peças também se movem.

Além disso, glossários extensos inevitavelmente contêm termos ambíguos: palavras que deveriam ser traduzidas de forma diferente dependendo do contexto. Mas a maioria dos sistemas de glossários não consegue lidar com essa ambiguidade contextual. Eles simplesmente aplicam a primeira tradução da lista, ou a última, ou ignoram o termo por completo. O resultado é imprevisível: traduções forçadas que acabam erradas metade das vezes.

O paradoxo é claro: um glossário conciso com 15 a 20 termos-chave melhora a tradução. Um glossário exaustivo com 200 termos a prejudica.

O verdadeiro desafio não é tecnológico. É educacional.

Essa lacuna de expectativas não será resolvida por uma IA mais avançada. Ela será resolvida por uma melhor compreensão do que a interpretação humana ou artificial realmente é: um exercício extraordinariamente complexo de tradução em tempo real que lida com uma matéria altamente difusa como as línguas e que opera dentro de margens de excelência profissional, não de perfeição.

As interpretações simultâneas por IA, como o Nubart TRANSLATE, tendem a oferecer um nível de qualidade comparável ao dos melhores intérpretes humanos, com as vantagens que a IA oferece: custo acessível, disponibilidade imediata, escalabilidade ilimitada.

É perfeita? Não. É profissional, eficaz e revolucionária? Absolutamente. É passível de melhorias? Sem dúvida também. E na Nubart trabalhamos incansavelmente nisso.

A tecnologia democratizou algo que antes era um luxo reservado a organizações com grandes orçamentos. Vale a pena celebrar essa revolução, mas com expectativas realistas sobre o que a interpretação — humana ou artificial — realmente pode alcançar.