sábado, 11 de setembro de 2010

Testando o Google Tradutor (ou Seremos todos executados?)

Erros de tradução costumam ser motivo de boas gargalhadas. Alguns são mitos, como a legenda "Eu quero um filho seu", que teria sido uma tradução inspirada de "I want you, baby". Mas as últimas notícias revelam que os problemas de tradução estão com os dias contados: o Google Tradutor, segundo especialistas em inteligência artificial, deve economizar custos com tradução e cursos de línguas, além de evitar mal-entendidos entre falantes de idiomas diferentes.

A primeira vez que ouvi essa ideia a sério foi de um colega da malhação, engenheiro-geek-tecnológico com competências e curiosidades linguísticas, que me contou, olhos brilhando, sobre a matéria numa revista que explicava como já está bem desenvolvida a tecnologia de tradução automática. Hum, pensei, que propaganda esquisita!

É verdade que na localização de software, que consiste em traduzir e adaptar aplicativos pro mercado de destino, o uso da “máquina” já é uma realidade. Mas, das oito etapas do processo que conheço, adotado por uma das maiores empresas do setor, só uma é feita por um software, o que sugere que a tal da máquina depende totalmente dos tradutores de carne, osso e sensibilidade ao contexto.

Voltando à tecnologia da Google, resolvi testar as maravilhas ao alcance do nosso clique traduzindo páginas de ajuda do site da Microsoft do inglês pro português. Prá ter o melhor resultado, era essencial usar textos técnicos com função informativa, já que, segundo os especialistas, seria esse o âmbito ideal pro uso da tradução automática. Prá me aproximar o máximo possível da perspectiva do usuário que não lê inglês, pulei o original e fui direto prás traduções.

Diante dos resultados, comecei por desprezar os aspectos gramaticais, que os desenvolvedores reconhecem que ainda não foram incorporados pela tecnologia, me concentrando no âmbito puramente comunicativo, isto é, tentei depreender o que o usuário pode entender da leitura da tradução automática. Na primeira passada de olhos, notei que a tradução como um todo dava aquela “ideia geral” útil quando alguém quer saber do que um texto trata. Mas, quando fui prá análise dos parágrafos, o resultado foi tipo... Não digo ainda.

O primeiro texto cuja tradução testei foi o artigo “Going places with your netbook", algo como “Saindo por aí com seu netbook”, que ficou “Indo a lugares com o seu netbook” (publicado na página http://windows.microsoft.com/en-us/windows7/going-places-with-your-netbook). Embora um pouco esquisito, o título cumpriu seu papel, o que não foi o caso de vários parágrafos dele, um dos quais saiu assim:

Eu tenho usado um ordinário, netbook meio-de-estrada para o último ano e amá-lo. Leia mais e eu vou te dar a colher interna em netbooks, que são, por que há tanta agitação sobre eles, e que está na cópia fina.

Aqui o leitor entende que o autor está satisfeito com seu netbook (porque “amá-lo”), mas não entende o motivo, já que ele é "ordinário” e “meio-de-estrada”, o que não parece coisa boa. Só quem conhece o termo "ordinary" do inglês vai entender que se trata de um netbook comum (ou básico).

O autor parece satisfeito com seu netbook (“amá-lo”), mas não entendi o motivo, se ele é "ordinário” e “meio-de-estrada”, o que não sugere boa coisa. Já a “colher interna” me sugeriu a ideia de uma "colher de chá". Só depois que vi o original (“I'll give you the inside scoop”), entendi que a ideia era algo como “Vou mostrar prá vocês o mapa da mina”. E não é que era mesmo uma colher de chá! Depois achei que teria uma explicação sobre os netbooks (“que são”... o quê?), mas só soube que eles estão “na cópia fina".

Em outro parágrafo, entendi que o assunto é o tamanho do teclado do netbook, sendo 90% do tamanho completo um ponto doce, o que quer que isso signifique:

Algumas pessoas simplesmente não se sentirão confortáveis com um pequeno teclado. Meu teclado netbook é 90% de um teclado de tamanho completo, e para mim, esse é o ponto doce. Tipo I pode facilmente, sem erros mais do que o habitual. Mas, se você tem mãos pequenas ou estão comprando um para uma criança, eu ia ficar com esse tamanho, 90% ou próximo a ele. A melhor maneira de saber é procurar uma pessoa no computador, eletrônicos e lojas de materiais de escritório são um bom lugar para começar. (Eu mesmo vi modelos básicos em grandes lojas de brinquedo!)

Do trecho, compreendi que a melhor maneira de saber “é procurar uma pessoa no computador” e que “eletrônicos e lojas de material de escritório são um bom lugar para começar”. Desconfiei que se tratasse da procura por um netbook ou teclado, mas talvez o texto estivesse sugerindo procurar alguém prá testar o tamanho do teclado, embora essa dica fosse meio estranha.

Outro texto que usei no teste tinha como título “A new way to work with your PC” (publicado na página http://windows.microsoft.com/en-US/windows/discover/touch). O subtítulo “Um toque de diversão” me pareceu excelente em todos os sentidos: o parágrafo começou bem e a diversão veio logo em seguida:

Como você vai usar Windows Touch? É totalmente até você. Virtualmente qualquer programa que funciona com o Windows 7 agora responde ao seu toque. (Você pode até pintar no Paint dedo!) Nos próximos meses, à espera de ver ainda mais software finger-friendly. Bem, quem conhece a expressão inglesa “It’s up to you” não vai demorar a entender "É totalmente até você" como “Tudo depende de você”. Quem não lê, vai entender só a tradução da palavra “you” (“você”), que saiu direitinho.

Prosseguindo, não entendi o que seria o “Paint dedo!”, primeiro achei que se tratasse de um programa chamado "Paint Finger” ou “Finger Paint”. Mas como nunca tinha ouvido falar dele, fui lá no inglês e entendi que “Você pode até pintar no Paint dedo!” significa “Você pode até usar a ponta do dedo para pintar com o Paint!", o que mostra que depois do “Você pode até” tudo fica inteligível. A não ser, claro, prá quem já sabe o que é “finger-frindly”, caso em que a tradução não seria necessária.

O exemplo traz três ocorrências de “finger”, que a máquina "sabe” que significa "dedo", mas não sabe onde inserir, porque a sintaxe de cada frase é única e as possibilidades de combinação, por sua vez, são virtualmente infinitas. A ironia é que milhões de frases continuarão a ser armazenadas em dispositivos cada vez mais poderosos, mas, quanto maior o número de traduções de "dedo” armazenadas, maior a chance de a máquina não saber onde botar o dedo.

Bom, fui dar uma olhada no New York Times e acabei testando a tradução de um texto sobre as eleições em Myanmar. Mas quando vi que a frase que informa que “40 partidos estão inscritos para participar da eleição” foi traduzida como “40 partidos se registraram para ser executado”, achei que eu já estava bem de teste.

A foto é de uma página que não existe mais (deve ter sido executada): http://1.bp.blogspot.com/_QvhWeUUxSEY/RusX6W-G--I/AAAAAAAAABk/Qfq3LiUVX6s/s320/paredon.jpg.