Internet conecta a más de mil millones de personas, pero está fragmentada por el lenguaje. Los usuarios anglófonos tienen tantas páginas entre las que elegir como los hablantes de chino, y hay casi tantos blogs en japonés como en inglés. Aunque la blogósfera árabe tuvo un comienzo tardío, hoy está en auge. Pero cada uno de estos grupos está separado de los otros por el lenguaje.
¿Cómo sería una web sin barreras lingüísticas? Imagine si los usuarios de internet de cada país pudieran traducir cualquier contenido a su propio lenguaje de modo automático, fácil y preciso. (…)
Esto es todavía una fantasía, pero está comenzado a parecer posible. Para empezar, la traducción: gracias a Internet, es un proceso relativamente barato y manejable.
En la base de la jerarquía de la traducción automática se encuentran los servicios ofrecidos por Google y otros. Estos servicios “aprenden” mediante el análisis de colecciones de documentos que han sido traducidos por humanos, como los registros del Parlamento Europeo, que son traducidos a 11 idiomas diferents. Estas colecciones son tan grandes, y las máquinas que las analizan tan poderosas, que la traducción automática puede normalmente transmitir la esencia de un texto, aunque de un modo ligeramente confuso. Google y sus rivales se concentran en los idiomas más hablados, pero los académicos están trabajando en servicios de traducción automática para lenguajes más restringidos.
Un ejército de traductores voluntarios ocupa el siguiente puesto en la jerarquía. Muchas prominentes publicaciones en inglés son traducidas regularmente al mandarín, para beneficio de muchos lectores, por grupos de voluntarios que no recibien paga. Hay también proyectos más formales. En Global Voices, una especie de colectivo políglota de bloguers, alrededor de 200 voluntarios eligen y traducen los posts de sus colegas. En Meedan, una red social dedicada a discutir noticias de Medio Oriente, los artículos son traducidos del inglés al árabe por máquinas, y los lectores ajustan la traducción.
No es sorprendente que los traductores humanos pagos todavía produzcan los mejores resultados. Pero incluso sus costos están bajando. Mechanical Turk es un servicio online que opera Amazon, que permite a las compañías subcontratar trabajos cotidianos a un grupo de trabajadores online. SpeakLike, que lanzó a fines de 2009, tiene 3.000 traductores y ofrece trabajos por entre 0.5 y 0.15 dólares por palabra. SpeakLike incluso traduce posts de Twitter y los envía por una cuenta paralela en pocos minutos a un costo de 0.25 centavos de dólar por tweet.
(..) ¿Cuánto más cerca está entonces el sueño de una web unificada? Los traductores voluntarios sólo se arremolinan alrededor de los sitios populares, de modo que la vasta mayoría de los blogs sigue sin traducir. La mayoría de los productores de contenido no puede pagar a traductores humanos, aún a los precios de hoy. Esto los obliga a recurrir a la traducción automática, que está mejorando, pero todavía lucha con coloquialismos y modismos. En palabras de Ethan Zuckerman, cofundador de Global Voices e investigador de la Universidad de Harvard:”Si hablás como un miembro del parlamento británico, te podemos traducir bastante bien”. Hasta que las computadoras aprendan a ser igual de eficientes con los arranques lingüísticos de bloguers adolescentes o la jerga de los columnistas de chismes, a los artículos traducidos por computadora les va a costar atraer lectores. La tecnología inteligente puede ayudar a disminuir las barreras lingüísticas, pero todavía no puede eliminarlas.
Texto original, aquí.
Los sistemas de traducción automática actuales permiten establecer parámetros (por ejemplo, limitando el rango de sustituciones permitidas) de acuerdo con el dominio o la profesión en la que se hace la traducción, lo que mejora el resultado. Esta técnica es particularmente útil en campos donde se emplea un lenguaje formal o basado en formularios, como los reportes del tiempo y los documentos legales o administrativos, pero su uso no es viable en la traducción de conversaciones u otros textos menos estandarizados.
En las últimas décadas ha habido un fuerte impulso en el uso de técnicas estadísticas para el desarrollo de sistemas de traducción automática (…)
La intervención humana puede mejorar la calidad del resultado: por ejemplo, algunos sistemas pueden traducir con mayor exactitud si el usuario ha identificado previamente las palabras que corresponden a nombres propios. Con la ayuda de estas técnicas, la traducción por computadora ha mostrado ser un auxiliar útil para los traductores humanos. Sin embargo, y aún cuando en algunos casos pueden producir resultados utilizables “tal cual”, los sistemas actuales son incapaces de producir resultados de la misma calidad que un traductor humano, particularmente cuando el texto a traducir usa lenguaje coloquial o familiar.
(Por eso) están cobrando interés las técnicas estadísticas de traducción asistida basadas en una aproximación interactiva-predictiva, en la que el computador y el traductor humano trabajan en estrecha colaboración mutua. Tomando como base el texto a traducir, el sistema ofrece sugerencias sobre posibles traducciones a la lengua destino. Si alguna de estas sugerencias es aceptable, el usuario la selecciona y, en caso contrario, corrige lo necesario hasta obtener un fragmento correcto. A partir de este fragmento, el sistema produce mejores predicciones. El proceso continúa de esta manera hasta obtener una traducción completamente aceptable por el usuario.
Texto original, aquí.
¿Cuáles son las diferencias entre un traductor automático y uno humano? Un debate reciente en la lista de correo electrónico de los traductores (humanos) de la Asociación Española de Traductores, Correctores e Intérpretes (Asetrad):
-Los traductores profesionales parecen estar divididos en dos grupos: aquellos que consideran que merece la pena prestar atención a todas las herramientas que permitan aumentar la productividad sin afectar la calidad de las traducciones y que opinan que cualquier recurso que facilite la labor profesional es bienvenido, y los que temen que la traducción automática acabe acaparando (buena) parte del trabajo desempeñado actualmente por los traductores humanos o que desconfían de los traductores automáticos por considerarlos herramientas deficientes o ineficaces que dan más trabajo del que en realidad ahorran.
-La traducción automática está mejorando exponencialmente y es muy probable que Google, por ejemplo, ofrezca, pagando o gratis, un servicio de traducción bastante aceptable dentro de muy poco. Los programas de traducción automática son capaces de producir, en ciertos casos, textos de una calidad altamente aceptable que apenas necesitan retoques. Muchos organismos internacionales ya los emplean en la traducción de ciertos tipos de textos, como es el caso de la UE y su programa Systran.
-El ámbito para el que la traducción automática parece representar una mayor “amenaza” y donde seguramente puede desempeñar un papel importante es en la traducción técnica, que abarca buena parte de los documentos que se traducen hoy. Las características semánticas, sintácticas y estilísticas de este tipo de textos los hacen especialmente aptos para ser traducidos automáticamente, por ejemplo por el uso de palabras iguales o muy semejantes en distintos idiomas, como sucede en la jerga informática (“RAM”, “ROM”, etc.), y la ausencia de elementos, presentes en otros textos más creativos, que no podrían ser reconocidos y mucho menos vertidos en otra lengua por un traductor automático, como las ironías, los juegos de palabras, etc.
-La tendencia del sector es que esta modalidad de traducción acabará comiéndose una parte del pastel y ocupando un lugar legítimo en el proceso de traducción. ¿Es profesional que un traductor utilice un programa de traducción automática como herramienta para traducir?
-Para que la traducción automática funcione mínimamente son requisitos necesarios:
*que se trate de dos idiomas muy emparentados (checo y eslovaco; portugués y castellano, etc.)
*que el texto original esté muy bien redactado, evitando ambigüedades léxicas, sintácticas y mixtas que, en muchas ocasiones, no se deben a la mala redacción de un texto, sino a la propia naturaleza de las lenguas.
-Las empresas que han invertido en traducción automática (por ejemplo, Caterpillar) han tenido que invertir también en formación de sus redactores: enseñarles a escribir de tal forma que le “faciliten la vida” al traductor automático. Los resultados son muy controvertidos, porque esa formación también lleva tiempo y dinero. Además, el resultado es aceptable pero no es literatura y se restringe a un ámbito de uso muy concreto.
-Quizá lo más práctico sea utilizar la traducción automática en combinación con otras herramientas, como programas de traducción asistida y de reconocimiento de voz, siempre llevando a cabo una revisión exhaustiva de la traducción para evitar que su calidad se resienta.
-La traducción automática adolece de deficiencias: errores terminológicos (para traducir correctamente un texto es necesario comprender lo que se está explicando, y las máquinas pueden equivocarse de la misma manera que lo hacen las personas que traducen sin conocimientos ni investigación); los traductores automáticos no son capaces de detectar errores semánticos ni de identificar conceptos como “que suene mejor”, “que quede más elegante”, “que sea más conciso”, etc., nociones difícilmente codificables en informática.
Texto original, aquí.
Informe de Google:
Trabajamos continuamente en la mejora del sistema. Sin embargo, ni siquiera el software más sofisticado que existe en la actualidad ofrece la fluidez de un hablante nativo ni posee las habilidades de un traductor profesional. La traducción automática es muy compleja, ya que el significado de las palabras depende del contexto en el que se utilizan. A pesar del intenso trabajo realizado, es posible que pase algún tiempo antes de que se pueda ofrecer un sistema de traducción de calidad similar a la de las traducciones realizadas por personas.
Texto original, aquí.
Algunas páginas de traductores automáticos en Internet:
Internostrum (catalán/español)
Sitio web sobre traducción y tecnología (en inglés), aquí.





July 6th, 2010 → 2:57 pm @ elpuercoespín
0