¿Traducción automática para la salud?

traduccion automaticaSegún una noticia publicada el 13 de junio, en el sitio web MedicalXpress, los investigadores de la UE  han acercado aún más la traducción totalmente automatizada con un sistema neuronal capaz de traducir textos sobre salud pública del inglés al checo, alemán, polaco y rumano. Plantea que la información en línea a menudo solo está disponible en algunos idiomas ya que las organizaciones no pueden permitirse traducirla a otros más. Pero los investigadores del proyecto Health in My Language, o HimL, financiado por la UE, han hecho más cercana la perspectiva de la traducción totalmente automatizada, trabajando con organizaciones de salud pública escocesas e internacionales para producir un sistema adaptado para el ámbito de la salud.

Este artículo hace referencia a las mejorías de la calidad de la traducción automatizada al usar un enfoque sintáctico o basado en frases, que rápidamente pasó a la traducción automática neuronal (NMT), un enfoque basado en el aprendizaje profundo que surgió durante la vida del proyecto. Cada año los investigadores evalúan cuidadosamente los resultados  utilizando encuestas de usuarios y pruebas centradas en la aplicación.

“Las mejorías se realizaron en tres áreas principales; adaptación de dominio o ajuste de la traducción a la terminología específica de salud pública; semántica o aseguramiento de la precisión de la traducción; morfología o aseguramiento de que las variantes morfológicas se produzcan correctamente,” según el artículo, “aunque la extremadamente alta calidad requerida por los usuarios de NHS 24 y Cochrane significa que todavía no podemos automatizar por completo la traducción”, dijo el Dr. Haddow, quien es coordinador de proyectos e investigador de alto nivel en informática en la Universidad de Edimburgo.
Más adelante, el artículo comenta que los investigadores pudieron reducir “la cantidad de intervención humana entre un 30-50% para producir una traducción tan buena como la que hubiéramos logrado con un enfoque completamente humano” para todos los idiomas que participan en esta investigación, excepto para el polaco.
También trabajan en otros productos como el corpus médico UFAL, que es un conjunto de datos estándar para sistemas de capacitación para tratar textos médicos. Cubre ocho pares de idiomas europeos, incluidos los HimL.

MedicalXpress señala que “el análisis de la salida de NMT mostró que los problemas presentes en los sistemas anteriores se han superado en gran medida, pero que estos sistemas siguen siendo propensos a omitir información importante o agregar información incorrecta”  y que los investigadores  intentan contrarrestar esto, usando una técnica llamada reconstrucción “, donde la fuente debe poder reconstruirse a partir de la salida”, dice el Dr. Haddow y, “también hemos demostrado cómo mejorar NMT utilizando diccionarios de alta calidad y cómo incorporar información semántica y sintáctica de herramientas externas “.

Y usted ¿qué cree? ¿Será prescindible la intervención humana en la traducción o interpretación? ¿Y qué hay de los registros del lenguaje de los usuarios?  ¿Están incluidos en los controles de calidad? Sin dudas los avances científicos y técnicos son necesarios pero ¿quién certifica la calidad?

Le invitamos a leer el artículo original en el sitio web MedicalXpress y a reflexionar en estos temas.

Versión del artículo en pdf imagen