Conecta con nosotros

Noticias

TeresIA, un proyecto que refuerza la traducción de terminología al español mediante IA

Publicado el

TeresIA, un proyecto que refuerza la traducción de terminología al español mediante IA

El Consejo Superior de Investigaciones Científicas (CSIC) ha desarrollado un proyecto centrado en el refuerzo de la traducción de terminología al español mediante Inteligencia Artificial. Su nombre TeresIA, es un homenaje a la labor realizada por la lingüistasta y filóloga Teresa Cabré en el campo de la terminología.

Su desarrollo, posible 15 años después de la aparición de la idea inicial. se ha financiado con 1,4 millones del Plan de Recuperación asignados por la Secretaría de Estado de Digitalización e Inteligencia Artificial del Ministerio de Transformación Digital. Está enmarcado en el PERTE de la Nueva Economía de la Lengua y tiene como fin la generación de un portal de acceso a terminología en español de alcance panhispánico mediante herramientas de IA. Todo para facilitar las traducciones y redacciones de textos a traductores e intérpretes del y al español.

Con TeresIA se podrá crear un metabuscador para terminologías en español, con vocabulario de todo el espectro panhispánico. Así se concentrarán las terminologías de ámbitos de alta especialización, como el jurídico o el médico. Además, los distintos organismos, instituciones y empresas contarán con un portal de tecnologías de IA en el que validar nuevas terminologías que se vayan incorporando al metabuscador para garantizar su interoperabilidad.

TeresIA servirá además para generar un corpus de literatura científica en español. Con este proyecto se diseñará una metodología para la extracción de información mediante técnicas de IA y PLN (Proceso de lenguaje natural). Así se podrán extraer términos, mostrarlos en su contexto, validarlos, sancionarlos, pasarlos a formatos de la web de datos y conseguir que sean visibles y recuperables en distintos entornos. Entre ellos, en el metabuscador mencionado.

Elea Giménez Toledo, la investigadora que dirige el proyecto y que es científica titular del Grupo de Investigación sobre el Libro Académico del Intituto de Filosofía del CSIC, ha señalado que «al trabajar con estándares tecnológicos, las palabras de la ciencia en español se conectarán con las palabras de la ciencia en otros idiomas. De este modo, se multiplican las posibilidades de recuperar y descubrir contenidos científicos en distintos idiomas. Además, se preserva la riqueza terminológica de cada lengua, se favorecen las traducciones especializadas (tanto las humanas como las automáticas), se entrenan algoritmos, y se mejora la enseñanza del español de especialidades, entre otras aplicaciones«.

Por su parte, Cristina Gallach, Comisionada del PERTE de la Nueva Economía de la Lengua, ha recordado que «ese carácter multilingüe de TeresIA es compartido desde el PERTE de la Nueva Economía de la Lengua, donde apoyamos el español y las lenguas cooficiales para que ganen terreno en el ámbito digital, tecnológico, cultural, de la enseñanza, entre otros. Si no lo hacemos, no seremos capaces de garantizar su supervivencia en el futuro. Por ello, es necesario que desde el PERTE, gracias a los fondos NextGeneration del Plan de Recuperación, apoyemos iniciativas como TeresIA”.

El consorcio encargado del desarrollo conjunto del proyecto está compuesto por siete instituciones: la Plataforma Temática Interdisciplinar (PTI) ES CIENCIA, del CSIC; el Instituto Cervantes; el Centro Nacional de Supercomputación (BSC); el Grupo de Ingeniería Ontológica de la Universidad Politécnica de Madrid; la Asociación Española de Terminología (AETER); la Real Academia de Ingeniería (RAI); y el Departamento de Lengua Española de la Dirección General de Traducción de la Comisión Europea. Esta última prestará apoyo a las otras seis entidades participantes.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Lo más leído