Català | English| Euskara

Diversos proyectos de Recuperación de Información, de Gestión del Conocimiento, de Traducción Automática y de Extracción Automática de Terminología incorporan estrategias de base lingüística a fin de mejorar la calidad de sus resultados (cobertura y precisión, y relevancia temática). Entre estas estrategias lingüísticas, destaca el uso de ontologías o jerarquías léxicas, que ofrecen representación de información semántica de unidades léxicas (clases semánticas y relaciones léxicas).

En el proyecto anterior RICOTERM-2 (HUM2004-056658-00), orientado a la Recuperación de Información para las lenguas catalán, castellano, gallego y vasco, estamos comprobando la robustez de esta estrategia para la expansión de consultas multilingües en el ámbito de la economía. También en el desarrollo del Extractor Automático de Terminología YATE (Vivaldi 2001), realizado dentro de los proyectos vinculados TEXTERM2 (BFF2003-02111) y RICOTERM2, el enriquecimiento de EuroWordNet con unidades terminológicas de ámbitos temáticos distintos se ha mostrado como una estrategia básica para aumentar la cobertura y la precisión en la identificación de Candidatos a Términos.

El objetivo básico de este nuevo proyecto es la adaptación de la herramienta YATE a diversos ámbitos especializados, mediante el enriquecimiento de EuroWordNet (EWN), y para las lenguas castellana, catalana y vasca. Además se pretende mejorar la plataforma de acceso a esta herramienta, con la incorporación de otras aplicaciones auxiliares, como la detección automática de expresiones metalingüísticas que reflejen relaciones conceptuales en los textos, y mejores prestaciones de la plataforma de acceso.

Concretamente el subproyecto 1 (UPF) se ocupará del enriquecimiento de EuroWordNet (EWN) en derecho, medioambiente e informática, para las lenguas castellana y catalana; y el subproyecto 2 (EHU), además de seguir con la constitución de recursos textuales y léxicos del euskera en algunos ámbitos especializados, se ocupará del enriquecimiento de EuroWordNet (EWN) en medicina, economía, derecho, medioambiente e informática, mediante equivalentes en la lengua vasca de las entradas realizadas para el castellano y el catalán.

 

 

Fecha de actualización: 19-01-2015