English | Español | Euskara

Diversos projectes de Recuperació d'Informació, de Gestió del Coneixement, de Traducció Automàtica i d'Extracció Automàtica de Terminologia incorporen estratègies de base lingüística per millorar la qualitat dels seus resultats (cobertura i precisió, i rellevança temàtica). Entre aquestes estratègies lingüístiques, destaca l'ús d'ontologies o jerarquies lèxiques, que ofereixen representació d'informació semàntica d'unitats lèxiques (classes semàntiques i relacions lèxiques).

En el projecte anterior RICOTERM-2 (HUM2004-056658-00), orientat a la Recuperació d'Informació per a les llengües catalana, castellana, gallega i basca, comprovem la robustesa d'aquesta estratègia per a l'expansió de consultes multilingües a l'àmbit de l'economia. També en el desenvolupament de l'Extractor Automàtic de Terminologia YATE (Vivaldi 2001), realitzat en els projectes vinculats TEXTERM2 (BFF2003-02111) i RICOTERM2, l'enriquiment d'EuroWordNet amb unitats terminològiques d'àmbits temàtics diferents s'ha mostrat com una estratègia bàsica per augmentar la cobertura i la precisió en la identificació de Candidats a Termes.

L'objectiu bàsic d'aquest nou projecte és l'adaptació de l'eina YATE a diversos àmbits especialitzats, mitjançant l'enriquiment d'EuroWordNet (EWN), i per a les llengües castellana, catalana i basca. A més es vol millorar la plataforma d'accés a aquesta eina, amb la incorporació d'altres aplicacions auxliars, com la detecció automàtica d'expressions metalingüístiques que reflecteixen relacions conceptuals en els textos, i millors prestacions de la plataforma d'accés.

Concretament el subprojecte 1 (UPF) s'ocuparà de l'enriquiment d'EuroWordNet (EWN) en dret, medi ambient i informàtica, per a les llengües castellana i catalana; i el subprojecte 2 (EHU), a més de seguir amb la constitució de recursos textuals i lèxics de l'euskera en alguns àmbits especialitzats, s'ocuparà de l'enriquiment d'EuroWordNet (EWN) en medicina, economia, dret, medi ambient i informàtica, mitjançant equivalents en la llengua basca de les entrades realitzades per al castellà i el català.

 

Data d'actualització: 12-12-2007