Català | English | Español | Euskara

Subproxecto da UPF-UPV

Obxectivos propios

Paquetes de traballo

Primeira anualidade

PT11.- Desenvolvemento do corpus de economía para o éuscaro. Localización de textos en formato electrónico, selección de textos e partición de mostras. Procesamento dos textos. Incorporación ó corpus técnico do IULA accesible mediante BWANANET.

PT12.- Explotación do corpus de economía en castelán e en catalán. Extracción de información do corpus procesado sobre unidades léxicas, frecuencias, concordancias, etc. mediante BWANANET. Paralelización con ALINEA da parte do corpus que conteña textos traducidos.

PT13.- Licenza de dicionarios computacionais e de analizadores morfolóxicos xa existentes para o éuscaro. Adaptación das ferramentas licenciadas á cadea de traballo. Adaptación dos sistemas de etiquetado morfolóxico.

PT14.- Localización de thesaurus documentais, ontoloxías, xerarquías léxicas existentes e reutilizables con información sobre economía. Avaliación de contidos e de posibilidades de importación. Localización de glosarios de economía en formato electrónico.

PT15.- Deseño e constitución de recursos. Importación de dicionarios de economía ó sistema MERCEDES. Deseño da ontoloxía e da base de datos terminolóxica asociada mediante Ontoterm. Deseño da páxina web do proxecto. Protocolos de transferencia entre xestores de bases de datos.

Segunda anualidade

PT21.- Enriquecemento de recursos léxicos. Base de datos de predicados (verbos, adxectivos e nominalizacións) da economía con información semántica e fraseolóxica para incorporar a dicionarios de procesamento do castelán, catalán e éuscaro. Incorporación de datos, por importación e ad hoc, na base de datos terminolóxica multilingüe.

PT22.- Construción da ontoloxía. Revisión das importacións de ontoloxías reutilizables á ontoloxía de base. Incorporación de sistemas de conceptos a partir dos datos resultantes do PT12.

Terceira anualidade

PT31.- Deseño de estratexias lingüísticas para as consultas de RI. Tipoloxía de consultas de interacción entre a base de datos terminolóxica e a ontoloxía. Estratexias baseadas en fraseoloxía específica ou concordancias do corpus. Establecemento dun corpus de consultas de proba.

PT32.- Probas de reelaboración de consultas co sistema deseñado polo subproxecto da USC. Análise e avaliación de resultados.

PT33.- Implementación de todos os recursos e do sistema de reelaboración de consultas no portal web do proxecto.

Subproyecto da USC

Obxectivos propios

Paquetes de traballo

Primeira anualidade

PT11.- Localización e adaptación de ferramentas de procesamento para o galego. Dicionario, analizador morfolóxico e desambiguador. Adaptación dos sistemas de etiquetado morfolóxico.

PT12.- Desenvolvemento do corpus de economía para o galego. Localización de textos en formato electrónico, selección de textos e partición de mostras. Marcaxe estrutural dos textos mediante SXML. Procesamento lingüístico dos textos.

Segunda anualidade

PT21.- Análise de posibilidades de importación de ontoloxías existentes en economía. Deseño de protocolos para a súa importación. Probas de importación.

PT22.- Explotación dos córpora (galego e castelán) para o enriquecemento da base de datos terminolóxica e da ontoloxía.

Terceira anualidade

PT31.- Deseño dun sistema de reelaboración de consultas, que transforme unha consulta simple nunha lingua nunha consulta complexa e combinada multilingüe a partir da extracción de datos da BD terminolóxica e da ontoloxía. Saída da consulta reelaborada cara a diversos motores de busca e metabuscadores.

PT32.- Fase de probas. Análise e avaliación de resultados. Participación para completar o portal web, co acceso ó banco de coñecemento sobre economía, composto por corpus textual, BD terminolóxica e ontoloxía e coa implementación do sistema de reelaboración de consultas.

Data de actualización: 26-06-2007