Català | English |Español | Galego

UPF-EHUko azpiproiektua

Berezko helburuak

Lan-enkarguak

Lehen urtea

1.1.LE.- Ekonomiako euskarazko corpus a eraikitzea. Formatu elektronikoan dauden testuak aurkitzea, hautatzea eta laginak bereiztea. Testuak prozesatzea. BWANANET bidez eskuragarri dagoen IULAren corpus ean txertatzea.

1.2.LE. - Ekonomiako gaztelaniazko eta katalanezko corpus aren ustiapena. Prozesaturiko corpus etik informazioa erauztea (besteak beste, unitate lexikoez, maiztasunez, konkordantziez) BWANANET bitartez. Itzulitako testuak dituen corpus aren zatiaren paralelizazioa ALINEA bitartez.

1.3.LE.- Euskararako hiztegi konputazionalak eta analizatzaile morfologikoak erabiltzeko baimenak. Baimendun tresnak lan-katean erabiltzeko behar diren egokitzapenak. Etiketatze morfologikorako sistemen egokitzea.

1.4.LE.- Ekonomiari buruzko informazio berrerabilgarria duten thesaurus dokumentalak, ontologiak eta hierarkia lexikoak aurkitzea Edukiak eta esportaziorako aukerak aztertzea. Formatu elektronikoan dauden ekonomiari buruzko glosategiak aurkitzea.

1.5.LE.- Baliabideak diseina tzea eta eraikitzea. Ekonomiako hiztegiak MERCEDES sistemara inportatzea. Ontologiaren eta hari lotutako datu-base terminologikoaren diseinua Ontoterm bitartez. Proiektuaren web-orriaren diseinua. Datu-baseen kudeatzaileen artean transferentziak egin ahal izateko protokoloak.

Bigarren urtea

2.1.LE.- Baliabide lexikoen aberastea. Ekonomiaren predikatuen datu-basea (aditzak, adjektiboak eta nominalizazioak), informazio semantiko eta fraseologikoa duena. Informazio hau gaztelaniako, katalaneko eta euskarako prozesamendu-hiztegietan sartu ahal izango da. Datuak terminologiako datu-base eleanitzean sartzea, inportazioz eta ad hoc .

2.2.LE.- Ontologia eraikitzea. Berrerabilitako ontologietatik oinarrizko ontologiarako inportazioak berrikustea. 1.2. LEan lortutako datuetatik ateratako kontzeptu-sistemak inkorporatzea.

Hirugarren urtea

3.1.LE.- IErako estrategia linguistikoen diseinua. Datu-base terminologikoaren eta ontologiaren arteko elkarrekintza-kontsulten tipologia. Berezko fraseologian edo corpus eko konkordantzietan oinarritutako estrategiak. Probetarako kontsulta- corpus bat ezartzea.

3.2.LE.- Kontsulten berreraikitzerako probak USCko azpiproiektuak diseinatutako sistema erabiliz. Emaitzen azterketa eta ebaluazioa.

3.3.LE.- Baliabide guztiak eta kontsultak berreraikitzeko sistema inplementatzea proiektuaren web-atarian.

USCko azpiproiektua

Berezko helburuak

Lan-enkarguak

Lehen urtea

1.1.LE.- Galegorako prozesamendu-tresnak aurkitzea eta egokitzea. Hiztegia, analizatzaile morfologikoa eta desanbiguatzailea. Etiketatze morfologikorako sistemak egokitzea.

1.2.LE.- Ekonomiako corpus a garatzea galegorako. Formatu elektronikoan dauden testuak aurkitzea, hautatzea eta laginak bereiztea. Testuen egiturazko markatzea SGML sistemaren bidez. Testuen prozesamendu linguistikoa.

Bigarren urtea

2.1.LE.- Ekonomiako ontologiak inportatzeko aukeren azterketa. Inportazio-protokoloen diseinua. Inportazio-probak.

2.2.LE.- Corpus en (galegoa eta gaztelania) ustiapena datu-base terminologikoa eta ontologia aberasteko.

Hirugarren urtea

3.1.LE.- Hizkuntza batean egindako kontsulta bakunak, datu-base terminologikoaren eta ontologiaren datuak baliatuz, kontsulta konplexu eta konbinatu eleanitzean eraldatzen duen berreraikitze-sistema diseinatzea. Berreraikitako kontsulta zenbait bilaketa-tresnen eta metabilatzaileetara bidaltzea.

3.2.LE.- Proba-fasea. Emaitzen azterketa eta ebaluazioa. Web-atariaren gauzatzean parte-hartzea. Web-atari horrek sarrera emango die Ekonomiako Ezagutza Bankuari, testu- corpus ari, datu-base terminologikoari eta ontologiari, eta kontsultak berreraikitzeko sistemari.

Eguneratze-data: 26-06-2007