UPF-EHUko azpiproiektua
Berezko helburuak
- Ekonomiako katalanezko corpusa ustiatzea.
- Ekonomiako corpusa eraikitzea euskararako.
- Euskararako dauden prozesamendu-tresnak egokitzea.
- Ekonomiari buruzko ontologiak eta thesaurusak aurkitzea eta ebaluatzea, berrerabili ahal izateko.
- Itzulpen-corpusa paralelizatzea ingelesa-gaztelania, katalana-ingelesa eta gaztelania-katalana bikoteetarako.
- Ontologia bat eraikitzea edota dauden ontologiak inportatzea.
- Terminologiako datu-base eleanitz bat diseinatzea eta eraikitzea.
- Datu terminologikoak (formalak, semantikoak eta fraseologikoak) sartzea, gaztelaniazko, katalanezko eta euskarazko corpusen ustiapenaren ondorioz.
Lan-enkarguak
Lehen urtea
1.1.LE.- Ekonomiako euskarazko corpus a eraikitzea. Formatu elektronikoan dauden testuak aurkitzea, hautatzea eta laginak bereiztea. Testuak prozesatzea. BWANANET bidez eskuragarri dagoen IULAren corpus ean txertatzea.
- Espero den emaitza: baliabide linguistikoa bukatuta eta eskuragarria.
- Kokapena: Ekonomiako euskarazko corpus aren eraikitzea UPV/EHUn (Donostia); egiturazko markatze estandarra eta prozesamendu linguistikoa IULA-UPFn (Bartzelona).
- Koordinatzailea: Zabala doktorea
- Parte-hartzaileak: Odriozola doktorea , Bach. doktorea , Elordui doktorea
- Laguntzaileak: bekadun bat
- Kanpo aholkularitza: EHUko ekonomia-irakasleak. Aurreikusitako leku-aldatzeak: bi bilera (egitasmoa prestatzeko bilera bat Bartzelonan, eta jarraipena egiteko bilera bat Donostian).
1.2.LE. - Ekonomiako gaztelaniazko eta katalanezko corpus aren ustiapena. Prozesaturiko corpus etik informazioa erauztea (besteak beste, unitate lexikoez, maiztasunez, konkordantziez) BWANANET bitartez. Itzulitako testuak dituen corpus aren zatiaren paralelizazioa ALINEA bitartez.
- Aurreikusitako emaitzak: Txostenak eta datu linguiskoen errepresentazioa.
- Kokagunea: IULA-UPF (Bartzelona). Vangehuchten doktoreak IULAn egin behar duen ikerkuntza-egonaldia sartzen da.
- Koordinatzailea: Vangehuchten doktorea
- Parte-hartzaileak: Mercè Lorente doktorea, Lluís de Yzaguirre doktorea, Tebé jauna.
- Laguntzaileak: Joan anderea, Quiroz jauna.
1.3.LE.- Euskararako hiztegi konputazionalak eta analizatzaile morfologikoak erabiltzeko baimenak. Baimendun tresnak lan-katean erabiltzeko behar diren egokitzapenak. Etiketatze morfologikorako sistemen egokitzea.
- Aurreikusitako emaitza: Tresna baimendunak egokituta eta eskuragarriak.
- Kokagunea: UPV-EHU (Donostia) eta UPF (Bartzelona).
- Koordinatzailea: Odriozola doktorea
- 3LEko parte-hartzaileak: Bach doktorea, Lluís de Yzaguirre doktorea, Zabala doktorea, Elordui doktorea
- Kanpo aholkularitza: UPV / EHUko IXA taldea.
1.4.LE.- Ekonomiari buruzko informazio berrerabilgarria duten thesaurus dokumentalak, ontologiak eta hierarkia lexikoak aurkitzea Edukiak eta esportaziorako aukerak aztertzea. Formatu elektronikoan dauden ekonomiari buruzko glosategiak aurkitzea.
- Aurreikusitako emaitza: Txostena.
- Kokagunea: IULA-UPF (Bartzelona).
- Koordinatzailea: Mercè Lorente doktorea
- LEko parte-hartzaileak: Vangehuchten doktorea , Tebé jauna.
- Laguntzaileak: Arano anderea, Joan anderea.
- Kanpo aholkularitza: IULAko DigiDoc taldea, Lluís Codina doktoreak zuzendua; TEXTERM-2 (BFF2003-02111) proiektuko ikertzaileak, ontologietan adituak direnak.
1.5.LE.- Baliabideak diseina tzea eta eraikitzea. Ekonomiako hiztegiak MERCEDES sistemara inportatzea. Ontologiaren eta hari lotutako datu-base terminologikoaren diseinua Ontoterm bitartez. Proiektuaren web-orriaren diseinua. Datu-baseen kudeatzaileen artean transferentziak egin ahal izateko protokoloak.
- Aurreikusitako emaitza: Ontologiaren eta datu-base terminologikoaren eraiketarako lan-protokoloak.
- Kokagunea: IULA-UPF (Bartzelona).
- Koordinatzailea: Lorente doktorea
- 2 LEko parte-hartzaileak: Lluís de Yzaguirre doktorea , Tebé jauna.
- Laguntzaileak: Arano anderea, Joan anderea, Quiroz jauna.
- Kanpo aholkularitza: TEXTERM (BFF2000-0841) proiektuko zenbait ikertzaile, Giza Genomaren Ezagutza Bankuaren diseinu eta eraiketan esperientzia izan zutenak.
Bigarren urtea
2.1.LE.- Baliabide lexikoen aberastea. Ekonomiaren predikatuen datu-basea (aditzak, adjektiboak eta nominalizazioak), informazio semantiko eta fraseologikoa duena. Informazio hau gaztelaniako, katalaneko eta euskarako prozesamendu-hiztegietan sartu ahal izango da. Datuak terminologiako datu-base eleanitzean sartzea, inportazioz eta ad hoc .
- Aurreikusitako emaitzak: b aliabide linguistikoak bukatuta.
- Kokagune banatua: IULA-UPF (Bartzelona), UPV, Ambereseko Unibertsitatea.
- Koordinatzailea: Zabala doktorea
- 2 LEko parte-hartzaileak: Lorente doktorea , Vangehuchten doktorea , Odriozola doktorea , Elordui doktorea , Bach doktorea , Tebé jauna.
- Laguntzaileak: Joan anderea, Quiroz jauna, bekadun bat.
- Kanpo aholkularitza: Lexikoak datu semantikoekin aberasten trebatuta dagoen ikerketa-taldea: Istituto di Lingüística Computazionale de Pisa institutuko CLIPS proiektua, Nicoletta Calzolari doktoreak zuzendua eta Nilda Ruimy doktoreak koordinatua.
2.2.LE.- Ontologia eraikitzea. Berrerabilitako ontologietatik oinarrizko ontologiarako inportazioak berrikustea. 1.2. LEan lortutako datuetatik ateratako kontzeptu-sistemak inkorporatzea.
- Aurreikusitako emaitzak: Baliabide linguistikoak bukatuta.
- Kokagune banatua: IULA-UPF (Bartzelona), UPV-EHU, Ambereseko Unibertsitatea.
- Koordinatzailea: Lorente doktorea.
- 2 LEko parte-hartzaileak: Zabala doktorea, Vangehuchten doktorea, Odriozola doktorea, Elordui doktorea, Bach doktorea, Tebé jauna.
- Laguntzaileak: Arano anderea, Joan anderea, bekadun bat.
- Kanpo aholkularitza: Malagako Unibertsitateko Antonio Moreno doktorea, Ontoterm kudeatzailearen sortzailea dena. TEXTERM (BFF2000-0841) proiektuko ikertzaileak, Giza Genomaren Ezagutza Bakuaren diseinu eta eraiketan parte hartu dutenak.
Hirugarren urtea
3.1.LE.- IErako estrategia linguistikoen diseinua. Datu-base terminologikoaren eta ontologiaren arteko elkarrekintza-kontsulten tipologia. Berezko fraseologian edo corpus eko konkordantzietan oinarritutako estrategiak. Probetarako kontsulta- corpus bat ezartzea.
- Aurreikusitako emaitza: Baliabide linguistikoak bukatuta.
- Kokagune banatua: IULA-UPF (Bartzelona), UPV-EHU, Ambereseko Unibertsitatea.
- Koordinatzailea : Lorente doktorea.
- 2 LEko parte-hartzaileak: Zabala doktorea, Vangehuchten doktorea, Odriozola doktorea, Elordui doktorea, Lluís de Yzaguirre doktorea, Bach doktorea, Tebé jauna.
- Laguntzaileak: Joan anderea, bekadun bat.
- Kanpo aholkularitza: Ricardo Baeza Yates (Universidad de Chile) irakaslearen IEari buruzko ikerketa-taldea, Universitat Politècnica de València unibertsitateko Encarna Segarra doktoreak zuzendutako TURSI proiektuko taldea.
3.2.LE.- Kontsulten berreraikitzerako probak USCko azpiproiektuak diseinatutako sistema erabiliz. Emaitzen azterketa eta ebaluazioa.
- Aurreikusitako emaitzak: ebaluazio-txostena.
- Kokagune banatua: IULA-UPF (Bartzelona), UPV-EHU, Ambereseko Unibertsitatea.
- Koordinatzailea: Lorente doktorea.
- 2 LEko parte-hartzaileak: Zabala doktorea, Vangehuchten doktorea, Odriozola doktorea, Elordui doktorea, Lluís de Yzaguirre doktorea, Bach doktorea, Tebé jauna .
- Laguntzaileak: Arano anderea, bekadun bat.
- Bestelako laguntza: Universidad Politécnica de Madrid, Guadalupe Aguado doktoreak zuzendutako taldeko doktoregaiak.
- Kanpo aholkularitza: Ricardo Baeza Yates irakasleak zuzendutako IBari buruzko ikerketa-taldea (Universidad de Chile), Universitat Politècnica de València unibertsitateko TURSI proiektuko taldea, Encarna Segarra doktoreak zuzendua.
3.3.LE.- Baliabide guztiak eta kontsultak berreraikitzeko sistema inplementatzea proiektuaren web-atarian.
- Aurreikusitako emaitza: Ekonomiari buruzko Ezagutza Bankuaren eta kontsultak berreraikitzeko sistema eskuragarriaren ataria.
- Kokagunea: IULA-UPF
- Koordinatzailea: Lorente doktorea.
- 2 LEko parte-hartzaileak: Zabala doktorea, Vangehuchten doktorea, Odriozola doktorea, Elordui doktorea, Lluís de Yzaguirre doktorea, Bach doktorea, Tebé jauna.
- Parte-hartzaileak: Joan anderea, Arano anderea, bekadun bat.
- Kanpo aholkularitza: IULATERM taldea, M. Teresa Cabré doktoreak zuzendua; IULAko DigiDoc taldea, Lluís Codina doktoreak zuzendua; Guadalupe Aguado doktoreak zuzendutako Universidad Politécnica de Madrid unibertsitateko taldea.
USCko azpiproiektua
Berezko helburuak
- Ekonomiako corpus a eraikitzea galegorako.
- Galegorako dauden prozesamendu-tresnak egokitzea.
- Galegorako eta gaztelaniako corpus aren ustiapenaren ondorioz lorturiko datu terminologikoak (formalak, semantikoak eta fraseologikoak) sartzea.
- Ekonomiaren ontologiaren aberaste automatikorako inportazio-protokoloak sortzea.
Lan-enkarguak
Lehen urtea
1.1.LE.- Galegorako prozesamendu-tresnak aurkitzea eta egokitzea. Hiztegia, analizatzaile morfologikoa eta desanbiguatzailea. Etiketatze morfologikorako sistemak egokitzea.
- Aurreikusitako emaitza: tresnak egokituta eta funtzionalak.
- Koordinatzailea: María Sol López doktorea.
- Parte-hartzaileak: Eduardo Miguel Moscoso, M.ª Paula Santalla, Susana Sotelo, Guillermo Rojo.
- Taldekideak ez diren parte-hartzaileak: Eva Domínguez, Fco. Mario Barcala
- Kanpo aholkularitza: Ramón Piñeiro Giza Zientzien Ikerketarako Zentroko ikertzaileak, Universidad de Coruñako Colo taldea.
1.2.LE.- Ekonomiako corpus a garatzea galegorako. Formatu elektronikoan dauden testuak aurkitzea, hautatzea eta laginak bereiztea. Testuen egiturazko markatzea SGML sistemaren bidez. Testuen prozesamendu linguistikoa.
- Aurreikusitako emaitza: baliabide linguistikoak bukatuta eta eskuragarriak.
- Koordinatzailea: María Sol López doktorea.
- Parte-hartzaileak: Eduardo Miguel Moscoso, Guillermo Rojo (testuen bilaketa eta corpus aren diseinua), M.ª Paula Santalla, Susana Sotelo (egiturazko markatzea eta prozesamendu linguistikoa).
- Taldekideak ez diren parte-hartzaileak: Eva Domínguez.
- Kanpo aholkularitza: Ramón Piñeiro Giza Zientzien ikerketa-zentroko ikertzaileak.
Bigarren urtea
2.1.LE.- Ekonomiako ontologiak inportatzeko aukeren azterketa. Inportazio-protokoloen diseinua. Inportazio-probak.
- Aurreikusitako emaitza: Txostena. Inportazio-protokoloak. Ebaluazioa.
- Koordinatzailea: María Paula Santalla doktorea.
- Parte-hartzaileak: Susana Sotelo, Guillermo Rojo.
- Taldekideak ez diren parte-hartzaileak: Fco. Mario Barcala.
- Laguntzaileak: M.ª Sol López, Eduardo Miguel Moscoso
- Aholkularitza: IULA-UPF, TEXTERM (BFF2000-0841) proiektuko ikertzaileak.
2.2.LE.- Corpus en (galegoa eta gaztelania) ustiapena datu-base terminologikoa eta ontologia aberasteko.
- Aurreikusitako emaitzak: Txostenak eta datu linguistikoen errepresentazioa .
- Koordinatzailea: Guillermo Rojo.
- Parte-hartzaileak: M.ª Paula Santalla, Susana Sotelo, María Sol López, Eduardo Miguel Moscoso.
- Taldekideak ez diren parte-hartzaileak: Eva Domínguez.
- Aholkularitza: IULA-UPF.
Hirugarren urtea
3.1.LE.- Hizkuntza batean egindako kontsulta bakunak, datu-base terminologikoaren eta ontologiaren datuak baliatuz, kontsulta konplexu eta konbinatu eleanitzean eraldatzen duen berreraikitze-sistema diseinatzea. Berreraikitako kontsulta zenbait bilaketa-tresnen eta metabilatzaileetara bidaltzea.
- Aurreikusitako emaitzak : kontsultak berreraikitzeko sistema (beta bertsioa).
- Koordinatzailea: María Paula Santalla doktorea.
- Parte-hartzaileak: Susana Sotelo.
- Taldekideak ez diren parte-hartzaileak: Fco Mario Barcala, Eva Domínguez.
- Laguntzaileak: Guillermo Rojo, María Sol López, Eduardo Miguel Moscoso.
- Kanpo aholkularitza: Universidad de Coruñako Cole taldea.
3.2.LE.- Proba-fasea. Emaitzen azterketa eta ebaluazioa. Web-atariaren gauzatzean parte-hartzea. Web-atari horrek sarrera emango die Ekonomiako Ezagutza Bankuari, testu- corpus ari, datu-base terminologikoari eta ontologiari, eta kontsultak berreraikitzeko sistemari.
- Aurreikusitako emaitza: Txostenak, web-ataria, arazturiko kontsultak berreraikitzeko sistema.
- Koordinatzailea: Guillermo Rojo.
- Parte-hartzaileak: M.ª Paula Santalla, Susana Sotelo, M.ª Sol López, Eduardo Miguel Moscoso.
- Taldekideak ez diren parte-hartzaileak: Fco Mario Barcala, Eva Domínguez.
- Kanpo aholkularitza: Universidad de Coruñako Cole taldea.