-
Ekonomiako testuen ezaugarrien berri izateko, bi corpus erabili ditugu: bata elebakarra eta bestea elebiduna.
Corpus elebiduna bi testuz osaturik dago: bata ekonomia orokorrekoa eta, bestea, marketinekoa. Bi corpus hauek berezitutzat hartu ditugu.
Kontuan hartu behar da testuak itzulpenak direla (jatorrizko testua gaztelaniaz idatzita dago).
Ekonomiako testuak 177.799 hitz ditu:
GARCÍA DELGADO, J.L. [zuz.] [et al.]. Lecciones de economía española. Madrid: Civitas, 1995.
GARCÍA DELGADO, J.L. [zuz.] UZEI [trad.]. Espainiako ekonomiari buruzko ikasgaiak. Bilbo: EHU/UPV Argitalpen Zerbitzua, 1998.
Marketineko testuak 133.476 hitz ditu:
AGUIRRE GARCÍA, M.S. [coord]. Marketing en sectores específicos. Madrid: Pirámide, 2000
AGUIRRE GARCÍA, M.S. [coord]. Sektore espezifikoetako marketina. UZEI [trad.] (2003)
Bi testu hauek esaldi mailan lerrokatuta daude. Puntuek eta bi puntuek markatzen dituzte esaldiak.
Corpus elebakarra Euskaldunon Egunkaria kazetatik atera dugu. 2000 urteko ekonomiari buruzko artikulu guztiak jaso ditugu. Orotara 600.931 hitz dira.
Corpusak lematizatu eta morfologikoki analizatu ditugu. Euskarazko testuak analizatzeko, Euskal Herriko Unibertsitateko (UPV/EHU) IXA taldeak garaturiko EUSTAGGER analizatzailea (Aduriz et al ., 1994) erabili dugu.
Gaztelaniazko zatirako, Universitat Politècnica de Catalunya (UPC) unibertsitateko TALP taldeak garatutako Freeling analizatzaileaz (Atserias et al. , 2006) baliatu gara.
Proiektu honen helburuetako bat izan da ekonomia alorraren bereizgarria den terminologia erauztea. Horretarako, bi terminologia-erauzle erabili ditugu: ERAUZTERM testu elebakarretarako, eta ELEXBI testu elebidunetarako.