O Vocabulario multilingüe de economía español, catalán, galego, vasco e inglés és un dels resultats, en forma de recurs lexicogràfic, del projecte RICOTERM-2. Control terminolóxico e discursivo para a recuperación de información en ámbitos comunicativos especializados, mediante recursos lingüísticos específicos e un reelaborador de consultas (HUM2004-05658-C02-00), proxecto do Plan Nacional I+D+I do Ministerio de Educación y Ciencia para o período 2004-2007, coordinado entre a Universitat Pompeu Fabra e a Universidade de Santiago de Compostela, no que tamén participaron investigadores da Euskal Herriko Unibertsitatea e da Universiteit Antwerpen.
O obxectivo do proxecto RICOTERM-2 foi o desenvolvemento dun prototipo de reelaborador de consultas que permita lanzar unha consulta simple e monolingüe en Internet e recuperar a resposta nas linguas que o usuario indique. Baseado na expansión de consultas a partir de coñecemento lingüístico, o prototipo lanza ademais consultas complexas constituídas con variantes léxicas de cada lingua, usuais no ámbito específico da consulta. Para esta versión do prototipo traballouse con recursos textuais e léxicos do ámbito da economía nas linguas oficiais do estado español: castelán, catalán, galego e éuscaro.
Os materiais que se construíron, ou que se actualizaron, para poder controlar a expansión de consultas de maneira eficiente no ámbito da economía, foron córpora textuais especializados (monografías, revistas e teses de doutoramento) e córpora textuais de prensa (prensa económica ou suplementos económicos da prensa diaria) en cada unha das linguas de traballo. Todos os córpora foron procesados e etiquetados estrutural e lingüisticamente. O proxecto permitiu adaptar e probar, nun ámbito de ciencias sociais, os extractores automáticos de terminoloxía existentes para o castelán, o catalán e o vasco, e tamén serviu para iniciar a construción dun novo sistema para o galego. Paralelamente enriqueceuse unha ontoloxía léxica xeral con información léxica específica de economía.
Con estes recursos e estas ferramentas de procesamento e de extracción puideron xerarse listados multilingües de termos de economía, que quixemos validar mediante a consulta de dicionarios e vocabularios terminolóxicos de referencia publicados, que nos axudaron a controlar parte da variación léxica detectada. Debemos agradecer especialmente a colaboración da Fundación Elhuyar, de Euskalterm (Banco Terminolóxico Público Vasco), do Servizo de Normalización Lingüística da Universidade de Santiago de Compostela e do Centre de Terminologia TERMCAT, que nos facilitaron o acceso a estas fontes de referencia.
Os listados léxicos que se puideron extraer e validar coa consulta de fontes de referencia son moi distintos en relación co número de entradas para cada lingua, e ademais a fusión de todos eles nun único listado multilingüe deu como resultado unha coincidencia baixa, xa que as fontes textuais e terminográficas están relacionadas con ramas moi distintas da economía (seguros, banca, comercio, bolsa, etc.). Por este motivo, e para garantir a solidez dun recurso léxico multilingüe para o reelaborador, realizáronse fusións automáticas parciais en combinatorias de tres linguas, e completáronse manualmente as entradas do vasco, co que obtivemos un recurso tetralingüe de 1100 entradas cos seus correspondentes equivalentes.
Deste proceso nace este vocabulario multilingüe que inclúe tamén o inglés, ademais das linguas de traballo de RICOTERM-2. O número de entradas varía segundo a lingua: 7000 para o castelán e o catalán, 6400 para o inglés, 4000 no galego e 971 en vasco. O recurso inclúe os 1100 lemas que presentan a serie completa de equivalencias nas catro linguas; e tamén o resto de lemas, que só aparecen nunha, dúas ou tres linguas. Ademais das equivalencias, os usuarios atoparán información gramatical e sinónimos documentados como variantes en cada unha das linguas.
Trátase dunha versión preliminar e, xa que logo, somos conscientes das limitacións deste recurso, que pretendemos mellorar e completar máis adiante. Porén, confiamos en que a edición en formato HTML deste vocabulario será unha ferramenta útil para tarefas de mediación lingüística realizadas por economistas, profesores, xornalistas, tradutores, redactores e estudantes.