Presentación

El proyecto Vocabulario multilingüe de economía , catalán, gallego, vasco e inglés es uno de los resultados, en forma de recurso lexicográfico, del proyecto RICOTERM-2. Control terminológico y discursivo para la recuperación de información en ámbitos comunicativos especializados, mediante recursos lingüísticos específicos y un reelaborador de consultas (HUM2004-05658-C02-00), proyecto del Plan Nacional I+D+I del Ministerio de Educación y Ciencia para el período 2004-2007, coordinado entre la Universitat Pompeu Fabra y la Universidade de Santiago de Compostela, en el que también han participado investigadores de la Euskal Herriko Unibertsitatea y de la Universiteit Antwerpen.

El objetivo del proyecto RICOTERM-2 ha sido el desarrollo de un prototipo de reelaborador de consultas que permita lanzar una consulta simple y monolingüe en Internet y recuperar la respuesta en las lenguas que el usuario indique. Basado en la expansión de consultas a partir de conocimiento lingüístico, el prototipo lanza además consultas complejas constituidas con variantes léxicas de cada lengua, usuales en el ámbito específico de la consulta. Para esta versión del prototipo se ha trabajado con recursos textuales y léxicos del ámbito de la economía en las lenguas oficiales en el estado español, el castellano, el catalán, el gallego y el vasco.

Los materiales que se han construido, o que se han actualizado, para poder controlar la expansión de consultas de manera eficiente en el ámbito de la economía han sido córpora textuales especializados (monografías, revistas y tesis doctorales) y córpora textuales de prensa (prensa económica o suplementos económicos de prensa diaria) en cada una de las lenguas de trabajo. Todos los córpora han sido procesados y etiquetados estructural y lingüísticamente. El proyecto ha permitido adaptar y probar, en un ámbito de ciencias sociales, los extractores automáticos de terminología existentes para el castellano, el catalán y el vasco y también ha servido para iniciar la construcción de un nuevo sistema para el gallego. Paralelamente se ha enriquecido una ontología léxica general con información léxica específica de economía.

Con estos recursos y estas herramientas de procesamiento y de extracción han podido generarse listados multilingües de términos de economía, que hemos querido validar mediante la consulta de diccionarios y vocabularios terminológicos de referencia publicados, que nos han ayudado a controlar parte de la variación léxica detectada. Debemos agradecer especialmente la colaboración de la Fundación Elhuyar, de Euskalterm (Banco Terminológico Público Vasco), del Servizo de Normalización Lingüística de la Universidade de Santiago de Compostela y del Centre de Terminologia TERMCAT, que nos han facilitado el acceso a estas fuentes de referencia.

Los listados léxicos que se han podido extraer y validar con la consulta de fuentes de referencia son muy distintos en relación con el número de entradas para cada lengua, y además la fusión de todos ellos en un único listado multilingüe ha dado como resultado una coincidencia baja, puesto que las fuentes textuales y terminográficas están relacionadas con ramas muy distintas de la economía (seguros, banca, comercio, bolsa, etc.). Por este motivo, y para garantizar la solidez de un recurso léxico multilingüe para el reelaborador, se han realizado fusiones automáticas parciales en combinatorias de tres lenguas, y se han completado manualmente las entradas del vasco, con lo que hemos obtenido un recurso tetralingüe de 1100 entradas con sus correspondientes equivalentes.

De este proceso nace este vocabulario multilingüe que incluye también el inglés, además de las lenguas de trabajo de RICOTERM-2. El número de entradas varía según la lengua: 7000 para el español y el catalán, 6400 para el inglés, 4000 en gallego y 971 en vasco. El recurso incluye los 1100 lemas que presentan la serie completa de equivalentes a las otras lenguas y el resto que solamente presentan equivalentes en una, dos o tres lenguas. Además de la información de equivalentes, los usuarios encontrarán sinónimos documentados como variantes en cada una de las lenguas.

Se trata de una versión preliminar, y por lo tanto somos conscientes de las limitaciones de este recurso, que pretendemos mejorar y completar más adelante. Sin embargo, confiamos que la edición en formato HTML de este vocabulario será una herramienta útil para tareas de mediación lingüística realizadas para economistas, profesores, periodistas, traductores, redactores y estudiantes.