Corpus y herramientas
Acceso a los recursos lingüísticos desarrollados en el IULA en el marco del proyecto común Corpus Tècnic.
El Instituto Universitario de Lingüística Aplicada se ocupa, dentro de sus objetivos de investigación básica y aplicada, del diseño y del desarrollo de recursos lingüísticos, de herramientas de procesamiento del lenguaje y de extracción de información. El proyecto Corpus Tècnic es el proyecto común de todos los miembros del IULA, y a su alrededor continúan construyéndose herramientas para la explotación de corpus.
Acceso ![]() |
Bwananet |
| online | |
| Interfaz de consulta del Corpus Tècnic. El Corpus Tècnic agrupa textos escritos de derecho, economía, genómica, medicina, medioambiente, más un corpus de contraste de prensa. Las lenguas del corpus son catalán, castellano, inglés, francés y alemán. | |
Acceso ![]() |
Herramientas de procesamiento de corpus |
| demo online (dirección provisional) | |
| Paquete de herramientas de procesamiento de corpus en catalán y castellano. Incluye un preprocesador y un desambiguador probabilístico. También permite visualizar la información del diccionario del desambiguador. | |
![]() |
Treebank-IULA |
| en fase de desarrollo | |
| Nueva herramienta de procesamiento del Corpus Tècnic en catalán, castellano e inglés. | |
Acceso ![]() |
PALIC |
| demo online | |
| Paquete de herramientas de procesamiento de corpus en catalán y castellano. Incluye un preprocesador, un etiquetador morfosintáctico y un desambiguador de base lingüística. | |
![]() |
Desambigua |
| Banco de reglas lingüísticas de desambiguación para el catalán y el castellano. | |
Acceso ![]() |
Jaguar |
| Herramienta de explotación estadística de corpus. Muestra concordancias, cuenta enegramas, extrae colocaciones, y ofrece medidas de asociación, distribución y similitud. | |
![]() |
COLDIC |
| acceso restringido | |
| Herramienta de gestión de la colección de diccionarios usados en el procesamiento lingüístico del Corpus Tècnic y en otros proyectos del IULA. Los diccionarios en formato electrónico han sido cedidos por entidades colaboradoras del IULA o han sido elaborados por los diversos grupos de investigación del IULA. | |
![]() |
Analitzador sintàctic en llengua castellana |
| Grámatica HPSG para la lengua castellana de código abierto implementada en el sistema LKB. | |
Acceso ![]() |
Alinea |
| Herramienta de paralelización de textos traducidos, especialmente diseñada para córpora especializados, y como validador de traducciones. | |
Acceso ![]() |
Poppins |
| Diseño experimental de clasificador de documentos con aprendizaje supervisado. |
© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona