Universitat Pompeu Fabra Institut Universitari de Lingüística Aplicada
Pàgina inicial Versió imprimible Cercar informació Informació de contacte



Recursos IULA. Corpus y herramientas

Acceso a los recursos lingüísticos desarrollados en el IULA en el marco del proyecto común Corpus Tècnic.

El Instituto Universitario de Lingüística Aplicada se ocupa, dentro de sus objetivos de investigación básica y aplicada, del diseño y del desarrollo de recursos lingüísticos, de herramientas de procesamiento del lenguaje y de extracción de información. El proyecto Corpus Tècnic es el proyecto común de todos los miembros del IULA, y a su alrededor continúan construyéndose herramientas para la explotación de corpus.

 

Acceso Accés Bwananet
Accesibilidad: online
Descripción: Interfaz de consulta del Corpus Tècnic. El Corpus Tècnic agrupa textos escritos de derecho, economía, genómica, medicina, medioambiente, más un corpus de contraste de prensa. Las lenguas del corpus son catalán, castellano, inglés, francés y alemán.
Acceso Accés Herramientas de procesamiento de corpus Nou Nuevo!
Accesibilidad: demo online (dirección provisional)
Descripción: Paquete de herramientas de procesamiento de corpus en catalán y castellano. Incluye un preprocesador y un desambiguador probabilístico. También permite visualizar la información del diccionario del desambiguador.
en desenvolupament Treebank-IULA
Accesibilidad: en fase de desarrollo
Descripción: Nueva herramienta de procesamiento del Corpus Tècnic en catalán, castellano e inglés.
Acceso Accés PALIC
Accesibilidad: demo online
Descripción: Paquete de herramientas de procesamiento de corpus en catalán y castellano. Incluye un preprocesador, un etiquetador morfosintáctico y un desambiguador de base lingüística.
en desenvolupament Desambigua
Accesibilidad: demo online disponible en breve
Descripción: Banco de reglas lingüísticas de desambiguación para el catalán y el castellano.
Acceso Accés Jaguar Nou Nuevo!
Accesibilidad: acceso online provisional en fase de pruebas
Descripción: Herramienta de explotación estadística de corpus. Muestra concordancias, cuenta enegramas, extrae colocaciones, y ofrece medidas de asociación, distribución y similitud.
restringit COLDIC
Accesibilidad: acceso restringido
Descripción: Herramienta de gestión de la colección de diccionarios usados en el procesamiento lingüístico del Corpus Tècnic y en otros proyectos del IULA. Los diccionarios en formato electrónico han sido cedidos por entidades colaboradoras del IULA o han sido elaborados por los diversos grupos de investigación del IULA.
en desenvolupament Analitzador sintàctic en llengua castellana
Accesibilidad: demo online disponible en breve
Descripción: Grámatica HPSG para la lengua castellana de código abierto implementada en el sistema LKB.
Acceso Accés Alinea
Accesibilidad: demo online
Descripción: Herramienta de paralelización de textos traducidos, especialmente diseñada para córpora especializados, y como validador de traducciones.
en desenvolupament Wüska
Accesibilidad: en fase de pruebas
Descripción: Paquete de herramientas de recuperación y clasificación automática de textos especializados.
Acceso Accés Poppins
Accesibilidad: acceso online provisional en fase de pruebas
Descripción: Diseño experimental de clasificador de documentos con aprendizaje supervisado.

 

© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona