Universitat Pompeu Fabra
Institut Universitari de Lingüística Aplicada
 
Inici
Cerca
Contacte | Mapa Web

Recursos IULA

Corpus i eines

Recursos lingüístics desenvolupats a l'IULA en el marc del projecte comú Corpus Tècnic.

L'Institut Universitari de Lingüística Aplicada s'ocupa, dins dels seus objectius de recerca bàsica i aplicada, del disseny i del desenvolupament de recursos lingüístics, d'eines de processament del llenguatge i d'extracció d'informació. El projecte Corpus Tècnic és el projecte comú de tots els membres de l'IULA, i al voltant d'aquest s'hi continuen construint eines per a l'explotació de corpus.

Accès Accés Bwananet
Accessibilitat: online
Descripció: Interfície de consulta del Corpus Tècnic. El Corpus Tècnic aplega textos escrits del dret, l'economia, la genòmica, la medicina, el medi ambient, més un corpus de contrast de premsa. Les llengües del corpus són català, castellà, anglès, francès i alemany.
Accès Accés Eines de processament de corpus
Accessibilitat: demo online (adreça provisional)
Descripció: Paquet d'eines de processament de corpus en català i castellà. Inclou un preprocessador i un desambiguador estadístic. També permet visualitzar la informació del diccionari del desambiguador.
en desenvolupament Treebank-IULA
Accessibilitat: en fase de desenvolupament
Descripció: Nova eina de processament del Corpus Tècnic en català, castellà i anglès.
Accés Accés PALIC
Accessibilitat: demo online
Descripció: Paquet d'eines de processament de corpus en català i castellà. Inclou un preprocessador, un etiquetador morfosintàctic i un desambiguador de base lingüística.
en desenvolupament Desambigua
Accessibilitat: demo online disponible properament
Descripció: Banc de regles lingüístiques de desambiguació per al català i el castellà.
Accés Accés Jaguar
Accessibilitat: accés online provisional en fase de proves
Descripció: Eina d'explotació estadística de corpus. Mostra concordances, compta enegrames, extrau col·locacions, ofereix mesures d'associació, distribució i similitud.
restringit COLDIC
Accessibilitat: accés restringit
Descripció: Eina de gestió de la col·lecció de diccionaris usats en el processament lingüístic del Corpus Tècnic i en altres projectes de l'IULA. Els diccionaris en format electrònic han estat cedits per entitats col·laboradores de l'IULA o han estat elaborats pels diversos grups de recerca de l'IULA.
en desenvolupament Analitzador sintàctic en llengua castellana
Accessibilitat: demo online disponible properament
Descripció: Gràmatica HPSG per a la llengua castellana de codi obert implementada en el sistema LKB.
Accés Accés Alinea
Accessibilitat: demo online
Descripció: Eina de paral·lelització de textos traduïts, especialment dissenyada per a corpus especialitzats i com a validador de traduccions.
Accés Accés Poppins
Accessibilitat: accés online provisional en fase de proves
Descripció: Disseny experimental de classificador de documents amb aprenentatge supervisat.

 

© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona