| Resum: | L'edició de textos fent ús de mitjans informàtics
ha comportat avantatges i inconvenients. Mentre que ha fet molt
accessible l'edició acurada de textos també ha provocat tot
un seguit de problemes, un del quals és la dificultat de compartir
recursos.
Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra. |
| Resumen: | La edición de textos hace uso de medios informáticos que presentan ventajas e inconvenientes. Mientras que se ha hecho muy accesible la edición detallada de textos también ha provocado un conjunto de problemas, uno de los cuales es la dificultad de compartir recursos. Por otro lado, la lingüística necesita elaborar corpus voluminosos para conocer con mas precisión y fundamento el comportamiento real del lenguaje. Es evidente que la obtención y consiguiente preparación de un corpus para su explotación se convierte en un proceso costoso en tiempo y recursos, motivo por el cual es muy atractivo y hasta necesario compartir este material de investigación con otras organizaciones. En este trabajo se examinan las distintas propuestas de aplicación del estándar SGML (Standard Generalized Markup Language) en la constitución de corpus textuales para la investigación lingüística, con énfasis especial en las soluciones propuestas en l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra. |
| Abstract: |
The edition of texts make use of computer tools that have advantages and disadvantages. While detailed text edition is now very accesible, it has also caused a set of problems, for example, the difficulty fo sharing resources. On the other hand, linguistics needs to make larger corpus to know with more precision and theoretical bases the real behavior of language. It is evident that the compilation and, then the preparation of a corpus to be used is a time- and -resource consuming process. This is why is very attractive and thus necessary to share this research material with other organizations. In this work, the different proposal for the application of the standar SGML (Standard Generalized Markup Language) in the building of corpora for linguistic research are examined , with special emphasis on the solutions proposed by the Institute for Applied Linguistics at Universitat Pompeu Fabra. |
© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona