![]() |
Transcription, Tagging and Coding of Bilingual Corpora
via LIDES IULA/INF021/97 Autoria: M. Teresa Turell, Montserrat Forcadell |
||
|
| Resum: | L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants. |
| Resumen: | Se presenta la aplicación de una serie de propuestas sobre transcripción, etiquetaje y codificación de dos corpus: el corpus bilingüe LC (La Canonja (catalán-español)) y el corpus trilingüe (Code-switching as Communicative Design (catalán-español-inglés)). Estas propuestas, que constituyen la aportación del equipo IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificación del sistema LIDES (Language Interaction Database Exchange System), adoptado por el grupo europeo LIPPS, pueden ser útiles para transcribir, etiquetar y codificar datos provenientes de lenguas tipológicamente tanto próximas como distantes. |
| Abstract: | This report presents an overview of the contributions of the IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) team to the LIDES (Language Interaction Database Exchange System) coding manual and their application to two corpora: the LC (La Canonja) bilingual corpus (Catalan-Spanish) and the CSCD (Code-switching as Communicative Design) trilingual corpus (Catalan-Spanish-English). These contributions to LIDES can also be exploited for transcribing, tagging and coding language interaction data from both typologically close and distant languages. |
© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona