Per la necessitat d'actualització constant de les dades, la metodologia de treball de l'Observatori de Neologia té com a base l'activitat de buidatge de textos per a l'extracció de nous neologismes. L'Observatori compatibilitza aquesta activitat amb els treballs d'anàlisi i de difusió dels neologismes.
Buidatge
El buidatge consisteix en la detecció de neologismes i creació dun corpus de neologismes per al català i per al castellà, a partir del buidatge de textos (fonts de buidatge). Aquesta detecció es fa manualment i, seminautomàticament, amb l'eina Buscaneo. La fitxa de buidatge incorpora informació lingüística i pragmàtica dels neologismes.
Definició de neologisme
El criteri amb què treballa lObservatori de Neologia per establir la neologicitat dels mots és el criteri lexicogràfic: es considera neologisme qualsevol paraula que no apareix en el corpus lexicogràfic dexclusió.
S'apliquen diverses restriccions al criteri lexicogràfic: d'una banda, es consideren neologismes, encara que es documentin al corpus dexclusió, les paraules amb marques de neologicitat. D'altra banda, no es consideren neologismes, encara que no es documentin al corpus dexclusió, diversos tipus d'unitats com els augmentatius, diminutius i superlatius, els adverbis en -ment, etc. Actualment l'OBNEO treballa en l'aplicació de filtres que complementin el criteri lexicogràfic i que permetin distingir unitats més o menys neològiques dins del conjunt d'unitats considerades neològiques des del punt de vista lexicogràfic.
Corpus lexicogràfic dexclusió
El corpus lexicogràfic d'exclusió és el conjunt de diccionaris utilitzats per determinar si les unitats són neològiques des d'un punt de vista lexicogràfic.
Per al català, actualment es consideren obres de referència:
Fins a l'aparició d'aquests diccionaris, es consideraven obres d'exclusió:
Per al castellà, es consideren obres de consulta:
Fins a l'aparició d'aquests diccionaris , es consideraven obres d'exclusió:
Fonts de buidatge
Actualment, l'Observatori de Neologia fa tres tipus de buidatge segons les fonts de treball: buidatge de diaris, buidatge de textos orals i buidatge de revistes.
| Per
al català |
|||
![]() |
![]() |
||
| Avui des de 1989 |
El Periódico des de 1998 |
||
Per al castellà |
|||
![]() |
![]() |
||
| El País des de 1989 |
La Vanguardia des de 1989 |
||
Anteriorment també han estat fonts de buidatge per al català: Diari de Barcelona, Nou Diari, El Punt de Girona, El Temps i Diari de Mallorca.
El nombre de diaris que es buiden anualment ha variat al llarg dels anys; actualment són aproximadament 150 entre totes dues llengües.
Des de l'any 1999 es treballa també amb textos orals de la ràdio en català i castellà; alguns dels espais buidats són, en català: Els millors anys de la nostra vida [Catalunya Radio], El matí de Catalunya Ràdio [Catalunya Radio], Minoria absoluta [Rac1], El món a RAC1 [Rac1], Extraradi [COMRadio], etc. I en castellà: Es la mañana Cowboys de medianoche [ESRadio], Tolerancia cero [Radio 5], La Mañana [COPE], El Vestuario [RNE], etc.
Des de l'any 2000 es treballa també amb textos no necessàriament revisats per serveis de correcció lingüística; algunes de les fonts de buidatge són les següents: Barcelona Informació, Teatre BCN, Tribuna Bit, etc.
La descripció detallada de la metodologia està
disponible en format PDF en la publicació Metodologia
del treball en neologia: criteris, materials i processos.
Barcelona, IULA, 2004.
© INSTITUT UNIVERSITARI DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA, Roc Boronat 138, 08018 Barcelona