APLE2

Objetivos

Metodología

Hipótesis

En su vertiente teórico-descriptiva, el proyecto se propone cubrir un vacío existente hasta ahora en los estudios sobre la neologia léxica: la  caracterización de los neologismos léxicos como objeto científico dentro de una teoría del léxico, ampliando esta caracterización con aspectos psicolingüísticos y sociolingüísticos relacionados con su producción, recepción y circulación social, y establecer la especificidad de los neologismos especializados y sus relaciones con los generales y con el léxico no neológico. Y en su vertiente aplicada, el proyecto se propone desarrollar herramientas para el trabajo neológico, y específicamente construir una herramienta capaz de extraer de corpus textuales patrones de evolución de los neologismos y clasificarlos automáticamente en neologismos efímeros, neologismos emergentes y neologismos diccionarizables, con la finalidad de contribuir a la transferencia de conocimiento a organismos y empresas que requieren neologismos para actualizar sus recursos lexicográficos y sus herramientas de gestión de conocimiento e información. En este trabajo se aplicaran las herramientas al tratamiento del español, aunque sean herramientas concebidas como independientes de lengua.

Las hipótesis de partida pueden generalizarse en las siguientes:

a) A través de un corpus segmentado diacrónicamente se pueden detectar automáticamente los neologismos, seguir su evolución en el uso y establecer patrones evolutivos.
b) A partir de los patrones evolutivos se pueden clasificar los neologismos según su grado de estabilización y realizar predicciones sobre su evolución futura.
c) Establecer diferencias relevantes entre los neologismos generales y especializados tanto por sus características lingüísticas como pragmáticas.
d) Identificar diferencias entre los neologismos basadas en factores relacionados con sus condiciones de producción, recepción y circulación que pueden expresarse como correlaciones entre variables distintas. Algunas de estas diferencias tienen un correlato psicolingüístico relacionado con el procesamiento de la información.

Bloques de trabajo

Bloque 1: Constitución de materiales

a) Elaboración de un corpus de prensa segmentado diacrónicamente

La publicación online del contenido de los periódicos de prensa nacionales e internacionales representa una de las grandes oportunidades para la investigación en lingüística de corpus. En nuestro caso, nos interesa estudiar la variedad peninsular del castellano, y con ese objetivo constituiremos nuestro corpus de análisis en periódicos españoles. Tratándose de una investigación confinada a nuestro laboratorio y que no implicara de ninguna manera la redistribución ni total ni parcial de los contenidos de los periódicos por cualquier otro canal, nuestra investigación no infringe en modo alguno la ley de protección de los derechos de propiedad intelectual. El material extraído de estas fuentes serán las unidades léxicas –incluyendo expresiones multi-palabra– que no están sujetas a esta legislación, con la excepción de marcas comerciales. Para medir el efecto del sesgo en el vocabulario que implica el género prensa, realizaremos contrastes con un corpus control, que consiste en una colección de textos de ensayo y narrativa española. Esto nos ofrecerá alguna estimación de las construcciones del castellano que no se dan (con frecuencia) en el corpus de prensa.

b) Elaboración de corpus temáticamente especializados segmentados diacrónicamente

Además del género prensa, Internet es un excelente corpus especializado. Existe un número muy elevado de publicaciones científicas que ofrecen sus contenidos en formato digital. El archivo de publicaciones de una revista especializada es valioso por dos motivos: en primer lugar, es una garantía de calidad y coherencia de los contenidos de un área temática especifica y, en segundo lugar, están organizados diacrónicamente. Seleccionando un numero arbitrario de disciplinas técnico-científicas, que luego podremos ir incrementando paulatinamente para incluir otras materias, ubicaremos aquellas publicaciones de referencia de estas disciplinas que ofrezcan sus contenidos online.
En cuanto a la legalidad de esta operación, rigen los mismos principios que lo observado para el caso del análisis de los textos de prensa. Cabe añadir, además, que los procesos de descarga de información desde los servidores de Internet se realiza de manera responsable, lo que significa que se lleva a cabo de manera pausada durante largos periodos de tiempo con el objeto de no representar una sobrecarga de solicitudes que podría ser interpretada un tipo de ataque informático.
La constitución de los distintos corpus nos permitirá establecer distintos conjuntos de vocabulario, con unidades léxicas (simples o sintagmáticas) pertenecientes a cada una de las aéreas temáticas por un lado y a la lengua general por otro, así como también, como subproducto del análisis, una selección del vocabulario cientifico castellano, consistente en el conjunto de expresiones que no representan terminología propia de una disciplina, sino formulas del discurso argumentativo o científico en general, como marcadores reformulativos, marcas organizadoras del discurso, etc.

Bloque 2: Adaptación y/o desarrollo de herramientas de extracción de información y análisis de los neologismos generales y especializados en los corpus

En trabajos anteriores hemos presentado el desarrollo de estrategias de detección de unidades especializadas mono o poliléxicos (Cabré y Nazar, en prensa; Nazar, 2011a). En este caso, aplicamos una nueva dimensión en el análisis representada por el eje diacrónico. Adoptaremos aquí dos líneas de investigación para las cuales disponemos de instrumentos ya desarrollados y evaluados (Nazar y Vidal, 2010; Nazar, 2011b): en primer lugar, la extracción automática de unidades del corpus diacrónico a partir de la forma que describe la curva de frecuencia de uso de esas unidades y, en segundo lugar, las estadísticas de coaparición de las palabras del corpus, definida como concurrencia de las palabras dentro de una misma oración o párrafo, ya sea en orden fijo y posiciones adyacentes o en orden libre y a distinta distancia.
En cuanto a la primera línea de análisis, el foco de nuestro interés esta en las unidades que describen una curva ascendente. Sin embargo, podemos incluir el análisis de unidades que están cayendo en desuso, o bien comparar aquellos neologismos que prosperan con los que caen en desuso e intentar encontrar alguna regularidad entre ambos grupos que permita predecir que neologismos se estabilizaran. Naturalmente, este análisis se llevara a cabo sin necesidad de tener en cuenta la realidad extralingüística a la que hacen referencia los neologismos, sino tomando en cuenta únicamente las propiedades geométricas que describe la curva de evolución de su frecuencia de uso.
En cuanto a la segunda línea, partimos de la base de que un cambio en el tipo de contexto en el que se utiliza una determinada unidad léxica (definido como el conjunto de las unidades con las que suele coocurrir la unidad de análisis) es indicativo de que se está produciendo un cambio en el significado de esa unidad. Es posible estudiar el cambio del contexto de una unidad en distintos corpus o bien en el mismo corpus a lo largo del tiempo. En el caso de la comparación entre corpus, se verá que una misma unidad puede tener contextos distintos en el corpus de especialidad respecto al general. En caso del cambio en el mismo corpus, este cambio se puede producir porque el elemento es un deíctico, y por lo tanto hace referencia a elementos distintos según pasa el tiempo, como sucede por ejemplo con las palabras que designan cargos públicos (lo cual no es científicamente interesante) o bien con las unidades léxicas cuyo significado esta mutando o desarrollan un significado nuevo.
El análisis requerirá asimismo el desarrollo de nuevas herramientas que nos permitan estudiar correlaciones entre la evolución de la frecuencia de uso de las unidades léxicas en los distintos corpus. Por ejemplo, necesitaremos calcular cuando un determinado evento en el corpus especializado anticipa un cambio similar en el corpus de prensa y, a la vez, medir el lapso de tiempo que se produce entre ambos eventos.

Bloque 3: Descripción de las características intrínsecas (tipo y estructura) y extrínsecas (procedencia, frecuencia, distribución) de los neologismos generales y especializados. Contraste de resultados.

Se analizaran las características de los neologismos extraídos de los dos corpus textuales (general y especializado) en relación con su tipo, origen, estructura y proceso de formación, y se compararan los resultados para obtener generalizaciones sobre la especificidad de ambos tipos de neologismos. Asimismo, se analizaran por separado los neologismos generales y especializados organizados por patrones de evolución (efímeros, emergentes y diccionarizables) a fin de conocer las tendencias generales y establecer correlaciones entre las distintas variables. Nuestro objetivo en este punto es saber si existe alguna correlación entre el tipo estructural del neologismo o su procedencia en el caso de los préstamos y calcos, y sus posibilidades de estabilización en el uso colectivo. Y ello, tanto para los neologismos de carácter general como para los de especialidad. No descartamos hacer un estudio de los neologismos específicos de un solo ámbito de especialidad que sea innovador (pensamos en el dominio de la nanorobótica por el hecho de disponer de expertos que pueden asesorarnos) para ver si los resultados del análisis aplicado al corpus especializado en general coinciden en un ámbito particular tan innovador como el que proponemos.

Bloque 4: Análisis de los neologismos: producción

Consideramos que los neologismos localizados en el corpus especializados habrán sido producidos por expertos, y que, en cambio, muchos de los que apareceran en el corpus de prensa habrán sido producidos por no expertos, los periodistas. En este punto nos interesa analizar más particularmente aquellos neologismos de tema especializado que hayan aparecido en ambos corpus y tratar la variación denominativa que presentan en los dos corpus, con un interés centrado en la variación denominativa que un concepto de especialidad abre en la prensa de carácter divulgativo. Trataremos de conocer si los mecanismos lingüísticos usados por los expertos coinciden con los usados por los no expertos cuando se trata de denominar un mismo concepto y de observar las modulaciones semánticas que se producen en los diferentes corpus.

Bloque 5: Análisis de los neologismos: recepción

Partimos del supuesto que muchos neologismos pasan desapercibidos para una gran parte de los hablantes y otros en cambio se hacen muy visibles. Ello induce a pensar que existen factores que dan visibilidad a determinados tipos de neologismos, con lo que se puede establecer una escala de percepción de neologicidad en correlación con los tipos de neologismos. Esto es muy claro en los casos extremos (los prestamos no adaptados de otras lenguas suelen ser muy visibles y, en cambio, los neologismos formados por prefijación suelen pasar desapercibidos). En este apartado del proyecto se intentara encontrar correlaciones entre el grado de percepción de la neologicidad y las características de las unidades neológicas y además se tratara de corroborar que el grado de neologicidad se sustenta en factores de orden psicolingüístico como la velocidad de procesamiento de la información. A menor visibilidad menor sorpresa y mayor velocidad de procesamiento; y a la inversa, a mayor visibilidad, mayor sorpresa y menor velocidad de procesamiento.

Bloque 6: Análisis de los neologismos: circulación social

La metodología usada para el análisis de la circulación de los neologismos comprende dos aspectos:

a) Como se ha descrito en la metodología de análisis del corpus, el establecimiento de curvas de frecuencia de uso de los neologismos generales y especializados, centrando nuestro interés en los neologismos que siguen una curva ascendente, para ver si existe correlación entre patrones evolutivos y tipos de neologismos; y si estos resultados difieren o son similares en el caso de los neologismos generales y en los especializados.

b) El análisis de algunos de los neologismos terminológicos de los tres tipos, en contexto, tanto en el corpus de especialidad como en el de prensa, para establecer los mecanismos de estabilización de los neologismos especializados en el discurso general, y específicamente en la prensa.

Fecha de actualización: 28-04-2015