Resultados previos
Nuestro grupo, UVAL - ForensicLab, ya dispone de resultados previos que son fruto de la investigación llevada a cabo en cuatro tesis doctorales (dos defendidas a finales de 2007 y dos en curso de elaboración).
Por un lado, la tesis doctoral ya defendida (29 de noviembre de 2007) por el Dr. Jordi Cicres: Aplicación del análisis de la entonación y de la alineación tonal a la identificación de hablantes en fonética forense. El objetivo principal de esta tesis ha sido localizar y describir los parámetros relacionados con la entonación y la alineación tonal del catalán que son idiosincrásicos de los hablantes. Estos parámetros, en fonética forense, tienen que poder ser útiles para identificar hablantes. Concretamente, se han estudiado tres variables relacionadas con la forma de la línea melódica y dos variables relacionadas con la alineación de los picos de frecuencia fundamental respecto de las sílabas tónicas. Se ha considerado la posición de las sílabas estudiadas dentro de las unidades de entonación. Por otro lado, este trabajo ha implicado dos focos de análisis: un análisis sincrónico y otro diacrónico. El primer foco ha servido para detectar las diferencias entonativas entre hablantes diferentes (variación inter-hablante), a partir de un corpus de lecturas y otro de habla semiespontánea. El segundo foco, en cambio, ha estudiado el rol del paso del tiempo en los patronos utilizados por los mismos hablantes (variación intra-hablante), a partir del análisis de corpus en tiempo aparente y en tiempo real. Los resultados han demostrado que existe más variación inter-hablante que intra-hablante, que las pautas entonativas no varían muy poco a lo largo del tiempo y que, por tanto, se pueden identificar los hablantes a partir del análisis de las variables estudiadas, ya que estos mantienen unos patronos respecto de la entonación y de la alineación tonal similares a lo largo de los años.
Por otro lado, la tesis doctoral de Montserrat Forcadell (defendida el 20 de diciembre de 2007): Information packaging, language contact and linguistic change: structural calque in Catalan. Esta tesis estudia una innovación estructural de tipo prosódico detectada en el catalán oral actual. Este trabajo se enmarca en los estudios sobre embalaje informativo y variación lingüística. La estructura analizada es la de (a) “Hauríem de PASSAR d’això”, en contraste con la de (b) “N’hauríem de PASSAR, d’això”. Mientras (b) presenta la variante sintáctica estándar (la dislocación), (a) presenta la variante prosódica y no estándar (la desacentuación dentro del núcleo oracional del elemento temático) para una misma función: la expresión de la partición tema-rema. Se demuestra que el fenómeno (tipificado como calco estructural según la propuesta también hecha en la tesis) esta progresando ya que la presencia de (a) ha aumentado a lo largo de los dos periodos estudiados. El estudio demuestra que este fenómeno se esta extendiendo sin ser detectado por los asesores lingüísticos. La hipótesis de partida supone que el contacto con el inglés y el español, que sí que disponen de la variante (a), y la existencia de otros fenómenos entonativos no estándar puede favorecerlo. Este fenómeno constituye una variable pragmática de contacto de lenguas, con implicaciones prosódicas y sintácticas que podría constituir – se trata de demostrarlo – una marca identificativa de autoría y podría, por tanto, formar parte del ISI del módulo discursivo-pragmático.
También, la tesis doctoral de María Spassova (lectura prevista a finales de 2008) sobre marcas sintáctica de determinación de autoría. Los resultados del proyecto de tesis (defendido en mayo de 2006): Las marcas sintácticas de Atribución Forense de Autoría de textos escritos en español, apuntan en la dirección de las hipótesis de partida de este proyecto de investigación. El proyecto de tesis de Spassova ha implicado el estudio y el análisis de dos tipos de construcciones: unas de orden fijo, las perífrasis verbales y otras de orden libre, las secuencias de categorías morfosintácticas (MATS). Las perífrasis verbales han mostrado ser marcas identificativas, pero debido al hecho de que su uso está condicionado por la extensión del texto y el contexto concreto, han sido excluidas de la investigación adicional de la tesis. Las secuencias de categorías morfosintácticas (MATS (Morpho-syntactically Annotated Tag Sequences)), en cambio, han dado resultados muy prometedores en el experimento que se llevó a cabo con el fin de determinar su valor discriminatorio con textos de 1500 palabras. A partir de los resultados que se contemplan en el experimento final se pueden avanzar las siguientes conclusiones preliminares: a) las MATS discriminan entre autores, aunque la prevalencia de algunas de estas marcas, como los tríos (trigrams), es discutible. En el futuro deberá considerarse un análisis lingüístico comparativo de cada unidad de ocurrencia relevante para la atribución correcta; b) las MATS parecen tener cierta “inmunidad” a las interferencias de la disimilitud temporal en el agrupamiento de los textos por autor, según el Análisis Discriminante Lineal llevado a cabo; c) las MATS no se muestran subordinadas en su función de marcas identificativas a la extensión de los documentos analizados. En las pruebas estadísticas realizadas las MATS agrupan los textos por autor en grupos bien separados, tanto en el subcorpus N(ovela) como en el subcorpus A(rtículo)O(pinión). En la fase actual de la investigación se ha emprendido una nueva serie de experimentos con un corpus más extenso y variado y con documentos de 500 y 300 palabras que contribuirán a confirmar o no si la eficacia discriminatoria de este tipo de marcas disminuye cuando se consideran textos cortos o de extensión similar a la de los documentos dubitados reales.
Y finalmente la tesis doctoral de Fernanda López (lectura prevista a finales de 2009) sobre las propiedades dinamicas de los parámetros fonéticos idiosincrásicos para la identifiación de hablantes del español de México. Los resultados del proyecto de tesis (defendido en mayo de 2007): El análisis de las características dinámicas de la señal de habla como posible marca para la identificación de hablantes con finalidad forense: Un estudio para el español de México indican que las 4 variables fonéticas analizadas por separado ((oclusivas sordas) + vocal /e/; (oclusivas sonoras) + vocal /e/; (nasales) + vocal /e/; (fricativa /s/) + vocal /e/)) resultan significativas estadísticamente y por lo tanto permiten diferenciar distintas poblaciones. Con todo, el nivel de clasificación discriminatoria de cada variable fonética resulta distinto, siendo el de la variable fricativa /s/ el que realiza una predicción más precisa. Por otro lado, el análisis con las 4 variables fonéticas juntas es el que proporciona los datos más significativos al predecir correctamente la clasificación del 97.20 % de las muestras. Por lo tanto, esta primera experimentación demuestra que el estudiar las características dinámicas del habla arroja resultados mucho más alentadores que los obtenidos en estudios que se centran en las características estáticas.

