Resumen:

 

Título Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.
Autores y afiliación Garrote, Marta; J.M. Guirao, y Antonio Moreno Sandoval

Universidad Autónoma de Madrid
Dpto. de Lingüística, Laboratorio de Lingüística Informática
Campus de Cantoblanco, 28049-Madrid

marta@maria.lllf.uam.es
Resumen Presentamos en este artículo una extensión del método propuesto en Guirao et al. (2006). Nuestro corpus está compuesto por transcripciones de grabaciones de lengua oral, en las que se incluyen cabeceras con información sociolingüística sobre los participantes. Se utiliza un programa para asociar cada palabra del texto con el hablante y sus características sociolingüísticas. De esta forma, se generan subcorpus para la variable edad. En este experimento se contrasta la lengua entre adultos y niños.
Se aplica el test de ratio de verosimilitud (Dunning 1993) para identificar las distintas palabras y lemas en un corpus dado. Esta técnica estadística asume una distribución binomial, que resulta más apropiada para unidades distintivas y características. En otras palabras, detecta no las palabras más frecuentes usadas por los niños de una determinada edad, sino las palabras que ese grupo utiliza de forma más específica y que en el resto de grupos no aparecen.
Los resultados, aunque claramente insuficientes y probablemente parciales, proporcionan una nueva perspectiva a los estudios empíricos sobre variación léxica, combinando el trabajo en corpus orales con herramientas computacionales para el análisis de datos.
Palabras clave corpus de lengua oral infantil, test de ratio de verosimilitud (Dunning 1993)
Artículo completo Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.