CLG8 2008 - Actas clasificadas por artículos

Título	Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.
Autores y afiliación	Garrote, Marta; J.M. Guirao, y Antonio Moreno Sandoval Universidad Autónoma de Madrid Dpto. de Lingüística, Laboratorio de Lingüística Informática Campus de Cantoblanco, 28049-Madrid marta@maria.lllf.uam.es
Resumen	Presentamos en este artículo una extensión del método propuesto en Guirao et al. (2006). Nuestro corpus está compuesto por transcripciones de grabaciones de lengua oral, en las que se incluyen cabeceras con información sociolingüística sobre los participantes. Se utiliza un programa para asociar cada palabra del texto con el hablante y sus características sociolingüísticas. De esta forma, se generan subcorpus para la variable edad. En este experimento se contrasta la lengua entre adultos y niños. Se aplica el test de ratio de verosimilitud (Dunning 1993) para identificar las distintas palabras y lemas en un corpus dado. Esta técnica estadística asume una distribución binomial, que resulta más apropiada para unidades distintivas y características. En otras palabras, detecta no las palabras más frecuentes usadas por los niños de una determinada edad, sino las palabras que ese grupo utiliza de forma más específica y que en el resto de grupos no aparecen. Los resultados, aunque claramente insuficientes y probablemente parciales, proporcionan una nueva perspectiva a los estudios empíricos sobre variación léxica, combinando el trabajo en corpus orales con herramientas computacionales para el análisis de datos.
Palabras clave	corpus de lengua oral infantil, test de ratio de verosimilitud (Dunning 1993)
Artículo completo	Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.

Título

Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.

Autores y afiliación

Garrote, Marta; J.M. Guirao, y Antonio Moreno Sandoval

Universidad Autónoma de Madrid
Dpto. de Lingüística, Laboratorio de Lingüística Informática
Campus de Cantoblanco, 28049-Madrid

marta@maria.lllf.uam.es

Resumen

Presentamos en este artículo una extensión del método propuesto en Guirao et al. (2006). Nuestro corpus está compuesto por transcripciones de grabaciones de lengua oral, en las que se incluyen cabeceras con información sociolingüística sobre los participantes. Se utiliza un programa para asociar cada palabra del texto con el hablante y sus características sociolingüísticas. De esta forma, se generan subcorpus para la variable edad. En este experimento se contrasta la lengua entre adultos y niños.
Se aplica el test de ratio de verosimilitud (Dunning 1993) para identificar las distintas palabras y lemas en un corpus dado. Esta técnica estadística asume una distribución binomial, que resulta más apropiada para unidades distintivas y características. En otras palabras, detecta no las palabras más frecuentes usadas por los niños de una determinada edad, sino las palabras que ese grupo utiliza de forma más específica y que en el resto de grupos no aparecen.
Los resultados, aunque claramente insuficientes y probablemente parciales, proporcionan una nueva perspectiva a los estudios empíricos sobre variación léxica, combinando el trabajo en corpus orales con herramientas computacionales para el análisis de datos.

Palabras clave

corpus de lengua oral infantil, test de ratio de verosimilitud (Dunning 1993)

Artículo completo

Extracción de unidades distintivas en adultos y niños de un corpus de lengua oral espontánea.