Main

Laboratorio de Lingüística Informática

Recursos lingüísticos

Tabla comparativa de los corpus del LLI-UAM


RECURSO
TIPO
USO
CARACTERÍSTICAS

CORLEC

Corpus Oral de Referencia de la Lengua Española Contemporánea
Corpus
Libre
Base de datos textual (corpus de lengua oral): 1.100.000 de palabras transliteradas en soporte informático.

Corpus de Referencia de la Lengua Española en la Argentina
Corpus
Libre
Base de datos textual (corpus de lengua escrita): más de 2.000.000 de palabras

Corpus de Referencia de la Lengua Española en Chile
Corpus
Libre
Base de datos textual (corpus de lengua escrita): 2.000.000 de palabras

Spanish Treebank Corpus
Corpus
Libre
1.500 oraciones extraídas de periódicos y anotadas sintácticamente
C-ORAL-ROM
Corpus
Restringido
Corpus oral multilingüe español-francés-portugués-italiano con 300.000 palabras en cada lengua
CHIEDE

Corpus de Habla Infantil Espontánea del Español
Corpus
Libre
Corpus oral de lenguaje infantil con alrededor de 60.000 palabras
GRAMPAL
Programa
Restringido
Etiquetador morfosintáctico.
Corpus Árabe-Español
Corpus
Libre
Corpus paralelo árabe-español con 1179 oraciones
Diccionario Español-Francés
Diccionario
Libre
Diccionario de dificultades de uso de las preposiciones en el idioma francés
JAPONÉS
Corpus y diccionario
Restringido
Corpus oral del japonés de unas 50.000 palabras y diccionario de las 800 palabras básicas del japonés con sonido.
Corpus MAVIR
Corpus
Restringido
Corpus oral en el que se recopilan las conferencias de las Jornadas MAVIR.
Base de datos acústica de preguntas
Base de datos
Restringido
Colección de preguntas orales recopilada a partir de la participación en el CLEF
Analizador morfológico de árabe
Programa
Libre
Demo



Main Main