Main

Laboratorio de Lingüística Informática

Recursos lingüísticos

Tabla comparativa de los corpus del LLI-UAM


CORPUS
RECURSO
USO
CARACTERÍSTICAS
CORLEC. Corpus Oral de Referencia de la Lengua Española Contemporánea
Libre

Base de datos textual (corpus de lengua oral): 1.100.000 de palabras transliteradas en soporte informático.

Corpus de Referencia de la Lengua Española en la Argentina
Libre

Base de datos textual (corpus de lengua escrita): más de 2.000.000 de palabras


Corpus de Referencia de la Lengua Española en Chile


Libre
Base de datos textual (corpus de lengua escrita): 2.000.000 de palabras

Spanish Treebank Corpus


Libre
1.500 oraciones extraídas de periódicos y anotadas sintácticamente
C-ORAL-ROM
Restringido

Corpus oral multilingüe español-francés-portugués-italiano con 300.000 palabras en cada lengua

Corpus MAVIR
Libre

Corpus oral en el que se recopilan las conferencias de las Jornadas MAVIR.

MULTIMÉDICA
Restringido

Corpus médico español, japonés y árabe de casi 8.000.000 de palabras

C-ORAL JAPÓN
Restringido

Corpus oral del japonés de unas 50.000 palabras


CHIEDE. Corpus de Habla Infantil Espontánea del Español

Libre
Corpus oral de lenguaje infantil con alrededor de 60.000 palabras
Corpus Oral de Español como Lengua Extranjera
Libre

Corpus oral de interlengua de estudiantes de español con más de 50.000 palabras.

Corpus Oral de Aprendientes de Francés
Libre

Corpus oral de interlengua de aprendientes de francés con más de 61.000 palabras.

Corpus Árabe-Español
Libre

Corpus paralelo árabe-español con 1179 oraciones

COREMAH
Libre

Corpus Español Multimodal de Actos de Habla

C-ORAL CHINA
Restringido

Corpus espontáneo chino

DIR-SI
Restringido

Corpus oral bilingüe inglés-italiano de conferencias con sus traducciones al italiano

 
HERRAMIENTAS
RECURSO
USO
CARACTERÍSTICAS
GRAMPAL
Libre online

Etiquetador morfosintáctico para el extractor.

MULTIMÉDICA
Libre online

Herramienta extractora de términos médicos.

LETRAS-WEB
Libre online

Herramienta desarrollada por Hiroto Ueda para procesamiento y estudio de corpus

NÚMEROS-WEB
Libre online

Herramienta desarrollada por Hiroto Ueda para cálculos estadísticos

Diccionario japonés
Libre online


Diccionario de las 800 palabras básicas del japonés con sonido.


JABALÍN
Libre

Analizador y generador morfológico de verbos en árabe

OJIME
Libre

Etiquetador de modalidad para el español y el japonés

Diccionario Español-Francés
Libre online

Diccionario de dificultades de uso de las preposiciones en el idioma francés

Base de datos acústica de preguntas
Restringido

Colección de preguntas orales recopilada a partir de la participación en el CLEF




Main Main