Laboratorio de Lingüística Informática
GRAMPAL fue desarrollado en origen como un procesador morfológico del español para la lengua escrita (Moreno 1991, Moreno y Goñi 1995). Más tarde, con la necesidad de anotar el corpus de lengua oral C-ORAL-ROM, fueron creados nuevos módulos: un tokenizador, módulos de desambiguación y un reconocedor de palabras desconocidas (Moreno y Guirao 2003). Dichos módulos se crearon para el español, con la intención de adaptar el procesador morfológico a las características propias de la lengua oral. La base de datos léxica de GRAMPAL cuenta con unas 50.000 entradas entre raíces, sufijos y multipalabras. Todas las entradas de diccionario, esto es, exceptuando a los morfemas dependientes y a las multipalabras, poseen información morfológica y categorial, incluyendo sus respectivos lemas. Además, GRAMPAL cuenta con 239 prefijos que forman nuevas palabras sin que se produzca un cambio de categoría.