Main

Laboratorio de Lingüística Informática

EL ANALIZADOR MORFOLÓGICO DE VERBOS ÁRABES JABALÍN


El analizador morfológico Jabalín es una aplicación para generar y analizar verbos en árabe culto moderno y secundariamente árabe clásico. El sistema ha sido creado por Alicia González Martínez (lingüista) y Susana López Hervás (ingeniera informática), bajo la supervisión del Dr Antonio Moreno Sandoval, en 2012.

Jabalín es principalmente una aplicación para generar verbos en árabe culto moderno. El sistema de generación ha sido implementado en el lenguaje python, versión 3. El sistema incluye un lexicón de 15.452 lemas verbales, que es usado como entrada para el generador. El programa genera todos los verbos como morfológicamente regulares a partir de la raíz verbal. Las irregularidades son consideradas alteraciones que afectan al nivel superficial de la forma, y como tales son tratadas en un estadío posterior del proceso de generación. El sistema clasifica todos los verbos en sólo dos clases conjugacionales.

La salida del programa es un lexicón de 1.684.268 formas verbales con su correspondiente información morfológica. 749.051 de estas formas, lo que constituye el 44% del lexicón, han sido evaluadas para validar el correcto funcionamiento del proceso de generación. Para la evaluación, hemos usado el lexicón del analizador morfológico ElixirFM (Smrž 2012), que consideramos nuestro gold standard. El procedimiento para realizar la evaluación consistió en comparar cada forma verbal de Jabalín contra su correspondiente equivalente en el ElixirFM, y comprobar si ambas formas coincidían o no. Las formas idénticas son consideradas formas generadas correctamente. Los resultados de la evaluación pueden verse en la tabla siguiente.



Nº formas % del total % del total de formas evaluables
Correctas 745,436 44,26% 99.52%
Incorrectas 3,615 0.21% 0.48%
Sin datos 935,217 55.53% -
Total 1,684,268 - -



INTERFAZ ONLINE DEL ANALIZADOR JABALÍN


El sistema de generación implementado en python está disposible bajo licencia GPL-GNU:

DESCARGAR EL CÓDIGO FUENTE DE JABALÍN EN github.com

DESCARGAR EL CÓDIGO FUENTE DE JABALÍN EN sourceforge.net


El proyecto Jabalín incluye componentes adicionales:

Sistema de trasliteración Jabalín

Datos cuantitativos extraídos de los lexicones



PUBLICACIONES RELEVANTES