Laboratorio de Lingüística Informática
El proyecto Jabalín incluye la creación de un sistema de transliteración para representar los caracteres árabes a partir de caracteres del alfabeto latino. Una transliteración es una equivalencia unícova entre los caractéres de una lengua con un conjunto de símbolos tomados de otro sistema de escritura. En el campo del procesamiento del árabe, el sistema de transliteración de Buckwalter ha recibido una amplia aceptación en los últimos años. Esta transliteración tiene la ventaja de poderse utilizar en todo tipo de software, pues contiene sólo caracteres ascii. Sin embargo, también hace uso de símbolos no alfabéticos, y su lectura puede resultar muy poco transparente, incluso para los expertos en árabe. Debido a esto, hemos creado un sistema de transliteración para el árabe que respete al máximo los principios de portabilidad y legibilidad.
Árabe | Nombre de la letra | Buckwalter | Jabalín | Unicode carácter Jabalín |
ء | hamza aislada | ' | c | 0x621 |
آ | alif mamduda | | | Ã | 0x622 |
أ | hamza sobre alif | > | Á | 0x623 |
ؤ | hamza sobre waw | & | ú | 0x624 |
إ | hamza bajo alif | < | À | 0x625 |
ئ | hamza sobre ya | } | ý | 0x626 |
ا | alif | A | A | 0x627 |
ب | ba | b | b | 0x628 |
ة | ta marbuta | p | ä | 0x629 |
ت | ta | t | t | 0x62a |
ث | tha | v | þ | 0x62b |
ج | jim | j | j | 0x62c |
ح | Ha | H | H | 0x62d |
خ | kha | x | x | 0x62e |
د | dal | d | d | 0x62f |
ذ | dhal | * | ð | 0x630 |
ر | ra | r | r | 0x631 |
ز | zay | z | z | 0x632 |
س | sin | s | s | 0x633 |
ش | shin | $ | X | 0x634 |
ص | Sad | S | S | 0x635 |
ض | DaD | D | D | 0x636 |
ط | Ta | T | T | 0x637 |
ظ | Dha | Z | Z | 0x638 |
ع | 'ayn | E | ç | 0x639 |
غ | gayn | g | g | 0x63a |
ف | fa | f | f | 0x641 |
ق | qaf | q | q | 0x642 |
ك | kaf | k | k | 0x643 |
ل | lam | l | l | 0x644 |
م | mim | m | m | 0x645 |
ن | nun | n | n | 0x646 |
ه | ha | h | h | 0x647 |
و | waw | w | w | 0x648 |
ى | alif maqsura | Y | Y | 0x649 |
ي | ya | y | y | 0x64a |
َ | fatha | a | a | 0x64e |
ُ | damma | u | u | 0x64f |
ِ | kasra | i | i | 0x650 |
ً | doble fatha | F | â | 0x64b |
ٌ | doble damma | N | û | 0x64c |
ٍ | doble kasra | K | î | 0x64d |
ّ | shadda | ~ | ~ | 0x651 |
ْ | sukun | o | · | 0x652 |
ـ | tatweel o kashida | _ | ¯ | 0x640 |