Desarrollo de un analizador automático de estados finitos para la lengua bribri

El bribri es una lengua de la estirpe chibchense, hablada en la actualidad por aproximadamente 7000 indígenas en el sudeste de Costa Rica; es la lengua indígena del país mejor estudiada y descrita hasta la fecha. Sin embargo, el presente proyecto constituye el primer intento de realizar una investigación aplicada sobre una lengua indígena hablada en Costa Rica en el campo de la lingüística computacional o procesamiento del lenguaje natural.

La construcción del analizador morfológico se ha realizado con la herramienta de código abierto Foma , concretamente la versión 0.9.17alpha, desarrollada por Hulden (2009). En nuestro caso, compilamos el código fuente en un sistema operativo Linux. Foma es compatible con las herramientas de Xerox (Xfst y Lexc), desarrolladas por los lingüistas computacionales Beesley R. y Kartttune L. (2003). En esencia Xfst y Foma sirven para convertir expresiones regulares en un transductor de estados finitos. Nosotros hemos utilizado Foma para desarrollar un transductor de estados finitos que funcione como un analizador morfológico de la lengua bribri.

Ejemplo de  un transductor de estado finitos

Hemos fundamentado el análisis de la morfología de la lengua bribri en las descripciones gramaticales existentes, concretamente en Constenla et al. (1998), el diccionario de Margery Peña (1982) y el reciente estudio "Morfología verbal de la lengua bribri" de Jara (2013) así como en la permanente consulta a los señores Julio Morales Campos y Franklin Morales Morales, ambos maestros del territorio de Talamanca y hablantes nativos del bribri, el cual escriben de acuerdo con el alfabeto práctico propuesto en Constenla et al. (1998).

Sistema de escritura

Es importante reseñar que ninguna de las lenguas indígenas de Costa Rica contaba originalmente con un sistema de escritura autóctono. En la década de 1970 Jack Wilson y Adolfo Constenla realizaron el primer intento de estandarización de un alfabeto para el bribri. Para ver su relación con el sistema fonológico así como la historia y los criterios empleados en la elaboración, véase Wilson (1982) y Constenla et al. (1998). El alfabeto de Constenla y Wilson usa el alfabeto del español modificado para representar los sonidos propios del bribri. Este es el estándar utilizado en los textos didácticos publicados por el Departamento de Educación Indígena del Ministerio de Educación de Costa Rica. Recientemente Flores (2010) ha realizado su adaptación a la escritura en medios informáticos mediante una aplicación que proporciona una fuente Unicode y un método de entrada desde el teclado para apilar los diferentes diacríticos, de modo que se pueda escribir en procesadores de texto y en cualquier aplicación.

Para utilizar el analizador morfológico es altamente recomendable instalar previamente en la computadora el Teclado Chibcha , para asegurar la introducción correcta de las marcas diacríticas combinables que utiliza el sistema de escritura bribri: el saltillo, código Unicode U+02BC ( ʼ ), el tono alto U+0300 ( ` ), el tono descendente U+0301 (  ́ ), el tono ascendente U+0302 (  ̂ ), la diëresis combinable U+0308 (  ̈ ) para y tanto si llevan marca de tono (ë́ ë̀ ë̂, ö́ ö̀ ö̂) como si no llevan. La marca de nasalidad implementada en el analizador es el símbolo Unicode U+0331 o acento largo inferior combinable (  ̱ ) el cual debe introducirse antes del tono. Por ejemplo, para consultar una palabra bribri como ká̱ 'tiempo, día', se escribe (1) "k" después la vocal (2) "a", después la marca de nasalidad (3) "   ̱ " y finalmente el tono descendente (4) "  ́ ".

Frase bribri o palabra (s) para ser analizada:

Análisis

Símbolos

Referencias

Beesley K. and Karttunen L (2003), "Finite state morphology" Stanford, California CSLI (Center of the Study of Language an Information).
Constenla A, Elizondo F and Pereira F (1998), "Curso básico de bribri" San José Editorial de la Universidad de Costa Rica.
Flores Solórzano S (2017), "Corpus oral pandialectal de la lengua bribri" URL http://bribri.net
Flores Solórzano S (2010), "Teclado Chibcha: Un software lingüístico para los sistemas de escritura de las lenguas bribri y cabécar", Revista de Filología y Lingüística de la Universidad de Costa Rica. Vol. 36(2), pp. 155-161.
Hulden M (2009), "Foma: a finite-state compiler and library", In Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics, pp. 29-32.
Jara C. (2013), "Morfología verbal de la lengua bribri", Estudios de Lingüistica Chibcha. Vol. 32, pp. 95-152.
Margery Peña E (1982), "Diccionario fraseológico bribri-español, español-bribri" San José Editorial Universidad de Costa Rica.
Wilson JL (1982), "El alfabeto bribri", En Diccionario fraseológico bribri-español, español-bribri, pp. 15-24.

Analizador morfológico bribri

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.