Expertos buscan cerrar la brecha lingüística

La Gran Brecha Lingüística de la Inteligencia Artificial en África

Pumza Fihlani
BBC News, Johannesburg

La agricultora Kelebogile Mosime utiliza una aplicación de IA que habla su idioma.

Aunque África alberga una gran proporción de los idiomas del mundo (mucho más de un cuarto según algunas estimaciones), muchos de ellos estan ausentes en el desarrollo de la inteligencia artificial.

Esto se debe tanto a la falta de inversión como a la escasez de datos disponibles facilmente.

La mayoría de las herramientas de IA, como Chat GPT, se entrenan principalmente en inglés y otros idiomas europeos o chinos. Estos tienen enormes cantidades de texto online para aprender.

Pero como muchos idiomas africanos son mayormente hablados y no escritos, hay una falta de texto para entrenar a la IA y hacerla útil para sus hablantes. Para millones de personas en el continente, esto significa quedar excluidos.

Investigadores que intentan solucionar este problema han lanzado recientemente lo que se cree es el mayor conjunto de datos de idiomas africanos.

"Pensamos en nuestros propios idiomas, soñamos en ellos e interpretamos el mundo a través de ellos. Si la tecnología no refleja eso, un grupo entero riesgo quedar atrás", dice el Profesor Vukosi Marivathe de la Universidad de Pretoria, quien trabajó en el proyecto.

"Estamos en medio de una revolución de IA, imaginando todo lo que se puede hacer. Ahora imagina que hay una parte de la población que no tiene acceso porque toda la información está en inglés".

El proyecto "Africa Next Voices" reunió a lingüistas y científicos informáticos para crear conjuntos de datos listos para IA en 18 idiomas africanos. Esto es solo una pequeña porción de los más de 2000 idiomas que se estima se hablan en el continente, pero esperan expandirse en el futuro.

LEAR  Activistas buscan redirigir la atención del Festival de Cine de Venecia hacia la crisis en Gaza

En dos años, el equipo grabó 9000 horas de voz en Kenia, Nigeria y Sudáfrica, capturando escenarios cotidianos en agricultura, salud y educación. Los idiomas incluyeron kikuyu y dholuo en Kenia, hausa y yoruba en Nigeria, y isiZulu y tshivenda en Sudáfrica.

"Necesitas una base para empezar, y eso es Africa Next Voices. Luego la gente construirá sobre eso y agregará sus propias innovaciones", dice el Prof. Marivathe, quien lideró la investigación en Sudáfrica.

Su contraparte keniana, la lingüista computacional Lilian Wanzare, dice que grabar el habla en el continente significó crear datos que reflejen cómo la gente realmente vive y habla. "Reunimos voces de diferentes regiones, edades y origenes para que sea lo más inclusivo posible. Las grandes tecnológicas no siempre ven esos matices", afirma.

El proyecto fue posible gracias a una subvención de 2,2 millones de dólares de la Fundación Gates. Los datos serán de acceso libre, permitiendo a desarrolladores crear herramientas que traduzcan, transcriban y respondan en idiomas africanos.

Ya hay pequeños ejemplos de cómo los idiomas indígenas en IA pueden resolver desafíos de la vida real. Kelebogile Mosime gestiona una granja de 21 hectáreas en Rustenburg, Sudáfrica. Cultiva verduras con un pequeño equipo y usa una app llamada "AI-Farmer", que reconoce varios idiomas sudafricanos, para resolver problemas.

"Como alguien que aún está aprendiendo, enfrentas muchos desafíos. Diariamente, veo los beneficios de usar mi idioma materno, setswana, en la app. Pregunto cualquier cosa y obtengo una respuesta útil. Para alguien en áreas rurales como yo, es muy útil", dice sonriendo bajo su sombrero.

Lelapa AI es una joven empresa sudafricana que crea herramientas de IA en idiomas africanos para bancos y telecomunicaciones. Para su CEO, Pelonomi Moiloa, lo disponible actualmente es muy restrictivo.

LEAR  ¿Cuándo terminará el miserable clima en España? Los expertos entregan la BUENA noticia.

"El inglés es el idioma de la oportunidad. Para muchos sudafricanos que no lo hablan, no es solo un inconveniente; puede significar perderse servicios esenciales como salud, banca o incluso apoyo gubernamental. El idioma puede ser una gran barrera. Nosotros decimos que no debería serlo".

Pero esto va más allá del negocio y la conveniencia. Para el Prof. Marivathe, sin iniciativas para los idiomas africanos, también se podría perder algo más.

"El idioma es acceso a la imaginación. No son solo palabras; es historia, cultura, conocimiento. Si los idiomas indígenas no se incluyen, perdemos más que datos; perdemos formas de ver y entender el mundo".