Texto en español (nivel B2, con algunos errores comunes):
Vineet Sawant ha pasado los últimos dos años recorriendo las calles de Mumbai en una moto como repartidor.
"Estar en la carretera es siempre muy estresante, especialmente en ciudades como Mumbai," dice.
Pero cuando empezó, las barreras del idioma eran un problema adicional.
Su primer idioma es el maratí y el señor Sawant habla "muy poco" inglés. "Puedo entender, pero es muy difícil leer," explica.
Eso causó problemas en su nuevo trabajo.
Dijo: "Al principio fue difícil. Todo estaba en inglés, y entiendo algo, pero me siento más cómodo en maratí. Solía pedir ayuda a otros repartidores para saber qué hacer."
Su empleador, Zepto, promete "La Entrega de Comestibles Online Más Rápida de India." Por eso, tener repartidores que no entienden las instrucciones no era idea.
Hace un año, Zepto se alió con Reverie Language Technologies para introducir un servicio de traducción por IA para sus conductores.
Desde entonces, los repartidores pueden elegir entre seis idiomas en la aplicación de Zepto.
"Ya no tengo que adivinar," dice Sawant.
"Antes tardaba más en leer y aveces cometía errores. Ahora, si el cliente escribe ‘tocar el timbre,’ recibo esa instrucción en maratí. Entonces no tengo que pregunta o volver a verificar. Todo está claro."
India tiene 22 idiomas oficiales y cientos de dialectos [Getty Images].
Las dificultades de Sawant son comunes.
"India tiene 22 idiomas oficiales y cientos de dialectos," dice el profesor Pushpak Bhattacharyya, del IIT Mumbai, uno de los principales expertos en el uso de IA en idiomas indios.
"Sin tecnología que entienda y hable estos idiomas, millones quedan excluidos de la revolución digital, especialmente en educación, gobierno, salud y banca," señala.
La llegada de nuevas IA generativas, como ChatGPT, ha hecho la tarea más urgente.
Grandes cantidades de datos, como páginas web, libros o transcripciones de videos, se usan para entrenar una IA.
En idiomas hablados ampliamente, como hindi e inglés, es relativamente fácil conseguirlos, pero para otros es más difícil.
"El principal desafío para crear modelos en idiomas indios es la disponibilidad de datos. Hablo de datos refinados. Datos de baja calidad sí hay disponibles." Texto en español (nivel B2 con algunos errores comunes):
"Pero esos datos no son de muy buena calidad, necesitan filtrado," dice el profesor Bhattacharyya.
"El problema en India es que, para muchos idiomas indios, especialmente los dialectos tribales y regionales, estos datos simplemente no existen o no están digitalizados."
Reverie Language Technologies ahora está implementando su tecnología de traducción basada en IA para varias empresas indias.
El cofundador Vivekananda Pani dice que, aunque la tecnología de traducción facilitará la comunicación, existe "el riesgo de que los dialectos menos comunes queden marginados".
"El desafío será asegurar que los increíbles beneficios de los avances en el lenguaje por IA no reduzcan accidentalmente la rica variedad de lenguas humanas."
Para ayudar a resolver el problema, el profesor Bhattacharyya ha contribuido a Bhashini, un proyecto gubernamental para desarrollar los conjuntos de datos de alta calidad necesarios para entrenar una IA.
Además de los datos, Bhashini ha construido modelos de lenguaje y servicios de traducción en 22 idiomas.
Comenzado en 2022, es un gran proyécto, pero ya ha logrado mucho progreso.
Bhashini aloja actualmente 350 modelos de lenguaje basados en IA que han procesado más de mil millones de tareas.
Más de 50 departamentos gubernamentales trabajan con Bhashini, así como 25 gobiernos estatales.
Por ejemplo, la tecnología de Bhashini se usa en chatbots multilingües para servicios públicos y para traducir esquemas gubernamentales a idiomas locales.
"Bhashini asegura la representación lingüística y cultural de India al construir modelos de IA específicos para el país en lugar de depender de plataformas globales," dice Amitabh Nag, CEO de Digital India, División Bhashini.
Él espera que, en los próximos dos o tres años, los usuarios rurales tengan acceso por voz a servicios gubernamentales, herramientas financieras y sistemas de información en sus idiomas nativos.
Investigadores indios están desarrollando una IA para ayudar a los fumadores a dejar el hábito [Getty Images]
Estos conjuntos de datos centrados en India esperanzadamente algún día darán a los desarrolladores de modelos basados en IA las herramientas para adaptarlos más fácilmente a toda la población.
Actualmente, diseñar cualquier programa de IA para procesos complejos como la salud puede ser muy desafiante.
Kshitij Jadhav, profesor asociado en el Koita Centre for Digital Health de IIT Mumbai, está trabajando en un programa de IA que ayudaría a la gente a dejar de fumar.
Explica que personas en distintas etapas del proceso necesitan consejos diferentes y usualmente requieren un profesional capacitado para esa evaluación.
Pero hay pocos especialistas disponibles, especialmente los que pueden operar en múltiples idiomas, por lo que el profesor Jadhav espera que su modelo de IA pueda llenar ese vacío.
La IA "primero identificará el tipo de conversación que la persona necesita y en base a eso formulará preguntas, mostrará empatía y emociones," dice el profesor Jadhav.
Y todo eso, con suerte, eventualmente funcionará en 22 idiomas. Los experimentos iniciales están en inglés e hindi.
"Será muy personalizado, no será algo estándar," afirma.
De vuelta en las calles de la ciudad, Vineet Sawant ha aumentado el número de paquetes que entrega de diez a unos 30 al día, ayudado en parte por la función de traducción en la app de entregas.
Él cree que ayudará a más personas como él.
"Nos hace sentir que pertenecemos. No todos entienden inglés. Cuando la app habla nuestro idioma, nos sentimos más seguros y trabajamos mejor."