La próxima actuación de la inteligencia artificial: Nuevos medicamentos.

Traer una nueva droga al mercado es sorprendentemente ineficiente: Aproximadamente el 90% de las nuevas drogas fallan en ensayos clínicos, los tiempos de desarrollo son de 10-15 años y los costos pueden superar los $2 billones de dólares. Es difícil pensar en un esfuerzo que necesite más impulso de la IA, y la industria tecnológica, entusiasmada por los avances recientes, está sumergiéndose en ella.

Pero, ¿lo que nos trajo hasta aquí nos llevará allí?

La historia nos enseña que la ecuación correcta en el momento correcto puede cambiarlo todo. La E=mc2 de Einstein ayudó a iniciar la era nuclear. Las redes neuronales, con suficiente capacidad de cómputo y datos de entrenamiento, encendieron la explosión actual de la IA. Y a finales de los años 90, cuando era difícil encontrar algo en la web, Sergey Brin y Larry Page inventaron el algoritmo PageRank que convirtió a Google (ahora Alphabet) en una de las compañías más valiosas del mundo.

PageRank y otros algoritmos de “centralidad” pueden no haber terminado de transformar el mundo aún. De hecho, pueden ser la clave para el próximo avance en el descubrimiento de medicamentos impulsado por la IA.

Cuando se aplican a sitios web, los algoritmos de centralidad identifican qué páginas están más enlazadas y, por lo tanto, son más relevantes para una consulta. Cuando se aplican a datos biomédicos, pueden identificar las respuestas más enlazadas a preguntas científicas, destacando qué hallazgos tienen el mayor respaldo experimental. Es crucial destacar que los algoritmos de centralidad pueden aplicarse a datos relativamente crudos, incluidos los enormes conjuntos de datos generados por enfoques modernos de alto rendimiento, por lo que pueden conectar puntos que nunca antes se habían conectado, entre datos dispersos en innumerables bases de datos y otras fuentes de datos. Nuevas conexiones pueden significar descubrimientos novedosos. Y los sistemas de IA multiagente están revolucionando estas capacidades aún más que en el pasado.

LEAR  SEAG 2025 probable próxima participación de Yulo

Mucho datos, muy pocas ideas

Por diseño, las publicaciones científicas cuentan historias, y solo unas pocas historias pueden caber en cada artículo. Por lo tanto, los estudios modernos, con sus enormes conjuntos de datos acompañantes, dejan miles o incluso millones de historias sin contar. Cuando se combinan con otros estudios, el número de historias no contadas aumenta, tal vez exponencialmente.

Esto es a la vez una tragedia y una gran oportunidad. Algunas de estas historias pueden ser nuevas estrategias para curar el cáncer, o enfermedades raras, o para contrarrestar importantes amenazas para la salud pública. Y las estamos perdiendo simplemente porque no podemos usar los datos que ya están en nuestras manos virtuales.

Un cálculo rápido da una idea de la cantidad de datos de la que estamos hablando: Una encuesta de 2022 encontró aproximadamente 6,000 bases de datos biológicas públicas disponibles. Una de estas bases de datos, el Gene Expression Ominibus (GEO), un repositorio público alojado por el NCBI, actualmente contiene cerca de 8 millones de muestras. Si asumimos que cada muestra tiene alrededor de 10,000 mediciones (la mitad de los 20,000 o más genes en el genoma humano) obtenemos alrededor de 80 mil millones de mediciones. Multiplicando por 6,000 bases de datos llegamos a alrededor de 500 billones de puntos de datos en total. Eso sin contar las bases de datos de química, fuentes de datos propietarias o los conjuntos de datos a gran escala que no se han depositado en bases de datos centrales. Sea cual sea el número real, no hay duda de que es grande y está creciendo rápidamente.

LEAR  Los hospitales están adoptando inteligencia artificial - ¿Pero pueden medir y escalar estas herramientas?

La oportunidad

La utilización efectiva de un tesoro tan vasto de datos podría impulsar drásticamente la capacidad de los enfoques de IA para ofrecer avances biomédicos significativos. Por ejemplo, combinando algoritmos de centralidad con un constructo llamado “grafo focal”, los agentes de IA pueden aprovechar realmente estos datos para ofrecer hallazgos respaldados experimentalmente de fuentes rastreables. Además, cuando se combinan con modelos de lenguaje grandes (LLM) como ChatGPT de OpenAI o Claude de Anthropic, los enfoques basados en grafos focales pueden funcionar de manera autónoma, generando ideas sobre los impulsores de enfermedades y potencialmente revelando nuevas formas de tratarlas. En este momento de impresionante progreso en IA, se habla mucho sobre un deslizamiento desde el “Pico de Expectativas Infladas” hacia la “Caída de la Desilusión” del ciclo de hype de Gartner. Tales afirmaciones son comprensibles, pero casi seguramente prematuras. De hecho, podríamos estar en vísperas del próximo avance: una nueva combinación de algoritmos “antiguos” que promete acelerar radicalmente el descubrimiento y desarrollo de nuevos medicamentos. Un avance así es muy necesario y, al utilizar toda la gama de herramientas y datos disponibles, finalmente puede estar al alcance.