Director de Plataforma de Mayo Clinic Opina que la Anonimización de Datos Reduce su Utilidad para la Industria Farmacéutica y Terceros

Maneesh Goyal, director de operaciones de Mayo Clinic Platform, es un firme defensor de la privacidad del paciente, pero no de la manera en que comúnmente se ha representado en el ámbito sanitario: los datos desidentificados según el método HIPAA Safe Harbor.

“Muchas organizaciones toman los datos del paciente y los desidentifican; una vez hecho esto, ya no se consideran datos HIPAA,” comentó Goyal en una reciente entrevista. “Nos parece un enfoque interesante, pero insuficiente para proteger la información del paciente porque, especialmente con la creciente capacidad de cómputo, en realidad se podrían llegar a identificar.”

En dicha entrevista, explicó el enfoque que adopta Mayo Clinic Platform para proteger la privacidad dentro del contexto más amplio de su plataforma Orchestrate. Se trata de una plataforma de datos que permite a empresas biofarmacéuticas y de tecnología médica aprovechar los ricos datos de Mayo Clinic Platform, combinándolos con investigación de alta calidad y experiencia en laboratorios centrales, acelerando así su propio descubrimiento de fármacos e impulsando programas de desarrollo clínico. El 11 de febrero, el sistema de salud con sede en Rochester, Minnesota, anunció que la plataforma Orchestrate permitirá ahora a los investigadores acceder a datos oncológicos estandarizados y del mundo real procedentes de Mayo Clinic y de los socios participantes de Mayo Clinic Platform Connect.

Entonces, ¿cómo garantiza Mayo Clinic la privacidad de los pacientes, especialmente dado que estos datos se ponen a disposición de usuarios externos como empresas farmacéuticas y de tecnología médica? ¿Y por qué es importante hacerlo de esta manera?

“Nuestro enfoque de la desidentificación no consiste solo en eliminar todos los elementos que serían identificadores, sino en cambiarlos realmente,” afirmó, poniendo como ejemplo su propio historial médico. “Nuestras herramientas intervienen y lo reemplazan con una persona ficticia, pero dejan las notas clínicas. Luego aplicamos un desplazamiento de fechas, un cambio aleatorio en todas las fechas del registro clínico. Así, si por desgracia yo sufriera un accidente automovilístico en una fecha concreta, y esa información fuera pública, ahora se alejaría de esa fecha. Y por tanto, yo ya no sería identificable.”

LEAR  Agosto abrasador en España cederá frente a un final más fresco de lo previsto para la mayoría de las regiones.

Mayo Clinic cuenta con aproximadamente 100 petabytes de datos estructurados y no estructurados de historiales electrónicos, de los cuales unos 28 petabytes han sido desidentificados, señaló Goyal. Los datos no estructurados de las notas clínicas son importantes porque explican la razon del profesional sanitario tras, por ejemplo, un diagnóstico u otra decisión. Todos esos datos desidentificados se alojan en un “contenedor en la nube”.

“Creamos un contenedor y esos datos nunca salen de él, y esto ha superado la prueba del sistema regulatorio estadounidense,” explicó Goyal, añadiendo que también cumple en entornos regulatorios extranjeros. “Así que cuando proporcionamos acceso, lo hacemos en un entorno de pruebas dentro de nuestro ambiente controlado. No es visible ningún historial de paciente individual. Verificamos todo lo que sale del sistema. Por lo tanto, los datos nunca salen de nuestro control.”

Esto se conoce como entorno de sala limpia, dijo Goyal. Otro término popular para un proceso de acceso a datos que preserva la privacidad es el “aprendizaje federado”, y en Mayo Clinic, esto se aplica a los socios del sistema de salud que se han unido a la Plataforma, como el Hospital Israelita Albert Einstein en Brasil.

“El aprendizaje federado consiste básicamente en enviar la pregunta a todos estos conjuntos de datos diferentes y luego recibir la respuesta agregada. Pero cada uno de esos entornos debe soportar este contenedor cerrado, y nadie tiene acceso al área central donde se encuentra toda la información,” afirmó Goyal.

Esto permite a las compañías farmacéuticas ejecutar trabajos de cómputo, entrenar modelos de IA o simplemente consultar para comprender mejor la enfermedad objetivo. Por ejemplo, pueden plantear preguntas como: “encontrar la evolución de la enfermedad X desde el nacimiento hasta la muerte de todos los pacientes que cumplen los criterios Y. ¿Qué comorbilidades adicionales se observaron en esta población?” O, por separado, preguntar: “¿cómo se comportó este fármaco en diabéticos frente a no diabéticos?”

LEAR  Sedes del PGA Championship para la próxima década desveladas: Bethpage Black y Oak Hill a la cabeza.

También son posibles otras acciones, y esto toca el núcleo del desperdicio de recursos en el desarrollo clínico. Los ensayos clínicos deben ser replicables, y en el pasado, había que ejecutarlos para saber si lo eran. En muchos casos, fracasaban o no eran replicables por diversas razones, como un tamaño muestral incorrecto o un diseño defectuoso del ensayo. Las farmacéuticas solo lo descubrían más tarde, tras invertir tiempo, esfuerzo y dinero.

Ahora, con Mayo Clinic Orchestrate, las empresas farmacéuticas pueden crear versiones sintéticas de ensayos clínicos para ver si los resultados son replicables en, digamos, una población de pacientes mucho más amplia.

“Una forma en que nuestros socios farmacéuticos utilizan esto es para validar su hipótesis de ensayo,” dijo. “Nuestro enfoque es usar datos reales de personas reales y reunir la mayor cantidad posible en un único repositorio, para que puedas ejecutar un ensayo sintético sobre datos reales. Puedes preguntarte: ‘¿va a funcionar esto? ¿Tenemos suficientes pacientes en una gran población para ejecutar el ensayo como lo he imaginado?’”

Pero no se trata simplemente de consultar datos, entrenar un modelo de IA o validar una hipótesis. Goyal explicó que Orchestrate consiste en integrar un proceso de I+D fragmentado en una única plataforma integral. Por ejemplo, si una farmacéutica quiere realizar un ensayo sobre enfermedad inflamatoria intestinal y acude a Mayo Clinic para reclutar pacientes, el proceso con Orchestrate se desarrollaría más o menos así.

“Identifican un conjunto de pacientes. Podemos hacer esto con nuestros datos desidentificados. Asignamos un especialista en EII de Mayo Clinic, desarrollamos una cohorte de pacientes, luego realizamos una revisión ética (IRB) y los reclutamos rápidamente para realizar una recolección adicional de muestras de tejido,” describió Goyal. “La potencia de esto radica en tomar esa muestra de tejido dentro de nuestra propia infraestructura, realizar todos los perfiles (genético, proteómico, epigenético, patológico), cotejar eso con los datos longitudinales del paciente para reintegrarlo al historial clínico de forma identificada, y luego entregárselo a nuestros socios farmacéuticos diciendo: es su campo de juego para innovar e identificar los objetivos que serán relevantes para su afección.”

LEAR  La Higiene de Manos Salva Vidas: ¿Por Qué el 40% de los Centros de Salud Siguen Faltando?

El acceso al programa Orchestra se basa en suscripción, afirmó.

Foto: ClaudioVentrella, Getty Images

Deja un comentario