Guillermo David Subreski Román
Un equipo de investigadores de la Universidad de Stanford, financiado por los Institutos Nacionales de Salud, ha desarrollado un modelo de IA llamado Merlin que puede interpretar tomografías computarizadas abdominales en 3D en más de 750 tareas, desde la identificación de órganos hasta la predicción de la aparición de enfermedades crónicas años antes del diagnóstico clínico. El estudio, publicado en Nature esta semana, demuestra que un único modelo de propósito general supera a herramientas especializadas diseñadas para tareas individuales
Un modelo generalista que supera a los especialistas
Merlin es un modelo fundacional de visión-lenguaje 3D entrenado con 15.331 tomografías computarizadas abdominales emparejadas con informes radiológicos y casi un millón de códigos diagnósticos de registros médicos electrónicos.
Los investigadores lo evaluaron en seis categorías amplias de actividad que abarcan 752 tareas individuales, incluyendo diagnósticos, pronósticos y evaluación de calidad.
En promedio, a lo largo de 692 códigos diagnósticos diferentes, Merlin predijo correctamente cuál de dos tomografías tenía mayor probabilidad de estar asociada con una condición particular más del 81% de las veces, superando a varios modelos competidores. Para un subconjunto de 102 códigos, su precisión alcanzó el 90%.
“Con Merlin, potencialmente se podría ir más allá de la radiología tradicional y pasar directamente de las imágenes a un posible diagnóstico. Y eso es solo un uso potencial”, dijo el coprimer autor Louis Blankemeier, quien realizó el trabajo mientras era estudiante de posgrado en Stanford.
Predicción de enfermedades antes de que aparezcan
Quizás lo más sorprendente es la capacidad de Merlin para predecir enfermedades crónicas. Cuando se le asignó la tarea de predecir si pacientes sanos desarrollarían condiciones como diabetes, osteoporosis o enfermedades cardiovasculares en un plazo de cinco años, el modelo identificó a los pacientes de mayor riesgo el 75% del tiempo, en comparación con el 68% de un modelo alternativo. Los hallazgos sugieren que Merlin puede detectar características en las imágenes que son invisibles al ojo humano, lo que potencialmente podría señalar nuevos biomarcadores para enfermedades.
Los investigadores también desafiaron a Merlin a interpretar tomografías computarizadas de tórax, una región del cuerpo completamente ausente de sus datos de entrenamiento. El modelo tuvo un desempeño igual o mejor que las herramientas entrenadas exclusivamente en imágenes de tórax, demostrando su capacidad para aprender características generalizables de las enfermedades.
Entrenado con una sola GPU
A diferencia de muchos modelos de IA de gran escala que requieren una vasta infraestructura informática, Merlin fue entrenado con una sola GPU, un detalle que el equipo destacó como evidencia de que los hospitales e instituciones de investigación podrían construir sus propios modelos fundacionales con recursos modestos. Ashwin Kumar, coprimer autor y estudiante de posgrado en Stanford, señaló que si bien algunas tareas funcionaron de inmediato, “otras tareas más complicadas, como redactar informes radiológicos desde cero o identificar y delinear órganos en un espacio 3D, requirieron entrenamiento adicional”.
Los investigadores dijeron que planean buscar aprobación regulatoria para aplicaciones más simples mientras continúan refinando Merlin para desafíos más complejos como la redacción automatizada de informes.








