El mismo modelo que predice el Mundial también lee tus TAC
Por Miguel Angarita, radiólogo e implementador de IA clínica
DataCamp acaba de lanzar una competencia que me detuvo en seco: predecir cada partido del Mundial 2026 — marcador exacto, córners, tarjetas — usando machine learning. El premio es una camiseta oficial y una suscripción a Claude. El reto real, según ellos mismos, es que ni con IA puedes lograr un puntaje perfecto. Demasiadas variables. Demasiado caos.
Eso me sonó exactamente igual a lo que pasa en radiología todos los días.
Lo que pide la competencia
El torneo se expande este año a 48 equipos con 104 partidos. La competencia pide predecir resultados desde la fase de grupos hasta la final, con un sistema de puntos que premia la precisión: un marcador exacto otorga el máximo de puntos, mientras las predicciones cercanas aún suman algo. Los partidos en rondas posteriores tienen multiplicadores de hasta ×16 para la final.
El modelo que gane no solo acertará más partidos — sabrá cuánta incertidumbre hay en cada predicción y la gestionará bien.
El paralelo que nadie está haciendo
Cuando un modelo de datos predice el marcador Brasil vs. Argentina, está procesando esto:
- Historial de enfrentamientos directos
- Rendimiento reciente de cada equipo
- Lesiones, formaciones, sede del partido
- Variables contextuales (cansancio, fase del torneo)
Cuando un modelo de IA en radiología analiza una tomografía de tórax, está procesando esto:
- Historial de imágenes previas del paciente
- Características actuales del nódulo (tamaño, densidad, bordes)
- Variables clínicas (edad, tabaquismo, laboratorios)
- Contexto institucional (equipo, protocolo, operador)
La arquitectura es la misma. La lógica es la misma. Lo que cambia es el dominio.
Ambos son problemas de predicción con datos incompletos, ruido inherente y consecuencias reales si el modelo falla.
Lo que el fútbol le enseña a la medicina
En el fútbol nadie espera que el modelo acierte el 100%. Un modelo que predice bien el 60-65% de los partidos ya es extraordinario — y todos lo saben. Por eso el sistema de puntos da crédito parcial: predecir 2-1 cuando salió 2-0 sigue valiendo algo.
En medicina hacemos lo contrario: exigimos certeza o sospechamos del modelo.
Eso es un error de calibración, no un problema de la IA.
Los mejores sistemas de IA clínica que conozco funcionan como el sistema de puntos del Mundial: no dicen "hay cáncer" o "no hay cáncer". Dicen "probabilidad 78%, hallazgos compatibles con malignidad de bajo grado, recomiendo correlación con PET". Eso es un modelo honesto con su propia incertidumbre.
Los datos que alimentan cada sistema
| Fútbol (DataCamp) | Radiología (IA clínica) |
|---|---|
| Historial de partidos | Estudios previos del paciente |
| Estadísticas del equipo | Base de datos de casos similares |
| Contexto del torneo | Protocolo institucional |
| Variables del partido (árbitro, sede) | Variables técnicas (kV, mAs, contraste) |
| Predicción: marcador + eventos | Predicción: diagnóstico + severidad |
Los modelos de fútbol se entrenan con décadas de partidos internacionales. Los modelos de imágenes médicas se entrenan con millones de estudios anotados. En los dos casos, la calidad del etiquetado de los datos históricos determina el techo del modelo.
Un dataset de partidos con estadísticas mal registradas produce predicciones malas. Un dataset de imágenes con diagnósticos inconsistentes entre radiólogos produce modelos que replican esa inconsistencia.
Lo que los radiólogos podemos aprender de esto
Tres cosas concretas que la competencia de DataCamp me deja:
1. Predecir no es adivinar. El concursante que gane no adivinó — construyó un modelo con variables relevantes, limpió sus datos y entendió qué factores realmente importan. En radiología hacemos lo mismo cuando integramos IA: el modelo no adivina, calcula.
2. La incertidumbre es información, no fracaso. El sistema de puntos premia las predicciones cercanas porque reconoce que la realidad es compleja. Un modelo de IA que dice "probabilidad 62%" no está fallando — está siendo honesto. Un modelo que siempre dice 0% o 100% debería preocuparnos más.
3. Los multiplicadores de ronda importan. En el Mundial, equivocarse en la final cuesta 16 veces más que en la fase de grupos. En radiología, el equivalente es el contexto clínico: equivocarse en un paciente inmunocomprometido con fiebre no es lo mismo que en un control rutinario. Los buenos sistemas de IA clínica saben ponderar el costo del error según el contexto.

Por qué esto me importa como médico latinoamericano
La competencia de DataCamp tiene un detalle que me pareció simbólico: el premio incluye una suscripción a Claude Enterprise. Es decir, la plataforma de data science más grande del mundo está usando el Mundial para enseñarle a sus usuarios cómo funcionan los modelos predictivos — y lo hace con algo que todo el mundo entiende: fútbol.
Eso es exactamente lo que necesitamos hacer en medicina. No esperar que los médicos latinoamericanos aprendan machine learning desde cero. Mostrarles que ya entienden la lógica — porque la usan cada vez que interpretan una probabilidad pre-test, ajustan un diagnóstico diferencial o pesan la evidencia de un estudio.
La IA no es una caja negra mágica. Es un modelo de predicción entrenado con datos históricos que opera en condiciones de incertidumbre.
Como un buen analista del Mundial — pero con consecuencias que importan más que el marcador.
Datacamp link del concurso: https://www.datacamp.com/competitions/world-cup-prediction?src=data-ai-world-cup
Miguel Angarita es radiólogo, implementador de IA clínica en Colombia y Centroamérica, y fundador de AngaritaRad, programa de entrenamiento en agentes de IA para médicos latinoamericanos.