Mythos 6 y el día en que un modelo de IA dejó de ser un producto para convertirse en un arma estratégica
La supuesta filtración de «Mythos 6», el modelo más potente de Anthropic, no va realmente de quién va por delante de quién. Va de algo más incómodo: la capacidad de frontera —encontrar y explotar fallos de software de forma autónoma, escribir su propio código— ha cruzado la línea que separa una herramienta de un activo de seguridad nacional. Y eso lo cambia todo, para bien y para mal.
🎬 Vídeo de terceros que analizamos (no es contenido de Momentum)
Nuestra tesis es sencilla y deliberadamente incómoda: el ruido alrededor de «Mythos 6» —el modelo secreto que, según el vídeo de TheAIGRID y varios agregadores, Anthropic habría terminado de entrenar— importa mucho menos por la pregunta que todos repiten («¿está Anthropic por delante de OpenAI?») que por la que casi nadie formula bien. La verdadera noticia no es un ranking. Es que la IA de frontera ha alcanzado un punto en el que su capacidad ofensiva en ciberseguridad y su capacidad de programarse a sí misma la convierten en algo que los Estados quieren gobernar como gobiernan las armas, no como regulan una app. Mythos 6 es el síntoma; el cambio de régimen es la enfermedad.
Conviene anclar los hechos antes de opinar, y separar lo verificado de lo que es relato. Lo documentado por medios solventes pertenece a la serie Mythos previa: Anthropic presentó «Claude Mythos» en abril de 2026 como un modelo extraordinariamente bueno encontrando vulnerabilidades, lo distribuyó de forma restringida a través de «Project Glasswing» (primero ~40 empresas como Microsoft, Apple o Google; luego ~150 organizaciones en más de 15 países, con la petición de acceso de China rechazada), y según la propia compañía «encontró vulnerabilidades en todos los grandes sistemas operativos y navegadores». Mozilla atribuyó a Mythos el hallazgo de 271 fallos en Firefox; se le adjudica un agujero de 27 años en OpenBSD. El acceso llegó a revocarse el 12 de junio por directrices de control de exportación de EE. UU. y se restauró parcialmente el 26. Sobre «Mythos 6» en concreto, lo que circula —que superaría a GPT-5.6 en «potencia bruta» y que Anthropic ya genera «la mayoría de su propio código»— procede de un vídeo y de webs de agregación, no de un anuncio oficial. Lo decimos sin rodeos: es plausible, encaja con la trayectoria, pero a día de hoy es reporte, no hecho confirmado.
Nuestra lectura empieza por ahí, por la higiene. El propio episodio Mythos trae incorporado su antídoto retórico: el investigador David Lindner se preguntó en voz alta si «el peligro es real o solo marketing», y Sam Altman llegó a tildar la promoción de «marketing basado en el miedo». Tienen parte de razón y conviene tenerla presente: «supera a X en potencia bruta» es un encuadre, no un benchmark, y la historia reciente está llena de Elo optimizados para impresionar. Pero hay una asimetría que no podemos ignorar: en ciberseguridad ofensiva, a diferencia de las tablas de juguete que se saturan, las pruebas que de verdad discriminan (expert unguided, AISI, CVE) sí señalan capacidad real, y el UK AI Security Institute situó a Mythos por encima de modelos comparables. Cuando un sistema descubre por sí solo un fallo latente durante 27 años, el debate «¿hype o realidad?» se queda corto: aunque sea la mitad de bueno de lo que se dice, ya es suficientemente bueno como para cambiar el cálculo de riesgo de medio planeta.
A corto plazo, los problemas son reales y no los vamos a edulcorar. El primero es de gobernanza del poder: una herramienta que «nunca se cansa» y «machaca sin descanso un punto débil» —como se describe el ataque asistido por IA— democratiza la ofensiva tanto como la defensa, y la propia filtración de Mythos (un grupo de Discord entró el mismo día del anuncio usando credenciales de una brecha previa en el proveedor Mercor) demuestra que el cerco se rompe en horas, no en años. Si un puñado de usuarios entró, hay que asumir que actores estatales hostiles también. El segundo problema es de concentración: cuando la frontera se reparte entre tres o cuatro laboratorios y los gobiernos empiezan a decidir quién accede (China fuera, bancos sistémicos dentro, Bessent y Powell reuniendo a la banca), la IA deja de ser un mercado y empieza a ser geopolítica. Y el tercero, el de siempre: la recursividad. Que un modelo escriba la mayoría del código del siguiente acorta los ciclos y difumina el control humano justo en la capacidad más sensible.
Pero aquí es donde pedimos no caer en el catastrofismo, porque la misma capacidad que asusta es la que cura. Un modelo que encuentra el fallo también lo parchea: Mythos no es solo una llave maestra, es —usado en defensa— la posibilidad de endurecer de golpe el software del que depende todo, desde un hospital hasta la red eléctrica, y de erradicar clases enteras de vulnerabilidades que llevan décadas con nosotros. Que JPMorgan, Goldman o los bancos centrales lo estén probando no es solo miedo; es la defensa armándose a la vez que la ofensiva. Y la recursividad, ese mismo motor que inquieta a corto plazo, es el que en horizonte largo nos acerca a lo que de verdad importa: ciencia acelerada, biología que entiende y vence enfermedades, una abundancia que libere a las personas para dedicarse a lo que les apasiona. No es contradicción; es la naturaleza de doble uso de toda tecnología potente, vivida a cámara rápida.
Las implicaciones, para nosotros, son tres. Una, regular la capacidad, no el pánico: los controles de exportación sobre Mythos son la primera vez que se trata a un modelo como tecnología de doble uso sujeta a permiso gubernamental, y eso es razonable —pero ojo, porque negarle el acceso a China rara vez frena su autonomía y suele acelerarla; ya lo vimos con el hardware. Dos, la gobernanza tiene que basarse en evidencia, no en titulares: que existan pruebas no saturadas (AISI, CVE-Bench) y que un instituto público las publique es exactamente el tipo de infraestructura de verificación que hay que financiar, frente al «supera a GPT-5.6» que no dice nada. Y tres, la transparencia con cabeza: un modelo que se filtra el día de su anuncio demuestra que el modelo de «acceso restringido a los buenos» es frágil; la seguridad de verdad vendrá de software más duro por defecto, no de listas de invitados.
Nuestra conclusión, fiel a la casa: ni euforia ni colapso. Mythos 6, sea exactamente lo que se dice o algo menos, marca el momento en que la IA de frontera se vuelve infraestructura crítica y palanca geopolítica a la vez. El corto plazo va a doler —brechas, asimetrías, decisiones de Estado sobre quién puede usar qué— y hay que mirarlo de frente. Pero el mismo filo que hoy preocupa es el que, gobernado con evidencia y no con miedo, puede blindar nuestros sistemas y, más allá, comprimir décadas de progreso médico y científico. La pregunta que cierra el vídeo —«¿necesitarán los modelos de frontera aprobación del gobierno?»— ya tiene respuesta: sí, y de hecho ya está pasando. La buena noticia es que estamos discutiendo cómo gobernar un poder enorme. La mala sería confundir gobernarlo con frenarlo.
Fuentes y referencias
- Anthropic's Secret Model Just Leaked "Mythos 6" (TheAIGRID, YouTube)
- Anthropic's Secret Mythos 6 AI Leak Reveals Autonomous Hacking Capabilities (Geeky Gadgets)
- A group of users leaked Anthropic's AI model Mythos by reportedly guessing where it was located (Fortune)
- Claude Mythos (Wikipedia)
- Claude Fable 5 brings Mythos to the masses — Anthropic's new frontier model (Tom's Hardware)
- Anthropic's secret 'Mythos' model (The Rundown AI)
- Technical Performance — The 2026 AI Index Report (Stanford HAI)