A Fondo

Anthropic lanza el Proyecto Glasswing para controlar la potencia de su propia IA en ciberataques

Publicado el

8 abril, 2026

por

Anthropic ha anunciado el Proyecto Glasswing, una iniciativa de ciberseguridad que combina un modelo de IA de vanguardia aún no lanzado -Claude Mythos Preview- con una coalición de doce importantes empresas de tecnología y finanzas. Será uno de los mayores esfuerzos de la industria en ciberseguridad, en un esfuerzo por encontrar y corregir vulnerabilidades de software en la infraestructura más crítica del mundo antes de que los adversarios puedan explotarlas.

El Proyecto Glasswing tiene motivaciones curiosas. Anthropic asegura que su modelo cibernético de IA más potente es demasiado peligroso para publicarlo y de ahí que haya cambiado el foco hacia un proyecto ambicioso y comunitario que tiene el objetivo de controlar su alcance. La iniciativa vuelve a traer al primer plano de la actualidad uno de los grandes desafíos de la industria tecnológica actual, IA y ciberseguridad, y el papel de la IA en los ciberataques, permitiendo campañas maliciosas cada vez más avanzadas, más baratas y accesibles.

Entre los socios para el lanzamiento del proyecto, se incluyen grandes organizaciones como Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. Anthropic afirma que también ha ampliado el acceso a más de 40 organizaciones adicionales que desarrollan o mantienen software crítico, y se compromete a destinar hasta 100 millones de dólares en créditos de uso para Claude Mythos Preview en toda la iniciativa, junto con 4 millones de dólares en donaciones directas a organizaciones de seguridad de código abierto.

El anuncio llega en un momento de gran impulso -y de gran escrutinio- para la startup de IA californiana. La compañía anunció el pasado fin de semana que su tasa de ingresos anualizados ha superado los 30.000 millones de dólares (frente a los 9.000 millones de dólares a finales de 2025) y que el número de clientes empresariales que gastan más de un millón de dólares al año supera ya los 1.000, duplicándose en menos de dos meses. La compañía anunció simultáneamente un acuerdo de computación multigigavatio con Google y Broadcom. Bloomberg informó de que Anthropic había fichado a un alto ejecutivo de Microsoft, Eric Boyd, para liderar la expansión de su infraestructura.

Proyecto Glasswing

La iniciativa es categóricamente distinta a un hito de ingresos o un acuerdo de computación. Es el intento más ambicioso de Anthropic por transformar las capacidades de IA de vanguardia -capacidades que como decíamos la propia compañía describe como peligrosas- en una ventaja defensiva antes de que esas mismas capacidades se extiendan a actores hostiles.

En el centro del proyecto se encuentra Claude Mythos Preview, un modelo de exploración de propósito general que, según Anthropic, ya ha identificado miles de vulnerabilidades de día cero de alta gravedad, fallos previamente desconocidos para los desarrolladores de software, en todos los principales sistemas operativos y navegadores web, junto con una variedad de otro software crítico.

Por ello la startup no pondrá el modelo a disposición del público en general. «No tenemos previsto que la versión preliminar de Claude Mythos esté disponible para el público en general debido a sus capacidades de ciberseguridad», ha declarado Newton Cheng, responsable del equipo de ciberseguridad Frontier Red Team de Anthropic, en una entrevista con VentureBeat. «Sin embargo, dado el ritmo de avance de la IA, no pasará mucho tiempo antes de que dichas capacidades se extiendan, posiblemente más allá de los actores comprometidos con su implementación segura. Las consecuencias para la economía, la seguridad pública y la seguridad nacional podrían ser graves«.

Esta declaración resulta llamativa viniendo de la empresa que creó el modelo y trae a colación las críticas de algunos analistas por la falta de control de los grandes modelos de inteligencia artificial. Anthropic argumenta, en esencia, que la herramienta que creó es lo suficientemente potente como para transformar el panorama de la ciberseguridad, y que lo único responsable es mantenerla restringida, dando a los sistemas de defensa al menos una ventaja inicial.

Los resultados técnicos refuerzan esta afirmación. Según el comunicado de prensa, Mythos Preview logró encontrar miles de vulnerabilidades y desarrollar numerosos exploits relacionados, de forma totalmente autónoma y sin intervención humana. Anthropic ha revelado algunas de ellas en el sistema operativo OpenBSD, en la biblioteca para vídeo FFmpeg y hasta en el kernel de Linux. Las tres vulnerabilidades se han notificado a los responsables correspondientes y ya se han corregido, pero quedan muchísimas más.

Cómo gestionar los 0-Days

Encontrar miles de vulnerabilidades de día cero a la vez suena impresionante. Sin embargo, gestionarlas de forma responsable es una pesadilla logística, y una de las críticas más severas que los investigadores de seguridad han planteado sobre el descubrimiento de vulnerabilidades mediante IA. Inundar a los responsables del mantenimiento de software de código abierto, muchos de los cuales son voluntarios no remunerados, con una avalancha de informes de errores críticos, podría ser más perjudicial que beneficioso.

Anthropic ha creado un sistema de clasificación específico para gestionar este problema. Primero serán clasificados y luego enviados los de mayor gravedad a evaluadores humanos profesionales contratados para que ayuden en el proceso de divulgación, validando manualmente cada informe de error antes de enviarlo. Este sistema está diseñado para evitar precisamente el escenario que más temen los responsables del mantenimiento: una avalancha automática de informes no verificados.

Cuando Anthropic tenga acceso al código fuente, la empresa se propone incluir un parche candidato en cada informe, etiquetado según su procedencia (lo que significa que el responsable del mantenimiento sabe que el parche fue escrito o revisado por un modelo), y ofrece colaborar en una solución de calidad para producción, ya que el modelo del Proyecto Glasswing también puede escribir parches que serán sometidos al mismo escrutinio.

En cuanto a los plazos de divulgación, Anthropic afirma seguir un marco coordinado con sus socios para la divulgación de vulnerabilidades. Una vez disponible un parche, la empresa suele esperar 45 días antes de publicar todos los detalles técnicos, dando así tiempo a los proveedores para implementar la solución antes de que la información sobre la explotación se haga pública.

Cómo mejorar la confianza en la IA… y en las compañías que la manejan

La ironía de que una empresa afirme haber construido el modelo cibernético más capaz jamás creado, mientras sufre simultáneamente una serie de vergonzosos fallos de seguridad, no ha pasado desapercibida para los observadores. A finales de marzo, un borrador de una entrada de blog sobre Mythos quedó en un repositorio de datos público y sin protección, una configuración errónea del CMS que expuso aproximadamente 3000 recursos internos, incluidos lo que parecían ser planes estratégicos para el lanzamiento del modelo.

Días después, el 31 de marzo, cualquier persona que ejecutara npm install en Claude Code descargó el código fuente original completo de Anthropic (512.000 líneas) durante aproximadamente tres horas debido a un error de empaquetado, un incidente que atrajo mucha atención en la comunidad de desarrolladores.

Cuando se le pregunta a sus ejecutivos por qué los socios y los gobiernos deberían confiar en Anthropic como custodio de un modelo que, según la empresa, posee capacidades cibernéticas sin precedentes, Cheng fue directo: «La seguridad es fundamental en nuestra forma de desarrollar y distribuir y los fallos comentados fueron errores humanos en las herramientas de publicación, no fallos en nuestra arquitectura de seguridad». La startup dice haber implementado cambios para evitar que esos casos vuelvan a suceder.

Los socios del Proyecto Glasswing

La amplitud de la coalición es notable. Incluye competidores directos, junto con empresas líderes en ciberseguridad, instituciones financieras y el responsable del mayor ecosistema de código abierto del mundo, la Fundación Linux. Además, varios socios llevan semanas probando el modelo Mythos Preview en su propia infraestructura.

La necesidad logra la unión. El CTO de CrowdStrike, Elia Zaitsev, describió la iniciativa en términos de reducción de plazos: «El lapso entre el descubrimiento de una vulnerabilidad y su explotación por parte de un adversario se ha reducido drásticamente; lo que antes tardaba meses, ahora sucede en minutos gracias a la IA».

La vicepresidenta y CISO de AWS, Amy Herzog, afirmó que sus equipos ya han estado probando Mythos Preview en bases de código críticas, donde el modelo «ya nos está ayudando a fortalecer nuestro código». Por su parte, el CISO global de Microsoft, Igor Tsyganskiy, señaló que, al ser probado con CTI-REALM, el referente de seguridad de código abierto de Microsoft, «Claude Mythos Preview mostró mejoras sustanciales en comparación con los modelos anteriores».

Quizás el comentario más revelador provino de Jim Zemlin, director ejecutivo de la Linux Foundation, quien señaló la asimetría fundamental que ha afectado la seguridad del software de código abierto durante décadas: «En el pasado, la experiencia en seguridad ha sido un lujo reservado para organizaciones con grandes equipos de seguridad. Los responsables del mantenimiento del software de código abierto, cuyo software sustenta gran parte de la infraestructura crítica mundial, históricamente se han visto obligados a resolver los problemas de seguridad por su cuenta». El proyecto Glasswing, afirmó, «ofrece una vía viable para cambiar esta situación».

Defensa antes del ataque

La pregunta más importante que plantea el Proyecto Glasswing no es si las capacidades de Mythos Preview son reales -los respaldos de los socios y las vulnerabilidades corregidas sugieren que sí lo son- sino cuánto tiempo tienen realmente los defensores antes de que capacidades similares estén disponibles para los adversarios.

El responsable de ciberseguridad en Anthropic fue sincero: «Es probable que las capacidades de IA de vanguardia avancen sustancialmente en los próximos meses. Dado el ritmo de progreso de la IA, no pasará mucho tiempo antes de que dichas capacidades se extiendan, posiblemente más allá de los actores comprometidos con su implementación segura».

No obstante, el Proyecto Glasswing parece un paso importante para brindar a los defensores una ventaja duradera en la próxima era de la ciberseguridad impulsada por la IA. Como señalan desde la startup, la iniciativa solo es un punto de partida. Ninguna organización puede resolver estos problemas de ciberseguridad por sí sola. A medio plazo, la compañía ha propuesto que un organismo independiente externo pueda ser el entorno ideal para continuar trabajando en proyectos de ciberseguridad a gran escala.

Los grandes modelos de IA como el mismo Claude Mythos, ya han demostrado su capacidad para descifrar de forma autónoma los sistemas que hasta ahora se consideraban los más seguros del planeta. Y, atención, el Q-Day, el momento en que un ordenador cuántico podrá descifrar la criptografía que protege toda la infraestructura digital corporativa, está programado para el 2029. La coordinación y unión será obligatoria.