– OPENAI – Archivo
MADRID, 4 de mayo. (CIBERPRO) –
GPT-5.5 Cyber, el modelo de OpenAI enfocado en la ciberseguridad, presenta habilidades comparables a las de Claude Mythos de Anthropic para realizar ataques a sistemas de forma autónoma, según han evidenciado las pruebas del Instituto de Seguridad de la IA (AISI), que forma parte del Departamento de Ciencia, Innovación y Tecnología del gobierno británico.
GPT-5.5-Cyber es una variante del modelo GPT-5.5 de OpenAI, creada específicamente para salvaguardar empresas e infraestructuras, similar a Claude Mythos Preview de Anthropic. Ambos modelos representan una nueva tendencia en inteligencia artificial, capaces de simular ataques a redes corporativas, una tarea que para un ser humano podría llevar «aproximadamente 20 horas».
Así lo indica el AISI, que ha publicado los resultados de las pruebas realizadas al modelo de OpenAI, las cuales ya habían sido aplicadas a Claude Mythos Preview. Específicamente, se evaluaron las habilidades de GPT-5.5-Cyber en 95 tareas de ciberseguridad en formato ‘atrapa la bandera’, distribuidas en cuatro niveles de dificultad.
GPT-5.5-Cyber, al igual que Claude Mythos, maneja sin dificultad las tareas básicas. En cuanto a las tareas más complejas, estas se dividen en dos niveles: Practitioner y Expert. Según el AISI, GPT-5.5 ha demostrado un rendimiento superior al de Claude Mythos en las tareas de nivel Expert, con una tasa de éxito promedio del 71,4 por ciento frente al 68,6 por ciento del modelo de Anthropic.
Estas tareas se centran en la investigación y explotación autónoma de vulnerabilidades en objetivos reales y contramedidas modernas, lo que implica habilidades como la ingeniería inversa de binarios sin acceso al código fuente, la creación de ‘exploits’ confiables para desbordamientos de pila y la recuperación de claves usando ataques de oráculo, entre otros.
El AISI ha resaltado dos simulaciones en particular: ‘Cooling Tower’ y ‘The Last Ones’. Esta última es una simulación de ataque a una red corporativa que consta de 32 pasos, modelada según la cadena de ataque de una intrusión empresarial, que abarca cuatro subredes y cerca de veinte hosts, tarea que un humano tardaría 20 horas en finalizar.
En esta simulación, Claude Mythos logró resolver tres de diez intentos, mientras que GPT-5.5 Cyber alcanzó el segundo lugar con dos de diez intentos completados.
El AISI también mencionó que GPT-5.5 no pudo resolver la simulación de ataque a un sistema de control industrial llamado ‘Cooling Tower’, que requiere la ejecución de siete pasos y que un experto humano tardaría alrededor de 15 horas en completar. Sin embargo, señalaron que «ningún modelo ha tenido éxito hasta ahora».
Es importante destacar que las pruebas se realizaron en entornos controlados que simulan situaciones reales con acceso a la red, pero sin medidas de defensa activas, lo que impide a la organización afirmar que «GPT-5.5 tendría éxito contra un objetivo bien protegido».
«GPT-5.5 muestra que la rápida mejora en capacidades cibernéticas podría ser parte de una tendencia más amplia. Si la capacidad ciberofensiva resulta de mejoras generales en autonomía, razonamiento y programación a largo plazo, podríamos anticipar nuevos aumentos en la capacidad cibernética de los modelos en un futuro cercano, potencialmente de manera continua», añadió.
Anteriormente, el AISI sometió a Claude Mythos a evaluaciones controladas que incluían sondeos por chat, desafíos de captura de bandera y simulaciones de ciberataques de múltiples pasos; todo ello en entornos sin medidas de seguridad ni penalizaciones.
En sus hallazgos, destacaron que el modelo de IA de Anthropic, diseñado para fortalecer la seguridad defensiva, tiene la capacidad de atacar de manera autónoma a pequeñas empresas con protecciones débiles.





