OpenAI lanza Codex Security: agente de IA para detectar vulnerabilidades críticas
Un agente que entiende contexto, no solo patrones
OpenAI ha lanzado Codex Security en research preview, un agente de seguridad de aplicaciones que utiliza modelos de frontera para identificar vulnerabilidades complejas que otras herramientas automatizadas pasan por alto. A diferencia de scanners tradicionales, construye contexto profundo del proyecto para entregar hallazgos de alta confianza con parches ejecutables.
La herramienta, anteriormente conocida como Aardvark durante su beta privado, ya ha demostrado capacidades reales: identificó un SSRF crítico, una vulnerabilidad de autenticación cross-tenant y múltiples problemas que el equipo de seguridad de OpenAI parcheó en horas.
Durante el período beta, Codex Security mejoró significativamente sus métricas de precisión. En un caso documentado, redujo el ruido en un 84% desde el rollout inicial. La tasa de hallazgos con severidad sobre-reportada cayó más del 90%, y los falsos positivos se redujeron en más del 50% across all repositories.
Metodología de tres fases
El workflow de Codex Security se estructura en tres etapas diferenciadas:
Construcción de contexto y threat modeling: Analiza el repositorio para entender la estructura security-relevant del sistema y genera un threat model específico del proyecto que captura qué hace el sistema, en qué confía y dónde está más expuesto.
Priorización y validación: Utiliza el threat model como contexto para buscar vulnerabilidades y categorizar hallazgos basado en impacto real esperado. Cuando es posible, pressure-testea findings en entornos de validación sandbox para distinguir señal de ruido.
Patching con contexto completo: Propone fixes que se alinean con la intención del sistema y comportamiento circundante, minimizando regresiones y facilitando reviews más seguros.
En los últimos 30 días, Codex Security scaneó más de 1.2 millones de commits, identificando vulnerabilidades críticas en proyectos open-source de alto perfil como OpenSSH y GnuTLS.
Fuente original: OpenAI
Foto de Laine Cooper en Unsplash