security

OpenAI lanza Codex Security: agente de IA para detectar vulnerabilidades críticas

Carlos Ruiz

08 mar. 2026 — 1 min read

Un agente que entiende contexto, no solo patrones

OpenAI ha lanzado Codex Security en research preview, un agente de seguridad de aplicaciones que utiliza modelos de frontera para identificar vulnerabilidades complejas que otras herramientas automatizadas pasan por alto. A diferencia de scanners tradicionales, construye contexto profundo del proyecto para entregar hallazgos de alta confianza con parches ejecutables.

La herramienta, anteriormente conocida como Aardvark durante su beta privado, ya ha demostrado capacidades reales: identificó un SSRF crítico, una vulnerabilidad de autenticación cross-tenant y múltiples problemas que el equipo de seguridad de OpenAI parcheó en horas.

Durante el período beta, Codex Security mejoró significativamente sus métricas de precisión. En un caso documentado, redujo el ruido en un 84% desde el rollout inicial. La tasa de hallazgos con severidad sobre-reportada cayó más del 90%, y los falsos positivos se redujeron en más del 50% across all repositories.

Metodología de tres fases

El workflow de Codex Security se estructura en tres etapas diferenciadas:

Construcción de contexto y threat modeling: Analiza el repositorio para entender la estructura security-relevant del sistema y genera un threat model específico del proyecto que captura qué hace el sistema, en qué confía y dónde está más expuesto.

Priorización y validación: Utiliza el threat model como contexto para buscar vulnerabilidades y categorizar hallazgos basado en impacto real esperado. Cuando es posible, pressure-testea findings en entornos de validación sandbox para distinguir señal de ruido.

Patching con contexto completo: Propone fixes que se alinean con la intención del sistema y comportamiento circundante, minimizando regresiones y facilitando reviews más seguros.

En los últimos 30 días, Codex Security scaneó más de 1.2 millones de commits, identificando vulnerabilidades críticas en proyectos open-source de alto perfil como OpenSSH y GnuTLS.

Fuente original: OpenAI

Foto de Laine Cooper en Unsplash

a man sitting at a desk in front of a laptop computer

OpenAI lanza GPT-5.4: el modelo más capaz para trabajo profesional

Control de ordenadores nativo y contexto de 1M tokens OpenAI ha lanzado GPT-5.4, su modelo frontier más capaz para tareas profesionales complejas. La principal novedad es la capacidad nativa de control de ordenadores, que permite a los agentes operar sistemas informáticos completos mediante capturas de pantalla y comandos de

Sunlight breaks through dramatic clouds over bridge cables

Amazon Bedrock lanza Projects API compatible con OpenAI para aislar cargas de trabajo AI

Nueva API para organizar aplicaciones AI a nivel empresarial Amazon Bedrock ha lanzado la Projects API compatible con OpenAI, proporcionando aislamiento a nivel de aplicación para cargas de trabajo de IA generativa. La nueva API permite a las organizaciones gestionar múltiples aplicaciones, entornos y equipos con control de acceso granular

Anthropic vs Pentágono: el precedente que podría cambiar las reglas del juego en IA

¿Qué significa realmente "riesgo de cadena de suministro"? La designación de Anthropic como "riesgo de cadena de suministro" por parte del Departamento de Guerra estadounidense es históricamente inédita. Esta etiqueta, tradicionalmente reservada para adversarios extranjeros como empresas chinas o rusas, nunca se había aplicado públicamente a

Sticky notes with words and drawings on wooden table.

OpenAI define 5 modelos de valor para evolucionar de pilotos AI a reinvención empresarial

De experimentos aislados a transformación sistemática OpenAI ha publicado un framework estratégico que identifica cinco modelos de valor para que las organizaciones evolucionen desde pilotos AI dispersos hacia reinvención empresarial sistemática. La propuesta plantea que las empresas líderes no serán las que ejecuten más pilotos, sino las que comprendan qué