OpenAI lanza GPT-5.4: el modelo más capaz para trabajo profesional

Miguel Torres

08 mar. 2026 — 2 min read

Control de ordenadores nativo y contexto de 1M tokens

OpenAI ha lanzado GPT-5.4, su modelo frontier más capaz para tareas profesionales complejas. La principal novedad es la capacidad nativa de control de ordenadores, que permite a los agentes operar sistemas informáticos completos mediante capturas de pantalla y comandos de teclado y ratón.

GPT-5.4 combina las fortalezas del razonamiento de GPT-5.2 con las capacidades de codificación de GPT-5.3-Codex en un único modelo. Soporta hasta 1M tokens de contexto en la API, permitiendo a los agentes planificar y ejecutar tareas de largo alcance sin perder coherencia.

Mejoras sustanciales en trabajo profesional

En benchmarks de conocimiento profesional, GPT-5.4 alcanza el 83% de precisión en GDPval, superando al 70.9% de GPT-5.2. Esta métrica evalúa la capacidad del modelo para generar trabajo especializado en 44 ocupaciones diferentes, desde presentaciones de ventas hasta diagramas de manufactura.

Las mejoras son especialmente notables en hojas de cálculo financieras, donde el modelo logra un 87.3% frente al 68.4% anterior. En presentaciones, los evaluadores humanos prefieren el output de GPT-5.4 en el 68% de los casos debido a mejor estética y uso más efectivo de la generación de imágenes.

Brendan Foody, CEO de Mercor, confirma que "GPT-5.4 es el mejor modelo que hemos probado. Ahora lidera nuestro benchmark APEX-Agents para servicios profesionales, destacando en entregables de largo horizonte como presentaciones, modelos financieros y análisis legal".

Tool Search revoluciona el manejo de herramientas

Una innovación clave es Tool Search, que permite a GPT-5.4 trabajar eficientemente con ecosistemas masivos de herramientas. En lugar de cargar todas las definiciones de herramientas en el prompt inicial, el modelo puede buscar y cargar herramientas específicas solo cuando las necesita.

En pruebas con 36 servidores MCP, Tool Search redujo el uso de tokens de entrada en un 40% manteniendo una tasa de éxito del 95% en la selección de la herramienta adecuada. Esto hace que el modelo sea no solo más capaz, sino también más rentable en despliegues a gran escala que requieren múltiples integraciones.

El despliegue de GPT-5.4 comienza hoy para usuarios de ChatGPT Plus y Team, con disponibilidad general en la API prevista para finales de esta semana. El precio se mantiene idéntico al de GPT-5.2, posicionándolo como el nuevo estándar de eficiencia y potencia.

Fuente original: OpenAI

Foto de Anton Savinov en Unsplash

Sunlight breaks through dramatic clouds over bridge cables

Amazon Bedrock lanza Projects API compatible con OpenAI para aislar cargas de trabajo AI

Nueva API para organizar aplicaciones AI a nivel empresarial Amazon Bedrock ha lanzado la Projects API compatible con OpenAI, proporcionando aislamiento a nivel de aplicación para cargas de trabajo de IA generativa. La nueva API permite a las organizaciones gestionar múltiples aplicaciones, entornos y equipos con control de acceso granular

Anthropic vs Pentágono: el precedente que podría cambiar las reglas del juego en IA

¿Qué significa realmente "riesgo de cadena de suministro"? La designación de Anthropic como "riesgo de cadena de suministro" por parte del Departamento de Guerra estadounidense es históricamente inédita. Esta etiqueta, tradicionalmente reservada para adversarios extranjeros como empresas chinas o rusas, nunca se había aplicado públicamente a

Sticky notes with words and drawings on wooden table.

OpenAI define 5 modelos de valor para evolucionar de pilotos AI a reinvención empresarial

De experimentos aislados a transformación sistemática OpenAI ha publicado un framework estratégico que identifica cinco modelos de valor para que las organizaciones evolucionen desde pilotos AI dispersos hacia reinvención empresarial sistemática. La propuesta plantea que las empresas líderes no serán las que ejecuten más pilotos, sino las que comprendan qué

a box with a key chain and a key chain on it

La controversia de chardet: ¿pueden los agentes de código relicenciar open source?

Reescritura con IA desata debate sobre clean room implementations La biblioteca Python chardet ha desatado una controversia fundamental sobre los límites legales de los agentes de código tras relicenciar de LGPL a MIT mediante una reescritura completa asistida por Claude Code. El caso expone tensiones emergentes entre derechos de autor,