OpenAI lanza GPT-5.4: el modelo más capaz para trabajo profesional
Control de ordenadores nativo y contexto de 1M tokens
OpenAI ha lanzado GPT-5.4, su modelo frontier más capaz para tareas profesionales complejas. La principal novedad es la capacidad nativa de control de ordenadores, que permite a los agentes operar sistemas informáticos completos mediante capturas de pantalla y comandos de teclado y ratón.
GPT-5.4 combina las fortalezas del razonamiento de GPT-5.2 con las capacidades de codificación de GPT-5.3-Codex en un único modelo. Soporta hasta 1M tokens de contexto en la API, permitiendo a los agentes planificar y ejecutar tareas de largo alcance sin perder coherencia.
Mejoras sustanciales en trabajo profesional
En benchmarks de conocimiento profesional, GPT-5.4 alcanza el 83% de precisión en GDPval, superando al 70.9% de GPT-5.2. Esta métrica evalúa la capacidad del modelo para generar trabajo especializado en 44 ocupaciones diferentes, desde presentaciones de ventas hasta diagramas de manufactura.
Las mejoras son especialmente notables en hojas de cálculo financieras, donde el modelo logra un 87.3% frente al 68.4% anterior. En presentaciones, los evaluadores humanos prefieren el output de GPT-5.4 en el 68% de los casos debido a mejor estética y uso más efectivo de la generación de imágenes.
Brendan Foody, CEO de Mercor, confirma que "GPT-5.4 es el mejor modelo que hemos probado. Ahora lidera nuestro benchmark APEX-Agents para servicios profesionales, destacando en entregables de largo horizonte como presentaciones, modelos financieros y análisis legal".
Tool Search revoluciona el manejo de herramientas
Una innovación clave es Tool Search, que permite a GPT-5.4 trabajar eficientemente con ecosistemas masivos de herramientas. En lugar de cargar todas las definiciones de herramientas en el prompt inicial, el modelo puede buscar y cargar herramientas específicas solo cuando las necesita.
En pruebas con 36 servidores MCP, Tool Search redujo el uso de tokens de entrada en un 40% manteniendo una tasa de éxito del 95% en la selección de la herramienta adecuada. Esto hace que el modelo sea no solo más capaz, sino también más rentable en despliegues a gran escala que requieren múltiples integraciones.
El despliegue de GPT-5.4 comienza hoy para usuarios de ChatGPT Plus y Team, con disponibilidad general en la API prevista para finales de esta semana. El precio se mantiene idéntico al de GPT-5.2, posicionándolo como el nuevo estándar de eficiencia y potencia.
Fuente original: OpenAI
Foto de Anton Savinov en Unsplash