¿Por qué tu agente de IA hace cosas raras? Llegan los contratos conductuales

Miguel Torres

27 feb. 2026 — 2 min read

Imagina esto: has implementado un agente de IA para moderar comentarios en tu plataforma. Funciona bien durante semanas, pero de repente empieza a comportarse de forma extraña: bloquea contenido que antes aprobaba, o peor, deja pasar spam evidente. No has cambiado nada en el código. ¿Qué pasó?

El problema invisible de los agentes autónomos

Este fenómeno se llama "drift" (deriva conductual) y es uno de los dolores de cabeza más grandes cuando trabajas con sistemas agenticos en producción. A diferencia del software tradicional, que opera sobre contratos explícitos (APIs, tipos, aserciones), los agentes de IA funcionan con prompts y lenguaje natural. Sin especificaciones formales de comportamiento.

Varun Pratap Bhardwaj acaba de publicar un paper que propone una solución elegante: Agent Behavioral Contracts (ABC). Es básicamente llevar el paradigma "Design-by-Contract" al mundo de la IA, pero adaptado para la naturaleza probabilística de los LLMs.

Cómo funcionan los contratos ABC

Un contrato ABC se define como C = (P, I, G, R), donde cada componente tiene un propósito específico:

Precondiciones (P): Qué condiciones deben cumplirse antes de que el agente actúe. Por ejemplo, "solo procesar comentarios con menos de 500 caracteres".

Invariantes (I): Propiedades que deben mantenerse durante toda la ejecución. Como "nunca bloquear contenido que contenga links a documentación oficial".

Governance (G): Políticas de governanza que definen los límites operativos. "Escalar a humano si la confianza del modelo es menor al 80%".

Recovery (R): Mecanismos de recuperación cuando algo sale mal. "Si se detecta deriva, revertir a configuración anterior".

La matemática detrás del control de deriva

Lo más interesante del paper es el Teorema de Límites de Deriva. Bhardwaj demuestra que si tienes un contrato con tasa de recuperación γ mayor que la tasa natural de deriva α, puedes acotar la deriva conductual a D* = α/γ en expectativa.

En términos prácticos: si tu agente tiene tendencia a derivar un 5% por sesión (α = 0.05) pero implementas mecanismos de recuperación que funcionan el 80% de las veces (γ = 0.8), la deriva máxima será 0.05/0.8 = 0.0625, o 6.25%.

Resultados en el mundo real

El equipo implementó ABC en AgentAssert, una librería de enforcement runtime, y lo probó en AgentContract-Bench con 200 escenarios across 7 modelos de 6 proveedores diferentes.

Los números son impresionantes: los agentes con contratos detectaron entre 5.2 y 6.8 violaciones soft por sesión que los baselines sin contrato no veían para nada (p < 0.0001). Lograron 88-100% de compliance en restricciones hard y mantuvieron deriva conductual por debajo de D* < 0.27 en sesiones extendidas.

¿Dónde encaja en tu stack?

Si estás corriendo agentes en producción, esto no es teórico. Los contratos conductuales son especialmente valiosos para:

Sistemas críticos: Donde la deriva puede tener consecuencias costosas (moderación de contenido, aprobación de transacciones, diagnósticos médicos).

Chains multi-agente: El paper incluye condiciones suficientes para composición segura de contratos cuando tienes múltiples agentes trabajando juntos.

Compliance y auditoría: Tener especificaciones formales facilita enormemente demostrar que tus sistemas cumplen regulaciones.

La librería AgentAssert añade menos de 10ms de overhead per acción, así que el costo es mínimo. Y el 100% de recovery rate en modelos frontier sugiere que esta aproximación es viable para sistemas reales.

Fuente original: arXiv