La controversia de chardet: ¿pueden los agentes de código relicenciar open source?
Reescritura con IA desata debate sobre clean room implementations
La biblioteca Python chardet ha desatado una controversia fundamental sobre los límites legales de los agentes de código tras relicenciar de LGPL a MIT mediante una reescritura completa asistida por Claude Code. El caso expone tensiones emergentes entre derechos de autor, licencias copyleft y la capacidad de la IA para generar implementaciones "independientes".
Dan Blanchard, mantenedor de chardet durante 12 años, lanzó la versión 7.0.0 como una "reescritura completa bajo licencia MIT" que promete ser "mucho más rápida y precisa" que las versiones anteriores. Sin embargo, Mark Pilgrim, autor original de la biblioteca en 2006, considera la relicenciación una "violación explícita de la LGPL".
El conflicto gira en torno a si una reescritura asistida por IA puede considerarse legalmente independiente del código original, especialmente cuando el desarrollador ha estado inmerso en el codebase durante más de una década.
Metodología controvertida: ¿clean room válido o derivación encubierta?
Blanchard documentó meticulosamente su proceso de reescritura, utilizando un repositorio vacío e instruyendo explícitamente a Claude "no basar nada en código con licencia LGPL/GPL". Las pruebas con JPlag, herramienta de detección de plagio, muestran apenas 1.29% de similitud con la versión anterior frente al 80-93% típico entre releases incrementales.
Sin embargo, Blanchard reconoce una limitación crítica: "Un enfoque clean-room tradicional implica separación estricta entre personas con conocimiento del original y quienes escriben la nueva implementación, y esa separación no existió aquí".
Armin Ronacher, mantenedor de Flask, observa que "cuando el coste de generar código baja tanto, y podemos reimplementar desde test suites únicamente, ¿qué significa eso para el futuro del software?". El caso chardet podría ser el primero de muchos donde la IA permite a los desarrolladores escapar de licencias restrictivas mediante reescrituras automatizadas de alta fidelidad.
Implicaciones para el ecosistema de código abierto
Este incidente plantea preguntas existenciales sobre la durabilidad de las licencias copyleft en la era de los LLM. Si un agente de IA puede recrear la funcionalidad de una biblioteca compleja basándose únicamente en sus tests y documentación, el valor de la protección de autor tradicional podría diluirse significativamente.
Expertos legales sugieren que estamos entrando en una zona gris donde la intención y el proceso importan tanto como el código final. Por ahora, chardet v7.0.0 se mantiene bajo MIT, pero la comunidad observa de cerca si este precedente abrirá las puertas a una migración masiva de proyectos GPL hacia licencias más permisivas mediante reescrituras sintéticas.
Fuente original: Simon Willison's Weblog
Foto de Markus Winkler en Unsplash