Aller au contenu principal

chardet 7.0 : Claude réécrit un pilier Python en 5 jours

6 mars 2026 2 min de lecture Paul Forcadel
chardet 7.0 : Claude réécrit un pilier Python en 5 jours

Une bibliothèque réécrite de zéro par IA

Dan Blanchard, mainteneur de chardet depuis plus de dix ans, a utilisé Claude d'Anthropic pour réécrire intégralement cette bibliothèque Python de détection d'encodage de caractères. Le résultat : chardet 7.0, livré en cinq jours, 48 fois plus rapide que la version 6.0, avec une précision de 96,8 % sur 49 langues et 99 encodages. Une bibliothèque téléchargée 130 millions de fois par mois.

Le changement de licence qui fait débat

Le vrai séisme n'est pas technique mais juridique. Blanchard a changé la licence de LGPL (copyleft) à MIT (permissive), arguant que le code produit par Claude constitue une « clean room implementation » avec moins de 1,3 % de similarité avec l'ancien code (contre 80-93 % entre les versions précédentes).

Mark Pilgrim, créateur original de chardet en 2006, conteste : « Le code sous licence, quand il est modifié, doit être publié sous la même licence LGPL. » La Free Software Foundation, par la voix de Zoë Kooyman, avertit : « Il n'y a rien de clean dans un LLM qui a ingéré le code qu'on lui demande de réimplémenter. »

Le paradoxe juridique de l'IA

Le 2 mars 2026, la Cour suprême des États-Unis a refusé d'examiner un appel sur le copyright du contenu IA, consolidant l'exigence d'un « auteur humain ». Cela crée un paradoxe : si le code généré par IA ne peut pas être protégé par le copyright, alors la licence MIT elle-même pourrait être juridiquement invalide. Si le code est considéré comme dérivé, il reste soumis à la LGPL.

Un précédent pour tout l'open source

Armin Ronacher, créateur de Flask, accueille favorablement le changement. Bruce Perens, cofondateur de l'Open Source Initiative, va plus loin : « L'économie du développement logiciel est morte. » Si un développeur peut contourner le copyleft en cinq jours avec un agent IA, la question dépasse chardet : c'est le modèle même des licences open source qui est remis en cause.

Partager cet article

Questions fréquentes

chardet est une bibliothèque Python qui détecte automatiquement l'encodage de caractères d'un fichier texte. Elle est téléchargée 130 millions de fois par mois et fait partie des packages Python les plus utilisés au monde.
La licence LGPL (copyleft) oblige les versions dérivées à rester sous la même licence. En réécrivant le code avec Claude, le mainteneur argue qu'il ne s'agit pas d'une version dérivée mais d'un code entièrement nouveau, justifiant le passage à MIT.
C'est la grande question juridique. La Cour suprême des États-Unis a consolidé l'exigence d'un « auteur humain » en mars 2026. Si le code IA n'est pas protégeable, la licence MIT pourrait être invalide.
La version 7.0 est 48 fois plus rapide que la version 6.0, avec une précision de 96,8 % sur 2 510 fichiers de test. Elle supporte 49 langues et 99 encodages, sans aucune dépendance externe.

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Articles connexes

Parcourir par catégorie