Cinq des plus grands éditeurs mondiaux ont déposé plainte contre Meta devant le tribunal fédéral de Manhattan le 5 mai 2026, accusant le géant technologique d’avoir pillé des millions d’ouvrages pour nourrir son modèle d’intelligence artificielle Llama. Elsevier, Cengage, Hachette, Macmillan et McGraw Hill, rejoints par le romancier Scott Turow, affirment dans cette action collective que des manuels universitaires, des articles scientifiques et des romans ont été aspirés sans la moindre autorisation. La riposte de Meta fut immédiate et combative. « Les tribunaux ont à juste titre estimé que l’entraînement de l’IA sur du matériel protégé peut relever du fair use. Nous combattrons ce procès avec la plus grande fermeté », a déclaré un porte-parole du groupe.
Cette offensive judiciaire s’inscrit dans une guerre juridique qui oppose désormais des dizaines d’auteurs, de médias et d’artistes visuels aux architectes de l’intelligence artificielle générative, d’OpenAI à Anthropic en passant par Midjourney. La question qui irrigue chaque audience est d’une élégance trompeuse dans sa formulation, et d’une complexité redoutable dans ses implications. L’entraînement d’un modèle de langage sur des œuvres protégées constitue-t-il un usage loyal, ce fameux « fair use » américain qui autorise la transformation d’une œuvre existante en quelque chose de radicalement nouveau ?
Les deux premiers juges à s’être penchés sur le sujet ont rendu en 2025 des décisions divergentes, dessinant une fracture doctrinale qui promet de remonter jusqu’aux cours d’appel fédérales. Dans l’affaire Bartz contre Anthropic, le tribunal a qualifié l’entraînement d’un modèle de langage d’usage « transformatif, et spectaculairement transformatif », comparant le processus d’apprentissage d’une IA à celui d’un lecteur humain qui assimile, mémorise puis reformule. Deux jours plus tard, dans Kadrey contre Meta, un autre juge a lui aussi conclu au fair use pour l’entraînement, tout en reprochant vertement aux plaignants de n’avoir pas développé l’argument qui aurait pu faire basculer l’affaire. L’accord paraît superficiel. Car les deux magistrats ont profondément divergé sur le facteur le plus déterminant de l’analyse, celui du préjudice de marché, et sur le sort à réserver aux œuvres obtenues par piratage.
Des documents internes dévoilés dans le cadre de procédures judiciaires ont révélé début 2026 l’ampleur industrielle de l’opération. Anthropic avait lancé dès 2024 un programme baptisé « Project Panama », dont un mémo interne résumait ainsi l’ambition et le secret « Project Panama est notre effort pour scanner de manière destructive tous les livres du monde. Nous ne voulons pas que l’on sache que nous travaillons là-dessus. » L’entreprise avait acquis, numérisé puis détruit des millions de volumes, tout en téléchargeant plus de sept millions de titres depuis des bibliothèques pirates comme LibGen. Le juge du dossier Bartz a bien reconnu le fair use pour l’entraînement lui-même, mais refusé de l’étendre au stockage de copies piratées. Télécharger des ouvrages depuis des sites illégaux ne bénéficie d’aucun passe-droit, même lorsque l’usage final se veut transformatif.
Anthropic a finalement accepté de régler l’affaire pour 1,5 milliard de dollars, un montant qui reste bien en deçà des centaines de milliards auxquels la start-up s’exposait théoriquement en dommages statutaires (jusqu’à 150 000 dollars par œuvre contrefaite, multipliés par près d’un demi-million d’auteurs). Chaque créateur de la classe devrait recevoir environ 3 000 dollars par ouvrage, avant déduction des honoraires d’avocats estimés à 300 millions. Ce règlement constitue le premier accord financier d’envergure entre un développeur d’IA et des ayants droit littéraires, et il a immédiatement encouragé d’autres plaignants, notamment des éditeurs musicaux, à ajouter des allégations de piratage à leurs propres recours.
Le front ne se limite pas à la littérature. Disney, Lucasfilm et Marvel poursuivent Midjourney devant le tribunal fédéral de Californie centrale, alléguant que le générateur d’images a reproduit et distribué des versions dérivées de leurs personnages emblématiques pour attirer des abonnés et générer des centaines de millions de dollars de revenus. Dans un rebondissement qui illustre toute l’ambivalence de l’industrie du divertissement, Disney a parallèlement signé un accord de licence avec OpenAI autorisant son outil Sora à créer des vidéos mettant en scène plus de 200 personnages de ses franchises, assorti d’un investissement d’un milliard de dollars dans la firme de Sam Altman. Cette stratégie du double jeu, en tout cas perçue comme telle, pourrait bien redéfinir le quatrième facteur du test de fair use. L’existence d’un marché actif de licences rend en effet plus difficile pour les entreprises d’IA de prétendre qu’aucun préjudice commercial n’est causé aux détenteurs de droits.
La consolidation de douze affaires contre OpenAI au sein d’un contentieux multidistrict devant le tribunal fédéral du sud de New York ajoute une dimension supplémentaire à cette saga. Le juge a ordonné en mars 2026 la production de 108 millions de journaux de résultats (outputs), un volume de données qui pourrait pour la première fois permettre de mesurer à quelle fréquence ChatGPT reproduit substantiellement des textes protégés. Car c’est bien là que réside la prochaine bataille. Si l’entraînement semble en voie d’être largement protégé par le fair use, la question de la responsabilité pour les contenus générés reste entièrement ouverte.
La Cour suprême a de son côté confirmé en mars 2026, en refusant d’examiner l’affaire Thaler contre Perlmutter, que seul un auteur humain peut prétendre à la protection du droit d’auteur. Les œuvres entièrement produites par une machine demeurent donc exclues du champ du copyright. Cette décision laisse toutefois béante la question du degré d’intervention humaine nécessaire pour qu’une création assistée par IA devienne protégeable…
Maria Pallante, présidente de l’Association of American Publishers, a résumé l’enjeu avec une formule qui vaut programme politique « L’infraction à grande échelle de Meta ne constitue pas un progrès pour le public, et l’IA ne sera jamais pleinement réalisée si les entreprises technologiques privilégient les sites pirates plutôt que le savoir et l’imagination. » Le paradoxe est saisissant. Les modèles de langage ont besoin de textes de qualité pour devenir performants, et cette performance même leur permet ensuite d’inonder le marché avec des contenus susceptibles de concurrencer les œuvres dont ils se sont nourris. Le juge de l’affaire Kadrey avait lui-même identifié ce cercle vicieux, notant que les livres des plaignants rendaient l’IA meilleure, laquelle devenait alors capable de diluer le marché de ces mêmes livres.
L’industrie de l’IA se trouve à un carrefour où le droit, la technologie et l’économie de la création convergent sans qu’aucune jurisprudence stable n’ait encore émergé. Les cours d’appel fédérales devront trancher les contradictions entre tribunaux de première instance, et le Congrès américain pourrait finir par légiférer si les juges ne parviennent pas à harmoniser leurs raisonnements. En attendant, chaque accord de licence signé et chaque milliard versé en transaction façonnent un droit coutumier de fait, où le rapport de force économique pèse au moins autant que la doctrine juridique.

