Copyright : Meta poursuivi par cinq éditeurs sur Llama (IA générative) Cinq éditeurs attaquent Meta sur l’entraînement de Llama et les droits d’auteur; le débat sur le fair use est relancé.
Le domaine de l’IA générative et des droits d’auteur est à nouveau sous pression: Meta est poursuivi par cinq éditeurs pour l’entraînement de son modèle Llama sur des œuvres protégées. L’action, déposée devant la cour du district sud de New York, relance le débat sur le fair use et les sources utilisées pour former les systèmes d’IA.
Cinq éditeurs portent plainte contre Meta
La plainte réunit Hachette, Macmillan, McGraw Hill, Elsevier et Cengage, avec Scott Turow associé au dossier. Selon les plaignants, Meta et Mark Zuckerberg auraient « illégalement téléchargé » des millions de livres et d’articles via des sites pirates et des scrapes web non autorisés afin d’entraîner Llama, modèle évalué à plusieurs milliards de dollars.
Les avocats précisent que les accusés auraient aussi « recherché d’autres sources » après Common Crawl et que Zuckerberg aurait personnellement autorisé et encouragé ces actions.
Outre le téléchargement, les éditeurs soutiennent que les modèles de Meta « restituent » ces contenus dans leurs réponses, produisant des passages verbatim ou quasi verbatim issus de textes protégés par le droit d’auteur.
La plainte indique que l’IA est à l’origine d’innovations, mais rappelle que les tribunaux examineront ce qu’il est permis de faire au regard du droit d’auteur et du cadre du fair use.
Ce que réclament les plaignants et ce qui est en jeu
La demande centrale est la destruction de toutes les copies d’œuvres protégées utilisées pour l’entraînement, la cessation de toute activité illégale et, le cas échéant, d’autres mesures que la Cour jugera appropriées. Meta affirme, de son côté, que l’entraînement d’IA sur des contenus protégés peut relever du fair use et assure qu’elle se défendra vigoureusement devant la justice.
- Origine des textes : accusation selon laquelle les œuvres proviennent de sites pirates et de scrapes non autorisés.
- Restitution dans les résultats : Llama générerait des passages protégés mot à mot.
- Cadre légal : le fair use demeure un sujet débattu et potentiellement déterminant pour l’issue.
Ce que cela implique pour l’IA et le cadre légal
Cette affaire illustre la tension entre l’utilisation de textes protégés pour l’entraînement des modèles et la nécessité d’un cadre clair pour protéger les auteurs et les éditeurs. Les éditeurs, dont certains dominent le marché des manuels scolaires et de la littérature scientifique, pourraient influencer les pratiques d’entraînement et les revenus si les décisions judiciaires étendent le périmètre du droit d’auteur dans le domaine de l’IA.
Le débat sur le fair use est central: les décisions passées ont été favorables à certains usages, mais les circonstances entourant l’entraînement massif et les sources utilisées restent à préciser. Les éditeurs demandent une clarification du cadre, afin de garantir un équilibre entre innovation et protection des auteurs.
Pour terminer
En définitive, la question du droit d’auteur à l’ère de l’IA demeure en suspens: qui peut utiliser ou non des œuvres protégées pour entraîner des modèles, et sous quelles conditions? Les prochains mois devraient apporter des éléments sur la transparence des sources et les mécanismes de contrôle autour des données utilisées pour l’IA.