Mistral AI accusée de contrefaçon : des classiques littéraires au cœur du scandale
L’étoile montante française de l’intelligence artificielle se retrouve dans la tourmente. Une enquête révèle que Mistral AI aurait utilisé des œuvres littéraires protégées pour développer ses modèles d’IA, soulevant de graves questions juridiques sur les pratiques d’entraînement des algorithmes. Alors que la start-up tricolore vise le milliard de dollars de revenus, ces accusations menacent son ascension fulgurante.
Des classiques de la littérature reproduits par l’IA
Les révélations de Mediapart sont édifiantes. Des tests menés sur le modèle Mistral Large 3-2512 et son chatbot Le Chat démontrent une capacité troublante à restituer de longs passages d’ouvrages célèbres.
Le système parvient à reproduire 35% du premier tome de Harry Potter, 58% du Petit Prince et 25% du Hobbit. Les débuts de romans emblématiques comme 1984 de George Orwell ou Le Trône de Fer sont également restitués avec précision.
Au-delà de la littérature, le modèle reproduit également des paroles de chansons. « Rocket Man » d’Elton John figure parmi les œuvres musicales copiées, dépassant largement les seuils légaux.
Le cadre juridique européen en question
La jurisprudence est claire : un tribunal de Munich considère que la restitution de plus de 15 mots consécutifs constitue une contrefaçon. Les résultats obtenus par Mediapart dépassent largement ce seuil.
La directive européenne de 2019 autorise le « text and data mining » pour l’entraînement des IA, mais sous conditions. Les détenteurs de droits peuvent s’y opposer via un fichier robots.txt, un mécanisme technique de protection.
Mistral AI est précisément accusée de ne pas respecter ces dispositifs d’opposition, ignorant les barrières mises en place par les éditeurs et ayants droit.
Des obligations de transparence renforcées
L’AI Act européen impose désormais aux développeurs d’IA de détailler les sources utilisées pour l’entraînement de leurs modèles. Cette exigence de transparence vise à protéger les droits d’auteur dans l’ère numérique.
Mistral AI devra donc clarifier l’origine des données ayant servi à alimenter ses algorithmes, une obligation qui pourrait révéler l’ampleur des emprunts non autorisés.
La défense ambiguë de la licorne française
Face aux accusations, l’entreprise invoque un « principe de réalité » concernant la collecte de contenus en ligne. Un argument qui peine à convaincre les défenseurs du droit d’auteur.
Mistral AI précise utiliser des robots pour enrichir les réponses de son chatbot, mais nie leur emploi pour la collecte de données d’entraînement. Une distinction technique qui ne règle pas la question fondamentale de l’utilisation initiale des œuvres protégées.
Une ascension fulgurante sous pression
Ces révélations interviennent au pire moment pour la start-up parisienne. Valorisée à 10 milliards d’euros, elle vient d’annoncer un investissement de 1,2 milliard d’euros dans un data center dédié à l’intelligence artificielle.
L’entreprise s’est fixé un objectif ambitieux : atteindre un milliard de dollars de revenus d’ici 2026. Un partenariat récent avec HSBC vise à transformer les outils métiers de la banque britannique.
Dans le viseur d’Apple
Des rumeurs persistantes évoquent un possible rachat par Apple pour 6 milliards d’euros. Ces accusations de contrefaçon pourraient compliquer, voire compromettre, une telle opération.
Mistral AI ambitionne d’établir un nouveau standard open source dans le secteur de l’IA. Mais la course à la taille des modèles implique des enjeux juridiques et éthiques considérables que la jeune pousse française semble avoir sous-estimés.



Laisser un commentaire