Les artistes critiquent le manque de transparence des données d'Apple Intelligence

Cette année encore, des millions d'appareils Apple fonctionneront avec Apple Intelligence, la version de Cupertino de l'IA générative, qui permet notamment de créer des images à partir de modèles de texte. Certains membres de la communauté créative sont toutefois mécontents du manque de transparence de l'entreprise concernant les données brutes sur lesquelles repose le modèle d'IA qui permet cela.

"J'aurais aimé qu'Apple explique au public de manière plus transparente comment ils ont collecté leurs données d'entraînement", a déclaré à Engadget Jon Lam, un artiste de jeux vidéo basé à Vancouver et militant pour les droits des créateurs. "Je pense que cette annonce n'aurait pas pu tomber à un pire moment".

Les créatifs ont toujours été parmi les clients les plus fidèles d'Apple, une entreprise décrite par son fondateur comme "le carrefour de la technologie et de l'art libre". Mais les photographes, les artistes conceptuels et les sculpteurs qui se sont entretenus avec Engadget ont déclaré être frustrés par le silence relatif d'Apple sur la manière dont elle collecte les données pour ses modèles d'IA.

La qualité de l'IA générative dépend des données avec lesquelles les modèles sont entraînés. Dans ce but, la plupart des entreprises ont collecté à peu près tout ce qu'elles pouvaient trouver sur Internet, sans se soucier du consentement ou de la rémunération. Près de 6 milliards d'images avec lesquelles différents modèles d'IA ont été entraînés proviennent également de LAION-5B, un ensemble de données contenant des images provenant d'Internet. Dans une interview avec Forbes, David Holz, CEO de Midjourney, a expliqué que les modèles de l'entreprise ont été entraînés sur "une grande partie d'Internet" et qu'il n'est "pas vraiment possible d'avoir 100 millions d'images et de savoir d'où elles proviennent".

Des artistes, des auteurs et des musiciens ont accusé des entreprises d'IA générative de s'approprier gratuitement leur travail et d'en tirer profit, ce qui a donné lieu à plus d'une douzaine de procès pour la seule année 2023. Le mois dernier, de grands labels de musique comme Universal et Sony ont poursuivi les générateurs de musique IA Suno et Udio, des startups valant des centaines de millions de dollars, pour violation des droits d'auteur. Ironiquement, les entreprises technologiques se sont à la fois défendues et ont conclu des accords de licence avec des fournisseurs de contenu, y compris des éditeurs d'informations.

Certains créatifs pensaient qu'Apple pouvait faire mieux. "C'est pourquoi je voulais leur donner un peu de confiance", explique Lam. "Je pensais qu'ils aborderaient le débat éthique différemment.

Au lieu de cela, Apple n'a donné que très peu d'informations sur la source des données d'entraînement pour Apple Intelligence. Dans un article publié sur son blog de recherche sur l'apprentissage automatique, l'entreprise a écrit que, comme d'autres entreprises travaillant dans le domaine de l'IA générative, elle récupérait des données publiques sur le web ouvert à l'aide d'AppleBot, son explorateur web propriétaire. John Giannandrea, directeur du département de l'intelligence artificielle et de l'apprentissage automatique chez Apple, a également déclaré qu'"une grande quantité de données d'entraînement a été créée par Apple", mais n'a pas donné plus de détails. Selon certaines informations, Apple aurait également signé des contrats avec Shutterstock et Photobucket afin d'obtenir des licences pour les images d'entraînement, mais n'a pas confirmé publiquement ces relations. Alors qu'Apple Intelligence tente de se distinguer par une approche prétendument plus respectueuse de la vie privée, utilisant le traitement sur l'appareil et le cloud computing sur mesure, les bases du modèle d'IA ne semblent guère différentes de celles de la concurrence.

Apple n'a pas répondu aux questions spécifiques d'Engadget.

En mai, Andrew Leung, un artiste basé à Los Angeles qui a travaillé sur des films tels que Black Panther, Le Roi Lion et Mulan, a qualifié l'IA générative de "plus grand vol dans l'histoire de l'intellect humain" lorsqu'il s'est exprimé devant l'Assemblée de l'État de Californie sur l'impact de l'IA sur l'industrie du divertissement. "Je tiens à préciser que l'utilisation du terme 'accessible au public' n'est pas autorisée", a déclaré Leung lors d'une interview. "Cela ne signifie pas automatiquement une utilisation équitable".

Le fait que des entreprises comme Apple ne proposent une option de sortie qu'après avoir déjà entraîné des modèles d'IA avec des données auxquelles elles n'ont pas consenti pose également problème, selon Leung. "Nous n'avons jamais demandé à y participer".

Apple permet aux sites web de choisir de ne pas être explorés par AppleBot pour les données d'entraînement d'Apple Intelligence - l'entreprise dit qu'elle respecte robots.txt, un fichier texte que chaque site web peut héberger pour indiquer aux robots d'exploration de rester à l'écart - mais ce serait au mieux un tri. On ne sait pas exactement quand AppleBot a commencé à parcourir le web, ni comment quiconque aurait pu se désinscrire avant. Et d'un point de vue technologique, la question de savoir comment ou si les demandes de suppression d'informations des modèles génératifs peuvent être prises en compte est ouverte.

Cette opinion est également exprimée sur des blogs de fans d'Apple. "Il est décevant de voir Apple diluer une série de fonctionnalités par ailleurs convaincantes (dont certaines que j'aimerais vraiment essayer) avec des pratiques qui ne sont pas meilleures que le reste de l'industrie", écrit Federico Viticci, fondateur et rédacteur en chef du blog des passionnés d'Apple, MacStories.

Adam Beane, un sculpteur basé à Los Angeles qui a créé une effigie de Steve Jobs pour Esquire en 2011, utilise exclusivement des produits Apple depuis 25 ans. Mais le manque de volonté de l'entreprise de révéler la source des données d'entraînement Apple Intelligence l'a désillusionné.

"Je suis de plus en plus en colère contre Apple", a-t-il déclaré à Engadget. "Vous devez être suffisamment bien informé pour savoir comment refuser l'entraînement de l'IA d'Apple, et ensuite vous devez faire confiance à une entreprise pour respecter vos souhaits. Et tout ce que je vois comme option de sortie, c'est de continuer à entraîner l'IA avec vos données".

Karla Ortiz, une illustratrice basée à San Francisco, est l'une des plaignantes dans une plainte déposée en 2023 contre Stability AI et DeviantArt, les sociétés derrière les modèles de création d'images Stable Diffusion et DreamUp, respectivement, et Midjourney. "L'essentiel est que nous savons [que] l'IA générative, pour fonctionner comme elle le fait, repose sur des transgressions et des violations massives des droits, privés et intellectuels", a-t-elle écrit dans un fil de discussion viral X sur Apple Intelligence. "C'est vrai pour toutes les entreprises d'IA [générative], et comme Apple nous impose cette technologie, il est important de se rappeler qu'ils ne sont pas une exception".

L'indignation à l'égard d'Apple s'inscrit également dans un sentiment plus large de trahison parmi les créateurs vis-à-vis des entreprises technologiques sur les outils desquelles ils s'appuient pour travailler. En avril, un rapport de Bloomberg a révélé qu'Adobe, l'éditeur de Photoshop et de nombreuses autres applications utilisées par les artistes, les designers et les photographes, avait utilisé des images provenant de sources douteuses pour former Firefly, son propre modèle de traitement d'images, qui, selon Adobe, a été formé de manière "éthique". Et au début du mois, l'entreprise a été contrainte de mettre à jour ses conditions d'utilisation pour préciser qu'elle n'utiliserait pas le contenu de ses clients pour entraîner des modèles d'IA générative, suite à leur indignation. "Toute la communauté créative a été trahie par chaque entreprise de logiciels à laquelle nous avons jamais fait confiance", déclare Lam. Il ne peut pas se passer totalement des produits Apple, mais il essaie de faire des concessions - il prévoit de remplacer son iPhone par un Light Phone III.

"Je pense qu'il y a un sentiment croissant qu'Apple devient comme tout le monde", dit Beane. "Une énorme entreprise qui place ses profits au-dessus de la vie des gens qui utilisent ses produits.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *