Gli artisti criticano la mancanza di trasparenza dei dati di Apple Intelligence

Noch in diesem Jahr werden Millionen von Apple-Geräten mit Apple Intelligence laufen, Cupertinos Version der generativen KI, die es unter anderem ermöglicht, Bilder aus Textvorlagen zu erstellen. Einige Mitglieder der kreativen Gemeinschaft sind jedoch unzufrieden mit der mangelnden Transparenz des Unternehmens in Bezug auf die Rohdaten, die dem KI-Modell zugrunde liegen, das dies ermöglicht.

“Ich wünschte, Apple hätte der Öffentlichkeit auf transparentere Weise erklärt, wie sie ihre Trainingsdaten gesammelt haben”, sagte Jon Lam, ein in Vancouver ansässiger Videospielkünstler und Aktivist für die Rechte von Kreativen, gegenüber Engadget. “Ich denke, die Ankündigung hätte zu keinem schlechteren Zeitpunkt kommen können.”

Kreative gehören seit jeher zu den treuesten Kunden von Apple, einem Unternehmen, das von seinem Gründer als “Schnittpunkt von Technologie und freier Kunst” beschrieben wurde. Aber Fotografen, Konzeptkünstler und Bildhauer, die mit Engadget sprachen, sagten, sie seien frustriert über Apples relatives Schweigen darüber, wie es Daten für seine KI-Modelle sammelt.

Generative KI ist nur so gut wie die Daten, mit denen die Modelle trainiert werden. Zu diesem Zweck haben die meisten Unternehmen so ziemlich alles gesammelt, was sie im Internet finden konnten, ohne sich um Zustimmung oder Bezahlung zu kümmern. Fast 6 Milliarden Bilder, mit denen verschiedene KI-Modelle trainiert wurden, stammen ebenfalls aus LAION-5B, einem Datensatz mit Bildern aus dem Internet. In einem Interview mit Forbes erklärte David Holz, CEO von Midjourney, dass die Modelle des Unternehmens auf “einem großen Teil des Internets” trainiert wurden und dass es “nicht wirklich möglich ist, 100 Millionen Bilder zu haben und zu wissen, woher sie stammen”.

Künstler, Autoren und Musiker haben generative KI-Unternehmen beschuldigt, sich ihre Arbeit kostenlos anzueignen und daraus Profit zu schlagen, was allein im Jahr 2023 zu mehr als einem Dutzend Klagen geführt hat. Letzten Monat verklagten große Musiklabels wie Universal und Sony die KI-Musikgeneratoren Suno und Udio, Startups im Wert von Hunderten von Millionen Dollar, wegen Urheberrechtsverletzung. Ironischerweise haben sich die Technologieunternehmen sowohl verteidigt als auch Lizenzvereinbarungen mit Inhaltsanbietern, einschließlich Nachrichtenverlagen, geschlossen.

Einige Kreative dachten, dass Apple es besser machen könnte. “Deshalb wollte ich ihnen einen kleinen Vertrauensvorschuss geben”, sagt Lam. “Ich dachte, sie würden die ethische Diskussion anders angehen.

Stattdessen gab Apple nur sehr wenig über die Quelle der Trainingsdaten für Apple Intelligence preis. In einem Beitrag auf dem firmeneigenen Forschungsblog für maschinelles Lernen schrieb das Unternehmen, dass es, wie andere Unternehmen, die sich mit generativer KI beschäftigen, öffentliche Daten aus dem offenen Web mit Hilfe von AppleBot, seinem proprietären Web-Crawler, abrufe. John Giannandrea, Leiter der Abteilung für künstliche Intelligenz und maschinelles Lernen bei Apple, sagte ebenfalls, dass “eine große Menge an Trainingsdaten von Apple erstellt wurde”, ging aber nicht näher darauf ein. Berichten zufolge hat Apple auch Verträge mit Shutterstock und Photobucket unterzeichnet, um Trainingsbilder zu lizenzieren, hat diese Beziehungen aber nicht öffentlich bestätigt. Während Apple Intelligence versucht, sich mit einem angeblich datenschutzfreundlicheren Ansatz zu profilieren, der die Verarbeitung auf dem Gerät und maßgeschneidertes Cloud-Computing nutzt, scheinen sich die Grundlagen des KI-Modells kaum von denen der Konkurrenz zu unterscheiden.

Apple hat auf spezifische Fragen von Engadget nicht geantwortet.

Im Mai bezeichnete Andrew Leung, ein in Los Angeles ansässiger Künstler, der an Filmen wie Black Panther, Der König der Löwen und Mulan mitgewirkt hat, generative KI als den größten Diebstahl in der Geschichte des menschlichen Intellekts”, als er vor der kalifornischen Staatsversammlung über die Auswirkungen von KI auf die Unterhaltungsindustrie sprach. Ich möchte darauf hinweisen, dass die Verwendung des Begriffs “öffentlich zugänglich” nicht zulässig ist”, sagte Leung in einem Interview. “Das bedeutet nicht automatisch eine faire Nutzung.”

Problematisch sei auch, dass Unternehmen wie Apple erst dann eine Ausstiegsoption anbieten, wenn sie bereits KI-Modelle mit Daten trainiert haben, denen sie nicht zugestimmt haben, so Leung. “Wir haben nie darum gebeten, daran teilzunehmen.”

Apple erlaubt es Websites, sich dagegen zu entscheiden, von AppleBot für die Trainingsdaten von Apple Intelligence gecrawlt zu werden – das Unternehmen sagt, es respektiere robots.txt, eine Textdatei, die jede Website hosten kann, um Crawlern mitzuteilen, dass sie wegbleiben sollen – aber das wäre bestenfalls eine Sortierung. Es ist nicht klar, wann AppleBot begonnen hat, das Web zu durchforsten, oder wie irgendjemand sich vorher hätte abmelden können. Und aus technologischer Sicht ist es eine offene Frage, wie oder ob Anfragen zur Entfernung von Informationen aus generativen Modellen überhaupt berücksichtigt werden können.

Diese Meinung wird auch in Blogs von Apple-Fans geäußert. “Es ist enttäuschend zu sehen, wie Apple eine ansonsten überzeugende Reihe von Funktionen (von denen ich einige wirklich gerne ausprobieren würde) mit Praktiken verwässert, die nicht besser sind als der Rest der Branche”, schreibt Federico Viticci, Gründer und Chefredakteur des Apple-Enthusiasten-Blogs MacStories.

Adam Beane, ein in Los Angeles ansässiger Bildhauer, der 2011 ein Abbild von Steve Jobs für Esquire schuf, verwendet seit 25 Jahren ausschließlich Apple-Produkte. Aber die mangelnde Bereitschaft des Unternehmens, die Quelle der Apple Intelligence Trainingsdaten offen zu legen, habe ihn desillusioniert.

“Ich bin zunehmend verärgert über Apple”, sagte er gegenüber Engadget. “Man muss gut genug informiert sein, um zu wissen, wie man das Training von Apples KI ablehnen kann, und dann muss man darauf vertrauen, dass ein Unternehmen seine Wünsche respektiert. Und alles, was ich als Ausstiegsoption sehe, ist, die KI weiter mit Ihren Daten zu trainieren.”

Karla Ortiz, eine in San Francisco ansässige Illustratorin, ist eine der Klägerinnen in einer im Jahr 2023 eingereichten Klage gegen Stability AI und DeviantArt, die Unternehmen hinter den Bilderstellungsmodellen Stable Diffusion bzw. DreamUp und Midjourney. “Die Quintessenz ist, dass wir wissen, [dass] generative KI, um so zu funktionieren, wie sie funktioniert, auf massiven Ãœberschreitungen und Verletzungen von Rechten, privaten und intellektuellen, beruht”, schrieb sie in einem viralen X-Thread über Apple Intelligence. “Das gilt für alle [generativen] KI-Unternehmen, und da Apple uns diese Technologie aufzwingt, ist es wichtig, sich daran zu erinnern, dass sie keine Ausnahme sind.”

Die Empörung über Apple ist auch Teil eines breiteren Gefühls des Verrats unter Kreativen gegenüber Technologieunternehmen, auf deren Werkzeuge sie sich bei ihrer Arbeit verlassen. Im April enthüllte ein Bloomberg-Bericht, dass Adobe, der Hersteller von Photoshop und vielen anderen Anwendungen, die von Künstlern, Designern und Fotografen verwendet werden, Bilder aus fragwürdigen Quellen verwendet hatte, um Firefly zu trainieren, sein eigenes Bildbearbeitungsmodell, das laut Adobe “ethisch” trainiert wurde. Und Anfang dieses Monats sah sich das Unternehmen gezwungen, seine Nutzungsbedingungen zu aktualisieren, um klarzustellen, dass es nicht die Inhalte seiner Kunden verwenden würde, um generative KI-Modelle zu trainieren, nachdem diese sich empört hatten. “Die gesamte kreative Gemeinschaft wurde von jedem einzelnen Softwareunternehmen, dem wir jemals vertraut haben, verraten”, sagt Lam. Ganz ohne Apple-Produkte geht es für ihn nicht, aber er versucht, Abstriche zu machen – er plant, sein iPhone durch ein Light Phone III zu ersetzen.

“Ich glaube, es wächst das Gefühl, dass Apple wie alle anderen wird”, sagt Beane. “Ein riesiges Unternehmen, das seinen Profit über das Leben der Menschen stellt, die seine Produkte benutzen.

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *