Entro la fine dell'anno, milioni di dispositivi Apple eseguiranno Apple Intelligence, la versione di AI generativa di Cupertino che consente, tra l'altro, di creare immagini a partire da modelli di testo. Tuttavia, alcuni membri della comunità creativa non sono soddisfatti della mancanza di trasparenza dell'azienda riguardo ai dati grezzi alla base del modello di IA che rende possibile tutto ciò.
"Avrei voluto che Apple fosse stata più trasparente nello spiegare al pubblico come raccoglieva i dati di allenamento", ha dichiarato a Engadget Jon Lam, artista di videogiochi di Vancouver e attivista per i diritti dei creatori. "Non credo che l'annuncio potesse arrivare in un momento peggiore".
I creativi sono sempre stati tra i clienti più fedeli di Apple, un'azienda descritta dal suo fondatore come "l'intersezione tra tecnologia e belle arti". Ma i fotografi, gli artisti concettuali e gli scultori che hanno parlato con Engadget si sono detti frustrati dal relativo silenzio di Apple su come raccoglie i dati per i suoi modelli di intelligenza artificiale.
L'intelligenza artificiale generativa è buona solo quanto i dati utilizzati per addestrare i modelli. A tal fine, la maggior parte delle aziende ha raccolto praticamente tutto ciò che poteva trovare su Internet, senza preoccuparsi del consenso o del pagamento. Quasi 6 miliardi di immagini utilizzate per addestrare vari modelli di IA provengono anche da LAION-5B, un set di immagini provenienti da Internet. In un'intervista a Forbes, David Holz, CEO di Midjourney, ha spiegato che i modelli dell'azienda sono stati addestrati su "un'ampia porzione di Internet" e che "non è davvero possibile avere 100 milioni di immagini e sapere da dove provengono".
Artisti, autori e musicisti hanno accusato le aziende di IA generativa di appropriarsi gratuitamente del loro lavoro e di trarne profitto, dando vita a più di una dozzina di cause legali solo nel 2023. Il mese scorso, importanti etichette musicali come Universal e Sony hanno citato in giudizio i generatori di musica AI Suno e Udio, startup dal valore di centinaia di milioni di dollari, per violazione del copyright. Ironicamente, le aziende tecnologiche si sono difese e hanno stipulato accordi di licenza con i fornitori di contenuti, compresi gli editori di notizie.
Alcuni creativi pensavano che Apple potesse fare di meglio. "È per questo che ho voluto concedere loro un piccolo atto di fede", dice Lam. "Pensavo che avrebbero affrontato la discussione etica in modo diverso.
Apple ha invece rivelato ben poco sulla fonte dei dati di addestramento di Apple Intelligence. In un post sul blog dedicato alla ricerca sull'apprendimento automatico, l'azienda ha scritto che, come altre aziende che si occupano di IA generativa, recupera dati pubblici dal web aperto utilizzando AppleBot, il suo web crawler proprietario. John Giannandrea, responsabile dell'intelligenza artificiale e dell'apprendimento automatico di Apple, ha anche affermato che "una grande quantità di dati di addestramento è stata creata da Apple", ma non ha approfondito. Apple avrebbe anche siglato accordi con Shutterstock e Photobucket per la concessione in licenza di immagini di addestramento, ma non ha confermato pubblicamente questi rapporti. Sebbene Apple Intelligence stia cercando di distinguersi con un approccio presumibilmente più rispettoso della privacy che utilizza l'elaborazione sul dispositivo e il cloud computing su misura, i fondamenti del suo modello di intelligenza artificiale sembrano poco diversi da quelli dei suoi concorrenti.
Apple non ha risposto alle domande specifiche di Engadget.
A maggio Andrew Leung, un artista di Los Angeles che ha lavorato a film come Black Panther, Il Re Leone e Mulan, ha definito l'IA generativa "il più grande furto nella storia dell'intelletto umano" quando ha parlato all'Assemblea dello Stato della California dell'impatto dell'IA sull'industria dell'intrattenimento. Vorrei sottolineare che l'uso del termine "pubblico dominio" non è accettabile", ha detto Leung in un'intervista. "Non significa automaticamente fair use".
È inoltre problematico che aziende come Apple offrano un'opzione di opt-out solo dopo aver già addestrato i modelli di IA con dati per i quali non è stato dato il consenso, afferma Leung. "Non abbiamo mai chiesto di partecipare a questo".
Apple consente ai siti web di non essere sottoposti a crawling da parte di AppleBot per i dati di formazione dell'Apple Intelligence - l'azienda afferma di rispettare il file robots.txt, un file di testo che qualsiasi sito web può ospitare per indicare ai crawler di starne alla larga - ma si tratterebbe di un'operazione di selezione, nella migliore delle ipotesi. Non è chiaro quando AppleBot abbia iniziato a strisciare il web, o come qualcuno possa aver scelto di non farlo prima di allora. E da un punto di vista tecnologico, è una questione aperta come o se le richieste di rimozione delle informazioni dai modelli generativi possano essere onorate.
Questa opinione è espressa anche nei blog dei fan di Apple. "È deludente vedere Apple annacquare una serie di funzioni altrimenti interessanti (alcune delle quali mi piacerebbe davvero provare) con pratiche che non sono migliori di quelle del resto del settore", scrive Federico Viticci, fondatore e caporedattore del blog MacStories, dedicato agli appassionati di Apple.
Adam Beane, uno scultore di Los Angeles che nel 2011 ha creato un ritratto di Steve Jobs per Esquire, utilizza esclusivamente prodotti Apple da 25 anni. Ma la riluttanza dell'azienda a rivelare la fonte dei dati di formazione dell'Apple Intelligence lo ha disilluso.
"Sono sempre più infastidito da Apple", ha dichiarato a Engadget. "Bisogna essere abbastanza informati da sapere come rinunciare all'addestramento dell'IA di Apple, e poi bisogna fidarsi del fatto che un'azienda rispetterà i tuoi desideri. E tutto ciò che vedo come opzione di opt-out è continuare ad addestrare l'IA con i tuoi dati".
Karla Ortiz, un'illustratrice con sede a San Francisco, è una dei querelanti in una causa intentata nel 2023 contro Stability AI e DeviantArt, le società dietro i modelli di creazione di immagini Stable Diffusion e DreamUp e Midjourney, rispettivamente. "Il punto fondamentale è che sappiamo che l'IA generativa, per funzionare nel modo in cui funziona, si basa su massicce trasgressioni e violazioni dei diritti, privati e intellettuali", ha scritto in un thread virale di X sull'intelligenza di Apple. "Questo vale per tutte le aziende di IA [generativa] e con Apple che ci impone questa tecnologia, è importante ricordare che non fa eccezione".
L'indignazione nei confronti di Apple è anche parte di un più ampio senso di tradimento da parte dei creativi nei confronti delle aziende tecnologiche, i cui strumenti sono utilizzati per il loro lavoro. Ad aprile, un rapporto di Bloomberg ha rivelato che Adobe, il produttore di Photoshop e di molte altre applicazioni utilizzate da artisti, designer e fotografi, aveva utilizzato immagini provenienti da fonti discutibili per addestrare Firefly, il proprio modello di editing delle immagini che, secondo Adobe, è stato addestrato "eticamente". All'inizio di questo mese, l'azienda è stata costretta ad aggiornare i propri termini di servizio per chiarire che non avrebbe utilizzato i contenuti dei propri clienti per addestrare modelli di intelligenza artificiale generativa, dopo che questi si erano indignati. "L'intera comunità creativa è stata tradita da ogni singola azienda di software di cui ci siamo fidati", afferma Lam. Non può fare a meno del tutto dei prodotti Apple, ma sta cercando di ridurre i costi: ha intenzione di sostituire il suo iPhone con un Light Phone III.
"Penso che ci sia una crescente sensazione che Apple stia diventando come tutti gli altri", dice Beane. "Un'azienda enorme che mette i suoi profitti al di sopra della vita delle persone che usano i suoi prodotti.