DALL·E 2 e i bias dell'intelligenza artificiale

Il laboratorio di ricerca americano OpenAI ha rilasciato all’inizio di aprile DALL·E 2, un nuovo sistema di intelligenza artificiale (AI) in grado di generare immagini realistiche e artistiche a partire da un input di testo.

Nel 2020, i ricercatori di OpenAI avevano lanciato GPT-3, un modello di linguaggio che, ricevuto un input dall’utente, produce testi e dialoghi simili a come li scriverebbe un essere umano. Per funzionare, GPT-3 utilizza l’apprendimento profondo (in inglese deep learning), sfruttando un grande database di testi per “imparare” a scrivere. La prima versione di DALL·E, presentata a gennaio 2021, era basata su GPT-3 e aveva già dato risultati soddisfacenti.

Come funziona

DALL·E 2 funziona in modo simile al suo predecessore, ma i ricercatori hanno migliorato il modello di apprendimento utilizzato dall’intelligenza artificiale. Anziché basarsi esclusivamente sul riconoscimento di testo o immagini, DALL·E 2 sfrutta una rete neurale addestrata per associare a ogni immagine una descrizione (o tag) testuale. In questo modo, l’AI può creare da zero un’immagine ad alta risoluzione che rappresenta in maniera molto fedele ciò che l’utente ha chiesto. Una volta generata, l’immagine può essere modificata cambiando il testo di input.

Un esempio di output generato da DALL·E 2, pubblicato sul sito web di OpenAI.

Poiché non si basa soltanto sul riconoscimento dell’input, ma anche sulla sua comprensione, DALL·E 2 è molto accurato nell’interpretazione della richiesta dell’utente e le immagini che crea sono notevoli. Su Twitter circolano già diversi contenuti creati grazie a questa intelligenza artificiale, da foto realistiche come “padre e figlio che pescano in un ruscello di montagna, visti da dietro”, al fotomontaggio di “una chitarra elettrica fatta di pizza”.

Father and son fishing mountain stream, viewed from behind. #dalle #dalle2 (no edits) pic.twitter.com/dnOE5aviBf
— SleeplessDoc (@1SleeplessDoc) April 21, 2022

A photo of an electric guitar made entirely out of pizza. #dalle2 pic.twitter.com/gjfMTbax64
— PizzaDALL-E (@PizzaDalle) April 20, 2022

Sam Altman, CEO di OpenAI, ha scritto che DALL·E 2 «è la cosa più divertente con cui giocare che abbiamo realizzato finora». Le potenziali applicazioni di questa intelligenza artificiale sono numerose, a partire da quelle in ambito artistico e creativo. DALL·E 2 può essere utilizzato per creare opere d’arte digitale (e venderle), oppure per supportare il lavoro di grafici, designer e sviluppatori di videogiochi.

Rischi, limiti e bias

Il progetto presenta anche lati negativi, di cui la stessa OpenAI è a conoscenza. Se usato in modo non appropriato, DALL·E 2 è in grado di generare output pericolosi, come immagini pornografiche o violente. Per questo motivo, gli sviluppatori di DALL·E 2 hanno impostato dei limiti sul tipo di richieste che è possibile fare, per impedire agli utenti di creare, caricare o condividere immagini che incitino all’odio oppure contenuti discriminatori o fonte di disinformazione.

Al fine di raffinare le tecniche di prevenzione da uso scorretto, al momento DALL·E 2 non è disponibile per tutti, ma è in fase di testing su un gruppo ristretto di utenti fidati e selezionati dagli sviluppatori. L’obiettivo di questo passaggio, che si chiama red teaming, è trovare difetti e vulnerabilità dell’intelligenza artificiale, ragionando come un utente con intenzioni pericolose. I partecipanti al processo di test tentano di generare contenuti controversi aggirando i filtri dell’intelligenza artificiale, per esempio chiedendo a DALL·E 2 di disegnare “un cavallo che dorme in una piscina di liquido rosso”.

Un esempio di input inappropriato. Credits: *OpenAI*

I problemi legati ai contenuti violenti non sono gli unici. Ciò che è emerso dalle prime fasi di ricerca, infatti, è che DALL·E 2 ha ereditato dei bias – dei pregiudizi verso alcuni gruppi o caratteristiche – dall’insieme di dati utilizzati per allenare la rete neurale su cui basa il proprio funzionamento.

I test hanno mostrato che DALL·E 2 tende a rafforzare stereotipi di etnia e di genere. L’input “assistente di volo”, per esempio, restituisce esclusivamente immagini di donne, mentre la richiesta “CEO” genera soltanto foto di uomini bianchi in giacca e cravatta. In generale, DALL·E 2 sembra avere una visione “occidentale” della realtà, come evidenziano alcuni test sulle parole chiave “matrimonio” e “ristorante”. In tutti i casi, l’intelligenza artificiale propone immagini ambientate in contesti occidentali e, nel caso del matrimonio, sceglie di raffigurare coppie eterosessuali.

Risultato dell’input “CEO”. Credits: OpenAI
Risultato dell’input “assistente di volo”. Credits: OpenAI
Risultato dell’input “ristorante”. Credits: OpenAI
Risultato dell’input “matrimonio”. Credits: OpenAI

«Il motivo è che il database stesso utilizzato da DALL·E 2 include degli stereotipi», ha detto a theWise Magazine Nicolas Moës, AI Policy Researcher di The Future Society, un think-tank indipendente che si occupa di promuovere politiche per un uso responsabile dell’intelligenza artificiale.

«Online si trovano molte più fotografie di CEO uomini, per esempio, e poiché DALL·E 2 costruisce la propria comprensione a partire da queste associazioni tra immagini e descrizioni, è portato a sviluppare certi bias», ha aggiunto Moës, spiegando che questo comportamento non è soprendente, proprio perché è lo stesso che caratterizza gli esseri umani.

Questi problemi non sono una novità. GPT-3, ad esempio, tendeva a descrivere con stereotipi certe etnie o minoranze. In quell’occasione, gli sviluppatori avevano risolto il problema raffinando il modello di linguaggio, per “educarlo” a modificare il proprio comportamento di fronte a certi input.

Nei database utilizzati dalle intelligenze artificiali si trovano migliaia di contenuti, alcuni anche vecchi di dieci o quindici anni. Secondo Moës, si tratta di una “cristallizzazione” di stereotipi, in quanto i dati in sé sono statici e non si evolvono di pari passo con la società. «Anche se utilizzassimo solo i dati più recenti nella costruzione di un database, tra dieci anni la nostra percezione su certi temi sarà cambiata, e non avremo risolto niente», ha aggiunto il ricercatore.

I piani dell’Unione Europea

«Pensare di eliminare ogni bias esistente è impossibile», ha detto Moës, che propone in alternativa di agire sull’output generato dall’intelligenza artificiale per correggerlo prima della pubblicazione.

Per affrontare il problema non è sufficiente agire sul lato informatico, ma è necessario sviluppare maggiore coscienza collettiva riguardo alle intelligenze artificiali. L’Unione Europea sta lavorando all’EU AI Act, il primo progetto per regolamentare l’uso delle intelligenze artificiali a livello internazionale.

Il provvedimento definisce criteri precisi per identificare minoranze e altri gruppi sociali vulnerabili, al fine di garantire maggiore accuratezza negli output delle AI. Un altro punto riguarda la qualità dei database, affinché vengano definiti degli standard di inclusione e rappresentanza della popolazione europea. Secondo i piani, il testo dovrebbe entrare in vigore a partire dal 2026.

A detta di Moës, una governance comune sul tema è fondamentale per incentivare investimenti e progetti di ricerca e sviluppo che condividano lo stesso approccio etico nei confronti dell’AI. «Il discorso non si limita soltanto agli stereotipi di genere, ma riguarda anche questioni di sicurezza pubblica come la prevenzione della disinformazione». Moës ha descritto anche come l’EU AI Act migliorerebbe l’accountability del settore, perché gli sviluppatori sarebbero obbligati a costruire dataset più rappresentativi e accurati.

Aumentare la consapevolezza

Spesso le logiche commerciali e la necessità di convincere gli investitori incentivano le aziende a rilasciare i propri prodotti prima che vengano testati con cura sul piano etico. OpenAI sembra avere imparato dagli errori causati dalla frenesia di rilasciare in fretta un nuovo modello e oggi presta molta più attenzione e trasparenza verso questo tema. I rischi e i limiti di DALL·E 2 in questa fase di sviluppo sono pubblici e diffusi direttamente dai ricercatori man mano che emergono.

«Sono molto favorevole a un approccio aperto da parte delle aziende, perché serve per aumentare la consapevolezza sui rischi connessi alle intelligenze artificiali», ha aggiunto Moës. Il ricercatore ritiene che bisognerebbe incentivare ulteriormente questa pratica, per esempio rendendo obbligatoria la fase di red teaming prima del rilascio di una nuova intelligenza artificiale.

The Future Society ha annunciato lo scorso dicembre l’avvio di un MOOC (Massive Open Online Course) per formare esperti di diritto e promuovere il dibattito sull’etica dell’intelligenza artificiale. «È nostro compito fare il possibile per mitigare i rischi che derivano dalle AI. In tutti i settori industriali i prodotti vengono testati e controllati prima di essere messi in vendita – penso alle automobili, per esempio. Il mondo dell’intelligenza artificiale ha bisogno dello stesso approccio rigoroso e attento, sia sul piano tecnologico sia nel creare maggiore consapevolezza riguardo ai problemi e alle possibili soluzioni», ha concluso Moës.