Un po’ di teoria dei giochi

La teoria dei giochi è una disciplina che studia modelli matematici di interazione strategica tra agenti razionali e fornisce un metodo algoritmico per calcolare quale strategia di azione vi risulterebbe più favorevole, indipendentemente dalle azioni degli altri agenti. In questo articolo viene presentato il dilemma del prigioniero, uno degli esempi più classici di applicazione di questa teoria, per poi illustrare alcuni altri ambiti cui questa teoria viene applicata: controlli in aeroporto, economia e sport.

Carlo e Alice: il dilemma del prigioniero

Due criminali, entrambi colpevoli, vengono catturati, separati e interrogati in due stanze differenti, senza alcuna possibilità di comunicare l’uno con l’altro. «Ha a disposizione due possibilità» viene comunicato a ciascuno. «Può confessare, oppure restare in silenzio. Se lei sceglierà di confessare e il suo complice restasse in silenzio, non sarà soggetto ad alcuna condanna. Il suo complice, invece, avrà una pena di sette anni. Se invece confessaste entrambi, subirete sei anni di pena a testa. Nel caso in cui lei restasse in silenzio, ma il suo complice scegliesse di confessare, la pena consisterà in sette anni pena per lei e nessuno per il suo complice. Se restaste in silenzio entrambi, sconterete un solo anno di pena».

Gli scenari possibili possono essere sintetizzati in questo modo. Con “collabora” si intende la collaborazione con le forze dell’ordine; non collaborare significa restare in silenzio.

In questo gioco si assume che il complice non sia né un vostro amico, né una vostra familiare, e in generale nessuno che voi desideriate proteggere o che vi aspettiate desideri proteggere voi.

Cosa fareste, considerato che comunicare con il vostro complice (o la vostra complice) è impossibile?

Il dilemma del prigioniero in teoria dei giochi

La teoria dei giochi è una disciplina che studia modelli matematici di interazione strategica tra agenti razionali, e fornisce un metodo algoritmico per calcolare quale strategia di azione vi risulterebbe più favorevole, indipendentemente dalle azioni del vostro complice.

In questo caso è sufficiente considerare le due possibilità. 

Alice potrebbe collaborare. Collaborando – quindi, tradendo il suo complice – lo scenario peggiore possibile le dà sei anni di pena. Se invece le va bene, è libera. Nel caso in cui Alice restasse in silenzio, le sue prospettive peggiorerebbero in entrambi i casi. Se le andasse bene, resterebbe comunque in carcere per un anno, se invece le andasse male, gli anni diventerebbero sette.

Quindi, per come è strutturato il gioco, ad Alice conviene collaborare, e lo stesso a Carlo. Collaborando entrambi, tuttavia, non ottengono quella che sarebbe la soluzione migliore in generale, che è evidentemente il silenzio, grazie al quale sarebbero entrambi liberi dopo soltanto un anno. 

La scelta di Alice (o quella di Carlo) di collaborare, in teoria dei giochi, si chiama strategia dominante. Consiste nella strategia che, indipendentemente dalle scelte dell’avversario, permette di ottenere il pay-off più alto. Quella di non collaborare, invece, si definisce strategia dominata. Non sempre esiste una dominanza stretta (che rende cioè quell’alternativa la migliore in qualsiasi circostanza). In tal caso, si parla di dominanza debole (cioè tale da essere la migliore solo in determinate circostanze).

L’equilibrio di Nash, che prende il nome dal premio Nobel – e protagonista di A Beautiful Mind – John Nash, è una combinazione di  strategie in cui ciascun giocatore effettua la sua strategia dominante. Nel nostro esempio, l’equilibrio di Nash corrisponde al caso in cui Alice e Carlo scegliessero congiuntamente di collaborare, con una pena di sei anni per entrambi. Si noti, di nuovo, che l’equilibrio di Nash non corrisponde al miglior risultato per entrambi – che sarebbe invece il silenzio congiunto – ma alla situazione di stabilità prodotta dalle scelte individuali indipendenti di ciascuno. 

Ho illustrato il dilemma in questa forma perché è quella più celebre, ma è un modello interpretativo che viene applicato allo studio di un molto più vasto raggio di fenomeni, dal funzionamento della Borsa alla corsa agli armamenti, dallo sport all’evoluzione naturale.

Viaggi e oggetti d’antiquariato: il dilemma del viaggiatore

Kaushik Basu, economista, ha creato, nel 1994, il dilemma del viaggiatore

In questa variante Alice e Carlo sono di ritorno da una vacanza sul Pacifico. Al ritorno, scoprono che la compagnia aerea ha danneggiato i due oggetti di antiquariato identici che avevano acquistato. La compagnia aerea deve stimare il costo dei pezzi, ma teme che i suoi clienti ne esagerino il valore.

Chiede a ognuno dei due di scrivere il prezzo dell’oggetto, espresso con un numero tra 2 e 100. Se scriveranno lo stesso numero, quello sarà il prezzo che otterranno. Se però scrivessero un numero diverso, si presumerà che chi ha scritto il più basso sia sincero e che l’altro stia mentendo. Il sincero riceverà il prezzo che ha indicato con un bonus di due euro, mentre chi ha mentito ne riceverà due in meno. La logica stretta del gioco indicherebbe scrivere 2 come strategia dominante (perché, qualunque numero Carlo scriva, se Alice scrivesse due Carlo riceverebbe zero. Scrivendo due, invece, si ha la certezza di ricevere almeno due euro, e massimo 4). 

Gli studi su questo esempio hanno dimostrato che la maggior parte delle persone tende a scegliere un numero molto più grande di due. Basu racconta di aver utilizzato questo esempio per dimostrare l’insufficienza di molte teorie economiche che applicano la teoria dei giochi allo studio dei meccanismi economici. «Nel dilemma del viaggiatore, la soluzione efficiente è che entrambi scelgano 100, perché ha come risultato il massimo ricavo complessivo per tutti e due. L’”egoismo liberista” farebbe sì che le persone si allontanassero da 100 verso numeri inferiori, ottenendo una minore efficienza nella speranza di ottenere individualmente di più, ma se la gente non gioca l’equilibrio di Nash gli assunti degli economisti sul comportamento razionale vanno riveduti».

Sport, doping e teoria dei giochi

Michael Shermer, fondatore di Skeptic e ciclista dilettante, racconta in che modo l’equilibrio di Nash si applica al problema del doping nello sport. «Per mettere fine al doping, il gioco si dovrebbe ristrutturare in modo che la competizione pulita sia in una situazione di equilibrio di Nash. Gli organi di controllo dovrebbero cambiare i valori di pay-off. Quando gli altri giocatori rispettano le regole, il pay-off per fare altrettanto deve essere maggiore rispetto al pay-off che si ottiene barando. E, anche quando gli altri giocatori barano, il pay-off che si ottiene rispettando le regole deve essere maggiore rispetto al pay-off che si ottiene barando. I giocatori, insomma, non devono vedere come uno svantaggio il fatto di seguire le regole. Nel dilemma del prigioniero, abbassare il pay-off della confessione e aumentare il pay-off del silenzio nel caso l’altro prigioniero confessi aumenta la cooperazione. Ma il modo più efficacie per aumentare la cooperazione tra i giocatori è farli comunicare prima di iniziare il gioco. Nello sport, questo significherebbe rompere l’omertà. Tutti devono ammettere che il problema esiste. Successivamente vanno eseguiti i controlli, e i risultati vanno comunicati regolarmente e in maniera trasparente a tutti, finché danno esito negativo. In questo modo si dimostrerebbe che il pay-off del rispetto delle regole è maggiore di quello relativo al doping, indipendentemente da quello che fanno gli altri».

Shermer propone quattro suggerimenti, per il ciclismo.

(1) Immunità a tutti per il doping assunto in passato. L’intero sistema è corrotto e quasi tutti hanno fatto uso di doping, quindi non serve a niente togliere il titolo al vincitore quando è quasi sicuro che anche gli altri erano dopati.

(2) Aumentare il numero degli atleti sottoposti a test, in gara e fuori gara, soprattutto immediatamente prima e dopo le gare, per impedire l’uso di contromisure e trucchi.

(3) Stabilire una ricompensa per gli scienziati che sviluppano test per nuove sostanze.

(4) Aumentare considerevolmente le sanzioni: un test positivo e si è fuori per sempre.

Impostazioni privacy