Il dilemma del prigioniero

18349.strip“Due sospettati, A e B, sono arrestati dalla polizia. La polizia non ha prove sufficienti per trovare il colpevole e, dopo aver rinchiuso i due prigionieri in due celle diverse, interroga entrambi offrendo loro le seguenti prospettive: se uno confessa (C) e l’altro non confessa (NC) chi non ha confessato sconterà 10 anni di detenzione mentre l’altro sarà libero; se entrambi non confesseranno, allora la polizia li condannerà ad un solo anno di carcere; se, invece, confesseranno entrambi la pena da scontare sarà pari a 6 anni di carcere ciascuno. Ogni prigioniero può riflettere sulla strategia da scegliere tra, appunto, confessare o non confessare. In ogni caso, nessuno dei due prigionieri potrà conoscere la scelta fatta dall’altro prigioniero.”

Il Dilemma del Prigioniero, come formalizzato da Tucker, è il più classico degli esempi della Teoria dei Giochi, ed è stato sviscerato da ogni prospettiva, rendendo anche la sua soluzione l’esempio principe dell’utilizzo della matrice dei pay-off come rappresentazione dei vantaggi delle scelte strategiche a disposizione dei giocatori dei giochi non cooperativi.

In sintesi, visto che ogni giocatore non ha informazioni sul comportamento dell’altro, la soluzione razionale sarà la strategia dominante: A confesserà e lo stesso farà B, e si regaleranno entrambi 6 anni di carcere a testa; tuttavia, seppure logica, la soluzione proposta non è la più vantaggiosa (o pareto-efficiente), ma è comunque la strategia ottimale, quale che sia quella dell’altro giocatore. Ancora più in sintesi, colui che non confessa è irrazionale (e rimarrà fregato, in un mondo normale).

Questo se il gioco è non-cooperativo o viene giocato una volta sola.

Più interessante è invece il caso in cui una strategia venga decisa prima del gioco – i prigionieri si parlano e si accordano -, o il gioco venga giocato un numero sconosciuto N di volte, in modo che i giocatori acquisiscano informazioni sull’efficacia delle loro strategie nel corso delle ripetizioni.

Paradossalmente, la soluzione logica – A non confessa e lo stesso fa B – potrebbe essere ancora scartata, visto che la tendenza a scartellare sarebbe ancora più incentivata (siamo d’accordo, ma se io confesso sarò libero e tu che rispetti l’accordo prendi 10 anni), dimostrando che massimizzare il proprio interesse personale non è un’allocazione ottimale delle risorse, visto che si poteva ottenere di meglio senza danneggiare alcuno, e che quello che è razionale individualmente non lo è necessariamente dal punto di vista collettivo. Il tutto stringatamente riassumibile in “l’equilibrio delle strategie dominanti non è un ottimo paretiano”.

Supponiamo ora che i due prigionieri – come spesso accade quando si tratta di cose serie –, rispondano ad alcuni requisiti base (capacità logica perfetta):

  • capiscono il gioco allo stesso modo
  • non fanno alcun errore

ne conseguirà che entrambi prenderanno la stessa decisione, perchè è chiaro che chi “tradisce” subirà l’identico trattamento: se uno dei prigionieri capisce che le conclusioni a cui arriva lui sono le stesse a cui arriva l’altro, scegliere di non confessare è l’unica azione possibile, perchè se ci si convince che è impossibile che gli altri giocatori diano risposte diverse, il discorso egoista cade. Rimanendo solamente le possibilità Confessare-Confessare e Non Confessare-Non Confessare, la scelta non permette esitazioni.

A causa della natura paradossale dell’unico equilibrio del gioco (giocato una singola volta), nel quale ciascuno dei due giocatori usa, com’è naturale, la sua strategia dominante, l’esito che si ottiene è peggiore per entrambi dell’esito che si avrebbe se entrambi usassero la loro strategia dominata (Non Confessare), nel caso invece in cui il gioco venga reiterato più volte, come accade nella realtà, quando si è di fronte a decisioni che coinvolgono spesso gli stessi attori, la strategia cooperativa deve resistere, anche se l’incentivo allo scartellamento a fronte di un vantaggio immediato potrebbe sembrare elevato.

Il disincentivo a rompere la strategia cooperativa è nel fatto che ciascun giocatore teme che un caso di non cooperazione possa portare al collasso della cooperazione in futuro. Se il valore di una futura collaborazione è grande ed eccede ciò che si può guadagnare nel breve periodo non collaborando, allora l’interesse individuale a lungo termine dei giocatori può distoglierli automaticamente dal non collaborare, senza bisogno dell’intervento di esterni.

Di fatto, tutto sta a dare il corretto valore alla collaborazione futura e a presentare minacce credibili in caso di scartellamento, minacce efficaci e immediate (trigger strategies, o strategia del dito sul grilletto), ma soprattutto “credibili”: si collabora (Non Confessare) finchè l’avversario collabora, si punisce per un tempo più o meno lungo in caso di tradimento.

La grim strategy è adatta ad integralisti e massimalisti, al primo tradimento la collaborazione cessa per sempre, la ritorsione equivalente (tit-for-tat) è più flessibile e (matematicamente) più efficace: si collabora finchè l’altro giocatore collabora, si punisce al turno successivo in caso di tradimento (quella che è stata la strategia di comportamento durante tutta la Guerra Fredda, per fortuna della razza umana).

Posto che la collaborazione – in caso di gioco a informazione completa o nel caso di gioco ripetuto – è la strategia migliore per la collettività, è stato anche provato che la strategia Tit for Tat è la migliore forma di ritorsione per giungere e mantenere la collaborazione nei giochi ripetuti, una formula riassumibile in 5 istruzioni in FORTRAN per un calcolatore, ma non necessariamente chiara ai giocatori umani.

Se le strategie impazienti di deviare accumulano vantaggi immediati, esse scontano la ripetizione di reciproche deviazioni con payoff miseri, se strategie remissive (cooperazione senza ritorsione) vengono maltrattate da avversari non cooperativi, la strategia migliore risulta quella della ritorsione equivalente, facilmente riassumibile in quattro condizioni per massimizzare i risultati di tutti i giocatori:

  1. non essere invidioso
  2. non essere il primo a deviare
  3. ricambia cooperazione e deviazione
  4. non essere troppo furbo;

come ebbe a dire Axelrod “it is at once forgiving, nice, provocable, and clear”.

Quindi,  in ogni occasione in cui si prendono decisioni individuali in situazioni di interazione con altri soggetti (due o più), tali per cui le decisioni di uno possono influire sui risultati conseguibili dall’altro/i secondo un meccanismo di retroazione, se lo scopo non è il massimo guadagno del singolo, vale la regola d’oro “don’t be clever, be clear”.

Annunci

Tag:, , , , , , , , , ,

Trackbacks / Pingbacks

  1. I fregni e i fessi | cerebrolesTo - 10/05/2014

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: