Conceptul de echilibru non-cooperativ Nash se bazeaza pe doua ingrediente cheie: capacitatea jucatorilor de a anticipa corect comportamentul adversarilor si de a adopta strategia optima de raspuns la aceste anticipatii corect formulate. Astfel, conform teoriei rationale a jocurilor, in echilibru, fiecare decident joaca un “cel mai bun” raspuns la alegerea celuilalt iar anticipatiile/inferentele sunt corecte in sensul ca ele sunt confirmate de deciziile adoptate de fiecare oponent.
Prin relaxarea uneia si/sau ambelor dintre premisele descrise mai sus se poate obtine o pletora de modele cu rationalitate “limitata” in care, spre exemplu, jucatorii sunt inzestrati cu procese sub-optimale de formare a anticipatiilor relativ la deciziile adversarilor.
Un astfel de model de inferinta sub-optimal, bazat pe un rationament prin analogie, este propus de Jehiel si Samuelson (2012). Autorii introduc, intr-un context de interactiune repetata, o aplicatie a conceptului de echilibru-bazat-pe-analogie dezvoltat de Jehiel (2005).
Modelul investigheaza interactiunea repetata dintre un jucator permanent (“long-run” player in terminologia autorilor) si o serie de jucatori ocazionali (“short-run” players). Aplicatiile economice pot include, printre altele, raporturilor firma-angajati, firma-clienti, banca centrala-public, etc.
Ptr a modela incertitudinea asupra jucatorului permanent acesta poate fi, cu probabilitate ridicata, tipul rational din modelul clasic al jocurilor, iar cu probabilitate redusa dar non-negativa tipul “mecanic” (crazy player) care selecteaza aceiasi strategie, posibil mixta in fiecare iteratie a jocului repetat.
Prin contrast, jucatorii ocazionali rationeaza prin analogie: ei identifica corect strategia “medie” a adversarului rational dar nu si structura, ordinea actiunilor acestuia pe parcursul fiecarui istoric al jocului. Aceasta inabilitate de a detecta pattern-uri in istoricul jocului adversarului, permite oponentului rational sa construiasca “corelatii” intre actiunile sale si cele ale jucatorului analogic.
Principala concluzie a studiului este ca exploatarea acestor corelatii poate garanta jucatorului rational o utilitate strict superioara celei corespunzatoare echilibriului Nash din fiecare joc de etapa. Reamintim ca, daca ambii jucatori sunt rationali, profitul Nash este limita de sus a ceea ce isi poate garanta fiecare agent in cadrul jocului non-cooperativ.
Comportamentul de “echilibru” al jucatorului permanent poate fi caracterizat printr-o etapa initiala de construire a unui “stoc” de reputatie referitor la un anumit tip de comportament ( ex. o banca centrala cu reputatie conservatoare), urmata de o etapa de manipulare-exploatare a acestei reputatii (de ex. prin episoade inflationiste scurte care pot manipula asteptarile publicului).
Rationament Analogic
Fara a intra in detaliile tehnice ale articolului trebuie remarcat ca jucatorii ocazionali folosesc un model incorect specificat asupra jucatorului permanent. Mai precis, isi construiesc anticipatiile privind deciziile tipului rational plecand de la ipoteza unui comportament stationar al acestuia in diversele istorii/realizari ale jocului repetat. El observa astfel, distributia agregata a deciziile jucatorului rational in trecutul interactiunii dintre jucatorul permanent si seria de ocazionali, dar nu si modul in care aceste decizii depind de o realizare specifica a acestei istorii (asa cum se intampla de exemplu in conceptul clasic de equilibru secvential, unde, anticipatiile sunt actualizate imediat plecand de la actiunile efectiv jucate de adversari).
Aceasta supozitie este, desigur, corecta ptr tipul “mecanic”, care joaca aceiasi strategie (mixta) la fiecare repetitie a jocului, dar poate fi invalidata de un jucator rational care isi actualizeaza inferentele intr-o maniera Bayesiana folosind modelul “corect” asupra oponentului ocazional.
Autorii motiveaza aceasta specificare eronata prin insasi natura jucatorilor ocazionali: intervenind episodic, reusesc sa obtina informatii agregate despre frecventa actiunilor jucatorului rational, dar nu si informatii detaliate despre actiunile acestuia in interiorul fiecarei istorii a jocului. Modelul jucatorul ocazional este corect doar “in medie”: frecventele empirice observate corespund alegerilor de echilibru ale jucatorului rational. Fara a distorsiona aceasta distributie empirica agregata, jucatorul rational poate manipula inteligent asteptarile jucatorului ocazional de ex. prin corelarea alternativa a actiunilor dintre ei astfel incat, pe de o parte sa obtina profitul maxim la fiecare iteratie, iar pe de alta, sa mentina nemodificate asteptarile acestuia privind tipul de adversar rational cu care interactioneaza.
Ilustratie: jocul calitatii
Jocul modeleaza interactiunea dintre o firma (jucator permanent) – care poate decide intre a vinde un produs de calitate inalta (B) si unul de calitate redusa (T) – si o serie de consumatori (jucatori ocazionali) care pot alege sa cumpere fie un produs adaptat (L) fie unul generic (R ). Firma are o strategie dominanta in produsul de calitate redusa si prefera ca optiunea consumatorului sa fie produsul adaptat (L). Produsul adaptat este insa cea mai buna alegere ptr consumator doar daca firma alege calitate ridicata. In situatia in care ambii jucatori sunt rationali, singurul echilibru Nash este (T,R): firma produce un bun de calitate scazuta, iar consumatorul alege un produs generic.
Cu un consumator “analogic” producatorul poate garanta pentru sine un rezultat mai bun decat Nash prin urmatoarea strategie: o etapa initiala de construire a reputatiei, jucand in mod repetat B cu raspunsul optim R din partea jucatorului ocazional. Un numar suficient de repetii al optiunii B schimba alegerea optima a consumatorului in produsul adaptat L. In acest moment firma poate incepe etapa de manipulare a reputatiei jucand alternativ T si B: va obtine, in expectanta, o medie intre (T,L) – care ii asigura profitul maxim – si (T,R) care este echilibrul Nash. Frecventa relativa a actiunilor T si B este determinata astfel incat jucatorul analogic sa-si mentina inferenta initiala, indusa de jucatorul rational in faza de construire a reputatiei, ca intalneste o firma/produs de calitate inalta si, in consecinta trebuie sa aleaga produsul customizat.
In comparatie cu modele reputationale ciclice, etapa de construire a reputatiei este relativ scurta, in timp ce faza de exploatare este virtual nelimitata in timp, in masura in care reglajul fin al anticipatiilor seriei de adversari ocazionali este realizat astfel incat sa induca alegerile dorite.
De notat ca acest joc al calitatii este izomorfic cu interactiunea dintre o banca centrala – care detine in meniul de strategii inflatie ridicata sau redusa – si public care, la randul sau poate formula anticipatii inflationiste ridicate sau joase.
Cu o strategie similara de “fazare” a reputatiei, imediat dupa incheierea etapei de acumulare a reputatiei conservatoare, banca centrala isi poate garanta permanent, prin pusee inflationiste periodice, un rezultat superior celui de echilibru Nash, cu conditia ca publicul sa rationeze prin analogie cu privire la comportamentul strategic al bancii centrale, a la Jehiel si Samuelson.
Referinte:
Jehiel, P., “Analogy-Based Expectation Equilibrium” Journal of Economic theory, 2005
Jehiel, P., “Reputation with analogical reasoning” (with Larry Samuelson) Quarterly Journal of Economics 2012
Draga domnule Ochea,
Asteptam sa scrie cineva despre rationalitate limitata! Am impresia ca e singura cale de a vinde modelele economice ca realiste si am mi lasat un comentariu unui coleg al dumneavoastra de pe blog, domnul Arcalean. Articolele pe care le indicati la subsol sunt putin cam complexe pentru nivelul meu de intelegere, insa v-as intreba daca puteti sa imi recomandati daca exista un fel de rezumat actualizat al acestei literaturi. Eventual un manual pe care il vedeti mai accesibil, daca se poate cu ceva aplicatii.
Cu stima,
Mircea Ban
traducere:
“ptr”=pentru
“repetii al optiunii B”=repetitii ale optiunii B
virgule multe in plus=atentie (nu rationalitate!) limitata 😆