Kierownik projektu: dr Fryderyk Falniowski
Katedra Matematyki
Konkurs: OPUS 26, panel: HS4
Podstawowym założeniem klasycznej teorii gier jest racjonalność graczy. Oznacza ona, że uczestnicy interakcji opisywanej przez daną grę (czyli gracze) są świadomi swoich celów i wybierają strategie najlepiej dostosowane do ich osiągnięcia. W wyniku tego typu interakcji dochodzi do powstawania społecznych instytucji i konwencji.
W ramach teorii gier sytuacje takie reprezentowane są przez równowagi Nasha, czyli rozwiązania gry, których odrzucenie jest niekorzystne dla każdego gracza. Pomimo fundamentalnego znaczenia koncepcji równowagi Nasha w teorii gier, założenie pełnej racjonalności graczy, na którym jest ona oparta, rzadko jest spełnione w życiowych sytuacjach. Jak pokazały liczne eksperymenty, ze względu na niepełną informację ludzie często błędnie oceniają atrakcyjność rezultatów, które chcą osiągnąć i skuteczność środków, które do tych rezultatów mają doprowadzić. Dopiero gdy dana interakcja powtarza się wielokrotnie, jej uczestnicy uczą się nowych, lepszych strategii, obserwując w praktyce skutki swoich działań i porównując je z efektami osiąganymi przez innych. Dynamiczne modelowanie takiego procesu uczenia się jest przedmiotem badań zarówno ewolucyjnej, jak i algorytmicznej teorii gier. Teorie te nie zakładają, że gracze posiadają pełną informację o zasadach danej gry, możliwych strategiach czy konsekwencjach ich wyboru. Ich zachowania zmieniają się w kolejnych powtórzeniach gry (interakcji) na podstawie zadanego algorytmu uczenia się. W rezultacie otrzymujemy dynamikę gry, czyli układ dynamiczny opisujący zmianę strategii stosowanych przez graczy w czasie. Za jej pomocą możemy modelować nie tylko długoterminowe tendencje zachowań, ale także sposób ich powstawania. Takie dynamiczne podejście do analizy postępowań graczy o ograniczonej racjonalności stanowi wspólną cechę wszystkich nurtów badań składających się na nasz projekt. W wielu przypadkach dynamika uczenia się długoterminowo wykazuje zbieżność do pojedynczego układu zachowań graczy, czyli wyłaniającej się konwencji społecznej, korzystnej lub przynajmniej akceptowalnej dla wszystkich. Jednakże, jak wykazują najnowsze badania, możliwe jest też powstawanie bardziej skomplikowanych (i mniej korzystnych) zachowań długoterminowych, takich jak oscylacja pomiędzy kilkoma rozwiązaniami, zbieżność do rozwiązania suboptymalnego lub też powstawanie złożonej dynamiki, w której gracze zachowują się chaotycznie. Wobec tego pierwszym celem naszych badań będzie przeanalizowanie, kiedy układy dynamiczne oparte na szeroko stosowanych algorytmach uczenia się (takich jak FTRL oraz EWA), jak również na stanowiących podstawę ekonomicznych zastosowań ewolucyjnej teorii gier protokołach postępowania, wykazują skomplikowane i nieprzewidywalne zachowania, a następnie sformułowanie warunków gwarantujących zbieżność do rozwiązania optymalnego. Otrzymane w tym kierunku wyniki mogą być zastosowane do wykrywania i analizowania sytuacji, w których bez starannego zaprojektowania odpowiednich mechanizmów i instytucji naturalne interakcje społeczne generują rozwiązania niekorzystne dla wszystkich uczestników. Opisany powyżej kierunek badań koncentruje się na analizie zachowań graczy o ograniczonej racjonalności, którzy w celu wybrania odpowiedniej strategii stosują pewien ustalony algorytm uczenia się. Zwróćmy jednak uwagę, że w wielu życiowych sytuacjach procesy podejmowania decyzji przez poszczególnych graczy mogą w istotny sposób różnić się od siebie. Różnice te mogą wynikać m.in. z niejednorodnych sposobów uczenia się i porównywania osiąganych efektów, czy też odmiennych przekonań i chęci do podejmowania ryzyka. Obserwacja ta stanowi motywację dla drugiego nurtu naszych badań, jakim jest konstrukcja i analiza (ko-)ewolucyjnych modeli, w których heterogeniczni gracze wykorzystują algorytmy uczenia się w środowisku gospodarczym. Uzyskane wyniki zastosujemy do ważnych problemów ekonomicznych, takich jak rozpowszechnianie innowacji czy integracja pewnych grup w populacji.