Czy Twoim zdaniem jest korzystnie być uczciwym i dobrym wobec innych ludzi?
Pytanie to zadał na Facebooku Paweł – nauczyciel matematyki. Nie mogłem nie odpowiedzieć. Tym bardziej, że od lat noszę się z opracowaniem materiału dydaktycznego poświęconego iterowanemu dylematowi aresztowanych rozgrywanemu w grupie.
Ponieważ pytanie to zadał Paweł – nauczyciel matematyki – to nie mogłem nie odpowiedzieć. Tym bardziej, że od lat noszę się z opracowaniem materiału dydaktycznego poświęconego iterowanemu dylematowi aresztowanych rozgrywanemu w grupie.
Odpowiedzi na pytanie Pawła w stylu „Oczywiście, że nie warto. Tylko frajerzy tak robią.” lub „Dane dobro zawsze wraca do dającego.” to przykłady myślenia redukcjonistycznego, które w największym skrócie polega na poszukiwaniu jednej prostej reguły, która wszystko ma wytłumaczyć lub rozwiązać. Myślenie to, choć powszechne, jednak słabo sprawdza się w sytuacjach życiowych.
W Ewangelii wg Św. Mateusza czytamy: Jeśli cię ktoś uderzy w prawy policzek, nadstaw mu i drugi (Mt 5,39). I oczywiście większość z nas interpretuje to zdanie w sposób redukcjonistyczny. Na przykład jak bloger:
Chyba wszyscy na pamięć znamy słowa Jezusa o nadstawianiu drugiego policzka. Są one jednymi z najbardziej znanych i zarazem jednymi z wzbudzających najwięcej kontrowersji i nieporozumień cytatów z Ewangelii. Wiele osób, traktując je bardzo dosłownie, zniechęciło się do Kościoła, uznając, że jest on dla frajerów i „ofiar losu”. Ktoś nas bije, oszukuje, wykorzystuje — no to pozwólmy mu na to i jeszcze zachęćmy by dalej to robił. Przecież to głupota, to stoi w sprzeczności z elementarnym poczuciem sprawiedliwości, ja mam swoją godność, chrześcijaństwo jest zbyt radykalne jak dla mnie myślimy sobie. Z drugiej strony niektórzy katolicy, także biorąc sobie do serca słowa Jezusa, przyjmują postawę całkowicie odmienną i w dobrej wierze pozwalają na krzywdzenie siebie, godzą się na zło. Wydaje mi się, że Chrystus ucząc nas nadstawiania drugiego policzka, pragnął przekazać nam zupełnie co innego, chciał nauczyć nas miłości nie cofającej się nawet przed największymi poświęceniami, miłości nie tylko do bliskich nam osób ale i do nieprzyjaciół. Ale zarazem miłości dojrzałej a nie naiwnej. [Więcej w artykule Czy zawsze należy nadstawiać drugi policzek?]
W ostatnich zdaniach bloger interpretuje słowa Ewangelii na swój sposób. Oczywiście, każdy z nas, podobnie jak i on, ma z tym słynnym ewangelicznym wersem sporo kłopotu. Warto jednak zwrócić uwagę na to, że Chrystus mówi „nadstaw mu i drugi”, a nie mówi „daj mu się lać bez końca po obu”, ani też „pozwól mu na obcięcie ci ręki”.
Czy myśl Jezusa można przeanalizować naukowo? Okazuje się, że jak najbardziej. Choć nauka zwykle kojarzy nam się z postawą antyreligijną, to jednak okazuje się, że niektóre dyscypliny naukowe zajmują się podobnymi zagadnieniami. Jednak jak do tej pory w kwestii „nadstawiania drugiego policzka” nie zajęły jasnego stanowiska. Spróbujmy zatem to zrobić, może się uda.
Badając naukowo szeroko rozumiany temat życia, prędzej czy później natrafiamy na matematyczną teorię gier, nieco później na jedno z kluczowych jej zagadnień – dylemat aresztowanych. A jeśli jesteśmy na prawdę mocno zmotywowani i chcemy temat gruntownie zgłębić to w końcu dochodzimy do iterowanego dylematu aresztowanych. Jeszcze dalej, jeśli nie zadowolimy się wyłącznie zrozumieniem tego o co w nim chodzi, lecz zaczniemy go badać przy wykorzystaniu analizy wrażliwości, dojdziemy do arcyciekawego wniosku: Jeśli rozpoznajemy drugą osobę pod kątem tego czy nadaje się ona do współpracy to Chrystus miał rację.
Dylemat aresztowanych,
jest kluczowym modelem poznawczym w matematycznej teorii gier. Wyobraźmy sobie, że aresztowano Jana i Ewę podejrzanych o udział w przestępstwie, zagrożonym karą 10 lat pozbawienia wolności. Jednak by wystąpić o taki wymiar kary prokurator nie ma dostatecznych dowodów. Może jednak każdą z tych osób skazać, jeśli druga złoży fałszywe zeznanie obciążające. Składa zatem Ewie (i Janowi) następującą propozycję: Ewo (Janie) zeznaj fałszywie przeciwko Janowi (Ewie), to puszczę cię wolno, jeśli nie zeznasz to posadzę ciebie dwa lata, paragraf się znajdzie.
W zależności od tego co każdy z nich zrobi efekt końcowy może być następujący:
- jeśli zachowają się lojalnie wobec siebie i będą milczeć, można ich będzie skazać tylko na dwa lata więzienia za jakieś mniejsze występki.
Bilanse: Jana=-2, Ewy=-2, Jana i Ewy jako Grupy=-4; - oboje mogą złożyć fałszywe zeznanie, każdy z nich będzie obciążać drugiego; wtedy co prawda nie dostaną maksymalnej kary, ale oboje otrzymają wyroki po 5 lat.
Bilanse: Jana=-5, Ewy=-5, Jana i Ewy jako Grupy=-10; - Natomiast gdy jedna osoba złoży fałszywe zeznanie przeciwko drugiej natomiast druga nie, wówczas druga osoba zostanie skazana na 10 lat odsiadki, natomiast pierwsza wyjdzie na wolność.
Bilanse: Jana=0, Ewy=-10, Jana i Ewy jako Grupy=-10; (lub odwrotnie: Jana=-10, Ewy=0;)
Rozprawy obu aresztowanych są niejawne i żaden z nich nie wie, co zrobi ten drugi: czy zezna, czy też nie. Dylemat polega na tym, co gracz ma zrobić? Wyobraźmy sobie siebie na miejscu jednego z nich: najlepsza sytuacja dla mnie zachodzi, gdy ja go obciążę, a on mnie nie. Jednak nie jestem głupi i wiem, że tamten też to wie. Co zatem zrobić? Nie obciążać się nie opłaca, bo a nóż tamten mnie obciąży – i wtedy trafiam do więzienia na 10 lat. Bezpiecznie jest go obciążyć, bo jest szansa, co prawda mała, że tamten akurat mnie nie obciąży i wtedy zostanę puszczony wolno. Dylemat pogłębia się, gdy aresztanci przebywają w tej samej celi i mogą się dogadać. Oczywiście ustalą, że nie będą się nawzajem oskarżać, ale jakież katusze będą przeżywali podczas swojej rozprawy! Oszukać czy nie oszukać? Oszuka czy nie oszuka?
Dylemat aresztowanych jest świetną ilustracją tego, że:
- wynik gry nie zależy wyłącznie od akcji pojedynczego gracza, lecz i od tego, jaki ruch wykona jego przeciwnik,
- by grupa osiągała maksymalne korzyści, wszyscy jej członkowie muszą przestrzegać ustalonych umów,
- maksymalny zysk osobisty osiąga ten, kto nie dotrzymuje ustalonych umów, podczas gdy pozostali lojalnie ich przestrzegają,
- informacja (w postaci podjętej decyzji) steruje światem materialnym (konkretny wymiar kary).
Iterowany dylemat aresztowanych
polega na ciągłym rozgrywaniu dylematu aresztowanych. Ci sami gracze rozgrywają go wielokrotnie ze sobą. Decyzję o tym co mają zrobić (czy fałszywe oskarżyć przeciwnika czy nie) w rozgrywanej rundzie opracowują na podstawie informacji o tym co zrobił przeciwnik we wcześniejszych rundach.
Zagadnieniem tym w 1984 roku zajął się Robert Axelrod (1943-), amerykański politolog i matematyk, autor książki „Ewolucja współpracy”. Zaproponował on zorganizowanie turnieju, w którym w sposób ciągły rozgrywano by dylemat aresztowanych, kumulując wyniki uzyskiwane przez każdą ze stron. Wprowadzenie tej iteracyjności jest dość abstrakcyjne, bo jakiż sens ma stawianie oskarżonym raz za razem tej samej propozycji i przyglądanie się, jaki łączny wyrok sobie nawzajem fundują? Gdyby jednak nie chodziło o wyrok, lecz, na przykład, o pieniądze lub punkty przetrwania, zagadnienie miałoby jak najbardziej życiowy charakter. Turniej oczywiście rozegrano, a obserwacje okazały się nader ciekawe.
Zadaniem zaproszonych z całego świata naukowców było opracowanie w postaci podprogramów komputerowych najskuteczniejszych strategii rozgrywania tej gry. Strategię należy rozumieć dokładnie tak, jak została zdefiniowana: realizujący ją podprogram musi wyznaczyć akcję, którą ma wykonać gracz w bieżącej rundzie. W pierwszym kroku rozgrywki komputer prosił strategię gracza A o podanie akcji: „Co robisz? Zeznajesz czy nie?”, jednocześnie to samo pytanie zadawał strategii gracza B. Na podstawie udzielonych odpowiedzi odczytywał z tabelki wyroki i dodawał je do kont poszczególnych graczy. W każdym kroku obie strategie udzielały odpowiedzi, nie wiedząc, jaką akcję w tej rundzie podjęła strategia konkurencyjna, natomiast obu strategiom znane były wszystkie ruchy zrealizowane w poprzednich rundach oraz wszelkie informacje pochodzące z dotychczas przeprowadzonych rozgrywek pomiędzy innymi strategiami.
Kolejne rundy przebiegały dokładnie według tego samego scenariusza: strategie niezależnie od siebie udzielały odpowiedzi i na ich podstawie z tabeli wypłat odczytywane były wyroki i ponownie dodawane do kont graczy. Gra toczyła się, aż w pewnym losowym momencie ją kończono. Za zwycięską uważana była ta strategia, która uzyskała najmniejszy łączny wyrok.
Do turnieju zgłoszono następujące strategie:
Tabela różnych strategii | ||
---|---|---|
Nazwa | Opis działania strategii | L |
Przyjazny Wet za Wet | Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej | Nie |
Nieprzyjazny Wet za Wet | Zaczyna od fałszywego oskarżenia, później robi to co zrobił przeciwnik w rundzie poprzedniej | Nie |
Przyjazny Wet za Wet z losowością | Zaczyna od współpracy, później robi to co zrobił przeciwnik w rundzie poprzedniej losowo jednak zmieniając tę decyzję | Tak |
Przyjazny Pawłow | Zaczyna od współpracy, jeśli ruch okazał się korzystny to nie jest zmieniany w następnej rundzie, jeśli okazał się niekorzystny to jest zmieniany | Nie |
Skruszony Zdrajca | Tak jak Przyjazny Wet za Wet, lecz czasem fałszywie oskarża zamiast współpracować. Jeśli przeciwnik na jego fałszywe oskarżenie odpowie fałszywym oskarżeniem to z powodu wyrzutów sumienia odpowiada współpracą. | Nie |
Naiwny Siewca Pokoju | Tak jak Przyjazny Wet za Wet, czasem zmieniając fałszywe oskarżenie na współpracę | Tak |
50% Losowy Wariat | Decyzję podejmuje losowo, z prawdopodobieństwem 50% na 50% | Tak |
Ponury Zdrajca | Zawsze fałszywie oskarża | Nie |
Lojalny aż do bólu | Zawsze współpracuje | Nie |
Niewybaczający | Współpracuje, lecz gdy przeciwnik fałszywie oskarży, nigdy nie wybaczy i zawsze będzie fałszywie oskarżał | Nie |
Dostosowujący się | Zaczyna w,w,w,w,w,o,o,o,o,o po czym podejmuje takie decyzje, które przyniosły mu najlepszy wynik w poprzedniej rundzie | Nie |
Powolny | Współpracuje do momentu, gdy przeciwnik go fałszywie oskarży, po czym oskarża przeciwnika tyle razy ile ten go oskarżył, następnie dwukrotnie współpracuje. | Nie |
Turniej wygrała strategia nazwana przyjazny wet za wet. Zasada jej działania była dość prosta: w pierwszym kroku nigdy nie oskarżała fałszywie, a w następnych robiła dokładnie to samo co jej przeciwniczka w rundzie poprzedniej. Ciekawostką jest, że porównujący ją z innymi strategiami matematycy przypisali jej pewne ludzkie cechy, podając przy okazji bardzo ścisłe, matematyczne ich definicje:
Tabela cech strategii | ||
---|---|---|
Nazwa cechy | Opis cechy | |
Przyjazna | Zaczyna od współpracy | |
Gotowa do współpracy | Nie zrywa współpracy jako pierwsza | |
Mściwa | Bo na brak współpracy natychmiast odpowiada brakiem współpracy | |
Potrafiąca wybaczyć | Na współpracę natychmiast odpowiada współpracą | |
Niezazdrosna | Nie stara się osiągnąć wyniku lepszego niż przeciwnik | |
Przejrzysta | Jest łatwa do zrozumienia przez przeciwnika | |
Sprawiedliwa (zapewniająca równość) | Gwarantuje uzyskanie wyniku nie gorszego niż przeciwnik, gorszy może być zaledwie o stratę w pojedynczej rundzie. W porównaniu z przeciwnikiem nie straci dużo |
Jak już wiemy turniej wygrał przyjazny wet za wet. Wracając do słów Chrystusa zauważamy jednak, że strategia ta nie nadstawia drugiego policzka. Wręcz przeciwnie, gdy ktoś ją uderzy ta od razu zwrotnie uderza w następnej rundzie. Czy Chrystus przesadził? Otóż okazuje się, że wcale nie. To naukowcy rozgrywający turniej spoczęli na laurach i nie przebadali tematu do końca. Zresztą trudno ich winić, bowiem analiza wrażliwości jako metoda naukowa i dziś nie jest popularna, a 30 lat temu tym bardziej mało kto o niej słyszał.
Analiza wrażliwości
jest znana w ekonomii i naukach technicznych. Polega ona na badaniu zachowania modelu dowolnego systemu spowodowanego:
- zmianą warunków początkowych,
- zmianą parametrów systemu,
- zmianą struktury systemu,
- zmianą warunków zewnętrznych,
- wpływem zaburzenia.
Szczególnie ważne jest badanie wpływu tak zwanych zaburzeń, czyli zmian z pozoru nieistotnych, rzadko występujących lub wręcz nieprzewidywalnych.
Nietrudno jest sobie wyobrazić grę dwóch strategii przyjazny wet za wet. Obie w pierwszym ruchu nie oszukują i każda z nich otrzymuje najniższy wymiar kary – 2 lata, później obie robią dokładnie to co zrobił przeciwnik w rundzie poprzedniej, czyli również nie oszukują. I tak za każdym razem dodawane są do ich kont koleje 2 letnie wyroki. Dla przykładu, jeśli grają ze sobą dwie strategie przyjazny wet za wet to po 5 rundach każda z nich ma na swoim koncie po 10 punktów. Sumarycznie jest to wyrok najmniejszy z możliwych. Bo gdy zagrają ze sobą dajmy na to: przyjazny wet za wet z nieprzyjaznym wetem za wet to po pięciu rundach ten pierwszy będzie miał 30 (lat do odsiedzenia), a ten drugi 20.
Najlepszy wynik osiągną również i inne pary, na przykład: przyjazny wet za wet z przyjaznym pawłowem oraz przyjazny wet za wet z naiwnym siewcą pokoju. Jak nietrudno zauważyć wynik ten można osiągnąć wyłącznie wtedy, gdy cały czas obie strony nie oszukują, jakiekolwiek oszustwo, nawet jednorazowe, z dowolnej strony zawsze skutkuje gorszym wynikiem dla obu stron.
Przeanalizujmy teraz grę dwóch przyjaznych wetów za wet przy użyciu analizy wrażliwości. Wprowadźmy do ich gry zaburzenie. Wyobraźmy sobie, że w drugiej rundzie jedna ze strategii nagle, z niewiadomych przyczyn, oszukała. Taka jest istota zaburzenia – dzieje się coś czego wytłumaczyć się nie da, czego przyczyny nie znamy, to coś ma jednak wpływ na wynik. Wypłaty w kolejnych rundach układają się tak: (pierwsza strategia dostaje 2, druga dostaje 2) w drugiej rundzie pierwsza strategia z niewiadomych przyczyn oszukuje i od tego momentu wypłaty wynoszą (0,10), a potem (10,0), (0,10) i w piątej rundzie (10,0). Co daje łączny wynik 22 dla pierwszej strategii i 22 dla drugiej. A więc wynik zdecydowanie gorszy od najlepszego, który jak pamiętamy, po 5 rundach, wynosił (10,10)
Jak zatem widać gra dwóch najlepszych taktyk nie jest odporna na przypadkowe zaburzenie. Co zatem proponuje Chrystus? Jeśli ktoś fałszywie cię oskarży nie traktuj tego jako przejawu złej woli – nadstaw drugi policzek i sprawdź czy przypadkiem nie zrobił tego przez pomyłkę. Jeśli oberwiesz po raz drugi – to w tym momencie będzie to dla ciebie jasny sygnał, że to nie był żaden przypadek, lecz że masz do czynienia z egoistą, który dba wyłącznie o swój interes i to na dodatek twoim kosztem. Jeśli jednak nie nadstawisz drugiego policzka to przypadkowe zaburzenie sprawi, że obaj stracicie.
Przejdźmy teraz do kolejnej gry, która powinna zainteresować każdego nauczyciela: matematyki (ze względu na matematyczną teorią gier), biologii (zachowania społeczne obiektów żywych) i WOS (wiedzę o społeczeństwie). Grę tę można rozegrać na lekcji każdego z wymienionych przedmiotów, dzieci nieźle się będą bawiły, przy okazji będą mogły wyciągnąć ważne dla siebie wnioski, a nauczyciel w interesujący sposób przekaże swoim podopiecznym ogrom, mało znanej, wszak bardzo ważnej wiedzy.
Iterowany dylemat życia w grupie
jest rozbudowaną wersją iterowanego dylematu aresztowanych. Polega na tym, że gra kilkunastu graczy. Na sygnał prowadzącego uczestnicy losowo dobierają się w pary i podejmują decyzje o tym co zrobić. Następnie sprawdzają w tabeli wypłat, ile punktów zyskali i dopisują je do swojego konta. W grze tej można wykorzystać klasyczną tabelę wypłat:
Ewa oszukała | Ewa wyrok: 5 Jan wyrok: 5 |
Ewa wyrok: 0 Jan wyrok: 10 |
Ewa nie oszukała | Ewa wyrok: 10 Jan wyrok: 0 |
Ewa wyrok: 2 Jan wyrok: 2 |
Tabela ta jest jednak dość trudna w interpretacji – wygrywa ten kto dostaje najniższy łączny wyrok. Wydaje się, że ze względów dydaktycznych ciekawszą będzie inna tabela – „Jak to w życiu”. Tutaj gracze nie oskarżają się wzajemnie, lecz albo deklarują chęć współpracy z drugim graczem albo chęć okradzenia go. Jeśli złodziej trafi na złodzieja to razem tracą po trzy punkty, jeśli złodziej trafi na chętnego do współpracy to przejmuje jego 50 punktów – dochodzi do klasycznej kradzieży: to co zyskuje jeden, traci drugi. Jeśli okradany nie ma 50 punktów to zabierane mu są wszystkie, które posiada, a on sam wypada z gry. Natomiast para, w której obaj gracze wykażą się chęcią współpracy „wypracowuje” dla każdego po 10 punktów. Tabela ta wygląda w sposób następujący:
Gracz 2 kradnie | Gracz 1: -3 Gracz 2: -3 |
Gracz 1: -50 Gracz 2: +50 |
Gracz 2 współpracuje | Gracz 1: +50 Gracz 2: -50 |
Gracz 1: +10 Gracz 2: +10 |
Każdy z graczy na początku gry ma na swoim koncie 250 punktów. Przy takiej punktacji nauczycielowi łatwiej jest grę uwiarygodnić, ponieważ jak głosi jej nazwa bardziej odpowiada warunkom spotykanym w życiu. Co więcej, łatwiej jest również postawić jasny cel: wygrywa ten kto zgromadzi więcej punktów. A same punkty można po prostu porównać do pieniędzy – wygra ten kto będzie bogatszy.
Gdy kilka laty temu, na jakimś szkoleniu, sam grałem w tę grę, zabawa zaiste była przednia, a wnioski same wchodziły do głowy. Grę tę można dodatkowo urozmaicić i rozegrać ją w środowisku małej wioski, gdzie każdy każdego zna i każdy wie jak dany gracz zagrał w poprzednich rundach. Albo rozegrać w anonimowym wielkim mieście, gdzie w każdej z rund absolutnie nic o przeciwniku nie wiemy. Ciekawym urozmaiceniem może być wprowadzenie reguły, że aktualny stan konta każdego gracza jest znany i można odmówić rozegrania rundy skutkujący tym, że ten kto odmawia traci 1 punkt, a ten komu odmówiono ani nic nie traci, ani nic nie zyskuje.
Oczywiście by osiągnąć cel dydaktyczny, czyli po prostu by przekazać swoim podopiecznym wartościową wiedzę, która im się przyda w dalszym życiu należy po grze dokładnie omówić jej przebieg. W pierwszym rzędzie chodzi o metody (zwane inaczej taktykami), które podpowiadały im jak zagrać w danym spotkaniu z danym graczem. Niewątpliwie najwięcej w tym temacie będą mieli do powiedzenia zwycięzcy. Ale i ci którzy zgromadzą najmniej punktów prawdopodobnie też opowiedzą o ciekawej sytuacji jaką jest przymus współpracy. Gdy bowiem spotyka się dwóch graczy, a każdy z nich ma na koncie mniej niż 10 punktów to obopólna współpraca jest najkorzystniejszym ruchem. Na koniec zajęć można polecić obejrzenie filmu „Piekło na Pacyfiku”, który opowiada o tym jak dwaj śmiertelni wrogowie znalazłszy się na bezludnej wyspie, po okresie bijatyk zaczynają żyć w pokoju. I chociaż trudno powiedzieć, że ich relacje są przyjacielskie to w końcu udaje im się porozumieć na tyle, że wspólnie budują tratwę i podczas nawałnicy, wspierając się nawzajem, przepływają na większą wyspę, gdzie…
…ich dalsza historia wkracza już w kolejne, arcyciekawe zagadnienie zwane cyklem społecznym.
Myślę, że każdy kto zagra w dylemat życia w grupie, będzie dokładnie wiedział, że na pytanie Pawła nie ma jednej prostej odpowiedzi.
Prezentowane zagadnienia należą do Fizyki Życia – działu nauki, łączącego różne dyscypliny naukowe, którego celem jest wyjaśnianie problematyki życia i wzajemnych interakcji pomiędzy obiektami żywymi. Więcej na ten temat TUTAJ
to jest bardzo czeste w prymitywnych skupiskach ludzkich np zlodziejstwo – kapitalizm gdzie pracobiorca dziala o jakiejs prymitywnej umowie o prace a pasozyt na ustawie o dzialalnosci gospodarczej … jest to bandyckie lamanie podstawowego prawa ze kazdy jest rowny wobec prawa …