Bakover induksjon

Hva er bakoverinduksjon?

Bakoverinduksjon i spillteori er en iterativ prosess med resonnement bakover i tid, fra slutten av et problem eller en situasjon, for å løse en begrenset omfattende form og sekvensielle spill, og utlede en sekvens av optimale handlinger.

Bakover induksjon forklart

Bakoverinduksjon har blitt brukt til å løse spill siden John von Neumann og Oskar Morgenstern etablerte spillteori som et akademisk emne da de ga ut boken sin, Theory of Games and Economic Behavior i 1944.

På hvert stadium av spillet bestemmer bakover induksjon den optimale strategien til spilleren som gjør det siste trekket i spillet. Deretter bestemmes den optimale handlingen til den nest sist bevegelige spilleren, og tar den siste spillerens handling som gitt. Denne prosessen fortsetter bakover til den beste handlingen for hvert tidspunkt er bestemt. Effektivt bestemmer man Nash-likevekten til hvert delspill i det originale spillet.

Resultatene som er utledet fra induksjon bakover, klarer imidlertid ofte ikke å forutsi faktisk menneskelig lek. Eksperimentelle studier har vist at "rasjonell" atferd (som forutsagt av spillteori) sjelden vises i det virkelige liv. Irrasjonelle spillere kan faktisk ende opp med å oppnå høyere utbetalinger enn forutsagt av baklengs induksjon, som illustrert i tusenbeinspillet.

I tusenbeinspillet får to spillere vekselvis en sjanse til å ta en større andel av en økende pott med penger, eller gi potten videre til den andre spilleren. Utbetalingene er ordnet slik at dersom potten sendes til ens motstander og motstanderen tar potten på neste runde, mottar man litt mindre enn om man hadde tatt potten på denne runden. Spillet avsluttes så snart en spiller tar oppbevaringen, med den spilleren som får den største delen og den andre spilleren den mindre delen.

Eksempel på bakoverinduksjon

Som et eksempel, anta at Izaz går først og må bestemme om de skal "ta" eller "passere" stashen, som for øyeblikket utgjør $2. Hvis de tar, får Izaz og Jian $1 hver, men hvis Izaz består, må beslutningen om å ta eller bestå nå tas av Jian. Hvis Jian tar, får de $3 (dvs. forrige oppbevaring på $2 + $1) og Izaz får $0. Men hvis Jian passerer, får Izaz nå bestemme om han skal ta eller bestå, og så videre. Hvis begge spillerne alltid velger å bestå, mottar de hver en utbetaling på $100 på slutten av spillet.

Poenget med spillet er at hvis Izaz og Jian begge samarbeider og fortsetter å passere til slutten av spillet, får de maksimal utbetaling på $100 hver. Men hvis de mistror den andre spilleren og forventer at de "tar" ved første anledning, spår Nash-likevekten at spillerne vil ta lavest mulig krav ($1 i dette tilfellet).

Nash-likevekten i dette spillet, der ingen spillere har et insentiv til å avvike fra sin valgte strategi etter å ha vurdert en motstanders valg, antyder at den første spilleren vil ta potten i den aller første runden av spillet. Men i virkeligheten er det relativt få spillere som gjør det. Som et resultat får de en høyere uttelling enn utbetalingen forutsagt av likevektsanalysen.

Løse sekvensielle spill ved å bruke bakover induksjon

Nedenfor er et enkelt sekvensielt spill mellom to spillere. Etikettene med spiller 1 og spiller 2 i dem er informasjonssettene for henholdsvis spiller en eller to. Tallene i parentes nederst i treet er utbetalingene ved hvert respektive punkt. Spillet er også sekvensielt, så spiller 1 tar den første avgjørelsen (venstre eller høyre) og spiller 2 tar sin avgjørelse etter spiller 1 (opp eller ned).

Bakoverinduksjon, som all spillteori, bruker forutsetningene om rasjonalitet og maksimering, noe som betyr at spiller 2 vil maksimere utbetalingen i enhver gitt situasjon. Ved begge informasjonssettene har vi to valg, fire i alt. Ved å eliminere valgene som spiller 2 ikke vil velge, kan vi begrense treet vårt. På denne måten vil vi markere linjene i blått som maksimerer spillerens uttelling ved det gitte informasjonssettet.

Etter denne reduksjonen kan spiller 1 maksimere utbetalingene nå som spiller 2s valg blir gjort kjent. Resultatet er en likevekt funnet ved bakover induksjon av spiller 1 som velger "høyre" og spiller 2 velger "opp". Nedenfor er løsningen på spillet med likevektsbanen med fet skrift.

For eksempel kan man enkelt sette opp et spill som ligner på det ovenfor ved å bruke selskaper som spillere. Dette spillet kan inkludere produktutgivelsesscenarier. Hvis selskap 1 ønsket å gi ut et produkt, hva kan selskap 2 gjøre som svar? Vil Company 2 gi ut et lignende konkurrerende produkt? Ved å forutsi salget av dette nye produktet i forskjellige scenarier, kan vi sette opp et spill for å forutsi hvordan hendelser kan utvikle seg. Nedenfor er et eksempel på hvordan man kan modellere et slikt spill.