Indução para trás
O que é indução para trás?
A indução para trás na teoria dos jogos é um processo iterativo de raciocínio para trás no tempo, a partir do final de um problema ou situação, para resolver uma forma finita e extensa e jogos sequenciais, e inferir uma sequência de ações ótimas.
Indução para trás explicada
A indução regressiva tem sido usada para resolver jogos desde que John von Neumann e Oskar Morgenstern estabeleceram a teoria dos jogos como um assunto acadêmico quando publicaram seu livro Theory of Games and Economic Behavior em 1944.
Em cada estágio do jogo, a indução para trás determina a estratégia ideal do jogador que faz a última jogada no jogo. Então, a ação ideal do penúltimo jogador em movimento é determinada, tomando a ação do último jogador como dada. Este processo continua para trás até que a melhor ação para cada ponto no tempo tenha sido determinada. Efetivamente, determina-se o equilíbrio de Nash de cada subjogo do jogo original.
No entanto, os resultados inferidos da indução para trás muitas vezes não conseguem prever o jogo humano real. Estudos experimentais mostraram que o comportamento “racional” (como previsto pela teoria dos jogos) raramente é exibido na vida real. Jogadores irracionais podem realmente acabar obtendo recompensas mais altas do que o previsto pela indução regressiva, como ilustrado no jogo da centopéia.
No jogo da centopéia, dois jogadores alternadamente têm a chance de receber uma parte maior de um pote crescente de dinheiro ou de passar o pote para o outro jogador. Os pagamentos são organizados de modo que se o pote for passado para o oponente e o oponente ganhar o pote na próxima rodada, ele receberá um pouco menos do que se tivesse levado o pote nesta rodada. O jogo termina assim que um jogador pega o estoque, com aquele jogador recebendo a porção maior e o outro jogador recebendo a porção menor.
Exemplo de indução para trás
Como exemplo, suponha que Izaz vá primeiro e tenha que decidir se deve “pegar” ou “passar” o estoque, que atualmente equivale a $ 2. Se eles aceitarem, Izaz e Jian recebem $ 1 cada, mas se Izaz passar, a decisão de aceitar ou passar agora deve ser tomada por Jian. Se Jian pegar, eles recebem $3 (ou seja, o estoque anterior de $2 + $1) e Izaz recebe $0. Mas se Jian passar, Izaz agora decide se aceita ou passa, e assim por diante. Se ambos os jogadores sempre optarem por passar, cada um receberá uma recompensa de $ 100 no final do jogo.
O ponto do jogo é que, se Izaz e Jian cooperarem e continuarem a passar até o final do jogo, eles receberão o pagamento máximo de $ 100 cada. Mas se eles desconfiam do outro jogador e esperam que ele “pegue” na primeira oportunidade, o equilíbrio de Nash prevê que os jogadores terão a menor reivindicação possível ($1 neste caso).
O equilíbrio de Nash deste jogo, onde nenhum jogador tem um incentivo para se desviar de sua estratégia escolhida depois de considerar a escolha de um oponente, sugere que o primeiro jogador levaria o pote na primeira rodada do jogo. No entanto, na realidade, relativamente poucos jogadores o fazem. Como resultado, eles obtêm um retorno maior do que o previsto pela análise de equilíbrio.
Resolvendo jogos sequenciais usando indução reversa
Abaixo está um jogo sequencial simples entre dois jogadores. Os rótulos com Jogador 1 e Jogador 2 dentro deles são os conjuntos de informações para os jogadores um ou dois, respectivamente. Os números entre parênteses na parte inferior da árvore são as recompensas em cada ponto respectivo. O jogo também é sequencial, então o jogador 1 toma a primeira decisão (esquerda ou direita) e o jogador 2 toma sua decisão após o jogador 1 (para cima ou para baixo).
A indução para trás, como toda a teoria dos jogos, usa as suposições de racionalidade e maximização, o que significa que o Jogador 2 maximizará sua recompensa em qualquer situação. Em qualquer conjunto de informações, temos duas opções, quatro ao todo. Ao eliminar as escolhas que o Jogador 2 não escolherá, podemos diminuir nossa árvore. Desta forma, marcaremos as linhas em azul que maximizam o pagamento do jogador no conjunto de informações fornecido.
Após essa redução, o Jogador 1 pode maximizar seus ganhos agora que as escolhas do Jogador 2 são conhecidas. O resultado é um equilíbrio encontrado por indução inversa do Jogador 1 escolhendo "certo" e o Jogador 2 escolhendo "para cima". Abaixo está a solução para o jogo com o caminho de equilíbrio em negrito.
Por exemplo, pode-se facilmente configurar um jogo semelhante ao acima usando empresas como jogadores. Este jogo pode incluir cenários de lançamento de produtos . Se a Empresa 1 quisesse lançar um produto, o que a Empresa 2 poderia fazer em resposta? A Empresa 2 lançará um produto concorrente similar? Ao prever as vendas desse novo produto em diferentes cenários, podemos montar um jogo para prever como os eventos podem se desenrolar. Abaixo está um exemplo de como alguém pode modelar tal jogo.