Investor's wiki

Induction en arrière

Induction en arrière

Qu'est-ce que l'induction à rebours ?

L'induction vers l'arrière dans la théorie des jeux est un processus itératif de raisonnement vers l'arrière dans le temps, à partir de la fin d'un problème ou d'une situation, pour résoudre une forme extensive finie et des jeux séquentiels, et déduire une séquence d'actions optimales.

L'induction en arrière expliquée

L'induction à rebours est utilisée pour résoudre des jeux depuis que John von Neumann et Oskar Morgenstern ont établi la théorie des jeux comme matière académique lorsqu'ils ont publié leur livre Theory of Games and Economic Behavior en 1944.

A chaque étape du jeu, l'induction à rebours détermine la stratégie optimale du joueur qui effectue le dernier coup de la partie. Ensuite, l'action optimale de l'avant-dernier joueur en mouvement est déterminée, en prenant l'action du dernier joueur comme donnée. Ce processus se poursuit en arrière jusqu'à ce que la meilleure action pour chaque instant ait été déterminée. En effet, on détermine l' équilibre de Nash de chaque sous-jeu du jeu original.

Cependant, les r√©sultats d√©duits de l'induction √† rebours √©chouent souvent √† pr√©dire le jeu humain r√©el. Des √©tudes exp√©rimentales ont montr√© que le comportement ¬ę rationnel ¬Ľ (tel que pr√©dit par la th√©orie des jeux) se manifeste rarement dans la vie r√©elle. Les joueurs irrationnels peuvent en fait finir par obtenir des gains plus √©lev√©s que pr√©vu par l'induction √† rebours, comme illustr√© dans le jeu du mille-pattes.

Dans le jeu du mille-pattes, deux joueurs ont alternativement la possibilité de prendre une plus grande part d'un pot d'argent croissant ou de passer le pot à l'autre joueur. Les gains sont arrangés de sorte que si le pot est passé à son adversaire et que l'adversaire prend le pot au tour suivant, on reçoit un peu moins que si on avait pris le pot à ce tour. Le jeu se termine dès qu'un joueur prend la réserve, ce joueur obtenant la plus grande partie et l'autre joueur obtenant la plus petite partie.

Exemple d'induction en arrière

Par exemple, supposons qu'Izaz passe en premier et doive d√©cider s'il doit ¬ę prendre ¬Ľ ou ¬ę passer ¬Ľ la r√©serve, qui s'√©l√®ve actuellement √† 2 $. S'ils prennent, alors Izaz et Jian gagnent 1 $ chacun, mais si Izaz passe, la d√©cision de prendre ou de passer doit maintenant √™tre prise par Jian. Si Jian prend, ils obtiennent 3 $ (c'est-√†-dire la r√©serve pr√©c√©dente de 2 $ + 1 $) et Izaz obtient 0 $. Mais si Jian passe, Izaz doit maintenant d√©cider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils re√ßoivent chacun un gain de 100 $ √† la fin de la partie.

Le but du jeu est que si Izaz et Jian coop√®rent tous les deux et continuent √† passer jusqu'√† la fin du jeu, ils obtiennent le paiement maximum de 100 $ chacun. Mais s'ils se m√©fient de l'autre joueur et s'attendent √† ce qu'il ¬ęprenne¬Ľ √† la premi√®re occasion, l'√©quilibre de Nash pr√©dit que les joueurs prendront la r√©clamation la plus faible possible (1 $ dans ce cas).

L'√©quilibre de Nash de ce jeu, o√Ļ aucun joueur n'a d'incitation √† s'√©carter de la strat√©gie qu'il a choisie apr√®s avoir examin√© le choix d'un adversaire, sugg√®re que le premier joueur remporterait le pot d√®s le premier tour du jeu. Cependant, en r√©alit√©, relativement peu de joueurs le font. En cons√©quence, ils obtiennent un gain plus √©lev√© que le gain pr√©dit par l'analyse des √©quilibres.

Résolution de jeux séquentiels à l'aide de l'induction inverse

Ci-dessous, un simple jeu séquentiel entre deux joueurs. Les étiquettes contenant le joueur 1 et le joueur 2 sont les ensembles d'informations pour les joueurs un ou deux, respectivement. Les nombres entre parenthèses au bas de l'arbre sont les gains à chaque point respectif. Le jeu est également séquentiel, donc le joueur 1 prend la première décision (gauche ou droite) et le joueur 2 prend sa décision après le joueur 1 (haut ou bas).

L'induction à rebours, comme toute théorie des jeux, utilise les hypothèses de rationalité et de maximisation, ce qui signifie que le joueur 2 maximisera son gain dans une situation donnée. À chaque ensemble d'informations, nous avons deux choix, quatre en tout. En éliminant les choix que le joueur 2 ne choisira pas, nous pouvons affiner notre arbre. De cette manière, nous marquerons les lignes en bleu qui maximisent le gain du joueur pour l'ensemble d'informations donné.

Apr√®s cette r√©duction, le joueur 1 peut maximiser ses gains maintenant que les choix du joueur 2 sont connus. Le r√©sultat est un √©quilibre trouv√© par induction vers l'arri√®re du joueur 1 choisissant ¬ę √† droite ¬Ľ et du joueur 2 choisissant ¬ę en haut ¬Ľ. Vous trouverez ci-dessous la solution du jeu avec le chemin d'√©quilibre en gras.

Par exemple, on pourrait facilement mettre en place un jeu similaire à celui ci-dessus en utilisant des entreprises comme joueurs. Ce jeu pourrait inclure des scénarios de lancement de produits . Si la société 1 voulait lancer un produit, que pourrait faire la société 2 en réponse ? La société 2 lancera-t-elle un produit concurrent similaire ? En prévoyant les ventes de ce nouveau produit dans différents scénarios, nous pouvons mettre en place un jeu pour prédire comment les événements pourraient se dérouler. Vous trouverez ci-dessous un exemple de la façon dont on pourrait modéliser un tel jeu.