Какво е обратна индукция?
Обратната индукция в теорията на игрите е итеративен процес на разсъждение назад във времето, от края на проблем или ситуация, за решаване на ограничена обширна форма и последователни игри и извеждане на последователност от оптимални действия.
Обяснено назад индукция
Обратната индукция се използва за решаване на игри, тъй като Джон фон Нойман и Оскар Моргенстерн установяват теорията на игрите като академичен предмет, когато публикуват книгата си „ Теория на игрите и икономическото поведение“ през 1944 г.
На всеки етап от играта назад индукцията определя оптималната стратегия на играча, който прави последния ход в играта. Тогава се определя оптималното действие на движещия се от последния до последния играч, като се предприеме действието на последния играч според дадеността. Този процес продължава назад, докато не се определи най-доброто действие за всеки момент от време. Ефективно е да се определи равновесието на Наш на всяка подграда на оригиналната игра.
Въпреки това, резултатите, произтичащи от назад индукция, често не успяват да предскажат действителната човешка игра. Експерименталните проучвания показват, че „рационалното” поведение (както е предвидено от теорията на игрите) рядко се проявява в реалния живот. Ирационалните играчи всъщност могат да получат по-високи печалби от предвиденото чрез индукция назад, както е илюстрирано в играта със стоножки.
В играта на стоножки двама играчи последователно получават шанс да вземат по-голям дял от нарастващ пот пари или да предадат пота на другия играч. Изплащанията са подредени така, че ако потът се предаде на противника и противникът вземе пота на следващия кръг, човек получава малко по-малко, отколкото ако човек е взел пота на този рунд. Играта приключва, щом играчът вземе скривалището, като този играч получи по-голямата част, а другият играч получи по-малката част.
Пример за обратна индукция
Като пример, приемете, че Играч А е на първо място и трябва да реши дали трябва да „вземе“ или „предаде“ скривалището, което в момента възлиза на 2 долара. Ако той вземе, тогава A и B получават по 1 $ всеки, но ако A премине, решението да вземе или да премине сега трябва да бъде взето от Играч B. Ако B вземе, тя получава $ 3 (т.е. предишното скривалище от $ 2 + $ 1) и A получава $ 0. Но ако B премине, сега A решава дали да вземе или да премине и т.н. Ако и двамата играчи винаги решат да преминат, всеки в края на играта получава награда от 100 долара.
Смисълът на играта е, ако А и Б и двете си сътрудничат и продължат да преминават до края на играта, те получават максимално изплащане от 100 долара всяка. Но ако имат недоверие към другия играч и очакват да ги „вземат“ при първа възможност, равновесието на Неш прогнозира, че играчите ще поемат възможно най-ниския иск ($ 1 в този случай).
Равновесието на Наш в тази игра, при което никой играч няма стимул да се отклони от избраната от него стратегия, след като обмисли избора на противник, предполага, че първият играч ще вземе пота още в първия кръг на играта. В действителност обаче сравнително малко играчи правят това. В резултат на това те получават по-високо изплащане от предвиденото от анализа на равновесието изплащане.
Решаване на последователни игри с помощта на обратна индукция
По-долу е проста последователна игра между двама играчи. Етикетите с Player 1 и Player 2 в тях са информационните набори за играчи съответно един или двама. Числата в скобите в долната част на дървото са изплащанията във всяка съответна точка. Играта също е последователна, така че Играч 1 взема първото решение (отляво или отдясно), а Играч 2 взема своето решение след Играч 1 (нагоре или надолу).
Фигура 1
Обратната индукция, както всички теории на игрите, използва предположенията за рационалност и максимизация, което означава, че Играч 2 ще увеличи максимално своето изплащане във всяка дадена ситуация. Във всеки набор от информация имаме два варианта, общо четири. Елиминирайки избора, който Player 2 няма да избере, можем да стесним дървото си. По този начин ще удебелим линиите, които максимално изплащат играча при дадения набор от информация.
Фигура 2
След това намаление, Player 1 може да увеличи своите изплащания сега, когато изборите на Player 2 станат известни. Резултатът е равновесие, открито чрез индуциране назад на Player 1, който избира "правилно" и Player 2 избира "нагоре". По-долу е решението на играта с удебелен балансиращ път.
Фигура 3
Например, лесно може да се създаде игра, подобна на тази по-горе, като се използват компании като играчи. Тази игра може да включва сценарии за пускане на продукти. Ако компания 1 иска да пусне продукт, какво може да направи компания 2 в отговор? Ще пусне ли компания 2 подобен конкурентноспособен продукт? Като прогнозираме продажбите на този нов продукт в различни сценарии, можем да създадем игра, която да предвиди как може да се развият събитията. По-долу е даден пример за това как човек може да моделира такава игра.
Фигура 4