Какво е дилемата на затворника?
Дилемата на затворника е парадокс в анализа на решения, при който двама лица, действащи в собствените си лични интереси, не дават оптимален резултат. Типичната дилема на затворника е поставена по такъв начин, че и двете страни да изберат да се защитят за сметка на другия участник. В резултат и двамата участници се оказват в по-лошо състояние, отколкото ако са си сътрудничили помежду си в процеса на вземане на решения. Дилемата на затворника е едно от най-известните понятия в съвременната теория на игрите.
Ключови заведения
- Дилемата на затворника е ситуация, при която отделните лица, които вземат решения, винаги имат стимул да изберат по начин, който създава по-малко от оптималния резултат за отделните хора като група. Дилемите на Призъни се срещат в много аспекти на икономиката. Хората са разработили много методи за преодоляване на дилемите на затворника, за да изберат по-добри колективни резултати, въпреки очевидно неблагоприятните индивидуални стимули.
Дилема на затворника
Разбиране на дилемата на затворника
Дилемата на затворника представя ситуация, при която две страни, разделени и неспособни да общуват, трябва всеки да избере между сътрудничеството с другия или не. Най-високата награда за всяка страна се получава, когато и двете страни решат да си сътрудничат.
Класическата дилема на затворника върви така: двама членове на банда банкови обирджии, Дейв и Хенри, са арестувани и са разпитвани в отделни стаи. Властите нямат други свидетели и могат да докажат делото срещу тях само ако успеят да убедят поне един от разбойниците да предаде своя съучастник и да даде показания за престъплението. Всеки банков разбойник е изправен пред избора да съдейства на съучастника си и да мълчи или да дефектира от бандата и да даде показания за обвинението. Ако двамата си сътрудничат и мълчат, властите ще могат да ги осъдят само с по-малка такса за нахлуване, което ще означава една година в затвора всеки (1 година за Дейв + 1 година за Хенри = 2 години общ затвор време). Ако единият свидетелства, а другият не, тогава този, който свидетелства, ще се освободи, а другият ще получи три години (0 години за този, който погреши + 3 за осъдения = общо 3 години). Ако обаче и двамата свидетелстват срещу другия, всеки ще получи две години в затвора за това, че е частично отговорен за грабежа (2 години за Дейв + 2 години за Хенри = 4 години общо затворно време).
В този случай всеки разбойник винаги има стимул за дефект, независимо от избора, който прави другият. От гледна точка на Дейв, ако Хенри мълчи, тогава Дейв може или да си сътрудничи с Хенри и да направи една година в затвора, или да дефектира и да излезе на свобода. Очевидно в този случай ще е по-добре да предаде Хенри и останалата банда. От друга страна, ако Хенри дефектира и свидетелства срещу Дейв, тогава изборът на Дейв става или да мълчи и да прави три години, или да говори и да прави две години в затвора. Отново, очевидно, той би предпочел да направи двете години над три.
И в двата случая, независимо дали Хенри си сътрудничи с Дейв или дефекти на прокуратурата, Дейв ще бъде по-добре, ако самият той дефектира и даде показания. Тъй като Хенри е изправен пред същият набор от избори, той също винаги ще бъде по-добре да дефектира. Парадоксът на дилемата на затворника е следният: и двамата разбойници могат да сведат до минимум общото време на затвора, което двамата ще направят само ако двамата си сътрудничат (общо 2 години), но стимулите, с които се сблъскват поотделно, винаги ще ги карат всеки да дефектира и в крайна сметка прави максималния общ затвор време между двамата (общо 4 години).
Примери за дилемата на затворника
Икономиката е пълна с примери за дилеми на затворници, които могат да имат резултати, които са полезни или вредни за икономиката и за обществото като цяло. Общата нишка са ситуации, при които стимулите, с които се сблъсква всеки отделен човек, който взема решение, би ги накарал всеки да се държи по начин, който прави всички колективно по-лоши, като поотделно избягва изборите, които биха направили всички колективно по-добри, ако всички могат някои избират по някакъв начин съвместно.
Един такъв пример е трагедията на общините. Възможно е в колективно предимство на всеки да се запази и да се инвестира отново в разпространението на общ природен ресурс, за да може да продължи да го консумира, но всеки индивид винаги има стимул вместо това да консумира възможно най-бързо, което е възможно след това изтощава ресурса. Намирането на някакъв начин за сътрудничество очевидно би направило тук всички по-добри.
От друга страна, поведението на картелите също може да се счита за дилема на затворник. Всички членове на картел могат колективно да се обогатяват чрез ограничаване на продукцията, за да запазят цената, която всеки получава достатъчно висока, за да улавя икономически наеми от потребителите, но всеки член на картела поотделно има стимул да изневерява на картела и да увеличи продукцията, за да вземе и наеми далеч от другите членове на картела. По отношение на благосъстоянието на цялото общество, в което картелът работи, това е пример за това как дилемата на затворниците, която разрушава картела, понякога може всъщност да направи обществото по-добро като цяло.
Бягство от дилемата на затворника
С течение на времето хората разработиха различни решения на дилемите на затворника, за да преодолеят индивидуалните стимули в полза на общото благо.
Първо, в реалния свят повечето икономически и други човешки взаимодействия се повтарят повече от веднъж. Истинската дилема на затворника обикновено се играе само веднъж или иначе се класифицира като повторена дилема на затворника. В повторена дилема на затворника играчите могат да избират стратегии, които да възнаграждават сътрудничеството или да наказват дефектите във времето. Чрез многократно взаимодействие с едни и същи индивиди можем дори умишлено да преминем от дилемата на еднократния затворник до повторната дилема на затворника.
Второ, хората са разработили официални институционални стратегии за промяна на стимулите, с които се сблъскват отделните отговорни лица. Колективните действия за налагане на поведение на сътрудничество чрез репутация, правила, закони, демократично или друго колективно вземане на решения и изрично социално наказание за дефекти трансформират много дилеми на затворника към по-изгодни резултати от съвместната работа.
И накрая, някои хора и групи от хора са развили психологически и поведенчески пристрастия във времето, като по-голямо доверие един в друг, дългосрочна бъдеща ориентация при многократни взаимодействия и склонност към положителна реципрочност на поведението на сътрудничество или отрицателна реципрочност на дефектните поведения. Тези тенденции могат да се развият чрез естествен подбор в рамките на едно общество във времето или групов подбор в различни конкурентни общества. В действителност те водят групи от хора да „ирационално“ избират резултати, които всъщност са най-полезни за всички тях заедно.
Взети заедно, тези три фактора (повтарящите се дилеми на затворника, формалните институции, които разрушават дилемите на затворника, и поведенческите пристрастия, които подкопават „рационалния“ индивидуален избор в дилемите на затворника) помагат за разрешаването на множеството дилеми на затворника, с които всички бихме се изправили иначе.