Принятие решений при наличии нескольких агентов: теория игр

Копия Глава 17. Принятие сложных решений

Страница 5 из 14

Парадоксальность дилеммы заключенного состоит в том, что результат в точке равновесия для обоих игроков хуже по сравнению с результатом, которого они достигли бы, если бы оба отказались свидетельствовать друг против друга. Иными словами, результат для равновесного решения доминируется по принципу Парето результатом (-1,-1), который соответствует обоюдному отказу от свидетельства, (refuse,refuse).

Существует ли какой-либо способ, с помощью которого Алиса и Боб могли бы формально прийти к результату (-1,-1)? Безусловно, что для них обоих вариант, в котором они отказываются свидетельствовать, является допустимым, но этот вариант маловероятен. Любой игрок, анализирующий вариант хода refuse, поймет, что для него было бы лучше выбрать ход testify. В этом состоит притягательная мощь точки равновесия.

Математик Джон Нэш (род. в 1928 году) доказал теорему, согласно которой каждая игра имеет равновесие такого типа, которое определено в данном примере.

Теперь указанное условие называют в его честь равновесием Нэша. Очевидно, что равновесием доминантных стратегий является равновесие Нэша, но не все игры имеют доминантные стратегии. Теорема Нэша означает, что равновесные стратегии могут существовать даже при отсутствии доминантных стратегий.

В дилемме заключенного равновесием Нэша является только профиль стратегий (testify, testify). Трудно понять, как рациональные игроки могут избежать такого результата, поскольку в любом предложенном неравновесном решении по меньшей мере один из игроков будет подвергаться соблазну изменить свою стратегию. Специалисты в области теории игр соглашаются с тем, что обязательным условием того, чтобы некоторый ход представлял собой решение, является принадлежность его к равновесию Нэша, но еще не достигнуто полное согласие в отношении того, является ли это условие достаточным.

Решения (testify, testify) можно довольно легко избежать, немного изменив правила игры (или взгляды игроков). Например, можно перейти к итерационной игре, в которой игроки знают, что когда-то обязательно снова встретятся и вспомнят, как действовали при прошлой встрече (но крайне важно то, что они не должны иметь определенной информации о том, через какое время встретятся). Кроме того, если агенты имеют моральные убеждения, которые способствуют сотрудничеству и справедливому отношению друг к другу, то можно изменить матрицу вознаграждения так, чтобы она отражала для каждого агента полезность взаимодействия с другим агентом. Как будет показано ниже, на результатах может также отразиться такая модификация агентов, чтобы они обладали ограниченной вычислительной мощью, а не способностью рассуждать абсолютно рационально, а также предоставление одному агенту информации о том, что способности другого рассуждать рационально ограничены.

<< В начало < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Следующая > В конец >>