Шкалы полезности и оценка полезности - Искусственный интеллект

Копия Глава 16. Принятие простых решений

Шкалы полезности и оценка полезности

Страница 1 из 2

Если даже известно, каково поведение агента в отношении предпочтений, аксиомы полезности не позволяют определить для него уникальную функцию полезности. Например, любую функцию полезности U( S) можно преобразовать в другую функцию:

где— некоторая константа;— любая положительная константа. Очевидно, что в результате этого линейного преобразования поведение агента останется неизменным.

В детерминированных контекстах, где имеются состояния, но не лотереи, поведение не изменяется под действием любого монотонного преобразования. Например, можно вычислить квадратный корень всех значений полезности, не повлияв на упорядочение действий по предпочтениям. Принято считать, что агент в детерминированной среде руководствуется функцией значения, или порядковой функцией полезности; по существу, эта функция обеспечивает лишь ранжирование состояний и не позволяет получить осмысленные числовые значения. Это различие было показано в главе 6 для игр: функции оценки в таких детерминированных играх, как шахматы, представляют собой функции значения, тогда как функции оценки в недетерминированных играх, подобных нардам, являются истинными функциями полезности.

Одна из процедур оценки полезностей состоит в том, что определяется шкала с "наилучшим возможным выигрышем" прии "наихудшим возможным проигрышем" при. Для нормализованных значений полезности используется шкала с. Оценка полезностей промежуточных результатов осуществляется путем опроса агента, который должен обозначить свое предпочтение между заданным результирующим состоянием S и стандартной лотереей . Вероятность ρ корректируется до тех пор, пока агент не становится безразличным к выбору между S и этой стандартной лотереей. Это означает, что при наличии нормализованных полезностей полезность S определяется вероятностью р.

<< В начало < Предыдущая 1 2 Следующая > В конец >>