Главная arrow книги arrow Копия Глава 12. arrow Условное планирование в полностью наблюдаемых вариантах среды
Условное планирование в полностью наблюдаемых вариантах среды

Полная наблюдаемость означает, что агент всегда знает текущее состояние. Но если среда является недетерминированной, то агент не будет способен предвидеть результат своих действий. Агент, занимающийся условным планированием, преодолевает такую недетерминированность, встраивая в свой план (на этапе планирования) условные этапы, в которых проверяется состояние среды (на этапе выполнения), для определения того, что делать дальше. Поэтому проблема состоит в том, как создавать такие условные планы.

Мы будем использовать в качестве примера проблемной области почтенный мир пылесоса, пространство состояний которого для данного детерминированного случая описано на с. 117. Напомним, что доступными действиями являются Left, Right и Suck. Нам потребуются определенные высказывания для описания этих состояний. Допустим, что предикат AtL (AtR) будет истинным, если агент находится в левом (правом) квадрате, а предикат CleanL (CleanR) истинен, если левый (правый) квадрат чист. Прежде всего необходимо дополнить язык Strips для того, чтобы он позволял учитывать недетерминированность. Для этого предусмотрено, чтобы действия имели дизъюнктивные результаты, а это означает, что действие может иметь два или несколько различных результатов при каждом его выполнении. Например, допустим, что действие по перемещению Left (Влево) иногда оканчивается неудачей. В таком случае следующее обычное описание действия:

должно быть модифицировано так, чтобы в него был включен следующий дизъюнктивный результат:

(12.1)

Авторы сочли также целесообразным, чтобы действия имели условные результаты, когда результат действия зависит от состояния, в котором оно выполняется. Условные результаты присутствуют в слоте Effect действия и имеют синтаксис

. Например, чтобы промоделировать действие Suck, необходимо записать следующее: