Аксиомы теории принятия решений
В этом разделе формулируются основные аксиомы теории принятия решений. Из приведенных аксиом следует принцип выбора действия. Он состоит в том, что нужно выбирать такую альтернативу, которая максимизирует ожидаемую полезность. Если сформулированные аксиомы кажутся разумными при рассмотрении какой-либо конкретной проблемы, то такие понятия, как суждения и предпочтения, следует выразить в числовой форме в соответствии с аксиомами 4 и 5. Аксиомы 4 и 5 превращают теорию принятия решений в рабочий инструмент анализа сложных проблем (или, как говорят, эта теория становится операционной). В подразделах 2.7 и 2.8 описываются процедуры, позволяющие получить необходимые числовые значения.
Прежде чем формулировать аксиомы теории принятия решений, введем обозначения и определения. Простой лотереей L(х1, р, x2) назовем вероятностное событие, имеющее два возможных исхода x1 и x2, вероятности наступления которых обозначим соответственно через р и (1-р). Знаками , ~, будем соответственно обозначать понятия «предпочтительнее», «равноценно», «равноценно или предпочтительнее». Например, если x1~L(х2, р, x3), то исход x1 равноценен лотерее, которая имеет исходы x2 с вероятностью р или x3 с вероятностью (1-р). Теперь сформулируем ряд аксиом теории принятия решений.
Аксиома 1. Существование относительных предпочтений. Для любой пары исходов x1 и x2 их предпочтения будут таковы, что или x1~x2, или x1x2, или x2x1.
Аксиома 2. Транзитивность. Для любых лотерей L1, L2 и Lз справедливо следующее:
(а) если L1~L2 и L2~Lз, то L1~Lз;
(б) если L1L2 и L2~Lз, то L1Lз и т. д.
Поскольку исход можно интерпретировать как вырожденный случай лотереи (то есть, р=1), то аксиомы 1 и 2 вместе означают, что ЛПР может провести ранжировку относительного предпочтения различных возможных исходов. Эти аксиомы не требуют стационарности ранжировки во времени и не утверждают, что ЛПР может объяснить свои предпочтения. Обозначим через исход, который не является более предпочтительным, чем любой другой исход, а через х* - исход, не менее предпочтительный, чем любой другой исход. Таким образом, единственная возможность состоит в том, что и х* означают соответственно наименее и наиболее предпочтительные исходы, хотя они могут представлять собой гипотетические исходы такие, что х.*x и xдля всех допустимых Х. Продолжим изложение аксиом.
Аксиома 3. Сравнение простых лотерей. Если для ЛПР x1x2, то
(а) L1(x1, p1, x2)L1(x1, p2, x2) при pl>p2.
Аксиома 4. Численная оценка предпочтений. Каждому возможному исходу х ЛПР может поставить в соответствие число (х) (где 0(х)1), такое, что х~L(х*, (х), ).
Аксиомы 3 и 4 определяют для ЛПР меру относительного предпочтения различных исходов. Величина (х), называемая вероятностью равноценности, является такой мерой.
Аксиома 5. Численная оценка неопределенности суждений. Каждому возможному событию Е, которое может влиять на исход решения, можно поставить в соответствие число Р(Е), где 0P(E)1, такое, что становятся равноценными лотерея L(х*, Р(Е), ) и ситуация, при которой ЛПР получает х*, если происходит событие Е, и , если событие Е не происходит. Значение Р(Е) определяется ЛПР.
Для того чтобы получить достаточно приемлемые оценки вероятностей событий, возможно, потребуется просмотреть большое число выборок. Однако, как указывалось выше, для многих важных проблем это неосуществимо. Аксиома 5 дает механизм получения вероятностей суждений для обеих ситуаций. Поскольку вероятности Р(Е) удовлетворяют аксиомам теории вероятностей, все результаты этой теории можно применить и для анализа проблем.
Аксиома 6. Возможность замены. Если модифицировать задачу принятия решения путем замены одного исхода (или лотереи) другим исходом (или лотереей), которые равноценны для ЛПР, то обе задачи принятия решения (старая и модифицированная) будут равноценны для этого лица.
Аксиома 7. Эквивалентность условного и безусловного предпочтений. Пусть L1 и L2 - две лотереи, возможные только при наступлении события Е. Если известно, наступит событие Е или нет, то ЛПР должно иметь те же предпочтения между L1 и L2, как и при отсутствии этой информации.
Как уже отмечалось, мера (x) описывает относительные предпочтения для х. Очевидно, что в разных ситуациях можно брать различные -функции, поскольку граничные значения и х* для измерения (х) являются достаточно произвольными. Однако, чтобы все возможные -функции удовлетворяли предыдущим семи аксиомам, они должны сводиться одна к другой с помощью положительного линейного преобразования. Любое положительное линейное преобразование следующего вида:
u(х)=а+b(х), b>0, (2.1)
будем называть шкалой полезности для исходов х. Если ЛПР опирается на данные аксиомы, ему надлежит всегда выбирать альтернативы так, чтобы максимизировать ожидаемую полезность. Согласно сформулированным аксиомам, не существует других процедур принятия решений.
Поскольку максимизация ожидаемой полезности эквивалентна максимизации ожидаемого значения в (2.1), произвольный выбор х* и не влияет на фактическое решение. Шкала полезности аналогична температурным шкалам; разные шкалы, которые получаются одна из другой с помощью положительного линейного преобразования, эквивалентны с позиции их использования для целей принятия решений.