Всем > Теория риска > Глава 5 > 5.5.Принятие решения о проведении неидеального эксперимента
Глава 5. Стоимость информации для принятия решения
В результате неидеального эксперимента мы получаем не конкретное указание на состояние природы, а лишь более точное вероятностное распределение этих состояний.
Распределение, которое предполагалось до эксперимента, называется априорным (от лат. "a priori" - буквально "от предшествующего"). Распределение, которое стало известно в результате эксперимента называют апостериорным (от лат. "a posteriori" - буквально "от последующего"). Соответствующие этим распределениям вероятности также называют априорными и апостериорными.
В отличие от детерминированных результатов идеального эксперимента, после неидеального приходится принимать решение все также в условиях риска, однако исходя уже не из первоначального (априорного) распределения, а на основе более точного апостерирорного.
Рассмотрим, каким образом это можно сделать на примере все той же дискретной модели рисковой ситуации.
Исходные данные
Исходная информация соответствует данным, которые приведены в таблице 5.1. Предположим, у нас есть возможность провести неидеальный эксперимент, который может указать состояние природы не абсолютно точно (со стопроцентной гарантией), а с некой уверенностью γ меньшей, чем 100% (γ < 1). Сколько должен стоить такой эксперимент, чтобы его проведение можно было признать экономически оправданным?
Чтобы оценить ожидаемый выигрыш при проведении неидеального эксперимента, необходимо знать два распределения:
Порядок принятия решения
1. Определим ожидаемый выигрыш МХ* без проведения эксперимента.
Также как и в предыдущем примере МХ* рассчитывается по зависимостям для дискретных моделей, рассмотренным в главе 3:
X* = Xk, MXk = max(MXi), i = 1..N
2. Определим вероятности результатов эксперимента.
Распределение возможных результатов также можно получить на основе рассуждений, которые уже применялись нами для случая идеального эксперимента (см. п.5.4). Вероятность того, что эксперимент укажет на состояние j, соответствует исходной (априорной) вероятности pj реализации данного состояния.
3. Определим апостериорные вероятности состояний природы.
В случае идеального эксперимента дальнейшие исходы были детерминированы и равны наилучшим показателям для каждого из состояний.
При неидеальном эксперименте ситуация продолжает быть рискованной, и вместо детерминированных исходов мы получаем новое (апостериорное) распределение для каждого конкретного результата эксперимента. По сути, вместо одной матрицы игры теперь есть две, каждая из которых реализуется с определенной вероятностью (см. рис.5.5).
Благодаря эксперименту, мы получаем указание на то, какое из возможных состояний природы реализуется. Предположим, эксперимент показал, что наступит состояние q. Поскольку эксперимент неидеальный, мы можем доверять такому результату только с уверенностью γ < 1. То есть, апостериорная вероятность реализации состояния q равна γ. В остальных случаях с вероятностью (1 - γ) могут реализоваться другие состояния.
В зависимости от характера ситуации и условий эксперимента нам могут быть известны их апостериорные вероятности, либо может понадобиться их найти самостоятельно с использованием некоторых допущений.
Далее мы будем применять следующее обозначение для апостериорных вероятностей:
p'j/r - это апостериорная (символ «'» - штрих) вероятность реализации состояния j, если эксперимент предсказал состояние r.
Рис.5.5. Формирование новых матриц игры в результате неидеального эксперимента.
В рассматриваемом примере всего два возможных состояния. Если эксперимент указал на первое состояние, то его апостериорная вероятность р'1/1 равна γ, а апостериорная вероятность второго состояния p'2/1 составит (1 - γ). И наоборот, если предсказано состояние 2, то
p'1/2 = 1 - γ
p'2/2 = γ
Примечание
В случае, когда состояний природы больше двух, оценка апостериорных вероятностей может осуществляться с использованием следующих рассуждений.
Суммарная вероятность получить любые состояния, отличные от q, равна (1 - γ). До проведения эксперимента нам были известны априорные вероятности этих состояний pj, j ≠ q. После эксперимента вероятности изменились, но можно предположить, что соотношение этих вероятностей осталось прежним. Поясним это допущение на простом примере. Предположим, возможны три состояния природы А, В и С. Состояние А до эксперимента было в 3 раза вероятнее состояния В (рА = 3рВ), Неидеальный эксперимент с уверенностью 90% показал, что выпадет состояние С. В оставшихся 10% из-за погрешности эксперимента мы можем получить как состояние А, так и состояние В. Их точные апостериорные вероятности p'A и p'B нам неизвестны, но можно допустить, что их соотношение по-прежнему будет 3 к 1. Тогда состояние А в этих 10% можно ожидать в 3 раза чаще, чем В. То есть апостериорные вероятности состояний А и В с учетом данного допущения можно рассчитать следующим образом:
p'A = pA / (pA + pB ) × 10% = 3/4 × 10% = 7,5%
p'В = pA / (pA + pB ) × 10% = 1/4 × 10% = 2,5%
Используя приведенные рассуждения, запишем формулы для расчета апостериорных вероятностей состояний в общем виде для ситуации, когда неидеальный эксперимент указал на состояние q с уверенностью γ :
а) для состояния q, на которое указал неидеальный эксперимент с уверенностью γ:
p'q/q = γ
б) для любого другого возможного состояния j, из числа отвергнутых неидеальным экспериментом (j ≠ q):
, j ≠ q ,
где:
p'j/q - апостериорная вероятность j-го состояния при условии, что эксперимент указал на состояние q;
pj - априорная вероятность j-го состояния.
Нетрудно заметить, что при таком расчете сумма апостериорных вероятностей всех отвергаемых неидеальным экспериментом состояний будет равна (1 - γ). Для случая с двумя возможными состояниями мы получаем формулы, рассмотренные нами выше при решении примера. В предельном случае, когда эксперимент дает 100% гарантию (γ = 1), данные зависимости описывают ситуацию идеального эксперимента.
4. Определим ожидаемые выигрыши альтернатив исходя из апостериорных распределений.
Так как в результате эксперимента мы получаем новое распределение состояний, то апостериорные ожидаемые выигрыши альтернатив будут отличаться от первоначальных. Для принятия обоснованного решения мы должны знать эти ожидаемые выигрыши для всех альтернатив при всех возможных результатах эксперимента.
Ожидаемый выигрыш МХi/r альтернативы Xi в случае, если эксперимент предсказал состояние r, находится исходя из матрицы для данного результата эксперимента:
В нашем примере мы получаем:
1) если эксперимент предсказал состояние r = 1:
МХ1/1 = р'1/1 х11 + p'2/1 х12 = γ х11 + (1 - γ ) х12
МХ2/1 = р'1/1 х21 + p'2/1 х22 = γ х21 + (1 - γ ) х22
2) если эксперимент предсказал состояние r = 2:
МХ1/2 = р'1/2 х11 + p'2/2 х12 = (1 - γ) х11 + γ х12
МХ2/2 = р'1/2 х21 + p'2/2 х22 = (1 - γ) х21 + γ х22
5. Находим оптимальные альтернативы и ожидаемые выигрыши для каждого результата эксперимента
При любом результате эксперимента рассматриваемый нами ЛПР выберет ту альтернативу, которая обещает наибольший ожидаемый выигрыш именно при таком развитии событий.
Если обозначить через Х(r) оптимальную альтернативу, обеспечивающую максимальный ожидаемый выигрыш для случая, когда эксперимент предсказал состояние r, то принцип ее выбора можно математически записать следующим образом:
Х(r) = Xk/r , МХk/r = max(MXi / r )
То есть в нашем примере, у нас будут два значения ожидаемого выигрыша: Х(1) для случая, если эксперимент предскажет первое состояние, и Х(2) если эксперимент предскажет второе состояние.
6. Рассчитываем ожидаемый выигрыш при осуществлении эксперимента.
Эксперимент может предсказать любое состояние r из числа возможных (r = 1..М) с вероятностью pr. При этом ожидаемый выигрыш для конкретного результата r составит Х(r). Тогда, ожидаемый выигрыш, если мы примем решение провести эксперимент, может быть найден по формуле:
7. Определим ожидаемую выгоду от проведения идеального эксперимента и сравним с его стоимостью.
Этот этап полностью аналогичен принятию решения о проведении идеального эксперимента. Выгода ΔМ от проведения эксперимента при оценке по критерию ожидаемого выигрыша равна разности значений данного критерия с экспериментом и без него:
ΔМ = MY - МХ*
Целесообразность проведения оценивается путем сравнения выгоды ΔМ и стоимости СY эксперимента:
СY < ΔМ - эксперимент проводится;
СY > ΔМ - эксперимент не проводится.
Дерево событий и логика принятия решения о проведении неидеального эксперимента приведена рис.5.6. Отметим несколько моментов.
Рис.5.6. Описание дерева событий и логики принятия решения для случая неидеального эксперимента.
Сумма вероятностей всех веток, выходящих из одного узла дерева, всегда должна быть равна единице. Первое "ветвление" дерева событий аналогично случаю идеального эксперимента. Здесь из узла "Э" ("эксперимент"), есть два варианта развития событий:
Так как возможны только эти два состояния природы, то сумма вероятностей р1 и р2 равна 1.
Далее ветвление вариантов продолжается (в отличие от идеального эксперимента). Даже если эксперимент предсказывает конкретное состояние, это не исключает возможность реализации другого. И по-прежнему, суммы вероятностей состояний, исходящих из узла "1" ("предсказано состояние 1") и узла "2" ("предсказано состояние 2") равны единице:
p'1/1 + p'2/1 = 1
p'1/2 + p'2/2 = 1
Вероятность p'j/r представляет собой условную вероятность наступления состояния j при условии, что было предсказано состояние r. При необходимости нахождения полных вероятностей можно воспользоваться теоремой Байеса, известной из курса теории вероятностей.
Дата обновления: 25.09.2014