Принятие решений в условиях неопределенности
Теория статистических решений может быть истолкована как теория поиска оптимального недетерминированного поведения в условиях неопределенности. Согласно А.Вальду, поведение считается оптимальным, если оно минимизирует риск в последовательных экспериментах, т.е. математическое ожидание убытков статистического эксперимента.
Считаю необходимым рассмотреть четыре критерия принятия решений в условиях неопределенности, когда никакие вероятностные характеристики не известны.
· критерий Лапласа,
· минимаксный критерий,
· критерий Сэвиджа,
· критерий Гурвица.
Основное различие между этими критериями определяется стратегией лица, принимающего решения. Критерий Лапласа основан на более оптимистичных предположениях, чем минимаксный критерий. Критерий Гурвица можно использовать при различных подходах – от наиболее оптимистичного до наиболее пессимистичного. Все эти критерии отражают субъективную оценку ситуации, в которой приходится принимать решение. При этом не существует общих правил применимости того или иного критерия, так как поведение лица, принимающего решение в условиях неопределенности, является наиболее важным фактором при выборе подходящего критерия.
Перечисленные критерии базируются на том, что лицу, принимающему решение, не противостоит разумный противник. В случае, когда в роли противника выступает природа, нет оснований предполагать, что она стремится причинить вред лицу, принимающему решение.
При наличии разумного противника, интересы которого противоречат интересам лица, принимающего решения (например, в военных действиях противоборствующие армии являются разумными противниками), для построения подходящего критерия требуется специальный подход. Эти вопросы рассматриваются в теории игр.
Данные, необходимые для принятия решений в условиях неопределенности, задаются в форме матрицы, строки которой соответствуют действиям, а столбцы - возможным состояниям системы.
Каждому действию и каждому возможному состоянию системы соответствует результат (исход), определяющий выигрыш (или потери) при выборе данного действия и реализации данного состояния.
Пусть ai (i=1,2, ... , m)
и q j представляет возможное состояние j ( j=1,2, ... ,n),
n ( ai , q j ) - описывает соответствующий результат.
В общем случае n ( ai , q j ) может быть непрерывной функцией ai и q j .
В дискретном случае указанные данные представляются в форме матрицы.
q 1 q 2 ... q n a1 n (a1 ,q 1) n (a1 ,q 2) ... n (a1 ,q n) a2 n (a2 ,q 1) n (a2 ,q 2) ... n (a2 ,q n) ... ... ... ... ... am n (am ,q 1) n (am ,q 2) ... n (am ,q n)
Критерий Лапласа
Этот критерий опирается на известный принцип недостаточного обоснования. Поскольку вероятности состояний q 1, q 2, ... ,q n не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. В противном случае можно было бы определить эти вероятности и ситуацию уже не следовало рассматривать как принятие решения в условиях неопределенности. Так как принцип недостаточного обоснования утверждает противоположное, то состояния q 1, q 2, ...,q n имеют равные вероятности. Если согласиться с приведенными доводами, то исходную задачу можно рассматривать как задачу принятия решений в условиях риска, когда выбирается действие ai , дающее ожидаемый выигрыш.
Другими словами, находится действие ai* , соответствующее
- вероятность реализации состояния q j ( j=1,2, ... ............