Макияж. Уход за волосами. Уход за кожей

Макияж. Уход за волосами. Уход за кожей

» » Применение теории игр для оптимизации принимаемых решений.

Применение теории игр для оптимизации принимаемых решений.

Стараясь занять наиболее уравновешенную позицию, Гурвиц предположил оценочную функцию, которая находится где-то между точкой зрения крайнего оптимизма и крайнего пессимизма:

e ir = {Ce ij + (1- C) e ij },

где С – весовой множитель.

Правило выбора согласно критерию Гурвица, формируется следующим образом:

матрица решений дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы e ir этого столбца.

При С =1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”

e ir = e ij ,

т.е. мы становимся на точку зрения азартного игрока, делающего ставку на то, что «выпадет» наивыгоднейший случай.

В технических приложениях сложно выбрать весовой множитель С , т.к. трудно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Поэтому чаще всего С := 1 / 2 .

Критерий Гурвица применяется в случае, когда:

    о вероятностях появления состояния F j ничего не известно;

    с появлением состояния F j необходимо считаться;

    реализуется только малое количество решений;

    допускается некоторый риск.

2О. Критерий Ходжа–Лемана.

Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра n выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае – ММ-критерий, т.е. мы ищем

e ir = {n + (1-n) e ir }, 0 £ n £ 1.

Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:

матрица решений дополняется столбцом, составленным из средних взвешенных (с весом n º const ) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.

При n = 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при n = 0 становится минимаксным.

Выбор n субъективен т. к. Степень достоверности какой-либо функции распределения – дело тёмное.

Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

    F j неизвестны, но некоторые предположения о распределении вероятностей возможны;

    принятое решение теоретически допускает бесконечно много реализаций;

    при малых числах реализации допускается некоторый риск.

3О. Критерий Гермейера.

Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех e ij . При этом

e ir = e ij q j .

Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие e ij <0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij - a при подходящем образом подобранном a > 0. При этом оптимальный вариант решения зависит от а .

Правило выбора согласно критерию Гермейера формулируется следующим образом:

матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния F j . Выбираются те варианты в строках которых находится наибольшее значение e ij этого столбца.

В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения q j = , j =, они становятся идентичными.

Условия его применимости таковы:

    вероятности появления состояния F j неизвестны;

    с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;

    допускается некоторый риск;

    решение может реализоваться один или несколько раз.

Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.

Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра n выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае  ММ-критерий, т.е. мы ищем

E ir = {n + (1-n) e ir }, 0 £ n £ 1.

Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:

матрица решений дополняется столбцом, составленным из средних взвешенных (с весом n º const) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.

При n = 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при n = 0 становится минимаксным.

Выбор n субъективен т. к. Степень достоверности какой-либо функции распределения  дело тёмное.

Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

F j неизвестны, но некоторые предположения о распределении вероятностей возможны;

2) принятое решение теоретически допускает бесконечно много реализаций;

3) при малых числах реализации допускается некоторый риск.

О. Критерий Гермейера.

Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех e ij . При этом

e ir = e ij q j .

Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие e ij <0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij - a при подходящем образом подобранном a > 0. При этом оптимальный вариант решения зависит от а .

Правило выбора согласно критерию Гермейера формулируется следующим образом:

матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния F j . Выбираются те варианты в строках которых находится наибольшее значение e ij этого столбца.

В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения q j = , j = , они становятся идентичными.

Условия его применимости таковы:

1) вероятности появления состояния F j неизвестны;

2) с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;

3) допускается некоторый риск;

4) решение может реализоваться один или несколько раз.

Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.

О. BL (MM) - критерий.

Стремление получить критерии, которые бы лучше приспосабливались к имеющейся ситуации, чем все до сих пор рассмотренные, привело к построению так называемых составных критериев. В качестве примера рассмотрим критерий, полученный путем объединения критериев Байеса-Лапласа и минимакса.

Правило выбора для этого критерия формулируется следующим образом:

матрица решений дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором - разность между опорным значением

и наименьшим значением

соответствующей строки. В третьем столбце помещаются разности между наибольшим значением

каждой строки и наибольшим значением той строки, в которой находится значение . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение

из второго столбца должно быть или равно некоторому заранее заданному уровню риска . Значение же из третьего столбца должно быть больше значения из второго столбца.

Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение:

1) вероятности появления состояний F j неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения;

3) допускается ограниченный риск;

4) принятое решение реализуется один раз или многократно.

BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска и, соответственно, оценок риска не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью.

существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом не известно, однако, четких количественных указаний, в каких случаях это условие следовало бы опускать.

О. Критерий произведений.

Правило выбора в этом случае формулируется так:

Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.

Применение этого критерия обусловлено следующими обстоятельствами:

1) вероятности появления состояния F j неизвестны;

2) с появлением каждого из состояний F j по отдельности необходимо считаться;

3) критерий применим и при малом числе реализаций решения;

4) некоторый риск допускается.

Критерий произведений приспособлен в первую очередь для случаев, когда все e ij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг e ij + а с некоторой константой а  ï e ij ï. Результат при этом будет, естественно зависеть от а. На практике чаще всего

а:= ï e ij ï+1.

Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.

5 о. Пример.

Рассмотрим тот же пример (табл. 1).

Построение оптимального решения для матрицы решений о проверках по критерию Гурвица имеет вид (при С =0.5, в 10 3):

С e ij (1-С) e ij e ir e ir
-20.0 -22.0 -25.0 -12.5 -10.0 -22.5
-14.0 -23.0 -31.0 -15.5 -7.0 -22.5
-24.0 -40.0 -20.0 -20.0 -20.0

В данном примере у решения имеется поворотная точка относительно весового множителя С : до С = 0.57 в качестве оптимального выбирается Е 3 , а при больших значениях  Е 1 .

Применение критерия Ходжа-Лемана (q = 0.33, n = 0.5, в 10 3) :

e ij n (1-n) e ij e ir e ir
-22.33 -25.0 -11.17 -12.5 -23.67 -23.67
-22.67 -31.0 -11.34 -15.5 -26.84
-21.33 -40.0 -10.67 -20.0 -30.76

Критерий Ходжа-Лемана рекомендует вариант Е 1 (полная проверка)  так же как и ММ-критерий. Смена рекомендуемого варианта происходит только при n = 0.94. Поэтому равномерное распределение состояний рассматриваемой машины должно распознаваться с очень высокой вероятностью, чтобы его можно было выбрать по большему математическому ожиданию. При этом число реализаций решения всегда остаётся произвольным.

Критерий Гермейера при q j = 0.33 даёт следующий результат (в ):

e ir = e ij q j e ir
-20.0 -22.0 -25.0 -6.67 -7.33 -8.33 -8.33 -8.33
-14.0 -23.0 -31.0 -4.67 -7.67 -10.33 -10.33
-24.0 -40.0 -8.0 -13.33 -13.33

В качестве оптимального выбирается вариант Е 1 . Сравнение вариантов с помощью величин e ir показывает, что способ действия критерия Гермейера является даже более гибким, чем у ММ-критерия.

В таблице, приведенной ниже, решение выбирается в соответствии с BL(MM)-критерием при q 1 =q 2 =q 3 = 1 / 2 (данные в 10 3).

-20.0 -22.0 -25.0 -23.33 -20.0
-14.0 -23.0 -31.0 -22.67 +6.0 -14.0 +6.0
-24.0 -40.0 -21.33 +15.0 +20.0

Вариант Е 3 (отказ от проверки) принимается этим критерием только тогда, когда риск приближается к . В противном случае оптимальным оказывается Е 1 . Во многих технических и хозяйственных задачах допустимый риск бывает намного ниже, составляя обычно только незначительный процент от общих затрат. В подобных случаях бывает особенно ценно, если неточное значение распределения вероятностей сказывается не очень сильно. Если при этом оказывается невозможным установить допустимый риск заранее, не зависимо от принимаемого решения, то помочь может вычисление ожидаемого риска . Тогда становится возможным подумать, оправдан ли подобный риск. Такое исследование обычно дается легче.

Результаты применения критерия произведения при а = 41×10 3 и а = 200×10 3 имеют вид:

e ir = e ij e ir
+21 +19 +16
а =41 +27 +18 +10
+41 +17 +1
+180 +178 +175
а =200 +186 +177 +169
+200 +176 +160

Условие e ij > 0 для данной матрицы не выполнимо. Поэтому к элементам матрицы добавляется (по внешнему произволу) сначала а = 41×10 3 , а затем а = 200×10 3 .

Для а = 41×10 3 оптимальным оказывается вариант Е 1 , а для а = 200×10 3  вариант Е 3 , так что зависимость оптимального варианта от а очевидна.

Часть 2. Теория игр.

КЛАССИФИКАЦИЯ ИГР.

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.

В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем.

По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной . Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной .

По характеру взаимодействия игры делятся на:

1) бескоалиционные : игроки не имеют права вступать в соглашения, образовывать коалиции;

2) коалиционные (кооперативные)  могут вступать в коалиции.

В кооперативных играх коалиции наперёд определены.

По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой .

По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.

Матричная игра  это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец  номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Биматричная игра  это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец  стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице  выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.

Если функция выигрышей является выпуклой, то такая игра называется выпуклой . Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.

ГЛАВА 1. МАТРИЧНЫЕ ИГРЫ.

Критерий пессимизма-оптимизма Гурвица

В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска.

Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма.

Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях .

Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:

Wi = Cminj aij + (1-C) maxj aij (1.4.3)

Где C - коэффициент пессимизма.

Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = max Wi

При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий азартного игрока, делающего ставку на то, что «выпадет» наилучший случай.

Критерий Гурвица применяется в ситуации, когда:

1. Информация о состояниях окружающей среды отсутствует или недостоверна;

3. Реализуется только малое количество решений;

4. Допускается некоторый риск.

Критерий Ходжа-Лемана

Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале .

Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае ММ-критерий

Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:

где u - параметр достоверности информации о вероятностях состояний окружающей среды.

Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = max Wi

Данный критерий применим в следующем случае :

1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;

2. Принятое решение теоретически допускает бесконечно много реализаций;

3. При малом числе реализации допускается некоторый риск.

Пример решения статистической игры

Рассмотрим пример решения статистической игры в экономической задаче.

Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации - с осени до начала лета следующего года.

Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:

A1 - реализовать всю капусту осенью, непосредственно после уборки;

A2 - заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;

A3 - заложить всю капусту на хранение и реализовать её в весенние месяцы.

Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.

На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:

S1 - поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;

S2 - в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен - в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;

S3 - в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются. Поэтому рынок испытывает значительные сезонные колебания цен.

Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 6.

Таблица 6.

Выручка от реализации капусты, тыс. д.е.

В задаче необходимо определить:

1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;

2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:

а) получить минимально гарантированный выигрыш;

б) учесть значения риска от принятия различных решений;

в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;

3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7;

4. Дать экономическую интерпретацию результатов решения задачи.

1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (таблица 7).

Таблица 7

Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты

Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3)

3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма (на рисунке - ПО-критерий, таблица 9).

Таблица 9

Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма

Значения Wi для ММ-критерия найдём по формуле:

W1 = min (10, 5, 2) = 2

W2 = min (0, 10, 3) = 0

W3 = min (-10, 0 20) =-10

Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2).

Определим оптимальную стратегию по критерию недостаточного основания Лапласа.

По данному критерию оптимальной является стратегия A1 (W = 5,67).

По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 (формула (6)) - стратегия A3 (W = 11).

4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (таблица 10).

Таблица 10

Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков

По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).

6. Проведём экономическую интерпретацию результатов решения задачи.

Если предприятие имеет информацию о вероятностях состояния рынка капусты и значения этих вероятностей соответствуют исходным данным задачи, наиболее выгодной стратегией является продажа части капусты в осенние месяцы и хранение оставшейся капусты для реализации в течение зимних месяцев (прибыль составит 6,3 тыс. д.е.).

Эта же стратегия является наиболее эффективной, если информация о вероятностях состояний рынка капусты отсутствует и пользователю необходимо минимизировать степень возможного риска потери прибыли в процессе принятия решения (значение возможного риска составит 17 тыс. д.е.).

В случае, когда при отсутствии информации о состоянии рынка наиболее существенным для пользователя является не максимизация прибыли в абсолютном выражении, а получение её гарантированного объема, хотя бы и минимального, наиболее целесообразным решением является реализация всей капусты в осенние месяцы (прибыль составит 2 тыс. д.е.).

Это же стратегия является наиболее выгодной, если пользователь имеет информацию о вероятностях состояний рынка, соответствующую исходным данным, но эта информация не вполне достоверна (в случае, если информация имеет достоверность 0,7, прибыль составит 4,94 тыс. д.е.).

В случае, если информация о вероятностях состояний рынка отсутствует и риск значительных потерь не является для пользователя определяющим фактором при принятии решения, или если есть основания для оптимистической оценки ситуации на рынке капусты, при котором пользователь имеет возможность получить наибольшую прибыль от производства капусты, ему следует сохранить произведённую продукцию и реализовать её в весенние месяцы (прибыль составит соответственно 5.7 и 11 тыс. д.е.).

принятие решение оптимальный программный

Экспертные оценки минимаксного метода и методов Байеса - Лапласа и Сэвиджа

Приведенные в подпараграфе 2.8.1 простейшие критерии и стратегии принятия решений (2.8.1) (2.8.5) имеют ясное и логическое объяснение мотивов, которыми руководствуются лица, принимающие решения. Далее можно перейти к рассмотрению обобщенных классических критериев принятия решений. К ним относятся минимаксный критерий, критерий Байеса - Лапласа, критерий Сэвиджа, а также другие обобщения.

Минимаксный критерий и метод

Минимаксный критерий использует оценочную функцию (2.8.1, а), соответствующую пессимистической позиции, формализуемой соотношением

Справедливо соотношение

причем Zn„„ в (2.8.8) - оценочная функция минимаксного критерия.

Правило выбора решения в соответствии с минимаксным критерием интерпретируется следующим образом. Матрица решений {ву} дополняется еще одним столбцом из наименьших результатов еГ каждой строки. При принятии решения следует выбрать такие варианты Ею, строки которых соответствуют наибольшим значениям ег этого столбца. Выбранные таким образом варианты полностью исключают риск, поскольку лицо, принимающее решение, ориентировано на пессимистическую позицию, что не позволяет получить худший результат. Вне зависимости от условий Fj результат выбора не может оказаться ниже 2.тт. Минимаксный критерий относится к числу фундаментальных, поскольку используется весьма часто. Применение минимаксного критерия оправдано в следующих ситуациях:

  • 1) о возможности появления внешних состояний (условий) Б] ничего неизвестно (например, неизвестны вероятности появления состояний Р])щ,
  • 2) приходится считаться с появлением различных внешних состояний Рр
  • 3) решение реализуется только один раз;
  • 4) необходимо исключить всякий риск (недопустимо получение результата ниже значения 2,„,„).

Критерий и метод Байеса - Лапласа

Для построения оценочной функции данного критерия используется априорная информация о вероятностях ц} появления внешних условий Ру Тем самым данная вероятностная модель учитывает каждое из возможных последствий. Пусть - вероятность появления внешнего состояния (условия) Ру Тогда критерий Байеса - Лапласа

соответствует множеству

Фактически в данном критерии в качестве оценочной функции выбирается математическое ожидание оценки, соответствующей у"-му варианту, причем усреднение происходит по множеству условий Г^.

Правило принятия решении (2.8.11)-(2.8.13) имеет вероятностную интерпретацию. При этом ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

  • - вероятности появления состояний (условий) известны и не зависят от времени;
  • - решение реализуется (теоретически) бесконечно много раз;
  • - для малого числа реализаций решения допускается некоторый риск.

Позиция лица, принимающего решения на основе критерия Байеса - Лапласа, является более оптимистичной, чем по минимаксному критерию.

Критерий и метод Сэвиджа

Этот критерий основывается на предварительном преобразовании матрицы системных оценок в соответствии с соотношениями

Оценочная функция имеет вид

Множество оптимальных вариантов решения определяется соотношением

Смысл критерия (2.8.16) становится ясным после анализа соотношений (2.8.14)-(2.8.17).

Величины а =(тахе, еЛ, вычисляемые в соответствии

(2.8.14), можно трактовать как максимальный дополнительный выигрыш, который достигается, если В состояний Fj вместо варианта £", выбрать другой, оптимальный для этого внешнего состояния. Величины ay =(тахву е^) можно также интерпретировать и как потери (штрафы), возникающие в состоянии Fj при замене оптимального для него варианта

Тогда величина eir определенная равенством (2.8.12), представляет собой - при интерпретации йу как потерь - максимально возможные (по всем внешним состояниям Fj) потери в случае выбора варианта Ej. Согласно соотношениям (2.8.15), (2.8.17) максимально возможные потери минимизируются за счет выбора £;.

С точки зрения матрицы {еф критерий Сэвиджа связан с риском, однако с позиции матрицы {ау) он от риска свободен, поскольку использует стратегию минимаксного критерия.

Обобщенный минимаксный критерий и метод

Этот критерий использует расширение доли вероятностно заданной неопределенности. Предположим, что для каждого из возможных внешних состояний Fj определена вероятность его появления

Введем вероятность Р, применения г"-го варианта решения и будем предполагать возможность реализации т вариантов решения. Тогда среднее значение

где Р= (/>„ ...,/>,„), д = (

В реальной ситуации вектор ц неизвестен. В этом случае, ориентируясь на наименее выгодное распределение ц состояний Fj, можно добиться максимального увеличения е(Р, д) за счет выбора наиболее удачного распределения Р вариантов решения £;. Подобная стратегия соответствует расширенному минимаксному критерию, причем в данной ситуации реализуется игровая стратегия: состояния Fj минимизируют критерий, а варианты Е, его максимизируют. Общая формулировка данного расширенного минимального критерия имеет вид

где векторы Рид определены в (2.8.18).

Таким образом, цель расширенного минимаксного критерия - нахождение наилучшего распределения вероятностей на множестве вариантов Е, когда в многократно использовавшейся ситуации ничего не известно о вероятностных состояниях ^, относительно которых предполагается "невыгодное" распределение.

Производные критерии, оценки и принятие решений

Данный класс критериев позволяет рассматривать задачи принятия решения с обобщенных позиций, причем обобщение предполагает более полный учет априорно известных факторов, а также введение новых функциональных элементов.

Следует иметь в виду, что для интерпретации критериев можно воспользоваться идеями подпараграфа 2.8.1. В соответствии с подпараграфом 2.8.1 целесообразно свести рассмотренные производные (обобщенные) критерии в табл. 2.8.

Критерий Гурвица

Оценочная функция критерия Гурвица находится между точками предельного оптимума (С = 0) и крайнего пессимизма (С = 1). Характерно, что при С = 1 критерий Гурвица превращается в минимаксный критерий (см. подпараграф 2.8.1).

Критерий Ходжа - Лемана

Критерий основан на минимаксном критерии и критерии Байеса - Лапласа, характеризуется тем, что с помощью параметра в выражает степень доверия к используемому распределению вероятностей. При V = 1 критерий переходит в критерий Байеса - Лапласа, а при V = 0 - в минимаксный критерий. Ситуация, в которой рекомендовано применение этого критерия, характеризуется следующими условиями: вероятности появления состояний Е] неизвестны, но некоторые предположения о распределениях вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций: при малых числах реализации допускается некоторый риск.

Критерий Ю. Б. Гермейера

Данный критерий ориентирован на оценочные функции, отражающие величину потерь, т.е. на отрицательные значения всех е-у матрицы оценок, применяется в хозяйственных задачах и ориентирован на цены и затраты. Смысл остальных параметров: <77 - вероятность условия Еу а ег - минимум математического ожидания затрат. В критерии Ю. Б. Гермейера допускается некоторый риск при принятии решения, а также должны быть известны вероятности Цр

Таблица 2.8.

Минимаксный критерий и метод Байеса - Лапласа

Метод позволяет лучше адаптироваться к ситуации за счет введения составных частей, логически унаследованных от других критериев (см. табл. 2.8). На первом этапе формирования критерия фиксируется опорное значение 2тт, задаваемое минимаксным критерием. Затем задается допустимый риск 5д0|| >0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.

Решение типового примера
Рассмотрим пример решения статистической игры в экономической задаче.
Сельскохозяйственное предприятие может реализовать некоторую продукцию:
А1) сразу после уборки;
А2) в зимние месяцы;
А3) в весенние месяцы.
Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.)



S1

S2

S3

A1

2

-3

7

A2

-1

5

4

A3

-7

13

-3
Определить наиболее выгодную стратегию по всем критериям (критерий Байеса, критерий Лапласа, максиминный критерий Вальда, критерий пессимизма-оптимизма Гурвица, критерий Ходжа-Лемана, критерий минимаксного риска Сэвиджа), если вероятности состояний спроса: 0,2; 0,5; 0,3; коэффициент пессимизма С = 0,4; коэффициент достоверности информации о состояниях спроса u = 0,6.
Решение
Результаты расчетов будем заносить в таблицу:


S1

S2

S3

Б

НО

ММ

П-О

Х-Л

А1

2

-3

7

1

2

-3

3

-0,6

А2

-1

5

4

3,5

2,7

-1

2,6

1,7

А3

-7

13

-3

4,2

1

-7

5

-0,28

p j

0,2

0,5

0,3

А3

А2

А2

А3

А2

1. Критерий Байеса (максимального математического ожидания)

Расчет осуществляется по формуле:
;
W 1 = 2∙0,2 + (-3) ∙0,5 + 7∙0,3 = 0,4 – 1,5 + 2,1 = 1
W 2 = -1∙0,2 + 5 ∙0,5 + 4∙0,3 = -0,2 + 2,5 + 1,2 = 3,5
W 3 = -7∙0,2 + 13 ∙0,5 + (-3)∙0,3 = -1,2 + 6,5 - 0,9 = 4,2
Найденные значения заносим в первый столбец (Б) и выбираем максимальное
W = max{1;3.5;4.2} = 4.2,

значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

2. Критерий недостаточного основания Лапласа (НО)

Находим среднее значение элементов каждой строки:
.
;
;
.
Найденные значения заносим во второй столбец (НО) и выбираем максимальное W = max{2; 2.7; 1} = 2.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

3. Максиминный критерий Вальда (ММ)

В каждой строке находим минимальный элемент: .
W 1 = min{2; -3; 7} = -3
W 2 = min{-1; 5; 4} = -1
W 3 = min{-7; 13; -3} = -7
Найденные значения заносим в третий столбец (ММ) и выбираем максимальное W= max{-3; -1; 7} = -1, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

4. Критерий пессимизма-оптимизма Гурвица (П-О)

Для каждой строки рассчитываем значение критерия по формуле: . По условию C = 0.4, значит:
W 1 = 0,4∙min{2; -3; 7} + (1-0,4) ∙ max{2; -3; 7} = 0,4∙(-3) + 0,6∙7 = -1,2 + 4,2 = 3
W 2 = 0,4∙min{-1; 5; 4} + (1-0,4) ∙ max{-1; 5; 4} = 0,4∙(-1) + 0,6∙5 = -0,4 + 3 = 2,6
W 3 = 0,4∙min{-7; 13; -3} + (1-0,4) ∙ max{-7; 13; -3} = 0,4∙(-7) + 0,6∙13 = -2,8 + 7,2 = 5
Найденные значения заносим в четвертый столбец (П-О) и выбираем максимальное W = max{3; 2.6 5} = 5, значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

5. Критерий Ходжа-Лемана (Х-Л)

Для каждой строки рассчитываем значение критерия по формуле: . По условию u = 0.6 и множители в каждом слагаемом уже рассчитаны, их можно взять их первого столбика (Б) и из третьего столбика (ММ), значит:
W 1 = 0,6∙1 + (1-0,6) ∙(-3) = 0,6 – 1,2 = -0,6
W 2 = 0,6∙3,5 + (1-0,6) ∙(-1) = 2,1 – 0,4 = 1,7
W 3 = 0,6∙4,2 + (1-0,6) ∙(-7) = 2,52 – 2,8 = -0,28
Найденные значения заносим в пятый столбец (Х-Л) и выбираем максимальное W = max{-0.6; 1.7; -0.28} = 1.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

5. Критерий минимаксного риска Сэвиджа

Рассчитаем матрицу рисков. Заполнять ее лучше по столбцам. В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца, результаты записываем на соответствующих местах.
Вот как рассчитывается первый столбец. Максимальный элемент в первом столбце: a 11 = 2, значит по формуле :
r 11 = 2 – a 11 = 2 -2 = 0
r 21 = 2 – a 21 = 2 –(-1) = 3
r 31 = 2 – a 31 = 2 –(-7) = 9
Рассчитаем второй столбец матрицы рисков. Максимальный элемент во втором столбце: a 32 = 13, значит:
r 12 = 13 – a 12 = 13 –(-3) = 16
r 22 = 13 – a 22 = 13 –5 = 8
r 32 = 13 – a 32 = 13 –13 = 0
Рассчитаем третий столбец матрицы рисков. Максимальный элемент в третьем столбце: a 13 = 7, значит:
r 13 = 7 – a 13 = 7 –7 = 0
r 23 = 7 – a 23 = 7 –4 = 3
r 33 = 7 – a 33 = 7 –(-3) = 10
Таким образом, матрица рисков имеет вид (в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль):




W i

0

16

0

16

3

8

3

8

9

0

10

10
Дополним матрицу рисков рассчитанными значениями критерия W i – в каждой строке выбираем максимальный элемент ():
W 1 = max{0; 16; 0} = 16
W 2 = max{3; 8; 3} = 8
W 3 = max{9; 0; 10} = 10
Найденные значения заносим в столбец (W i) и выбираем минимальное W = min{16,8,10} = 8, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

Вывод:

  1. Стратегия А1 (продавать сразу после уборки) не является оптимальной ни по одному из критериев.
  2. Стратегия А2 (продавать в зимние месяцы) является оптимальной согласно критериям недостаточного основания Лапласа, максиминного критерия Вальда и минимаксного критерия Сэвиджа.
  3. Стратегия А3 (продавать в весенние месяцы) является оптимальной согласно критериям Байеса, пессимизма-оптимизма Гурвица, Ходжа-Лемана.