П 1 | П 2 | П 3 | П 4 | |
А 1 | 30 +N | 10 | 20 | 25 + N/2 |
А 2 | 50 | 70 - N | 10 + N/2 | 25 |
А 3 | 25 – N/2 | 35 | 40 | 60 - N/2 |
Известны возможные состояния покупательского спроса, которые соответственно q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Необходимо найти стратегию сбыта, максимизирующую средний товарооборот фирмы. При этом использовать критерии Вальда, Гурвица, Сэвиджа, Байеса.
Решение
находим с помощью калькулятора .
Критерий Байеса
.
По критерию Байеса за оптимальные принимается та стратегия (чистая) A i , при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(a ij p j)
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9
A i | П 1 | П 2 | П 3 | П 4 | ∑(a ij p j) |
A 1 | 9.9 | 2 | 8 | 2.65 | 22.55 |
A 2 | 15 | 13.4 | 4.6 | 2.5 | 35.5 |
A 3 | 7.05 | 7 | 16 | 5.85 | 35.9 |
p j | 0.3 | 0.2 | 0.4 | 0.1 |
Критерий Лапласа .
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A i | П 1 | П 2 | П 3 | П 4 | ∑(a ij) |
A 1 | 8.25 | 2.5 | 5 | 6.63 | 22.38 |
A 2 | 12.5 | 16.75 | 2.88 | 6.25 | 38.38 |
A 3 | 5.88 | 8.75 | 10 | 14.63 | 39.25 |
p j | 0.25 | 0.25 | 0.25 | 0.25 |
Критерий Вальда .
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min a ij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
A i | П 1 | П 2 | П 3 | П 4 | min(a ij) |
A 1 | 33 | 10 | 20 | 26.5 | 10 |
A 2 | 50 | 67 | 11.5 | 25 | 11.5 |
A 3 | 23.5 | 35 | 40 | 58.5 | 23.5 |
Критерий Севиджа .
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max r ij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце b j = max(a ij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23.5 = 26.5;
2. Рассчитываем 2-й столбец матрицы рисков.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Рассчитываем 3-й столбец матрицы рисков.
r 13 = 40 - 20 = 20; r 23 = 40 - 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r 14 = 58.5 - 26.5 = 32; r 24 = 58.5 - 25 = 33.5; r 34 = 58.5 - 58.5 = 0;
A i | П 1 | П 2 | П 3 | П 4 |
A 1 | 17 | 57 | 20 | 32 |
A 2 | 0 | 0 | 28.5 | 33.5 |
A 3 | 26.5 | 32 | 0 | 0 |
A i | П 1 | П 2 | П 3 | П 4 | max(a ij) |
A 1 | 17 | 57 | 20 | 32 | 57 |
A 2 | 0 | 0 | 28.5 | 33.5 | 33.5 |
A 3 | 26.5 | 32 | 0 | 0 | 32 |
Критерий Гурвица .
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(s i)
где s i = y min(a ij) + (1-y)max(a ij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем s i .
s 1 = 0.5 10+(1-0.5) 33 = 21.5
s 2 = 0.5 11.5+(1-0.5) 67 = 39.25
s 3 = 0.5 23.5+(1-0.5) 58.5 = 41
A i | П 1 | П 2 | П 3 | П 4 | min(a ij) | max(a ij) | y min(a ij) + (1-y)max(a ij) |
A 1 | 33 | 10 | 20 | 26.5 | 10 | 33 | 21.5 |
A 2 | 50 | 67 | 11.5 | 25 | 11.5 | 67 | 39.25 |
A 3 | 23.5 | 35 | 40 | 58.5 | 23.5 | 58.5 | 41 |
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A 3 .
Руководство компании принимает решение о размещении производства нового продукта в некотором месте. Чтобы сформировать представление о ситуации на рынке нового продукта на момент освоения производства, ему необходимо учесть затраты на доставку готовой продукции до потребителя, развитость транспортной и социальной инфраструктуры региона, конкуренцию на рынке, соотношение спроса и предложения, курсы валют и многое другое. Возможные варианты решений, инвестиционная привлекательность которых определяется как процент прироста дохода по отношению к сумме капитальных вложений, представлены в таблице.
Выбрать:
1) место для размещения производства, если руководитель предприятия уверен в том, что на рынке сложится ситуация 4;
2) место для размещения производства, если руководство оценивает вероятность ситуации 1 в 0,2; ситуации 2 в 0,1; ситуации 3 в 0,25;
3) провести выбор варианта в условиях неопределенности по критерию: максимакс, максимин, критерий Лапласа, критерий Сэведжа, критерий Гурвица (y = 0,3);
4) изменится ли наилучший вариант решения по критерию Гурвица если величину a увеличить до 0,5?
5) предположив, что данные таблицы представляют затраты предприятия, определить выбор, который сделает предприятие при использовании каждого из следующих критериев: максимин; максимакс; критерий Гурвица(? = 0,3); критерий Сэведжа; критерий Лапласа
Выигрыш-критерий Байеса является основным критерием оптимальности стратегий, который используется при принятии решений в условиях риска (см. §2.1).
Рассмотрим игру с природой, задаваемой платежной матрицей А (см. (2.1.2)). Пусть q = - вектор вероятностей состояний природы, удовлетворяющих условиям (2.1.1), которые удобно расположить в добавленной строке матрицы (2.1.2):
Референд Томас Байес
(1702 - 17.04.1761)
Выигрыш-критерием Байеса оптимальности чистых стратегий с вектором ч вероятностей состояний природы (В 1 ’ (q) -критерием 2 ) называется критерий, по которому:
- показателем (В’’ (q) -показателем) эффективности чистой стратегии
A-(i = 1,2.....т) называется величина
- ценой (В 1 ’(q)-ценой) игры в чистых стратегиях (множества S c ), называется наибольший из показателей эффективности Bj’{q), /" = 1,2..., т, чистых стратегий:
- оптимальной (В 1 ’ (q) -оптимальной) во множестве S c чистых стратегий называется стратегия A k е S 1 с максимальным показателем эффективности
Оптимальную стратегию также называют байесовской стратегией. Так как показатель эффективности Bj’(q) стратегии А к есть взвешенная средняя выигрышей при этой стратегии, то оптимальная стратегия является по этому критерию оптимальной не в каждом отдельном случае, а во взвешенно среднем.
Равенство (2.5.2) можно записать в векторной форме:
где « г » - значок транспонирования.
Как видно из (2.5.3) и (2.5.4) во множестве чистых стратегий показатель эффективности оптимальной стратегии совпадает с ценой игры.
Интерпретируя чистую стратегию А- как дискретную случайную величину со значениями a n ,a i2 ,...,a irl , которые она принимает с вероятностями соответственно q u q 2 ,...,q n , получаем, что B"‘(q) - показатель эффективности стратегии А- сеть ее математическое ожидание. Именно поэтому выигрыш-критерий Байеса называют также «критерием математического ожидания».
Из (2.5.2) и (2.5.3) следуют оценки: где а™" = min а, я"“ = шах а п, а а " ттт = max min а, и max max л, -соот-
ISjSn 1 1 Klfimisy&i ’ 1 j 1
встственно максимин и максияшкс игры в чистых стратегиях. Подчеркнем, что левые и правые части неравенств (2.5.5) и (2.5.6) нс зависят от вектора q.
Чистая стратегия, наименьший выигрыш при которой совпадает с максими- ном, называется максиминной стратегией. Если игрок А придерживается макси- минной стратегии А к, то при любом состоянии природы Я имеет место неравенство а к1 >а"” т =а" юхтт, у = 1,2,..., и, означающее, что максимин экономически
представляет собой гарантированный наименьший выигрыш игрока А при любых вероятностях состояний природы, если только игрок А придерживается максиминной стратегии.
Множество чистых стратегий, оптимальных во множестве S c чистых стратегий по B p (q) -критерию, обозначим через (? с) 0(а "’»_ общее решение игры с природой в чистых стратегиях можно интерпретировать как двухэлементное множество {(S c) 0 , ?"(()}.
Под частным решением игры с природой в чистых стратегиях можно понимать двухэлементное множество, одним из элементов которого является непустая неполная совокупность чистых стратегий, оптимальных во множестве чистых стратегий, а другим - цена игры в чистых стратегиях.
Перейдем в область смешанных стратегий 5.
По В 1 ’(q) -критерию оптимальности смешанных стратегий:
- показателем (В 1 ’ (q) -показателем) эффективности смешанной стратегии Р = (р 1 ,р 2 ,...,р т) назовем взвешенно среднее значение выигрышей (2.2.3) с весами q l ,q 2 ,...,q ll:
- ценой (B p (q) -ценой) игры в смешанных стратегиях назовем наибольший из показателей эффективности (2.5.7):
- оптимальной (В’’(q) -оптимальной) во множестве S смешанных стратегий назовем стратегию Р° =(р", с наибольшим показателем эффективности:
Легко видеть, что если, в частности, смешанная стратегия Р является чистой, например, А к, к е {1,2,...,от}, то её показатель эффективности B p (P;q) как смешанной стратегии, выражаемый формулой (2.5.7), превращается в ее показатель эффективности B p (A t ;q) = Bj’(q) как чистой стратегии, вычисляемый по формуле (2.5.2).
Нетрудно убедиться в том, что показатель эффективности B p (Pq) можно представить в матричной форме:
где А - матрица игры.
В связи с бесконечностью множества 5 смешанных стратегий встает вопрос о существовании оптимальной стратегии в этом множестве. Положительный ответ дает следующая теорема.
Теорема 2.5.1. В любой игре с природой с любым вектором вероятностей ее состояний существует стратегия, оптимальная во множестве смешанных стратегий по выигрыш-критерию Байеса.
Доказательство. Из (2.2.3) и (2.5.7) заключаем, что показатель эффективности В 1 ’ (P,q) как функция смешанной стратегии Р линейна и, следовательно, непрерывна на множестве 5, которое, будучи симплексом, ограничено и замкнуто в от-мерном евклидовом пространстве R"". Следовательно, по теореме Вейерштрасса (, с. 298) функция B p (P;q) достигает на симплексе 5 своей верхней грани, т.е. найдется стратегия Р° = (/>,",р") е 5, удовлетворяющая равенству (2.5.9) ?
Множество S""(су)-оптимальных стратегий во множестве S смешанных стратегий обозначим через s 0(B (ч)) .
В следующей теореме устанавливается связь между показателями эффективности чистых и смешанных стратегий.
Теорема 2.5.2. Показатель эффективности B"Pq) смешанной стратегии Р = (Pi’PiP m) 1,0 В р (q)-критерию представляет собой взвешенное среднее показателей эффективности Bj’(q) чистых стратегий Д, / = 1,2,...,от, по тому же критерию с весами р (, / = 1,2,...,от:
Доказательство. Применяя последовательно равенства (2.5.7), (2.2.3) и (2.5.2), получим:
Пусть Р = (/; | ,р 2 ,...,р т) - произвольная смешанная стратегия. Умножая все части двойного неравенства (2.5.5) на р , и суммируя полученные неравенства по номеру /" от 1 до от, получим на основании (2.5.11) диапазон изменения показателя эффективности B p (Pq) при любых векторах вероятностей состояний природы:
Следующая теорема устанавливает связь между ценами игры в чистых и смешанных стратегиях.
Теорема 2.5.3. По выигрыш-критерию Байеса цены игры в чистых и в смешанных стратегиях равны.
Доказательство. Пусть P = (p l ,p 2 ,...,p m) е S. Используя (2.5.11), (2.5.3) и нормировочное условие вероятностей /?, i = 1,2,...,от, получим:
Так как это неравенство справедливо для любой смешанной стратегии Р, то оно справедливо, в том числе и для стратегии Р°, оптимальной во множестве смешанных стратегий 5: В р Р°q Но левая часть последнего неравенства,
по определению (2.5.9) оптимальной смешанной стратегии, равна цене игры в смешанных стратегиях. Таким образом,
С другой стороны, поскольку с5, то max Bf (q) max В 1 ’ (P:q) или, что то же
Неравенства (2.5.13) и (2.5.14) доказывают требуемое равенство B p c (q) = B p (q) ,
В силу этой теоремы можно нс говорить поотдельности о ценах в чистых и в смешанных стратегиях, а их общее значение назвать просто ценой игры по выигрыш-критерию Байеса
и обозначить через B p }