Применить графический и аналитический методы поиска оптимальных стратегий для игры 2x2 P -3 8 3 2
Ответ нейросети
01 декабря 2025 19:59
Ниже решение задачи для игры 2x2 с матрицей выигрышей первой стороны P:
P = [ [-3, 8], [ 3, 2] ]
Предположим, что это ноль-суммовая игра, где выигрыш первого игрока равен P, а выигрыш второго — минус P. Ищем оптимальные смешанные стратегии графическим и аналитическим методами.
- Проверка чистых стратегий (п saddle point)
- Минимумы по строкам (для ряда игрока): Row1 min = min(-3, 8) = -3; Row2 min = min(3, 2) = 2. maximin = max(-3, 2) = 2.
- Максимумы по столбцам (для противника): Col1 max = max(-3, 3) = 3; Col2 max = max(8, 2) = 8. minimax = min(3, 8) = 3. Так как maximin ≠ minimax (2 vs 3), чистого седла нет. Нужно смешанное равновесие.
- Графический метод (для игрока-строки) Обозначим p — долю стратегии Row1 у первого игрока (0 ≤ p ≤ 1). Тогда:
- Если противник выберет столбец 1 (C1), ожидаемая выплата первого игрока: E1(p) = -3p + 3(1-p) = 3 - 6p.
- Если противник выберет столбец 2 (C2), ожидаемая выплата первого игрока: E2(p) = 8p + 2(1-p) = 2 + 6p.
Противник будет выбирать столбец, который минимизирует выплату первого игрока, т.е. миниму из E1(p) и E2(p). Первый игрок хочет выбрать p так, чтобы минимальное значение максимизировалось. Графически точка пересечения E1(p) = E2(p) даст оптимальную p: 3 - 6p = 2 + 6p → 1 = 12p → p = 1/12.
Значение игры (при этом p) равно v = E1(1/12) = 3 - 6*(1/12) = 3 - 0.5 = 2.5.
Итак, графически оптимальная смешанная стратегия игрока-строки: p(Row1) = 1/12, p(Row2) = 11/12. Значение игры v = 2.5.
- Аналитический метод (уравнивание выигрышей против оппонента) Чтобы противник был не в выгоде накачивать одну из своих столбцов, найдём смешанную стратегию противника q на столбец1 (q) и (1-q) на столбец2, которая сделает строкового игрока равнозначным между двумя своими строками.
Ожидаемая выплата для первой строки при раздаче противника: U_row1(q) = -3q + 8(1-q) = 8 - 11q. Ужесточённая строка2: U_row2(q) = 3q + 2(1-q) = 2 + q.
Чтобы игрок-строка был indifferent между Row1 и Row2, при смешанной стратегии противника нужно: 8 - 11q = 2 + q → 6 = 12q → q = 1/2.
Тогда противник выбирает столбец1 с вероятностью 1/2 и столбец2 с вероятностью 1/2. Значение игры в этом случае: v = U_row1(1/2) = 8 - 11*(1/2) = 8 - 5.5 = 2.5.
Оптимальная смешанная стратегия противника: q(C1) = 1/2, q(C2) = 1/2.
- Сводка результатов
- Оптимальная стратегия игрока-строки: p(R1) = 1/12, p(R2) = 11/12.
- Оптимальная стратегия противника: q(C1) = 1/2, q(C2) = 1/2.
- Значение игры (выигрыш первого игрока): v = 5/2 = 2.5.
- Контрпример проверки по полной матрице: при смешанных стратегиях p и q ожидаемая выплата к первому игроку равна 2.5, что подтверждает равновесие.
Дополнительная проверка по формуле полной выплаты: E = p1q1(-3) + p1q2(8) + p2q1(3) + p2q2(2), где p1 = 1/12, p2 = 11/12, q1 = q2 = 1/2. E = (1/12)(1/2)(-3) + (1/12)(1/2)(8) + (11/12)(1/2)(3) + (11/12)(1/2)(2) = 2.5.
Если нужно, могу привести аналогичную задачу с другим набором матрицы и показать, как аналогично находить смешанные стратегии графическим и аналитическим путём.
Понравился ответ?
Задай свой вопрос
Напиши любую задачу или вопрос, а нейросеть её решит



