Главная / Рефераты / Экономико - математическое моделирование

Реферат: Биматричные игры. Поиск равновесных ситуаций

Московский городской университет управления правительства Москвы

Факультет управления

Кафедра прикладной математики

Реферат

по учебной дисциплине

"Математические методы исследования систем управления"

На тему: "Биматричные игры. Поиск равновесных ситуаций"

2010

1. Биматричные игры

Абсолютно любая управленческая деятельность не может существовать без конфликтных ситуаций. Это ситуации, где сталкиваются двое или больше сторон с разными интересами. Совершенно естественно, что каждая из сторон хочет решить конфликт в свою пользу и получить максимальную выгоду. Решение такой задачи может быть осложнено тем, что конфликтующая сторона не имеет полной информации о конфликте в целом. Иначе можно сказать, что в конфликтной ситуации необходимо принять оптимальное решение в условиях неопределённости.

Для решения такого рода задач используется математическое моделирование. Введём несколько основных понятий. Математическая модель конфликтной игрой называется игрой. Стороны конфликта – игроки, действие игрока – ход, совокупность ходов – стратегия, результат игры – выигрыш.

Обязательным моментом перед решением задачи является выявление определённых правил. Как правило, эти правила представляют собой совокупность требований и ограничений на действия игроков, обмен информацией игроков о действиях противников, функций выигрышей противников и т.п. Правила должны быть чёткими, иначе игра не состоится.

К настоящему времени существует несколько способов классификации игр. Основным является деление на бескоалиционные конечные парные игры с выигрышами (матричные, позиционные, биматричные) и коалиционные. В данном реферате мы рассмотрим биматричные игры.

Игры с фиксированной суммы – игры, в которых интересы игроков хоть и не совпадают, но не являются полностью противоположными. Частным случаем являются биматричные игры.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Рассмотрим парную игру, в которой каждый из участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А₁ , …, А_m ;

игрок В – любую из стратегий В₁ , …, В_n ;

Если игрок А выбрал стратегию А_i , игрок В – В_j , то в итоге выигрыш игрока А составит а_ij , игрока В – b_ij . Выигрыши игроков А и В можно записать в виде двух таблиц.

А=

В=

Таким образом, если интересы игроков различны, но не обязательно противоположны, для описания игры используются две платёжные матрицы. Данный факт и дал название подобным играм – биматричным.

2. Состояние равновесия в биматричных матрицах

Решением биматричной игры есть такое решение, которое в том или ином смысле устраивает обоих игроков. Данная формулировка очень расплывчата, что обуславливается тем, что в биматричных играх довольно трудно чётко сформулировать цели для игроков. Как один из возможных вариантов – желание игрока навредить своему сопернику в ущерб собственному выигрышу, или цель будет противоположна.

Обычно рассматриваются два подхода к решению биматричной игры. Первый – поиск равновесных ситуаций: ищутся условия, когда игра находится в некотором равновесии, которое невыгодно нарушать ни одному из игроков в отдельности. Второй – поиск ситуаций, оптимальных по Парето: нахождение условий, при которых игроки совместными усилиями не могут увеличить выигрыш одного игрока, не уменьшив при этом выигрыш другого.

Остановим своё внимание на первом подходе.

В данном подходе используются смешанные стратегии, т.е. случай, когда игроки чередуют свои чистые стратегии с определёнными вероятностями.

Пусть игрок А выбирает стратегию А₁ , с вероятностью р₁ , А₂ – р₂ , …, А_m – p_m , причём

Игрок В использует стратегию В₁ с вероятностью q₁ , B₂ – q₂ , …, B_n – q_n , причём

В качестве критерия "удачности" игры возьмём математические ожидания выигрыша игроков, которые вычисляются по формулам:

Таким образом, можно сформулировать основное определение:

Распределение вероятностей Р^* () и Q () определяют равновесную ситуацию, если для любых других распределений P и Q одновременно выполнены следующие неравенства:

Если равновесная ситуация существует, то отклонение от неё невыгодно самому игроку.

Также справедлива теорема Дж. Нэша. Всякая биматричная игра имеет хотя бы одну равновесную ситуацию в смешанных стратегиях.

3. Общий принцип решения биматричных игр

В первое неравенство системы последовательно подставляются все чистые стратегии игрока А, при предположении, что В придерживается своей оптимальной стратегии. Во второе неравенство подставляются все чистые стратегии игрока В, при предположении, что А придерживается своей оптимальной стратегии.

Полученная система m+n неравенств, решение которой дает значение элементов оптимальных смешанных стратегий (P*,Q*) и платежи, получаемые игроками в точке равновесия.

Пример: борьба за рынок.

А=

В=

Решение задачи

v_A =-10×1q₁ +2×1*(1-q₁ )+(1-p₁ )q₁ -(1-p₁ )(1-q₁ )=-14×1q₁ +3×1+2q₁ -1

v_B =5×1q₁ -2×1*(1-q₁ )-(1-p₁ )q₁ +(1-p₁ )(1-q₁ )=9×1q₁ -3×1-2q₁ +1

Пусть

p₁ =1 тогда v_A =2-12q₁ -14×1q₁ +3×1+2q₁ -1

p₁ =0 тогда v_A =-1+2q₁ -14×1q₁ +3×1+2q₁ -1

q₁ =1тогда v_B =-1+6×1 9×1q₁ -3×1-2q₁ +1

q₁ =0 тогда v_B =1–3×1 9×1q₁ -3×1-2q₁ +1

Cоставляем 4 системы, преобразовываем, получаем:

(p₁ -1)(-14q₁ +3) 0

p₁ (-14q₁ +3) 0

(q₁ -1)(9×1–2) 0

q₁ (9×1–2) 0

p₁ =0 следовательно -(-14q₁ +3) 0 q₁ 3/14

p₁ =1 следовательно (-14q₁ +3)>=0 q₁ 3/14

0<p₁ <1 следовательно -(-14q₁ +3) 0 и (-14q₁ +3) 0->q₁ =3/14

q₁ =0 следовательно p₁ 2/9

q₁ =1 следовательно p₁ 2/9

0<q₁ < 0-p₁ =2/9

Строим график по всем p и всем q, получается на пересечении точка p₁ =2/9, q₁ =3/14 - решение системы неравенств.

P(2/9;7/9), Q(3/14;11/14)

v_A ₌ 4/7, v_B =1/3

Вывод: 2/9 товара предлагать на первом рынке и 7/9 на втором рынке и тогда минимальный проигрыш — 4/7. 3/14 -защищать 1-й рынок, 11/14-защищать второй рынок.