Скачать .docx |
Реферат: Теория игр и статических решений
Контрольная работа по курсу «Теория игр»
1. Найдите решение по доминированию в данной игре:
2. Заполните пропуски в таблице так, чтобы в этой игре в чистых стратегиях было бы 3 равновесия по Нэшу. Найдите все равновесия в смешанных стратегиях (любым способом).
стратегия игра равновесие
a | b | ||
A | Ф | ? | |
? | И | ||
B | ? | О | |
В | ? |
3. Двое бегут по лыжной трассе навстречу друг другу. У каждого лыжника 2 стратегии: «уступить» и «не уступить». Если один из игроков уступает другому, то его потери - О секунд, второй – не теряет ничего; если же лыжники сталкиваются, то оба теряют В секунд.
a) Составьте платежную матрицу этой игры. Найдите равновесия в чистых стратегиях.
b) Нарисуйте линии откликов игроков и найдите смешанные равновесия в этой игре.
c) Допустим теперь, что у игроков теперь 3 стратегии: «не уступить», «уступить» и «уступить пол-лыжни». Если оба уступили друг другу пол-лыжни, то потери каждого И секунд, если же один уступил пол-лыжни, а второй - нет, то лыжники столкнутся, и потери при столкновении у уступившего – В+И секунд, у неуступившего - В секунд. Найдите все равновесия по Нэшу (в чистых и в смешанных стратегиях).
4. Профсоюз заключает с фирмой соглашение на несколько лет об уровне заработной платы w>0. Профсоюз максимизирует функцию совокупной прибыли членов профсоюза (зарплата за вычетом издержек от работы): u(w,L)=wL-И*L2 , фирма максимизирует свою прибыль (выпуск за вычетом зарплаты): П(w,l)=Ф*L0.5 -wL.
a) Найти равновесный уровень заработной платы и занятости в статической игре.
b) Каково равновесие в динамической игре, если профсоюз достаточно мощный, чтобы навязать фирме любой уровень заработной платы, после чего фирма не может менять уровень заработной платы в течение срока контракта, но может нанимать любое количество труда L>0.
c) Каково равновесие в динамической игре, если фирма – монополист на рынке труда, и она может установить любую заработную плату, после чего профсоюз может только регулировать численность работающих на монополиста.
5. В этой игре с нулевой суммой найдите равновесие в осторожных стратегиях. Существует ли в этой игре равновесие по Нэшу в чистых стратегиях?
c1 | c2 | c3 | c4 | c5 | |
s1 | 5 | 2 | 3 | 6 | 4 |
s2 | 4 | 1 | 1 | 5 | 0 |
s3 | 6 | 0 | 4 | 9 | -3 |
6. На корабле 50 пиратов делят 100 кусков золота по следующему правилу: первым дележ предлагает капитан. Если хотя бы половина команды (включая капитана) согласна, то на этом игра и заканчивается. Если нет, то капитана выбрасывают за борт и дележ предлагает следующий по старшинству и т.д. Найдите совершенное подыгровое равновесие в этой игре.
7. Приведите пример стратегического взаимодействия из вашей реальной жизни (укажите для этой игры – игроков; возможные стратегии участников; характер игры (с обоснованием): статическая или динамическая, с полной информацией или нет, с совершенной информацией или нет). Какое решение в этой игре было достигнуто в реальном мире? Попытайтесь объяснить - почему именно это решение реализовалось.
Пример должен быть действительно из реальный жизни, а не просто получаться из семейного спора заменой «муж» на «зять» и «театр» на «рыбалка» - такие примеры оцениваются в 0 балов!
1. Найдите решение по доминированию в данной игре
a | b | c | d | |
A | 2 5 |
6 2 |
4 1 |
3 0 |
B | 1 4 |
4 3 |
1 2 |
2 1 |
C | 0 1 |
1 1 |
5 1 |
1 5 |
D | 3 2 |
1 0 |
2 0 |
4 4 |
Решение:
1. В исходной игре стратегия d строго доминирует стратегию a. Больше строго или нестрого доминирующих стратегий у первого или второго игрока нет. Очевидно, что второй игрок не будет играть стратегию a и ее можно исключить.
Получаем:
b | c | d | |
A | 6 2 |
4 1 |
3 0 |
B | 4 3 |
1 2 |
2 1 |
C | 1 1 |
5 1 |
1 5 |
D | 1 0 |
2 0 |
4 4 |
2. В получившейся игре видим, что стратегия С первого игрока строго доминирует стратегию D. А также стратегия В строго доминирует стратегию А. Рассмотрим оба варианта. В первом – вычеркиваем стратегию D, во втором – стратегию А.
Получаем:
b | c | d | |
A | 6 2 |
4 1 |
3 0 |
B | 4 3 |
1 2 |
2 1 |
C | 1 1 |
5 1 |
1 5 |
b | c | d | |
B | 4 3 |
1 2 |
2 1 |
C | 1 1 |
5 1 |
1 5 |
D | 1 0 |
2 0 |
4 4 |
3. В полученной игре в обоих вариантах получаем, что у второго игрока нет строго доминирующих стратегий. Однако в первом варианте у второго игрока есть нестрого доминирующая стратегия b (доминирует стратегию d). Во втором же варианте у второго игрока нет строго или нестрого доминирующих стратегий. Однако по-прежнему есть строго доминирующая стратегия C первого игрока, которая доминирует стратегию D.
Продолжим рассматривать 2 варианта игры: в первом варианте вычеркиваем стратегию d, а втором – стратегию D. Получим 2 игры:
b | c | |
A | 6 2 |
4 1 |
B | 4 3 |
1 2 |
C | 1 1 |
5 1 |
b | c | d | |
B | 4 3 |
1 2 |
2 1 |
C | 1 1 |
5 1 |
1 5 |
4. В первом варианте полученной новой игры видим, что стратегия B первого игрока строго доминирует и стратегию А и стратегию C. Во втором же варианте видим, что стратегия b второго игрока нестрого доминирует стратегию d. Исключив в первом варианте стратегию A получим новую игру, совпадающую с вариантом, если во втором варианте исключить стратегию d. Еще один вариант игры получается исключением стратегии С в первом варианте игры. Итого вновь имеем 2 возможных варианта игры.
b | c | |
B | 4 3 |
1 2 |
C | 1 1 |
5 1 |
b | c | |
A | 6 2 |
4 1 |
B | 4 3 |
1 2 |
5. В первом варианте получившейся игры видим, что у второго игрока нет доминирующих стратегий. Во втором же варианте он имеет строго доминирующую стратегию b (доминирует стратегию с). Однако в первом варианте у первого игрока остается строго доминирующая стратегия B (доминирует стратегию С).
Исключим в первом варианте стратегию С, во втором – с.
b | c | |
B | 4 3 |
1 2 |
b | |
A | 6 2 |
B | 4 3 |
6. В первом варианте стратегия b второго игрока строго доминирует стратегию с. Во втором варианте стратегия B первого игрока строго доминирует стратегию А. Вычеркнув в обоих вариантах строго доминируемые стратегии, получим одинаковый вариант игры:
b | |
B | 4 3 |
На основании этого можно сделать вывод, что в исходной игре должен реализоваться исход (B, b).
2. Заполните пропуски в таблице так, чтобы в этой игре в чистых стратегиях было бы 3 равновесия по Нэшу. Найдите все равновесия в смешанных стратегиях (любым способом).
a | b | |
A | 7 ? |
? 4 |
B | ? 25 |
9 ? |
Решение:
Заменим знаки вопроса на неизвестные переменные следующим образом:
a | b | |
A | 7 y |
x 4 |
B | t 25 |
9 z |
Попытаемся заполнить пропуски в таблице так, чтобы равновесия по Нэшу достигались в вариантах игры (A, a), (B, a), (B, b), а при игре (A, b) равновесие по Нэшу не достигалось. Тогда должна выполняться система неравенств (объедим их парами для каждого варианта игры):
Откуда получаем:
Возьмем минимальные целые числа, удовлетворяющие системе неравенств. Получим игру:
a | b | |
A | 7 25 |
6 4 |
B | 9 25 |
9 5 |
Действительно, в данной игре варианты (A, a), (B, a), (B, b) будут являться равновесиями по Нешу, т.к. здесь ни одному из игроков не выгодно изменить свою стратегию, а при игре (A, b) каждому из игроков выгодно изменить свою стратегию.
Найдем равновесие в смешанных стратегиях. Предположим, что первый игрок с вероятностью µ играет стратегию A, соответственно с вероятностью (1 - µ) – стратегию B. Второй игрок с вероятностью ν играет стратегию a, а с вероятностью (1 - ν) - стратегию b. Тогда функции выигрыша игроков будут выглядеть следующим образом:
;
Тогда функции отклика будут следующими:
Имеем 2 равновесия в смешанных стратегиях. Если второй игрок играет стратегию b, то первый игрок всегда будет играть стратегию B. Если первый игрок играет стратегию А, то второй игрок будет играть стратегию a.
Решением же в доминируемых стратегиях будет (B, a).
3. Двое бегут по лыжной трассе навстречу друг другу. У каждого лыжника 2 стратегии: «уступить» (У) и «не уступить» (Н). Если один из игроков уступает другому, то его потери - 9 секунд, второй – не теряет ничего; если же лыжники сталкиваются, то оба теряют 25 секунд.
d) Составьте платежную матрицу этой игры. Найдите равновесия в чистых стратегиях.
e) Нарисуйте линии откликов игроков и найдите смешанные равновесия в этой игре.
f) Допустим теперь, что у игроков теперь 3 стратегии: «не уступить», «уступить» и «уступить пол-лыжни». Если оба уступили друг другу пол-лыжни, то потери каждого 4 секунд, если же один уступил пол-лыжни, а второй - нет, то лыжники столкнутся, и потери при столкновении у уступившего – 29 секунд, у неуступившего - 4 секунды. Найдите все равновесия по Нэшу (в чистых и в смешанных стратегиях).
Решение:
a) Составим платежную матрицу этой игры:
У | Н | |
У | -9 -9 |
0 -9 |
Н | -9 0 |
-25 -25 |
В чистых стратегиях равновесия в данной игре нет.
b) Найдем равновесие в смешанных стратегиях.
Предположим, что первый игрок с вероятностью µ играет стратегию У, соответственно с вероятностью (1 - µ) – стратегию Н. Второй игрок с вероятностью ν играет стратегию У, а с вероятностью (1 - ν) - стратегию Н.
Функции выигрыша игроков:
Соответственно функции откликов:
Имеем 2 точки пересечений линий, соответствующие равновесиям в смешанных стратегиях:
2. (Н; У), то есть первый игрок всегда не уступает, а второй – уступает;
3. (У; Н), то есть первый игрок всегда уступает, а второй – не уступает;
4. Каждый из игроков с вероятность 16/25 уступает лыжню и с вероятностью 9/25 не уступает лыжню.
c) Составим платежную матрицу игры:
У | Н | УП | |
У | -9 -9 |
0 -9 |
-4 -9 |
Н | -9 0 |
-25 -25 |
-29 -25 |
УП | -9 -4 |
-25 -29 |
-4 -4 |
В чистых стратегиях равновесия нет.
4. Профсоюз заключает с фирмой соглашение на несколько лет об уровне заработной платы w>0. Профсоюз максимизирует функцию совокупной прибыли членов профсоюза (зарплата за вычетом издержек от работы): u(w,L)=wL-4*L2 , фирма максимизирует свою прибыль (выпуск за вычетом зарплаты): П(w,l)=7*L0.5 -wL.
d) Найти равновесный уровень заработной платы и занятости в статической игре.
e) Каково равновесие в динамической игре, если профсоюз достаточно мощный, чтобы навязать фирме любой уровень заработной платы, после чего фирма не может менять уровень заработной платы в течение срока контракта, но может нанимать любое количество труда L>0.
f) Каково равновесие в динамической игре, если фирма – монополист на рынке труда, и она может установить любую заработную плату, после чего профсоюз может только регулировать численность работающих на монополиста.
Решение:
b) Профсоюз устанавливает уровень заработной платы. В свою очередь исходя из этого значение фирма определяет количество занятых. Предположим, что профсоюз установил уровень заработной платы w* . Тогда прибыль фирмы будет П(w* ,l)=7*L0.5 - w* L. Максимизируем прибыль по L.
ПL ’(w* ,l)= 3.5L-0.5 – w* = 0 при L* =.
То есть при установлении профсоюзом уровня з/п в значение w* фирма примет решении о найме рабочей силы в значение L* =.
Максимизируем теперь функцию совокупной прибыли членов профсоюза u(w,L)=wL-4*L2
Подставим в функцию найденное на предыдущем шаге значение L* .
u(w,L* )=wL* 4*L*2 =
. , откуда .
Решение игры: .
c) В данном случае сначала фирма устанавливает уровень з/п. После чего профсоюз принимает решение о количестве занятых, максимизируя свою прибыль. Предположим, что фирма приняла решение об уровне з/п равным w* .
Тогда прибыль членов профсоюза будет определяться: u(w* ,L)=w* L-4*L2 . Профсоюз максимизирует свою прибыль, варьируя значение L.
, откуда максимизирующий прибыль сотрудников профсоюза уровень занятости определяется как . Подставим это значение в функцию прибыли фирмы:
П(w, L* )=7*L*0.5 -wL* =. Пw ’(w, L* )==0 при .
Соответственно .
Решение игры: (;).
5. В этой игре с нулевой суммой найдите равновесие в осторожных стратегиях. Существует ли в этой игре равновесие по Нэшу в чистых стратегиях?
c1 | c2 | c3 | c4 | c5 | |
s1 | 5 | 2 | 3 | 6 | 4 |
s2 | 4 | 1 | 1 | 5 | 0 |
s3 | 6 | 0 | 4 | 9 | -3 |
Решение:
Игра антагонистическая, значит можем найти MinMax и MaxMin и сравнить их.
MaxMin = Max (2, 0, -3) = 2 и соответствует s1.
MinMax = Min (6, 2, 4, 9, 4) = 2 и соответствует c2.
Получаем, что MinMax = MaxMin = 2, следовательно в игре существует равновесие по Нэшу в чистых стратегиях и соответсвует (s1, c2).
6. На корабле 50 пиратов делят 100 кусков золота по следующему правилу: первым дележ предлагает капитан. Если хотя бы половина команды (включая капитана) согласна, то на этом игра и заканчивается. Если нет, то капитана выбрасывают за борт и дележ предлагает следующий по старшинству и т.д. Найдите совершенное подыгровое равновесие в этой игре.
Решение:
Будем использовать метод обратной индукции. Упорядочим всех пиратов по старшинству.
1. Предположим, что остался один пират. Тогда он предложит отдать все куски золота ему, с чем согласится и получит все золото.
2. Осталось 2 пирата. Чтобы старшему пирату заполучить все золото, ему нужно набрать один голос. Соответственно он предложит все золото отдать ему, согласится и получит все золото. Исход игры не зависит от того, согласен с этим решением или не согласен второй пират.
3. Осталось 3 пирата. Чтобы получить одобрение плана и остаться в живых самому старшему пирату необходимо получить 2 голоса. Второй пират знает, что он может получить все золото, если останется он и еще один пират. Потому он всегда будет голосовать против. Остался самый младший пират. Он также знает, что если останутся 2 пирата, то он не получит ничего. Если же в текущем дележе ему достанется хотя бы один кусок голоса, то он проголосует за дележ. Потому в условиях, когда осталось 3 пирата старший предлагает самому младшему один кусок золота, а все остальное оставляет себе. При таком дележе он точно получит 2 голоса: свой и самого младшего пирата.
4. Осталось 4 пирата. Для принятия плана дележа вновь необходимо заполучить 1 дополнительный голос, помимо своего. При этом все пираты понимают, что если останется 3 пирата, то дележ будет осуществлен в соответствии с п.3, в котором самый младший пират получает 1 кусок золота второй по старшинству не получает ничего. Если второму по старшинству пирату предложить хотя бы один кусок золота, то он проголосует за этот план, т.к. его выигрыш больше. Необходимое количество голосов будет набрано и остальным пиратам можно не платить ничего, и от их вариантов голосования ничего не зависит. Соответственно дележ будет таким: самому младшему пирату не достается ничего, второму отдается 1 кусок золота, третьему ничего, а четвертый (самый старший из оставшихся) получает 99 кусков золота.
5. Осталось 5 пиратов. Необходима поддержка двух дополнительных голосов. На предыдущем шаге ничего не получают самый младший и третий пираты и они это понимают. Потому предложить им более выгодные условия и получить поддержку их голосов. Поступаем в соответствии с п 3. – отдаем самому младшему и третьему по старшинству пирату по 1 куску золота. Остальные 98 оставляем себе. Они проголосуют за дележ, т.к. в противном случае не получат ничего.
6. Продолжая индукцию, принимая во внимание, что 50 – четное число, получаем, что капитан должен предложить следующий вариант дележа: самый младший пират не получает ничего, второй по старшинству получает 1 кусок золота, третий снова не получает ничего, четвертый получает 1 кусок золота и т.д. Итого 24 куска золота. Остальные 76 оставить себе. Итого он получит 25 голосов в поддержку, включая свой. Никому из пиратов, проголосовавших за дележ не выгодно менять стратегию, т.к. при смене он не получит ничего.
Итак, капитан предлагает описанный выше план дележа золота.
Соответственно совершенным подыгровым равновесием будет следующий набор стратегий:
Пират | 1 | 2 | 3 | 4 | … | 50 (капитан) |
Голосование | против | за | против | за | … | за |
Выигрыш | 0 | 1 | 0 | 1 | … | 76 |
Никому из пиратов невыгодно менять стратегию, т.к. в противном случае он не получит ничего. Соответственно равновесия является равновесием по Нэшу в полной игре и принимая во внимание метода обратной индукции во всех подыграх этой игры.
7. Приведите пример стратегического взаимодействия из вашей реальной жизни (укажите для этой игры – игроков; возможные стратегии участников; характер игры (с обоснованием): статическая или динамическая, с полной информацией или нет, с совершенной информацией или нет). Какое решение в этой игре было достигнуто в реальном мире? Попытайтесь объяснить - почему именно это решение реализовалось
Если я должен ехать куда-то на поезде или лететь на самолете, то предпочитаю приезжать на вокзал или в аэропорт заблаговременно (оптимально – за час). У меня есть друзья, с которыми я часто пересекаюсь и «путешествуем» одними маршрутами. При этом они как раз предпочитают приезжать минута в минуту. Соответственно, когда мы выезжаем из одного места в пункт назначения, то всегда спорим, во сколько нужно выезжать. Я не хочу приезжать минута в минуту, потому что считаю это рискованным, т.к. в дороге может что-нибудь произойти, и мы можем не успеть на транспорт. Они уверены, что все будет нормально, и они успеют и лучше этот лишний час провести в уютной обстановке, чем на вокзале или в аэропорте. Если мы выезжаем из разных мест, то каждый следует своей стратегии – я приезжаю за час, они приезжают точно в срок. При этом я переживаю, что они могут не успеть, а ехать в поездку одному мне не хочется. Можно рассмотреть вариант, когда мы выезжаем из одного места.
Каждый такой вариант можно представить как статическую игру с полной информацией, т.к. каждый знает интересы другого. Игроки: я, мои друзья. У каждого есть две стратегии: «ехать рано» или «ехать поздно». При этом выигрыши игроков условно следующие:
5. Мне выгоднее всего поехать вместе с ними за час до назначенного времени, т.к. в данном случае я не чувствую себя комфортно, при этом не переживаю за друзей, что они не успеют. Плюс ко всему мы весело и интересно проводим время в пути до аэропорта или вокзала. Ребята при этом проводят время на вокзале или аэропорту, чего не любят.
6. Ребятам выгоднее всего отправиться точно в срок вместе со мной, т.к. это их наиболее предпочитаемый вариант – они поводят врем в комфортной обстановке, а в дороге их сопровождаю я. Я при этом же переживаю, что мы можем опоздать.
7. Каждый едет в то время, в которое ему удобно. Это возможно, но выигрыш каждого тут будет уже меньше, т.к. в дороге скучно и неинтересно.
8. Самый невероятный вариант, когда ребята едут раньше, а я еду позже. Вариант неудобен для всех.
Я рассмотрел 4 варианта, т.к. если бы мы принимали решения независимо друг от друга (тайным голосованием) и следовали стратегиям, то все 4 варианта имеют место быть. В реальной же жизни нам всегда удается договориться и прийти к общему согласию. Как правило, мне удается убедить о необходимости выехать заблаговременно. Хотя, когда они отправляются без меня, то всегда приезжают минута в минуту до назначенного времени отправления поезда или окончания регистрации на рейс. .