《“博弈论”习题及参考答案.docx》由会员分享,可在线阅读,更多相关《“博弈论”习题及参考答案.docx(9页珍藏版)》请在优知文库上搜索。
1、(2)两厂商合作的结果是什么?8、求出下列博弈的全部纯境略纲什均衡,同中人2甲乙丙T局中人1A2.33,23,40,3B4.45.20.11.2C3,14.11.410,2D3,14,1-1,210,19、求出卜,面博弈的纳什均衡(含纯策略和混合策略)。乙1.R甲U5,00,8D2,64,510、依据两人博弈的损益矩网炉!答问时:乙左右甲I2.30.0卜0,01,2(1)写出两人各自的全部策略.(2)找出该博弈的全部纯策略纳什均衡.(3)求出该博弈的混合筑略纳什均衡,Ilx某齐头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函数为Q=200-P.求:(1)若两个厂商同时确定产最,产
2、瘠分别是多少?(2)若两个厂商达成协议垄断市场.共同支配产则各自的利润状况如何?(3)用该案例说明囚徒逆境.12、假设双头垄断企业的成本函数分别为:*=2(肛,G=?;,市场需求曲线为P=4-22其中,Q=QI+Q(1)求出古诺(Cournot)均衡状况下的产量、价格和利涧,求出各自的反应函数,并17 .求解下列下列的纳什均衡.博弈方2左中右博弈方1上4,35,I6.2中2.18.43.6下3.012,62.918 .某人正在打一场官司,不请律师确定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作UOO小时)时有50%的癖率能旅,律师不努力工作(10小时)Wl只有15%的概率Ife
3、fi1.假如诉讼获胜可得到250万元赔偿,失败则没有赔偿。因为托付方无法监督律师的工作,因此双方钝定依据结果付费.高官H律师可获黠偿金额的1O.失败则律师一分钱也得不到.假如律师的效用函数为?一.()5e.其中2是酬劳,e是努力小时数.H.律师有机会成本5万元.求这个博弈的均衡。四、论述题1、说明“囚犯逆境”,并举商业窠例说明。2、用“小用与保卫的保彝”说明“激励(赛管)悖论二博弈论习题参考答案一、单项选择题I5B.B.C.V),A.610C.A.A,D.C.11-15.B.C,A.C.16-20C.B.C,C.B.21-26.B.B.C.B.D.A.二、推断正误并简要说明理由I、F匕策均衡是
4、比纳什均衡更产格的均衡.所以上策均衡确定是纳什均衡.而纳什均衡不确定是上策均衡.2、T网弈类型按目中人数多少分为单人博弈、双人博弈和多人即弈3.F博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡.如性别战.4,T零和博弈指参加博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和但为零,所以双方不存在合作可能性5 .T上策均衡是地过产格下策消去法(重曳剔除下策)所得到的占优策略.只能有一个纳什均衡6 .F只要两囚犯只准备合作有限次,其最优策略均为招供.比如最终一次合谋.两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供.I可退到倒数我次次,既然已经知道下次不
5、会合作,这次为什么要合作呢,依此类推,对于有限次内的任何一次,两小偷均不行能合作.7 .F纳什均衡是上策的集介,指在给定的别人策珞状况下,博弈方总是选择利益相时较大的策略,并不保证结果是最好的。8 .F局中人总是以自己的利益最大化选择自己的策略并不以对方收益的变更为目标9 .T纳什均衡是上策的坎合,指在给定的别人镀略状况下,没有人会变更自己的策略而减低自己的收益10 .F局中人总是以自己的利益最大化选择自己的策略并不以对方收益的变更为目标11 .T虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利涧比古诺模型时高12 .T无限次理复博弈没仃结束重红的确定时间:而在有限次重更博弈中.存在
6、最终一次重红,并且正是有结束曲复的确定时间,使史红博弈无法实现更高效率均衡,13 .F子博弈精炼纳什均衡确定是一个纳什均衡.Hjw和博弈的无限次重契博弈中.全部阶段称不行能发生合作,局中人会始终曳复原博弈的混合战略纳什均所.15. T原博弈惟一的纳什均衡本身是怕韦托效率意义上最佳战略组合.因此不管是重.更有限次还是无限次,不会和一次性博弈有区分.16. F动态悔弈是指各博弈方的选择和行动又先后次序的博弈。动态博弈的信息可以是不对称的.所以策略分为先发制人和.斯塔克侑格博弈揭示“先发制人”更有利,而“后发制人”后行动的睥弈方可以先视察对方行为后再选择行为反而处不利境地。三、计算与分析题1、(1)
7、B做广告不做广告A做广告20-825,2不做广告10.1230,6纯策略纳什均衡为(做广告做广告),(不做广告,不做广告百事可乐不涨价涨价Ur口可乐不涨价10.10100.-30涨价-20,30M0,35纳什均衡(不涨价,不涨价),(涨价,涨价兄从帕累托均衡角度,为(法价,涨价)3、(D假如(上,左)是上策均衡,那么,aebd,gh(2)祖如(上,左)是纳什均衡aebd,不等式必需湎意小猪按等大猪按5.14,4等9,-10,04、新华航空合作竞争北方航空合作50,500,90竞争90,06.65、略6,纳什均衡为(按,等)。7、略8、纯策略纳什均衡(Bf),(A,内)5,00,82.61.5R
8、9 、甲UD不存在纯策略纳什均衡(2)设甲选择U的概率为P1,则选择3的概率为1-P1乙选择1.”的概率为P2,则选择“R”的率为1.P2对甲而言,坡佳策略是按确定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等即P81-P1)O=P11+(1-P1)*5解得P1-5/12!J(5112,712)按52t率选“上二7/12概率选“下”为甲的混合策略NaSh均衡时乙而言,最佳策略是按确定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等即P25+(1-P2)0=P2,2+(1-P2)*4解得P2=4-7即(4/7,3/7)即4/7概率选“左”、3/7概率选“右”为乙的混合策略N
9、aSh均衡10 .略.Ik见笔记12、见笫记。13.首先,运用严格下策反复消去法的思想,不难发觉在博弈方1的策略中,B是相对于T的严格下策。把博弈方1的B策略消去后又可以发觉,睥弈方2的策略中C是相对于R的严格下策,从而也可以消去.博弈方2两个博弈方各消去一个策略后的博弈是如下的两人2X2博弈,已经不存在任何产格卜策.再运用划线或箭头法,很简单发觉这个2X2博弈有两个纯策略纳什均衡(M.1.)和(T,R)o博弈方2由于两个纯策略纳什均衡之间没有怕累托效率意义上的优劣关系,一次性静态博弈的结果不能确定。由于双方在该曲弈中可能实行混合策略,因此事实上该仲界的结果可以是4个纯策略组合中的任何一个。1
10、4.假设哥的方案是Shl-SI,其中SI是自己的份额.弟的方案是S2:1T2,S2是哥的份做,那么可用如下的扩展形表示该博弈:运用逆推归纳法先分析最终一阶段哥的选择,由于只要接受的利益不少干不接受的利益哥就会接受,因此在这个阶段只要弟的方案满意S2/220,也就是S230,可就会接受,否则不会接受。由于冰激凌的份额不行能是负数,也就是说因为哥不接受弟的方案沐激凌会全连化掉,因此任何方案哥都会接受.现在回到前阶段弟的选择,由于弟知道后阶段哥的选择方法,因此知道假如不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的2块冰激凌:假如选择接受前一阶段哥的提议,那么自己将得到I-Sl,明
11、显只要I-Sl1/2,BPSl1/2,弟就会接受哥的提议。再回到第一阶段哥的选择.对清晰后两个阶段双方的选择逻辑和结果,因此他在这一阶段选择Sl=l2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能汨到,因此Sl=l2是地佳选择。综上,该博弈的子博弈完备纳什均衡是:哥野起先时就提议按(2,2)分割,弟弟接受,学生选择全面复习的期望得益是Ul=9(Wh-200)+0.1(Wl-200)空点复习的期盥得益是U2R.5(Wh10)+0.5(11-40)只有当UDU2时学生才会选择全面复习依据UlBU2我们可以算出Uh-WlHOO.这就是老师能有效全面发习须要湎急的条件.其实在奖学金与
12、成果挂钩时,Vh-Ui也可以理解成不同等奖学金的差额。16.没有纯策略均的,只有混合策珞均衡(0.25,0.75).(0.5,0.517,可以依据画线法求得有唯一纯策略均衡(上,左)18.参见笫15题四、论述题1、说明“囚犯逆境”,并举商业案例说明。(I)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法耳.通信息。各囚徒都被要求坦白罪行。假如两囚徒都坦白,各将被判入狱S年;假如两人都不坦白两囚徒可以期望被从轻发落入狱2年:假如一个囚徒坦白而另一个囚徒不坦向,坦后的这个囚徒就只能入狱】年,而不坦白的囚徒将被判入玳IO年.(2)闪优逆境的策略矩阵表,毋个囚徒都有两种策略:
13、坦白或不坦白。表中的数字分别代衣囚徒甲和乙的得益.囚徒乙坦白不坦白囚徒甲坦白今z5,-10不坦白-10.J-2.-2(3)分析:通过划规法可知:在囚徒逆境这个模型中,纳什均衡就是双方都“坦白工给定甲坦白的状况下,乙的最优策略是坦白:给定乙坦白的状况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白.其结果是双方都坦白。(4)商业案例:寡头垄断厂商常常发觉它们自己处于一种囚徒的逆境.当算头厂商选择产依时,假如寡头厂商们联合起来形成卡特尔,选杼垄断利润般大化产依,好个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡因为给定双方
14、遵守协议的状况下,每个厂商椰把增加生产,结果是每个厂商郴只得到纳什均衡产Jlt的利润,它远小于卡特尔产量卜的利润。2、用小偷与保卫的博弈”说明“激励(监管)悻论”。(I)假设条件举例:偷地和防止偷悌是小偷和卫之间进行博弈的一场的战。门卫可以不睐觉,或者Hi觉。小偷可以实行偷、不偷两种策珞。要如小偷知遒门卫喊觉,他的发佳选择就是偷:假如门卫不睡觉,他皎好还是不俗.对于门P.,假如他知道小偷想价.他的最佳选择是不睡觉,假如小偷实行不倏,自己最好去睡觉。(2)小愉与门卫的支付矩阵表(假定小偷在门卫睡觉时确定愉胜利.在门卫不睡觉时偷确定会被抓住):(3)分析:通过划线法可知:这个悔弈是没有纳什均衡的门见不睡觉,小偷不偷,双方都没有收益也没有损失:门卫不睡觉,小偷偷,门卫因为是本职工作得不到嘉奖,小偷被判刑丢失效用2单位;门卫睡觉,小偷不f,门卫睡觉的很开心得到效用2单位,小偷没有收益也没有损失:门卫睡觉.小偷偷,门卫因失职被处分而丢失效用1单位.小偷检窃胜利获得效用I单位.(4)”涕励雅管)悖论”说明:现实中,我们看到,当门卫不睡觉时,修窃分子便收敛一阵:严打的时期一过,偷窃分子又起先兴风作浪.在不能容忍小偷过分弟狂的时候.门卫不褥不再次起先仔细。即偷的小偷