㈠ 1 _ 分蛋糕^的动态博弈 桌子上放了一个冰淇淋蛋糕,小娟和小明讨论如何在
如果两个人分蛋糕的话,涉及到的最基本就是平均分配,怎么可以把蛋糕平均分给两个人,那么我们就要从蛋糕的中间取一条直线平均分成两份,每人要一人一份才行,不能分的过大或者是过小,因为过大和过小的话,那都不属于是平均分配了。
事实上,对于两个人分蛋糕的情况,经典的你来分我来选”的方法仍然是非常有效的,即使双方对蛋糕价值的计算方法不一致也没关系。首先,由其中一人执刀,把蛋糕切分成两块,然后,另一个人选出他自己更想要的那块,剩下的那块就留给第一个人。由于分蛋糕的人事先不知道选蛋糕的人会选择哪一块,为了保证自己的利益,他必须(按照自己的标准)把蛋糕分成均等的两块。
分蛋糕游戏怎么玩,可以这样玩,首先把蛋糕盖起来,然后,可以几个人划拳,赢了的,可以分一块蛋糕,然后继续这样玩,就好了。
㈡ 谁知道《博弈论的诡计》啊
国内最好的一本关于博弈论的普及书,2007和2008年连续两年的“中国图书榜中榜”科普类的第一名。
书评《博弈论的诡计》
小磨咖啡 / 挑灯看剑May 7th, 2008聿之
研习一下博弈论,已然是一个夙愿了。博弈论好歹也是我大学之后听闻的第一个伟大的经济学理论了。倒不是经济学的课堂,而是思修课上放映的《美丽心灵》。这一部当年击败《指环王》并维护了奥斯卡“良知”的影片,确乎给我们这些初入经济学的小生,影响是莫大的。而博弈论更是一些人即将并一直热衷的一个分析工具。
出纳什和博弈本身的神奇经历,一直想有所了解。不过,作为一门经过严谨数学证明的理论,要深入其中,却也必定是艰难的。在图书馆转了一圈,在两分类中发现博弈论的踪迹:经管类与数学类。无论哪一种,都是些许专着,有那么点令人头疼的专着。幸好,倒是在数学类的夹缝中瞧见一本《博弈论的诡计》的白话书,对于只知囚徒困境以及以牙还牙的我对说,倒确是一本不错的书。
《博弈论的诡计》提要与思考
囚徒困境:这个简单的例子,几乎是博弈论的代名词。两个基于“坦白从宽,抗拒从严”审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果若是,从个人理性并追求个人利益最大化,那么二人皆坦白,也就是背叛。这在四种策略中并不占优,那为什么不采用集体最有策略呢而合作。很简单集体的优化,必然侵害个人利益的最大化。当然这一切前提是理性假设,也就是着名的经济人假设:经济学中的人都是“小人”(管理学则认为人是“君子”,有意思而有道理的比喻)。破解这一困境的途径则是打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作,谁在这里面坚持到最后,谁将取胜。
重复博弈:囚徒困境,砸了传统经济学的场子。因为个人的自利行为,并不一定导致集体利益的最大化,“看不见的手”拉不住,人类向堕落之城下滑的趋势,难道这真是一个悲哀?索性并非如此,撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作将到来。因为,未来的收益将左右目前的决策。
以牙还牙:重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优。若干睿智而复杂在经过计算机中PK之后,极其原始的“以牙换牙”策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必以牙还牙,第三方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。
人质困境:一场憋屈的博弈。抢打出头鸟,人质联合固然可以制服歹徒,但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会,类似于秦的远交近攻、各个击破的策略,将最终全盘赢下。人质可有反制的策略,当然有,不过艰难至极。人质可以选择沉默,这样他有一定时间苟延残喘;或者联合劫持者对付人质,结局还是取决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将获得左右策略,但是这需要壮士断腕的勇气,部分人可能因此受伤。这里是实力与勇气的较量,而且实力暂居上风。
酒吧博弈:如果人人理性,那么每一天到达酒吧的人数将是差不多正好的,但是人非圣贤,往往是有限理性的。第一次到酒吧的人多,那么大多人人认为酒吧人太多,太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人……循环就此开始。酒吧博弈一方面显示,现实的博弈参与者,是极其有限理性的,其理性只前延后伸一小段。历史数据只对计算机有用,对人,则不一定。
另一个方面,酒吧博弈指出,胜利者永远只是少数。尽管酒吧存在调谐的可能,譬如发短信时时提醒,但成本恐怕太高。而在其他场合,少数派可能更加会设置种种障碍阻止后进者的上升。也就是说,我们的世界仍然是操弄在少数派的手中。不过,总算这个世界不是模型,少数派的道路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中找到唯一的生门。若你想要,必须做一个更加老练的将军。
枪手博弈:王者的悲哀。三人对枪自决,甲乙丙枪法优劣递减。最后无奈而神奇的结局,将不取决于同时开枪还是先后开枪,最优良的枪手,倒下的概率将最高;而最蹩脚的枪手,存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清楚目标。在这里,后发制人的弱势者将胜出。以弱胜强,绝不是神话。
难道王者的命运就真如此不堪,呵,道别忘了每个理论模型都是有其前提的,击破之中任何一个,王者仍将归来。这就是先发优势。假设这是一场类似CS的竞技,优秀的枪手击倒二号枪手,立刻获得奖励:盾牌。那么三号枪手将陷入绝境。不过,不管怎样,这个博弈模型,到底给了弱势者一份希望。机会永远存在。
猎鹿博弈:两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益,战略联盟将开始。这或许是件好事,不过有取决于最后猎获的鹿——这一公共资源的分配,如果分配得当,整体的效率将增加。如果一方主导,另一方受损,那么帕累托改善无法进行,合作可能终将破裂。
另外一个问题,更加大局的问题。合作的示范性将使得更多的猎人加入,猎获的鹿将大大增加,人类的利益短期内将呈几何级数增长。但是最后,确是生态失衡,鹿群灭群。短暂的繁华之后,猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧,人类还有最后的希望:制度经济学的法宝——科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性,人类社会的公共悲剧仍将不断上演。
智猪博弈:混沌之前最后的博弈。小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。结果怎样?是小猪选择“搭便车”,大猪勤跑。因为小猪无论跑还是停,大猪的最优策略都是策略都是去踩机关。不过在实际生活中。这里依旧存在两种策略。
小猪的“搭便车”。大猪有的时候,自觉或不自觉地自封“侠之大者,为国为民”,并因此承受一些不能承受之重。《博弈论的诡计》指出美国战后的行为极似大猪,战后的美国竭力宣传自己的普世价值观,并深入到海外事务,甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。
大猪在击破模型的一个假设之后,仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样,大猪完全有能力撑得更久,小猪如果不想饿死,那只有一条豪赌的路子:龟兔赛跑式的豪赌,但愿大猪打了个盹儿,他回来的时候,还能吃上一两口,要不然真是赔了夫人又折兵了。据此,再也不难解释为什么很多人切齿的腾讯,毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。
大猪在这里的后发制人和枪手博弈的后发并不一致,枪手后发是建立在他人恶斗的基础上,大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激进措施,只要跟随就好。因为小猪获胜的条件不是接近,还是距离。
警察与小偷:令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地,那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是,警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是,此时的小偷谋求的是,最小得手几率的最大化。也就是说,警察的最优策略将把小偷的最差策略改良!这个便是冯·诺伊曼提出的“最小最大定律”。
我们必须再一次感谢这个不完美的世界,因为现实之中,类似的现象,对于一方仍然可以设法找到对手致命的规律性行动(当然必须考虑到对方是不是一个更加老练的猎手,故意放出的诱饵)。而保持自己的行动的无序性,则有可能成为欺骗策略的武器,这倒似张三丰所言道的:无招胜有招。
斗鸡博弈:两只斗鸡在决斗的时候,无论选择进或退都是一个难题,因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下,死拼将是得不偿失的,因为很可能给第三者机会。因此,两个已经在战场的强势力很可能自觉的遵循纳什均衡,当一方攻击时,另一方暂退。虽然可能某方暂时受损,但较之于两败俱伤是好得多的。不过,要维持这一状况,必须保证下一次先期受损的一方发动攻势的时候,另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”,没有人真正流血。这只不过是两个巨头玩弄的游戏,目的是警告后来者,想进来,那么也得陪我们一起玩,可是你玩的起么?这正是百事的广告,即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。
协和谬误:欧洲政府在大量投资协和飞机后,终于不能自拔。即使前景黯淡,也撑着面子投下去,非要走头无路才放弃。而这时投入的成本已经全打水漂了。如果,发现不能继续的时候,就果敢放手,损失会小得多。可是他们会、能这么做么?壮士断腕,是何等的壮烈,却也是何等的艰难!
沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃,可惜大部分有赌徒式的心理,相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前,已经窒息了。
协和谬误,倒是给了人们半途而废的理由,会不会有人担心它的滥觞会左右一些本该坚持的目标?的确有这个可能,但是应该相信人们足够理智,完全可以比较沉没成本、机会成本与未来收益的关系。看清了的,必定会坦然地走出协和谬误。
蜈蚣博弈:一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果。它的另一个好处,就是使得未来的计划明晰化,是你不再徘徊。只可惜,很多时候,碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。
蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。可悲的是,这一次背叛将由于人性的理智,穿越时光隧道,回到原始的地点:人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧,事实上人们很少这样做。当然合作到最后的也很少,这意味着,倒推法只在中间阶段突然发生了作用,只不过谁也不能预测,中间一步在哪里。在那里,我们只有冀望信任、道德、良知等等。
分蛋糕博弈:两个小孩怎么分蛋糕?经典的故事,经典的解答:一个分,一个选。现实多如此,权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是一次性的,而是多回合的,而且出现成本:蛋糕在融化。
时间称本的加入,将使得分配变得复杂化。双方如果不能及时达成交易,不仅集体的收益将减量,而且个体的收益也将减少。在此情况下,利用时间称本以及威胁、承诺将对其中一方极其有利。顾客可能迫于情势,必须尽快结束谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上作出妥协。
顾客一方当然也有策略,它的策略就是货比三家,要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力,这就是顾客有权投诉商家。
鹰鸽博弈:这个博弈很多人等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体,鹰鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子一个苞谷场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。
由此产生了ESS进化上的稳定策略,也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。
进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,集团的胜利以及集体的止步不前。
脏脸博弈:恍然大悟的博弈。三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步……循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。
这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。在台面上的博弈之前,私下的算计已经置对手于死地。不过,很可能对方也预料到这一点,早也想到这一点,同时杀来。终于,形成双死局面。
当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知,双方只要各自依之行事就可以了。
信息均衡:很想然,信息的作用在博弈之中非常重要。将博弈论还原到现实,人们不再完全理性,信息存在不对称,博弈就需要在抢占信息高地上作出努力。
信息不对称,是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”,前者事前,后者事后。信息不对称短期内对某一方会有利,但最终会破坏整个市场。于是有两个解决策略。
信息传递:传达你的正面的信息的策略,也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。
信息甄别:诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜,保证顾客不会走到其他柜台去。这种策略显然更加有效,不过风险也更大:万一顾客用放大镜看出了了自己的瑕疵怎么办?
再介绍一篇评论:王春永《博弈论的诡计》
标签:王春永 博弈论的诡计 历史 文化
我们每天生活在博弈中,博弈论只是用数学的办法解释了我们长期进行的博弈。即使这样,当我们看到数学推演出的结论时,也不免目瞪口呆。
虽然每天博弈,但因为复杂的因素,我们常常看不清楚实质。按照直觉出牌,时常落入别人的算计。或许此书能帮我们解决些问题。本书涵盖范围很宽,大到人生抉择,小到一日三餐,用博弈的眼光解释了我们一生中的各类问题,包括职业,交往,爱情,经济,时间管理等等,有时让你忘记了这是本博弈论的书,还以为是成功学。但说起来,博弈还不是为了成功吗?
书里内容很多。作者恰当的将博弈理论、试验案例和历史、政治、文学、新闻、故事等等串联在一起,融会贯通,纵横肆意,文字优美,令人佩服。更有意思的是,每篇开头,作者都是引用一段流行歌曲(其中大部分我都不知道)的歌词作个引子,简直有些古典小说的结构意味了。在中国的教育体系下,研究数学的人有几人还会关注人文历史呢,更不要说关注流行了?而本书作者看来颇具阅历且阅读杂广,其中引用的不少东西都是近年来的新事物和新说法,想来都是敏锐的发现后总结到自己的研究中了。所以我每读到精彩处,都不免对作者的文理跨度感叹一番。
文字中常看到作者的一些抱负。他很聪明,把一些敏感的看法铺垫清楚然后一笔带过,读者自明。他常引用吴思先生的作品,但不像吴先生那么机锋。我想这也是博弈训练的结果。
书末尾的参考文献让人发笑。可能是觉得参考文献太少,作者竟然把罗贯中的三国演义也算在内充数。若是如此,他还引用的那些史记、通鉴等只怕就太感委屈了。本书其实引用极为丰富,若一一列出参考,作者要累死,所以就这样糊弄了一下吧。
㈢ 学会谈判——想要分蛋糕,你先要把蛋糕做大
人与人之间会进行谈判,公司与公司会进行谈判,就连国与国之间也会进行谈判。与一般的闲聊、沟通不同,谈判的目的在于 协调出具体的方案 ,来解决问题。在这场博弈中,如何避免谈判进入僵局,让谈判变得简单、高效,方案顺利落地实施,这是谈判中最希望获得的成果。
在 《谈判的逻辑》 中,作者 弗洛里安·韦 是一名谈判专家,不仅经历过各种谈判实战,还曾在哈佛大学接受过谈判技巧培训。对于谈判,他认为其关键点在于“ 着眼于利益,而非立场 ”。如果“立场”说的是“你是谁,你和别人是什么关系,你想要什么”,那么, “利益”所要表达的就是“为什么想要” ,即为一场谈判找到一个有力的支撑。
显然,谈判并非一件简单的事,会涉及到很多具体的内容,为了让更多人提升个人的谈判能力,作者为我们提供了 具体、有效的谈判技巧和原则 ,希望每个人都能在自己的“谈判”中,发挥更大的更多价值,争取更多的利益。
你理解的谈判是什么样的?是那种利益双方争得面红耳赤、怒不可遏?还是面对面列出条条框框,相互删选、衡量?又或是单方面的一方说服另一方……作者弗洛里安·韦所定义的谈判,与这些都不相同。
他认为:“ 谈判是一种创造性行为,而非一个简单的权力游戏 。”也就是说,谈判可能发生在任何时候。比如,买菜、求职,甚至是谈恋爱……而在我们极力让“谈判”顺利进行时,每个人都能发挥出独特的作用。
除了对“谈判”定义的不同观点,对谈判的本质,作者也有独到的见解。市面上大多数谈判的书籍都在争议—— 谈判到底是为了合作双赢 (以哈佛谈判术为代表),还是为了 一方胜利,另外一方失败 (以施汉纳谈判术为代表)。
在《谈判的逻辑》中,作者认为要想使谈判更有效、快速的产生结果, 必须同时满足这两种理念 ,即 要想分蛋糕,就需要双方合作先把蛋糕做大 。换种说法,这两个理念是一个循环,而非两条平行线。至于如何促进合作,那就需要我们了解成功谈判的关键法则。
正如书中所说,每次的谈判都不同,我们也不能将所有的谈判策略、技巧,全记下来。因此,我们只需掌握几条谈判过程中使用的关键原则,这样既方便记忆,又能快速判断下一步如何应对。作者具体为我们总结了 7 条法则,包括:
(一)收益优化原则
关于收益优化,在书中建议我们在谈判前,要准备好草案,设定评分体系、目标体系,然后根据谈判过程中获得的信息,不断调整目标。切记,调整不是退让,不是次优结果,我们要尽力达成“ 帕累托最优 ”的这个目标。当然,也不要忘记共情。
(二)知情原则
作者称:“ 谈判就是你需要赢得胜利的信息游戏 ”。所以,你要尽可能收集信息,不限于对你有利的信息,还有对你不利的信息,只有更全面的掌握情况,才能更有效的做出取舍,获得更好的结果。这时,不妨发挥身边人的力量,多向他人询问、求助。
(三)领导原则
谈判中所提及的“ 领导 ”,与现实生活中的领导不太一样,但也有相同之处。 掌握领导原则的关键是慎重 ,要想清楚自己可以为这个结果付出多大的代价,在每一个环节中都要负好责任,不只是对团队的伙伴,也是对谈判另一方,更是为你自己负责。
(四)合作原则
仔细思考,我们会发现,任何谈判都是 建立在“想合作”的基础上 。虽然,在谈判中,我们不能退缩、示弱,但这并不影响将“合作”作为谈判的目标之一。所以,请随时释放“想要合作”的信号,让对方感受到你的诚意。
(五)“双管齐下”原则
谈判是一件围绕“竞争”和“合作”双向的事,所以,我们要训练自己忍耐矛盾的能力,要能够 在这个矛盾过程中,随时进行切换 。
(六)理性原则
除了客观上的因素,主观上的情绪、心态,也会对谈判结果产生影响。所以,我们要避免一些常见的误区,比如 锚定效应、损失厌恶、被动贬低、沉默成本、优越感偏误 等。尽可能地营造出积极、乐观的谈判氛围。
(七)创造力原则
努力为谈判过程中的每个环节增加创意元素,比如表达时,不止用文字,还可以选用图片、视频等,尽量直观、可视化;谈判地点,可以根据谈判主题来选定……可以采用书中提出的四个步骤来激发解决方案的创意,具体包括: 定义问题、深入研究、孵化、塑造和完善新想法 。
除了上面提到的基本谈判知识、谈判原则以外,在书中,作者还列举出了可能遇到的 谈判难题 。比如,当我们遇到谈判僵局时,如何摆脱被搁置的状态,掌握主动权;当我们遇到难对付的谈判对象,如何顺利推进谈判……甚至如果你想精进谈判能力,书里还为你提供了很多谈判结构和方法,帮你找到适合自己的谈判工具和风格,成为“谈判专家”。
在读完《谈判的逻辑》后,你会发现 谈判每时每刻都在发生 ,大到国家之间的利益分歧,小到人与人之间的矛盾解决。不管是什么形式的谈判,作为谈判中的一方,我们既不能一味地被人牵着鼻子走、妥协退让,也不能得理不让人,让对方难堪。
想要谈判成功,需要在坚持自己观点的同时, 发挥自己的共情能力,学会着眼于利益,而非立场 ,从而简单、高效的为自己争取更多利益。
㈣ AL蛋糕店学习后怎样写心得体会
主要写一下主要的工作内容,如何努力工作,取得的成绩,最后提出一些合理化的建议或者新的努力方向。
工作总结就是让上级知道你有什么贡献,体现你的工作价值所在。
所以应该写好几点:
1、你对岗位和工作上的认识2、具体你做了什么事
3、你如何用心工作,哪些事情是你动脑子去解决的。
就算没什么,也要写一些有难度的问题,你如何通过努力解决了
4、以后工作中你还需提高哪些能力或充实哪些知识
5、上级喜欢主动工作的人。
你分内的事情都要有所准备,即事前准备工作以下供你参考:
总结,就是把一个时间段的情况进行一次全面系统的总评价、总分析,分析成绩、不足、经验等。
㈤ 7款博弈论模型帮你尽快适应职场
文/宝木笑
呵呵,这个应该是大家最熟悉的博弈论模型了吧,说的就是俩哥们儿犯了不小的事儿,结果被警察抓了,这肯定得单独审讯啊。这个时候问题来啦:虽然这两哥们儿都知道,如果他俩都能保持沉默的话,警方无法给他们定罪。但英明神武的警察叔叔也明白这一点,所以就像咱们电影儿里看到的那样,阿sir会很江湖地分别对俩人说:如果告发同伙,那么就可以无罪释放,还能得到一笔奖金,被告发的哥们儿会被按照最重的罪来判,还要罚款,作为对告发者的奖赏。博弈论最好看的地方,我觉得不是结论,而是中间逻辑推理的过程,就像这个问题。俩哥们一定会各自做激烈的思想斗争,比如其中那个叫大A的哥们儿,他马上意识到同伙不是傻子,不管自己沉默或者背叛,同伙都会觉得他会选择背叛。所以大A最后的结论是,唯一理性的选择就是背叛同伙,因为如果他的同伙笨得保持沉默,那么他就会是那个带奖出狱的幸运儿。而如果他的同伙也根据这个逻辑向警方交代了,那也没关系,大A反正也得服刑,起码他不必在这之上再被罚款。所以结果就是,这俩哥们按照最科学的逻辑得到了最糟糕的结果——一起玩儿完。
这个模型一定要辩证地看待,慎重地使用,但很遗憾,大部分职场新人都是读了之后马上做恍然大悟状,然后就直接拿来就用,遇到事情就秉承“人不为己天诛地灭”的准则,并将此模型作为科学证据,刚到单位人还没认全,就开始腹黑起来,而且还为自己的小聪明沾沾自喜。十来年了,我看到这样的新人不少,但能最后有好结果的不多。难道是书错了?如果单单从读书和运用的角度说,那就是光贪图一年100本儿的数量了,没有把书读细读深,“囚徒困境”只是一个单次博弈模型,而你和你的同事、同学基本上都是多次博弈的环境,所以条件不符合,不适用啊,呵呵。那这个模型到底该如何用呢?请接着看第二款模型。
“囚徒困境”这个模型告诉我们:出来混,要晓得人心隔肚皮,别期望同事都是“圣母心”,自私不但是人的本性流露,更是人们不得不面对的逻辑必然,防人之心不可无。
上面说到“囚徒困境”这个模型不能简单用到同事之间,因为那是个单次博弈的极端情况,有网友曾问过我,说刚上班儿,既想和同事们交好,又不想被人看做软柿子,咋办?当时宝叔就推荐了这个模型,“以牙还牙”是一个用于博弈论的重复囚徒困境非常有效的策略,这个策略在开局时选择合作,以后则模仿对手在上一期的行动。
在使用这个模型的时候要注意三点:一是以牙还牙者开始一定采取合作态度,不会背叛对方,别上来就腹黑;二是遭到对方背叛,以牙还牙者一定要坚决还击作出报复,别软弱和犹豫;三是当对方停止背叛,以牙还牙者会原谅对方,继续合作,别得理不饶人,你不是在家里和爹妈吵架,你是到社会上给自己挣口粮哒。
“以牙还牙”这个模型告诉我们:出来混,一味睚眦必报和一味委曲求全,都是扯淡,要能打能拉,高手都是不先出手哒,但高手出手并不是为了“伤”,而是为了“和”,这个拳脚套路有点儿像太极。
猪圈里有两头猪,一头大猪,一头小猪,猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。最后的结果是:小猪将选择舒舒服服地等在食槽边,而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物,对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,虽然明知小猪是不会去踩动踏板的,但自己亲自去踩踏板总比不踩强吧,所以只好每次都去踩了。
哎,个人觉得读博弈论和读哲学类的书一样,一定要多想一步,否则毁你三观跟玩儿似的,比如这个智猪模型,一般咱们看到这个模型的第一反应是啥?反正我第一次看到这个模型就觉得很泄气。别跟我说什么改变规则,科学设置往返距离神马的,你不是谢耳朵,也不是马云,这里不是生活大爆炸,也不会有什么阿里巴巴,咱只是普普通通的小老百姓,我们无力改变规则,我们很可能就是那只可悲的大猪,每天在公司里做加班狗,但有的人却从不加班,活得那叫一个潇洒,我们在深夜的柜式复印机前泪流满面,仰天长啸:啊!主啊!救救俺吧!这都特么啥狗日的公司啊!太特么不公平啦!我太阳!我太阳!我太阳啊!
没错,初入职场,我们会碰到无数那样潇洒的“小猪”,他们总能分分钟就把我们的心情搞坏,分分钟就能把我们昨天恶补了一晚上的鸡汤搞成麻辣烫。但如果经过冷静的权衡,你觉得现在这份工作能带给你的,远比那些气人的“小猪”要多,那你一定要记得每天去公司的路上都复习一下自己的权衡,任劳容易任怨难,说的就是咱们啊。
那么,也许有人会问,那我直接去做那个充满了“智慧”的小猪多舒服啊,呵呵,如果你在公司时间稍微久一些,你就会发现那些貌似非常“智慧”的小猪,其实多数不是靠的自己的智商(稍微有点儿智商的还能让你这样的新人恨的牙根儿痒痒啊?呵呵),而是靠一种“势”,这种“势”要么是背景深厚,要么是人脉通天,反正是我们现在还不拥有的,所以小猪自己最清楚,靠山硬才能有底气耍小聪明,那些自己啥底子也没有,就去做小猪的,好像都被老板做了“烤乳猪”。
“智猪博弈”这个模型告诉我们:出来混,对于普通百姓家的孩子来说,不是想着怎么去做那只舒服的小猪,而是告诉我们要尽快学会宏观的权衡,如果这份工作值得你去做忍气奔波的大猪,那么从理论角度告诉自己别和小猪一般见识,活下去最重要。
有三个枪手,甲的命中率是80%,乙是60%,丙是40%,他们同时举枪瞄准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,谁活下来的可能性最大?可能大家都知道结局,没错,是枪法最不准的阿丙活下来啦,呵呵。道理也简单,甲会打乙,乙会打甲,而我们的阿丙也会打甲,因为甲牛逼啊,大家都觉得甲对大伙儿构成了威胁。另外,如果三个人轮流开枪,甲先开枪的话,还是会先打乙,如果乙被打死了,则下一个开枪的就是阿丙,那么甲生存的概率为60%,而阿丙依然是100%(他开过枪后甲没有子弹了,汗……);如果打不死乙,则下一轮在乙开枪的时候一定会全力回击,甲的生存率为40%,不管是否打死甲,第三轮甲乙俩哥们儿的命都攥在我们阿丙的手里了。呵呵,如果必须由我们的阿丙先开枪呢?答案是胡乱开一枪,只要不针对甲乙任何一人即可,因为当阿丙开枪完毕,甲乙还是会陷入互掐的困境。
我们刚到一个公司,最喜欢干的事儿是啥,拼命证明自己呗,这是人之常情,但却不是战略最优,人家原来的大神还杀的难解难分呐,你突然半路蹦出来吓大家一跳,人家互相看看,只能先把手头的事儿先放一放,先料理了你再说。
“枪手搏命”这个模型告诉我们:出来混,保护自己是第一位,出人头地次之,满足虚荣心最忌,虎行似病,鹰立似睡,模型不是让我们去做那个阿丙,而是让我们懂得如何去做一个更加牛掰的枪手甲。
两个小孩怎么分蛋糕?大家都是成年人啦,这里就不说什么一个分,一个选了,直接介绍分蛋糕的进阶模型,即时间成本的加入,将使得分配变得复杂化,比如两个小孩儿都是古灵精怪,都在你来我往地寻求利益最大化和方案最优,双方不能及时达成一致,然后就没有然后了,因为蛋糕在融化,等俩小孩儿满意了,黄瓜菜都凉了。
如果你是个新人,但也已经工作一段时间了,你可能有时会遇到三个和尚没水喝的尴尬,或者是你的科室,或者是你的团队,总之你总有一天会直面一个小肚鸡肠的拍档,而且这厮每次都仿佛革命烈士转世,为了少干一点儿活儿,这货无所畏惧,宁可玉石俱焚,也绝不向你妥协。你这个气啊,丫看姑奶奶好欺负是不是?老娘还不伺候了呢!看谁耗得过谁!呵呵,这个分蛋糕的模型就是给你设计的,前提是这个工作对你很重要,你想自己闯出点儿名堂,让家里老人放心,那结果只能是——可别让蛋糕化了啊!你放心好了,人在做,天看不看先不说,周围的人和你的上司一定会看到的。
“分蛋糕模型”告诉我们:出来混,千万别和犟种一般见识,否则,时间久了你就会变成自己当初讨厌的样子,凡是有大局观的新人进步一定最快,实在点儿说大局观就是你的未来,你要是一个真的有抱负的人,你就会渐渐悟到其实怎么分蛋糕并不重要,重要的是你的上司会看到你每次是怎么分的蛋糕。
屋子里有三个脸脏的人,但他们都不知道自己的脸脏,他们被要求不能对话,这时候,一哥们儿从屋外走进来,对他们说:“你们至少有一个人的脸是脏的。”屋子里的仨人听完之后,相互看了看,没有任何反应,因为他们都看到别人脸脏,以为说的不是自己。外边来的哥们儿见状,又补充了一句:“你们不知道吗?”听完这话,三人又相互打量起来,突然间,他们同时意识到自己的脸是脏的,于是三个人的脸一下子都红了。推理过程是这样滴:“至少有一个人”脸脏,也就是说如果看到别人的脸是脏的,这句话就可以成立,而当第二句指的是“你们”时,就意味着脸脏的人至少是两个。如果只有两个人脏脸,但是我看到另外两个人的脸是脏的,假设我的脸是干净的,他们任何一个在看到我的脸是干净的时,再看到另一个人脸脏,就会意识到自己的脸脏,那么他的脸应该会红,但是这样的情形没有发生,情况就只有一种了:三个人的脸都是脏的。呵呵,这就是大名鼎鼎的“共同认识”,也叫“共同认知”,当某种局面被打破后,人们才会认识到原来自己也是如此,而且每个人都知道别人是如此的“共同认识”。
职场新人有的时候会走两个极端,要么是妄自菲薄,觉得自己什么都不行,要么是妄自尊大,看什么都不顺眼,这两年也不知为什么,后者越来越多。危险啊,如果前面5种模型都是技术层面的讨论的话,那么从第6个模型开始就是内涵层面的引申了。我们往往都是嘴上最谦虚,最低调,而我们的内心则充满了腹诽和鄙夷,我们都把这些归结为我们都是很自我的人,不愿意与世俗同流合污,呵呵,这个模型给我们上了生动一课,告诉我们也许自己并不是自己想象得那么特立独行和冰清玉洁,我们只是一个被惯坏了的孩子。
“脏脸博弈”告诉我们:出来混,自己的心千万别从一开始就走歪了,初期症状是各种看不惯,总把“活出自我”挂嘴边,中期症状是刚愎自用,听不得家人和其他人的任何批评意见,晚期症状是文过饰非,怨天尤人,让周围的人特别是自己的家人苦不堪言。朋友,与其装样子去了解世界,还不如多了解一些自我。
当一个人有一只表时,可以知道现在是几点钟,而当有两只表时,却不能告诉一个人更准确的时间,反而会让看表的人失去对准确时间的信心。这个模型建议选择其中较信赖的一只,尽力校准它,并以此作为你的标准,听从它的指引行事。
我们刚入职场的时候,会遇到价值观的大杂烩,不同的人,不同的事,每天都在围绕着我们,今天我们看到张三牛掰,明天我们听说李四是大神,我们一会儿觉得要韬光养晦,一会儿又觉得要锋芒毕露,我们一会儿觉得要腹黑到死,一会儿又觉得要返璞归真。我们被价值观和方法论的好多“手表”弄得无所是从,不知自己该信仰哪一个,还有一部分人在外部环境压力或者别人的误导下,违心选择了自己并不喜欢的路,为此郁郁寡欢。最后一款模型,我给大家推荐手表定律,这里有我深深的祝福,希望大家都能找准属于自己的那块儿“手表”。
“手表定律”告诉我们:出来混,善于调整自己的心是重要的,但涉及到价值观的事儿一定要慎重,尤其不要幻想可以同时拥有不同的价值观,选你所爱,爱你所选,无论结果如何,请务必不要回头。
今天介绍的7款模型肯定不能囊括所有的经典博弈论模型,至于到底哪些更应该上榜,也是仁者见仁,智者见智,但我仍记得古龙老爷子在《七种武器》系列中表达的意思:“其实,最厉害的武器是人心。”没错,不管职场的招数如何天花乱坠,关键是我们自己的心脏是否坚强有力,不忘初心,坚守本心,方得始终。
此文与诸君共勉。
-END-
㈥ 讨价还价的技巧是什么
在前面的论述中,我们探讨了商场博弈的优势策略与劣势策略。现在,让我们来看看具体的商场博弈在生活中的运用。比如,在商场讨价还价时,经常会运用到着名的最后通牒博弈。
有一家外企招聘员工面试时出了这样一道题:要求应聘者把一盒蛋糕切成八份,分给八个人,但蛋糕盒里还必须留有一份。面对这样的怪题,有些应聘者绞尽脑汁也无法完成;而有些应聘者却感到此题很简单,把切成的八份蛋糕先拿出七份分给七个人,剩下的一份连蛋糕盒一起分给第八个人。应聘者的创造性思维能力从这道题中就显而易见了。
分蛋糕的故事在很多领域都有应用。无论在日常生活、商界还是在国际政坛,有关各方经常需要讨价还价或者评判对总收益如何分配,这个总收益其实就是一块大“蛋糕”。这块大“蛋糕”如何分配呢?我们知道最可能实现一半对一半的公平分配的方案,是让一方把蛋糕切成两份,而让另一方先挑选。在这种制度设置之下,如果切得不公平,得益的必定是先挑选的一方,所以负责切蛋糕的一方就得把蛋糕切得公平,这就是最后通牒博弈。
但是,这个方案极有可能是无法保证公平的,因为人们容易想象切蛋糕的一方可能技术不老到或不小心切得不一样大,从而不切蛋糕的一方得到比较大的一半的机会增加。按照这样的想象,谁都不愿意做切蛋糕的一方。虽然双方都希望对方切、自己先挑,但是真正僵持的时间不会太长,因为僵持时间的损失很快就会比坚持不切而挑可能得到的好处大。也就是说,僵持的结果会得不偿失,会出现收益缩水的现象。
在现实生活中,收益缩水的方式非常复杂,不同情况下有不同的速度。很可能你讨价还价如何分割的是一个冰激凌蛋糕,在一边争吵怎么分配时,蛋糕已经在那边开始融化了。因此,我们在生活中经常会看到这样的现象:桌子上放了一个冰激凌蛋糕,小娟向小明提议应该如此这般分配。假如小明同意,他们就会按照成立的契约分享这个蛋糕;假如小明不同意,双方持续争执,蛋糕将完全融化,谁也得不到。
现在,小娟处于一个有利的地位:她使小明面临有所收获和一无所获的选择。即便她提出自己独吞整个蛋糕,只让小明在她吃完之后舔一舔切蛋糕的餐刀,小明的选择也只能是接受,否则他什么也得不到。在这样的游戏规则之下,小明一定不满足只能分到1/9的蛋糕,他一定要求再次分配。在这种情况下,分蛋糕的博弈就不再是一次性博弈。
事实上,当分蛋糕博弈成为一个“动态博弈”时,就形成一个讨价还价博弈的基本模型。在经济生活中,不管是小到日常的商品买卖还是大到国际贸易乃至重大政治谈判,都存在着讨价还价的问题。
有一个这样的故事:某个穷困的书生A为了维持生计,要把一幅字画卖给一个财主B。书生A认为这幅字画至少值200两银子,而财主认为这幅字画最多只值300两银子,但双方都对此价格没有公开。从这个角度看,如果能顺利成交,那么字画的成交价格会在200~300两银子。如果把这个交易的过程简化为这样:由B开价,而A选择成交或还价。这时,如果B同意A的还价,交易顺利结束;如果B不接受,那么交易就结束了,买卖也就没有做成。
这是一个很简单的两阶段动态博弈的问题,应该从动态博弈问题的倒推法原理来分析这个讨价还价的过程。由于财主B认为这幅字画最多值300两,因此,只要A的还价不超过300两银子,财主B就会选择接受还价条件。但是,再从第一轮的博弈情况来看,很显然,A会拒绝由B开出的任何低于300两银子的价格。如果说B开价290两银子购买字画,A在这一轮同意的话,就只能得到290两;如果A不接受这个价格,那么就有可能在第二轮博弈中提高到299两银子,B仍然会购买此幅字画。从人类的不满足心来看,显然A会选择还价。
在这个例子中,如果财主B先开价,书生A后还价,结果卖方A可以获得最大收益,这正是一种后出价的“后发优势”。这个优势属于分蛋糕动态博弈中最后提出条件的人——几乎霸占整个蛋糕。
事实上,如果财主B懂得博弈论,他可以改变策略,要么后出价,要么是先出价但是不允许A讨价还价,如果一次性出价A不答应,就坚决不会再继续谈判来购买A的字画。这个时候,只要B的出价略高于200两银子,A一定会将字画卖于B。因为200两银子已经超出了A的心理价位,一旦不成交,那一文钱也拿不到,只能继续受冻挨饿。
这个博弈理论已经证明,当谈判的多阶段博弈是单数阶段时,先开价者具有“先发优势”,而双数阶段时,后开价者具有“后发优势”。这在商场竞争中是非常常见的现象:非常急切想买到物品的买方往往要以高一些的价格购得所需之物;急切于推销的销售人员往往是以较低的价格卖出自己所销售的商品。正是这样,富有购物经验的人买东西、逛商场时总是不紧不慢,即使内心非常想买下某种物品都不会在销售员面前表现出来;而富有销售经验的店员们总是会劝说顾客,说“这件衣服卖得很好,这是最后一件”之类的推销语。
商场中的讨价还价,正如书生A与财主B之间的卖与买一样,都是一个博弈的过程,如果能够运用博弈的理论,一定能够成为胜出的一方。
?
㈦ 博弈论简单入门 基本概念解释以及具体案例分析
博弈论也也 称为 对策论 或 赛局理论 ,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构,所以它们是同一个游戏的特例。其中一个着名有趣的应用例子是囚徒困境。
具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
约翰·冯·诺伊曼是个超级跨界牛人——他同时在“数学、物理学、经济学、计算机”等多个领域作出了划时代的贡献,并留下一大堆以他命名的东西,比如程序员应该都听说过“冯诺依曼体系”,比如数学领域有“冯诺依曼代数、冯诺依曼遍历定理……”,理论物理领域有“冯诺依曼量子测量、冯诺依曼熵、冯诺依曼方程……”。另外还有很多东西,虽没有以他命名,也是他先搞出来的,比如:量子力学的公理化表述、希尔伯特第5问题、连续几何(其空间维数不是整数)、蒙特卡洛方法、归并排序算法1944年,他与奥斯卡·摩根斯坦合作发表了《博弈论与经济行为》一举奠定博弈论体系的基础,所以他也被称作博弈论之父。
合作博弈 & 非合作博弈
不论是合作博弈与非合作博弈,在博弈过程中都可能会出现合作的现象。差别在于——对于合作博弈,存在某种外部约束力,使得背叛的行为会受到这种外部约束力的惩罚。对于非合作博弈,没有上述这种外部约束力,对背叛的惩罚只能依靠博弈过程的其它参与者。通常所说的博弈大都指非合作博弈。
同时博弈 & 顺序博弈
同时博弈有时也称作静态博弈,指的是——博弈的任何一个参与者在选择自己的行为之前,并不知道其它参与者的行为信息。顺序博弈有时也称作动态博弈。在这类博弈中,参与者的动作有时间上的先后,并且后一个执行动作的博弈者可以看到其他博弈者之前的动作,然后根据别人的动作,思考自己的行为。
零和博弈 & 非零和博弈
零和博弈这个名称具有误导性,使得很多人以为各方的收益总和为零。零和博弈指的是——在博弈结束之后,参与各方的利益总和为常量(可以是零,也可以是正值或负值)。非零和博弈指的是——在博弈结束之后,参与各方的利益总和为变量。所以这类博弈有时候称为变和博弈。对于这类博弈,在某些情况下可能会让参与各方的利益总和变大,从而使得各方存在合作的可能性。
非重复博弈 & 重复博弈
非重复博弈有时也称作单次博弈;相应的,重复博弈也被称作多次博弈。重复博弈还可以进一步细分为有限重复博弈与无限重复博弈。更严谨的说法是:有限重复博弈——重复次数确定的博弈,无限重复博弈——重复次数不确定的博弈
收益矩阵 & 决策树
这两个概念都是为了更直观地描述博弈过程,并帮你看清各方的利弊得失。收益矩阵通常用来描述静态博弈(同时博弈)而且一般是用来描述双人的静态博弈,更多人的静态博弈也可以用收益矩阵表述,但画起来会复杂很多;由于动态博弈(顺序博弈)比较复杂,通常不用“收益矩阵”描述。决策树既可以用来描述静态博弈,也可以用来描述动态博弈。
策略 & 策略集合
以象棋为例,完成一局需要经历很多个步骤,对每个步骤,你都有多个决策选项(要走哪个棋子,走到哪)。而策略指的是——从第一步到最后一步的所有决策选项的总和。你可以把策略通俗理解为某种算法 指导思想,它指导你从第一步走到最后一步。所有可能的策略,构成了策略集合。
有限策略集合 & 无限策略集合
石头剪刀布是典型的有限策略集合,该集合只有3个元素。为了说明无限策略集合这种集合,举个分蛋糕博弈的例子,其中一人先把蛋糕随意分为两块,然后另一个人先挑选其中一块。对于负责分蛋糕的人而言,其策略集合是无穷大。很多人凭直觉会认为:具有无限策略集合的博弈比有限策略集合的博弈更复杂。其实不然,围棋虽然很复杂,但其策略集合依然是有限滴。作为对比,分蛋糕博弈比围棋简单多了,但分蛋糕博弈反而具有无限的策略集合。
纯策略 & 混合策略
在实际博弈时,如果你总是固定选择策略集合中的某一个策略,这种情况称之为纯策略。如果你在博弈时,总是随机选择策略集合中的某几个策略,这种情况称之为混合策略。如果某个混合策略包含了策略集合中的每一个元素,称之为完全混合策略。
支配策略
假设你有两个策略 A & B。如果在任何情况下,A 都比 B 更优,称作 A 支配 B 或者 B 被 A 支配。支配策略又称优势策略。如果某个策略能够支配所有其它策略,那么它就是支配策略。通俗地说,不论你的对手采用何种策略,你的支配策略总是比你的其它策略有更好的结果。有时候会把支配策略进一步细分为强支配和弱支配。对于前者,它在任何情况下都比其它策略更好;对于后者,它在某些情况下比其它策略更好,某些情况下与其它策略一样好。制胜策略也称必胜策略,它通常只用于零和博弈,指的是——只要你采用这个策略,不论对方如何应对你总是赢。制胜策略肯定是支配策略;但支配策略不一定是制胜策略。
最小最大定理
比较绕口的陈述是:最小化最大损失,更通俗的表述是在最坏情况下最小化损失。该定理及算法最早由冯·诺依曼在《博弈论与经济行为》一书中提出。
反向归纳法 & 概念该方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每个决策,以及对方在应对你的决策时,会采用何种决策,这个思维过程类似于决策树的展开,这个展开过程要一直推演到最后一步,也就是决策树的叶子节点。此时你就可以看清双方在最后一步各自的最优选择;然后再反向回推到第一步。当你要用反向归纳进行展望与推理,前提是——你要获得充分的信息;或者说,如果某个博弈者所知的信息不够充分,就无法运用该方法。
问题描述
5个海盗抢了100个金币,讨论如何分赃。这5个海盗有等级高低(不妨假设 A>B>C>D>E)。先由等级最高的海盗提出分赃方案,然后投票。如果半数以上(含半数)同意,就按这个方案分,游戏结束;如果同意的不到半数,把提出方案的海盗扔进海里喂鲨鱼,然后由次一等级的海盗提出新的方案;以此类推。每个海盗的特点是:足够理性(追求个人利益最大化)并且知道别人也足够理性;足够残忍(在个人利益等同的情况下,倾向于把更多同伴扔进海里)。
策略分析
为了进行反向推理,假设最后只剩下2个海盗(D & E)。此时的投票肯定过半(D 肯定投票赞同自己的方案)。在这种局面下,D 可以采用最极端的方案——自己全拿100个金币,E 则一个也拿不到。
现在回推一步。当只剩下3个海盗(C、D、E),由 C 提出方案。他只需要分1个金币给 E,E 就会投票支持(否则的话,等到由 D 来提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99个金币,E 拿1个金币。
再往前一步。只剩下4个海盗(B、C、D、E),B 提方案,他当然也能想到刚才那些推理。他只需给 D 1个金币,D 就会支持他(如果等到 C 来提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同样能得到半数支持。
基于上述分析,再看 A 的方案,就很显然了——A:98,B:0,C:1,D:0,E。
美国数学家纳什在1951年发表了一篇小论文名叫《非合作博弈》,其中提出了纳什均衡的概念并给出了相应的基于不动点定理数学证明。通俗地说是指在多人的非合作博弈中,如果每个博弈者都无法单方面改善自己的境地,此时的局面称作纳什均衡。冯·诺伊曼已经在《博弈论与经济行为》一书中证明了:零和博弈必定存在这样的均衡点。纳什的贡献在于他从零和博弈推广到非零和博弈,并证明了:这样的均衡点依然存在。当博弈的局面处于纳什均衡,此时的系统是稳定滴,如果每个博弈者都足够理性,他们都不愿意主动改变当前的策略。
换位思考
前面聊的很多博弈相关技能都依赖于换位思考这个能力,你需要站在对手的角度进行思考,才能看清局面,从而更好地选择自己的策略。一般来说,那些换位思考能力越强的人,也越善于进行强批判思维。
理性人假设
微观经济学在进行数学建模的时候,通常都会引入一个理性人假设,假定市场的行为主体是充分理性,此处的充分理性还隐含着掌握充分的信息,引入这个假设是为了数学建模的需要。对任何一个国家大多数人都很平庸,他们的共同点之一是非常不理性。充分理性并且掌握了充分信息的个人,那也绝对是凤毛麟角,而理性人假设竟然设定市场的行为主体全都是充分理性的。有了博弈论之后,这个非常扯蛋的理性人假设就可以丢到垃圾桶里。
旧的经济学理论(理性人的解释)会说——所有公司的老板都充分理性,也掌握了充分的信息,知道应该生产何种商品,才能满足市场需求。新的经济学理论(博弈论的解释)会说——公司的老板既有优秀的,也有平庸的。平庸公司生产的商品没人要,自然会亏损并倒闭。随着时间的推移,经过自然选择,活下来的公司当然是那些聪明的。
装疯策略
理性的博弈者把自己伪装成非理性的博弈者,这么干可以获得某种虚张声势的唬人效果。对这种手法,俺称之为装疯策略。
经济学
谈博弈论的影响,当然首先要谈它对经济学的影响。有了博弈论,就不再需要那个扯蛋的理性人假设了,这是博弈论诞生后对微观经济的重大影响,还有很多其它的影响。比如说:博弈论诞生前传统的微观经济学以供给需求来建立价格的数学模型。这个模型只考虑了供应量需求量的变化对价格的影响,而完全不考虑供给双方的力量对比。如果供给双方中,一方变得强势或另一方变得弱势。即使供应量与需求量都维持不变,价格也会发生变动,朝着对强势方有利的方向移动。
生物学
生物学受博弈论影响最大的分支估计是演化生物学,也就是的进化论。借助博弈论的研究成果,演化生物学家可以更好地建立物种演化的数学模型。
㈧ 微信好友删除了头像换了能看见吗
这个可以看到的,你删除了对方,你这里就没有对方的任何记录了,但是对于对方,只是不能跟你进行聊天,不能看你朋友圈,但是你的微信仍然在对方的通信录里,你的头像的变化对方也能看到,另外包括你的微信号对方也能看到。
㈨ 《博弈论与生活》|总有一款适合你
本周听了一本新书《博弈论与生活》,与其他讲博弈论的书相比,这本书没有一个数学公式,并不枯燥,作者诙谐幽默,案例充足,是一本博弈论入门的好书。
博弈论是20世纪40年代被提出,最典型的例子就是兄弟两个人分蛋糕,争执不下,后来爸爸说哥哥负责切,弟弟负责先选。这么一来,哥哥会尽可能的将蛋糕切的一样大。为什么会有这样的矛盾,应该说从本质上,人都是自私的。
博弈论有七大困境,你日常生活中遇到的矛盾,一定可以从这七个中找出一个。
第一:囚徒困境
警察抓到两个犯人,分开进行审讯。有三种情况,1. 两个人都不交代则各判2年。2. 一个交代,另一个不交代,则交代的无罪释放,不交代的盼10年。3. 两个都交代则各判4年。
这个困境的最优解是两个人都不交代各判2年。但现实情况却是第三个,这里边有个概念叫做纳什均衡。要想达到最优解,就是各判2年,条件是非常苛刻的,必须要2人达成某种协议,还要有条件促使对方不会变卦。这在分开审讯的时候,对2者的考验是巨大的。
第二:公地困境
公地困境是升级版的囚徒困境。
第三:搭便车困境
这个在我们生活中经常会遇到。形象一点的解释就是,你开车上班,和住同一小区的同事刚好碰见了,你出于好意,让他打了个便车。后来同事会要求你每天都要带上他,如果你拒绝的话,就说明你很小气。
抽象一点的理解就是没有付出的人享受付出人的成果,最后是的付出的人的利益收到损害。想一想你身边或自己是否存在搭便车困境呢。
第四:懦夫博弈
类似于过独木桥,双方各不相让,最后两败俱伤。
解决办法,第一个是笑一笑,记得之前看《解惑》这本书,一个看似无解的问题,不能在在矛盾中去寻找解决办法,应该跳出矛盾,境界高了,问题就自然而然不成为问题了。笑一笑的意思是说,自己心态上一个档次,做一个好人,不去计较。孔子说:求仁得仁,何怨乎? 你生来就是愿意做一个好人的,现在你做到了,为何要抱怨呢? 反过来,你抱怨是说你不想做一个好人吗? 老夫子还是厉害啊 。
第二个是鹰鸽搭配,就是强硬和柔软搭配着来,对敌人对打的威慑在于敌人猜不透你。
第五:志愿者困境
意思是你遇到一个问题,第一站出来的人会死,但没有人站出来大家都会死。
比如你路上遇到危险,喊的作用不是很大,受制于志愿者困境,大家都在相互观望,最有用的是直接抱着一个人,求他救命,这个最有效。
第六:两性困境
就是两个选择都可以,无所谓。
最厉害的例子就是过年去谁家,就我自己的经验,感觉怎么计划都不行,这里最优答案就是投硬币,大家听天由命。
第七:猎鹿问题
3个人去打猎,今天只有打到一只鹿3家人才都可以不挨饿,但前提是猎鹿需要3个人通力合作,少一个人都不行。但是其中一个人在去的路上看到一条兔子,这个兔子他一人就能搞定,搞定了他自己一家不会挨饿。
这就是这本书主要讲的七大困境,每个困境都会有一些指导性的建议。现实生活中,很多时候博弈不是双方,而是多方博弈,多方博弈的最优解是让他人先博弈,自己守株待兔。举个例子,3个人互相射击,命中率高的人最后射击,命中率低的人第一个射击。A100%命中率,B50%命中率,C30%命中率,问C第一枪射谁,活下来的概率高一些?最佳答案是C放弃机会,让给B来选择。
这本书最后用孔子的以直报怨,以德报德来告诉我们,在处理平时的矛盾中,要做一个有原则,有底线的好人。以后有空了,回头在来细细品读这本书。
雪堂-儒家国学经典 | 雪堂-道家国学经典
幸福猪的雪堂书屋 - 连载
会员通道
㈩ 博弈论的表格怎样做
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。
博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。
博弈分为:
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
例:囚徒困境
在博弈论中,含有占优战略均衡的一个着名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。
单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。