㈠ 1 _ 分蛋糕^的動態博弈 桌子上放了一個冰淇淋蛋糕,小娟和小明討論如何在
如果兩個人分蛋糕的話,涉及到的最基本就是平均分配,怎麼可以把蛋糕平均分給兩個人,那麼我們就要從蛋糕的中間取一條直線平均分成兩份,每人要一人一份才行,不能分的過大或者是過小,因為過大和過小的話,那都不屬於是平均分配了。
事實上,對於兩個人分蛋糕的情況,經典的你來分我來選」的方法仍然是非常有效的,即使雙方對蛋糕價值的計算方法不一致也沒關系。首先,由其中一人執刀,把蛋糕切分成兩塊,然後,另一個人選出他自己更想要的那塊,剩下的那塊就留給第一個人。由於分蛋糕的人事先不知道選蛋糕的人會選擇哪一塊,為了保證自己的利益,他必須(按照自己的標准)把蛋糕分成均等的兩塊。
分蛋糕游戲怎麼玩,可以這樣玩,首先把蛋糕蓋起來,然後,可以幾個人劃拳,贏了的,可以分一塊蛋糕,然後繼續這樣玩,就好了。
㈡ 誰知道《博弈論的詭計》啊
國內最好的一本關於博弈論的普及書,2007和2008年連續兩年的「中國圖書榜中榜」科普類的第一名。
書評《博弈論的詭計》
小磨咖啡 / 挑燈看劍May 7th, 2008聿之
研習一下博弈論,已然是一個夙願了。博弈論好歹也是我大學之後聽聞的第一個偉大的經濟學理論了。倒不是經濟學的課堂,而是思修課上放映的《美麗心靈》。這一部當年擊敗《指環王》並維護了奧斯卡「良知」的影片,確乎給我們這些初入經濟學的小生,影響是莫大的。而博弈論更是一些人即將並一直熱衷的一個分析工具。
出納什和博弈本身的神奇經歷,一直想有所了解。不過,作為一門經過嚴謹數學證明的理論,要深入其中,卻也必定是艱難的。在圖書館轉了一圈,在兩分類中發現博弈論的蹤跡:經管類與數學類。無論哪一種,都是些許專著,有那麼點令人頭疼的專著。幸好,倒是在數學類的夾縫中瞧見一本《博弈論的詭計》的白話書,對於只知囚徒困境以及以牙還牙的我對說,倒確是一本不錯的書。
《博弈論的詭計》提要與思考
囚徒困境:這個簡單的例子,幾乎是博弈論的代名詞。兩個基於「坦白從寬,抗拒從嚴」審訊的囚徒,從理性的角度出發,會產生怎樣的結局?結果若是,從個人理性並追求個人利益最大化,那麼二人皆坦白,也就是背叛。這在四種策略中並不佔優,那為什麼不採用集體最有策略呢而合作。很簡單集體的優化,必然侵害個人利益的最大化。當然這一切前提是理性假設,也就是著名的經濟人假設:經濟學中的人都是「小人」(管理學則認為人是「君子」,有意思而有道理的比喻)。破解這一困境的途徑則是打破信息孤立,而執法者的反制則是維持孤立或者加強威脅。無論背叛還是合作,誰在這裡面堅持到最後,誰將取勝。
重復博弈:囚徒困境,砸了傳統經濟學的場子。因為個人的自利行為,並不一定導致集體利益的最大化,「看不見的手」拉不住,人類向墮落之城下滑的趨勢,難道這真是一個悲哀?索性並非如此,撇去博弈論的理性假設不說。博弈論者很快發現囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重復,合作將到來。因為,未來的收益將左右目前的決策。
以牙還牙:重復的博弈理論上導致了合作的產生,但是誰也不能保證合作的繼續,因為之前已經說過,合作的代價是建立在損害個人利益基礎之上的。如果個人放棄未來收益或當前背叛收益大於未來收益,背叛的風險仍然存在。那麼在重復博弈中怎樣的策略才是最優。若干睿智而復雜在經過計算機中PK之後,極其原始的「以牙換牙」策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至於人們在短暫的欣喜之後,發現這把太阿指之劍倒持的可怕,一旦重復鏈條中出現一次(也許不經意的)背叛,那據此原則行事的博弈將永無止境的背叛下去,個人利益極度膨脹的同時,集體利益無限衰微。幸好,這個世界不是模型,也不是如此簡單。很多時候,我們不必以牙還牙,第三方的規范:道德與法律就是我們的假牙,他們更加有利、有理、有節。
人質困境:一場憋屈的博弈。搶打出頭鳥,人質聯合固然可以制服歹徒,但是誰願出頭。這一點給了無數處於劫持者地位的一方以機會,類似於秦的遠交近攻、各個擊破的策略,將最終全盤贏下。人質可有反制的策略,當然有,不過艱難至極。人質可以選擇沉默,這樣他有一定時間苟延殘喘;或者聯合劫持者對付人質,結局還是取決於劫持者,萬一他過河拆橋怎麼辦;同時反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。這里是實力與勇氣的較量,而且實力暫居上風。
酒吧博弈:如果人人理性,那麼每一天到達酒吧的人數將是差不多正好的,但是人非聖賢,往往是有限理性的。第一次到酒吧的人多,那麼大多人人認為酒吧人太多,太擠。第二次決定的時候,參考前次而不去酒吧。少數去的人發現酒吧的人第二天很少,感覺很爽,第三次將繼續回來,並重新帶回許多人……循環就此開始。酒吧博弈一方面顯示,現實的博弈參與者,是極其有限理性的,其理性只前延後伸一小段。歷史數據只對計算機有用,對人,則不一定。
另一個方面,酒吧博弈指出,勝利者永遠只是少數。盡管酒吧存在調諧的可能,譬如發簡訊時時提醒,但成本恐怕太高。而在其他場合,少數派可能更加會設置種種障礙阻止後進者的上升。也就是說,我們的世界仍然是操弄在少數派的手中。不過,總算這個世界不是模型,少數派的道路到底還是有跡可循的。老練的將軍仍舊會在八卦迷陣中找到唯一的生門。若你想要,必須做一個更加老練的將軍。
槍手博弈:王者的悲哀。三人對槍自決,甲乙丙槍法優劣遞減。最後無奈而神奇的結局,將不取決於同時開槍還是先後開槍,最優良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這里,後發制人的弱勢者將勝出。以弱勝強,絕不是神話。
難道王者的命運就真如此不堪,呵,道別忘了每個理論模型都是有其前提的,擊破之中任何一個,王者仍將歸來。這就是先發優勢。假設這是一場類似CS的競技,優秀的槍手擊倒二號槍手,立刻獲得獎勵:盾牌。那麼三號槍手將陷入絕境。不過,不管怎樣,這個博弈模型,到底給了弱勢者一份希望。機會永遠存在。
獵鹿博弈:兩個獵人合作獵鹿獲得的收益將遠大於分別獵兔的收益,戰略聯盟將開始。這或許是件好事,不過有取決於最後獵獲的鹿——這一公共資源的分配,如果分配得當,整體的效率將增加。如果一方主導,另一方受損,那麼帕累托改善無法進行,合作可能終將破裂。
另外一個問題,更加大局的問題。合作的示範性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內將呈幾何級數增長。但是最後,確是生態失衡,鹿群滅群。短暫的繁華之後,獵人將再一次回歸於原始獵兔生活。盡管為了避免這一悲劇,人類還有最後的希望:制度經濟學的法寶——科斯定理以產權歸屬來解決外部經濟問題。但由於談判成本以及可行性,人類社會的公共悲劇仍將不斷上演。
智豬博弈:混沌之前最後的博弈。小豬和大豬住在豬圈的一邊(食槽在這里),開啟食物的開關在另一頭,誰去踩,誰喪失先機。結果怎樣?是小豬選擇「搭便車」,大豬勤跑。因為小豬無論跑還是停,大豬的最優策略都是策略都是去踩機關。不過在實際生活中。這里依舊存在兩種策略。
小豬的「搭便車」。大豬有的時候,自覺或不自覺地自封「俠之大者,為國為民」,並因此承受一些不能承受之重。《博弈論的詭計》指出美國戰後的行為極似大豬,戰後的美國竭力宣傳自己的普世價值觀,並深入到海外事務,甚至不惜重金協助小國防務。這樣小國不自覺地對大國進行了「剝削」。
大豬在擊破模型的一個假設之後,仍然有一個後發制人的機會。因為大豬和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那隻有一條豪賭的路子:龜兔賽跑式的豪賭,但願大豬打了個盹兒,他回來的時候,還能吃上一兩口,要不然真是賠了夫人又折兵了。據此,再也不難解釋為什麼很多人切齒的騰訊,毫無顧忌地跟風,做QQ旋風,做拍拍,做滔滔。因為不甘心的小豬早早把新技術研發的前期搞定了,大豬們只需要悄悄跟隨,適當的時候踢開擋路的,就可以了。
大豬在這里的後發制人和槍手博弈的後發並不一致,槍手後發是建立在他人惡斗的基礎上,大豬後發完全是以自身實力為基礎。而且大豬完全不必採取任何激進措施,只要跟隨就好。因為小豬獲勝的條件不是接近,還是距離。
警察與小偷:令人沮喪的博弈結局。警察和小偷各只有一個機會去巡查或者偷盜A地或B地。A地的價值大於B地,那麼警察應該為了保護價值大而一直保護A地嗎。博弈論認為當然不是,警察的合理策略應當是有傾向於A以一定概率的隨機巡查。這個概率就是:p=A地價值/AB地總價值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是,此時的小偷謀求的是,最小得手幾率的最大化。也就是說,警察的最優策略將把小偷的最差策略改良!這個便是馮·諾伊曼提出的「最小最大定律」。
我們必須再一次感謝這個不完美的世界,因為現實之中,類似的現象,對於一方仍然可以設法找到對手致命的規律性行動(當然必須考慮到對方是不是一個更加老練的獵手,故意放出的誘餌)。而保持自己的行動的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。
斗雞博弈:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為納什均衡已經給出了一勝一敗的最優策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經在戰場的強勢力很可能自覺的遵循納什均衡,當一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之於兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發動攻勢的時候,另一方同樣的後退。於是這樣的攻擊性行為開始變得「儀式化」,沒有人真正流血。這只不過是兩個巨頭玩弄的游戲,目的是警告後來者,想進來,那麼也得陪我們一起玩,可是你玩的起么?這正是百事的廣告,即使暗含挑釁也最多隻到「敢為中國紅」這樣的地步的原因。
協和謬誤:歐洲政府在大量投資協和飛機後,終於不能自拔。即使前景黯淡,也撐著面子投下去,非要走頭無路才放棄。而這時投入的成本已經全打水漂了。如果,發現不能繼續的時候,就果敢放手,損失會小得多。可是他們會、能這么做么?壯士斷腕,是何等的壯烈,卻也是何等的艱難!
沉沒成本很可能會延續人們無畏的堅持。已經沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的杠桿終將啟動。可惜他們在爬到足夠撬動杠桿的支點之前,已經窒息了。
協和謬誤,倒是給了人們半途而廢的理由,會不會有人擔心它的濫觴會左右一些本該堅持的目標?的確有這個可能,但是應該相信人們足夠理智,完全可以比較沉沒成本、機會成本與未來收益的關系。看清了的,必定會坦然地走出協和謬誤。
蜈蚣博弈:一場顛前倒後的博弈。蜈蚣博弈的機理是以最終的結果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結果。它的另一個好處,就是使得未來的計劃明晰化,是你不再徘徊。只可惜,很多時候,碌碌無為的我們並沒有看透迷局的眼睛。我們黑色的眼睛只習慣於黑夜。
蜈蚣博弈也有一個致命的悖論,仍舊是個人利益和集體利益的沖突,因為最後一次的背叛收益始終優於合作。可悲的是,這一次背叛將由於人性的理智,穿越時光隧道,回到原始的地點:人們將從開始就拒絕合作。還是感謝我們這個不完美的世界吧,事實上人們很少這樣做。當然合作到最後的也很少,這意味著,倒推法只在中間階段突然發生了作用,只不過誰也不能預測,中間一步在哪裡。在那裡,我們只有冀望信任、道德、良知等等。
分蛋糕博弈:兩個小孩怎麼分蛋糕?經典的故事,經典的解答:一個分,一個選。現實多如此,權利的合理分配將有效促進公平與效率。經營權與所有權的分置的確使得經濟更加活力。不過分蛋糕的進階模型卻強調了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現成本:蛋糕在融化。
時間稱本的加入,將使得分配變得復雜化。雙方如果不能及時達成交易,不僅集體的收益將減量,而且個體的收益也將減少。在此情況下,利用時間稱本以及威脅、承諾將對其中一方極其有利。顧客可能迫於情勢,必須盡快結束談判,這時賣方卻不慌不忙,故意拖延,顧客一方將不得不在價格上作出妥協。
顧客一方當然也有策略,它的策略就是貨比三家,要求承諾或威脅。這個前提是買方市場的存在。顧客還應當保護自己討價還價的能力,這就是顧客有權投訴商家。
鷹鴿博弈:這個博弈很多人等同於斗雞博弈。不過,斗雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。在只有鴿子一個苞谷場里,突然加入的鷹將大大獲益,並吸引同伴加入。但結果不是鷹將鴿逐出苞谷場,而是一定比例共存,因為鷹群增加一隻鷹的邊際收益趨零時(鷹群發生內斗),均衡將到來。
由此產生了ESS進化上的穩定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿後,再試圖加入的鷹將會被鷹群排擠。
進化上的穩定均衡最大的好處莫過於保持穩定。但問題在於形成強勢的路徑依賴,也就是勝出的不一定是最好的。因為最好的會被當作出頭鳥幹掉,這是個體的失敗,集團的勝利以及集體的止步不前。
臟臉博弈:恍然大悟的博弈。三個人在屋子裡,不許說話。美女進來說:你們當中至少一個人臉是臟的。三人環看,沒有反應。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什麼?因為美女後一句廢話點破天機,三個人都知道臟臉的存在,而且推測知道對方也知道了臟臉的存在(因為另兩人臉沒紅,說明他們看到臟臉了),而且知道對方知道自己已經想到上一步……循環開始,知識開始共同化,真相大白:三個人都是臟臉,所有人都臉紅了。
這就是共同知識的作用,它的作用顯得有點可怕的強大。幾乎是一招無影腿,殺人不見血。在檯面上的博弈之前,私下的算計已經置對手於死地。不過,很可能對方也預料到這一點,早也想到這一點,同時殺來。終於,形成雙死局面。
當然,現實雖然存在類似現象,不過共同知識更大的作用在於減少交易成本。因為某些規則人盡皆知,雙方只要各自依之行事就可以了。
信息均衡:很想然,信息的作用在博弈之中非常重要。將博弈論還原到現實,人們不再完全理性,信息存在不對稱,博弈就需要在搶占信息高地上作出努力。
信息不對稱,是一個很大的障礙。信息的不對稱會造成「逆向選擇」和「道德風險」,前者事前,後者事後。信息不對稱短期內對某一方會有利,但最終會破壞整個市場。於是有兩個解決策略。
信息傳遞:傳達你的正面的信息的策略,也就是說吸引顧客走到你的櫃檯面前。它的要點是保持有效、減低成本。
信息甄別:誘導對手暴露其私下擁有的真實信息。就是給顧客一個放大鏡,保證顧客不會走到其他櫃台去。這種策略顯然更加有效,不過風險也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎麼辦?
再介紹一篇評論:王春永《博弈論的詭計》
標簽:王春永 博弈論的詭計 歷史 文化
我們每天生活在博弈中,博弈論只是用數學的辦法解釋了我們長期進行的博弈。即使這樣,當我們看到數學推演出的結論時,也不免目瞪口呆。
雖然每天博弈,但因為復雜的因素,我們常常看不清楚實質。按照直覺出牌,時常落入別人的算計。或許此書能幫我們解決些問題。本書涵蓋范圍很寬,大到人生抉擇,小到一日三餐,用博弈的眼光解釋了我們一生中的各類問題,包括職業,交往,愛情,經濟,時間管理等等,有時讓你忘記了這是本博弈論的書,還以為是成功學。但說起來,博弈還不是為了成功嗎?
書里內容很多。作者恰當的將博弈理論、試驗案例和歷史、政治、文學、新聞、故事等等串聯在一起,融會貫通,縱橫肆意,文字優美,令人佩服。更有意思的是,每篇開頭,作者都是引用一段流行歌曲(其中大部分我都不知道)的歌詞作個引子,簡直有些古典小說的結構意味了。在中國的教育體系下,研究數學的人有幾人還會關注人文歷史呢,更不要說關注流行了?而本書作者看來頗具閱歷且閱讀雜廣,其中引用的不少東西都是近年來的新事物和新說法,想來都是敏銳的發現後總結到自己的研究中了。所以我每讀到精彩處,都不免對作者的文理跨度感嘆一番。
文字中常看到作者的一些抱負。他很聰明,把一些敏感的看法鋪墊清楚然後一筆帶過,讀者自明。他常引用吳思先生的作品,但不像吳先生那麼機鋒。我想這也是博弈訓練的結果。
書末尾的參考文獻讓人發笑。可能是覺得參考文獻太少,作者竟然把羅貫中的三國演義也算在內充數。若是如此,他還引用的那些史記、通鑒等只怕就太感委屈了。本書其實引用極為豐富,若一一列出參考,作者要累死,所以就這樣糊弄了一下吧。
㈢ 學會談判——想要分蛋糕,你先要把蛋糕做大
人與人之間會進行談判,公司與公司會進行談判,就連國與國之間也會進行談判。與一般的閑聊、溝通不同,談判的目的在於 協調出具體的方案 ,來解決問題。在這場博弈中,如何避免談判進入僵局,讓談判變得簡單、高效,方案順利落地實施,這是談判中最希望獲得的成果。
在 《談判的邏輯》 中,作者 弗洛里安·韋 是一名談判專家,不僅經歷過各種談判實戰,還曾在哈佛大學接受過談判技巧培訓。對於談判,他認為其關鍵點在於「 著眼於利益,而非立場 」。如果「立場」說的是「你是誰,你和別人是什麼關系,你想要什麼」,那麼, 「利益」所要表達的就是「為什麼想要」 ,即為一場談判找到一個有力的支撐。
顯然,談判並非一件簡單的事,會涉及到很多具體的內容,為了讓更多人提升個人的談判能力,作者為我們提供了 具體、有效的談判技巧和原則 ,希望每個人都能在自己的「談判」中,發揮更大的更多價值,爭取更多的利益。
你理解的談判是什麼樣的?是那種利益雙方爭得面紅耳赤、怒不可遏?還是面對面列出條條框框,相互刪選、衡量?又或是單方面的一方說服另一方……作者弗洛里安·韋所定義的談判,與這些都不相同。
他認為:「 談判是一種創造性行為,而非一個簡單的權力游戲 。」也就是說,談判可能發生在任何時候。比如,買菜、求職,甚至是談戀愛……而在我們極力讓「談判」順利進行時,每個人都能發揮出獨特的作用。
除了對「談判」定義的不同觀點,對談判的本質,作者也有獨到的見解。市面上大多數談判的書籍都在爭議—— 談判到底是為了合作雙贏 (以哈佛談判術為代表),還是為了 一方勝利,另外一方失敗 (以施漢納談判術為代表)。
在《談判的邏輯》中,作者認為要想使談判更有效、快速的產生結果, 必須同時滿足這兩種理念 ,即 要想分蛋糕,就需要雙方合作先把蛋糕做大 。換種說法,這兩個理念是一個循環,而非兩條平行線。至於如何促進合作,那就需要我們了解成功談判的關鍵法則。
正如書中所說,每次的談判都不同,我們也不能將所有的談判策略、技巧,全記下來。因此,我們只需掌握幾條談判過程中使用的關鍵原則,這樣既方便記憶,又能快速判斷下一步如何應對。作者具體為我們總結了 7 條法則,包括:
(一)收益優化原則
關於收益優化,在書中建議我們在談判前,要准備好草案,設定評分體系、目標體系,然後根據談判過程中獲得的信息,不斷調整目標。切記,調整不是退讓,不是次優結果,我們要盡力達成「 帕累托最優 」的這個目標。當然,也不要忘記共情。
(二)知情原則
作者稱:「 談判就是你需要贏得勝利的信息游戲 」。所以,你要盡可能收集信息,不限於對你有利的信息,還有對你不利的信息,只有更全面的掌握情況,才能更有效的做出取捨,獲得更好的結果。這時,不妨發揮身邊人的力量,多向他人詢問、求助。
(三)領導原則
談判中所提及的「 領導 」,與現實生活中的領導不太一樣,但也有相同之處。 掌握領導原則的關鍵是慎重 ,要想清楚自己可以為這個結果付出多大的代價,在每一個環節中都要負好責任,不只是對團隊的夥伴,也是對談判另一方,更是為你自己負責。
(四)合作原則
仔細思考,我們會發現,任何談判都是 建立在「想合作」的基礎上 。雖然,在談判中,我們不能退縮、示弱,但這並不影響將「合作」作為談判的目標之一。所以,請隨時釋放「想要合作」的信號,讓對方感受到你的誠意。
(五)「雙管齊下」原則
談判是一件圍繞「競爭」和「合作」雙向的事,所以,我們要訓練自己忍耐矛盾的能力,要能夠 在這個矛盾過程中,隨時進行切換 。
(六)理性原則
除了客觀上的因素,主觀上的情緒、心態,也會對談判結果產生影響。所以,我們要避免一些常見的誤區,比如 錨定效應、損失厭惡、被動貶低、沉默成本、優越感偏誤 等。盡可能地營造出積極、樂觀的談判氛圍。
(七)創造力原則
努力為談判過程中的每個環節增加創意元素,比如表達時,不止用文字,還可以選用圖片、視頻等,盡量直觀、可視化;談判地點,可以根據談判主題來選定……可以採用書中提出的四個步驟來激發解決方案的創意,具體包括: 定義問題、深入研究、孵化、塑造和完善新想法 。
除了上面提到的基本談判知識、談判原則以外,在書中,作者還列舉出了可能遇到的 談判難題 。比如,當我們遇到談判僵局時,如何擺脫被擱置的狀態,掌握主動權;當我們遇到難對付的談判對象,如何順利推進談判……甚至如果你想精進談判能力,書里還為你提供了很多談判結構和方法,幫你找到適合自己的談判工具和風格,成為「談判專家」。
在讀完《談判的邏輯》後,你會發現 談判每時每刻都在發生 ,大到國家之間的利益分歧,小到人與人之間的矛盾解決。不管是什麼形式的談判,作為談判中的一方,我們既不能一味地被人牽著鼻子走、妥協退讓,也不能得理不讓人,讓對方難堪。
想要談判成功,需要在堅持自己觀點的同時, 發揮自己的共情能力,學會著眼於利益,而非立場 ,從而簡單、高效的為自己爭取更多利益。
㈣ AL蛋糕店學習後怎樣寫心得體會
主要寫一下主要的工作內容,如何努力工作,取得的成績,最後提出一些合理化的建議或者新的努力方向。
工作總結就是讓上級知道你有什麼貢獻,體現你的工作價值所在。
所以應該寫好幾點:
1、你對崗位和工作上的認識2、具體你做了什麼事
3、你如何用心工作,哪些事情是你動腦子去解決的。
就算沒什麼,也要寫一些有難度的問題,你如何通過努力解決了
4、以後工作中你還需提高哪些能力或充實哪些知識
5、上級喜歡主動工作的人。
你分內的事情都要有所准備,即事前准備工作以下供你參考:
總結,就是把一個時間段的情況進行一次全面系統的總評價、總分析,分析成績、不足、經驗等。
㈤ 7款博弈論模型幫你盡快適應職場
文/寶木笑
呵呵,這個應該是大家最熟悉的博弈論模型了吧,說的就是倆哥們兒犯了不小的事兒,結果被警察抓了,這肯定得單獨審訊啊。這個時候問題來啦:雖然這兩哥們兒都知道,如果他倆都能保持沉默的話,警方無法給他們定罪。但英明神武的警察叔叔也明白這一點,所以就像咱們電影兒里看到的那樣,阿sir會很江湖地分別對倆人說:如果告發同夥,那麼就可以無罪釋放,還能得到一筆獎金,被告發的哥們兒會被按照最重的罪來判,還要罰款,作為對告發者的獎賞。博弈論最好看的地方,我覺得不是結論,而是中間邏輯推理的過程,就像這個問題。倆哥們一定會各自做激烈的思想斗爭,比如其中那個叫大A的哥們兒,他馬上意識到同夥不是傻子,不管自己沉默或者背叛,同夥都會覺得他會選擇背叛。所以大A最後的結論是,唯一理性的選擇就是背叛同夥,因為如果他的同夥笨得保持沉默,那麼他就會是那個帶獎出獄的幸運兒。而如果他的同夥也根據這個邏輯向警方交代了,那也沒關系,大A反正也得服刑,起碼他不必在這之上再被罰款。所以結果就是,這倆哥們按照最科學的邏輯得到了最糟糕的結果——一起玩兒完。
這個模型一定要辯證地看待,慎重地使用,但很遺憾,大部分職場新人都是讀了之後馬上做恍然大悟狀,然後就直接拿來就用,遇到事情就秉承「人不為己天誅地滅」的准則,並將此模型作為科學證據,剛到單位人還沒認全,就開始腹黑起來,而且還為自己的小聰明沾沾自喜。十來年了,我看到這樣的新人不少,但能最後有好結果的不多。難道是書錯了?如果單單從讀書和運用的角度說,那就是光貪圖一年100本兒的數量了,沒有把書讀細讀深,「囚徒困境」只是一個單次博弈模型,而你和你的同事、同學基本上都是多次博弈的環境,所以條件不符合,不適用啊,呵呵。那這個模型到底該如何用呢?請接著看第二款模型。
「囚徒困境」這個模型告訴我們:出來混,要曉得人心隔肚皮,別期望同事都是「聖母心」,自私不但是人的本性流露,更是人們不得不面對的邏輯必然,防人之心不可無。
上面說到「囚徒困境」這個模型不能簡單用到同事之間,因為那是個單次博弈的極端情況,有網友曾問過我,說剛上班兒,既想和同事們交好,又不想被人看做軟柿子,咋辦?當時寶叔就推薦了這個模型,「以牙還牙」是一個用於博弈論的重復囚徒困境非常有效的策略,這個策略在開局時選擇合作,以後則模仿對手在上一期的行動。
在使用這個模型的時候要注意三點:一是以牙還牙者開始一定採取合作態度,不會背叛對方,別上來就腹黑;二是遭到對方背叛,以牙還牙者一定要堅決還擊作出報復,別軟弱和猶豫;三是當對方停止背叛,以牙還牙者會原諒對方,繼續合作,別得理不饒人,你不是在家裡和爹媽吵架,你是到社會上給自己掙口糧噠。
「以牙還牙」這個模型告訴我們:出來混,一味睚眥必報和一味委曲求全,都是扯淡,要能打能拉,高手都是不先出手噠,但高手出手並不是為了「傷」,而是為了「和」,這個拳腳套路有點兒像太極。
豬圈裡有兩頭豬,一頭大豬,一頭小豬,豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。最後的結果是:小豬將選擇舒舒服服地等在食槽邊,而大豬則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物,對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,雖然明知小豬是不會去踩動踏板的,但自己親自去踩踏板總比不踩強吧,所以只好每次都去踩了。
哎,個人覺得讀博弈論和讀哲學類的書一樣,一定要多想一步,否則毀你三觀跟玩兒似的,比如這個智豬模型,一般咱們看到這個模型的第一反應是啥?反正我第一次看到這個模型就覺得很泄氣。別跟我說什麼改變規則,科學設置往返距離神馬的,你不是謝耳朵,也不是馬雲,這里不是生活大爆炸,也不會有什麼阿里巴巴,咱只是普普通通的小老百姓,我們無力改變規則,我們很可能就是那隻可悲的大豬,每天在公司里做加班狗,但有的人卻從不加班,活得那叫一個瀟灑,我們在深夜的櫃式復印機前淚流滿面,仰天長嘯:啊!主啊!救救俺吧!這都特么啥狗日的公司啊!太特么不公平啦!我太陽!我太陽!我太陽啊!
沒錯,初入職場,我們會碰到無數那樣瀟灑的「小豬」,他們總能分分鍾就把我們的心情搞壞,分分鍾就能把我們昨天惡補了一晚上的雞湯搞成麻辣燙。但如果經過冷靜的權衡,你覺得現在這份工作能帶給你的,遠比那些氣人的「小豬」要多,那你一定要記得每天去公司的路上都復習一下自己的權衡,任勞容易任怨難,說的就是咱們啊。
那麼,也許有人會問,那我直接去做那個充滿了「智慧」的小豬多舒服啊,呵呵,如果你在公司時間稍微久一些,你就會發現那些貌似非常「智慧」的小豬,其實多數不是靠的自己的智商(稍微有點兒智商的還能讓你這樣的新人恨的牙根兒癢癢啊?呵呵),而是靠一種「勢」,這種「勢」要麼是背景深厚,要麼是人脈通天,反正是我們現在還不擁有的,所以小豬自己最清楚,靠山硬才能有底氣耍小聰明,那些自己啥底子也沒有,就去做小豬的,好像都被老闆做了「烤乳豬」。
「智豬博弈」這個模型告訴我們:出來混,對於普通百姓家的孩子來說,不是想著怎麼去做那隻舒服的小豬,而是告訴我們要盡快學會宏觀的權衡,如果這份工作值得你去做忍氣奔波的大豬,那麼從理論角度告訴自己別和小豬一般見識,活下去最重要。
有三個槍手,甲的命中率是80%,乙是60%,丙是40%,他們同時舉槍瞄準、同時射擊另兩個人中的一個,要盡可能消滅對手,每個人一次機會,一顆子彈,誰活下來的可能性最大?可能大家都知道結局,沒錯,是槍法最不準的阿丙活下來啦,呵呵。道理也簡單,甲會打乙,乙會打甲,而我們的阿丙也會打甲,因為甲牛逼啊,大家都覺得甲對大夥兒構成了威脅。另外,如果三個人輪流開槍,甲先開槍的話,還是會先打乙,如果乙被打死了,則下一個開槍的就是阿丙,那麼甲生存的概率為60%,而阿丙依然是100%(他開過槍後甲沒有子彈了,汗……);如果打不死乙,則下一輪在乙開槍的時候一定會全力回擊,甲的生存率為40%,不管是否打死甲,第三輪甲乙倆哥們兒的命都攥在我們阿丙的手裡了。呵呵,如果必須由我們的阿丙先開槍呢?答案是胡亂開一槍,只要不針對甲乙任何一人即可,因為當阿丙開槍完畢,甲乙還是會陷入互掐的困境。
我們剛到一個公司,最喜歡乾的事兒是啥,拚命證明自己唄,這是人之常情,但卻不是戰略最優,人家原來的大神還殺的難解難分吶,你突然半路蹦出來嚇大家一跳,人家互相看看,只能先把手頭的事兒先放一放,先料理了你再說。
「槍手搏命」這個模型告訴我們:出來混,保護自己是第一位,出人頭地次之,滿足虛榮心最忌,虎行似病,鷹立似睡,模型不是讓我們去做那個阿丙,而是讓我們懂得如何去做一個更加牛掰的槍手甲。
兩個小孩怎麼分蛋糕?大家都是成年人啦,這里就不說什麼一個分,一個選了,直接介紹分蛋糕的進階模型,即時間成本的加入,將使得分配變得復雜化,比如兩個小孩兒都是古靈精怪,都在你來我往地尋求利益最大化和方案最優,雙方不能及時達成一致,然後就沒有然後了,因為蛋糕在融化,等倆小孩兒滿意了,黃瓜菜都涼了。
如果你是個新人,但也已經工作一段時間了,你可能有時會遇到三個和尚沒水喝的尷尬,或者是你的科室,或者是你的團隊,總之你總有一天會直面一個小肚雞腸的拍檔,而且這廝每次都彷彿革命烈士轉世,為了少干一點兒活兒,這貨無所畏懼,寧可玉石俱焚,也絕不向你妥協。你這個氣啊,丫看姑奶奶好欺負是不是?老娘還不伺候了呢!看誰耗得過誰!呵呵,這個分蛋糕的模型就是給你設計的,前提是這個工作對你很重要,你想自己闖出點兒名堂,讓家裡老人放心,那結果只能是——可別讓蛋糕化了啊!你放心好了,人在做,天看不看先不說,周圍的人和你的上司一定會看到的。
「分蛋糕模型」告訴我們:出來混,千萬別和犟種一般見識,否則,時間久了你就會變成自己當初討厭的樣子,凡是有大局觀的新人進步一定最快,實在點兒說大局觀就是你的未來,你要是一個真的有抱負的人,你就會漸漸悟到其實怎麼分蛋糕並不重要,重要的是你的上司會看到你每次是怎麼分的蛋糕。
屋子裡有三個臉臟的人,但他們都不知道自己的臉臟,他們被要求不能對話,這時候,一哥們兒從屋外走進來,對他們說:「你們至少有一個人的臉是臟的。」屋子裡的仨人聽完之後,相互看了看,沒有任何反應,因為他們都看到別人臉臟,以為說的不是自己。外邊來的哥們兒見狀,又補充了一句:「你們不知道嗎?」聽完這話,三人又相互打量起來,突然間,他們同時意識到自己的臉是臟的,於是三個人的臉一下子都紅了。推理過程是這樣滴:「至少有一個人」臉臟,也就是說如果看到別人的臉是臟的,這句話就可以成立,而當第二句指的是「你們」時,就意味著臉臟的人至少是兩個。如果只有兩個人臟臉,但是我看到另外兩個人的臉是臟的,假設我的臉是干凈的,他們任何一個在看到我的臉是干凈的時,再看到另一個人臉臟,就會意識到自己的臉臟,那麼他的臉應該會紅,但是這樣的情形沒有發生,情況就只有一種了:三個人的臉都是臟的。呵呵,這就是大名鼎鼎的「共同認識」,也叫「共同認知」,當某種局面被打破後,人們才會認識到原來自己也是如此,而且每個人都知道別人是如此的「共同認識」。
職場新人有的時候會走兩個極端,要麼是妄自菲薄,覺得自己什麼都不行,要麼是妄自尊大,看什麼都不順眼,這兩年也不知為什麼,後者越來越多。危險啊,如果前面5種模型都是技術層面的討論的話,那麼從第6個模型開始就是內涵層面的引申了。我們往往都是嘴上最謙虛,最低調,而我們的內心則充滿了腹誹和鄙夷,我們都把這些歸結為我們都是很自我的人,不願意與世俗同流合污,呵呵,這個模型給我們上了生動一課,告訴我們也許自己並不是自己想像得那麼特立獨行和冰清玉潔,我們只是一個被慣壞了的孩子。
「臟臉博弈」告訴我們:出來混,自己的心千萬別從一開始就走歪了,初期症狀是各種看不慣,總把「活出自我」掛嘴邊,中期症狀是剛愎自用,聽不得家人和其他人的任何批評意見,晚期症狀是文過飾非,怨天尤人,讓周圍的人特別是自己的家人苦不堪言。朋友,與其裝樣子去了解世界,還不如多了解一些自我。
當一個人有一隻表時,可以知道現在是幾點鍾,而當有兩只表時,卻不能告訴一個人更准確的時間,反而會讓看錶的人失去對准確時間的信心。這個模型建議選擇其中較信賴的一隻,盡力校準它,並以此作為你的標准,聽從它的指引行事。
我們剛入職場的時候,會遇到價值觀的大雜燴,不同的人,不同的事,每天都在圍繞著我們,今天我們看到張三牛掰,明天我們聽說李四是大神,我們一會兒覺得要韜光養晦,一會兒又覺得要鋒芒畢露,我們一會兒覺得要腹黑到死,一會兒又覺得要返璞歸真。我們被價值觀和方法論的好多「手錶」弄得無所是從,不知自己該信仰哪一個,還有一部分人在外部環境壓力或者別人的誤導下,違心選擇了自己並不喜歡的路,為此鬱郁寡歡。最後一款模型,我給大家推薦手錶定律,這里有我深深的祝福,希望大家都能找准屬於自己的那塊兒「手錶」。
「手錶定律」告訴我們:出來混,善於調整自己的心是重要的,但涉及到價值觀的事兒一定要慎重,尤其不要幻想可以同時擁有不同的價值觀,選你所愛,愛你所選,無論結果如何,請務必不要回頭。
今天介紹的7款模型肯定不能囊括所有的經典博弈論模型,至於到底哪些更應該上榜,也是仁者見仁,智者見智,但我仍記得古龍老爺子在《七種武器》系列中表達的意思:「其實,最厲害的武器是人心。」沒錯,不管職場的招數如何天花亂墜,關鍵是我們自己的心臟是否堅強有力,不忘初心,堅守本心,方得始終。
此文與諸君共勉。
-END-
㈥ 討價還價的技巧是什麼
在前面的論述中,我們探討了商場博弈的優勢策略與劣勢策略。現在,讓我們來看看具體的商場博弈在生活中的運用。比如,在商場討價還價時,經常會運用到著名的最後通牒博弈。
有一家外企招聘員工面試時出了這樣一道題:要求應聘者把一盒蛋糕切成八份,分給八個人,但蛋糕盒裡還必須留有一份。面對這樣的怪題,有些應聘者絞盡腦汁也無法完成;而有些應聘者卻感到此題很簡單,把切成的八份蛋糕先拿出七份分給七個人,剩下的一份連蛋糕盒一起分給第八個人。應聘者的創造性思維能力從這道題中就顯而易見了。
分蛋糕的故事在很多領域都有應用。無論在日常生活、商界還是在國際政壇,有關各方經常需要討價還價或者評判對總收益如何分配,這個總收益其實就是一塊大「蛋糕」。這塊大「蛋糕」如何分配呢?我們知道最可能實現一半對一半的公平分配的方案,是讓一方把蛋糕切成兩份,而讓另一方先挑選。在這種制度設置之下,如果切得不公平,得益的必定是先挑選的一方,所以負責切蛋糕的一方就得把蛋糕切得公平,這就是最後通牒博弈。
但是,這個方案極有可能是無法保證公平的,因為人們容易想像切蛋糕的一方可能技術不老到或不小心切得不一樣大,從而不切蛋糕的一方得到比較大的一半的機會增加。按照這樣的想像,誰都不願意做切蛋糕的一方。雖然雙方都希望對方切、自己先挑,但是真正僵持的時間不會太長,因為僵持時間的損失很快就會比堅持不切而挑可能得到的好處大。也就是說,僵持的結果會得不償失,會出現收益縮水的現象。
在現實生活中,收益縮水的方式非常復雜,不同情況下有不同的速度。很可能你討價還價如何分割的是一個冰激凌蛋糕,在一邊爭吵怎麼分配時,蛋糕已經在那邊開始融化了。因此,我們在生活中經常會看到這樣的現象:桌子上放了一個冰激凌蛋糕,小娟向小明提議應該如此這般分配。假如小明同意,他們就會按照成立的契約分享這個蛋糕;假如小明不同意,雙方持續爭執,蛋糕將完全融化,誰也得不到。
現在,小娟處於一個有利的地位:她使小明面臨有所收獲和一無所獲的選擇。即便她提出自己獨吞整個蛋糕,只讓小明在她吃完之後舔一舔切蛋糕的餐刀,小明的選擇也只能是接受,否則他什麼也得不到。在這樣的游戲規則之下,小明一定不滿足只能分到1/9的蛋糕,他一定要求再次分配。在這種情況下,分蛋糕的博弈就不再是一次性博弈。
事實上,當分蛋糕博弈成為一個「動態博弈」時,就形成一個討價還價博弈的基本模型。在經濟生活中,不管是小到日常的商品買賣還是大到國際貿易乃至重大政治談判,都存在著討價還價的問題。
有一個這樣的故事:某個窮困的書生A為了維持生計,要把一幅字畫賣給一個財主B。書生A認為這幅字畫至少值200兩銀子,而財主認為這幅字畫最多隻值300兩銀子,但雙方都對此價格沒有公開。從這個角度看,如果能順利成交,那麼字畫的成交價格會在200~300兩銀子。如果把這個交易的過程簡化為這樣:由B開價,而A選擇成交或還價。這時,如果B同意A的還價,交易順利結束;如果B不接受,那麼交易就結束了,買賣也就沒有做成。
這是一個很簡單的兩階段動態博弈的問題,應該從動態博弈問題的倒推法原理來分析這個討價還價的過程。由於財主B認為這幅字畫最多值300兩,因此,只要A的還價不超過300兩銀子,財主B就會選擇接受還價條件。但是,再從第一輪的博弈情況來看,很顯然,A會拒絕由B開出的任何低於300兩銀子的價格。如果說B開價290兩銀子購買字畫,A在這一輪同意的話,就只能得到290兩;如果A不接受這個價格,那麼就有可能在第二輪博弈中提高到299兩銀子,B仍然會購買此幅字畫。從人類的不滿足心來看,顯然A會選擇還價。
在這個例子中,如果財主B先開價,書生A後還價,結果賣方A可以獲得最大收益,這正是一種後出價的「後發優勢」。這個優勢屬於分蛋糕動態博弈中最後提出條件的人——幾乎霸佔整個蛋糕。
事實上,如果財主B懂得博弈論,他可以改變策略,要麼後出價,要麼是先出價但是不允許A討價還價,如果一次性出價A不答應,就堅決不會再繼續談判來購買A的字畫。這個時候,只要B的出價略高於200兩銀子,A一定會將字畫賣於B。因為200兩銀子已經超出了A的心理價位,一旦不成交,那一文錢也拿不到,只能繼續受凍挨餓。
這個博弈理論已經證明,當談判的多階段博弈是單數階段時,先開價者具有「先發優勢」,而雙數階段時,後開價者具有「後發優勢」。這在商場競爭中是非常常見的現象:非常急切想買到物品的買方往往要以高一些的價格購得所需之物;急切於推銷的銷售人員往往是以較低的價格賣出自己所銷售的商品。正是這樣,富有購物經驗的人買東西、逛商場時總是不緊不慢,即使內心非常想買下某種物品都不會在銷售員面前表現出來;而富有銷售經驗的店員們總是會勸說顧客,說「這件衣服賣得很好,這是最後一件」之類的推銷語。
商場中的討價還價,正如書生A與財主B之間的賣與買一樣,都是一個博弈的過程,如果能夠運用博弈的理論,一定能夠成為勝出的一方。
?
㈦ 博弈論簡單入門 基本概念解釋以及具體案例分析
博弈論也也 稱為 對策論 或 賽局理論 ,是研究具有斗爭或競爭性質現象的數學理論和方法。博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構,所以它們是同一個游戲的特例。其中一個著名有趣的應用例子是囚徒困境。
具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。
約翰·馮·諾伊曼是個超級跨界牛人——他同時在「數學、物理學、經濟學、計算機」等多個領域作出了劃時代的貢獻,並留下一大堆以他命名的東西,比如程序員應該都聽說過「馮諾依曼體系」,比如數學領域有「馮諾依曼代數、馮諾依曼遍歷定理……」,理論物理領域有「馮諾依曼量子測量、馮諾依曼熵、馮諾依曼方程……」。另外還有很多東西,雖沒有以他命名,也是他先搞出來的,比如:量子力學的公理化表述、希爾伯特第5問題、連續幾何(其空間維數不是整數)、蒙特卡洛方法、歸並排序演算法1944年,他與奧斯卡·摩根斯坦合作發表了《博弈論與經濟行為》一舉奠定博弈論體系的基礎,所以他也被稱作博弈論之父。
合作博弈 & 非合作博弈
不論是合作博弈與非合作博弈,在博弈過程中都可能會出現合作的現象。差別在於——對於合作博弈,存在某種外部約束力,使得背叛的行為會受到這種外部約束力的懲罰。對於非合作博弈,沒有上述這種外部約束力,對背叛的懲罰只能依靠博弈過程的其它參與者。通常所說的博弈大都指非合作博弈。
同時博弈 & 順序博弈
同時博弈有時也稱作靜態博弈,指的是——博弈的任何一個參與者在選擇自己的行為之前,並不知道其它參與者的行為信息。順序博弈有時也稱作動態博弈。在這類博弈中,參與者的動作有時間上的先後,並且後一個執行動作的博弈者可以看到其他博弈者之前的動作,然後根據別人的動作,思考自己的行為。
零和博弈 & 非零和博弈
零和博弈這個名稱具有誤導性,使得很多人以為各方的收益總和為零。零和博弈指的是——在博弈結束之後,參與各方的利益總和為常量(可以是零,也可以是正值或負值)。非零和博弈指的是——在博弈結束之後,參與各方的利益總和為變數。所以這類博弈有時候稱為變和博弈。對於這類博弈,在某些情況下可能會讓參與各方的利益總和變大,從而使得各方存在合作的可能性。
非重復博弈 & 重復博弈
非重復博弈有時也稱作單次博弈;相應的,重復博弈也被稱作多次博弈。重復博弈還可以進一步細分為有限重復博弈與無限重復博弈。更嚴謹的說法是:有限重復博弈——重復次數確定的博弈,無限重復博弈——重復次數不確定的博弈
收益矩陣 & 決策樹
這兩個概念都是為了更直觀地描述博弈過程,並幫你看清各方的利弊得失。收益矩陣通常用來描述靜態博弈(同時博弈)而且一般是用來描述雙人的靜態博弈,更多人的靜態博弈也可以用收益矩陣表述,但畫起來會復雜很多;由於動態博弈(順序博弈)比較復雜,通常不用「收益矩陣」描述。決策樹既可以用來描述靜態博弈,也可以用來描述動態博弈。
策略 & 策略集合
以象棋為例,完成一局需要經歷很多個步驟,對每個步驟,你都有多個決策選項(要走哪個棋子,走到哪)。而策略指的是——從第一步到最後一步的所有決策選項的總和。你可以把策略通俗理解為某種演算法 指導思想,它指導你從第一步走到最後一步。所有可能的策略,構成了策略集合。
有限策略集合 & 無限策略集合
石頭剪刀布是典型的有限策略集合,該集合只有3個元素。為了說明無限策略集合這種集合,舉個分蛋糕博弈的例子,其中一人先把蛋糕隨意分為兩塊,然後另一個人先挑選其中一塊。對於負責分蛋糕的人而言,其策略集合是無窮大。很多人憑直覺會認為:具有無限策略集合的博弈比有限策略集合的博弈更復雜。其實不然,圍棋雖然很復雜,但其策略集合依然是有限滴。作為對比,分蛋糕博弈比圍棋簡單多了,但分蛋糕博弈反而具有無限的策略集合。
純策略 & 混合策略
在實際博弈時,如果你總是固定選擇策略集合中的某一個策略,這種情況稱之為純策略。如果你在博弈時,總是隨機選擇策略集合中的某幾個策略,這種情況稱之為混合策略。如果某個混合策略包含了策略集合中的每一個元素,稱之為完全混合策略。
支配策略
假設你有兩個策略 A & B。如果在任何情況下,A 都比 B 更優,稱作 A 支配 B 或者 B 被 A 支配。支配策略又稱優勢策略。如果某個策略能夠支配所有其它策略,那麼它就是支配策略。通俗地說,不論你的對手採用何種策略,你的支配策略總是比你的其它策略有更好的結果。有時候會把支配策略進一步細分為強支配和弱支配。對於前者,它在任何情況下都比其它策略更好;對於後者,它在某些情況下比其它策略更好,某些情況下與其它策略一樣好。制勝策略也稱必勝策略,它通常只用於零和博弈,指的是——只要你採用這個策略,不論對方如何應對你總是贏。制勝策略肯定是支配策略;但支配策略不一定是制勝策略。
最小最大定理
比較繞口的陳述是:最小化最大損失,更通俗的表述是在最壞情況下最小化損失。該定理及演算法最早由馮·諾依曼在《博弈論與經濟行為》一書中提出。
反向歸納法 & 概念該方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每個決策,以及對方在應對你的決策時,會採用何種決策,這個思維過程類似於決策樹的展開,這個展開過程要一直推演到最後一步,也就是決策樹的葉子節點。此時你就可以看清雙方在最後一步各自的最優選擇;然後再反向回推到第一步。當你要用反向歸納進行展望與推理,前提是——你要獲得充分的信息;或者說,如果某個博弈者所知的信息不夠充分,就無法運用該方法。
問題描述
5個海盜搶了100個金幣,討論如何分贓。這5個海盜有等級高低(不妨假設 A>B>C>D>E)。先由等級最高的海盜提出分贓方案,然後投票。如果半數以上(含半數)同意,就按這個方案分,游戲結束;如果同意的不到半數,把提出方案的海盜扔進海里喂鯊魚,然後由次一等級的海盜提出新的方案;以此類推。每個海盜的特點是:足夠理性(追求個人利益最大化)並且知道別人也足夠理性;足夠殘忍(在個人利益等同的情況下,傾向於把更多同伴扔進海里)。
策略分析
為了進行反向推理,假設最後只剩下2個海盜(D & E)。此時的投票肯定過半(D 肯定投票贊同自己的方案)。在這種局面下,D 可以採用最極端的方案——自己全拿100個金幣,E 則一個也拿不到。
現在回推一步。當只剩下3個海盜(C、D、E),由 C 提出方案。他只需要分1個金幣給 E,E 就會投票支持(否則的話,等到由 D 來提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99個金幣,E 拿1個金幣。
再往前一步。只剩下4個海盜(B、C、D、E),B 提方案,他當然也能想到剛才那些推理。他只需給 D 1個金幣,D 就會支持他(如果等到 C 來提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同樣能得到半數支持。
基於上述分析,再看 A 的方案,就很顯然了——A:98,B:0,C:1,D:0,E。
美國數學家納什在1951年發表了一篇小論文名叫《非合作博弈》,其中提出了納什均衡的概念並給出了相應的基於不動點定理數學證明。通俗地說是指在多人的非合作博弈中,如果每個博弈者都無法單方面改善自己的境地,此時的局面稱作納什均衡。馮·諾伊曼已經在《博弈論與經濟行為》一書中證明了:零和博弈必定存在這樣的均衡點。納什的貢獻在於他從零和博弈推廣到非零和博弈,並證明了:這樣的均衡點依然存在。當博弈的局面處於納什均衡,此時的系統是穩定滴,如果每個博弈者都足夠理性,他們都不願意主動改變當前的策略。
換位思考
前面聊的很多博弈相關技能都依賴於換位思考這個能力,你需要站在對手的角度進行思考,才能看清局面,從而更好地選擇自己的策略。一般來說,那些換位思考能力越強的人,也越善於進行強批判思維。
理性人假設
微觀經濟學在進行數學建模的時候,通常都會引入一個理性人假設,假定市場的行為主體是充分理性,此處的充分理性還隱含著掌握充分的信息,引入這個假設是為了數學建模的需要。對任何一個國家大多數人都很平庸,他們的共同點之一是非常不理性。充分理性並且掌握了充分信息的個人,那也絕對是鳳毛麟角,而理性人假設竟然設定市場的行為主體全都是充分理性的。有了博弈論之後,這個非常扯蛋的理性人假設就可以丟到垃圾桶里。
舊的經濟學理論(理性人的解釋)會說——所有公司的老闆都充分理性,也掌握了充分的信息,知道應該生產何種商品,才能滿足市場需求。新的經濟學理論(博弈論的解釋)會說——公司的老闆既有優秀的,也有平庸的。平庸公司生產的商品沒人要,自然會虧損並倒閉。隨著時間的推移,經過自然選擇,活下來的公司當然是那些聰明的。
裝瘋策略
理性的博弈者把自己偽裝成非理性的博弈者,這么干可以獲得某種虛張聲勢的唬人效果。對這種手法,俺稱之為裝瘋策略。
經濟學
談博弈論的影響,當然首先要談它對經濟學的影響。有了博弈論,就不再需要那個扯蛋的理性人假設了,這是博弈論誕生後對微觀經濟的重大影響,還有很多其它的影響。比如說:博弈論誕生前傳統的微觀經濟學以供給需求來建立價格的數學模型。這個模型只考慮了供應量需求量的變化對價格的影響,而完全不考慮供給雙方的力量對比。如果供給雙方中,一方變得強勢或另一方變得弱勢。即使供應量與需求量都維持不變,價格也會發生變動,朝著對強勢方有利的方向移動。
生物學
生物學受博弈論影響最大的分支估計是演化生物學,也就是的進化論。藉助博弈論的研究成果,演化生物學家可以更好地建立物種演化的數學模型。
㈧ 微信好友刪除了頭像換了能看見嗎
這個可以看到的,你刪除了對方,你這里就沒有對方的任何記錄了,但是對於對方,只是不能跟你進行聊天,不能看你朋友圈,但是你的微信仍然在對方的通信錄里,你的頭像的變化對方也能看到,另外包括你的微信號對方也能看到。
㈨ 《博弈論與生活》|總有一款適合你
本周聽了一本新書《博弈論與生活》,與其他講博弈論的書相比,這本書沒有一個數學公式,並不枯燥,作者詼諧幽默,案例充足,是一本博弈論入門的好書。
博弈論是20世紀40年代被提出,最典型的例子就是兄弟兩個人分蛋糕,爭執不下,後來爸爸說哥哥負責切,弟弟負責先選。這么一來,哥哥會盡可能的將蛋糕切的一樣大。為什麼會有這樣的矛盾,應該說從本質上,人都是自私的。
博弈論有七大困境,你日常生活中遇到的矛盾,一定可以從這七個中找出一個。
第一:囚徒困境
警察抓到兩個犯人,分開進行審訊。有三種情況,1. 兩個人都不交代則各判2年。2. 一個交代,另一個不交代,則交代的無罪釋放,不交代的盼10年。3. 兩個都交代則各判4年。
這個困境的最優解是兩個人都不交代各判2年。但現實情況卻是第三個,這里邊有個概念叫做納什均衡。要想達到最優解,就是各判2年,條件是非常苛刻的,必須要2人達成某種協議,還要有條件促使對方不會變卦。這在分開審訊的時候,對2者的考驗是巨大的。
第二:公地困境
公地困境是升級版的囚徒困境。
第三:搭便車困境
這個在我們生活中經常會遇到。形象一點的解釋就是,你開車上班,和住同一小區的同事剛好碰見了,你出於好意,讓他打了個便車。後來同事會要求你每天都要帶上他,如果你拒絕的話,就說明你很小氣。
抽象一點的理解就是沒有付出的人享受付出人的成果,最後是的付出的人的利益收到損害。想一想你身邊或自己是否存在搭便車困境呢。
第四:懦夫博弈
類似於過獨木橋,雙方各不相讓,最後兩敗俱傷。
解決辦法,第一個是笑一笑,記得之前看《解惑》這本書,一個看似無解的問題,不能在在矛盾中去尋找解決辦法,應該跳出矛盾,境界高了,問題就自然而然不成為問題了。笑一笑的意思是說,自己心態上一個檔次,做一個好人,不去計較。孔子說:求仁得仁,何怨乎? 你生來就是願意做一個好人的,現在你做到了,為何要抱怨呢? 反過來,你抱怨是說你不想做一個好人嗎? 老夫子還是厲害啊 。
第二個是鷹鴿搭配,就是強硬和柔軟搭配著來,對敵人對打的威懾在於敵人猜不透你。
第五:志願者困境
意思是你遇到一個問題,第一站出來的人會死,但沒有人站出來大家都會死。
比如你路上遇到危險,喊的作用不是很大,受制於志願者困境,大家都在相互觀望,最有用的是直接抱著一個人,求他救命,這個最有效。
第六:兩性困境
就是兩個選擇都可以,無所謂。
最厲害的例子就是過年去誰家,就我自己的經驗,感覺怎麼計劃都不行,這里最優答案就是投硬幣,大家聽天由命。
第七:獵鹿問題
3個人去打獵,今天只有打到一隻鹿3家人才都可以不挨餓,但前提是獵鹿需要3個人通力合作,少一個人都不行。但是其中一個人在去的路上看到一條兔子,這個兔子他一人就能搞定,搞定了他自己一家不會挨餓。
這就是這本書主要講的七大困境,每個困境都會有一些指導性的建議。現實生活中,很多時候博弈不是雙方,而是多方博弈,多方博弈的最優解是讓他人先博弈,自己守株待兔。舉個例子,3個人互相射擊,命中率高的人最後射擊,命中率低的人第一個射擊。A100%命中率,B50%命中率,C30%命中率,問C第一槍射誰,活下來的概率高一些?最佳答案是C放棄機會,讓給B來選擇。
這本書最後用孔子的以直報怨,以德報德來告訴我們,在處理平時的矛盾中,要做一個有原則,有底線的好人。以後有空了,回頭在來細細品讀這本書。
雪堂-儒家國學經典 | 雪堂-道家國學經典
幸福豬的雪堂書屋 - 連載
會員通道
㈩ 博弈論的表格怎樣做
博弈論又被稱為對策論(Game Theory)既是現代數學的一個新分支,也是運籌學的一個重要學科。
博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。 博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。
博弈論已經成為經濟學的標准分析工具之一。在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。
基本概念中包括局中人、行動、信息、策略、收益、均衡和結果等。其中局中人、策略和收益是最基本要素。局中人、行動和結果被統稱為博弈規則。
博弈分為:
(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。
(2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。
(3)完全信息/不完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有充分了解稱為完全信息;反之,則稱為不完全信息。
(4)靜態博弈和動態博弈
靜態博弈:指參與者同時採取行動,或者盡管有先後順序,但後行動者不知道先行動者的策略。
動態博弈:指雙方的的行動有先後順序並且後行動者可以知道先行動者的策略。
例:囚徒困境
在博弈論中,含有占優戰略均衡的一個著名例子是由塔克給出的「囚徒困境」(prisoner's dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個博弈的支付矩陣。
對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什麼,他選擇「坦白」總是最優的。顯然,根據對稱性,B也會選擇「坦白」,結果是兩人都被判刑8年。但是,倘若他們都選擇「抵賴」,每人只被判刑1年。在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累托最優,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。但是,「坦白」是任一犯罪嫌疑人的占優戰略,而(坦白,坦白)是一個占優戰略均衡,即納什均衡。不難看出,此處納什均衡與帕累托存在沖突。
單從數學角度講,這個理論是合理的,也就是選擇都坦白。但在這樣多維信息共同作用的社會學領域顯然是不合適的。正如中國古代將官員之間的行賄受賄稱為「陋規」而不是想方設法清查,這是因為社會體系給人行為的束縛作用迫使人的策發生改變。比如,從心理學角度講,選擇坦白的成本會更大,一方坦白害得另一方加罪,那麼事後的報復行為以及從而不會輕易在周圍知情人當中的「出賣」角色將會使他損失更多。而8年到10年間的增加比例會被淡化,人的尊嚴會使人產生復仇情緒,略打破「行規」。我們正處於大數據時代,向更接近事實的處理一件事就要盡可能多地掌握相關資料並合理加權分析,人的活動動影像動因復雜,所以囚徒困境只能作為簡化模型參考,具體決策還得具體分析。