⑴ 博弈論簡單入門 基本概念解釋以及具體案例分析
博弈論也也 稱為 對策論 或 賽局理論 ,是研究具有斗爭或競爭性質現象的數學理論和方法。博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構,所以它們是同一個游戲的特例。其中一個著名有趣的應用例子是囚徒困境。
具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。
約翰·馮·諾伊曼是個超級跨界牛人——他同時在「數學、物理學、經濟學、計算機」等多個領域作出了劃時代的貢獻,並留下一大堆以他命名的東西,比如程序員應該都聽說過「馮諾依曼體系」,比如數學領域有「馮諾依曼代數、馮諾依曼遍歷定理……」,理論物理領域有「馮諾依曼量子測量、馮諾依曼熵、馮諾依曼方程……」。另外還有很多東西,雖沒有以他命名,也是他先搞出來的,比如:量子力學的公理化表述、希爾伯特第5問題、連續幾何(其空間維數不是整數)、蒙特卡洛方法、歸並排序演算法1944年,他與奧斯卡·摩根斯坦合作發表了《博弈論與經濟行為》一舉奠定博弈論體系的基礎,所以他也被稱作博弈論之父。
合作博弈 & 非合作博弈
不論是合作博弈與非合作博弈,在博弈過程中都可能會出現合作的現象。差別在於——對於合作博弈,存在某種外部約束力,使得背叛的行為會受到這種外部約束力的懲罰。對於非合作博弈,沒有上述這種外部約束力,對背叛的懲罰只能依靠博弈過程的其它參與者。通常所說的博弈大都指非合作博弈。
同時博弈 & 順序博弈
同時博弈有時也稱作靜態博弈,指的是——博弈的任何一個參與者在選擇自己的行為之前,並不知道其它參與者的行為信息。順序博弈有時也稱作動態博弈。在這類博弈中,參與者的動作有時間上的先後,並且後一個執行動作的博弈者可以看到其他博弈者之前的動作,然後根據別人的動作,思考自己的行為。
零和博弈 & 非零和博弈
零和博弈這個名稱具有誤導性,使得很多人以為各方的收益總和為零。零和博弈指的是——在博弈結束之後,參與各方的利益總和為常量(可以是零,也可以是正值或負值)。非零和博弈指的是——在博弈結束之後,參與各方的利益總和為變數。所以這類博弈有時候稱為變和博弈。對於這類博弈,在某些情況下可能會讓參與各方的利益總和變大,從而使得各方存在合作的可能性。
非重復博弈 & 重復博弈
非重復博弈有時也稱作單次博弈;相應的,重復博弈也被稱作多次博弈。重復博弈還可以進一步細分為有限重復博弈與無限重復博弈。更嚴謹的說法是:有限重復博弈——重復次數確定的博弈,無限重復博弈——重復次數不確定的博弈
收益矩陣 & 決策樹
這兩個概念都是為了更直觀地描述博弈過程,並幫你看清各方的利弊得失。收益矩陣通常用來描述靜態博弈(同時博弈)而且一般是用來描述雙人的靜態博弈,更多人的靜態博弈也可以用收益矩陣表述,但畫起來會復雜很多;由於動態博弈(順序博弈)比較復雜,通常不用「收益矩陣」描述。決策樹既可以用來描述靜態博弈,也可以用來描述動態博弈。
策略 & 策略集合
以象棋為例,完成一局需要經歷很多個步驟,對每個步驟,你都有多個決策選項(要走哪個棋子,走到哪)。而策略指的是——從第一步到最後一步的所有決策選項的總和。你可以把策略通俗理解為某種演算法 指導思想,它指導你從第一步走到最後一步。所有可能的策略,構成了策略集合。
有限策略集合 & 無限策略集合
石頭剪刀布是典型的有限策略集合,該集合只有3個元素。為了說明無限策略集合這種集合,舉個分蛋糕博弈的例子,其中一人先把蛋糕隨意分為兩塊,然後另一個人先挑選其中一塊。對於負責分蛋糕的人而言,其策略集合是無窮大。很多人憑直覺會認為:具有無限策略集合的博弈比有限策略集合的博弈更復雜。其實不然,圍棋雖然很復雜,但其策略集合依然是有限滴。作為對比,分蛋糕博弈比圍棋簡單多了,但分蛋糕博弈反而具有無限的策略集合。
純策略 & 混合策略
在實際博弈時,如果你總是固定選擇策略集合中的某一個策略,這種情況稱之為純策略。如果你在博弈時,總是隨機選擇策略集合中的某幾個策略,這種情況稱之為混合策略。如果某個混合策略包含了策略集合中的每一個元素,稱之為完全混合策略。
支配策略
假設你有兩個策略 A & B。如果在任何情況下,A 都比 B 更優,稱作 A 支配 B 或者 B 被 A 支配。支配策略又稱優勢策略。如果某個策略能夠支配所有其它策略,那麼它就是支配策略。通俗地說,不論你的對手採用何種策略,你的支配策略總是比你的其它策略有更好的結果。有時候會把支配策略進一步細分為強支配和弱支配。對於前者,它在任何情況下都比其它策略更好;對於後者,它在某些情況下比其它策略更好,某些情況下與其它策略一樣好。制勝策略也稱必勝策略,它通常只用於零和博弈,指的是——只要你採用這個策略,不論對方如何應對你總是贏。制勝策略肯定是支配策略;但支配策略不一定是制勝策略。
最小最大定理
比較繞口的陳述是:最小化最大損失,更通俗的表述是在最壞情況下最小化損失。該定理及演算法最早由馮·諾依曼在《博弈論與經濟行為》一書中提出。
反向歸納法 & 概念該方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每個決策,以及對方在應對你的決策時,會採用何種決策,這個思維過程類似於決策樹的展開,這個展開過程要一直推演到最後一步,也就是決策樹的葉子節點。此時你就可以看清雙方在最後一步各自的最優選擇;然後再反向回推到第一步。當你要用反向歸納進行展望與推理,前提是——你要獲得充分的信息;或者說,如果某個博弈者所知的信息不夠充分,就無法運用該方法。
問題描述
5個海盜搶了100個金幣,討論如何分贓。這5個海盜有等級高低(不妨假設 A>B>C>D>E)。先由等級最高的海盜提出分贓方案,然後投票。如果半數以上(含半數)同意,就按這個方案分,游戲結束;如果同意的不到半數,把提出方案的海盜扔進海里喂鯊魚,然後由次一等級的海盜提出新的方案;以此類推。每個海盜的特點是:足夠理性(追求個人利益最大化)並且知道別人也足夠理性;足夠殘忍(在個人利益等同的情況下,傾向於把更多同伴扔進海里)。
策略分析
為了進行反向推理,假設最後只剩下2個海盜(D & E)。此時的投票肯定過半(D 肯定投票贊同自己的方案)。在這種局面下,D 可以採用最極端的方案——自己全拿100個金幣,E 則一個也拿不到。
現在回推一步。當只剩下3個海盜(C、D、E),由 C 提出方案。他只需要分1個金幣給 E,E 就會投票支持(否則的話,等到由 D 來提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99個金幣,E 拿1個金幣。
再往前一步。只剩下4個海盜(B、C、D、E),B 提方案,他當然也能想到剛才那些推理。他只需給 D 1個金幣,D 就會支持他(如果等到 C 來提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同樣能得到半數支持。
基於上述分析,再看 A 的方案,就很顯然了——A:98,B:0,C:1,D:0,E。
美國數學家納什在1951年發表了一篇小論文名叫《非合作博弈》,其中提出了納什均衡的概念並給出了相應的基於不動點定理數學證明。通俗地說是指在多人的非合作博弈中,如果每個博弈者都無法單方面改善自己的境地,此時的局面稱作納什均衡。馮·諾伊曼已經在《博弈論與經濟行為》一書中證明了:零和博弈必定存在這樣的均衡點。納什的貢獻在於他從零和博弈推廣到非零和博弈,並證明了:這樣的均衡點依然存在。當博弈的局面處於納什均衡,此時的系統是穩定滴,如果每個博弈者都足夠理性,他們都不願意主動改變當前的策略。
換位思考
前面聊的很多博弈相關技能都依賴於換位思考這個能力,你需要站在對手的角度進行思考,才能看清局面,從而更好地選擇自己的策略。一般來說,那些換位思考能力越強的人,也越善於進行強批判思維。
理性人假設
微觀經濟學在進行數學建模的時候,通常都會引入一個理性人假設,假定市場的行為主體是充分理性,此處的充分理性還隱含著掌握充分的信息,引入這個假設是為了數學建模的需要。對任何一個國家大多數人都很平庸,他們的共同點之一是非常不理性。充分理性並且掌握了充分信息的個人,那也絕對是鳳毛麟角,而理性人假設竟然設定市場的行為主體全都是充分理性的。有了博弈論之後,這個非常扯蛋的理性人假設就可以丟到垃圾桶里。
舊的經濟學理論(理性人的解釋)會說——所有公司的老闆都充分理性,也掌握了充分的信息,知道應該生產何種商品,才能滿足市場需求。新的經濟學理論(博弈論的解釋)會說——公司的老闆既有優秀的,也有平庸的。平庸公司生產的商品沒人要,自然會虧損並倒閉。隨著時間的推移,經過自然選擇,活下來的公司當然是那些聰明的。
裝瘋策略
理性的博弈者把自己偽裝成非理性的博弈者,這么干可以獲得某種虛張聲勢的唬人效果。對這種手法,俺稱之為裝瘋策略。
經濟學
談博弈論的影響,當然首先要談它對經濟學的影響。有了博弈論,就不再需要那個扯蛋的理性人假設了,這是博弈論誕生後對微觀經濟的重大影響,還有很多其它的影響。比如說:博弈論誕生前傳統的微觀經濟學以供給需求來建立價格的數學模型。這個模型只考慮了供應量需求量的變化對價格的影響,而完全不考慮供給雙方的力量對比。如果供給雙方中,一方變得強勢或另一方變得弱勢。即使供應量與需求量都維持不變,價格也會發生變動,朝著對強勢方有利的方向移動。
生物學
生物學受博弈論影響最大的分支估計是演化生物學,也就是的進化論。藉助博弈論的研究成果,演化生物學家可以更好地建立物種演化的數學模型。
⑵ 請教各位高手一個簡單的數學建模問題,謝謝,如何將一個不規則的蛋糕平分成兩部分........
可以先將它分成規則圖形幾份,每份切一半,把每份切的半個聚集在一起,就是這塊蛋糕的一半了.
⑶ 一塊不規則的蛋糕上取一點,要經過這一點一刀平均分開,問:怎樣切(數學建模問題)
找一個細長的棍狀物放在蛋糕下面(例如筷子),旋轉蛋糕以使筷子通過蛋糕上p點相應的位置,然後找到平衡點,沿著筷子的方向切就是了。
原理:若截面對某軸的靜矩為零,則該軸必通過截面形心。
⑷ 各位高手如何將一塊不規則的蛋糕平均分成兩份,要用數學建模的方法
作它的一個外切圓,按直徑切成兩塊,應該差不多吧,也比較好求的