版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

關(guān)于博弈的基本常識

北京理工大學(xué)
原創(chuàng)
北京理工大學(xué)官方科普號,i北理愛科學(xué)
收藏

關(guān)于博弈的基本常識

王杰衛(wèi)

一、博弈的分類

博弈可根據(jù)不同的分類方式進(jìn)行劃分,例如根據(jù)參與者的行動順序、對其他參與者的了解程度以及是否存在合作關(guān)系等進(jìn)行分類。

1、按照參與者出招的順序、博弈持續(xù)時(shí)間和重復(fù)次數(shù)的角度,博弈可分為靜態(tài)博弈(Static Game)和動態(tài)博弈(Dynamic Game)。 靜態(tài)博弈指的是各方同時(shí)采取策略,而各方的收益則取決于不同的策略組合。因此靜態(tài)博弈也被稱為“同時(shí)行動的博弈”(Simultaneous-Move Games)。盡管有時(shí)博弈方采取策略有先后之分,但他們并不了解之前其他人所做出的策略。比如在“囚徒困境”中,當(dāng)罪犯1做出策略后,輪到罪犯2時(shí)他并不知道罪犯1所做出的策略。 動態(tài)博弈(序貫博弈)指的是參與博弈的方在選擇策略時(shí)有先后順序,且能夠了解先行動者所選擇的策略。

2、從博弈者對其他參與者了解的程度方面,博弈可分為完全信息博弈(Complete Information Game)與不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)與不完美信息博弈(Imperfect Information Game),確定的博弈(Certainty Game)與不確定的博弈(Uncertain Game),對稱信息博弈(Symmetric Game)與非對稱信息博弈(Asymmetric Game)等。 完全信息博弈指的是每個(gè)博弈者對其他博弈者的特征、策略空間和收益函數(shù)都了解,即所有博弈者都知道博弈者的收益集(Pay offs)。完美信息則指的是博弈者在采取策略時(shí)完全知曉其他博弈者的所有策略信息。完美信息涉及到記憶,即博弈者了解博弈過程中的所有信息。如果博弈者在采取策略時(shí)觀察到的信息節(jié)點(diǎn)是唯一的,則表示他對過去信息有完美的記憶;否則,他對之前信息的記憶不完美。因此,完全信息不一定意味著完美信息,而不完全信息則一定不是完美的。 不完全信息博弈指的是某些博弈者對其他博弈者的特征、策略空間和收益函數(shù)了解不夠全面,或者說并非所有博弈者對這些信息了解充分。在不完全信息博弈中,首先行動的是自然(Nature),自然決定博弈者以何種可能性采取某種策略,而這種可能性只有自然本身知道。確定的博弈則是指不存在由自然做出這種行動的博弈,否則就是不確定的博弈。

3、從博弈者之間是否存在合作關(guān)系的角度來看,博弈可分為合作博弈(Cooperative Game)和非合作博弈(Non-Cooperative Game)。 合作博弈指的是博弈者之間有一定程度的合作協(xié)議,他們需要在協(xié)議允許的范圍內(nèi)進(jìn)行博弈。例如,兩家企業(yè)可能通過談判達(dá)成協(xié)議,約定各自的產(chǎn)量或價(jià)格,以達(dá)到共同壟斷市場的目的。相反,如果博弈者無法通過談判達(dá)成具有約束力的協(xié)議以限制彼此的策略選擇,則這種情況被稱為非合作博弈。 非合作博弈可以進(jìn)一步細(xì)分為:完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈。對應(yīng)于這些情況的有四種均衡:納什均衡(Nash Equilibrium)、子博弈精煉納什均衡(Subgame Perfect Nash Equilibrium)、貝葉斯納什均衡(Bayesian Nash Equilibrium)、精煉貝葉斯納什均衡(Perfect Bayesian Nash Equilibrium)。

|| ||

4、根據(jù)博弈者的收益情況,博弈可以被歸類為零和博弈(Zero-Sum Game)與非零和博弈(Non-Zero-Sum Game),以及常和博弈(Constant-Sum Game)與變和博弈(Variable-Sum Game)。零和博弈已經(jīng)在先前有所介紹,而非零和博弈指涉的是博弈各方的總收益不為零。常和博弈是指各方的總收益始終保持常數(shù),而變和博弈則是指各方的總收益并非固定不變。

二、博弈中的參與方(博弈方)

1、單人博弈

單人博弈僅涉及一方參與者,可視為一般優(yōu)化問題。在這種情況下,博弈者在給定條件下選擇何種策略以最大化自身收益,而不考慮其他博弈方的影響。單人博弈的分析有助于理解更為復(fù)雜的多人博弈。

2、雙人博弈

雙人博弈由兩方構(gòu)成,例如兩人玩猜硬幣、囚徒困境等,這類博弈最為普遍。

3、多人博弈

在多人博弈中,參與者達(dá)三人或三人以上。每個(gè)博弈方獨(dú)立做出決策,需要在其他博弈者做出反應(yīng)的情況下找到使自身收益最大化的策略。雖然多人博弈與雙人博弈相似,但其復(fù)雜性更高,可能存在“破壞者”,其策略選擇對自身利益無影響,但對其他博弈者的收益產(chǎn)生影響。

三、博弈中的策略(Strategies)

在博弈中,每個(gè)博弈者根據(jù)情況做出的決策被稱為“策略”,博弈者可選擇的所有策略構(gòu)成“策略空間”。該空間可以是離散或連續(xù)的。如果博弈者可選擇的策略是可數(shù)的,例如在“囚徒困境”中,每個(gè)博弈者只有“坦白”和“不坦白”兩種策略,這被稱為“有限次博弈”,可用收益矩陣、擴(kuò)展形式等方法表示;如果博弈者可選擇的策略是不可數(shù)的,例如古諾模型中的連續(xù)模型,每個(gè)工廠可有無數(shù)種策略,這被稱為“無限次博弈”,通常以數(shù)集或函數(shù)形式表示。

四、博弈中的收益(Payoffs)

博弈中的收益是博弈者從中獲得的利益,類型多種多樣,例如收入、利潤、時(shí)間或情緒價(jià)值等。一般來說,有限次博弈的收益可用收益矩陣表示,而無限次博弈的收益可用收益函數(shù)表示。

五、博弈的過程

博弈過程可包含先后、反復(fù)或重復(fù)的策略對抗。根據(jù)博弈過程,可分為“靜態(tài)博弈”、“動態(tài)博弈”和“重復(fù)博弈”。

1、靜態(tài)博弈(Static Games)

靜態(tài)博弈要求所有參與者同時(shí)做出決策。即使決策時(shí)間不同,但在做出決策之前,參與者不知道其他博弈者的選擇,且在了解其他博弈者決策后也不能改變自身策略。

2、動態(tài)博弈(Dynamic Games)

動態(tài)博弈中,博弈方的決策有先后順序。后決策者在做出決策之前可以看到前面博弈者的選擇,甚至包括自己的決策。動態(tài)博弈也稱為“多階段博弈”。

3、重復(fù)博弈(Repeated Games)

重復(fù)博弈是指同一博弈進(jìn)行多次。構(gòu)成重復(fù)博弈的一次性博弈也稱為“原博弈”或“階段博弈”。大多數(shù)重復(fù)博弈的原博弈是靜態(tài)博弈,或由靜態(tài)博弈構(gòu)成的。重復(fù)博弈的最少重復(fù)次數(shù)為兩次,有的重復(fù)博弈會進(jìn)行有限次數(shù),如體育競技中的多局制比賽,也有的進(jìn)行無限次數(shù),如市場中企業(yè)的競爭。重復(fù)博弈的每次博弈之間存在相互影響和制約,無法將其分解為獨(dú)立的博弈進(jìn)行分析。

評論
陳 光 輝
少師級
博弈過程可包含先后、反復(fù)或重復(fù)的策略對抗。根據(jù)博弈過程,可分為“靜態(tài)博弈”、“動態(tài)博弈”和“重復(fù)博弈”。
2024-06-28