本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
, k% n1 Q- @& ~; A8 s+ M5 D0 Q9 ]( O) Y$ O
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 V8 ?+ h L* X' f( H, V8 v 以下三个定义:
# @5 T! C; y$ F$ I5 c$ D* B 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # x% v; @& a' W
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 `! a+ }+ D# ~7 K
所谓的双方优势策略则是指双方利益总和最大的策略。 6 R' \/ l$ R# |! V0 Y
[编辑本段]严格优势策略举例分析
( c: q0 k; s1 I8 g 一、经典的囚徒困境
: M) A" u- o: S 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ A/ P+ z8 B" E1 ^8 R) h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ z d2 O M+ D8 R E& [
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 }% C! l0 C, x: G$ o( P' s. c/ q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 t0 _+ }' z: n) z, r- J 若二人都互相检举(互相“背叛”),则二人同样判监2年。
% \; m: ^* k, }# Z i
2 J* n0 f+ u2 Y& a- y用表格概述如下:; W6 P, P8 v# p1 Z4 F
% w+ W# i( E6 ~2 S) b2 X3 ] 甲沉默(合作) 甲认罪(背叛) 9 S* ?7 e) k& v* T3 W/ y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 [0 H2 T+ b% P7 O* k7 J' j乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . V- e" x* ?, g' s7 Q& t4 }
2 N0 O" O! q3 a% o
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 Z/ p4 d/ ^7 X ~
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 Y+ f5 m6 s# B- `/ M 若对方沉默、背叛会让我获释,所以会选择背叛。
: z; \4 m2 F0 ^ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : A3 [, ?9 M/ O9 G* `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) ]7 g% v2 Z2 c$ M; n% ~; {
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 S/ N2 Y# @7 n3 Z 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# o( P! B9 o( [ {7 u
[编辑本段]二、智猪博弈理论- k) g! v+ z f1 J
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( @3 I! N& @5 q4 C6 j+ Y1 ` 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 M) s1 F/ A! h; N
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 p% l$ `% o* w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( j1 G" s5 l6 G0 @1 j
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) o+ t( Y( t# Y+ `; Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 R( E& L! X5 `1 `, P% L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 }- \* H, h) B, [* }( a
/ n( d+ r! R) T/ J) h三、关于企业价格策略
: N1 j0 ?: S5 X$ f S7 ~. g, _1 L" b W# W! \( r! t7 U' r! B/ C) N: O$ d# E/ ]
$ d# F* S- P! i1 @
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ I& j6 W V E+ X 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ \6 R% N% n" [
以下三个定义:0 G7 M' s6 I- `, c/ F
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 J3 \& T* Y2 F" u o& p
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 r$ o. c9 r* b' r% F6 k. t+ k
所谓的双方优势策略则是指双方利益总和最大的策略。 5 G$ M3 b. ~% B1 [- E
[编辑本段]严格优势策略举例分析
. N( a1 x& l# E" O 一、经典的囚徒困境 + { h7 V+ F* @0 n/ D1 X a9 r$ h b4 H
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 F% j) i/ j! I9 d5 l 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 ]8 d- w" h: J! H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! I9 u8 S$ H6 { F. M! v$ O7 B
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % i7 ?5 s6 o! ? ?0 a! r* s
若二人都互相检举(互相“背叛”),则二人同样判监2年。
# p" N3 {7 \- o) t( a - E5 W# }2 u: g
用表格概述如下:) H6 Y2 Y! @; B7 ]* V
5 S: m2 \/ M$ T% F |
甲沉默(合作) 甲认罪(背叛) o0 d M3 q, W- c- N
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 P7 r* z- R2 G" z- T乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + e7 W9 {; H2 N" b; t
& O# a5 m. T3 g( I9 X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ V- [8 d$ G# S3 G8 Q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 t' ~$ Q' o$ x) r+ O; X$ N 若对方沉默、背叛会让我获释,所以会选择背叛。
1 E; [, J. i. m2 w: L; B 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 O6 K# o, X$ K2 d5 b& [3 A; Q
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 c2 m% K1 {5 Q# b, I
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( l% D: [# m$ G' O/ s! a7 V
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" z; i# S. S: i# X' G6 J; H. I[编辑本段]二、智猪博弈理论! {/ q) ]2 D I
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, w8 C! |4 A( c) v 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # X) S' V4 s; |- G
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : G% C5 G4 y6 s4 @5 A0 @ Y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 R! b" k% h, M; [. I
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 z9 k+ j8 |! a! M) N. I0 d6 E
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; B2 D4 G5 K/ s: I) y& q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 I) K+ z( L1 ?6 G0 _" O
% F# c9 ^$ Q8 s7 c7 P三、关于企业价格策略
8 d. P+ U# m L ]$ T$ q, P Y( b6 C
: y m$ i# T8 P) l* j i 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * _2 @( o0 M3 }1 ^! o R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 H x0 o9 e3 P' E# l3 M 以下三个定义:- v: J0 l0 ]4 I# N" T
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, }# C( N: n. d7 t 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 d1 v' s* \8 G5 V; C3 r
所谓的双方优势策略则是指双方利益总和最大的策略。 / _! I, _& N! q) K
[编辑本段]严格优势策略举例分析: y0 G8 G! F( t# W+ Y. v% o+ P8 i
一、经典的囚徒困境 + h& y6 @& m4 V
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' f- `! @0 c/ a2 r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 f5 _- l& F0 X# u1 S 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 ^/ {8 n5 }# R4 g# z0 }4 n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 # O1 _" w! K+ Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. M2 E) I" s+ P1 o w3 \
/ a- ~7 w5 X/ X用表格概述如下:7 \' E0 g0 t7 l0 Q- E
% H0 X. h5 P, G ~
甲沉默(合作) 甲认罪(背叛)
- X+ b2 P- f' K* s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & q3 G3 ?/ d; z: B/ Z( ^
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; X4 m; c4 f* W6 U9 _
0 ]6 ?$ w+ M4 f 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) b5 }* ]3 t* N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! q* D) @2 Y) n7 M$ } 若对方沉默、背叛会让我获释,所以会选择背叛。 9 X$ g$ ?- X, F# L
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
f! {! R' J* P* c0 w" b 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 W( Z4 H& U. |1 T/ K 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* m; ~1 p: U! A9 j0 a 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 x w9 ^9 Q [
[编辑本段]二、智猪博弈理论( Y q- m" ^" k9 Q3 S! \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! d) M$ t+ {, z% e1 i4 L; g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! I6 X4 V7 i+ D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" m) ]0 f- {6 S" C x 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 e$ a$ L4 j6 p6 b6 X) U$ K# L/ I “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 l9 u9 m% C: i: L( o 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / z/ U9 O, ^6 ~' B1 A1 m) v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。# X$ y* l* ^- f6 \/ G
4 @! `2 U) C4 d' w# r W# S- ?
三、关于企业价格策略
1 q9 F3 B7 D& r
' j8 o- ^. y l: t4 @: O + ?0 J, \ v! C6 {
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 \4 U' M5 b$ e5 L9 K
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" g3 t( J1 z9 }' d6 t' L: l 以下三个定义:, m& E! b' h* b# {
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 d* T8 v# r+ @. Q: Y+ r+ X* u
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) @. q& ]! M% v4 K3 ~
所谓的双方优势策略则是指双方利益总和最大的策略。 1 n7 v7 @0 @9 ?( m$ E r* G
[编辑本段]严格优势策略举例分析! ~3 I- b) B3 N5 |! l, F) l
一、经典的囚徒困境
8 V& L% p8 q) j" o3 k 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) M5 U4 P6 k$ c, |* s1 k t 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 G. _0 k9 u; Y6 P1 o 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& [2 r6 e: X2 a; {9 [8 x# ?! {+ w, Z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / ~; ^- n& C+ D' n! ? _- t7 F/ x+ `
若二人都互相检举(互相“背叛”),则二人同样判监2年。- ]5 A6 H B: [1 G
1 v8 M0 w- w. B, G0 J用表格概述如下:
% [" S$ Y& t& u( q8 Y8 f: r. @ g `
甲沉默(合作) 甲认罪(背叛)
}6 q# H9 s6 _* N7 U乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. b4 M% y$ R7 w- g) j( S乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ ]" z+ P5 k7 F- S
/ [ P" O+ W. F7 G& U& c 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 d/ [+ p4 K7 H# L
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. H4 t5 l; z6 ~( z! ~ 若对方沉默、背叛会让我获释,所以会选择背叛。 & d: E& F9 k% \. j: S) L
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ D/ \) x! c# s+ g' Y* r9 u 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( h0 J0 W5 I7 e; ]
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + P5 y) F L( P% }- K3 I9 Z! f5 ]
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! p* R# B6 s) y/ E; y: Q
[编辑本段]二、智猪博弈理论- G- @' O6 Q E; G1 J
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " l6 E/ H2 r1 O6 o
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . m) `6 X% U" k5 _2 I, O: b' d5 T h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + ]% ~+ _5 `9 G5 ?, I& L! [
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 b" G6 A1 O) I/ \1 Y3 d
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ S9 J% ~3 Z" g) |: f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 s8 q9 _3 a# _# H 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 v% y B/ X0 V/ [9 e1 d: Z4 T, v) t$ }. R
8 X5 p& \: [' n5 N# f7 k4 _三、关于企业价格策略
- h1 C: w- F8 Q8 O
# q7 o) l9 z5 C/ d1 Y$ R7 Y
2 R! W( m5 j2 ]. x) K9 a/ R 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ u" x$ k& s3 m$ e/ @- f 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |