AI 新聞與投資
決策與判斷

第7章 期望效用理論 73

8 / 22

為你偏好方案B比偏好方案C更多一些,你當然樂意接受我的提議,並付給我一分錢。 現在你選擇了方案B。同樣的,我也可以提議你放棄方案B並再付一分錢而得方案A(相對於方案B來說,你更偏好方案A一些)。這樣你就得到了方案A。但是,由於你的偏好具有不可傳遞性,我仍然可以提議,你放棄方案 A 並再付一分錢而得到方案C(相對於方案A 來說,你更偏好方案C一些)。 其結果就是,你還是回到了最初的狀態,卻損失了3分錢(或者是3美元、3 000美元,或者其他)。也就是說,我可以繼續利用偏好所具有的不可傳遞性, 把它作為搖錢樹,直到騙光你所有的錢。在以後幾章中,我們將討論違背理性行為中的可傳遞性原則和其他原則的一些例子。 理論的擴充套件繼馮•諾伊曼和摩根斯坦提出期望效用理論後,許多其他理論家對此進行了擴充套件,提出了多個變式。其中最有名的一個變式是由倫納德 •薩維奇(Leonard Savage)於1954年提出的“主觀期望效用理論”。薩維奇的理論與馮•諾伊曼和摩根斯坦的理論相比的最大區別在於,薩維奇考慮到了主觀的,個人的因素。1954年以前,期望效用理論中使用的機率都是經典理論中的客觀機率(例如,以相對頻率為基礎)。薩維奇將這一理論進行了推廣,將人們對某個事件可能發生的主觀機率也納人進來。 如果客觀機率不可能預先得知或是這種結果只會發生一次,這種推廣就顯得十分重要了。比如說,在主觀期望效用理論的框架下,如果一些不可重複事件的發生可能性(如核戰爭)的機率無法透過計算相對頻率來得到,就可以進行人為的估計。而經典效用理論則無法估計“核戰爭爆發的可能性”究竟有多大。 其他理論家也對經典效用理論進行了補充和完善。例如,鄧肯•盧斯 (Duncan Luce, 1959)和其他人一起建立了一個他們稱之為“隨機的” 選擇模型—這一模型認為偏好具有隨機成分。在隨機模型出現之前,效用理論家很難解釋清楚為什麼頭一天偏好喝湯而第二天卻偏好沙拉。盧斯解釋這一問題的方法是,將對湯和沙拉的偏好作為一種隨機機率而不是100%固定的選擇。 彼得 •菲什伯恩(Peter Fishbur,1984)、尤德爾• 卡梅卡(Udar Karmarkar,1978)、約翰•佩恩(John Payne,1973)和克菜德•庫姆斯(Clyde Coombs,1975)等人對期望效用理論進行了更進一步的擴充套件,並提出了其他一些替代理論。雖然期望效用理論常常被作為一個整體理論來進行探討,但實際上期望效用理論指的是一個理論系,而不是某個特定的理論(雖然“期望效用理論”也常常作為馮•諾伊曼和摩根斯坦理論的一個簡稱)。

74 第三部分決策模型結論保羅 •休梅克(1982,P. 529)對期望效用理論及其變數做了一次全面回顧,他認為:“可以毫不誇張地說,期望效用理論是自二戰以來決策研究的主要正規化。”確實,在決策理論中,這一理論所引起的研究和討論比其他理論所引起的研究和討論都要多。但是,正如第8章所示,經典期望效用理論卻存在一些棘手的問題和悖論。這些問題使得部分決策研究者放棄了期望效用理論而去尋找更有用的替代理論。 醬第8章理性決策的悖論雖然期望效用理論的原則聽起來好像是合理的,但在許多情況下決策者卻會違背這些原則。例如,第6章的框架效應表明,決策者常常會違背恆定性原則(如果要進一步瞭解違背恆定性原則和佔優性原則的例子,參見特韋爾斯基和卡尼曼,1986)。在這一章中,我們主要討論違背相消性原則和可傳遞性原則的例子。 阿萊悖論根據相消性原則,在兩個方案中做出選擇應該只取決於它們之間的差異 ——而不是兩種方案所具有的共同點。兩種方案所具備的相同因素不應該影響到理性人所做的選擇。比如說,你要在兩輛車之間進行選擇,而它們具有同樣的質量,那麼質量這一因素就不應該影響到你的選擇。 從表面看來,這一原則看似有理;如果兩輛車有同樣的質量,為什麼要讓質量的高低來影響你的選擇呢?理性決策者應該是根據兩種方案的不同方面來進行選擇。但1953年,一位名叫莫里斯 •阿萊斯(Maurice Allais)的法國經濟學家發表了一篇文章,向相消性原則提出了挑戰。在這篇文章中,阿萊斯(1953)簡要概述了他的阿萊悖論—這一悖論顯示了違背相互抵消原則的情況。讓我們來看一看這一悖論是怎樣起作用的。 假設我提供給你兩種選擇,A和B。如果你選擇 A,你一定能夠得到100 萬美元。但如果你選擇B,就有10%的機率得到250萬美元,有89%的機率得到100萬美元,1%的機率什麼也得不到。也就是說,你的選擇如下: 選項A:肯定會獲得100萬美元選項B:10%的機率獲得250萬美元,89%的機率獲得100萬美元,1%的機率什麼也得不到你會做出什麼樣的選擇?(參見讀者調查中第28 題(1)的答案。)實驗結果是,即使選項B 的期望值大於100萬美元,大多數的人仍然會選擇A 以得到一個確定的數額。將選項B中的可能結果與其機率相乘後,可以計算出選項B

76 第三部分決策模型的期望值(EV)實際上為114萬美元,比選項A 的期望值更高: EV(B) = (0.10) (2 500 000美元)+(0.89)(1000000美元) +(0.01)(0美元) = 1140 000 美元雖然如此,大部分的人仍然願意獲得一個確定的100萬美元的數額。 現在,假設我提供給你另外一個選擇。這一次,選項 A 有11%的機率獲得 100萬美元,89%的機率什麼也得不到;而選項B則有10%的機率獲得250萬美元,90%的機率什麼也得不到。也就是說,你的選擇如下: 選項A:11%的機率獲得100萬美元,89%的機率什麼也得不到選項B:10%的機率獲得250萬美元,90%的機率什麼也得不到這次你會如何選擇?(參見你在讀者調查中第28題(2)的答案。)大多數人會選擇B。他們通常會這樣認為,10%與11%盈利機率的差別很小,但100 萬美元和250萬美元的差別卻很大。而且,選項B 的期望值也最大。選項B的期望值是250萬美元的1/10,也就是25萬,這是選項A的期望值(100萬美元的11%是11 萬美元)的兩倍多。問題或者說是悖論在於,在第一種情況下選擇A 的人在第二種情況下也應該選擇A一 -否則就違背了相互抵消的原則。 10W 89R 1B A 第一種選擇 $1M 10W $1M 89R $1M IB B $2.5M $1M $0 10W 89R 1B A 第二種選擇 $1M 10W $O 89R $IM 1B B $2.5M 圖8.1 $O 阿萊悖論 $0

第8章理性決策的悖論 77 為了說明這一點,現在假設每個選擇的結果是透過從罐子裡的100個彩色小球中隨機抽取來決定:89個紅球(R),10個白球(W),1個藍球(B)。在第一種情況下,選項A 代表抽到紅球、白球或是藍球中的任意一個就可以獲得 100萬美元(也就是說,不管抽到什麼都可以得到100萬美元)。選項B則代表抽到紅球可以得到100萬美元,抽到白球可以獲得250萬美元,抽到藍球則什麼也沒有。按照同樣的邏輯,在第二種情況下,選項A 代表抽到白球和藍球都可以獲得100萬美元,抽到紅球則什麼也得不到。而選項B則代表抽到白球可以得到250萬美元,抽到紅球或藍球則什麼也沒有。 由此看來,你會發現兩種情況實際上提供了完全相同的選擇,只是在第一種情況下無論你選擇哪一個選項,抽到紅球你都可以獲得100萬美元,而在第二種情況下無論你選擇哪一個選項,抽到紅球都表示什麼也沒有。在兩種情況下選項A 都表示,抽到白球和藍球可以獲得100萬美元;選項B則表示,抽到白球和藍球分別可以獲得250萬美元和0美元。第一種情況下的選項A 和第二種情況下的選項A相比較,除了89%的機率可以多獲得100萬美元以外完全相同;第二種情況下的選項B和第二種情況下的選項B相比較,除了89%的機率可以多獲得100萬美元以外也完全相同。 所以說,附加的等同結果—在第一種情況下紅球代表100萬美元,而在第二種情況下紅球則代表一無所獲—使得人們做出了不同選擇。這種差異恰恰違背了相同因素相消性的原則。因為根據相消性原則,在對兩種選項做出選擇時,只應該以它們的差異為依據,而不以它們的共同點為依據。 埃爾斯伯格悖論另外一個違背相消性原則的著名例子則由丹尼爾•埃爾斯伯格(Daniel Ellsberg,1961)提出。埃爾斯伯格悖論是這樣的:假設缸裡有90個球,30個是紅色的,剩下60個要麼是黑色要麼是黃色,其比例未知。從缸裡抽出一個球,球的顏色將決定你的收益(見圖8.2a 的列表)。 你會在哪種顏色的球上下注——紅色還是黑色?大多數人都選擇了紅球, 以避免黑球和黃球混合比例的不確定性。但如果給出的收益列表如圖8.2b所示,你又會在哪個顏色上下注呢?在第二種情況下,大多數的人偏好在黑球或黃球上下注,而不是在紅球或黃球上下注。這也是為了避免黑球和黃球混合比例的不確定性。也就是說,大多數的人在第一種情況下會選擇選項1,而在第二種情況下則會選擇選項2。 但根據相消性原則,人們在兩種情況下應該選擇同樣的選項。這可以從圖 8.2看出,兩種情況的結果只有一點不同,那就是在第一種情況下黃球表示什麼也得不到,而在第二種情況下則表示100美元。由於在兩種情況下選項1和選項2中的黃球都代表相同的數額(在第一種情況下代表0美元,在第二種情

78 第三部分決策模型圖8.2a 埃爾斯伯格悖論第一種情況下的結果 30個球 — 下注選項選項1:一個紅球選項2:一個黑球紅色 100 美元 0美元 60 個球黑色 0 美元 100 美元黃色 0 美元 0 美元圖8.2b 埃爾斯伯格驚論第二種情況下的結果。惟一的變化是黃球現在表示100美元而不是 0 美元。 30個球紅色 100 美元 0美元 60個球下注選項選項1:一個紅球或黃球選項2:一個黑球或黃球黑色 0 美元 100 美元黃色 100 美元 100美元況下代表100美元),因此兩種情況下黃球的價值都不應該影響到對選項1和選項2的選擇(正如相同的質量不應該影響到對兩輛車的選擇一樣)。但與期望效用理論相悖的是,人們常常在兩種情況下做出不同的選擇。 不可傳遞性另外一個理性決策原則是備選方案應該具有可傳遞性,也就是說,如果一個決策者在結果A和B 中偏好 A,在結果B和C中偏好B,那麼在結果A和C 中就應該偏好 A。第7章曾討論過,一個具有不可傳遞性偏好的決策者容易被別人當做“搖錢樹” 來使。圖8.3給出了有關不可傳遞性的另外一個例子。 假設你必須在3個求職者中做出選擇(圖8.3中的求職者A、B和C),你已經有了關於他們才智和經驗方面的資訊。再進一步假設你的決策原則如下: 如果兩人的1Q 差距超過10分,選擇更有才智的人;如果兩人的1Q 相差不超過 10分,選擇更有經驗的人。 這聽起來倒不失為一個合理的原則,但如果你遵循這一原則就有可能會面臨困境。如果將求職者A與B相比較,我們應該選擇B,因為A和B的才智相差不超過10分,而B卻比A有經驗得多。同樣,如果將求職者B與C比較, 我們應該選擇C,因為B和C的才智相差不超過10分,而C卻比B 有經驗得多。但如果我們將求職者C與A相比較,我們應該選擇A,因為A的1Q比C 的1Q高出了10分以上。也就是說,A 和B 中應該選擇B,B和C中應該選擇 C,而A和C中則應該選擇A。這種不可傳遞性出現的原因在於,決策標準有兩個維度—才智和經驗——而這兩個維度都是小幅遞增且呈負相關的。 現實中的人們是否會違背可傳遞性原則呢?1969年阿莫斯•特韋爾斯基發表了他的研究,在這項研究中有1/3的被試表現出了不可傳遞性。特韋爾斯基第8章理性決策的悖論 79 圖8.3 以下的決策原則使得很難在A、B、C3個求職者中做出選擇,因為此時的偏好是不可傳遞的:如果兩人的IQ 相差超過10分,選擇更有才智的人;如果兩人的IQ 相差不超過 10分,選擇更有經驗的人。 維度求職者 A B C 才智(I9) 120 110 100 經驗(年限) 1 2 3 向18名哈佛研究生展示了圖8.4中所列出的5種賭博遊戲。正如你所見,每個賭博遊戲的期望值隨著獲勝機率遞增,隨著獲勝金額而遞減。隨機挑選一對賭博遊戲展示給學生,要求他們選出更喜歡的一種遊戲。遊戲的配對有10種可能(A和B、A 和C,等等)。學生做了3次選擇後,特韋爾斯基從中挑出8名表現出不可傳遞性傾向的被試,讓他們每週去一次他的實驗室,進行一項為期 5周的深人研究。 他發現,有6名學生表現出可信度較高的不可傳遞性。當兩個選項具有十分相近的獲勝機率時(如賭博遊戲A 和B),被試會選擇具有更高獲勝金額的選項。與之相反的是,當兩個選項的獲勝機率相差懸時(如賭博遊戲A和 E),被試會選擇具有更高獲勝機率的選項。也就是說,A比B好,B比C好, C比D好,D比五好,而E卻比A好。特韋爾斯基(1969)採用了與上面所述的求職者選擇相類似的問題,也發現了不可傳遞性的存在。 不可傳遞性並不只是實驗上的一個新奇事物,它對決策者來說也具有非常重要的啟示。舉例來說,考慮一下決策研究者們所熟悉的“委員會問題”。在一個典型的委員會問題例子中,一個委員會里一般有5個成員:安、鮑伯、辛迪、丹和埃倫。他們的任務是聘用一名新教授,3個候選人如圖8.5所示。 假設你是委員會的主席,你知道每個人的偏好,並且你希望能夠控制投票以使得阿爾•愛因斯坦被選中。你應該怎麼做? 圖8.4 阿真斯•特韋爾斯基(1969)採用以下的賭博遊戲對偏好的不可傳遞性做了買驗。 將每個遊戲的獲勝機率和獲勝金類相乘,即可得到每個遊戲的期望值(EV) 賭博遊戲獲勝機率獲勝金額(美元) A 7/24 5.00 B 8/24 4.75 c 9/24 4.50 D 10/24 4.25 E 11/24 4.00 期望值(美元) 1.46 1.58 1.69 1.77 1.83 -

80 第三部分決策模型圍8.5 在一個典型的委員會問題中,偏好排序如下。數字越低代表的偏好程度越高(例如, 安在喬•施莫和筒•多伊中更喜歡喬 •施莫,而在筒•多伊和阿爾•愛因斯坦之間更喜歡簡•多伊) 候選人喬•施莫簡•多伊阿爾,愛因斯坦安鮑伯 2 3 3 2 委員會成員辛迪 2 3 1 丹 3 2 埃倫 3 1 2 答案就是你應該避免在愛因斯坦和多伊之間直接投票,因為5個委員中有 3個人都更加偏好多伊而不是愛因斯坦(安、丹和埃倫)。相反,你應該讓他們就施莫和多伊之間選擇誰進行投票,等到施莫贏了以後再安排在施莫和愛因斯坦之間進行投票。另一方面,如果你更希望僱傭多伊,你應該先就施莫和愛因斯坦之間進行投票,再在愛因斯坦和多伊之間進行投票。由於在成對比較中委員們的偏好具有不可傳遞性,因而安排投票程序的人能完全控制結果。 偏好逆轉違反不可傳遞性原則還不是最糟的,因為有的時候甚至連偏好都會隨著情境的變化而發生逆轉。薩拉•利希滕斯坦和保羅•斯洛維奇於1971年發表的實驗是有關偏好逆轉的最早的實驗之一。利希滕斯坦和斯洛維奇推斷,當需要從一對賭博遊戲中做出選擇時,其心理過程可能有別於單獨在每種賭博遊戲上出價的過程(也就是說,對一項賭博遊戲單獨設定一個金額)。具體來說,他們認為二選一的選擇是由賭博的獲勝機率決定的,而單獨出價則主要是由輸羸的金額決定的。 為了驗證這一假設,他們進行了3個實驗。在每一個實驗中,他們首先向被試演示了幾組賭博遊戲。每組中的兩個遊戲具有十分相近的期望值,但一個遊戲具有很高的獲勝機率,而另一個則具有很高的獲勝金額(見圖8.6)。在每組中做出選擇後,被試還需要在單獨考慮每種賭博的情況下出價。被試被告知,他們有一張玩賭博遊戲的門票,他們需要說出願意賣出這張票的最高價和最低價。 在第一次實驗中,大學生們需要指出他們在每組賭博中更偏好哪個遊戲, 以及他們願意以怎樣的價格賣出其持有的門票。利希滕斯坦和斯洛維奇衡量偏好逆轉的方法是,假定當兩個遊戲配對出現時,被試所選擇的是獲勝機率高的遊戲,則計算高獲勝金額遊戲門票售價超過高獲勝機率遊戲門票的次數百分比。利希滕斯坦和斯洛維奇發現,73%的被試總是表現出這種偏好逆轉。第二