AI 新聞與投資

領域的4倍，貝葉斯定理就會認為，你必須相信湯姆是電腦科學家的機率是11%。此外，如果基礎比率是80%，那你眼中的新機率就應該是94.1%，以此類推。數學問題與本書並無關聯。關於貝葉斯定理，有兩點我們要銘記在心，要知道我們總是喜歡把事情搞得一團槽。第一，基礎比率十分重要，即便是在手頭的案例已有證據的情況下依然如此；第二，透過分析證據得到的直觀印象通常都會被誇大。眼見即為事實與聯想一致性的結合易使我們相信自己編纂的故事。以下是對貝葉斯定理關鍵點的總結： •以相對合理的基礎比率對結果的可能性作出判斷。 •質疑你對證據的分析。這兩個理念都是直接明瞭的。當我意識到自己從未學習過怎樣運用它們時，我感到非常震驚，即使是現在，我仍舊覺得自己在踐行這兩個理念時總有些不自然。示例——典型性與基礎比率 “草坪修整得很好，接待員看起來很能幹，傢俱也十分搶眼，但這並不意味著這是一家經營狀況良好的公司。我希望董事會不要依照典型性啟示作出判斷。” “這家新成立的企業看起來好像不會倒閉，但是這個行業的成功基礎比率非常之低。我們又怎麼能知道這家企業就是個特例（一定能成功）呢？” “他們一直在重複犯同樣的錯誤：用並不充分的證據來預測罕見的事件。當證據不充分時，我們應該以基礎比率作為判斷依據。” “我知道這份報告絕對是具有毀滅性意義的，也許它的證據十分確鑿，但我們憑什麼相信呢？我們必須在做計劃時保持一定的懷疑態度才行。” 00 135

第15章琳達問題的社會效應我們的實驗中最著名也最受爭議的地方是設計了一位虛擬的女士，名叫琳達。阿莫斯和我擬造了琳達問題，用以說明啟發式在判斷中的作用以及它與邏輯相悖的地方。以下是我們對琳達的描述：琳達，31歲，單身，一位直率又聰明的女士，主修哲學。在學生時代，她就對歧視問題和社會公正問題較為關心，還參加了反核示威遊行。 20世紀80年代聽到這個描述的人常常會笑出聲來，因為他們馬上就知道琳達曾在加州大學伯克利分校上過學，因這個學校以有一批熱衷政治的激進學生而著稱。在一項實驗中，我們給受試者看了一張單子，上面列有琳達可能會出現的8種情況。在湯姆問題中，有些人透過典型性對湯姆的專業進行排序，而其他人則透過機率做出排序。琳達問題也是如此，但有些新的變化。琳達是小學老師。琳達在書店工作，她還在學瑜伽。

第15章琳達問題的社會效應琳達積極參與女權運動。琳達是婦女選民聯盟成員。琳達是銀行出納。琳達是保險推銷員。琳達是銀行出納，還積極參與女權運動。這個問題從幾個方面透露出年代的資訊。“婦女選民聯盟”如今的地位已經不再像從前那樣突出了，“女權運動”雖說見證了過去30年裡女性地位的變化，但這種說法今天聽來也已經很陌生了。然而即使在當今這個 “臉譜”時代，我們仍然很容易猜到人們會對這位女士作出高度一致的判斷：琳達非常適合當一個激進的女權主義者，也相當符合在書店工作且學習瑜伽的身份特徵，不過卻不怎麼適合做銀行出納或是保險推銷員。琳達不可能只是一名普通的銀行出納吧？現在請注意這張單子上有一點很重要：琳達更像一名（普通的）銀行出納，還是更像一名積極參與女權運動的銀行出納？所有人都認為琳達更像是“主張女權主義的銀行出納”，而不是普通的銀行出納。普通的銀行出納不會熱衷女權主義，加上這個細節，整個描述便更像是一個有條理的故事了。但是在判斷機率的過程中會讓人有些糾結，因為上述兩種情況之間存在一種邏輯關聯。按照維恩圖解來說，積極參與女權主義的銀行出納的集合包含在銀行出納的集合之中，因為每個持女權主義理念的銀行出納本身還是銀行出納。因此，琳達是位積極參與女權主義的銀行出納的機率，就一定比她只是個（普通的）銀行出納的機率低。當你想更加詳盡地說明某個可能的事件時，只能降低其機率。因此這個問題使典型性直覺和機率邏輯兩者對立起來。我們的首次實驗是一次受試者組間實驗（between-subjects）。每位受試者都看到一組列有7個結果的單子，其中只包括幾個重要結果中的一個（“銀行出納”或“積極參與女權主義的銀行出納”）。有些人透過相似度來排序，而其他人則透過機率排 137

思考，快與慢 THINKING， FAST AND SLOW 序。就像湯姆問題出現的結果那樣，透過相似度和機率得出的平均排序結果是相同的。在兩種情況下，“積極參與女權主義的銀行出納”都比“銀行出納”的排序要靠前。然後我們運用受試者組內設計（within-subject）對此項實驗作了更深入的研究。我們設計了你此前看到的那份調查問卷，其中“銀行出納” 排在第六位，“女權主義銀行出納”位於最末。我們相信受試者會注意到兩個結果之間的關係，而且他們的排列也應該會符合邏輯。事實上，我們對此非常有把握，不必再專門做個實驗來證實這個想法。我的助手當時正在實驗室裡做另一項實驗，她讓受試者一邊在報酬表上簽名（臨走前要領報酬），一邊完成這項關於琳達的問卷。後來我隨意一瞥，看到助手書桌上的檔案盒裡已經放了10份調查問卷了，而且所有的受試者都認為（琳達是）“積極參與女權主義的銀行出納”比“銀行出納”的可能性更大。當時我太驚訝了，因為自己有了一個重大發現，因此我至今對那張灰色金屬質地的書桌以及當時每張表的位置仍記憶猶新。當時我興奮極了，趕緊給阿莫斯打電話，告訴他我們有了重大發現：我們讓邏輯與典型性互相競爭，結果典型性贏了！我們還觀察到系統2的一個缺點：既然兩種結果都包含在同一列表中，受試者就有很大機會發現邏輯規則中的關聯性，但他們卻沒有把握好這次機會。當我們把實驗的規模擴大時，發現樣本中89%的研究生都違背了機率的邏輯。我們相信，從統計學角度作出複雜應答的受試者表現會更好些，因此我們給斯坦福大學商學院決策科學專案的博士生髮了同樣的調查問卷，所有的博士生都學過機率論、統計學和決策論等學科的高階課程。我們又一次驚奇地發現：85%的博士生也認為（琳達是）“積極參與女權主義的銀行出納”比“銀行出納”的可能性更大。為了消除這個錯誤—一後來我們認為“這個希望越來越渺茫”——我們讓很多人瞭解琳達，並且問了他們下面這個簡單的問題：下面兩種情況哪種可能性更大？琳達是銀行出納。琳達是銀行出納，同時她還積極參與女權運動。這個直截了當的問題使琳達這個人物在某些領域中小有名氣，也引起了數年的爭議。幾所重點大學中85%~90%的大學生選擇了第二個選項，這一選擇有悖邏輯，但 138

第15章琳達問題的社會效應卻沒有人因此感到羞恥。我曾經有些憤怒地問自己教的那些大學本科生：“難道你們沒有注意到自己違背了基本的邏輯原則嗎？”當時後排有些學生大喊：“那又怎樣？” 還有個犯了同樣錯誤的畢業生解釋道：“我還以為你只不過是問問我的看法罷了。” 通常，當人們沒能運用明顯相關的邏輯原則時，就會出現“謬誤”。阿莫斯和我引入了“合取謬誤” （conjunction fallaly）這個想法，透過直接比較，人們總會認為兩個事件（在此即為銀行出納和女權主義者）的聯合出現比只出現其中一件事（銀行出納）的可能性要大，此時就出現了合取謬誤。正如繆勒•里亞的錯覺圖所示，即使你對謬誤有了真切的瞭解，也仍然難以避免這種錯誤。生物學家斯蒂芬 •傑•古爾德（Stephen Jay Gould）曾描述他自己在琳達問題上的糾結反應。他當然知道這個問題的正確答案，然而他還是寫道：“我腦中有個小人，跳上跳下的，還對著我喊：‘她不可能只是個銀行出納，看看那描述就知道了。””這個喋喋不休的小人當然就是古爾德的系統1了。（在他寫這些文字時還沒有引入兩個系統的說法。）琳達問題簡短版本的正確答案只是對我們眾多研究中的一項的多數回應：斯坦福大學和伯克利大學的社會科學專業大學生組中有64%的學生正確地判斷出（琳達是）“女權主義的銀行出納”比“銀行出納”的可能性更小。起初列有8個結果的版本中，相似的大學生組中只有15%的人作出了正確選擇，其區別頗具啟發性。問題的較長版本透過在不同結果中穿插其他結果（保險推銷員）來區別開兩個重要結果，讀者要分別判斷每個結果，因此不會對所有結果進行比較。相反，（琳達）問題的較短版需要有能啟動系統2的明確對比，允許多數有統計學知識的學生避免謬誤。不過遺憾的是，我們沒有對這組知識淵博的受試者中選擇錯誤的少數人（36%）的推論進行探究。我們的受試者在湯姆問題和琳達問題中提供的機率判斷與典型性判斷（與原型判斷類似）正相吻合。典型性屬於一連串可能同時發生且聯絡緊密的基本評估，最具典型性的結果與特性描述結合在一起就會生成最有條理的資訊。而這些最具條理的資訊卻不一定就是可能性最大的，但它們“貌似正確”，稍有疏忽，我們就很容易混淆有條理、貌似正確和機率這三者的概念。如果我們將具體描述用做預測的工具，那麼不加批判地用貌似合理的判斷來替代 139

思考，快與慢甜以aG 機率就會嚴重影響我們的判斷結果。請思考下列一組問題中的兩個描述，並對其可能性作出評估。明年北美某地將有一次洪災，1000多人將被淹死。明年加利福尼亞某時將有一次地震，此次地震將導致洪水，1 000多人將被淹死。加利福尼亞地震的情節要比北美洪災的情節更合乎情理，儘管加利福尼亞地震的機率非常小。不出所料，人們對更詳細、更豐富的描述作出的機率判斷更高，這一點有違邏輯。預言家總會給其客戶設下陷阱：對情節加以詳述會使其更可信，都更不可能成為現實。為了體會“貌似合理”的作用，請看下面的問題：下面兩個論述哪個可能性更大？馬克長有頭髮。馬克長有金色的頭髮。以及下面兩個論述哪個可能性更大？筒是位老師。簡是位老師，她走路去上班。這兩個問題與琳達問題一樣，有相同的邏輯結構，但它們卻沒有引起謬誤，因為更詳細的結果只是更詳細而已，不會更讓人信服，或更有連貫性，或更講得通。對貌似合理和連貫性的評估不會產生機率問題的答案。在與之相矛盾的直覺缺位時，邏輯就會起作用。少即是多的邏輯悖論芝加哥大學的奚愷元（Christopher Hsee）讓人們在當地一家商店清倉大甩賣時 140

第15章琳達問題的社會效應為幾套餐具標價，當地餐具的價位一般在30~60美元。他將受試者分成三個小組，其中一個組看了下面的標價，奚愷元將這組標價標註為“綜合評估”，因為受試者可以對兩套餐具進行對比。另外兩組只看了其中一組的標價，此謂“單一評估”。綜合評估是組內實驗，而單個評估則是組間評估。 A套：40件 B套：24件餐盤湯/沙拉碗甜點盤杯子杯託 8，全部完好 8，全部完好 8，全部完好 8，有2個破損 8，有7個破損 8，全部完好 8，全部完好 8，全部完好假設A，B兩套餐具質量相當，那麼哪套更值錢呢？這個問題很簡單。你可以看到A套包括B套所有的餐具，另外還多出7件完好無損的餐具，所以A套“必然”更值錢。的確，綜合評估組的受試者寧願多花點錢買A套餐具也不願買B套，A套標價為32美元，B家標價30美元。在單一評估組中則出現了完全相反的結果，其中B套標價（33美元）比A套（23 美元）高很多，我們都知道何會出現這一結果。用具組合（包括餐具）透過標準和原型展示出來，因為沒有人想買破損的餐具，於是你立即感覺到A套組合的平均價值比B套組合的平均價值低。如果以平均價值引導估測，人們認為B套更值錢也就不足為奇了。奚愷元將這樣的結果模式稱為“少即是多”。從A套中拿走16件餐具（有 7件是完好無損的），它的價值就會提升了。實驗經濟學家約翰 •李斯特（John List）對奚愷元的發現進行了複製，他在真正的市場上拍賣兩套相同的高價值棒球卡片，每套各為10張，但其中一套附贈3張普通價值的卡片。就像餐具的例子一樣，在綜合評估中，數量多的組合會比少的更有價值，但在單一評估中則正好相反。從經濟理論的角度來看，一套餐具或一套棒球卡片的經濟價值是一種總體變數，給任何一套加上一個有價值的物件只能提升它的價值。如果是這樣，這個結果就有些令人煩惱了。 141

考，快與慢 THINKING AST AND SLOY 琳達問題和餐具問題的結構完全相同。機率就像是經濟價值，是一種總體變數，我可以透過以下這個例子加以說明：機率（琳達是個出納）=機率（琳達是個女權主義出納）+ 機率（琳達是個非女權主義出納）這就是為什麼琳達問題的單一評估產生了一種“少即是多”的模式，這一點與奚愷元的餐具實驗一樣。系統1會取價值的平均值而不是累加值，因此，當我們將非女權主義的銀行出納從銀行出納的大集合中移除後，主觀（判定）的機率就會加大。然而，變數的總體性對機率判斷的影響要小於其對金錢的影響。因此，綜合評估只是消除了奚愷元的實驗中出現的錯誤，卻無法消除琳達實驗中出現的錯誤。琳達不是唯一一個在綜合評估中得以存在的合取謬誤，我們在其他許多判斷中也發現了有悖邏輯的類似情況，其中一項研究的受試者被要求從高到低排列下一屆溫布林登網球賽的4個可能結果，比約 •伯格（Bjor Borg）是研究進行當日的主要網球比賽運動員。以下即為結果： A. 伯格會贏得比賽。 B. 伯格會輸掉首局。 C.伯格會輸掉首局，但會贏得比賽。 D.伯格會贏得首局，但會輸掉比賽。上述結果中B和C兩項比較重要。B囊括的內容更多，其機率“一定”比自身所包含的一個事件發生的機率大。受試者給出的答案與邏輯相悖，卻順應了典型性和貌似合理性，72%的人認為B選項比C選項的可能性更小——又一個透過直接比較得出 “少即是多”的例子。這一次受試者選出的可能性最大的描述無疑貌似更合理，更符合當今世界一流網球運動員身上所具有的所有公認的特質。合取謬誤是因為對機率的誤解，為阻止可能會出現的異議，我們設計了一個需要作出機率判斷的問題，但在這個問題中，事件不是用文字來描述的，而且“機率” 這個詞一次也沒有出現過。我們告訴受試者有一個標準的六面骰子，其中四面是綠色的，兩面是紅色的，此骰子可被投擲20次。我們給他們看了三組預設的結果，都 142

第15章琳達問題的社會效應是綠色《G）和紅色（R）的任意排列，並讓他們選一組。如果他們選擇的那組正好出現，他們會（假想）得到25美元。這三組是： 1.RGRRR 2.GRGRRR 3.GRRRRR 因為這個骰子綠色面的數量是紅色的2倍，第一組就很不具代表性——就像琳達是個銀行出納這一選項一樣。第二組包括6次投擲結果，與預期投骰子結果更為符合，因為它有兩個G。但是這個結果在設計時只是在第一種序列的開頭加了個G，所以它比第一組更不可能，只是相當於“琳達是個積極參與女權主義的銀行出納”的非言語表達。與琳達的研究一樣，典型性主導著上例的結果。幾乎2/3的受試者更願意在第二組上下注，而不願賭第一組。然而，當人們看到支援兩種選擇的理由時，大多數人發現正確的理由（偏向第一組的）更可信。下一個問題是個突破，因為我們終於找到了可以降低合取謬誤的條件。兩組受試者看到同一個問題，但其變數稍顯不同：不列顛的哥倫比亞省針對成年男子樣本作了一個健康調查，這些男子年齡不同，職業也不同。請對以下價值給出最佳評估：在被調查的男子中，有幾成人有過一次甚至多次心臟病發作的經歷？在被調查的男子中，有幾成人既超過了55 歲又有過一次甚至多次心臟病發作的經歷？不列顛的哥倫比亞省對一個由100名成年男性構成的樣本進行了調查，這些男性年齡不同，職業也不同。請對以下價值給出最佳評估： 100名受試者中有多少位有過一次甚至多次心臟病發作的經歷？ 100 名受試者中有多少超過55歲又有過一次甚至多次心臟病發作的經歷？看左欄問題的小組的錯誤率為65%，而看右欄的小組的錯誤率僅為25%。為什麼“在100名受試者中有多少⋯”的問題比“有幾成人⋯••”更容易回答？有一個可能的解釋是“100名”這個參考值給大腦一種空間上的暗示。假使有很多人按照指示把自己歸到一間屋子裡的不同小組中去：“名字首字母是A到L之間的人到房間的左前方角落去。”然後這個小組中的人再按照指示進一步分組。這種包含的關係現在已經很明顯了，你會看到名字以C字母開頭的人是左前方角落中那群人的一分 143

思考，快與慢理談 AND SL.OW 子。在這個醫學調查問題中，心臟病患者最終會走到屋子的某個角落，他們中有些人不足55歲。不是每個人都能想象出這一場景的，但很多後續實驗顯示，人們所熟知的典型頻率會使人們更容易理解一個組完全被另一個組包含的概念。上述問題中的“多少”使你想到了個體，但“幾成”就不會使你有這種聯想，從這點來看，這個難題的答案就不難理解了。關於系統2的工作機制，我們從這些研究中能窺見多少？有一個已經不算新鮮的說法是，系統2並非時刻處於警惕狀態。參與我們那些合取謬誤實驗的大學生和研究生當然都“知道”維恩圖解中的邏輯，但即使所有的相關資訊都擺在面前，他們也沒有對此加以運用。“少即是多”模式的荒謬在奚愷元的餐具實驗中表現得淋漓盡致，在“多少”的事例中也非常容易識別出來，但對那些在最初的琳達問題以及其他相似問題中也犯了合取謬誤的數幹人來說，這一模式還不夠明顯。在所有這些例子中，合取謬誤顯得貌似合理，而且也獲得了系統2的認可。系統2的惰性也是導致判斷失誤的部分原因。如果這些受試者的下一次休假要根據此次調查結果來決定，而他們又有足夠的時間，被告知要遵循邏輯，直到確定答案正確才能說出來，我相信大多數受試者都是可以避開合取謬誤的。然而，（事實是）他們的休假並不取決於一個正確的答案，他們幾乎沒費什麼時間就得出了答案，而且他們也願意用隨意的方式來回答這個問題。系統2的情性是生活中存在的一個重要事實，而對典型性會阻礙明顯的邏輯原則運用的相關觀察也至關重要。琳達問題值得注意的一個方面是：它與餐具實驗的結果形成了對比。這兩個問題有著相同的構造，但產生了不同的結果。那些看到成套餐具中有破損餐具的人會給這套餐具標低價，他們的行為是直覺反應。其他能看到兩套餐具並進行對比的人則能運用邏輯原則，得出多出來的餐具只是為了增加價值的結論。在組間研究情況下作判斷時，直覺就會起作用，邏輯原則則在綜合評估中起作用。而在琳達問題中卻不是這樣，直覺常會推翻邏輯，即使在綜合評估中也會如此，雖然我們確定有些場合下邏輯會占主導地位，但大膽的直覺也會將其推翻。我們在一些明確的問題中觀察到了機率公然違背邏輯的現象，阿莫斯和我都認這種有悖邏輯的現象非常有意思，值得和同事們分享。我們還相信這些結果能進一步加強我們關於判斷啟發式強大作用的論證，這會讓懷疑者啞口無言。然而在這一 144

第14章猜一下，湯姆的專業是什麼？