關於庫蘭和桑斯坦用來說明效用層疊概念的第二個例子,人們的觀點至今仍然存有分歧。這個例子就是1989年的艾拉事件,也就是環境問題批評者口中的“艾拉恐慌”。艾拉是種化學品,噴灑到蘋果上用以調節蘋果的生長週期並改善其外觀。有報道稱該化學品用量大,可導致大老鼠和家鼠得癌症,恐慌便由此引發。報道自然可以嚇到眾人,而且這些恐慌情緒也促使媒體爭相報道,這就是效用層疊的基本機制。 這一主題對新聞形成引導作用,進而引發了重大的媒體事件,例如梅麗爾•斯特里普(Meryl Streep)在國會前的證詞。由於蘋果和蘋果產品引起人們的恐慌,蘋果產業損失巨大。庫蘭和桑斯坦引用了一位打來電話的居民的話,此人問道:“是把蘋果汁倒進下水道更安全,還是扔到有毒廢物垃圾場更安全?”生產商回收了蘋果殺蟲劑產品,美國食品藥品管理局也對此產品頒佈禁令。此後的研究證實這種物質致癌的可能性很小,艾拉事件顯然是對一個小問題做出的過激反應。這件事對公眾健康的最終影響可能是致命的,因為人們吃到的好蘋果越來越少了。 艾拉事件說明,我們的大腦解決小風險的能力有一個基本限度:我們要麼完全忽視風險,要麼過乾重視風險,沒有中間地帶。每位等待晚歸女兒的家長都能體驗到這種感覺。你也許知道真的是(幾乎是)沒有什麼可擔心的,但你的大腦會不自覺地閃現危險的景象。正如斯洛維克所言,焦慮對傷害的可能性還不夠敏感。你想到了分子(即你在新聞中看到的悲慘新聞),卻沒有想到分母。桑斯坦發明了“機率忽視”這一短語來描述這一模式。機率忽視和效用層疊兩種社會機制的組合必然會導致對小威脅的誇大,有時還會引發嚴重後果。 當今世界,將效用層疊發揮到極致的人最有可能是那些恐怖分子。除了幾次可怕的事件,比如 “9•11”事件,恐怖襲擊導致的死亡人數與其他死亡原因相比是非常小的。即使在恐怖活動猖獗的國家,比如以色列,每週的死亡人數也遠不及交通事故死亡的人數多。機率忽視和效用層疊間的不同在於兩種發現的可得性和呈現到腦中的輕鬆度和機率。媒體不斷重複的可怕畫面可使每個人都處於崩潰的邊緣。我們都有這樣的體驗:想要勸自己完全冷靜下來是非常難的。恐怖主義是直接和系統1對話的。 125
思考,快與慢 TUNKSMA NE SL 在和朋友辯論的過程中,我是從何時開始處於下風的呢?效用層疊是真實的,它無疑擾亂了公共資源分配的重點。卡斯•桑斯坦會探索將決策制定者從公眾壓力中隔離開來的機制,讓資源的分配由公正的專家來決定,這些人對所有風險都瞭如指掌,還知道可利用哪些資源來降低風險。公眾比桑斯坦更相信專家,但保羅•斯洛維克卻不怎麼相信這些專家,他指出,將專家從公眾情感中隔離出來會產生公眾排斥的政策,這種情形不可能發生在民主制的國家中。兩人的觀點都非常有見地,他們的說法我都贊同。 我同桑斯坦一樣,對非理性的恐懼和應對風險的公共政策的效用層疊都感到不適。不過,我也認同斯洛維克的觀點,即政策制定者不應該忽略普遍存在的恐懼情緒, 即使這些情緒是毫無緣由的也不該忽略。不管理性與否,恐懼都是令人痛苦且身心俱疲的。政策制定者必須努力保護公眾不受恐懼情緒的影響,而不是隻保護其不受真實存在的危險的傷害。 斯洛維克強調公眾對那些不代表民意的不靠譜專家做出的決策心存抵制情緒,這一點的確不錯。此外,效用層疊也會透過呼籲人們關注風險和增加降低風險預算總額的措施來創造長期效益。拉夫運河事件可能會使過剩資源分配到有毒垃圾的治理上,但這一事件在提升公眾對環境問題的關注程度方面發揮了更大作用。民主難免無鐵序,其中部分原因是引導民眾信仰和態度的可得性及情緒啟發式難免有失偏頗, 即使這些因素都指向正確的方向也難以達成完美結局。心理學應該助風險政策的設計一臂之力,使之集專家知識、公眾情感及直覺於一身。 示例——效用層疊 “她對一項創意大為讚賞,說它收益大,無成本。我認為這就是種情緒啟發式。” “這是一個效用層疊的例子:被媒體和公眾大肆宣揚的事還沒發生,電視上就滿是關於此事的報道,每個人都在談論這件事。” 126
第14章猜一下,湯姆的專業是什麼? 請看下面這個簡單的問題: 湯姆是你們國家一所著名院校的研究生。請預測湯姆就讀於以下9個專業的機率,並對專業進行排序。用1表示最有可能就讀的專業,9表示最無可能的。 工商管理電腦科學工程學人文與救育法學醫學圖書館學自然科學與生命科學社會科學和社會工作這個問題很簡單,你馬上就知道不同專業的招生規模是解決問題的關鍵。就你所退考,快與傻 PNSLe FAST AND3SLOY 知,湯姆是從這所大學裡隨機挑選出來的一名研究生,好比從罐子裡隨意拿出來的一個彈球一樣。想要知道這個彈球是紅色的還是綠色的,你必須清楚罐子裡兩種顏色的彈球各有多少。某一特定種類的彈球所佔比率被稱為基礎比率。同樣,在這個問題中,人文與教育專業的基礎比率指的就是這個專業的學生人數佔全體學生總數的比率。在觖乏與湯姆相關的具體資料的情況下,你可能會根據基礎比率進行猜測, 相比電腦科學和圖書館學,湯姆更有可能被人文與教育專業錄取,因為人文與教育專業的招生規模比另外兩個專業的招生規模大。在沒有其他資訊可供參考時,採取基礎比率的方法最容易。 接下來的這個任務與基礎比率井無關聯。 一位心理學家在湯姆高三時對他進行了一系列不定效果的心理測試,大體推斷出他的個性,其描述如下: 儘管缺乏創造力,但湯姆智商很高。他喜歡按部就班的簡單生活,喜歡乾淨整潔的環境,屋子裡的物件要擺放得規規矩矩。他寫的文章枯燥,偶爾會寫一些老掉牙的雙關語,或者迸發出類似科幻小說的火花,文章還顯得有那麼點生動。他頗具競爭意識。此外,湯姆待人冷淡,缺乏同情心,也不願與他人接觸。 儘管他總是以自我為中心,但卻有強烈的道德觀念。 現在,請拿出一張紙來,按照上文對湯姆的性格描述,預測他與某個專業典型學生的相似度並進行排序。用1表示最相像的專業,9表示最不像的。 如果能夠很快完成這個任務的話,你就會從本章學到更多東西。很有必要讀讀湯姆的相關報告,這會幫助你對不同專業的研究生特質作出判斷。 下面這個問題同樣很直接。它需要你重新獲得或構建一個不同專業領域的研究生的典型形象。在20世紀70年代早期,實驗剛開始進行時,平均結果所呈現的專業順序如下所示。這與你的排序可能並沒有多大不同: 1.電腦科學 2.工程學 3.工商管理 128
第14章猜一下,湯姆的專業是什麼? 4. 自然科學與生命科學 5.圖書館學 6.法學 7.醫學 8.人文與教育 9.社會科學和社會工作由於會想到書呆子(因為描述中有“老掉牙的雙關語”這一條),你有可能將電腦科學排在首位。實際上,湯姆的性格特徵就是按照電腦科學專業學生的典型形象來描述的。另一個大多數人都排在前面的專業是工程學(描述中有 “規規矩矩” 這一條)。你可能認為湯姆並不適合社會科學和社會工作專業(因為他“待人冷淡, 缺乏同情心”)。但該專業人員的典型形象似乎在我設計描述湯姆實驗後的40年內發生了少許變化。 給這9個專業排序是一項複雜的任務,肯定需要系統2有規則、有秩序地組織, 只有這一系統才能完成這項任務。然而,描述所給的提示(老掉牙的雙關語及其他一些提示)很容易激話關於典型形象的聯想,這是系統1控制下的自主活動。 這項尋找相似點的任務要求我們對湯姆的描述和不同專業學生的典型形象進行比較。描述的準確性——無論這是不是對湯姆的真實寫照——與任務的目的沒有關係。另外,你對每個專業基礎比率的瞭解也與任務無關,因為某個個體與某個組織典型人員的相似性並不受這個組織大小的影響,甚至在大學裡根本沒有圖書館系的情況下,你都可能會將湯姆的性格描述與圖書館學專業的研究生形象進行比較。 如果你再次審視湯姆,會發現他很適合人數少的專業(電腦科學、圖書館學、 工程學),並不適合人數多的專業(人文與教育、社會科學與社會工作)。的確,受試者也幾乎都將人數多的兩大專業排在了最後。湯姆被刻意設計成了“反基礎比率” 的角色,適合於人數少的專業,不適合人數多的專業。 129
思考,快與慢甜絲! 依據典型性作出預測是下意識的行為第三個排序的任務是由心理學專業的研究生完成的。這項任務尤其重要,同樣是根據湯姆就讀專業的機率對9個專業進行排序。不過進行這次預測的人瞭解相關的統計學事實:他們對不同領域的基礎比率都很熟悉,也知道對湯姆的性格描述並不十分可信。然而,我們希望他們只關注描述與典型特徵的相似性(我們將其稱為典型性),而忽路掉基礎比率以及對描述的準確性的懷疑。他們將人數少的電腦科學專業排在了最前面,因為這個專業最典型。 在尤金工作的那一年,我與阿莫斯十分賣力,我有時還會在辦公室裡通宵達旦地工作。徹夜工作的任務之一就是將典型性和基礎比率之間的衝突描述出來。湯姆的形象就是我努力的結果,我是在清晨時分完成了對他的描述。那天早晨第一個來上班的是我的同事兼好友羅賓•道斯(Robyn Dawes)。他是一個富有經驗的統計學家,也是直覺判斷有效性的懷疑者。如果說有人能意識到基礎比率的話,這個人一定是羅賓。我將羅賓叫過來,給他看了我剛打出來的問題,並讓他猜測湯姆的專業。 我至今仍然記得他試著回答時露出的狡黠笑容,他說道:“電腦科學嗎?”那是一個令人開心不已的時刻,我心想:你也有失算的時候啊。當然,我一提到“基礎比率”,羅賓很快就更正了他的錯誤,但他開始並沒有自主地想到這一點。儘管他比任何人都清楚基礎比率在預測中的作用,但當他看到某個人的性格描述時,就會忽略掉這些比率。不出所料,他用對典型性的判斷替代了對機率的評估。 隨後,我和網莫斯蒐集了3所重點院校裡114名心理學研究生對這個問題的答案。 這些學生都上過幾門統計學課程。結果確實沒讓我們失望。他們對9個專業機率的排序與和典型形象相似程度的排序並無太大差別。在這個例項中,替換起了很大作用: 並無跡象表明除了判斷典型性以外,受試者還用了別的方法。因為關於機率的問題較難回答,而關於相似性的問題就比較簡單,所以在回答時受試者就置換了問題。 這是一個嚴重的錯誤,因對相似性和機率的判斷所遵守的並不是同一個邏輯規律。 我們對相似性的判斷可以完全不受基礎比率的影響,不受可能會出現的不當描述的影響,但是在判斷機率時,如果忽略基礎比率和證據的可靠性的話,就註定會犯錯誤。 “湯姆是學電腦科學的機率”並不是一個簡單的概念,邏輯學家和統計學家對 130
第14章猜一下,湯姆的專業是什麼? 它的意義各執己見,還有一些人認為它根本就沒有意義。對於很多專家而言,機率是信念主觀程度的評估手段。有些事你確信無疑,例如今天早晨出太陽了,而另外一些事是你認為根本不可能的,例如太平洋突然結冰了。還有許多事會令你半信半疑,例如你隔壁的鄰居是一個電腦科學家—這便是此事在你眼中的機率。 邏輯學家和統計學家相互爭論,提出了多個關於機率的定義,全都非常精確。然而,對於外行人來說,機率(在日常生活中和“可能性”是同義詞)是一個相對含糊的概念,與不確定性、傾向性、貌似正確以及出平意料等詞緊密相關。模糊性和令人不爽的感覺不都是這個概念所特有的特性。當我們使用“民主”或“美麗”這樣的詞時,我們或多或少明白自己究竟要表達什麼意思,我們的談話物件也或多或少能明白我們究竟想要說什麼。在我潛心研究事件的機率問題的這些年來,從來沒有人舉手問過我:“先生,請問機率指的是什麼?”如果我問他們的是一個奇怪的概念,例如適應全球化的能力,他們肯定就會舉手問問題了。儘管每一個人都表現出他們知道該怎樣回答我的問題,但我們都明白要求他們去解釋這個詞的含義有些難。 被要求作機率評估的人並不會感到很困惑,因為他們對機率的判斷與統計學家或是哲學家的判斷不同。關於機率或可能性的問題引起了思維的發散性,讓人想起比較簡單的問題的答案。其中一個簡單的答案就是對典型(代表性)的自動評估—在我們理解語言時這種現象很常見。“貓王埃爾維斯 •普雷斯利(Elvis Presley)的父母曾希望他成為一名牙醫”,這(錯誤的)陳述聽起來有些好笑,因我們會自動把貓王的形象與牙醫聯絡在一起,然而這兩者的形象實在相差太大。系統1能使人產生相似的印象,雖然它並沒有刻意這樣做。“她會贏得竟選,你明白她肯定會贏”,“他學習成績好不了,看那一身文身吧”,聽到有人這樣說時,他們一定是受到了典型性啟發式的影響。如果我們透過某個下巴的輪廓或鏗鏘有力的演講來判斷這個職位候選人是否具有領導才能,此時我們依賴的就是典型性。 儘管透過典型性作出預測的做法很普遍,但是在統計學上這一做法並不是最優選擇。邁克爾,劉易斯(Michael Lewis)的暢銷作品《魔球》(Moneyball) 說的就是這種預測方式的低效性。職業棒球球探在預測某個選手是否會成功時,他們大體上看的是球員的體格和相貌。這本書的主角是奧克蘭“運動家棒球隊”的經理比利•比恩 (Billy Beane)。他作出了一個大家都不願接受的決定:否決球探們的建議,透過 131
思考,快與幢翌織2 選手過去表現的統計資料來挑選球員。“運動家棒球隊”挑選出來的選手都以低會費入隊,因為其他球隊都因為沒有想到用資料來判斷,因而拒絕了這些選手。“運動家棒球隊”很快就以低成本達成了最佳結果。 典型性啟發的兩宗罪用典型性來判斷機率有-一些重要的優點,它所帶來的初始印象通常比亂猜一氣更為精確。 • 在大多數情況下,表現得很友好的人實際上也很友好。 •又高又瘦的職業運動員很有可能是打籃球的而不是踢足球的。 • 獲得哲學博士學位的人比只讀完高中的人更有可能訂閱《紐約時報》。 •年輕的男性會比年老的女性更不要命地珠油門。 在這些例子及其他更多例子中,典型的形象特徵左右著我們對典型性的判斷,受這種典型性啟發得到的預測有可能是對的,這樣的說法在某種程度上就是事實。然而在其他情況下這種典型形象卻是錯誤的,因而典型性的啟發也會造成誤導,尤其會使人們忽略基礎比率資訊、找錯預測方向。即使啟發性具有一定的真實性,但絕對依賴啟發效應就是違背統計學邏輯,是有嚴重“罪過”的。 典型性的第宗罪就是,它過於喜愛預測不可能發生的(低基礎比率的)事件。 下面就是一個例子:如果你看見一個人在紐約地鐵裡閱讀《紐約時報》,下面哪種情況與讀報者更吻合? 她有博士學位。 她沒有大學文憑。 典型性會告訴你應該選有博士學位那位,但這樣做並不一定是明智的。你應該充分考慮第二個選項,因為紐約地鐵裡更多的是沒有大學文憑的人,而不是有博士學位的人。如果猜測一一個被描述為“羞澀的詩歌愛好者”的女士學的是中國文學還是工商管理,你也應該選擇第二個答案。因為雖然學習中國文學的女學生都害羞且愛好 132
第14章猜一下.湯姆的專業是什麼? 詩歌,但幾乎可以肯定的是有更多工商管理專業的學生同樣也是害羞的詩歌愛好者。 在某些情況下,沒有受過統計學訓練的人也會使用基礎比率來進行預測。在本章開頭關於湯姆的第一個問題中,我們沒有提供關於他的細節,對於每一個人來說, 湯姆讀某個專業的機率就是那個專業招生規模的基礎比率。然而,得知湯姆的個性特徵後,人們再也不會將基礎比率納人考慮範圍了。 在前期證據的基礎上,我和阿莫斯原本以為在瞭解了具體資訊後,基礎比率的資訊“總會”被忽略,但是這樣的結論太過絕對了。心理學家做過許多實驗,在這些實驗中,所給問題都明確地提供了基礎比率資訊,儘管關於個人特徵的資訊比單純的資料分量更重,許多受試者還是受到了這些特徵資訊的影響。諾伯特 •施瓦茨和他的同事表示,引導人們“像統計學家那樣思考”就能夠促使他們使用基礎比率資訊, 引導人們“像臨床醫生”那樣思考則會起到相反的效果。 幾年前,我和哈佛大學的學生做了一項實驗,讓我有了一個令我十分驚訝的發現:增強系統2的啟用狀態能有效提高回答湯姆問題的準確率。這項實驗將舊問題與認知順暢性的現有形式結合了起來。在實驗過程中,我們要求一半學生鼓腮幫,另一半學生皺眉頭。前文中已經提過,皺眉通常可以增強系統2的警覺性,降低對直覺的過分相信和依賴。鼓起腮幫(與感情無關的表情)的學生的預測結果與原實驗結果一樣:他們只依賴於典型性,而忽略了基礎比率。然而不出作者所料,那些皺眉頭的同學的確對基礎比率表現得很敏感。這是一個具有啟發性的發現。 一旦人們作出一個錯誤的直覺判斷,系統1和系統2都脫不了干係。系統1引起了錯誤的直覺,系統2採納了這個直覺,並將其運用在判斷當中。然而,造成系統2 犯下此類錯誤的原因有兩個——忽視與懶惰。許多人忽視了基礎比率,因為在有個人資訊的情況下他們認為基礎比率與問題並無關聯。另一些人犯下同樣的錯誤則是因為他們沒有將注意力集中在任務上。如果皺眉能帶來不同結果的話,這說明懶惰也許是人們忽視基礎比率的合理解釋,至少對於哈佛大學的學生來說是這樣。當具體資訊峽失時,他們的系統2“知道”基礎比率與問題相關,但是只有在任務中付出特別努力時,才能將基礎比率的知識應用於其中。 典型性的第二宗罪是它對證據質量不夠敏感。請回想系統1的眼見即事實的原則。在湯姆的問題中,啟用你聯想機制的是對湯姆的描述,且這個描述不一定是 133
思考,快與饅 T2429 真實的。對湯姆“對人冷淡,缺乏同情心”的表述也許能讓你(以及許多其他讀者) 相信他不太可能是社會科學與社會工作專業的學生。然而,彼時你已經清楚地知道這樣的描述是不可信的。 原則上講,你當然知道不值得信任的資訊就相當於沒有資訊,但是眼見即為事實使你難以遵循那條原則。除非你決定立刻否定證據(例如,你堅信的資訊是從一個騙子口中得來的),否則你的系統1會自動將這一資訊視為真實的。當你懷疑資訊的可靠性時,可以做件事:作機率判斷時,往基礎比率那方面想。別期望遵循這條原則會很容易—需要在付出很多努力的情況下,才能實現自我監督和自我控制。 想要得出湯姆問題的正確答案,你應該遵從最先出現在自己腦海中的想法,若認為某招生人數多的專業(人文與教育、社會科學與社會工作)被選中的機率高,則稍微降低其機率;若認為某招生人數少的專業(圖書館學、電腦科學)被選中的機率低,則稍微提高其機率。如果你對湯姆一無所知,你作出的抉擇就不是你的初衷了, 你手頭上的那點資訊也不能相信了。所以,你應該讓基礎比率在預測時起主導作用。 用貝葉斯定理來約束直覺你認為明天會下雨的機率只不過是你的臆測,你不應該相信頭腦裡出現的所有想法。你的信念必須受限於機率邏輯。所以,如果你相信明天某個時候會下雨的機率是40%,就該相信不會下雨的機率是60%,那麼明天早晨下雨的機率就一定不會是 50%。如果你相信某個候選人當選總統的機率是30%,並且相信他在首次競選成功後再次當選的機率是80%,你就必須相信他連任的機率是24%。 貝式統計學(Bayesian statistics)提供了類似湯姆等相關問題的“定理”。這個研究統計學的定理影響深遠,是以18世紀英國一位名為瑞福倫德•托馬斯•貝葉斯神甫的名字命名的,因為人們認為他是為一個重大問題作出重要貢獻的第一人,這個問題就是:如何推斷人們是怎樣根據證據改變自己的想法的。貝葉斯定理詳細說明了最強烈的信念(在本章的例項中指的是基礎比率)應該與證據分析相結合,這樣才能更接近假設而不是偏離到其他方向上。例如,如果你相信有3%的研究生是被電腦科學專業錄取的(基礎比率),你還相信湯姆是該領域研究生的可能性是其他 134