“她說經驗教會她一個道理,批評比讚揚更有用。不過她不明白這是迴歸幹均值在發揮效用。” “也許由於懼怕讓眾人失望,所以他的第二次面試沒有第一次那樣令人印象深刻,他第一次的表現太優秀了。” “我們的篩選過程並不是很完美,所以我們會考慮迴歸性。有些極其優秀的候選人也會讓我們失望,對此我們並不感到驚訝。” 安驗 165
第18章如何讓直覺性預測更恰當有效? 生話中,許多場合都會用到預測。經濟學家預測通貨膨脹和失業率,財務分析師預測收益,軍事專家預測傷亡人數,風險資本家預測利潤率,出版商和生產商預測讀者和消費人群,承包商預測專案完成所需的時間,工程師預測建造某建築需要的水泥量,火場指揮員預測撲滅大火所需的消防車數量。一些私人問題同樣需要用到預測,我們預測戀人在自己求婚時的反應,預測在新工作中需要作的自我調節。 有些預測判斷,比如那些工程師所作的預測,主要就是透過查詢表格、精確計算以及對類似專案的結果進行仔細分析得來的。還有一些預測則需要直覺和系統1的共同參與,主要有兩種型別。有些直覺主要依靠反覆訓練得來的技能和經驗。加里•克菜因在《力量的源泉》(Source of Power)一書中及其他場合曾提到過象棋高手、火場指揮員和內科醫生所作的快速自動判斷及選擇,用以闡釋這種經驗性直覺,即由於識別出熟悉的線索,大腦中快速呈現出當前問題的解決方案。 還有些直覺有時從一開始就難以從主觀上進行區分。這種直覺受啟發法的影響, 通常會用簡單的問題來替代難以回答的問題。即使證據很不充分,決定亦不可更改, 人們依此作出直覺性判斷時往往也會信心十足。當然,許多判斷,特別是專業領域第18章如何讓直覺性預測更恰當有效? 的判斷,受到了分析與直覺的共同影響。 偏離預測方向的直覺讓我們再來看看下面這個老問題: 米莉現在是一名州立大學4年級的學生。她4歲就能流暢地進行閱讀。她的平均績點(GPA)是多少? 熟悉美國教育體制的人很快就能得出一個數字,且這個數字通常在3.7或3.8左右。為什麼呢?原因在於,系統1的幾個機制共同參與了預測。 •人們會探尋證據(朱莉的閱讀能力)與預測目標(她的平均績點)之間是否存在因果關係。這種關係可能不是直接的。在這個例子中,很小就能閱讀與較好的平均績點都是學術天分的表現,必然會存在某種聯絡。你(你的系統2)可能會否定朱莉在高中曾經贏得釣魚比賽或是在舉重比賽中表現良好的說法。這個過程被有效地一分為二。系統1能夠摒棄那些無關或是錯誤的資訊,但卻無法彌補證據中相對較小的瑕疵。因此,直覺性預測對證據的實際預測結果幾乎毫無感覺。一旦發現某種關聯,例如朱莉很小時就能閱讀,眼見即為事實原則就會發揮作用:你的聯想記憶會快速自動地運用可利用資訊編出最恰當的故事。 •另外,證據的評估與相關規範聯絡緊密。4歲時閱讀能力就很強的孩子早熟嗎?什麼樣的名次或者說百分制下得多少分才能與這樣的能力相符?與這個孩子作比較的人群(我們稱之為參照人群)也沒能明確說明這一點,但與我們平時說話所遵循的規則相同。如果即將畢業於這所大學的某個人被贊為“相當聰明”,你幾乎不必問:“當你說他‘相當聰明’時,腦子裡想到的是哪些參照人群呢?” •下一部分包括替代和快速配對。對於兒童時期認知能力這個並不周密的證據進行評估的問題被替換成關於她大學平均績點問題的答案。朱莉的平均績點和她小時候就能閱讀這項能力的百分比值是相同的。 167
思考,快與慢限 FAST ANDSLOW •這個問題明確規定答案必須在平均績點的範圍內,這也就要求另一個強度匹配的運作,即將你對朱莉的學術成就的總體印象與能證明她本人天賦的平均績點這一證據匹配起來。最後的步驟是轉化,將你對朱莉學術水準的印象轉化為相應的平均績點。 透過強度匹配得到的預測結果與支援這個預測的證據一樣極端,會導致人們面對兩個不同的問題卻給出相同的答案: 朱莉的早期閱讀能力成績是多少(百分制)? 朱莉的平均績點是多少(百分制)? 到目前為止,你應該很容易就能看出所有這些運作都是系統1的特點,我按照不同步驟依次將它們列在這裡,當然聯想記憶的大量啟用並不遵循這一順序。你應該將這種記憶大量啟用的過程想象為以下幾步:由資訊和問題激發起聯想記憶,然後自我反饋,最後選定最具連貫性的合理性方案。 我與阿莫斯曾經在一個實驗中要求受試者對8位大學新生的相關描述作出判斷, 這個描述是由一名輔導老師根據對新班級的訪談而寫成的。每個描述由5個形容片語成,如下例所示: 聰明、自信、篤學、勤奮、好問我們問了受試者下面兩個問題: 這個描述對你關於學術能力的想法有多大影響? 你認為這些關於新生的描述令你印象深刻的可能性有多大(百分制)? 這兩個問題要求你根據自己的標準對新生進行描述,將自己的描述與輔導老師的描述進行對比,進而評估上述描述。你自身的評判標準存在著重大影響。雖然你根本不知道自己如何形成這一評判標準的,但你對這條描述承載的熱情程度非常清楚: 輔導老師認為這個學生是優秀的,但還算不上是最棒的,因為我們還有很多比“聰明” 程度更深的形容詞(傑出、有創造力),也有很多比“篤學”程度更深的詞(博學的、 168
第18章如何讓直覺性預測更恰當有效? 淵博的),更有許多程度超過“勤奮”的形容詞(積極的、力求完美的)。由此可以推測,(該生)成績很有可能在前15%,但不太可能在前3%。人們在類似的判斷中得到的結果出奇地一致,至少在相同文化背景的人群中是這樣。 我們問了實驗中另一組受試者不同的問題: 你估計這個學生的平均績,點是多少? 新生中取得較高平均績,點的學生佔多大比例? 你需要再三思考才能看出這兩組問題的微小差別。這種不同本該很明顯,但事實卻並非如此。第一組問題只要求你作出評估,第二組問題則與第一組不同,包含了很大的不確定性。這個問題指的是在大學一年級期末的真實表現。自訪談後,這一年發生了什麼呢?你怎樣才能以5個形容詞來預測這個學生在大學第一年的真實表現呢?如果這只是輔導老師本人透過與該生的訪談而作出的平均績點預測,那麼她的預測會準確無誤嗎? 這項研究旨在比較兩個判斷結果(百分比成績):受試者透過評估一個案例中的描述做出的判斷結果(百分比成績)和另一個案例中的最終預測結果。結論很明顯: 兩個判斷結果完全相同。儘管兩組問題不同(一組關於該生的描述,另一組關於該生未來的學術表現),但受試者將這兩個問題看成了一個。與朱莉的例子相同,受試者並沒有將對未來的預測和對當前資訊的估測區別開來—預測與估測相匹配。這也許是我們得到的能證明替換存在的最佳證據。當人們接要求預測時,他們總會將預測替換為對所描述問題的估測,而且沒有意識到他們回答的問題並不是那個被問到的問題。這個過程證明預測時會存在系統偏見;他們完全忽略了一點,即應該回歸到平均值上來。 在以色列國防軍隊服役期間,很長時間我都待在一支部隊裡,這支部隊透過一系列面試及實戰測試來挑選後備實訓軍官。成功預測的特定標準為這些人在軍官學校的最終成績。這些等級評定的效度非常低(我會在後面的章節詳細說明)。若干年後,這支部隊仍舊存在,而彼時我已成為一名教授,並且正與阿莫斯合作研究直覺性判斷問題。我一直與這支部隊的工作人員保持著密切聯絡,於是便請他們幫個忙。 除了他們通常使用的評估候選人的評分系統以外,我還讓他們猜測每個學員將來在 169
思考,快與慢 T!!!2K00 軍官學校中可能得到的分數。他們蒐集了幾百份這樣的預測。所有作出這些預測的軍官都知道學校給學員評分時用的是字母評分系統,也知道所有學員得到的A、B. C各等級的近似比例。實驗結果令人驚訝:預測出來的A和B的頻率幾乎與學校的結業成績中的A、B等級的頻率等同。 這些發現提供了一個引人注目的例子,這個例子涉及替代和強度匹配兩個方面。 作出預測的軍官完全將這兩個任務混淆在一起了: •他們平時的任務是對候選人在該部隊的表現作出評價。 •我讓他們執行的任務是對候選人的未來成績作出實預測。 他們運用強度匹配將自己的評級簡單地轉換為軍官學校的評分結果。由於無法解決預測中存在(相當大)的不確定性,他們的預測又一次完全無法迴歸(平均值)。 對直覺性預測的偏見進行修正我們回過頭再來看朱莉,那個兒時閱讀能力就很強的閱讀者。前一章已經介紹過預測她平均績點的正確方法。我在前一章中還為連續兩天打高爾夫球的例子以及體重和彈鋼琴的例子分別寫了一個原理公式,在這裡我也要為閱讀年齡和大學成績的決定因素寫一個公式: 閱讀年齡=共同因素+決定閱讀年齡的特殊因素=100% 平均績點二共同因素+決定平均績,點的特殊因素=100% 共同因素包括由遺傳決定的潛能、家庭支援學業的程度,以及能夠造成人們在孩童時期成為出色的閱讀者、青年時期又在學術上有所建樹的所有其他因素。當然, 許多因素只會影響到其中的某個結果,卻不會對其他結果產生影響。朱莉可能是因為父母對她期望過高強迫女兒讀書才這麼早學會閱讀的,也有可能因為一段不愉快的感情經歷,她的大學成績才那麼糟糕,還可能在少年時滑雪出了事故導致腦部輕微受損等。 回想下上面兩個測量公式的關聯,即當前閱讀年齡和平均績點這兩個公式,你 170
第18章如何讓直覺性預測更恰當有效? 會發現兩者所考慮的共同因素在決定因素中所佔的比例是一樣的。你對這個比例能作出的最貼近的估測是多少?我給出的答案是最多30%。有了這個估測,我們就完全有條件作出不帶偏見的預測了。按照以下4個簡單步驟來做,我們就可以進行無偏見預測: 1.先估測出平均績點的平均值。 2.根據你對證據的印象算出與之相匹配的平均績點。 3.對你的證據和平均績點的關聯作出估計。 4.如果關聯度是0.3,則從估算出的平均績點的平均值中抽出30%,放到與之匹配的平均績點裡。 步驟1為你提供了基準線,即在你除了知道朱莉是個快畢業的大學生之外什麼也不知道的情況下,預測她的平均績點。在沒有資訊的情況下,你很有可能預測其為一般水平。(這一點與你對湯姆的預測相似,在對他一無所知的情況下,你便將企業管理專業畢業生的基礎比率放在了他的身上。)步驟2是你的直覺性預測,這個預測將你的估計和證據進行了匹配。步驟3使你離開基準線靠向自己的直覺,但你能離開的距離取決於你對關聯性的估測。在步驟4中,儘管你最終作出的預測還是受到了直覺的影響,但是這個影響力已經小很多了。 這種預測方法很常見。在你需要預測一個定量數值時,就可以運用這個方法,例如在預測平均績點、投資效益、公司發展的業績時,這個方法就可以派上用場。這個方法以你的直覺為基礎,但是削弱了直覺的影響,使它迴歸到平均值上了。當你有充分的理由對自己的直覺性預測的準確性充滿信心時,即證據和預測之間聯絡非常緊密,進行調整的餘地就會很小。 直覺性預測需要校正是由於它並不具有迴歸性,因此是帶有偏見的。假設我預測每一位高爾夫球員在一場錦標賽上第二天的得分與第一天的得分相同,那麼這個預測並沒有考慮到迴歸平均值的問題:第一天發揮得好的高爾夫球員第二天比賽時水平都會有所下降,而那些頭天狀態不佳的球員則大多會在第二天有所提高。當我們最後將預測值與實際結果進行比較時,我們會發現,缺失迴歸性的直覺確實帶有偏見。 這些預測普遍對第一天發揮得好的人過於樂觀,對開始就發揮得不怎麼樣的人則過於悲觀。預測與證據一樣極端。同樣,如果不使預測迴歸到平均值上來,而是根據 171
思忠考,快與慢 THINKING FAST ANDD SLOW 兒童時期的成就來預測其大學時期的分數,那麼你多半會對孩提時代閱讀能力強的人在大學時代取得的學術成績頗感失望,而那些較晚開始閱讀的孩子的大學成績反而會給你帶來驚喜。修正過的直覺性預測消除了這些偏見,所以預測(過高或過低) 高估真實值或低估真實值的可能性大致是相等的。當你不帶偏見地預測時仍然會犯錯,但這時的錯誤較小,也不會導致過高或過低的估值。 兩位教授候選人,應該選擇哪一位? 前文中,我向大家介紹了湯姆的情況,用以說明不連續結果的預測問題,比如對其所屬的專業領域或者一次考試的成功機率進行的預側,這些預測是透過評估某一特定事件的可能性(或者按照結果出現的可能性大小排序)來表達的。我還曾描述過抵制不連續預測中的常見偏見的步驟,比如忽略基礎比率,對資訊的優劣不敏感。 有些預測偏見是透過一個數值範圍來表達的,例如某學生的平均績點或某公司的收益,這些偏見與我們在判斷結果的可能性的過程中所持偏見相似,而兩種偏見的修正過程也十分相似: •都包含一種基準線預測,如果你對手頭這個案例的情況一無所知,便會作出這種預測。在純對的情況下,這個基準線是基礎比率;在有數字的情況下, 這個基準線就是相關結果的平均值。 •都包含一種直覺預測,無論是可能性或是平均績點,這種預測會將呈現在大腦中的數值通通表達出來。 •在上述兩種情況中,你的目的都是要作出一種預測,這種預測可在基礎比率和直覺性反應之間充當煤介。 • 在沒有什麼有價值的資訊的情況下,你會堅守基準線。 •在其他極端情況下,你還會堅守自己最初的預測。當然,只有在對支援自己最初預測的證據進行過嚴格驗證之後,你才會信心十足地堅持那個預測。 •在大多數情況下,你會發現自己有理由懷疑自己的直覺判斷和真理之間的關聯其實並不完美,而你最終會給出介於兩者之間的判斷。 172
第18章如何讓直覺性預測更恰當有效? 這個過程很接近一個恰當的統計分析可能會出現的結果。如果成功的話,這個過程就會使你作出的預測偏見越來越少,作出的可能性評估越來越合理,對各種數值作出的預測也越來越適度。前述兩個過程意在解決同一種偏見,即直覺性預測總是過於自信或過於極端。 修正你的直覺性預測的偏見是系統2的任務。要想找到相關的參照物、對基準預測作出估測或者對證據的質量進行評估,往往需要付出很大的努力。只有在風險很高而你又特別渴望避免犯錯誤時,這種努力才顯得合乎情理。此外,你應該知道糾正你的直覺也許會使你的生活變得複雜。無偏見預測的一個特徵就是,只有在資訊非常有效時才允許人們對罕見或極端的事件作出預測。如果你期待自己作出恰當有效的預測,那麼你的預測結果就永遠不會太離譜或者偏離平均值太多。而如果你的預測不存在偏見,你也就永遠不會有極端事件的“愉快體驗”了。當你在法學院最得意的學生成為最高法院的法官時,或者當你曾經很看好的那家新成立的公司成為商界新秀時,你永遠不會說“我早就知道會這樣”。如果資訊量有限,你也無法預測到一個出色的高中生會成為普林斯頓大學的優等生,同理,一個風險資本家永遠不會認為新創立的公司在起步階段時成功的機率會 “很高”。 一定要嚴肅對待那些反對適度的直覺性預測原則的意見,因為擺脫偏見並非總是頭等大事。如果不問具體情況,對所有預測的錯誤都同樣對待,那麼對無偏見預測的偏愛就是合理的了。然而總有那麼一些時候,一種錯誤比另一種錯誤更糟糕。若一位風險投資家只為尋找“下一件大事”,那麼他錯過下一個谷歌或臉譜網的風險就會遠遠大於對剛剛創立的公司(最終破產)進行適度投資帶來的風險。風險投資家的目標是正確判斷極端情況,甚至以高估其他許多風險為代價也在所不惜。對於借出大筆貸款的保守銀行家來說,某一位借款人破產帶來的風險會比拒絕幾位可能會履行債務的潛在客戶帶來的風險更大。在這種情況下,即使作出這些判斷所依據的資訊效度只是適中,使用極端的語言(“前景非常好”,“違約的嚴峻風險”)也可能會力其帶來舒適感。 對於一個理性的人來說,無偏見且適度的預測不應該引發問題。畢竟一個理性的風險投資家知道,即便是最有前景的新建公司,其成功機率也只是中等水平而已。 她將自己的工作視從所有賭注中找到的前景最好的賭注,而且關於要投資的那家 173
思考,快與慢 THINKING FAST ANE SLOU 新建公司的發展前景問題,她覺得沒有必要欺騙自己。同樣,預測某家公司收益的理性個體不會受到某個數字的束縛—他們應該考慮到最有可能出現的那個結果的不確定性。如果成功的回報足夠大,一個理性的人就會考慮向一家極有可能倒閉的企業投資一大筆錢,而不會自欺欺人地抬高其成功機率。然而,我們並不都是理性的, 我們中的一些人也許還需要歪曲判斷作為保護來掩蓋自己的無能為力。如果選擇接受極端的預測來矇蔽自己,你就會清楚地意識到自己對自己的縱容。 也許我提出來的那幾個修正步驟最難能可貴的貢獻就是這些步驟會要求你思考自己對事情到底瞭解多少。接下來我會運用一個學術界盡人皆知的例子,其他生活領域中的例子亦可依此類推。一個部門要僱用一位年輕的教授,他們希望這位教授未來的學術能力能夠達到最高水平。該部門的調查委員會最後將候選人圈定為兩個: 金最近完成了畢業設計。她的推薦信中都是對她的溢美之詞,而且西試時她說得也很好,給在場的每個人都留下了深刻的印象。不過她沒有什麼實質性的料研成果。 簡經過過去3年的學習取得了博士後頭銜,學術成果頗豐,研究也做得非常出色,但她在面試時表現得不如金出色。 我們直覺會選擇金,因她給人的印象更深刻,而且眼見即為事實。但與簡的資訊相比,金的相關資訊則少很多。我們可以回想一下小數原則。事實上,你從關於金的描述中得到的資訊樣本比簡的要小,而且在小樣本中更容易發現極端的結果。小樣本的結果往往有更多的運氣成分,因此在判斷金將來的表現時,更應該回歸平均值。 若覺得金更有可能退步,最終你就會選擇簡,儘管你對她的印象並不深刻。如果按照學術能力來選人,我會投給簡一票,但我得先努力克服自己對金的直覺印象——金更有希望。跟著我們的直覺走比違背直覺感覺更自然、更親切。 你很容易就能想象出不同情境下的相似問題,例如某位風險投資家要在位於不同市場中的兩家新建公司之中選出一家進行投資,他可以相當精確地預估其中一家公司的產品需求量,而另一家是一派欣欣向榮的景象,讓人覺得更有希望,但其發展前景𨚫並不是很確定。如果把這種不確定因素考慮在內的話,你對第二家公司前景的最佳猜測是否還會優於第一家公司呢?這個問題值得認真思考。 174