AI 新聞與投資
思考,快與慢

第16章因果關係比統計學資訊更具說服力想法以及我們對於個體案例的想法存在很大的差距。相較於非因果關係的資訊來說,

17 / 39

用因果關係進行解釋的統計學結果對我們的想法影響更大。但即使是具有說服力的因果關係統計資料也不會改變我們在個人經歷中形成的長期堅守或是根深蒂固的信念。此外,令人驚訝的個體案例影響甚大,是教授心理學更為有效的手段,因為個案與統計資料的分歧需要調解,並被嵌入一種因果關係裡,正因如此,本書才包含種種直接向各位讀者提問的問題。與從別人那兒聽到令人驚奇的事實相比,你更有可能因從自己的行為中發現驚人的事實而學到知識。 示例——原因和資料 “我們不能假設僅僅透過統計資料他們就能真正學到知識,需要再給他們一兩個有代表性的個體案例來影響他們的系統1(作出判斷)。” “不需要擔心這個統計學資訊會被忽略掉。相反,它會立刻被應用到形成陳規的過程中。” 安驅訴乎刪 155

第17章所有表現都會迴歸平均值我曾經為以色列空軍的飛行教練們講授過關於高效訓練的心理學課程,那次經歷為我帶來了職業生涯中最引以為豪的發現。當時我告訴他們關於技能訓練的一條重要原則:對良好表現的嘉獎比對錯誤的懲罰更有效。不管是對鴿子、老鼠、人類, 還是其他什麼動物的研究,都給這個說法提供了證據。 就在我結束了激情洋溢的演說之後,經驗最為豐富的一位教練舉手示意,發表了一番自己的意見。他先是承認獎勵對鳥確實管用,但他認為這不是訓練飛行學員的最佳選擇。他說道:“在很多情況下,我會讚許那些完美的特技飛行動作。不過,下一次這些飛行員嘗試同樣飛行動作的時候,通常都會表現得差一些。相反,對那些沒執行好動作的學員我會大聲怒吼,但他們基本上都會在下一次表現得更好。所以說,別告訴我們嘉獎有用而懲罰沒用,因為事實恰恰相反。” 這條統計學原則我已經講授了很多年,而這一次我從一個新的角度重新認識了它,這的確是一個頓悟的時刻。那個飛行教練是正確的,但同時他也徹徹底底地錯了。 他的觀察是精明且到位的:被他表揚之後,很多學員很有可能會表現得很糟糕;懲罰反而會促使他們進步。但是就他的推斷而言,獎勵和懲罰之間是毫無關係的。他所第17章所有表現都會迴歸平均值觀察到的就是眾所周知的“迴歸平均值”現象,這種現象與表現質量的隨機波動相關。 一般來說,只有學員的表現遠遠超出平均值時才能得到這位教練的表揚。但也許學員只是恰巧在那一次表現得很好,而後又變差,這與是否受到表揚毫無關係。同樣, 或許學員某一次非同尋常的糟糕表現招來了教練的怒吼,因此接下來的進步也和教練沒什麼關係。這個教練把不可避免的隨機波動與因果解釋聯絡起來了。 這個提議確實引起了反響,不過這些教練對機率預測的代數方法沒什麼興趣。 所以,我用粉筆在地上畫了一個靶子。我請房間裡的每一位教練都轉過身去,背對著靶子向裡面接連扔兩枚硬幣。接著我們分別測量了靶子到兩枚硬幣的距離,並寫在黑板上。然後,我們又將這些資料按第一次投擲的距離遠近排列。很明顯,第一次投擲得比較好的人第二次大都做得不好,而第一次沒有投擲好的人第二次大都有了進步。我告訴這些教練,他們在黑板上看到的資料其實和飛行員的表現是一致的: 槽糕的表現常常會有提高,而好的表現則會變得糟糕,這跟表揚與懲罰都沒有關係。 那天,我的發現是,那些飛行教練陷入了一個偶然性困局之中:因為當飛行學員表現差時,他們就會受到懲罰,而接下來的進步則很可能為他們帶來嘉獎,事實上懲罰根本就沒有發揮什麼作用。而且,處於這種窘境之中的不僅僅是那些教練。我曾無意中發現了人類環境中一個意義重大的事實:生活給予我們的反饋常常違背常理。因為當別人取悅我們時,我們也會對他好,當別人對我們不好時,我們也會對他產生厭惡之情。然而從統計學角度來看,我們卻是因為對人友好而受到懲罰,因為舉止無禮而得到嘉獎。 第二次的表現與第一次並無因果聯絡幾年之前,線上雜誌《邊緣》(Edge)的編輯約翰•布魯克曼(John Brockman) 請一些科學家講述他們 “最喜愛的公式”。以下是我提供的資訊: 成功=天賦+運氣巨大的成功=更多的天賦+更多的運氣運氣常常會促成成功,然而當我們把這個並不令人吃驚的想法用到高水平高爾夫 157

思考,快與慢 THINKING, FASTANDSLOW 錦標賽前兩天的比賽中時,卻出現了令人驚訝的結果。為了簡單說明這個問題,我們假設這兩天中參加比賽的選手平均績點為72標準桿。我們關注了一位在第一天表現非常不錯的選手,他在當天比賽結束時得分為66杆。我們從這個得分中能推斷出什麼?最直接的推斷就是這個球員要比錦標賽中其他選手有更高的天賦。成功公式告訴我們另一個推斷同樣成立:第一天表現很好的高爾夫選手很可能在那一天有著非比尋常的運氣。如果你能接受天賦和運氣都能帶來成功這種想法,那麼“這個成功的高爾夫球手很幸運”這個結論肯定和 “他很有天賦”這個結論一樣可信了。 同樣,如果你關注一個當天的成績超過標準桿5杆的球員,就可以推測他技術很槽,而且那天運氣也不好。當然,你也清楚這些推測不一定都成立。某個打了77杆的運動員很可能非常具有天賦但遭遇了極其不走運的一天。下面的推測是根據第一天的得分作出的,儘管不確定,但這種推測通常是正確的。 第一天高於一般水平的成績=高於一般水平的天賦+第一天的好運氣第一天低於一般水平的成績=低於一般水平的天賦+第一天的壞運氣現在,假設你已經知道某個高爾夫球手第一天的得分,並且要對其第二天的得分進行預測。你希望這個選手第二天仍舊能夠延續前一天的優異表現,所以你給出的最佳猜測就是第一個選手得分“高於平均水平”,而第二個選手得分則“低於平均水平”。當然,運氣就很難說了。我們沒辦法預測出一名選手在第二天(或是任意一天) 的運氣如何,因此我們能作的最佳推測就是採用其平均值—既不好也不壞。也就是說,在沒有其他任何相關資訊的情況下,對於某選手在第二天的得分情況,我們能作出的最好推測就是:第一天的表現不會重演。你很有可能會這樣說: •在第一天表現很好的高爾夫選手在第二天也會表現得不錯,但還是會比第一天稍差一點,因為他在第一天碰到的好運氣不一定能在第二天再次碰到。 •在第一天表現不佳的高爾夫選手在第二天也許得分還會低於平均水平,但是會有些提升,因為他第一天的黴運不一定會持續。 儘管我們會猜測第一名選手在第二天的表現還是會優於第二名選手,但是他們之間的差距會縮小。 158

第17章所有表現都會迴歸平均俏事實上,對選手第二天的表現最準確的預測通常是最保守、最接近平均值的,而不是基於第一天分數的預測。我的學生每次聽到這樣的結論都很驚訝。正因為如此, 這種模式被稱為“迴歸平均值”。原始資料越極端,我們所期待的迴歸就越明顯,因為極好的分數常常表明這一天的運氣很不錯。這種迴歸式的預測是很合理的,但是準確度卻得不到保證。有些高爾夫選手在第一天得了66杆的高分,如果第二天運氣更佳的話,得分甚至更高。當然大部分人的表現都會變差,因為他們的運氣不再處於平均值之上了。 現在我們將時間軸反過來,將選手按第二天的得分情況排序,來看看他們第一天的表現。我們仍舊會發現同樣的模式—迴歸平均值。第二天表現出色的選手很可能是因為當天運氣好,而最好的猜測就是他們第一天的運氣不佳。當你根據後期的表現來推測早期表現時,也會發現迴歸平均值的現象,此時你便會相信這種迴歸並非巧合。 迴歸效應無處不在,很多可以說明這一效應的誤導性因果事件同樣司空見慣。 有一個經典的例子,那就是“體育畫報的詛咒”—凡是登上《體育畫報》(Sports Ilustrated)這本雜誌封面的運動員都會在接下來的賽季中表現欠佳。一般來說,人們會認為過度自信以及人們對其期望過高的壓力造成了這些人表現不佳。不過,這個詛咒可以用更簡單的方式來解釋:能夠成為《體育畫報》封面人物的運動員在前一賽季一定表現極為出色,也許這種出色的表現在很大程度上源於運氣—運氣是善變的,接下來他就沒那麼走運了。 當年和阿莫斯正在撰寫一篇關於直覺預測法的文章時,我碰巧看了冬奧會的男子高空滑雪比賽。在這項比賽中,每個運動員都有兩次機會,最終結果由兩次得分決定。 每當一名選手進行第二輪時,解說員常常會說“挪威選手第一輪表現很好,現在他一定很緊張,因為想要保持領先地位,估計他在第二輪會表現欠佳”,或者“瑞典選手第一輪表現很糟糕,他明白自己已別無選擇,因此也沒有什麼壓力,大概第二輪就會做得更好”。所有這些評論都令我感到很吃驚。很明顯,這個評論員已經覺察到了迴歸平均值的概念,而且還在沒有任何依據的情況下編出了一個有理有據的故事。 也許他的解釋是正確的,如果我們測一下運動員的心跳,可能會發現不佳的表現之後確實會放鬆,當然也可能不會。有一點我們要記住,運動員第一跳和第二跳的表 159

思考,快與慢翠終2 現之間不存在因果關係。這只是一個數學問題,其中運氣起了很大的作用。這個說法不太令人滿意—我們都想得到一個有因果關係的解釋——但事實的確如此。 迴歸現象的意義不亞於發現萬有引力無論是沒有察覺還是解讀錯誤,這種迴歸現象對人類而言總是很陌生的,因此直到萬有引力和微積分理論出現兩百年後,這種現象才為人們所理解。而且,是19世紀英國最偉大的科學家之一經過艱苦卓絕的努力才探索出這一重要規律的。 弗朗西斯•高爾頓(Francis Galton)爵士是19世紀英國著名的學者,也是達爾文的表兄。他發現並命名了迴歸平均值的現象。1886年,他發表了《在遺傳的身長中向中等身長的迴歸》,其中涉及對連續子代的種子大小的測量以及對子代株高和母本株高的比較。在對種子的研究中,他寫下了如下的話: 實驗結果看上去十分值得關注,在1877年2月9日的一次演講中,我就先於皇家科學院將這些結果用做一次演講的基本內容了。從這些實驗可以看出,子代的高度和母本高度似乎並不相關,但似乎前者比後者更趨於平均。如果母本較高,那麼子代就會變矮;如果母本較矮,則子代就會變高。實驗顯示,子代向平均值的迴歸與母本高矮的差異是成比例的。 皇家科學院是世界上最古老的獨立酐究機構,高爾頓很期待該機構中博學的院士們也會對他那“值得關注的實驗觀察”感到驚訝。但真正值得關注的是,他為之驚訝的統計規律不過是像我們呼吸的空氣一樣稀鬆平常。迴歸效應隨處可見,但是我們卻無法識別它們的真面目。高爾頓以子代高度的迴歸現象為起點,逐漸發現當兩個測量值之間的關聯不是那麼完美時,此時也會出現這種迴歸。他藉助了當時最傑出的幾位統計學家的幫助,且歷時多年才得出這一結論。 當按不同的標準衡量兩個變數時——例如體重和鋼琴技藝——如何測量這兩個變數之間的迴歸是高爾頓要攻克的重大難題之一。要解決這一問題需要以人口作為參照標準。假設我們對某小學所有年級的100名兒童的體重和鋼琴技藝進行測量,然後將兩者按從高到低的順序分別進行排列。比如說,簡在鋼琴技藝中排第三名,但 160

第17章所有表現都會迴歸平均值按體重則排第27名,那麼我們就可以說她彈鋼琴的水平比她的體重排名靠前。我們來作些假設,這樣就可以使這一現象更容易理解。 不管年齡幾何, •鋼琴技藝高低僅僅取決於每週練習的時長。 •體重多少僅僅取決於冰激凌的攝入量。 •冰激凌攝入量和每週練習鋼琴的時長並不相關。 現在透過排行(按統計學家的說法是 “標準分”),我們可以得出更多的等式: 體重=年齡+冰激凌消耗量鋼琴技藝=年齡+每週練習時長你會發現,當我們透過體重預測鋼琴技藝或透過鋼琴技藝預測體重時,就會出現迴歸平均值的現象。如果知道湯姆在體重中排第12位(遠高於平均值),我們就可以 (從統計學上)推測他比平均年齡要大,而且可能比其他孩子吃更多的冰激凌。如果知道芭芭拉的鋼琴技藝排第85位(遠低於平均值),我們就可以推測她應當比大多數孩子年齡小,而且每週練習的時間也少。 兩個值之間的 “相關係數”指的是兩個值共有因素的相對比重。這個值在零和1 之間浮動。我們擁有父母各一半的基因,對於像身高這種受環境因素影響很小的特徵來講,父母和子女的相關係數在0.5左右。下面的例子能幫助我們更好地瞭解相關係數: •一個物體的型號用英制單位精確測量的結果與用公制單位精確測量的結果之間的相關係數為1。任何影響其中一個值的因素都會影響另一個。兩者享有同樣的決定性因素。 • 美國成年男性自報的身高和體重之間的相關係數為0.41。如果將女性和兒童也包括進去,那麼相關度就會更高,因為性別和年齡都會影響身高和體重, 這便使得共有因素所佔比例增加。 •學術能力評估考試成績(SAT)和平均績點(GPA)之間的相關係數大約是0.6。然而,研究生的潛能測試與成功之間的相關性則小得多,這在很大程度 161

思考,快與慢!!SX 上是因這一群體的潛能差異比較小。如果每個人都有相似的潛能,那麼在衡量成功時,潛能的因素就不會佔太大的比重。 •美國人收入和教育程度的相關係數約溝0.4。 •家庭收入和他們電話號碼後4位之間的相關係數為零。 弗朗西斯•高爾頓用了好幾年的時間才確定相關性和迴歸性並非兩個概念—它們只是從不同視角對同一個概念作出的闡釋。這個概念的原則很簡單,但是影響卻很深遠:只要兩個數值之間的相關度不高,就會出現迴歸平均值的情況。為了闡釋高爾頓的卓見,我們來看一個例子,很多人都認為這個例子很有趣: 聰明的女人常常會嫁給不如她們聰明的男人。 如果你在朋友聚會時挑起這個話題,一定會引起熱烈討論,大家肯定都願意分享自己的看法。即使有些對統計學有所瞭解的人也會很自然地用因果關係去解釋這個現象。一些人認為高智商的女人為了避免和同樣高智商的男人競爭才這麼做,或者是在擇偶之時不得不妥協,因為同等智商的男人不願意與這些女人競爭…⋯也許還會有其他更牽強的解釋。現在我們來看看下面的表述: 夫妻二人智商之間的相關性並不是絕對的。 這個觀點顯然是正確的,而且很無聊。誰會期待這樣一種相關性是絕對的呢?那就沒有什麼好解釋的了。不過,你認為有趣的觀點和你認為毫無意義的觀點又是等值的。如果夫妻二人智商之間的相關性並不是絕對的(如果男人和女人在平均智商上沒有差異),那麼從數學上來講,高智商女人嫁給那些不如她們智商高的男人是順理成章的(反之也成立)。對於這一現象,用迴歸平均值效應來解釋要比用並不絕對的相關性來解釋更通俗,也更有說服力。 你也許很同情高爾頓這樣絞盡腦汁地解釋迴歸的概念。統計學家戴維•弗裡德曼(David freedman)曾說過,如果把迴歸的概念用在民事或刑事審判中,那麼試圖對陪審團解釋“迴歸”的一方一定會輸掉官司。為什麼會這樣呢?其中主要的原因也是本書中反覆出現的主題:我們的思維常會對因果關係的解釋帶有很強的偏見, 162

第17章所有表現都會迴歸平均值而且不善於處理統計資料。當我們把注意力集中在某一事件上時,相關的記憶就開始探尋其原因—一更確切地說,我們會對所有早已存在於記憶中的原因進行自動搜尋。當發現有迴歸效應時,因果關係解釋就會被啟用,但事實上這些解釋都是不對的, 因為迴歸平均值雖然可以用來解釋現象,卻無法找出其中原因。在高爾夫錦標賽中, 那些第一天成功的選手通常在第二天發揮都很糟糕,而這場比賽總會吸引我們的注意力。對於這種現象最好的解釋就是,那些選手第一天出奇地走運,不過這種解釋缺乏我們的大腦所認可的因果關係因素。事實上,那些能夠為迴歸效應提供巧妙解釋的人往往賺得盆滿缽滿。如果一個商業評論員聲稱“今年的生意比去年要好,因為去年太槽了”,儘管他說得沒錯,但也很有可能很快就被電臺噤聲。 我們理解“迴歸”概念存在很多困難,這些困難皆源自兩個系統—系統!和系統2。在相當數量的案例中,即便提供了一些統計資料,若無特殊說明,“相關”與“迴歸”的關係還是相當模糊的。因此,系統2認為理解這種關係很難。因從某種程度上講,這是由於我們總是要求對事物進行因果關係解釋,這也是系統1的一個特徵。 抑鬱兒童喝了某種功能飲料,他們的情況在3個月內得到很大改善。 這個新聞標題是我杜撰的,但這則新聞所報道的內容卻是真實的:如果給一群抑鬱兒童喝了某種功能飲料的話,一段時間後,他們的病情會有很大的好轉。如果抑鬱兒童每天都花一段時間倒立,或是把一隻貓抱在懷裡20分鐘,這些舉動也可以使病情好轉。多數讀者讀了這則新聞之後會不由自主地認為:喝功能飲料和抱貓的行為的確使抑鬱兒童的病情得到了改善,但這個結論劫無法得到證實。抑鬱兒童是一個極端群體,他們比大多數其他兒童要壓抑得多——這些極端群體在一段時間之後會迴歸平均水平。一連串的測試反映出來的不同壓抑程度之間並無絕對的相關性, 因此迴歸平均值(或者更確切地說是迴歸平均水平)這種現象又會出現:即使他們不抱貓,也不喝功能飲料,一段時間之後這些抑鬱兒童的病情同樣會有所緩解。為了證明喝功能飲料或是其他治療方法是有效的,我們必須要對兩組患病兒童進行比較—實驗組接受了治療(比如喝過功能飲料),對照組沒接受過治療(或只是服用過安慰劑)。我們期望的是對照組僅透過迴歸就能改善病情,而該實驗的目的在於判定接受治療的病人是否恢復得更快。 163

思考,快與慢祭繳對迴歸效應作出錯誤因果解釋的不僅僅是大眾讀者。統計學家霍華德•維納曾經列出一長串傑出研究者的名字,他們也犯過同樣的錯誤——將相關性和因果性混淆在一起。迴歸平均值是科學研究中的常見問題,有經驗的科學家都會小心提防這種毫無緣由的因果推論所形成的陷阱。 在我最喜歡的那些關於直覺產生預測錯誤的例子中,有一個是根據馬克斯•巴澤曼(Max Bazerman)的《管理決策中的判斷》(Judgment in Managerial Decision Making)一書中的內容改編而來的: 假設你為一家連鎖百貨公司作銷售預測。所有連鎖店的規模和商品種類都非常相似,但是其地理位置、競爭狀況以及其他隨機因素使這些商品的銷量有所不同。下列資料為2011年的營業額,請你對2012年的營業額進行預測。你已經知道自己可以接受經濟學家所作的總體預測—銷售額總體會增長10%。那麼你將如何完成下列表格? 門店 I 2 3 4 總顴 2011年 11 000 000 美元 23 000 000美元 18 000 000美元 29 000 000美元 61 000 000美元 2012年 67 100 000美元讀過本章,你就知道將每家店的銷售額增加10%顯然是不對的。你應當使自己的預測具有迴歸性:對於業績不好的店,預測增長率應高於10%;對於業績較好的店,預測值應低於這個值(甚至是負值)。不過如果你諮詢其他人的話,很有可能會碰釘子:這麼顯而易見的問題還有什麼好問的?正如高爾頓歷經艱難才發現的那樣, 迴歸的概念從來就不是顯而易見的。 164