AI 新聞與投資

儘管你接收到的資訊中沒有任何與益處相關的資訊。在此我們又看到了系統2的另一個“特性”。到目前為止，我似乎已經將其描述成一個給系統1留有足夠餘地的默許監視器。我描述的系統2還具有主動搜尋記憶的功能、複雜計算功能、比較功能、規劃功能和決策功能。在球拍和球的問題中以及許多其他的兩個系統相互作用的例子中，系統2似乎總是處於最高決策地位，並有能力抵制系統1的建議，它能使事情放緩，開始進行邏輯分析。自我批評是系統2的功能之一。但在態度方面，系統2更像是系統1各種情感的讚許者而非批評者，也可以說是其各種情感的轉讓者而非實施者。它搜尋的資訊和論據多半侷限於與已有看法一致的資訊，並不著意對其進行調查稽核。積極且追求連貫的系統1為要求不高的系統2提供了各種解決方案。示例—替代和啟發法 “還記得我們絞盡腦汁去回答的那個問題嗎？我們是不是把它換成了一個簡單點的問題呢？” “別人問我們的問題是這位候選人是否會成功，但我們要回答的問題似乎是她是否能成功應對採訪。咱們還是別顧左右而言他了。” “他喜歡這個專案，因此他認為該專案投入少、回報高。這是情感啟發式的一個典型案例。” “我們將去年的表現作為依據來預測公司未來幾年的表現。這個依據能作為有效參照嗎？我們還需要其他什麼資訊才能作出正確預測？” 087

思考，快與/ 甜經下面列出了系統1的特點和活動。每個主動句都代替了一個陳述句，雖然表述更精確了，但刧更難理解了，因此大腦便開始自主且快速地執行。我希望這個對大腦特性的描述能幫你形成一種對虛擬的系統1各種“特性”的直覺認識。與身邊的很多人一樣，你對系統1在不同情況下如何運作會有直覺的認識，而且其中大多數直覺都是正確的。系統1的特點 •生成印象、感覺和傾向：當系統2支援這些行為時，它們就會成為信仰、態度和意圖。 •自主且快速執行，只需付出較少努力，甚至不用付出努力，沒有自主控制的感覺。 •當發現（搜尋）特形式時，能接受系統2編控來調動注意力。 • 在接受了一定的訓練後，能夠做出熟練的回應，產生直覺。 •另聯想記憶激發出來的各種想法創造連貫形式。 •將認知放鬆感和真理錯覺、愉快的感覺以及放鬆的警惕感聯絡起來。 •區分常態中令人驚奇之事。 •推斷原因和意圖。 •忽略歧義，按捺住心中的疑問。 •誇大情感的一致性（光環效應）。 •將注意力集中在當前的證據上，忽略不存在的證據（眼見即為事實）。 •作一些基本估測。 •透過常態和原型來表現集合，但不要將兩者看成一個整體。 •透過測量確定不同程度對應的匹配物（比如音量的大小）。 •真正去計算，而不是空想（思維的發散性）。 •有時用簡單點的問題替代難題（啟發法）。 •對變化的感知比對形態的感知更敏銳（前景理論）。* •對可能性作出過高估計。* •對數量越來越不敏感（心理物理學）。* •對損失的反應比獲得更強烈（損失厭惡）。* •嚴密設計決策問題，分別進行討論。* *帶*的內容將在本書第四部分作詳細介紹。 088

LHINKING. 第二部分 FASTAND SLOW 啟發法與偏見安驅昌第10章大數法則與小數定律一項研究對美國3141個縣的腎癌發病率進行了調查，調查顯示該病的分佈模式很值得注意。發病率最低的縣差不多都位於中西部、南部和西部人口稀少的鄉村，這些區域按照慣例由共和黨管轄。對此，你有何看法？剛剛過去的幾秒鐘裡，你的大腦處於非常活躍的狀態，這主要是因為系統2在執行。你謹慎地在記憶中搜尋著並作出假設。在這個過程中你也付出了一定的努力，你的瞳孔會擴張，心跳會適度加快。系統1也沒有閒著，因系統2的執行需要從聯想記憶中獲取事實和建議。你很可能會否認共和黨的政策提供了腎癌防控方法這個想法，卻會關注腎癌發病率低的縣大多是鄉村這個事實。這個例子是我從機智的統計學家霍華德 •維納（Howard Wainer）和哈里斯 • 澤維林（Harris Zwerling）那兒得到的，他們對這一案例的評論是：“人們很容易作出推斷，認為腎癌發病率低主要是由於鄉村的生活方式很健康—沒有空氣汙染和水汙染，食品沒有新增劑，保證新鮮。”這一點完全說得通。現在，考慮一下腎癌發病率最高的縣的情況吧。假設這些易發病的縣差不多都位於中西部、南部和西部人口稀少的鄉村，這些區域按照慣例由共和黨管轄。霍華思考，快與慢 WASL FAST ANE SLW 德•維納和哈里斯•澤維林半開玩笑地評論道：“人們可以很容易作出推斷，導致腎癌高發病率的直接原因是鄉村生活的貧困——醫療條件差、高脂肪飲食、酗酒、嗜煙等。”當然這種說法肯定有問題，因為鄉村生活方式不可能既是腎癌發病率高的原因又是其發病率低的原因。問題的關鍵並不在於這些縣處在鄉村地區或是由共和黨掌管，而在於鄉村地區人口少。我們透過這個例子學到的不是流行病學知識，而是我們的大腦和統計資料之間的複雜關係。系統1非常擅長一種思維模式——自動且毫不費力地識別事物之間的因果聯絡，即使有時這種關係根本就不存在，它也會這樣認定。當聽到腎癌高發地區的情況時，你立刻會想當然地認為這些縣與其他縣不同是有原因的，一定有個理由可以解釋這種不同。然而，正如我們所見，當系統1面對“純統計學”的資料時是束手無策的，因為這些資料雖然可以改變結果出現的機率，卻不能直接導致結果的發生。根據定義，一個隨機事件是不需要解釋的，但一連串的隨機事件就有規律可循。想象有一個裝有大理石彈球的甕，其中有一半的彈球是紅色的，另一半彈球是白色的。然後，再想象有一個非常有耐心的人（或一個機器人）隨意從甕中取出4個大理石球，記錄其中的紅球數，再把球放回去，重複這樣的做法數次。總結記錄結果時，你會發現 “2紅2白”的結果出現的次數（幾乎剛好）是“4個全紅”或“4個全白” 這種結果的6倍。這一倍數關係是個數學事實。你可以對這種從甕中反覆抽樣的結果作出自信的預測，就像你能預測到用錘子砸雞蛋的結果一樣。儘管你無法預見蛋殼破碎的具體細節，但大概結果還是很確定的。兩件事的不同之處在於：你想到錘子砸雞蛋時感受到的那種明確的因果聯絡，在甕中取樣的設想中是找不到的。相關的統計學事實與癌症那個例子也有聯絡。兩個耐心的計數者輪流從甕中取大理石球，傑克每次拿出4個球，吉爾拿出7個。他們都記錄了每次拿到相同顏色彈球的次數—-要麼全白，要麼全紅。如果他們取球的做法持續的時間足夠長，傑克拿到同顏色大理石的次數會是吉爾的8倍（兩人的預期機率分別為12.5%和1.56%）。這個結果與錘子無關，也與因果聯絡無關，這僅僅是一個數學上的事實：一次拿4個彈球與一次拿7個相比，出現極端結果的機率更大。現在，將美國人口想象成一個巨大的甕中的彈球。有些球上標有KC（即Kidney 092

第10章大數法則與小數定律 Cancer的簡稱）字樣，表示腎癌。你抽取彈球樣本，並依次按照所在縣擺放，你會發現鄉村地區的樣本要比其他地區的少。如同傑克和吉爾所做的那個遊戲一樣，極端的結果（非常高或非常低的癌症發病率）容易出現在人口稀少的縣，這個故事告訴我們的就是這些。我們從一個令人費解的事實說起：腎癌的發病率在各縣有所不同，且是有規律的，我用統計學理論對此作了解釋：相比干大樣本，極端的結果（高發病率和低發病率）更容易出現在小樣本中。這樣的解釋不存在因果聯絡。某縣的人口稀少既不會引發癌症，也不能避免癌症，只會使癌症的發病率比人口稠密地方的發病率更高（或更低）。這就是真相，沒什麼可解釋的。在某個人口稀少的縣，癌症發病率並非真的比正常情況更低或更高，只是這個縣正好在某個特殊的年份趕上了抽樣調查罷了。如果我們在第二年重複這樣的分析，也能預測到在小樣本中出現極端結果的一般模式，但在前一年癌症發病率高的縣，這一年發病率並不一定高。如果是這樣的話，則人口稠密或稀少的因素就無法對發病率作出解釋了：這些表面因素就是科學家眼中所謂的假象，即觀察結果完全依賴於調查方法的某一方面，在這個案例中，則依賴於樣本大小。我剛才說的例子也許會令你驚訝，但這並不是真相初次大白於天下。你早就知道應該更相信大樣本，並且即使是對統計學一無所知的人也聽說過大數法則。但是“知道”並非是非抉擇問題，你可能會發現下列陳述放在自己身上很合適： •當你閱讀這個關於流行病學的例子時，並沒有立刻注意到“人口稀少”這一將點與此次調查有何關聯。 •對於採用4個樣本還是7個樣本所產生的不同結果，你至少會感到有一點驚訝。腦力： • 即使是現在，想要確定下面兩個陳述句所說的完全是一回事，你也要費些（1）大樣本比小樣本更精確。（2）小樣本比大樣本產生極端結果的機率大。第一個表述清晰地陳述了一個事實，但直到感受到第二個表述傳達給你的意思， 093

思考，快與理緊2 你才意識到自己並沒有真正理解第一個表述的意思。上述內容概括起來就是：沒錯，你知道大樣本的結果更精確，但你現在可能才意識到你並不清楚為什麼它們更精確。不僅你一人如此，阿莫斯與我在一起進行的第一個研究表明，即使是經驗豐富的研究人員對樣本效應也缺乏直覺，要麼就是理解不到位。小樣本的出錯風險可能高達50% 沒有接受過統計學方面訓練的人是出色的“直覺性統計學家”。我與阿莫斯在20 世紀70年代早期的合作便始於對這個觀點的討論。他對我（在大學）的研究班及我本人講過，密歇根大學的一些研究人員對直覺性統計抱有樂觀態度。我個人對那個觀點有種強烈的感覺：那段時間我發現自己並不是一個出色的直覺性統計學家，但是我也不相信別人會比我好多少。對於一個研究型心理學家來說，樣本變差沒有什麼特別的。它是個煩人且損失又大的麻煩事，會把每項實驗都變成一場賭博。試想你希望證明6歲女孩的平均詞彙量比同齡男孩的詞彙量更豐富的假設。這個假設從整體來說是成立的，女孩的平均詞彙量確實要比男孩的豐富一些。然而，儘管男孩與女孩差別很大，但你很可能會抽取到男女相差不太明顯的樣本，甚至會抽到一個男孩比女孩詞彙測試成績還要好的樣本。如果你是那個研究者，這個結果對於你來說代價就太高了，因為它浪費了你的時間和精力，卻無法證實一個實際正確的假設。使用一個足夠大的樣本是降低這種風險的唯一方法。選擇小樣本的研究者只能看自己是不是能選對合適的樣本了。想要對樣本錯誤的風險作出評估，只需透過一個相當簡單的步驟就可以實現。然而按照慣例來看，心理學家並不是透過計算來選定樣本大小的。他們聽從自己的判斷，但這些判斷往往是錯的。在與阿莫斯發生意見分歧不久之前，我讀過一篇文章，文章透過生動的觀察結果展示了研究人員所犯的錯誤（他們現在仍在犯這種錯誤）。該文作者指出心理學家選擇的樣本通常都很小，致使他們有50%的風險不能夠證實其正確的假設，而任何研究人員都不會在頭腦清醒的情況下接受這種風險。對此有一個貌似正確的解釋，即心理學家對於樣本大小的決定反映了他們普遍存在的一個 094

第10章大數法則與小數定律直覺性錯誤觀念，即對於樣本變差範圍的錯誤看法。這篇文章令我十分震驚，因為我在自己的研究中碰到了一些問題，卻在這篇文章中找到了相關解釋。與大多數研究型心理學家一樣，我也墨守成規地選擇了一些過小的樣本，因此得到的實驗結果毫無意義。現在，我知道了原因：那些奇怪的結果實際上就是我這種研究方法的典型產物。我的錯誤特別令人尷尬，因為我教過統計學，也知道該怎樣計算樣本的大小，以便將風險降至可以接受的程度。但是，我從未透過計算來確定樣本大小。和我的同事一樣，我被傳統所禁錮，相信自己設計實驗的直覺，也從未認真考慮過樣本選擇會帶來的那些風險。阿莫斯來參加研討會時，我已經意識到自己的直覺是錯誤的。在研討會中，我們很快達成共識——密歇根的那些樂觀派是錯誤的。我與阿莫斯開始調查一個問題：只有我自己這麼愚蠢還是我只是眾多愚蠢的人之一，我們透過一項測試來證實這個問題，測試物件一些數學家，想看看這些人是否也會犯類似的錯誤。我們設計了一份調查問卷，其中描述了真實的研究情境，包括一些成功實驗的複製。問卷要求研究人員選擇樣品大小，對其決定可能帶來的失敗風險進行評估，並那些正在設計自己實驗的研究生提供建議。在“數學心理學協會”的一次會議上，阿莫斯收集了一組資深受試者（包括兩本經濟學著作的作者）的反應。結果很明顯：我並不是唯一一個愚蠢的人。大多數受試者都會犯和我一樣的錯誤。顯然，即使是專家，在選擇樣品大小時也無法充分集中注意力。我和阿莫斯將我們合寫的第一篇文章命名為“對小數定律的盲信”。我們半開玩笑地解釋道，“對於隨意取樣的直覺似乎符合小數定律，由此可以斷言大數法則對於小數定律同樣適用”。在文章中，我們還收錄了一個措辭有力的建議，即研究人員認為他們“對於統計直覺應抱有一些懷疑，只要條件允許，都應採用計算方法來確定樣本規模，而不是依靠直覺印象作決定”。信任多於質疑的普遍性偏見在一次面向300名老年人的電話民意調查中，有60%的人支援總統。 095

思考，快與慢 P!TXBSE ST ANDSL0W 如果你只能用三個詞來總結這句話，該怎麼說呢？幾乎可以肯定的是，你會說“老年人/支援/總統”。這些詞概括了這句話的要點。這次民意調查被省略掉的細節—媒介為電話，樣本為300人——本身意義不大，它們提供的背景資訊並不怎麼引人注意。即使樣本數量變了，你的結論也不會發生變化。當然，一個完全荒謬的數字倒可能會引起你的注意。（例如一項對6名或6億名老年選民的電話民意調查.•••）除非你是專業人員，否則不管樣本是150還是3000，你都不會有什麼不同的反應。這就是“人們對樣本大小沒有足夠的敏感性”這一表述的意義。這項民意調查包含了兩方面的資訊：新聞本身和新聞的來源。當然，你關注更多的是新聞本身，而不是其結果的可信度。但當可信度明顯很低時，新聞所包含的資訊也就不足為信了。如果得知 “某黨派小組操縱一項錯誤且帶有偏見的民意調查，使結果顯示老年人支援總統⋯”你當然會排斥這項調查的結果，不會相信這條新聞，這項由某黨派進行的民意調查以及其錯誤結果不但沒有令你信服，反而會成為另一條關於政治騙局的新聞。在這樣清晰的案例中，你可以選擇不相信其中的資訊。但是你能把“我在《紐約時報》讀到••”和“我在辦公室閒聊中聽到⋯⋯”這兩種說法完全區分開來嗎？你的系統1能夠區分出資訊的可信度嗎？眼見即為事實的原則表明：不能。如前所述，系統1並不善於質疑。它抑制了不明確的資訊，不由自主地將資訊處理得儘可能連貫。除非該資訊被立刻否定，不然，它引發的聯想就會擴散開，彷彿這條資訊就是千真萬確的。系統2能夠提出質疑，因為它可以同時包含不相容的多種可能性。然而，保持這種質疑會比不知不覺相信其真實性更加困難。小數定律是普遍性偏見的一種表現，即對事物的信任多於質疑。類似這樣的偏見在下面的章節中還會出現。相信小樣本能反映調查物件的整體情況，這一強烈偏見也是一個較大問題的一部分。這個問題就是，我們常誇大所見事物的相容性和連貫性。許多研究人員過於相信透過有限的幾次觀察得出的結果，這一現象與光環效應緊密相連。我們常常會覺得自己對某個人很熟悉也很瞭解，但事實上，我們對他卻知之甚少。系統1在瞭解事實之前就根據零散的證據拼湊了一個飽滿的形象。如果相信小數定律，急於下結論的機制就會運作起來。通常情況下，它會建構一個言之成理的說法使你相信自己的直覺判斷。 096

第10章大數法則與小數定律對隨機事件作出因果解釋必然是錯的聯想機制會搜尋原因。在統計規則方面，我們面對的困難是這些規則要求使用不同的方法處理問題。依據統計學觀點，我們不應關注當前事件的成因，而應當關注其未來走向。這件事的發生並沒有什麼特殊原因，一切只是機緣而已。因為偏好進行因果思考，我們在估測真實的隨機事件的隨機性時就會犯嚴重的錯誤。以在某家醫院依次出生的4個嬰兒的性別為例，男女出生次序明顯是隨機的。每個嬰兒的出生是各自獨立的。在前幾個小時內出生的男嬰女嬰數量並不會影響到下一個出生嬰兒的性別。現在，請考慮一下可能的序列：男男男女女女男男男男男男男女男男女男出現這些序列的可能性是一樣的嗎？人們的第一反應都是“肯定不一樣啊”。但是，這樣的反應是錯誤的。因為每個嬰兒的出生都是獨立的事，並且生男生女的機率也幾平相等，6個嬰兒任何一種可能的性別順序都與別的順序機率相等。即使是現在，你仍然認為這個結論是正確的，但它實際上是反直覺的，因為只有第三種順序是隨機的。如我們所料，“男女男男女男”比其他兩種順序更有可能發生。我們追求模式，相信所處的是一個各方面都相互聯絡的世界。在這個世界裡，規律（例如6個女嬰的順序）並不只是偶然發生的，它還是機械的因果聯絡或是人的意志的結果。我們並不期待在一個隨機的過程中找到規律。但當探尋到一個可能的規則時，我們就會拋開這個過程是真正隨機的想法。隨機過程會產生許多序列，以使人們相信這個過程完全是不隨機的。如此你就可以看出來為什麼假設的因果關係有進步發展的優勢。它是我們從先輩那裡繼承的一般警覺性的一部分。我們會習慣性地搜尋環境變化的可能性。獅子可能隨時都會出現在平原上，但注意到獅子出現頻率的明顯增長並採取行動則會安全許多，即使這種增長只是由於隨機過程的波動而發生的。對於隨機性的廣泛誤解有時會帶來重大影響。在我和阿莫斯合作的一篇代表性文章中，我們引用了統計學家威廉•費勒（William Feller）的闡述，他說，人們很容 097

忠考，快與慢 PAGTANSLO AST ANT SEOW 易在根本沒有模式的情況下建立模式。“二戰”期間，火箭彈在倫敦密集地轟炸。人們普遍相信爆炸不可能是隨機的，因為地圖顯示，爆炸點在各地的分佈有明顯區別。一些人猜測沒有被炸的地點住有德國的間諜。一份嚴謹的統計分析顯示，爆炸點的分佈是隨機程式的一個典型代表，同樣也是令人產生它並不是隨機的這一強烈印象的典型代表。費勒評論道：“在沒受過專業訓練的人看來，這一連串轟炸行動就好像具有某種規律或趨勢了。” 很快，我得到一次機會可以把我從費勒那兒學到的知識派上用場。1973年爆發的贖罪日戰爭中，我作出的唯一一項重大貢獻就是建議以色列空軍的高階官員停止一項調查。一開始，由於埃及地對空導彈表現出色，空戰對於以色列來說很不利。以色列方面人員傷亡慘重，其人員分佈也不均衡。有人告訴我說，有兩支來自同一基地的空軍中隊，其中一支被擊落了兩架飛機，而另一支一架也沒有被擊落。為了弄明白那支不幸的空軍中隊到底做錯了什麼，相關人員對此展開了調查。我們沒有理由認為其中一支空軍中隊比另一支更有效率，也並未發現他們在操作上有何不同。當然，飛行員的生活在很多方面會有所不同，據我回憶，其差異包括他們在任務之間回家的次數以及報告任務的執行情況等。我當時給出的建議是，司令部應該明白之所以出現不同結果僅僅只是因為他們運氣不同而已，應該停止對飛行員的調查。我推斷這次事件很可能是由於運氣不佳，對不明顯的原因進行隨機調查必定是勞而無功的。與此同時，空軍中隊不斷有人員損失，沒有必要再給他們增加額外的負擔，讓他們覺得那些去世的夥伴做錯了什麼。幾年以後，阿莫斯和他的同學湯姆•季洛維奇（Tom Gilovich）、羅伯特•瓦隆（Robert Vallone）對籃球隨機性的錯誤直覺所作的研究引起了轟動。運動員有時投籃順手的“事實”普遍被運動員、教練和球迷們所接受。這樣的推斷是順理成章的：如果一個運動員連續進了三四個球，你就會不由自主作出判斷：這個運動員正處於 “投籃順手”的狀態，得分率暫時增加。兩隊隊員都持這種判斷—隊員也更愛將球傳給打得順手的人，對方球隊則會用兩位防守球員防衛這位進攻球員。然而，對上千個投籃動作的分析結果卻十分令人失望：在職業籃球比賽中，無論球是從球場上投出還是從罰球線投出的，根本沒有“投籃順手”這回事。當然，一些球員會比其他球員投籃更準，但進球與投籃未中都只是隨機的。“投籃順手”完全只是旁人所見， 098