AI 新聞與投資

理學家、股票投資者以及經濟學者都掌握了各自領域的直覺性技能，但他們都不能夠鑑別出因直覺導致錯誤的情境和任務。這些未能識別的專業技能的侷限性解釋了專家總是過分自信的原因。直覺的對錯評估在我們的實驗快結束時，我和加里•克菜恩就上面提及的那個問題給出了一個一般性答案：什麼時候可以相信有經驗的專業人士的直覺？我們的結論是，大多數情況下，我們還是可以將可能是有效的直覺與可能是無效的直覺區分開來的。這就好比判斷一件藝術作品的真假一樣，關注這件作品的出處通常比關注作品本身的判斷準確率更高。如果環境有足夠的規律性，並且在判斷時有機會掌握這些規律，聯想機制就會識別這些情境並做出快速且準確的預測與決策。這些條件若得到滿足，你就可以相信某個人的直覺。不幸的是，聯想機制同樣會產生主觀的強迫性直覺，這種直覺是錯誤的。如果我們觀察有天賦的年輕人在象棋方面取得的進步，就會非常清楚完美的技能不是短時間就能練就的。在接近完美的過程中，他會犯錯誤，而且對這些錯誤還信心十足。當評估專家的直覺時，你應該時刻考慮到該專家是否有足夠的機會挖掘線索，即使是在有規律的環境下。在一個不夠規律或效度較低的環境中，判斷啟發式就會被啟用。系統1通常會用另一個問題快速替換掉難題，創造出並不存在的關聯。此時回答的問題並不是預期的那一個，但這個答案會很快出現在人們的腦海中，會透過系統2寬鬆的審查。你可能想預測某個公司的商業前景，並相信這就是你正在判斷的事，但實際上，你對這家公司高管能力的印象主宰了你的評估。因為替代是自動發生的，你通常並不清楚自己（你的系統2）贊同並採納的判斷源自何處。如果這是唯一出現在大腦裡的判斷，你可能就無法將它與你根據專業直覺得來的有效判斷進行主觀上的區分。這就是主觀自信不能作為直覺準確性指標的原因：即使判斷的是錯誤的問題，在作出這一判斷時仍可能有高度的自信。你可能會問：為什麼我和加里•克萊因立即想到了透過評估環境規律和專家學 219

思考，快與慢 AND SLOu 習經歷的方法來估測專家的直覺能力，而不是透過專家的自信程度來評判，還會問我們答案可能是什麼。其實解決方案一開始就很明顯。我們先前就知道火場指揮官和兒科護士的直覺是有效的，而米爾研究的那些專業人士以及股票投資者和經濟學者的直覺則不準確。很難說清是什麼使我們的實驗經年累月進行這麼久，是長時間的討論、不斷交換演示稿、數以百計的商談郵件，還是不止一次想要放棄的想法，我們真的不清楚。但如果某個專案完成得相當好，就常會有這樣的事情發生：一旦你明白了主要結論，這個結論就總是看似很明顯。正如我們那篇文章的標題所示，我和克菜因所持的觀點並不像我們預期的那樣不同，對於我們提出的實質性問題，我們採用了一些聯合方案。然而，我們發覺我們前期的分歧不單單是觀念上的不同，還有態度、情感和品位上的不同，而且這些分歧多年來都沒有太大變化，這一點在我們認為最有趣和最感興趣的事情上體現得最明顯。當有人提到“偏見”這個詞時，克萊恩的臉部仍然會有輕微抽搐，他仍然會嘲笑由於運算或是正式程式導致的明顯荒謬的決策，而我則會將這些偶爾由運算導致的錯誤視為提高的方法。另一方面，看到在零效度的情況下一些自負的專家仍聲稱自己有很準的直覺時，我比克萊因更喜歡看好戲。然而，從長遠來看，儘可能多地發現兩個人觀念方面的共識肯定比尋找我們在情感方面的分歧更加重要。示例——專家型直覺 “對這個特別任務，她有多少專業技能？做過多少練習？” “他真的相信這些新成立的公司的環境有足夠的規律來證明與基礎比率背道而馳的直覺嗎？” “她對自己的決策非常自信，但主觀自信並不是評估準確性的標準。” “他真的有機會學習嗎？對他判斷的反饋他接受得有多快、多徹底？” 220

第23章努力養成採納外部意見的決策習慣在和阿莫斯合作幾年之後，我說服了以色列教育部的一些官員在高中開設有關判斷與決策的課程。我組建了一支團隊，其中包括幾位經驗豐富的老師，我教授的心理學專業的一些學生，以及希伯來大學教育學院的院長希莫•福克斯（Seymour Fox）。我們設計了課程內容，還編寫了教材。我們每週五下午都開一次例會，這一慣例維持了約一年，我們制定出內容詳細的教學大綱，完成了教材幾個章節的編寫任務，還在教室裡上了幾節示範課。大家都感到取得了一定的進展。一天，在討論估測不確定參量的流程時，我突然想到可以進行一次現場操練。於是，我便請在場的所有人預測我們將完整的教材文稿提交給教育部所需的時間，並將預測結果寫下來。我遵循了我們已經計劃好要納入課程體系的流程：從一個團隊獲取資訊的合理方法並不是透過公開討論，而是透過私下收集大家的觀點來完成。這個流程與常規的公開討論不同，它更加充分地利用了每個成員的相關知識。我收集了大家的預測，並將結果記錄在黑板上。在場的各位對完稿時間的預估集中在兩年左右，最低估值為一年半，最高估值則為兩年半。隨後我又有了一個主意。我問課程編制專家希莫是否能想到還有哪些和我們類似

THINKING 思考，快與慢 ADSLN 的團隊曾經草擬過課程計劃。那段時間，有幾項類似 “新數學”這樣的教學革新在以色列得到引介。希莫說他能想到很多這樣的團隊。我又問他是否知道這些團隊更詳盡的情況，事實證明他對其中幾個團隊的情況還是較為熟悉的。我又請他回想這些團隊在取得與我們當前進展相當的成績時的狀況。根據這一點，我又問他是否記得這些團隊用了多長時間編完教材的。他陷入了沉默。當他終於張口說話時，我覺得他臉紅了，在為自己的回答感到尷尬，他說道：“你知道嗎，我過去從未意識到這一點，但事實上，並非所有取得與我們當前進展相當的團隊都能完成任務。沒完成任務的團隊還是佔了很大-部分的。” 他的話讓人很不安。我們從未考慮過自己可能會失敗。我越發不安了，於是想請他估測失敗的團隊佔多大比例。他說：“大約40%。”此時，整個房間彷彿籠罩在一片陰霾之中。我立刻又提了一個問題：“那些完成了任務的團隊用了多長時間呢？”他答道：“沒有一個團隊是少於7年的，最多用了10年時間。” 我如同抓住了救命稻草一般，說：“與其他團隊的技能和資源相比，我們的團隊怎麼樣？在這些團隊中，我們團隊大概處於什麼位置呢？”這次，希莫並沒太多猶豫，說道：“我們在平均水平以下，但也沒差太多。”他的回答讓我們感到震驚，甚至包括希莫自己，他先前的估測受到整個團隊所持的樂觀心態的影響。如果沒有我的提示，他就不會將自己對其他團隊過去經歷的瞭解與對我們團隊未來的預測聯絡在一起。聽了希莫的話，我們當時的思想狀態遠非“我們都清楚了”這句話能夠描述的。誠然，我們所有人當時都“清楚”與幾分鐘前我們寫在紙上的預測時間相比，最少 7年、失敗機率為40%才是對專案未來更合理的預測。我們並沒有承認自己清楚的事實。這個新的預測似乎仍然不真實，因為我們不能想象為何一個看似操作非常簡單的專案會耗時這麼久。我們沒有水晶球，無法看到未來。我們能看見的，只是一個合理的計劃，這個計劃會使我們在大約兩年的時間裡完成一本書，而這與那些顯示其他團隊不是失敗了就是用了很長時間完成任務的統計資料是互相沖突的。我們所聽到的是基礎比率資訊，依據這個資訊，能推斷出一個因果關係，即如果有這麼多的團隊失敗，或是用了很長時間才取得成功，那麼編寫一門課程就應該比我們想象中的難得多。但這樣的推斷又與我們對現階段取得的重大進展的直接體驗相左。我們對希莫提供的資料的處理就像平時對待基礎比率一樣：注意到其存在，但立刻 222

第23章努力養成採納外部意見的決策習慣選擇忽略。我們理應在那一天選擇放棄專案的。我們都不願意為一項失敗機率為40%的專案再多投入6年的時間。儘管我們認為堅持做下去並不是理性的選擇，但這不足以成為我們放棄的緣由。在幾分鐘斷斷續續的爭辯之後，我們達成了一種默契，那就是當做什麼事都沒發生，繼續工作。這本書最終在8年以後才編寫完成！那時，我早已搬離以色列，離開了團隊。也就是說，這本書的編寫經歷了許多不可預知的變化。教育部對這個想法所持的熱情也在等待這本書交稿的漫長時間裡消退了，因此這本書從未被使用過。這個令人尷的插曲成了我職業生涯中一段最具啟發性的經歷。我從中悟出了三點，第一點是顯而易見的，我偶然得到了兩種截然不同的預測方法。後來，這兩種方法被我和阿莫斯稱為內部意見和外部意見。第二點是我們最初的預測，即完成專案需要大約兩年的時間，體現出一種規劃謬誤。我花了很長的時間才悟出第三點，我將這一點稱為非理性堅持，一如我們那天做的荒唐事：沒有終止那個專案。面對選擇時，我們因力事業心而丟掉了理性。比起外部意見，我們更偏向內部意見在很久以前的那個週五，我們的課程專家對同一個問題作出了兩種判斷，並得到了截然不同的結果。我們所說的“內部意見”是指包括希莫在內的所有人自發採取的對我們專案的未來進行預測的方法。我們注重具體環境，在各自的經歷中尋找證據。我們有一個粗略的計劃：知道要寫多少章，瞭解已經完成的兩章所用的時間。我們之中有些人會謹慎些，可能會在預測所用時間的基礎上多加幾個月，以免出現預測誤差。外推法是錯誤的。我們根據眼前的資訊進行預測，但我們寫出的前幾章有可能比其他章節簡單，而且在寫那幾章時，我們對這個專案的投人程度很可能正處於最高點。然而，最主要的問題在於我們沒有考慮到由唐納德•拉姆斯菲爾德（Donald Rumsfeld）提出的著名觀點：“未知的未知數。”那天，我們沒能預見到接下來發生的事會導致這個專案拖延這麼久。離婚、生病、與官員的協調等事情導致工作一再 223

思考，快與慢 THINKING、FAST AND SLAN 延遲，這些事情都是意料之外的。這樣的事情不僅會減慢教材的編寫速度，還會導致任務在長時間內沒有任何進展或進展非常緩慢。當然，對希莫知道的那幾個團隊來說，情況也是一樣的。那些團隊的成員清楚自己的專案是切實可行的，所以他們也想象不到各種事的發生會使他們歷時7年才完成一個他們曾經認可行性很強的專案，或者最終根本就沒能完成任務。他們像我們一樣，並不知道自己的勝算有多少。任何計劃失敗的原因都有很多，儘管大多數原因人們可能無法預見，但一個大專案中“某件事”出差錯的機率卻是很高的。我向希莫提出的第二個問題將他的注意力從我們團隊轉移到了一些類似的團隊上。他估測那些團隊成功的基礎比率是：40%的失敗率和7~10年的完成時間。希莫的話雖然沒有經過正式調查，也沒有科學根據，卻為基準預測奠定了合理的基礎。如果你對一個事件的瞭解僅限於其所屬類別，其他情況一概不知，此時作出的預測就是基準預測。正如前文所述，基準預測應該是進一步調整的錨定。如果你只知道某位女士住在紐約，𨚫被問到她的身高的話，你的基準預測就是你對紐約女性平均身高的合理猜測。如果得到了與案例相關的特定資訊，例如那位女士的兒子是他所在高中籃球隊的首發中鋒，你就會將預測轉向一個合理的方向。希莫將我們團隊與其他團隊的對比說明，我們所作的預測較基準預測而言更糟糕，而基準預測已經是糟糕透頂了。在我們的這個問題中，外部意見的預測有著出奇的準確性。然而，這種準確性只是僥倖產生的，並不能作為外部意見有效性的證據。關幹外部意見有效性的論證是在一般理由下構建的：如果參考類別選擇適當，外部意見就會給出預測的大致範圍，我們的那個專案就是如此，這就表明內部預測與事實相去甚遠。對一個心理學家而言，希莫作出的兩種判斷的差異是令人詫異的。他頭腦中有相應的知識，本應該能夠估測出適當的資料，但他在最初估測時，卻完全沒有應用那部分知識。希莫由內部意見得出的預測並不是根據基準預測得到的判斷。他並沒有進行基準預測，他的預測只是基於我們所營造的特殊的努力氛圍。正如湯姆實驗中的受試者那樣，希莫知道相關的基礎比率，但卻沒想過應用它。與希莫不同的是，我們其他人並沒有外部意見的來源，也就不能作出合理的基準預測。然而值得注意的是，我們並不認為自己需要其他團隊的資訊作為自己預測的 224

第23章努力養成採納外部意見的決策習慣參考。我尋求外部意見的舉動讓所有人都頗為詫異，甚至包括我自己在內！這是一個常見模式：瞭解個別案例的人很少會認為他們有必要了解與這個案例同類別的其他案例。當我們最終瞭解到這一外部意見時，卻集體忽略了它。我們知道到底發生了什麼，這與解釋“教授心理學是徒勞的”那個實驗有相似之處。當他們在掌握很少資訊（一個簡短乏味的採訪）的情況下對個別案例作出預測時，尼斯貝特和博吉達的學生完全忽略了他們剛剛瞭解到的全域性解。當 “蒼白無力的”統計學資訊與某個人對案例的印象相沖突時，這些資訊總會被捨棄。在與內部意見的競爭中，外部意見絲毫沒有取勝的機會。偏向內部意見常帶有道德的意味。我的堂兄是一位出色的律師。我曾經問過他一個與參考類別相關的問題：“被告贏得與這個案子類似的官司的可能性有多大？”他立馬回答：“每一個案例都是獨特的。”這位堂兄說這話時的眼神表明他當時肯定認為我的問題既不得體又很淺薄。特別強調案例的獨特性在醫學領域也很普遍，儘管證據型醫學的最新進展指向其他方向，但案例獨特性仍不可忽視。醫學統計學和基準預測由醫患間越來越頻繁的交流催生而來。然而，醫學界對外部意見依舊抱有矛盾情緒，因整個醫療過程都由資料和清單主導，缺乏人情味。規劃謬誤：過於樂觀的計劃隨處可見按照外部意見及最終結果來看，我們在當初的那個星期五午後所作的最初預測幾平是一種妄想。對下面這種說法我們也不會感到驚訝：對專案成果過於樂觀的預測隨處可見。我和阿莫斯創造了“規劃謬誤”這個新詞來描述下列計劃和預測： •不切實際地接近理想狀況（的計劃和預測）。 •可透過參考類似案例的資料得到提高（的計劃和預測）。關於規劃謬誤的例子在個人、政府、企業的計劃和預測行為中皆不鮮見。駭人的事例也不勝列舉。 225

思考，快與慢 THINKING， 1451A21304 •1997年7月，愛丁堡規劃中的新蘇格蘭議會大樓預計的最高預算是4000萬英鎊。到了1999年6月，建樓的預算就變成了1.09億英鎊。2000年4月，規劃者將“成本上限”修改為1.95億英鎊。到2001年11月，他們又將“最終成本”預估為2.41億英鎊。這個最終成本在2002年年末的時候又上漲了兩次，成為2.946 億英鎊。到2003年6月，預算又增加了3次，達到3.758億英鎊。這株大樓最終在2004年建成，最終耗資約為4.3！億英鎊。 •2005年的一項研究對1969~1998年全球範圍內的鐵路專案進行了檢測。其中，超過90%的專案都高估了新線路的乘客數量。儘管這些乘客的差額曾被廣而告之，這30年間對乘客數量預測的準確度卻沒有什麼提高。設計者對新鐵路專案的乘容量的平均高估率達106%，平均成本超支45%。儘管收集了越來越多的證據，那些專家卻並沒有利用這些證據。 •2002年，針對改造廚房的美國有房者進行的一項調查發現，他們預估的廚房改造費用平均為18658美元，但實際上他們最後的平均花費是38769美元。規劃者與決策者的樂觀心態並不是造成超支的唯一原因。廚房改造和武器系統的承包人都承認（儘管不是對他們的客戶承認），他們都會透過擴充最初計劃而獲取最大利益。客戶們無法想象他們的意願會隨時間的推移而逐漸增多，而沒能預測到這些情況的事實也恰好反映出這一點。如果他們制訂一個較為現實的計劃並嚴格按計劃進行，最終就不會花掉這麼多錢了。最初預算的誤差並不總是無知的。制訂計劃的人都希望自己的計劃能得到上級和顧客的認可。通常也正是這種願望的驅使，他們才制訂出了不切實際的計劃。他們這樣做還因為僅僅由於超支或超時不太可能會導致專案被中途叫停。在這些例子中，避免規劃謬誤的最大責任落在了批准計劃的決策者身上。如果這些決策者沒有意識到外部意見的必要性，他們就會犯下規劃謬誤的錯誤。減少決策錯誤的有效方法自多年前那個星期五的下午以來，判斷和避免規劃謬誤的方法並未發生過變化， 226

第23章努力養成採納外部意見的決策習慣但這一理念的實施卻有了很大進展。現任教於哈佛大學的丹麥籍著名規劃專家本特•弗林夫伯格（Bent Flyvbjerg）曾經有過頗有說服力的總結：看輕或是忽略分佈資訊的普遍趨勢可能是預測產生錯誤的主要原因。因此，計劃者應該盡力劃分出預測問題的類別，這樣才能充分利用所有能夠獲取的分佈資訊。如何透過改進的方法提高預測的準確性？上面的說法可算做唯一一條最為重要的建議了。在預測時使用相似團隊的分佈資訊被稱為採納“外部意見”，它是避免規劃謬誤的有效方法。對規劃謬誤的修正如今也有了對應的專業術語，叫做“參考類別預測”。弗林夫伯格已將此術語運用到幾個國家的交通運輸專案中。外部意見透過使用更大的資料庫來實施，此資料庫提供了全世界範圍內數以百計的專案資訊，包括其計劃與結果的資訊，能提供可能發生的超支和超時的統計學資訊以及各類不盡如人意的專案資訊。弗林夫伯格使用的預測方法與為克服對基礎比率的忽視而採取的建議非常相似： 1.識別對應的參考類別（例如廚房改建和大型鐵路專案等）。 2.獲取參考類別的統計資料（每英里鐵路的造價或是支出超過預算的百分比），利用這些資料作出基準預測。 3. 如果有特別的原因說明這個專案多少會比同類專案的樂觀偏差更明顯，則可使用此例的具體資訊對基準預測進行調整。弗林夫伯格的分析旨在透過提供類似專案超出預算的統計資料，委任公共事業工程專案的官員提供指南。決策者在批准某個提議之前，需要先了解其成本和利益的實際評估。他們還希望估測出為超出預算而準備的預備金，即使這樣的預防措施通常會成為自我應驗的預言。正如一位官員告訴弗林夫伯格的那樣，“預備金與承包者的關係就像牛羊肉與獅子的關係，獅子會吞食牛羊肉，承包者也會私吞預備金”。高管們為了搶佔資源很容易會提出過於樂觀的計劃，因此，各個組織面臨著控制高管這種傾向的挑戰。運轉良好的組織會獎勵規劃師，因為他們提出的方案精準而又切實可行；當然也會處罰規劃師，因為他們沒能對遇到的困難作出預測或是沒能考慮到他們本可以規避的困難，即未知的未知數。 227

思考，快與慢雙以I！ THINKING. 而今距離那個星期五的下午已經過去了30年，但每一年我都會想起它，在演講中也會提到它。有些朋友已經對那個故事感到厭倦了，但我還在不斷從中吸取經驗。大約在我第一次和阿莫斯作關於規劃謬誤報告的15年後，我又與丹•洛瓦洛（Dan Lovallo）一起提到了這個話題。我們一起草擬了一個關於決策的理論，即樂觀偏差是人們願意承擔風險的重要原因。在經濟學標準的理性模式下，人們願意冒險是因勝算大——他們之所以現在能承受有代價的失敗，是因為他們相信最終成功的機率很大。這是替代的一個觀點。在我們預測風險專案的結果時，高管們很容易會掉人規劃謬誤的陷阱。在規劃謬誤的支配下，他們根據脫離現實的樂觀心態來做決策，而不是根據對利益得失以及機率的理性分析做決策。他們高估了利益，低估了損失。他們設想了成功的場景，卻忽略了失敗和誤算的可能性。因此，他們所追求的行動方案不太可能在預算之內完成，也不大可能按時完成，這個方案可能也無法實現預期的回報——甚至都無法完成。由此看來，人們之所以經常（但不是總是）承擔風險專案是因為他們對成功率過於樂觀。我將在本書中反覆提到這一點，因為它可能有助於解釋什麼人們會對簿公堂、發起戰爭或者急於創業。多年來我一直認為關於課程那件事的主要意義就是我從希莫那裡學到了一些東西：他對我們專案未來的最佳猜測並沒有參考他所知道的相似專案的資訊。我原以為自己很會敘述事情，而且在那件事中我還是一個聰明的詢問者、機敏的心理學家。但是，直到最近我才意識到，那的我其實是個笨蛋，是個無能的領導者。那個專案是由我發起的，因此我的主要責任就是賦予這個專案意義，而其他主要的問題則由團隊進行討論，但我卻失職了。當我聽到希莫的統計分析後，就改正了那個謬誤。如果是在迫不得已的情況下，我會承認我們的專案從一開始就是錯的，我們至少應該認真考慮承認失敗並打包回家這個選擇。但是沒有人向我施壓，也沒有人和我討論過這個問題，我們默許了這個專案繼續下去，根本就不考慮到底需要多長時間。這樣做很容易，因為我們在最開始時並沒有作出這樣的預測。如果在開始做這個專案時就有了合理的基準預測，那麼我們就不會再將專案進行下去了，但我們已經投入了大量精力——這是一個沉沒成本悖論的例子，我們將在本書後半部 228

第22章什麼時候可以相信專家的直覺？