AI 新聞與投資

案如何可能是錯誤的時候，校準才會得到改善。儘管這些發現可能部分是由於 “社會需要特徵（social demand characteristics）”的存在（如，被試感覺指導語暗示他們降低信心水平），但其他研究也證實了反對理由能夠改善校準水平（如 Hoch，1985）。這些結果回顧了第3章討論過的保羅•斯洛維奇和菲什霍夫（1977）的研究，在那個研究中，當被試思考為什麼一些實驗結果與他們所設想的有所不同的時候，後見之明的偏差（hindsight biases）減少了。從斯洛維奇和菲什霍夫的研究開始，有幾個實驗都已經解釋瞭如何透過考慮其他結果或答案的可能性來減少各種判斷上的偏差（Critfin,Dunning，& Ross,1990;Hoch,1985； Lord, Lepper， & Preston,1984）。正如查爾斯 • 洛德，馬克•萊珀和伊莉莎白•普雷斯頓（Charles Lord， Mark Lepper，& Elizabeth Preston,1984,p. 1239）所指出的：“人們對於相反的可能性存在盲點，這種觀察由來已久。在1620年，培根曾經寫下‘肯定比否定能夠激起更多的感動和興奮是人類智力中特殊並且永恆的錯誤。’”在第20 章，這個盲點——以及它所帶來的某些後果——將會被詳細探討。結論對過度自信進行研究是非常重要的。在大多數研究中，平均信心水平從沒有超過準確度10~20個百分點以上。因此，只要決策者對自己判斷的正確性不是非常確定，過度自信就不會成為一種災難。與太空梭的空間探索相似，最具破壞性的錯誤校準形式是不恰當的確信。總之，本章的研究為我們提出了幾條應對錯誤校準的策略： V 首先，你可能會希望標記出那些需要特別考慮的判斷。當判斷難於做出或極端自信的時候過度自信達到最強。在這樣的情況下，謹慎前行非常必要。 V 其次，你可能會希望“重新校準”你非常自信的判斷以及其他人的判斷。正如利希滕斯坦和菲什霍夫（1977）所觀察到的，如果一個決策者抱有90%的信心而只有70%~75%的準確度，最好的辦法可能就是將“90%的信心” 看做“70%~75%的信心”。 V 同樣，你可能會希望將具有“百分之百信心”的判斷自動轉變為較低程度的信心。百分之百的信心在預測人們如何行動的時候顯得尤其沒有根據（Dunning,Griffin,Milojkovic， & Ross, 1990）。 V最重要的是，如果你對某個答案感到極度自信，思考一下另外一個答案可能正確的原因。儘管你可能不會改變想法，但是你的判斷卻可能會得到更好的校準。

第20章自我實現的預言假如圖 20.1 中的每張卡片都是一面有數字而另一面有字母，並且有人告訴你：“如果某張卡片的一面是一個母音字母，那麼它的另一面就是一個偶數。”你需要翻開哪些卡片來判斷這個人是不是在撒謊？（見你對讀者調查第39 題的回答。）當彼得 •沃森和菲爾•約翰森- 萊爾德（Peter Wason & Phil Johnson - Laird,1972）將這種型別的題目*呈現給128名大學生時，他們發現“E和4” 是最為常見的回答（59名學生這樣選擇），而“E”是其次最為常見的回答（42名學生這樣選擇）。換句話說，大多數學生選擇了那些翻過來就能夠證實那條陳述的卡片。僅有5名學生給出了正確答案：“E和7”。如果這個答案看起來難以理解，就試著這樣考慮問題。要檢驗的規則是 “如果是母音字母，那麼就是偶數”，或者更為基本，“如果X，那麼Y”。證明一個“如果•••就”型別的陳述錯誤惟一的辦法就是找到一個“是X而不是Y” 的例子（比如，母音和奇數）。因此，僅有的能夠證偽的方法就是，找出那些具有母音字母和奇數的卡片（“E 和7”）。而具有偶數或子音字母的卡片並不重要。 E 4 7 國 20.1 *一些版本的問題使用了符號而不是E、K、4和7，但是問題的邏輯結構都是一樣的。

第20章自我實現的預言 203 儘管看起來簡單，這個問題對於大多數人來說卻是極其困難的。羅賓•道斯（Robin Dawes,1975）甚至發現五名“最受尊敬的”的研究數理的心理學家中有四位都不能解決這一問題。本章的焦點就在於為什麼這樣的問題如此困難，以及它能夠給決策者帶來什麼啟示。再次猜猜看 “你將得到三個數字，它們符合我頭腦中的一個簡單規則。這一規則關注的是任意三個數字之間的關係，而與數字本身的絕對大小無關，比如它不是那種類似於‘所有數字都大於（或小於）50’的規則，等等。你的目標是透過寫出由三個數字組成的若干組數字組來發現這個規則 …••在你寫下每組數字之後，我會告訴你這些數字是否符合這一規則⋯⋯ 沒有時間限制，但你應該透過儘量少的數字組來發現它。記住你的目標不是簡單地找出符合這一規則的數字，而是發現規則本身。當你非常自信地認為自己已經發現了這個規則時，不要過於匆忙，將它寫下來•…有什麼問題嗎？” 在檢驗假設的實驗中，沃森（1960）將這些指導語—以及一組範例數字 2，4，6——呈現給29名大學生。他頭腦中的規則一直是“三個數字按照從小到大的順序排列”，但是他發現只有六名被試第一次回答就正確說出了這條規則。作為粗略的解釋，下面列出了一名典型被試的手稿：被試4（一名19歲的女性）：8，10，12。主試：那些數字符合規則。被試：14，16，18。主試：那些數字符合規則。被試：20，22,24。主試：那些數字符合規則。被試：1，3，5。主試：那些數字符合規則。被試：規則就是以任意一個教字開頭，然後每次加上2來得到下一個數豐。主試：那不是正確的規則。請繼續•• 與四卡片問題一樣，沃森發現被試總是更多地去證實規則（如8，10，12）而不是證偽規則（如12，10，8）。這種傾向被稱做“證實偏好”〈confimation bias）。儘管“證實偏好”已經成為了一個萬能片語（Fischhoff & Beyth - Marom,1983），它還是經常被用來表示決策者偏好與假設一致的資訊，而不是那些不一致的資訊。

204 第六部分常見陷阱在一項關於人們如何檢驗假設（預感、規則、理論等等）的深入分析中，喬希 •克菜曼（Josh Klayman）和 Young- Won Ha （1987，Pp. 220）認為證實偏好是“正性實驗策略”（positive test strategy）的結果，這是一種有用的直覺，但是它“就像任何通用直覺一樣••並不總是最優的，可能在某些情況下導致非常嚴重的困難。”在第15 章已經討論了一組困難—當決策者主要關注於正性的共生事件時，由共變評估所產生出來的問題（比如，Jan Smedslund 所做的護士研究，1963）。下一部分將給出另外一個例子。自身永存的社會信念 1979 年，馬克 •斯奈德和南茜•坎託（Mark Snyder & Nancy Cantor）發表了三個關於社會知覺中證實偏好的實驗。第一個實驗中，所有被試都得到了一位名叫簡的女子的例子—她在一些情況下會表現得很外向而在其他情況下卻表現得較為內向。舉例來說，簡在慢跑的時候會與陌生人自由交談，但在超市裡面她會感到害羞和膽小。閱讀這個例子兩天以後，被試會被要求評估兩個命題：（1）簡非常適合一個通常與外向性相聯絡的工作（房地產銷售），或者（2）簡非常適合一個與內向性相聯絡的工作（圖書館研究員）。一些被試被告知簡正在申請這份工作，而另一些被告知她已經獲得了這個工作。簡單而言，我們將關注那些認為她正在申請這份工作的被試。要判斷簡是否非常適合這項工作，以及她將會有多適合這個工作，這些被試需要列出與事例相關的所有依據。斯奈德和坎託發現，那些考慮簡在申請房地產銷售工作的被試往往列出她的外向性作為相關依據，而那些考慮簡在申請圖書館研究員工作的被試往往列出她的內向性作為相關依據。換句話說，兩種條件下的被試都把“證實”性證據看得比“證偽” 性證據更有關聯性。此外，這種證實偏好與人們對於簡在所考慮工作上的適合性所做出的判斷有關。被試越喜歡證實性的證據，他們就會認為簡越適合—無論她申請什麼職位。第二個實驗基本重複了第一個實驗，但是有幾處小的改動（如：將“非常適合”一詞改“適合性”來避免過於強調證實性）。而在第三個實驗中，被試只需要列出他們想要了解一個工作候選者的哪些方面，從而來評估這個人有多適合房地產銷售或圖書館研究員的工作。和前面一樣，證實性的資訊比證偽性的資訊出現得更加頻繁。比如，當考慮那些房地產銷售工作的申請者時，被試提問“這名申請者待人友好嗎？”比“這名候選者有多害羞？”的頻率高得多。馬克•斯奈德和威廉 • 斯旺（William Swann）（1978）所做的幾個實驗也獲得了類似的結果。這些結果帶給我們的啟示可以很好地拓展到職業領域之外。斯奈德和斯旺（1978，Pp. 1211 -1212）觀察到：

第20章自我實現的預言 205 【人們】可以為自己創造一個這樣的世界，在這個世界中，假設會變成自我驗證性的假設，並且信念會變成自身永存的信念••••從這個觀點出發，就不難理解為什麼如此多關於他人的普遍信念（特別突出的是，明顯錯誤的社會及文化刻板印象）會非常難以改變。即使一個人將要對這些信念產生足夠的懷疑並主動地對它們進行驗證，他仍然可能會“找到”那些他需要用來證實及堅持這些信念所需要的全部證據。這樣，最終這個人將會持有一種安全的（但是毫無根據的）感覺，即這些信念一定是正確的，因為它們透過了十分恰當和精確的評估過程。皮格馬利翁效應為的樣子。按照人們應該成為的樣子去對待他們，並且你要幫助他們變成他們能夠成 —歌德（cited in Peter,1977） “自我實現的預言”（self-fulfilling prophecy）一詞在1948年由羅伯特•默頓（Robert Merton）提出。用默頓的話說（1948，pp. 195 -196）：“起初，自我實現的預言是指對情況的錯誤定義引發了一種新行為，這種新行為使得最初的錯誤概念變為了真實的。自我實現預言的外在效果是使得錯誤的盛行得以延續。因為預言者會引用真實的事件程序來證明他從一開始就是正確的⋯⋯這就是社會邏輯的反常之處。”簡言之，自我實現的預言是錯誤的概念，但它們是那種最終被證明是正確的錯誤概念。在1968年，羅森塔爾和雅格布森發表了當前在自我實現預言方面最為著名的研究。在該研究中，小學教師得到了關於自己學生的一些診斷性資訊，這些資訊暗示，佔總數20%的學生將會在未來的學業中獲得巨大發展。在8個月以後的1Q 測試中，這些學生的成績確實比其他學生長進得快。這一發現值得關注是在於，這些高成就者是隨機選出的。顯然，教師給予了這些“巨大發展者”更多的讚揚和關注，這樣導致的結果就是，這些學生確實比其他人發展得更好。羅森塔爾和雅格布森將這種現象稱為“皮格馬利翁效應”（來自蕭伯納的戲劇《皮格馬利翁》，劇中希金斯教授透過教給一個賣花姑娘如何著裝和說話，使她真正變成了一位“淑女”）。從羅森塔爾和雅格布森的研究開始，已經有400多個實驗對人際期望的自我實現性質進行了探討，並有超過100個實驗專門對教師期望的效果進行了檢驗（Brophy,1983；Jussim,1986；Rosenthal,1987,December）。總之，這些研究表明，儘管效果經常是中等程度的，但教師期望對學生的表現具有重要影響（（Brophy，1983）。有趣的是，同樣有“學生皮格馬利翁”的證據存在。羅伯特•費爾德曼（Robert Feldman）及其同事發現，學生的期望—既對於他

206 第六部分常見陷阱們自己的表現也對於他們老師的表現的期望—能夠影響師生關係和學生的表現，且影響程度並不亞於教師的期望（Feldman & Prohaska, 1979；Feldman & Theiss,1982）。在男人們的頭腦裡儘管羅森塔爾和雅格布森（1968）探討的是師生之間的互動，皮格馬利翁效應卻並不僅僅侷限於教室之內。對於皮格馬利翁效應最富戲劇性的描述之一就是馬克•斯奈德、伊莉莎白 •坦克（Elizabeth Tanke）和埃倫• 伯奇德（Ellen Berscheid）（1977）所做的研究，該研究探討了男人對女人吸引力的刻板印象是如何能夠自我實現的。實驗的第一部分，在透過電話相互認識的過程中，隨機配對的男性和女性被錄下了十分鐘的對話。然而，女性被試所不知道的是，實驗者已經事先告知男性被試“實驗中的其他人已經告訴我們，當頭腦中形成了交談者的形象時他們會感覺更舒服。” 於是男人們用一次性成像的相機照了相，並得到了一張女性的快照（表面上是他們的搭檔）。事實上，這些快照是從事先準備好的八張照片中隨機選擇的。這些照片中有四張是那些被評定為具有高吸引力的女性，有四張是被評定為沒有吸引力的女性。這樣就引導男性被試相信他們的搭檔是外表吸引人的還是外表沒有吸引力的。男性被試的快照被丟棄在了一旁，女性被試根本沒有得到任何可以形成頭腦影象的資訊。在相識談話之後，每個男性被試完成了一份問卷，內容是關於他對與其談話的女性的印象。問卷中包括了很多與一個有吸引力的人有關的刻板印象特徵 ——善於交際、鎮定、幽默等等。結果並不出人意料，與那些認為交談同伴沒有吸引力的男性相比，認為交談同伴外表吸引人的男性在隨後的評定中，認為同伴更加親切、鎮定、幽默以及善於社交。這是在第4章所討論過的暈輪效應的一個例子。更為重要的是幾名獨立評分者所做出的判斷，他們傾聽了談話錄音的剪輯。一組評分者在每段談話中僅僅傾聽男性的聲音，而另一組評分者僅僅傾聽女性的聲音（每組評分者都既有男性又有女性，儘管在評分過程中並不存在顯著的性別差異）。根據這些評分者做出的判斷——他們既不知道實驗假設也不知道被試實際的外表吸引力——與以為交談同伴沒有吸引力的男性相比，那些認為自己正在與一位有吸引力的女性交談的男性被試聽起來更加善於交際、溫情、寬容、有趣、大膽、外向、幽默，並且有更強的社會適應性。並且從反應推測，與開始被知覺為不具吸引力的女性相比，那些開始被知覺為外表具有吸引力的女性在實際中聽起來也更加富有吸引力（比如善於交際、鎮定等等）—儘管被試是被隨機分配到各種實驗條件下的，而且男人的預想與女人實際的外表吸引力沒有任何關係。

第20章自我實現的預言 207 正如斯奈德、坦克和伯奇德（1977，pp. 661，663）所提出的：“最初在男人們的頭腦裡形成的事實，現在已經在與他們互動的女人的行為中變成了真正的事實——一個即使是最幼稚的觀察判斷者也能加以辨別的行為事實，這些觀察者僅僅評估了談話錄音中女性的貢獻••知覺者最初的錯誤歸因已經變得真實：刻板印象真正作為一種自我實現的預言而發揮了它的作用。” 自我實現的種族刻板印象這類自我實現的預言——使刻板印象得以延續的一類—在種族歧視中扮演著關鍵角色。卡爾•沃德、馬克 •贊納和喬爾•庫珀（Carl Word,Mark Zanna，& Joel Cooper,1974）發表了關於這個問題的一項研究。沃德、贊納和庫珀在導言中解釋說，人們往往會透過非語言線索表現出他們對別人的態度。比如說，當人們對某人持有正性態度的時候，他們就會讓自己和那個人靠得相當近，表現出高度的目光接觸、更為直接的肩部相向，以及更多的身體前傾。另一方面，人們往往避開那些名譽不佳的人。比如，他們會很快中止與這種人的會面，並且與他們保持更遠的距離。沃德、贊納和庫珀在兩個實驗中考察了這種偏見——第一個實驗中，白人被試面試白人和黑人實驗助手，第二個實驗中，白人實驗助手面試白人被試。所有的被試和助手都是男性。第一個實驗中，被試會在實驗室中遇到兩個表面上也是被試的人（但實際上是主試的助手）。然後另外一個助手出現，再過一會兒主試走了進來。主試告訴四名“被試”他們將與另外四個團隊在一場市場活動中進行較量。但主試解釋說，他們的團隊還需要一個人，並且團隊中的一員將要對四個候選者進行面試以挑選出第五位成員。然後他們會進行一次事先做過手腳的抽籤儀式來使得被試成為最後的面試官。安排四次面試的原因在於隱瞞真正的研究目的（即，直接比較白人考官對待白人，黑人候選者有什麼區別）。第一次面試（一直是位白人候選者）被筒單地當做面試的熱身，而最後一次面試從來沒有發生過（告知被試申請者已經打電話取消約定）。令沃德、贊納和庫珀（1974）感興趣的是第二次和第三次面試。一半被試會首先面試一名白人候選者，再面試一名黑人候選者；另一半被試會首先面試一名黑人候選者，再面試一名白人候選者（儘管後來發現順序並不會導致差異出現）。在這些面試中，候選者—同樣是實驗者的助手— 被訓練過以保證其行為符合標準方式，並且他們不知道任何實驗者設計該測試的目標。沃德、贊納和庫珀（1974）測量了面試過程中的幾個特徵，包括：（1）面試時間長短，（2）面試官出現語言錯誤的次數（假定反映了不適感），以及（3）面試官和候選者之間的物理距離。第一個變數由主試測量。第二個變數由

208 第六部分常見陷阱獨立的評分者進行計分，這些評分者邊聽面試的錄音邊對發言結巴、詞語重複等諸如此類的內容做記錄。第三個變數，物理距離，是透過一種特殊而富有創造性的方法加以測量的。當被試進入面試考場的時候，候選者已經坐下，而主試假裝發現沒有面試官的椅子了。然後他會要求被試去鄰屋拿一把椅子，被試放置椅子的位置提供了其與候選者之間物理距離的測量指標。沃德、贊納和庫珀（1974）發現被試面試白人候選者所花費的時間比面試黑人候選者多出了35%，在面試黑人時比面試白人時多犯了50%的語言錯誤，並且椅子放置的位置距離，黑人候選者比白人候選者要遠7%。所有差異在統計上都是顯著的。但這還不是全部。在證明了這些差異之後，沃德、贊納和庫珀又進行了第二個實驗來評估這種職業面試表現中的歧視效應。在第二個實驗中，白人被試由一名白人助手面試，該助手採用第一個實驗中對待黑人的方式或者對待白人的方式來對待這些白人被試。就是說，在前一種實驗條件下，面試官坐得離候選者更遠，犯更多的語言錯誤，並且更早地中止面試。沃德、贊納和庫珀（1974）發現，那些被以第一個實驗中對待黑人候選者的方式進行面試的被試在面試過程中表現得更加糟糕（由觀看過面試錄影的獨立評判人進行評定），他們犯了50%以上的語言錯誤，並在後來認為面試官不夠友好。因此，第一個實驗中黑人被試所遭遇的對待方式使得白人被試在第二個實驗中表現得很差——這為種族刻板印象如何能夠自我實現提供了一個有力的證明。結論儘管關於自我實現的刻板印象方面的研究主要侷限在男性被試研究上（Christensen & Rosenthal,1982），其他自我實現的預言和證實偏好已經在男性和女性被試身上得到了充分的證明（見三篇精彩的綜述，Darley & Fazio， 1980:Miller & Tumbull,1986: Snyder,1984）。人們尋求證實性證據的傾向 ——不管是邏輯問題解決的任務、職業面試、在班級背景下，還是其他方面 —是廣泛存在且業已確定證實的。此外，克利福德•邁納特、邁克爾•多爾蒂和瑞安 •特韋尼（Clifford Mynatt, Michael Doherty，& Ryan Tweney）所做的兩個實驗表明證實偏好可能難以消除。第一個實驗中，邁納特、多爾蒂和特韋尼（1977）創造了一種模擬研究環境，在這一環境中被試必須發現計算機螢幕上支配“粒子運動”的某個規律。被試隨機得到三種指導語中的一種：（1）證實性指導語，他們被告知一名科學家的基本工作就是證實理論和假設；（2）證偽性指導語，他們被告知一名科學家的基本工作就是推翻理論和假設；（3）檢驗性指導語，他們僅被告知一名科學家的工作就是對理論和假設進行檢驗。

第19章 過度自信 201

第19章過度自信 201