AI 新聞與投資

最近也撰文聲稱，把矽樹脂植人人體不會導致免疫功能失調。練習3 從某種角度來說，多數年輕人都有成為律師的夢想，並且是帶著這一夢想進人大學的。由於某些原因，圍家為這些未來的律師們而擔憂，因為他們中將有很多人找不到工作。法律系的 Sharp 教授說：“我的法律課絕對是學生爆滿。沒有一張課桌是空著的。” 《時代》雜誌報道說，本國學法律的學生是律師的3倍。此外，學法律的學生有60%找不到法律專業的工作。律師這一職業為什麼如此有吸引力呢？想當律師的人幾乎都是衝著錢來的。對哈佛大學法律系一年級學生的隨機調查表明，近70%的學生認為律師有較高的收人。然而，事實上多數律師根本掙不了多少錢。當了15 年律師的 Myron Nickle 說：“我的年收人從來沒有超過4.5萬美元。成為一名能在紐約呼風喚雨的律師的觀念完全被電視和電影美化了。” 抽樣回答 — 練習1 結論：就讀於重點研究型大學的學生沒有得到與學費等值的教育。理由：三名大學生對他們所接受的教育的控訴。儘管概括性的結論可能是正確的，我們也不能把這些證詞當作有力的“證據”。練習1很好地說明了把證詞作為證據的缺點。這些“恐怖故事”夠不夠典型呢？其他學生有沒有指責他們的老師呢？採訪是在什麼情況下進行的？作者在篩選採訪到的意見時有沒有偏見呢？學生是否知道採訪者想證明的問題從而迎合採訪者的意願？在得出大學教育欺騙了學生這個結論之前，我們應當找到比這些證詞更好的證據。儘管如此，這些證詞確實說明，這所

•152•學會提問——批判性思維指南大學的學生與老師之間可能存在不愉快的經歷。練習2 結論：隆胸手術是安全的。理由：一名外科醫生和國家專業機構都聲稱這種手術是安全的。我們該在多大程度上相信權威人士的意見呢？不要太多。首先，所有專家都可能存在偏差。他們說手術是安全的，目的可能在於由此獲得經濟上的收益。Newbody 醫生的證詞尤其可疑，因為他僅僅是以他個人的經驗依據。他極有可能沒有說出他失敗的例子。假如國家專業機構為我們提供其宣告所依據的研究資訊，有可能我們會對他們的宣告給予更多的關注。

第9章這些證據的可信度有多大（I）•••••1$3• 第9章這些證據的可信度有多大（II）：個人觀察、科學研究、案例、類比在這一章裡，我們繼續探討對證據的評價。本章重點討論如何評價個人觀察、科學研究、案例及類比等這四種證據的可信度。當我們遇到這幾種型別的證據時，必須對它們的可信度提出質疑。見枇判性問題：這些證據的可信度有多大：個人觀寒、科掌研究、案例、類比。個人觀察個人觀察是一種有價值的證據，許多科學研究都以此為依據。例如，我們對自己親眼所見的東西是有把握的，因而我們對目擊證人的證詞給予高度的評價。然而，個人觀察也存在不足，這是因為人們傾向於看到或聽到合乎自己意願的東西，傾向於選擇並記住某一事件中與自己的經歷和背景最一致的部分。

•154•學會提問——批判性思維指南與鏡子不同，觀察者不會為我們提供“原模原樣”的觀察資料。我們“看到”的和報道的東西，都經過了一系列的價值觀、偏見、態度和期望的篩選。由於這些因素的影響，觀察者常常對觀察到的結果不滿意。因此，當我們預料到不同觀察者的觀察結果可能不一致時，必須要警惕不能僅僅依賴某一個觀察者的觀察。以下這三個例子能幫助你認識到依賴個人觀察結果的危險性： •裁判員看到一次擊打，擊球手看到一個球。 • 便利商店發生了一起搶劫案。一名目擊證人聲稱他看到歹徒手裡拿著一把很大的手槍：而另一名目擊證人卻信誓旦旦地說歹徒手裡揮舞的是一把水槍。 •一位朋友認為你對某重要人士的意見是有敵意的；而另一位朋友則認為你只是過分自信而已。雖然個人觀察通常都是有價值的證據來源，但我們必須認識到它們不是無偏見的“現實的鏡子”，當它們被用來支援有爭議的結論時，我們也必須透過其他觀察者來進行驗證，或尋找其他證據來支援該結論。例如，某人官稱她看到一名老師對一名學生實施了性騷擾，如果其他學生證實了她的說法，那麼證據就更為確鑿了。還有，實施觀察與報告觀察結果之間的時間間隔越久，觀察結果出現的問題就越多。當把報紙、雜誌、書籍、電視、網路中的觀察報告作為證據時，你必須確定有沒有充分的理由能讓你相信這些報告。最可信的報道必須以最新的觀察結果為依據，並且觀察者必須在理想的條件下進行觀察，觀察者不能有任何與被觀察事件有關的期望或偏見。

第9章這些證據的可信度有多大（I）⋯•⋯•155• 把科學研究作為證據 “研究表明⋯•⋯.” “研究人員在近期的一項調查中發現⋯•” “據《新英格蘭醫學雜誌》報道⋯•” 科學研究是一種以大量觀察資料為依據，並且常常具有特殊分量的一種權威意見，一般是由受過專門訓練的研究人員系統地收集觀察資料而進行的研究工作。研究結果的可靠性到底有多大呢？解決這個問題的方法與判斷權威意見的方法一樣，那就是提出大量的問題，否則無法對研究結果的可信度進行討論。世間萬事萬物之間的關係是非常複雜的，而且人類對於這些事物的觀察和理論也容易出錯，所以，社會就求助於科學方法，並把它作決定事實的重要指導。在對世界進行觀察以及在看待直覺和常識的時候，人們運用科學方法來儘量避免許多自身內在的偏向。科學方法有什麼特別之處呢？首先，科學方法在能被公眾證實的資料中尋找資訊，即其他合乎條件的人能進行相似的觀察並考察是否能得出相同的結果，在這種條件下得到的資料就是能被公眾證實的資料，也就是能被重複驗證的資料。例如，一名研究人員發現，一種新的放射療法能殺死癌細胞，如果其他研究人員重複了他的實驗並得到了相同的結果，那麼，我們對這種新療法就更有信心。科學方法的第二個典型特徵是控制，即運用特定的程式來減

•156 •學會提問——批判性思維指南少觀察和解釋研究結果時的錯誤。例如，偏向是觀察中的主要問題，研究人員可以將多個觀察者的觀察結果進行比較，以考察這些結果之間的一致程度，透過這個方法就可以控制偏向這類錯誤。為了實現控制最大化和無關因素最小化，自然科學家常常在實驗室裡進行研究。不幸的是，與自然科學研究相比，對社會問題進行研究時要控制變數更為不易。因此，要成功地運用科學方法來研究人類複雜的行為問題是非常困難的。語言精確是科學方法的第三個典型特徵。生活中的一些概念往往是混亂、模糊不清、模稜兩可的。而科學方法在語言表達方面則力求準確、一致。儘管科學遠比我們這裡討論的要複雜得多，但是，由於科學方法強調可驗證性、控制和語言精確，在操作恰當的情況下，科學研究是最可信的證據來源之一，希望你能記住這一點。研究結果存在的問題不幸的是，事實上，科學研究用作證據並不一定意味著它就是可靠的，或者對證據的解釋就是準確的。無論是依靠其他證據還是依靠研究證據，都必須保持謹慎的態度。還有，有些問題，尤其是人類行為問題，即使是最可靠的證據，也只能作為暫時性的答案。因此，在確定對研究結果的信任度之前，我們還有很多關於科學硏究的重要問題要問清楚。當傳達資訊的人用研究結果作證據時，你必須記住以下幾點： 1. 研究的質量有天壤之別；我們對科研結果的信任應當是有選擇的，不是所有的研究結果都值得信任。一項做得很好第9章這些證據的可信度有多大（I）⋯⋯•157• 的研究與一項做得很差的研究相比，當然應該相信前者。由於研究過程極其複雜，又受到許多外在因素的影響，即使是受過良好訓練的研究人員，有時也會得出有重大缺陷的結論。因此，發表在科學雜誌上的論文並不能保證該研究在關鍵方面沒有缺陷。 2. 研究結果常常是相互矛盾的。因此，針對同一問題，一項孤立的研究常常得出有誤導性的結論。由多個研究者或研究小組重複驗證過的研究結果最值得我們注意。我們必須始終堅持這個問題：“其他研究者驗證過這些結論嗎？” 3. 研究結果並不能證明結論。最多隻能說，研究結果支援結論。記住，研究結果不能為自身作證！研究人員必須解釋其研究結果的意義，而所有的研究結果都能用不止一種方式進行解釋。因此，我們不能把研究者的結論當作“真理” 來看待。當你遇到諸如 “研究結果表明⋯⋯”這樣的描述時，應當把它們理解成“研究者認為，其研究結果表明⋯…” 4. 與所有人一樣，研究者的期望、態度、價值觀和需要等使他們的提問、操作研究的方法以及解釋研究結果的方式存在偏差。儘管他們盡了最大努力來避免這些偏差，但是科學事業不是中立的、沒有價值取向的，也不是完全客觀的。例如，科學家在某個特定假設上往往投入了個人情感。科學家和所有容易犯錯誤的人一樣，也很難客觀地對待那些與假設相矛盾的資料。科學研究的主要優點是它儘量公開研究的程式和結果，以便於其他研究者評價其價值，並能

•158•學會提問——批判性恩維指南對它進行驗證。儘管如此，無論一份科研報告看起來多麼客觀，它總會包含一些重要的主觀成分。 5.演講者和作者經常歪曲或簡化研究結論。傳達資訊的人用來支援其觀點的證據與研究得到的原始結果之間可能存在巨大的差異。例如，研究者可能會在他們的原始研究報告中對結論進行仔細限定，而其他人在引用這些結論時卻毫無限制。 6.研究所得的“事實”會隨時間發生變化，尤其是關於人類行為的研究。例如，以下這些研究所得的“事實”全部都被主要的科學文獻報道過，卻都已經被新的研究證據“否決”了：右利手的人比左利手的人壽命更長。拍乳房X線照片對50歲以下的婦女有益。人們已經發現一種導致躁狂一抑鬱症的基因。纖維有助於防止結腸癌。父母離婚對子女造成的破壞性影響是日漸累積的。 7. 不同研究的人為性不同。通常，為了實現“控制”這一目的，研究會丟失一些“真實世界”的東西。研究的人為性越強，就越難把研究結果推廣到實驗室以外的世界。在關於複雜社會行為的研究中，人為性引起的問題尤其突出。例如，為了研究電視暴力的影響，研究者可能會讓兒童觀看暴力卡通片，然後觀察他們對玩具的攻擊行為。此時，我們應當思考：“對玩具的攻擊行為太人為化，我們是否可以藉此獲得兒童在其他情境下的攻擊性行為的資訊？”

第9章這些證據的可信度有多大（I）••••159• 8. 研究者在經濟收益、地位、安全及其他方面的需要會影響其研究結果。研究者是人，不是機器。要他們做到絕對的客觀是極其困難的。例如，直接由某藥品公司贊助的研究者，與跟藥品公司沒有任何私人關係的研究者相比，前者可能更多地發現該公司的藥品具有積極的治療效果。此外，獲得職位和提升、追求儘可能大的收益以及贏得更大名氣等方面的壓力都有可能影響研究結果的客觀性。正如你所看到的那樣，儘管科研證據具有很多優良的特性，我們還是要避免過早地相信研究所得的結論。評價科學研究的線索運用以下這些問題來判斷科研結果是不是可信的證據： 1. 該科研報告的來源質量如何？通常，最可信的科研報告發表在由同行專家評審的雜誌上，一系列的相關專寮對文章進行審查之後才能在這些雜誌上發表。一般來說—但也不總是這樣—雜誌的聲譽越好，發表在上面的研究設計就越好。因此，你應當儘可能地瞭解科研報告的來源是否有較好的聲譽。 2. 除了來源的品質，該論文中還有沒有其他線索能證明研究做得很好？例如，論文有沒有報告該研究特別突出的優點？ 3.該研究得到其他人的驗證了嗎？得出相同結論的研究是否不止一個？即使在“統計上達到顯著水平”的情況下，研究結果也可能是由隨機因素引起的。例如，如果某種關係得到設計良好的研究的反覆驗證，如吸菸與癌症之間的關係，那麼，至少在反對此結論的人提出可靠的反駁證據之前，我們有理由相信這個結論。 4.傳達資訊的人如何選擇他們需要的研究呢？例如，他們是否遺漏了與相反的結果有關的那些研究？研究者是不是隻選擇了支援其結論的研究？

•160•學會提問—批判性思維指南（續） 5.已有的證據是否具有較強的批判性思維？演講者或作者是否對支持其觀點的早期研究表明了批判性態度？由於研究本身具有侷限性，由研究得到的多數結論都必須限制在一定範圍內，傳達資訊的人是否證明了自己願意這樣做呢？ 6.某些人是否有歪曲該研究的理由呢？我們必須警惕研究者刻意追求某種特定結果的情況。 7.該研究的條件是不是人為的？有沒有被歪曲呢？你必須想想，“該研究的操作條件與作者推廣條件的相似程度有多大呢？” 8.由取樣研究得到的結果，可以推廣到多大的範圍？我們將在下一節裡深人討論這一問題。 9.該研究者所使用的調查、問卷、等級評定或其他測量手段是否存在偏差或失真？我們必須確認，研究者對其想測量的東西進行了準確的測量。在研究中，調查與問卷存在偏差的問題是很普遍的，隨後我們將進行更詳細的討論。取樣研究的推廣演講者和作者經常運用研究報告來支援其結論的泛化，即聲明其發現的事件具有普遍性。例如，“瓊斯夫婦離婚對他們家的孩子產生了不良影響”不是一個泛化的結論，而“父母離婚對子女有不良影響”就是一個泛化的結論。對研究結論的泛化程度依賴於研究者選擇的事件或被試的數量、廣度和隨機性。根據研究目的選擇事件或被試的過程稱為抽樣。由於研究者不可能對所有的事或人進行研究，所以研究者必須選用某種方法，從其想泛化的事件或人群中進行抽樣，而且相比之下，某些抽樣方法更為合適。在對抽樣進行評價時，有幾個第9章這些證據的可信度有多大（II）•••••161• 重要的問題需要考慮： 1.樣本必須足夠大才能證明結論或研究具有普遍性意義。在多數情況下，研究者觀察的事件或人越多，結論就越可信。假如我們想知道大學生在完成學期論文時從其他人那裡獲得了多少幫助，並得出一個普遍性的結論，那麼，研究100 個大學生肯定比研究10大學生得到的結論更可信。 2. 抽出的樣本在廣度或多樣性上必須與得出結論的事件一致。例如，研究者想概括大學生的飲酒習慣，就應當以不同大學、不同型別系科的大學生為研究物件。中西部小型私立學校的學生與西海岸大型公立學校的學生可能有著不同的飲酒習慣，因此，如果僅對一所學校的學生進行研究，抽樣的廣度就不夠。 3. 抽樣越隨機，樣本就越理想。當研究者隨機抽樣時，他們力求使他們想概括的事件有同等的機會被抽取，他們儘量避免抽樣偏差。例如，主要的民意測驗，如蓋洛普（Gallop）民意測驗等，總是儘量採用隨機抽樣，這樣能避免抽取的事件群或人群具有偏差性的特徵。你能看出以下這些樣本具有偏差性的特徵嗎？ a.自願接受性生活頻率調查的人。 b.14:30在家接受電話訪問的人。 c.完成刊登在某種流行的婦女雜誌上的調查，並寄回答案的讀者。因此，我們想對所有的科研結果提問：“他們抽取了多少事件或被試？抽樣的廣度有多大？抽樣的隨機性如何？”

•162•學會提問—批判性恩維指南對傳達資訊的人來說，一個普遍存在的問題就是，由於對抽樣的侷限性沒有足夠的重視而導致研究結果的“過度泛化”。他們所描述的結果的概括性遠遠大於研究證明的事實的概括性。在第8 章裡，我們把這樣的概括稱為概括草率謬誤。下面這個研究就存在過度泛化的問題：在大學裡，教授辱罵學生的現象十分常見。最近，對Brightsville 大學的300名女性進行的調查顯示，超過20%的女性遭受過不止一位教授的辱罵。抽樣方法不允許這種過度的泛化。該研究報告雖然沒有明說，實際上是把結論泛化到所有大學了，儘管他只研究了一所學校。由於不知道研究者抽樣的隨機性如何，我們甚至不知道該研究的結論是否適用於進行調查的那所大學。過度泛化使研究產生了缺陷。記住：我們只能把研究結果推廣到與研究事件或人相似的事件或人身上！千萬要對過度泛化保持警惕！這是一種普遍存在的、強有力的人類行為傾向，我們必須不斷與之抗爭。存在偏差的調查和問卷傍晚，你剛剛吃過晚飯，電話鈴響了。“我們正在進行一項關於公眾觀的調查，你能回答幾個問題嗎？”如果你回答“好的”，那麼，你就和成千上萬的人一起參與了該調查—這種電話調查就是你最常遇到的一種研究方法。想想你聽到“根據最近的民意測驗”這句話的機會有多麼頻繁吧。

第9章這些證據的可信度有多大（I）••••163• 調查和問卷常用於研究人們的態度和觀念。可是它們的可信度有多大呢？這就要視情況而言了。調查的結果受到許多因素的影響；因此，在解釋調查結果時要特別謹慎。下面，我們來討論其中一些問題。首先，要使調查結果有意義，就要確保被調查者對問題的回答是誠實的，即口頭報告必須反映被調查者真實的觀念和態度。然而，由於各種各樣的原因，人們常常掩蓋真相。例如，人們給出的答案可能是自己認為恰當的答案，而不是反映真實觀念的答案。他們也許對問卷或被詢問的問題有敵意，也許對問題的思考太少。假如你曾經當過調查人員，那麼，你還能考慮到其他影響因素。記住：你不能假設口頭報告準確地反映了真實態度。其次，調查中的很多問題在措辭上是模稜兩可的，同一問題可能有多種解釋。實際上，不同的人可能對同一問題有不同的理解！例如，你可以想像一下“你的婚姻幸福嗎”這個問題可能有幾種含義。問題越是模糊不清，調查的結果就越不可信。你應當始終把措辭問題掛在心上。一般來說，措辭越明確，不同的人作出相似理解的可能性就越大。第三，調查本身存在的內在偏差使調查更為可疑。措辭和上下文是兩種最重要的偏差。措辭偏差是一個常見問題，措辭上的一個細微變化就會大大地影響被試的答案。我們以一個由民意測驗得出的結論為例，看看該調查所用的問題是如何措辭的。美國的一名國會議員向他的選民發放了一份問卷，並得到如下結果：92%的選民反對政府資助兒童託管中心。現在我們來仔細看看調查所用的問題：“你認為聯邦政府是否

•164•學會提問——批判性恩維指南應當提供兒童託管中心以協助家長培養孩子？”請你仔細剖析這個問題，發現內在偏差了嗎？“引導”你做出回答的是“協助家長培養孩子”這幾個詞。假如把問題改成：“你認為聯邦政府是否應當提供兒童託管中心，以協助那些上班時間找不到地方託管兒童的家長？”調查結果會怎樣呢？因此，該研究得到的答案不能作為公眾對於兒童託管中心的態度的準確指標。我們必須堅持對調查資料和問卷可能存在的偏差進行檢查。這就要求我們仔細檢查問題的措辭！這裡還有一個例子，我們已經把具有明顯偏差的詞語標出來了。問題：你是否允許同性戀患者教授你天真無邪的孩子？結論：75%的人不希望讓同性戀患者教授自己的孩子。問卷的上下文安排也會影響被試的回答。如果問題呈現的方式及問題在問卷中的位置發生了變化，那麼，即使是對於確定問題的答案也會隨之發生變化。以最近的兩項調查為例，這兩項調查的其他問題都一樣，只有一個問題不同。一項調查問：“假如一名懷孕的已婚婦女不想多要孩子，你認為她可以進行合法的流產嗎？”而另一項調查中，這個問題之前有如下問題：“假如一名孕婦有證據證明她懷的孩子有觖陷，你認為是否應當允許她流產呢？”不出所料，這兩項調查得到了不同的結果。你知道問題的上下文是如何影響被調查者的反應的嗎？另一個重要的上下文因素是問卷的長度。在較長的調查中，僅僅是因疲勞，人們對前後專案的反應就可能出現差異。對調查結果進行評價時，一定要當心問卷的上下文因素。既然人們對調查的反應受到諸多未知因素的影響，如追求快第9章這些證據的可信度有多大（I）⋯•⋯•165• 樂的需要或對問題的不同理解等，我們還要把調查證據當作可信的證據嗎？關於這個問題的爭論頗多，我們的回答是：只要我們保持謹慎的態度，並且不泛化結論，調查證據就是可信的。之所以有些調查比其他調查更出名，是因為調查的質量越好，其影響力就越大。我們的建議是，在接受調查結果之前，仔細檢查調查方法。一旦你確定了方法的質量，你就能在考慮可能存在的所有偏差的前提下，概括出你自己的、具有普遍性的結論。例如，調查的物件是某種體現自由主義意識形態的雜誌的訂戶，那麼，你就會限制針對該雜誌訂戶的任何概括性發現。即使是有偏差的調查也能提供資訊，但是，為了不被這些調查矇蔽，你必須知道這些偏差。對以研究為證據的觀點的批判性評價以下這些現點使用了研究證據來支援結論，讓我們用針對研究的提問來評價這些觀點。有的孩子明明已經吃飽了，卻不知道如何停止進食。家長為了避免孩子長胖，往往會提醒孩子不要吃了。然而，一項新的研究表明，家長的這種提醒有可能是不恰當的，應該停止。77名3~ 5歲的兒童參加了這項研究，結果表明，在飲食的數量方面，最胖的孩子卻有“控制” 最嚴格的母親。Johnson和他的合作者Leann L.Birch 在11月出版的《兒科》雜誌上發表了一篇論文，認為“母親對孩子的飲食控制得越多，孩子的自我約束能力就越弱”。他們的研究是在伊利諾斯州立大學的學前班進行的。該研究發現，在

•106•學會提問—批判性思維指南調節食量方面表現出自然傾向的孩子，是那些在飲食方面最具有自發性、飢餓的時候就可以進食、不必吃完父母規定的所有食物的孩子。斯坦福大學醫學中心的一名兒科營養學家說：“當兒童自身的這種傾向受到干擾時，很有可能導致兒童後期的過度飲食，並引發超重。” 在上面這則訊息中，我們看不到批判性思考的任何跡象。傳達資訊的人毫無批判意識地接受了研究結果。原始的研究報告發表在一份聲譽較好的雜誌上，這說明該研究的水平應該是很高的。儘管研究報告確實提供了一些詳細的研究方法，但是沒有提到該研究的任何優點或缺點，因此，我們可以根據得出概括性結論的基礎來評價這項研究的價值。報告也沒有說明是否有其他研究者重複過該研究。還有，我們不知道傳達資訊的人在選擇研究時是如何選擇的，也不知道該研究與關於肥胖原因的研究是否一致。雖然我們不知道研究者發表這一研究結果能獲得什麼好處，但是可以推測，發表研究結果可能有助於研究者獲得撥款和提升，也許這些好處會使他們在解釋研究結果時不夠謹慎。那麼，在這項研究中，研究者和傳達資訊的人有沒有過度泛化呢？首先，該研究的樣本很小—只有77名兒童，並且它侷限於中西部的一所學校，所以缺乏廣度。針對抽樣，我們還有很多問題。比如，這77名兒童是以什麼標準挑選出來的？家長是如何得知這項研究的？自願接受調查的這些家長是否存在偏差？假如我們從全國的多個學校中隨機抽取家庭來進行這項研究，是否能得到相似的結果呢？由此可以看出，上面這篇短文清楚地說明了一個過度泛化的事例！

第9章這些證據的可信度有多大（I）⋯⋯•167• 這項研究使用的問卷有沒有偏差呢？假設你是家長，並完成一份關於你對孩子的控制程度的問卷。像這樣的問卷，難道你不認為我們應當對答案的準確性提出懷疑嗎？關於問卷的措辭或問卷的專案，可參考的資訊都太少了，我們無法判斷專案是否清晰以及是否存在有偏差的措辭和上下文情境。對於以上這篇短文的事實性宣告，我們已經提出了足夠多的問題來使你保持警惕。在相信這些宣告之前，我們希望有更多的研究可以參考。現在，我們來討論一種特別的證據來源。把案例作為證據總統候選人在演講時說：“我們政黨在保護婦女權益方面的工作已經取得了巨大的成效。事實上，其中一位受益人就在聽眾當中，她就是 Alice Goodcase，今年70歲，來自於伊利諾斯州南部的一個小鎮，今天她就跟我們在一起。在我們針對老年人而提出的新工作促進計劃的幫助下，目前她在一家醫院裡擔任一份全日制工作。Alice，請你站起來好嗎？” 還有一種與剛才描述的科學研究形成明顯對比的常用證據，它著重研究具有代表性的樣本，透過對一個或幾個特殊的個體或事件進行詳細的描述來支援結論。這些描述通常是以觀察或訪談資料為基礎，並且研究的深度、完整性和合理性大相徑庭。我們把這類描述稱為案例。傳達資訊的人往往以對個案進行振奮人心的描述開始。例如，

•168•學會提問——批判性思維指南論證《嚴格槍支管理法》的必需方法之一，就是提供一些無辜者被槍殺的生動案例。由於案例是生動、詳實的，這使得它們易於形象化，因而往往能吸引我們的注意。政黨候選人越來越多地把案例運用到演講中，因為他們知道個案豐富的細節能引發聽眾的情感共鳴。然而，這樣的案例更應當被看作是動人的事例或軼事，而非證據。它們被當作證據使用是非常可疑的。生動的個案能感染我們的情緒，並轉移我們的注意力，不讓我們尋找其他的相關證據。例如，“有一個肥胖的、領取救濟金的母親，她毫無責任感，10年來一直依靠救濟金生活，有過多次婚姻，與每個丈夫都生有孩子”，像這樣的描述可能會使我們忽視一些更相關的統計資料，即在接受救濟的人當中，僅有10%的人領取救濟金的時間會達到4年或更久一點。千萬要注意把動人的案例作為證據的情況！儘管案例可以與結論相一致，但不要被這種一致矇騙。你應當時刻提醒自己：“這個案例是否典型呢？”“能不能找出有力的反面事例？”“該案例在表述上有沒有偏差？” 即使案例算不上好證據，很多時候案例都是很有用的，是這樣嗎？當然了！與個人經驗一樣，案例證明了事件的可能性，並在抽象的統計資料中呈現了一個生動的面孔。案例使人們更容易聯想到某個論題，從而對這個論題更感興趣。

第9章這些證據的可信度有多大（I）•••••169• 把類比作為證據這裡有一些短文，請你仔細思考它們的結構，尤其要注意用來支援結論的理由。教育無法讓男人和女人為婚姻作好準備。這就好比教他們遊泳卻不讓他們下水一樣，是根本行不通的。對於當前行政部門中所有的不道德行為，誰應該負責呢？應當是總統。畢竟，魚是從頭開始往下腐爛的。如果叫你每天服用一匙砒霜，你肯定不樂意。所以我實在不明白你為什麼堅持吸菸。吸菸和服用砒箱都能置你於死地。這三段都是用類比作為證據的。這種證據與我們以前討論的那些證據有很大區別。我們如何判斷這種證據的好壞呢？在繼續往下讀之前，請你儘量判斷以上三個論證的可信度。傳達資訊的人常常將他們熟悉的東西與相對不熟悉的東西進行類比，依靠兩者之間的相似點來證明某個結論。他們把類比作為一種證據來使用，並按照這樣的方式進行推理：“假如這兩者在某一方面是相似的，那麼，它們在其他方面也可能是相似的。” 例如，研究者開始尋找艾滋病的起因時，他們先確定與艾滋病有相似特徵的一些疾病，比如肝炎。然後，他們根據已掌握的這些疾病的起因來找出艾滋病的起因。當我們選擇觀看某部由朋友推薦的電影時，我們也是按照類似的方式進行推理的。因為我們與朋友有一些相似的喜好，由此可以推知我們也會欣賞相同的電影。

•170•學會提問——批判性思維指南 •由類比得出的論證是指以兩個事物間已知的相似性為基礎，得出關於另一方相對未知的特點的結論。類比推理是用證據支援結論的一種常用方法。類比既能激發我們的靈感，也能矇騙我們。例如，在科學的、有邏輯性的推理中，類比非常有用。當我們以對老鼠的研究為基礎得出關於人的結論時，就是運用了類比推理。關於原子結構的多數思想也是來源於類比推理。當需要做出符合邏輯的決定時，我們會參照以往在類似情況下的決定。例如，法官在判斷關於焚燒旗幟的禁令是否與受憲法保護的言論自由相牴觸時，必須先判斷焚燒旗幟與言論自由的相似程度。這時，法官就藉助類比進行推理。這樣的推理是相當有見地的，也很具有說服力。不過，類比推理也會具有欺騙性。例如，歐盟的一名前領導人就曾利用類比來證明，犯有通好、賣淫或同性戀等罪的人應當被判處死刑：如果你的手指長了壞疽，你會怎麼做呢？你會讓整隻手甚至整個身體都長滿壞痘嗎？當然不會。所以，你會切掉手指。道德敗壞也是如此，我們不得不消滅道德敗壞的人。壞疽與通姦、賣淫及同性戀真的這麼相似嗎？兩者根本不是一回事。所以，這是一個具有欺騙性的類比。儘管某些社團看上去是“有魔力的”，實際上是利用錯誤的類比推理來煽動群眾。評價類比由於類比推理相當普遍，而且，既有可能是可信的，也有可能是錯誤的，所以你會發現，認識這種推理並學會如何系統地評第9章這些證據的可信度有多大（I）⋯⋯•171• 價它是非常有用的。要評價類比的好壞，你需要抓住兩個因素： 1.從多個方面比較兩種事物的相似之處與不同之處。 2.相似性與差異性之間的關聯。注意：你會發現，任意兩種事物之間幾乎都有某些相似之處。因此，僅僅因為兩者相似就進行類比推理並不可信。當被比較的兩種事物之間存在與論題有關的相似之處，但沒有與論題有關的差異時，這樣的類比才是強有力的。一切類比都試圖闡明事物潛在的原理。類似之處和差異都與類比闡明的潛在原理直接相關。這裡有一個運用了類比的論證，我們來考察一下它的可信程度。如果我的兒子得了流感或麻疹，我就不會讓他出門。為什麼有的父母要把患有艾滋病的孩子送到學校去呢？難道這些正在生病的孩子還喜歡跑、跳和玩耍嗎？既然你不會讓得了麻疹的孩子去上學，那麼就讓患有艾滋病的孩子呆在家裡吧。畢竟，他是個病人。在這個例子中，是否讓孩子上學與艾滋病有關，而麻疹與艾滋病主要的相似之處在於這兩者都是疾病。儘管如此，我們注意到兩者之間的一些差異。麻疹有一些嚴重的症狀，雖然這些症狀會逐漸消失，但是麻疹病毒很容易傳染。而艾滋病的症狀很難預測會如何發展，有可能很長一段時間內都不會出現急性症狀。.由於艾滋病是透過血液傳播，所以一般接觸的傳染性不強。因此，患有艾滋病的孩子感覺自己的身體狀況可以去上學，也很想上學。並且依據現有的知識，我們認為艾滋病不太可能在學校裡蔓延。艾滋病與麻疹之間的這些差異影響到我們是否把患艾滋病的孩子擋

•172•學會提問—批判性思維指南在校門外，所以這些差異與論題是有關聯的；因此，作者的類比沒能為他的結論提供強有力的支援。另一種有助於評價類比推理的策略是製造選擇性類比來理解作者試圖說明的相同現象。這種類比既可能支援，也可能反對原始類比所得出的結論。如果它們與結論相反，就揭示出了原始類比推理存在的問題。例如，有人認為：為了保持健康、消除疾病以及其他一些與遠離疾病有關的好處，應當控制飲酒量。有的人使用常見的類比來支援關於酒精的這個結論：酒精中毒就像生物性原因引起的疾病一樣。然而，另一些人制造了選擇性類比，認為酒精中毒就像 “意志崩潰”一樣。注意，從不同的角度看待類比可能會使你對原始類比的可信度產生懷疑。你可以根據下面這種有效方法來產生你自己的類比： 1.確定你所研究事物的某些重要特點。 2.儘量確定你熟悉的、具有類似特點的其他情況。比如，讓自己進行自由的想像、運用頭腦風暴法等。儘可能多地想像各種各樣的情況。 3.儘量判斷你所熟悉的情況是否能為你不熟悉的情況提供一些靈感。例如，在考慮酗酒的有關問題時，你要儘量考慮其他情況，如吸菸、暴飲暴食或者賭博，因為在這些情況下，人們反覆地尋求即時滿足而不管這些行為會帶來什麼樣的長期影響。這些行為是否能讓你從其他角度去看待酗酒呢？現在，你應當有能力來系統地評價本章開始提出的那三個論證了。你可以透過提問來確定論第9章這些證據的可信度有多大（I）⋯⋯•173• 證的結構，然後再透過提問對其進行評價。你應當尋找有關的相似點和不同點。一般來說，相似點比不同點越多，類比就越成功。如果你發現兩個事物沒有任何的不同點，並且能找到良好的證據來證明兩者確實存在相似之處，那麼，這項類比就格外有吸引力。對於本章開始提到的那三個作為樣例的類比，我們都找出了有關的差異來進行反駁。看看你會怎樣評價我們列出的這些差異。（樣例一）游泳的主要技巧是動力技巧；而建立成功的婚姻所需的技巧不同於動力技巧。像管理財產和溝通這樣的技巧是可以在婚姻以外學到的。（樣例二）與一條魚的部分器官相比，行政部門的“一部分” 在功能上具有更大的獨立性。程度較低的瀆職行為可能是由複雜的、各種各樣的原因引起的。（樣例三）砒霜導致的死亡是即時的、必然的。而從統計學角度來看，吸菸導致的死亡既不是即時的，也不是必然的。還有，吸煙能使人獲得很大的、即時的快感；砒霜卻不能。具有欺騙性的類比符合我們對一種推理謬誤的定義，我們把這種謬誤稱力錯誤類比謬誤。錯誤錯誤類比：當進行類比的兩個事物存在重要的、與論題有關聯的差異時，會出現此類謬誤。從某種意義上來說，由於所有的類比都進行了錯誤的假設，所以它們都是錯誤的。這是因為所有的類比都假設，如果兩個事物在某一方面或多個方面是相似的，那麼，它們在其他重要方面也

• •174•學會提問——批判性思維指南必然是相似的。你最好考慮一下類比的強弱，但是，即使最好的類比也僅僅是建議性的。所以說，如果作者將兩種情況進行比較，由兩者之間最顯著的相似性得出了一個結論，那麼，為了支援這個結論，他就應當提供更多的證據。總結本章繼續對如何評價證據進行了討論。我們已經討論過的證據型別有：觀察資料、科學研究、案例和類比。每種證據都既有優點又有缺點。一般來說，你會更多地相信那些被大量的科學研究直接證實的觀點。然而，即使是藉助科學研究，也不能澄清所有問題。這時，傳達資訊的人就必須依靠非結論性的研究和其他證據來源。當他們運用有偏差的觀察資料、生動的個案、設計不良的研究或錯誤類比來支援他們的觀點時，你必須格外小心。無論你遇到什麼型別的證據，都應當想想“證據的可信度有多大”這個問題，並判斷證據的好壞。練習口批判性問題：這些證據的可信度有多大：個人觀察、科學研究、案例、類比。這裡有幾篇短文，請你考察其中使用的證據，並對短文作出評價。

第9章這些證據的可信度有多大（I）⋯•⋯•175• 練習1 與同齡的非收養兒童相比，被收養的兒童在情感上和學業上有多脆弱呢？為了回答這個問題，我們在6~11歲的兒童中選取了130名收養兒童和 170名非收養兒童，對他們進行了心理測試和學習適應性測試，並讓他們的母親和老師對他們的適應能力進行評價。透過辦理收養事務的機構、中介以及報紙廣告、口頭宣傳，我們從新澤西、賓夕法尼亞東部和紐約徵集了收養家庭。而非收養家庭則透過新澤西北部5箇中心學校系統和報紙廣告徵集。與非收養兒童相比，收養兒童在心理問題和與學校相關的行為問題上得分較高，而在社會能力和學業成績上得分較低。可見，研究結果支援了這一觀點，即收養兒童更容易出現情感問題和與學校有關的行為問題。練習2 我們必須形成一套強制性的體系，以便對犯罪行為進行統一宣判。針對犯罪的嚴重程度劃分出不同等級，然後根據等級判處相應的懲罰。這是公平量刑的唯一方式。為特定的罪行劃分數字化的等級，與橄欖球規則中觸地得6分、進球得3分的意義是等同的。練習3 是的，美國人民最大的自由之一就是有權批評政治人物。但是，當言論自由損害了我們為贏得反恐鬥爭而付出的努力時，我們必須為言論自由劃一條底線。Holmes 法官曾說，在擁擠的劇場裡大喊“開火”的行為明顯具有危險性，這樣的言論自由是不受法律保護的。凡是不利於反恐的言論都有可能引起明顯的、即時的危險。難道Holmes不是在建議我們為言論自由制定一條清晰的界線嗎？只有少數人反對這種觀點。2002年春，在得克薩斯州的休斯頓市一家大型超市裡，有100個人回答了“是否應當對不愛國的戰爭言論進行限

•176•學會提問—批判性思維指南制”這個問題，其中80%的人作出了肯定的回答。抽樣回答—— 練習1 結論：收養兒童更容易產生情感問題和與學校相關的行為問題。理由：與非收養兒童相比，收養兒童在心理問題和與學校相關的行為問題上得分較高，而在社會能力和學業成績上得分較低。由於這只是一項孤立的研究，所以，我們想知道該研究的結果在這一領域裡有多大的代表性。同時，我們也不知道該研究結果是否發表在聲譽良好的雜誌上。儘管如此，我們還是可以對這項研究提出一些有用的問題。比如，該研究的樣本數量相當大，但是樣本的廣度值得懷疑。雖然樣本是從多個州抽取的，但是收養家庭的規模、收入水平以及家長的年齡等方面代表性如何呢？抽樣方面最大的問題可能是缺乏隨機性。就徵集方式而言，是否存在選擇性因素而使得某種型別的家長自願參與這項研究？收養家庭和非收養家庭的徵集方式是否有差別？例如，就算收養家庭的孩子正面臨著情感、學業等問題，收養家庭也更樂意參與該研究。如果研究中包含了這類選擇性因素，那樣本就是有偏差的。此外，測驗的評分標準準確度如何呢？家長和老師的評價是否真實地反映了孩子的情感適應狀況？他們的評價客觀程度如何？如果評價者知道某個兒童是被收養的，對他的評價會受到影響嗎？在給予結論更多的信任之前，我們想知道更多有關這些評價準確程度的資訊。練習2 結論：為罪行劃分等級是很有必要的。

第8章 這些證據的可信度有多大（I）⋯•••151•

第8章這些證據的可信度有多大（I）⋯•••151•