引富 2.2 調查 2.3 科學研究 2.4 觀察研究 2.5 資料整理:為概括和分析準備資料 2.6 小結利用調查和科學研究來收集資料 2.1 引言正如在第-章中提到的那樣,從資料中學習的第一步是仔細地思考研究的目標(先思而後行)。在富於劃地救據農第中關鍵的一步是資料收集過程的設計。 在這個過程中,需要有意識地做好以下幾步: • 詳細說明研究、調查或試驗的目標。 •確定所關心的變數。 •為調查或科學研究選擇適當的設計方案。 •收集資料。 為了明確研究的目標,你必須理解所面對的問題。例如,某大城市的交通部門為了增加市內公共汽車的使用率而想評估一下公眾對該市公交系統的認識。這樣,交通部門需要確定公交系統的哪些方面決定著人們是否乘車。該項研究的目標是, 找出那些交通部門為增加乘坐公共汽車的人數可以改變的因素。 為了確定所關心的變,你必須仔細分析研究的目標。對於公交系統,透過參考其他城市所做的調查或和公交系統的員工集體討論可以確定出一些主要因素。 其中一些可能的因素是安全性、車費、公交車的整潔度、在家或工作地點附近是否有停靠站以及公交車晚點的頻繁程度。調查中要獲得的測量值包括被確定出的因素的重要程度(非常重要、重要、沒意見、不太重要、很不重要)。人口統計學方面的資訊如年齡、性別、收入、住址等也要測量。最後,有關一個人當前乘車頻繁程度的量的測量值很重要。一-旦明確了調查目標和所關心的變數,你必須選擇最適當的方法去收集資料。資料收集過程包括:調香、試驗和對已有的來自商業紀錄,人口普查、政府記錄及過去的調查記錄等資料的檢查。抽樣調查稱試驗設計的理論為資料收集握供了極好的方法。調查的目標是收集有關現有條件、態度或行為的數
•20• 第二章利用調查和科學研究來收集資料據。因此,上述城市的交通部門需要設計一份調查問卷,然後抽取該市中當前的公共汽車乘客及使用其他交通工具的人作為樣本。 另一方面,科學研究似乎更積極主動:試驗人員透過改變試驗條件來研究試驗條件對試驗結果的影響。例如,交通部門可以透過在一些選出來的線路上降低票價來評估公共許車的利用率是否因此而增加。然而,在此例中,一些公交系統控制不了的其他因素也可能在這期間發生變化。比如,公共汽車使用率的增加可能是由於地鐵工人罷工或石油價格上漲而造成的。票價的降低只是造成乘坐公交車人數增加的幾種因素中的一種因素。 在大多數科學試驗中,影響測量值的儘可能多的因素都在試驗者的控制之下。 一個花匠想確定一種新的植物激素對商品花生長的影晌。該花匠在一個溫度、溼度、水分和光照都被控制好了的溫室中做試驗,選定幾個生長激素的用董,其中包括一個對照—即不施加生長激素,然後按照每個用量,給一組有同樣數量的植物施用生長激素。當試驗結束時,測量出植物的大小和生長狀況。由此可以決定出對植物生長最優的生長激素水平,因為在理想的狀態上,所有影響植物大小和生長狀況的其他因素對試驗中的所有植物來說都是一樣的。 在這一章,我們將考慮一些調查方法和科學研究的設計方案,也將分別對科學研究和觀察研究進行討論。 2.2 l j查來自抽樣調查的資訊幾乎影響我們日常生活的每一方面。這些調查決定了諸如經濟調控和促進社會進步等的國家政策。民意測驗是眾多新聞媒體所報道的許多新聞的基礎。電視節目的排行榜決定著將來可以看到哪些節目。 誰做調查?我們都熟悉公眾的民意測驗:紐約時報(Neze York Times)/哥倫比亞廣播公司新聞(CBS Nezess),華盛頓郵報(Washington Post)/全美廣播公司新聞(ABC Nezes),哈里斯(Harris),新聞週刊(Neusweveek)的蓋洛普民意測驗 (Gallup)和CNN的民意測驗。然而,純大多數調查是為了工業、政府、管理或科學等方面的特定目的而進行的。例如,冷車製造廠利用調查來找出顧客對他們生產的汽車的滿意程度;我們在購買某種產品後,經常被要求填寫一份調查表,以此作為獲得保修登記程式的一部分;許多涉及健康問題的重要研究常用調查來完成, 例如,食物中的脂肪含量、被動吸菸的情況、避孕套的使用與艾滋病的預防以及青春期抑鬱症的流行等。 美國憲法規定美國人口普查局每十年普查一次人口。隨政府對居民生活介入的增長,人口普查局已經擴充套件它的職能,不再僅僅是計數人口數量了。他們曾經做過這樣的嘗試,給美國每戶居民郵寄一份人口調查問卷。從1940年的人口普查
2.2 調查•21• 開始,在完全計數人口數量的基礎上,又從國民的代表樣本獲得了更多的資訊。在 2000年的人口普查中,使用了變化抽祥率。對大多數地區來說,大約六分之五的家庭被要求回答列在簡表上的14個問題,其餘的家庭回答包括增加了另外45個問題的一份長長的問卷。許多機構和個人把所得到的資訊用於各種目的。聯邦政府用它來給各州和城市分配基金;商業部門用它來預測銷售量、管理員工和構思將來的銷售點;城市和地方規劃人員用它來計劃土地的使用、交通網路的建設和能源的消耗等;社會科學家利用它來研究經濟狀況、種族均衡及生活質量的其他方面。 美國勞動力資源統計局(BLS)例行20多項調查,其中最著名、使用最廣泛的是建立消費價格指數(CPI)的調查。消費價格指數用來測量市場上一個固定的貨物和服務業範圍內的價格變化。一方面它是反映通貨膨脹的,另一方面,它也是反映政府政策的一項經濟指標。商業部門認為工資額度及退休金計劃與CPI緊緊聯絡在一起。聯邦衛生和福利機構以及許多州或地方部門把對他們專案適當與否的評價基礎與 CPI 緊緊聯在一起。租借和抵押價格的調整也要基於 CPI。這個由抽樣調查確定的指標,在我們的社會中起著十分重要的作用。 BL.S 所做的其他許多調查對促進社會的發展也是很重要的。每月當前人口的調查提供了有關勞動力、就業和失業等方面的基本資訊。消費支出調查收集了有關象庭日常生活中用於商品和服務支出的資料。基層單位調查(The Establishment Survey)收集有關非農業商業機構的僱用時間和工資收入的資訊。有關職業前景的調查提供了有關將來各種工作就業機會的資訊,它可以反映未來將近十年的情況。BLS的其他一些活動可參見 BL.S Handbook of Methads (1982)。 民意測驗經常地出現在新聞中,Gallup(蓋洛普)和 Harris 也已經成為象喻戶曉的民意調查機構。這些民意測驗和抽樣調查反映了公民對從政治和宗教到體育和娛樂幾乎所有事情的觀點和態度。Nielsen 收視率決定著電視節目的成敗。 Nielsen 零售指數提供了有關食品、化妝品、藥品、飲料和其他許多類產品的最新銷售資料。這些資料來自全美1,600家商店每60天的銷售和庫存清單。 商業部門為了內部經營而進行抽梯調查。另外他們在作重大管理決策時也利用政府部門的調查。審計員用抽取賬目的方法來估計賬上的收支平衡情況以及是否按規操作。生產過程中的質量控制很大程度上依賴於抽樣技術。 商業活動中依賴於細緻的抽樣活動的另一領域是市場銷售。決定銷售什麼產品,在哪兒銷售及如何為它們做廣告等常常都要基於抽樣調查得來的資料。這些資料可能來自生產該產品的公司所做的調查或從專業從事市場資料調查的調查公司購買得來。 抽樣的方法在任何調查中,如何從總體中挑選樣本都是一個關鍵的因素。如果其中個體的選擇僅僅是出於方便,那麼抽樣調查可能會產生偏差,這將妨礙調查準確地反映
• 22• 第二章利用調查和科學研究來收集資料作為一個整體的總體。例如,一個市場營銷學專業的研究生髮明瞭一種做廣告的新方法。為了評價這一新方法,他在一個大的本科生商學課程班中抽取學生,讓他們來評價該新方法是否對標準的廣告方法有所改善。該班學生的觀點能代表將來接收到這一新方法廣告的全體物件的觀點嗎?上述學生的收入水平、種族、受教育程度及其他的一些社會經濟特點可能與所關心的總體有很大的區別。此外,那些學生有可能是被他們老師強迫去參加調查的,因而他們可能對調查中的問題不給以坦誠的回答。因此,抽樣所用的方法對研究結果的可信度和適用程度至關重要。 簡單隨機抽樣基本的設計方法(簡單隨機抽樣)是如此抽取n個個體組成的樣本,使得總體中每組樣本量為*的樣本都有相同的機會被抽選出來。在民意測驗中,我們從選民登記列表中按照某種使得每個樣本量為?的樣本有同樣的概率被選中的方法選擇名單,這樣我們得到由合格選民組成的隨機樣本。簡單隨機抽樣的詳細內容在4.11節中討論,這裡我們只說明一點,即如果社群中所有選民具有相似的社會經濟背景,那麼簡單隨機抽樣與任何其他抽樣方案一樣包含同樣多的有關社群偏好的資訊。 分層隨機樣本然而,假定該社群由高、低兩類不同收入層次的人構成。高額收入階層中的選民對調查問題所持有的觀點可能與低收入階層中選民的觀點很不相同。所以,為了得到有關總體的確切資訊,我們要從每“階層”中抽取選民。我們可以把該總體中的元素按照收入分成兩組,或者說兩層,然後,從每組中抽取一個簡單隨機樣本。這樣抽得的樣本稱為分層隨機樣本。(參見 Scheffer 等,1996,