本站小編為你精心準備了無響應誤差統(tǒng)計學論文參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
一、關于可接受的回答率問題
如上所述,較低的回答率將會破壞樣本的代表性,從而產生較大的無回答偏差。那么,什么樣的回答率是可以接受的呢?這一問題目前尚沒有一個明確的、公認的結論。科克倫和伯恩鮑姆(A.Birnbaum)等人認為對一般調查而言,回答率應在90%甚至95%以上。美國廣告研究基金會則建議郵寄調查的回答率應80%以上。我國學者盧淑華也持這種看法。愛爾達斯(Erdos)則認為一個可靠的郵寄調查應有50%以上的回答率,或能用某種方法證實不回答者與回答者是相似的。萊斯勒(J.T.Lessler)認為對這一問題的回答不應是絕對的,而應考慮多方面因素。她指出應結合如下因素來討論:(1)調查前對回答率的期望值,它取決于調查的內容、總體與數(shù)據(jù)收集方式;(2)提高回答率的成本;(3)是否對無回答采用補救方法以及采用何種方法。(4)調查內容及其結論的重要性。應該指出的是,在調查報告或研究結果中說明回答率是一項良好的調查研究應有的內容。
三、無響應問題的處理方法
為了盡量減少無響應誤差的影響,統(tǒng)計學家們提出了許多的處理方法。這些處理方法可以歸納成兩類,一類是在進行統(tǒng)計分析之前的處理,即在調查階段的處理,一類是在統(tǒng)計分析中進行的處理,即調查完成之后的處理。
1.分析前的處理。分析前的處理方法的主要目標是提高回答率。主要方法包括:(1)認真選聘、培訓、督導調查員。(2)對被調查者進行適當激勵。(3)由有名望的機構出面組織調查。(4)多次訪問。(5)改進調查方法。如,科學地設計調查項目與問卷外觀,以使被調查者能較輕松地回答問題;調查前先與被調查者聯(lián)系;仔細分析不同受訪者最可能在家的時間;等等。(6)在無響應的樣本單位中再次抽樣。(7)使用隨機化回答技術。如果引起無響應的主要原因是問卷或某些項目為敏感性問題(如隱性收入、偷稅漏稅、吸毒等),則可用使用隨機化回答技術來進行調查。這種調查技術通過設置巧妙的“隨機化裝置”,使得被調查者可以說出實情而調查者并不會知道他的回答的真正含義。但調查者可以由整個樣本的回答獲得某類人數(shù)所占比重或某敏感性指標的均值等的估計值。
2.分析中的處理。如果由于某些原因未能采用上文所述的分析前的處理方法,或者雖已采用但仍未能達至足夠高的回答率,我們就需要采取事后的補救措施。各國統(tǒng)計學家已為此而提出了許多方法。(1)波利茲-西蒙斯(Politz-Simmons)方法。這種方法是預先在調查時詢問回答者在K個類似的期間里他有多少期間可以被找到,然后在分析時用他可被找到的期間數(shù)對其Y變量值(Y為所研究的指標的測度)作“倒數(shù)加權”。例如,對于在調查的前5天中在相同時間內呆在家里并可以接受調查的天數(shù)分別為0、1、2、3、4和5的回答者,分別用6/1、6/2、6/3、6/4、6/5、6/6作為其Y變量值的權數(shù)(分母是前5天可接受調查的天數(shù)加1,即加上調查的當天)。這種方法的隱含假設是在家天數(shù)越少者,其Y變量值越接近不在家者。(2)時間趨勢法。這種方法通過考察連續(xù)各批回答者(如郵寄調查中按時間先后對回件分批)的答案,分析其中的趨勢,然后將此趨勢延伸,以此推測出無響應者的答案。比如,如果各批回答者的收入呈上升趨勢,則推測無響應者的收入是最高的。(3)分組加權估計。這種方法要求按某些輔助信息將總體單位分成若干組,使組內各單位的Y變量值盡可能相近。在抽樣調查之后,若出現(xiàn)無響應問題,則按各組的單位數(shù)占總體單位數(shù)的比例進行加權調整。我們用一個簡化的例子來說明,設總體分成兩組,第一、二組單位數(shù)分別占總體單位數(shù)的30%與70%。假設抽樣調查的結果如下表。
如果不作加權調整,則對總體的Y變量均值的估計為:(3230×300+2110×500)/800=2530但考慮到第2組的不回答率遠高于第一組,為減少無響應偏差,使用分組加權估計,則總體的Y變量均值的估計調整為:3230×30%+2110×70%=2446。(4)替代方法。概括地說,替代方法是用“精心選擇”的回答單位的數(shù)據(jù)或者用按輔助信息推測的數(shù)據(jù)來“替代”無響應單位數(shù)據(jù)的方式來處理無響應問題。而具體的替代方法則多種多樣。———均值替代法。指將總體分組,用組內回答單位的樣本均值替代無響應單位的值。這種方式實質上與“分組加權估計”方法非常類似。———完全匹配替代法。使用某些外部來源的記錄來替代無響應單位或無響應項目的數(shù)據(jù)。如從工商、稅務、海關等管理部門取得無響應的被調查企業(yè)的注冊資本、所得稅、出口貨物情況等來作替代值。———最后回答者替代法。以最后一批回答者的答案替代無響應者的答案。比如,在郵寄調查中,以幾次追蹤后最后寄回問卷者來代表未回件者。———演繹估計法。如果所研究的Y變量與另一變量X存在已知的函數(shù)關系,即Y=F(X),且可了解到X的值,則可用此方法得出Y的缺失值。———回歸替代法。如果所研究的Y變量與另外一些變量存在高度的相關關系,則可建立一個回歸模型,并利用回答數(shù)據(jù)對模型參數(shù)進行估計。然后利用估計的回歸方程預測Y的缺失值。———“熱層”(Hot-deck)方法。通常用于項目無響應。一般做法是對調查中的項目缺失值用同一調查中具有類似背景的回答者的數(shù)值來替代。———最近距離替代法。通常用于項目無響應。這種方法要選擇一些輔助變量及一種距離測度。它按照輔助變量距離最近的原則選擇替代者。有人認為“熱層”方法采用的是非數(shù)值分類的方式,而最近距離替代法采用的是數(shù)值分類方式,因而后者是前者的修正。幾十年來,統(tǒng)計學家們針對無響應問題提出了許多的處理方法,本文難以一一介紹。統(tǒng)計學教材應按照所針對的學生層次、教學時間等來選擇介紹適當?shù)姆椒ā?/p>
作者:岑成德單位:中山大學管理學院