前言:我們精心挑選了數篇優質常用的統計分析文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
關鍵詞:自由分布 隨機性 獨立樣本
眾所周知,通過統計調查獲得的樣本資料只能部分地顯明總體數量特征,要想全面而深入認識總體,就需要在對樣本進行觀測而獲得數據資料的基礎上,用樣本已知的有關的“量”來對總體相應的“量”加以推斷估計而作出結論,這即是推斷統計。傳統的統計推斷都要對總體的分布形狀加以某些限定,如假設樣本所出自的總體必須是正態分布,或者假設兩個樣本取自具有相同方差的總體等等。這些限定無疑過于苛刻,在我們的抽樣調查實踐中是難以滿足的。如果采用自由分布統計檢驗來進行統計分析,即對樣本所出自的總體分布具體形狀不作假設,是基于樣本的特性來檢驗統計量,這種方法在實踐中行之有效。
一、Kolmogorov-Smirnov單樣本隨機性檢驗
Kolmogorov-Smirnov單樣本檢驗,涉及一組樣本觀測結果的經驗分布同某一指定的理論分布之間是否一致的問題,適用于確定順序分類數據的樣本觀測結果是否有理由認為它是來自具有指定理論分布的總體。
該數據取自調查樣本《核心能力調查表》的某一項目重要程度數據
取顯著性水平α=0.01,檢驗該樣本的被調查者對該項目的重要程度等級排序具有同等區分。
首先提出原假設H0與備擇假設H1:
H0 :P1=P2=P3=P4=P5=0.20
H1:P1≠P2≠P3≠P4≠P5≠0.20
具體檢驗步驟如下:
第一步,求期望頻數。對每一種排序號用總頻數n乘以H0成立時的概率P,即得期望頻數fe 。已知H0 :P=0.20,fe=24×0.20=4.8。
第二步,求觀察頻率(f0/n)和期望頻率(fe/n)。
第四步,確定檢驗統計量Dn=max|Fn(X)―F(X)|=6.6/24=0.275。
第五步,求臨界值Dnα。由Kolmogorov-Smirnov單樣本雙側檢驗的臨界值得:在n= 24,α=0.01時,Dnα=0.343,由于D35=0.275<D350.01=0.343,故不能舍棄H0 ,即結論是可以認為,在顯著性水平α=0.01時,該樣本的被調查者對該項目的重要程度等級排序具有同等區分,所測定出來的差異僅是由于樣本的隨機性波動所造成的。
二、多個獨立樣本的中位數檢驗
由于中位數作為一組數據集中趨勢的代表,不易受到極端數值的影響,其穩定性是其最顯著的優越性。因此,通過對多個獨立樣本中位數是否來自同一個總體的假設檢驗,可以判斷該總體中位數的數字特征。
現有抽樣調查《專業技能調查表》某一項目重要程度的四個隨機樣本,給出如下數據:
樣本Ⅰ :2,9,23,5,6
樣本 Ⅱ:5,6,8,1,1
樣本 Ⅲ:3,5,19,10,1
樣本 Ⅳ:0,6,10,18,4
取顯著性水平α =0.05,檢驗這四個隨機樣本是否來自共同中位數的總體。具體檢驗過程如下:
(一)建立假設
H0:四個隨機樣本所屬總體中位數沒有顯著性差異
H1 : 四個隨機樣本所屬總體中位數存在顯著性差異
(二)取顯著性水平α=0.05,雙側檢驗
(三)統計檢驗
由于隨機樣本彼此獨立,K=4,其觀察值表現為順序數據,適合采用 檢驗法來評價總體中位數的差異。
(四)將數據按由大到小混編排列
求出公共中位數后將各樣本分別“+”,“-”計數,填入4×2表。
求得公共中位數為5.5[=(6+5)/2]。凡大于該中位數者歸入“+”得計數,凡等于或小于該中位數者歸入“-”計數,得4×2表如下:
(五)計算 值
期望頻數等于每一格相應的兩個邊緣頻數乘積除以總頻數,fe=10×5/20=2.5。于是:
(六)求臨界值
查 臨界值表,在α=0.05,df=k-1=4-1=3相應欄中找到臨界值為7.815。
(七)判定
0.8<7.815,故不應舍棄H0。即可認為,在顯著性水平α=0.05下,這四個隨機樣本所屬總體中位數沒有顯著性差異。
從以上分析中可以看到,自由分布統計是基于樣本特征為研究出發點,而不對總體分布形狀加以限定。同時,這里的 “自由”是相對的,即它與傳統限定分布統計方法(Distribution-SpecifiedStatistical Methods)而言是自由的。該方法在市場調研分析中具有較強的應用價值,值得我們深入研究。
[參考文獻]
[1]顏金銳.科研中常用的統計方法―自由分布統計檢驗[M].中國統計出版社,2002.
關鍵詞: 轉移矩陣 轉移概率 齊次性 占有率
馬爾可夫鏈是一類常用的隨機過程,它在管理科學、可靠性理論等學科中被廣泛的應用。對離散狀態的馬爾可夫鏈,其轉移概率是一個重要的工具。為了處理的方便,常常假設馬爾可夫鏈式齊次的。
一馬爾可夫鏈的轉移概率的確定
考慮齊次馬爾可夫鏈。如何根據樣本序列作出馬爾可夫鏈的一步轉移概率的估計呢?在實際問題中,有時,所研究的過程已有了一步轉移概率陣的估計,那么是否可以接受呢?這要根據樣本序列來得出結論,即檢驗假設:
假設由樣本序列得到轉移頻數矩陣其中,表示從狀態轉移到狀態的次數。由此,可以得到一步轉移概率的估計:這里,。
取檢驗統計量 這里。,若有某些項則在上述和式中去掉這些項。
可以證明:當成立時,服從自由度為的分布,其中,是矩陣中零元素的個數。當大時,自然傾向于拒絕,因為成立時,=,因而,也很小。在顯著水平下,假設的拒絕域由下式決定:
二 齊次性檢驗
設馬爾可夫鏈的狀態空間。
記,。為在第次過程的轉移中由狀態轉移的次數。由此得到第次過程的轉移中轉移頻數表格
的估計為這里,。
如果馬爾可夫鏈是齊次馬爾可夫鏈,那么,記其一步轉移概率為。
檢驗馬爾可夫鏈具有齊次性,就是要檢驗假設,。取檢驗統計量可以證明:當成立時,服從自由度為的分布。
將改寫成 當與接近時,傾向于接受,而此時近似于0,因而較小時,傾向于接受,由此得到的拒絕域由下式定出:
三 實證分析
某地區有三家商場A,B,C共同競爭市場的占有率。現在A,B兩店已陸續開展了以一些促銷方式,如給優惠券等。而C店為了搞清A,B兩家店的促銷是否有效,請人做市場調查,共選取300名顧客為調查對象,假設開始時每家店各有100名忠實的顧客,調查進行6周,前三周時未進行促銷活動,爾后三周是在有促銷的情況下進行的,現把調查得到的轉移頻數表格列出
首先,我們來研究A,B,C三家商場促銷前的市場占有率,我們先求出轉移頻數矩陣
用頻率來估計概率,就得到一步轉移概率陣由于中無零元素,所以由定理可以知道此馬爾可夫鏈式遍歷鏈,且極限分布可以通過解方程組得出所以得出A,B,C三家商場的市場占有率分別是37.2%,32.7%,30%。
然后,我們來研究A,B促銷后,三家商場的市場占有率的變化。促銷后的轉移頻數矩陣為: 進而得到轉移概率矩陣為:,所以由定理可以知道此馬爾可夫鏈是遍歷鏈,且極限分布可以通過解方程組得出所以得出A,B,C三家商場的市場占有率分別是28.3%,42.1%,29.6%。
最后,我們通過總的轉移頻數矩陣和總的轉移概率矩陣及五個轉移頻數調查表計算出
取顯著水平,由于
所以拒絕,即不能認為本例中的馬爾可夫鏈具有齊次性,因此認為A,B二店的促銷確實產生了效果。
參考文獻
[1]王梓坤.概率論基礎及其應用.北京:科學出版社,1976 185-187
[2]何迎暉 錢偉民.隨機過程簡明教程.同濟大學出版社,2004
[3]劉次華.隨機過程(第二版).華中科技大學出版社,2001
關鍵詞:6 Sigma質量統計技術;298軸承蓋;統計量
中圖分類號:F203 文獻標識碼:A 文章編號:1006-8937(2013)21-0013-02
在現場中,影響某一事物的因素往往是很多的,例如,對于多名職工在一臺設備上(或者一名職工在多臺同類設備上)加工一個配件時,同一個質量特性值的分布情況因系統誤差和隨機誤差的影響,應是不同的。但這只是定性地分析,無法準確地區分系統誤差和隨機誤差的影響。
利用6 Sigma質量統計技術中的方差分析方法,可對上述兩種情況進行定量地分析:不同的職工的加工水平或不同的設備的質量保證情況(即分析質量問題發生原因用的因果圖中的人、機、料、法、環、測中的“人”和“機”)。區分出隨機誤差和系統誤差(嚴格的數理統計基礎上的、一定的置信度下的數據),從而分別采取措施進行消除和控制,為質量改進提供理論依據。
1 方差分析的有關概念
主要有試驗指標、因素、水平等。試驗指標――在試驗中,我們將要考察的指標稱為試驗指標;影響試驗指標的條件,稱為因素(或因子);因素所處的狀態,稱為該因素的水平。
2 項目的選擇
針對產品軸承蓋(298)的13號CTQ尺寸,進行方差分析試點,具體的尺寸要求為:Φ342.9130-0.038,考慮用方差分析手段對三名職工在同一臺設備上加工的產品的質量狀況進行衡量,這里試驗指標為298軸承蓋13號CTQ尺寸的質量;因素為三名職工的加工水平;水平值為30。這是一個典型的單因素三水平試驗。
3 工作步驟
①數據搜集。要保證數據的獨立性和真實性,且在相對短的時間內。本例收集數據90件,每個水平下有30個數據。
②假設檢驗的原假設和備擇假設設定。主要是假定三個水平下,每個總體數據均為正態分布且方差相等情況下,三個職工加工的尺寸平均值相等,如H0:μ1=μ2=μ3;H1:μ1、μ2、μ3不全相等。
③計算假設檢驗的統計量F。根據原假設情況,分別求出所有數據的總離差平方和ST、組間平方和SA(即系統誤差)、組內平方和Se(即隨機誤差)。并分別求出各自的自由度④根據卡方分布和F分布理論,判斷統計量F是否落在拒絕域,進而判斷因子是否顯著,即三個職工加工的產品質量有否明顯的差異。
⑤參數估計。分別估算平均值和方差數據。
目的是運用質量統計技術進行一系列的計算,定量分析職工加工產品的質量狀況,變定性分析為定量分析,為質量改進提供一個有力的工具。
4 數據收集情況
表1中的數據分別是三個不同的操作者在同一臺車床上加工的軸承蓋298的13號CTQ尺寸值。
5 檢驗假設和統計量F:H0:μ1=μ2=μ3;H1:μ1、μ2、μ3不全相等
6 假設檢驗的拒絕域
根據原假設和相關統計理論知識,我們知道:當H0不真時,即加工水平有很大差異時,統計量分子有偏大的趨勢,而分母的分布與H0無關,其數學期望值E(Se/(n-r))總是σ2。因此,可知方差分析的拒絕域為:
10 結 論
統計量F的值沒有落在拒絕域,也就是說,原假設是正確的,三名職工加工的產品沒有顯著性差異。說明三個操作者的操作水平沒有明顯的差異,因為軸承蓋全部由數控車床加工,由人員引起的加工誤差不顯著,差異屬隨機(偶然)誤差,屬于質量控制的范疇,不屬于質量改進的范圍,也就是說,沒有必要進行工藝或質量改進。
通過以上6 Sigma質量統計技術的運用,統計計算結果和現場一直講的“數控設備質量保證能力強的觀點”是相吻合的,不同的是,平常人們講的為定性的分析和基于經驗得出的結果,而方差分析則用統計知識進行科學的分析計算,定量地對這個結果進行驗證。
這個結論的取得,應該和現場的情況非常吻合,也給6 Sigma應用小組增添了信心。這次分析的結果不同于職工在同一臺設備上加工,沒有顯著差異。下一步,應有針對性地分析同類設備上加工的產品,從而找出同類型設備的差異(即因素為設備)。設想是:設備與設備之間應該或多或少有系統的差異(當然,針對現場已經出現問題或者懷疑有問題的設備,找出差異值,可用于設備調整),也即找出具體的系統誤差值(SA),從而可以有效地避免,促進工藝和質量改進。