SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。 卡方檢驗是一種常用的非參數(shù)檢驗方法,其統(tǒng)計的是樣本的實際觀測值與理論推斷值之間的偏離程度,卡方值越大,二者偏差程度越大;反之,二者偏差程度越小,可用于檢驗數(shù)值是否符合分布規(guī)律、檢驗因素的影響是否有差異等。
IBM SPSS Statistics非參數(shù)檢驗中的卡方檢驗,比較的是變量中的實際觀測頻率和期望的頻率的差異。本文將以檢驗數(shù)值是否符合均勻分布為例,演示IBM SPSS Statistics卡方檢驗方法的使用。
一、打開數(shù)據(jù)文件
如圖1所示,打開一組擲骰子的數(shù)據(jù),其中包含了擲骰子次數(shù)、點數(shù)兩個變量。擲骰子的結(jié)果數(shù)據(jù)是一個典型的均勻分布數(shù)據(jù),骰子出現(xiàn)1-6點數(shù)的概率是相等的。

圖1:擲骰子數(shù)據(jù)
二、應(yīng)用卡方檢驗
接著,如圖2所示,打開IBM SPSS Statistics的分析菜單,并選擇其非參數(shù)檢驗中的“卡方檢驗”。

圖2:非參數(shù)檢驗之卡方檢驗
如圖3所示,設(shè)置面板中包含了檢驗變量列表、期望范圍、期望值等選項。接下來,使用示例數(shù)據(jù)演示卡方檢驗的操作。

圖3:卡方檢驗設(shè)置面板
1、選擇變量
我們先簡單了解一下卡方檢驗中的選項含義:
1. 檢驗變量列表,即用于檢驗的變量。
2. 期望范圍,用于設(shè)置卡方檢驗的數(shù)據(jù)范圍,默認(rèn)選擇“從數(shù)據(jù)中獲取”,即使用數(shù)據(jù)中的最大值和最小值作為期望范圍;如需“使用指定范圍”,需手動設(shè)置范圍。
3. 期望值,用于設(shè)置數(shù)據(jù)中各分類所占的比例,默認(rèn)選擇“所有類別相等”,即檢驗數(shù)據(jù)是否服從均勻分布;選擇“值”,則檢驗數(shù)據(jù)是否服從設(shè)定的分布規(guī)律,需輸入指定分組的值。
本例中,我們需要檢驗的是擲骰子的結(jié)果是否服從均勻分布,因此,需將“點數(shù)”添加為檢驗變量列表,并設(shè)置“從數(shù)據(jù)中獲取”的期望范圍,以及“所有類別相等”的期望值。

圖4:變量設(shè)置
2、設(shè)置精確檢驗
由于卡方檢驗屬于非參數(shù)檢驗,需要進行精確檢驗設(shè)置。一般情況下,選擇“僅漸進法(適用于較大樣本或服從漸進分布的數(shù)據(jù))”,如果數(shù)據(jù)不符合漸進分布,則要選擇蒙特卡洛法。

圖5:設(shè)置精確檢驗
3、設(shè)置選項
接著,進行選項設(shè)置,如圖6所示,選取描述統(tǒng)計,獲取數(shù)據(jù)的頻率分析數(shù)值,幫助解讀數(shù)據(jù)結(jié)果。

圖6:設(shè)置選項
4、分析結(jié)果解讀
完成以上設(shè)置后,運行卡方檢驗。
首先,如圖7所示,從頻率表可以看到,各個點數(shù)的出現(xiàn)概率幾乎相同,其期望個案值為16.7。
接著,分析檢驗統(tǒng)計數(shù)據(jù),其漸近顯著性為1,表明檢驗結(jié)果不顯著,不能拒絕假設(shè)。由于本例檢驗所用的原假設(shè)是數(shù)據(jù)的分布與均勻分布無差異,檢驗結(jié)果不顯著,無法拒絕原假設(shè),也就是數(shù)據(jù)服從均勻分布。

圖7:結(jié)果不顯著
綜上所述,通過運用IBM SPSS Statistics的卡方檢驗,并設(shè)定的所有類別相等的期望,可檢驗數(shù)據(jù)是否服從均勻分布。
另外,卡方檢驗除了可用于檢驗均勻分布外,還可以通過設(shè)定交叉表進行列聯(lián)表分析,來探索變量間的相關(guān)關(guān)系。
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |