spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義



《spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義》由會員分享,可在線閱讀,更多相關(guān)《spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 spss 數(shù)據(jù)正態(tài)分布檢驗方法及意義判讀 要觀察某一屬性的一組數(shù)據(jù)是否符合正態(tài)分布,可以有兩種方法(目前我知道這兩種,并且這兩種方法只是直觀觀察,不是定量的正態(tài)分布檢驗): 1:在 spss 里的基本統(tǒng)計分析功能里的頻數(shù)統(tǒng)計功能里有對某個變量各個觀測值的頻數(shù)直方圖中可以選擇繪制正態(tài)曲線。具體如下: Analyze-----Descriptive S tatistics-----Frequencies ,打開頻數(shù)統(tǒng)計對話框,在 Statistics 里可以選擇獲得各種描述性的統(tǒng)計量,如:均值、方差、分位數(shù)、峰度、標準差等各種描述性統(tǒng)
2、 計量。在 Charts 里可以選擇顯示的圖形類型,其中 Histograms 選項為柱狀圖也就是我們說的直方圖,同時可以選擇是否繪制該組數(shù)據(jù)的正態(tài)曲線( With nor ma curve ),這樣我們可以直觀觀察該組數(shù)據(jù)是否大致符合正態(tài)分布。如下圖: 從上圖中可以看出,該組數(shù)據(jù)基本符合正態(tài)分布。 2 :正態(tài)分布的 Q-Q 圖:在 spss 里的基本統(tǒng)計
3、分析功能里的探索性分析里面可以通過觀察數(shù)據(jù)的 q-q 圖來判斷數(shù)據(jù)是否服從正態(tài)分布。 具體步驟如下: Analyze-----Descriptive Statistics-----Explore 打開對話框,選擇 Plots 選項,選擇 Normality plots with tests 選項,可以繪制該組數(shù)據(jù)的 q-q 圖。圖的橫坐標為改變量的觀測值,縱坐標為分位數(shù)。若該組數(shù)據(jù)服從正態(tài)分布,則圖中的點應(yīng)該靠近圖中直線。 縱坐標為分位數(shù),是根據(jù)分布函數(shù)公式 F(x)=i/n+1 得出的 .i 為把一組數(shù)從小到大排序后第 i 個數(shù)據(jù)的位置, n 為樣本容
4、量。若該數(shù)組服從正態(tài)分布則其 q-q 圖應(yīng) 該與理論的 q-q 圖(也就是圖中的直線)基本符合。對于理論的標準正態(tài)分布,其 q-q 圖為 y=x 直線。非標準正態(tài)分布的斜率為樣本標準差,截距為樣本均值。 如下圖: 如何在 spss中進行正態(tài)分布檢驗 1(轉(zhuǎn) )(2009-07-22 11:11:57) 標簽: 雜談
5、一、圖示法 1、 P-P 圖 以樣本的累計頻率作為橫坐標, 以安裝正態(tài)分布計算的相應(yīng)累計概率作為縱坐標, 把樣本值表現(xiàn)為直角坐標系中的散點。 如果資料服從整體分布, 則樣本點應(yīng)圍繞第一象限的對角線分布。 2、 Q-Q 圖 以樣本的分位數(shù)作為橫坐標, 以按照正態(tài)分布計算的相應(yīng)分位點作為縱坐標, 把樣本表現(xiàn)為指教坐標系的散點。 如果資料服從正態(tài)分布, 則樣本點應(yīng)該呈一條圍繞第一象限對角線的直線。 以上兩種方法以 Q-Q 圖為佳,效率較高。 3、直方圖 判斷方法:是否以鐘形分布,同時可以選擇輸出正態(tài)性曲線。 4、箱式圖 判斷方法:觀測離群值和
6、中位數(shù)。
5、莖葉圖
類似與直方圖,但實質(zhì)不同。
二、計算法
1、偏度系數(shù)( Skewness)和峰度系數(shù)( Kurtosis)
算公式:
g1 表示偏度, g2 表示峰度,通 算 g1 和 g2 及其 準 σ g1 及 σg2 然后作 U 。兩種 同 得出 U
7、方法 非參數(shù) 方法包括 Kolmogorov-Smirnov ( D )和 Shapiro- Wilk ( W 檢驗 )。 SAS中 定:當 本含量 n ≤ 2000 時 , 果以 Shapiro – Wilk (W 檢驗 ) 準 , 當 本含量 n >2000 時 , 果以 Kolmogorov – Smirnov( D 檢驗 ) 準。 SPSS中 定: (1)如果指定的是非整數(shù) 重, 在加 本大小位于 3 和 50 之 , 算 Shapiro-Wilk 量。 于無 重或整數(shù) 重, 在加 本大小位于 3 和 5000
8、 之 , 算 量。由此可 ,部分 SPSS教材里面關(guān)于“ Shapiro – Wilk 適用于 本 量 3-50 之 的數(shù)據(jù)”的 法是在是理解片面, 人子弟。 (2) 本 Kolmogorov-Smirnov 可用于 量(例如 income)是否 正 分布。 于此兩種 ,如果 P 大于 0.05,表明 料服從正 分布。 三、 SPSS操作示例 SPSS中有很多操作可以進行正態(tài)檢驗, 在此只介紹最主要和最全面最方便的 操作: 1、工具欄 --分析—描述性統(tǒng)計—探索性
9、 2、選擇要分析的變量,選入因變量框內(nèi),然后點選圖表,設(shè)置輸出莖葉圖 和直方圖,選擇輸出正態(tài)性檢驗圖表,注意顯示( Display)要選擇雙項( Both)。 3、 Output 結(jié)果 (1)Descriptives:描述中有峰度系數(shù)和偏度系數(shù),根據(jù)上述判斷標準,數(shù)據(jù)不符合正態(tài)分布。 Sk =0,Ku=0 時,分
10、布呈正態(tài), Sk>0時,分布呈正偏態(tài), Sk<0時,分布呈負偏 態(tài),時, Ku>0曲線比較陡峭, Ku<0時曲線比較平坦。由此可判斷本數(shù)據(jù)分布為正偏態(tài)(朝左偏),較陡峭。 (2)Tests of Normality:D 檢驗和 W 檢驗均顯示數(shù)據(jù)不服從正態(tài)分布, 當然在此,數(shù)據(jù)樣本量為 1000,應(yīng)以 W 檢驗為準。 (3)直方圖
11、 直方圖驗證了上述檢驗結(jié)果。 (4)此外還有莖葉圖、 P-P圖、 Q-Q 圖、箱式圖等輸出結(jié)果,不再贅述。結(jié)果同樣驗證數(shù)據(jù)不符合正態(tài)分布。 spss判斷兩組數(shù)據(jù)的相關(guān)性(已使用) (2009-07-22 13:07:34) 標簽: 雜談 兩組體重數(shù)據(jù):先要為數(shù)據(jù)分組 2.0 3000.0 2.0 3700.0 2.0 2900.0 2.0 3200.0 2.0 2
12、950.0 2.0 3100.0 2.0 700.0 2.0 3200.0 2.0 2500.0 2.0 3650.0 2.0 3450.0 2.0 4600.0 2.0 2700.0 2.0 2500.0 2.0 3150.0 2.0 3500.0 2.0 3800.0 2.0 2800.0 2.0 2400.0 2.0 3600.0 2.0 3200.0 2.0 1770.0 2.0 1450.0 2.0 1700.0 2.0 3250.0 2.
13、0 2700.0 2.0 3000.0 2.0 2250.0 2.0 2150.0 2.0 2450.0 2.0 1600.0 2.0 3100.0 2.0 4050.0 2.0 4250.0 2.0 2900.0 2.0 3250.0 2.0 3750.0 2.0 3500.0 2.0 4100.0 2.0 3100.0 2.0 2400.0 2.0 3250.0 2.0 2600.0 2.0 3100.0 2.0 3400.0 1.0 2400.0 1.0 2100
14、.0 1.0 3000.0 1.0 2600.0 1.0 4000.0 1.0 2200.0 1.0 1400.0 1.0 3000.0 1.0 3200.0 1.0 3600.0 1.0 2850.0 1.0 2850.0 1.0 3300.0 1.0 3500.0 1.0 3900.0 1.0 3250.0 1.0 3800.0 1.0 2800.0 1.0 3500.0 1.0 2650.0 1.0 2350.0 1.0 1400.0 1.0
15、2900.0 1.0 2550.0 1.0 2850.0 1.0 3300.0 1.0 2250.0 1.0 2500.0 使用命令: spss 的 t 檢驗: 菜單 Analyze->Compare Means->Independent-Samples T Test 運行結(jié)果: 經(jīng)方差齊性檢驗: F= 0.393 P=0.532 ,即兩方差齊。(因為 p 大于 0.05 ) 所以選用 t 檢驗的第一行方差齊情況下的 t 檢驗的結(jié)果 :就是選用方差假設(shè)奇的結(jié)果 所以, t=0.6
16、44 , p=0.522, 沒有顯著性差異。 (因為 p < 0.05 表示差異有顯著性)。 均值相差: 113.30159 解釋: 使用 compare means 里的 independent smaples T test, 果里的 Levene\s Test for Equality of Variances 就是 方差 性的 檢驗 , 如果 P 值 大于 0.05 是方差 , 量 F= S1^2/S^2 ~ F(n1-1,n2-1) , 著水平一般 0.05,0.01, 原假 H0:方差相等。
17、 方差分析 (Anaylsis of Variance, ANOVA) 要求各 方差整 ,不 一般 ,如果各 人數(shù)相若,就算未能通 方差整 , 也 不大。 One-Way ANOVA 方 中,點 Options ?( ? ) 按扭, 勾 Homogeneity-of-variance 即可。它會 生 Levene 、Cochran C 、Bartlett-Box F 等 及其 著性水平 P , 若 P 值<于 0.05 ,便拒 方差整 的假 。 一提, Cochran 和 B
18、artlett 定 非正 性相當敏感, 若出 「拒 方差整 」的 果,或因 原因而做成。 Statistics 菜 ->Compare Means->Independent-samples T Test.. 再看看 果中 p 的大小是否 <.05 ,若然即達 著水平。 SPSS學(xué)習(xí)筆記 描述樣本數(shù)據(jù) 一般的,一組數(shù)據(jù)拿出來, 需要先有一個整體認識。 除了我們平時最常用的集中趨勢外,還需要一些離散趨勢的數(shù)據(jù)。這方面 EXCEL就能一次性的給全了數(shù)據(jù),但對于 SPSS,就需要用多個工具了,感覺上
19、表格方面不如 EXCEL好用。 個人感覺,通過描述需要了解整體數(shù)據(jù)的集中趨勢和離散趨勢, 再借用各種圖觀察數(shù)據(jù)的分布形態(tài)。對于 SPSS提供的 OLAP cubes(在線分析處理表), Case Summary(觀察值摘要分析表), Descriptives (描述統(tǒng)計)不太常用,反喜歡 用 Frequencies (頻率分析), Basic Table (基本報表), Crosstabs (列聯(lián)表)這三個,另外再配合其它圖來觀察。這個可以根據(jù)個人喜好來選擇。 一.使用頻率分析( Frequencies )觀察數(shù)值的分布 。頻率分布圖與分析數(shù)據(jù)結(jié)合起來,可以更清楚的看到數(shù)據(jù)分
20、布的整體情況。 以自帶文件 Trends chapter 13.sav 為例,選擇 Analyze->Descriptive Statistics->Frequencies ,把 hstarts 選入 Variables ,取消在 Display Frequency table 前的勾,在 Chart 里面 histogram ,在 Statistics 選項中如圖 1 圖 1 分別選好均數(shù) (Mean),中位數(shù) (Median) ,眾數(shù) (Mode),總數(shù) (S
21、um),標準差 (Std. deviation) ,方差 (Variance) ,范圍 (range) ,最小值 (Minimum) ,最大值(Maximum),偏度系數(shù) (Skewness) ,峰度系數(shù) (Kutosis) ,按 Continue 返回,再按 OK,出現(xiàn)結(jié)果如圖 2 圖 2 表中,中位數(shù)與平均數(shù)接近,與眾數(shù)相差不大,分布良好。標準差大,即數(shù)據(jù)間的變化差異還還小。峰度和偏度
22、都接近 0,則數(shù)據(jù)基本接近于正態(tài)分布。下面圖 3 的頻率分布圖就更直觀的觀察到這樣的情況 圖 3 二.采用各種圖直觀觀察數(shù)據(jù)分布情況,如采用柱型圖觀察歸類的比例等。 同樣以自帶文件 Trends chapter 13.sav 為例,我們可以觀察一下各年的數(shù)據(jù)總和的對比: 1.選擇 Graph->Bar->Simple ,在“ Data in chart a
23、re ”一項選擇 Summaryof groups of cases ,然后按 Define ,出現(xiàn)圖 4, 圖 4 2. 選擇 Bars Represent->Other statistic(e.g. mean) ,把 hstarts 一項選入 Variable Statistic 里面,把 YEAR,Periodic 鍵,出現(xiàn)圖 5: 一項選入 Category Axis 項中,并按 Change 圖 5
24、 3.在 Statistic 選項中選 Sum of values 一項,按 Continue 返回,按 OK即可出現(xiàn)圖 6: 圖 6 從圖中可以非常直觀的看出 1965 年 -1975 年間,每年的總體數(shù)量對比和各數(shù)值 多少。 三.通過列聯(lián)表來觀察,數(shù)據(jù)的交錯關(guān)系。 以軟件自帶的文件 University of Florida graduate salaries.
25、sav 來說明 1、選擇 Tables->Basic Table ,在彈出對話框中,選擇 欄, College 到 Down ,Gender 到 Across 欄,如圖 7 Graduate 到 Summaries 圖 7 2、選擇 Statistics 按鍵,選取 Count 和 laye
26、r% 到 Cell Statistics 一欄,并 按 Continue 鍵,如圖 8 圖 8 三、選擇 Layout 按鍵,選擇 Summary Variable Labels->In separate labels (匯總的標簽,如本例的 Graduate ,放在表外), Statistics Labels->Across top (數(shù)據(jù)的標簽橫放在頂部
27、,如本例的 Count 和 Layer%),并在 Label groups with value labels only 前選擇打勾 ( 表示只需要具體的標簽名就可以,不需要匯總名,如本例 Gender 和 College) ,如圖 9 圖
28、 9 四、選擇 Total 按鍵,在 Totals over each group variable 出表會有增加匯總一欄,如圖 10 一項前選勾,則輸 圖 10 提示,需要什么表格形式可以根據(jù)要求來調(diào)整, 但對輸出按鍵都需要熟悉, 多嘗試幾次就可以看出不同的區(qū)別。圖 11 為輸出的表格
29、 圖 11 重要提示 :如果結(jié)果變成變量的匯總( SUM),則先選擇 Data->Weight Cases ,把 Graduate 的選項先選入 Weight Cases by 內(nèi),再選回 Do not weight Cases , 按 OK即可。對于其他帶有編號的一項都可以這樣做。這一點不知為何,本人屢次試過總需要這樣調(diào)整。參考圖 12
30、 圖 12 幾種常用的統(tǒng)計方法應(yīng)用 一般來說,最最常用的統(tǒng)計分析有假設(shè)檢驗和回歸分析,在 SPSS中也有很好的對應(yīng)工具來做這些分析, 但對其基本思路和要求都必須了解, 這樣才能更靈活的發(fā)揮。下面抄錄《 EXCEL在市場調(diào)查中的應(yīng)用》一書中關(guān)于這方面的內(nèi)容: 1.假設(shè)檢驗 目的:是用來 判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成 的統(tǒng)計推斷方法。 基本思想:小概率反證法思想。即 P<0.01 或 P<0.0
31、5 在一次試驗中基本不會生發(fā)。反證法思想是先提出假設(shè) (檢驗假設(shè) H0),再用適當?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如果可能性小, 則認為假設(shè)不成立, 否則,還不能認為假設(shè)不成立。方法: t 檢驗, u 檢驗,秩和檢驗,卡方檢驗
應(yīng)用條件: A、各組資料具有可比性
B、具正態(tài)分布
C、方差齊性(即先作 F 檢驗,如 F
32、差異 注 1,這樣可能更簡單一點 ) 。 基本思想:用組內(nèi)均方去除組間均方的商,即 F 值,與 1 比較,若 F 值接近 1,則說明各驗均數(shù)間的差異沒有統(tǒng)計學(xué)意義,否則表示有統(tǒng)計學(xué)意義。 應(yīng)用條件: A、各組資料具有可比性 B、具正態(tài)分布 C、方差齊性 (即 F 檢驗) 提示,在應(yīng)用 SPSS中,只要死死的記住一個顯著系數(shù) 0.05 就可以應(yīng)用(如果是雙尾系數(shù)需要除以 2),一般的大于 0.05 接受原假設(shè),小于 0.05 則拒絕。簡單的說,一般 結(jié)果拒絕就是說樣本有差異,樣本相對獨立 ,都是表示同一種意思,讀這方面書的時候,希望不要讓這些名詞混
33、亂了思路。 SPSS的方差檢驗中,需要注意下面問題: 方差檢驗中, Post Hoc 鍵有 LSD的選項:當方差分析 F 檢驗否定了原假設(shè),即認為至少有兩個總體的均值存在顯著性差異時, 須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行 多重比較來檢驗 。LSD即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。 2 Independent Samples 檢驗中的 Mann-Whitney U檢驗與 K Independent Samples 中的 Kruskal-Walllis (克魯斯卡爾—瓦里斯) H 檢驗法思想類似,常用來作為非參數(shù)檢驗。 2
34、 Related Samples 非參數(shù)檢驗中,一般有 Sign 普通符號檢驗法和 Wilcoxon 威 爾科克森符號秩檢驗法。前者用于研究的問題 只有兩個可能的結(jié)果 :“是”或“非”,并且二者遵從二項分布; 后者是普通符號檢驗法的改進, 除了可以檢驗是非外,還可以了解差異的大小。 K Related Samples 非參數(shù)檢驗中,主要有 Friedman 秩和檢驗與 Cochran Q 檢驗二種選擇,前者是對多個樣本是否來自同一總體的檢驗, 而后者是用于 只分為“成功”和“失敗”兩種結(jié)果的定類尺度 測量的數(shù)據(jù)。附錄: SPSS假設(shè)檢驗方法使用對照表
35、 圖 13 其中相關(guān)、配對或有交互作用可以理解為 EXCEL的重復(fù),獨立或無交互作用可以理解為 EXCEL中的無重復(fù)。圖 13 表大部分參考《數(shù)據(jù)分析與 SPSS應(yīng)用》一書,特別說明 3.回歸分析 目的:研究一個變量 Y 與其它若干變量 X 之間的一種數(shù)學(xué)工具。 它是一組試驗或 觀測數(shù)據(jù)的基礎(chǔ)上, 尋找被隨機性掩蓋的變量之間的依存關(guān)系 。 A.直線回歸方程 Yc=a bX B.回歸關(guān)系的檢驗:求回歸方程在總體中是否成立,即是否樣本代表的
36、總體也 有直線回歸關(guān)系。 a. 方差分析:基本思想是將總變異分解為 SS回歸和 SS乘余,然后利用 F 檢驗來判斷方程是否成立。 b. t 檢驗:基本思想是利用樣本回歸系數(shù) b 與總體平均數(shù)回歸系數(shù)進行比較來判斷回歸方程是否成立。 下面摘錄《數(shù)據(jù)分析與 SPSS應(yīng)用》一書關(guān)于相關(guān)回歸和時間序列分析一些概念解釋。 數(shù)據(jù)變量間主要存在二類關(guān)系: 一類是函數(shù)關(guān)系,一類是相關(guān)關(guān)系。 前者是變量間有確定關(guān)系,即一個變量的值能夠在其他變量取值確定的情況下, 按某種函數(shù)關(guān)系唯一確定; 后者是變量間雖然具有的聯(lián)系, 并非確定關(guān)系, 如價格與銷量量,價格高了,銷售
37、量可能會上去,但無法確定銷售量是多少。 通過散點圖來觀察, 如果點都集中在一條直線附近, 是線性相關(guān), 如果在一條曲線附近,則為非線性相關(guān)。 如果一個變量因另一個變量的增加而增加, 減少而減少,則二個變量間存在正相關(guān)關(guān)系,反之則為負相關(guān)關(guān)系。 極端的相關(guān)是完全相關(guān)和零相關(guān)。 如某地區(qū)購買自行車多少與購買大蒜多少無關(guān),是為零相關(guān)。 按我的理解,相關(guān)分析就是推斷變量與變量之間關(guān)系的密切程度, 回歸就是在相關(guān)的基礎(chǔ)上, 找出變量間的擬合模型, 從而進一步推測出未來的趨勢和變量。 而時間序列則是以時間的作為觀察的序列,來推斷變量間的關(guān)系的一種模型。 以自帶文件 Trends c
38、hapter 13.sav 為例,說明一下如何應(yīng)用這三種分析工具。1.相關(guān) 打開 Trends chapter 13.sav 文件,可以看到,這個文件的數(shù)據(jù)是以時間來排序的,在每個值前增加一行序列號變量,如圖 14 圖 14 一個時間序列的影響因素有四種變動: A長期趨勢( Secular Trend), B 季節(jié)變 動( Seasonal Variatio
39、n ), C循環(huán)變動( Cyclical Variation ), D 不規(guī)則變 動( Irregular Variation )。 我們可以觀察一下這些數(shù)據(jù)是否存在某種關(guān)系,打開 Graphs->Sequence,如圖 15 圖 15 把 hstarts 選入 Variables 項,把 No.選入 Time Axis Lables ,然后按 OK,出 現(xiàn)圖 16:
40、 圖 16 從圖可以看出,數(shù)據(jù)總是在一個周期內(nèi)反復(fù)在上下波動, 雖然高低的位置不一樣,但這種波動顯然是隨著時間的不同而變化。 因此可以察看,因變量與時間的關(guān)系如何。選擇 Data->Define Dates ,出現(xiàn)圖 17
41、 圖 17 在 Year 一欄填入 1965,Month 一欄填入 1,表示數(shù)據(jù)從 1965 年 1 月開始計算。 選擇 Analyze->Correlate->Bivariate ,出現(xiàn)圖 18 圖 18 把 hstarts ,Year 和 Month 都選入 Varibales 選項, Correlation Coe
42、fficients 選擇 Pearson 和 Spearman(其實只需要選 Spearman就可以,這里只是試一下,作為比較)。 注:相關(guān)檢驗中有 Pearson(皮爾森)相關(guān)系數(shù)和 Spearman(斯皮爾曼)等級相關(guān),前者也稱皮爾森相關(guān)系數(shù), 是對兩個定距變量 關(guān)系的刻畫; 后者是用來考察兩個變量中至少有 一個定序變量 時的相關(guān)關(guān)系。 Zero-order Correlations (零階偏聽偏相關(guān)系數(shù)) 是按 Pearson 簡單相關(guān)系數(shù)公式計算得到的相關(guān)系數(shù)。 在皮爾森系數(shù) r 是對兩個定距變量關(guān)系的刻畫 : 若 - 1≤r ≤1, |r| 越大,表明兩個變量之間
43、的相關(guān)程度越強。
若 0 44、tandard deviations Cross-product deviations
and covariances ,注意,這二個選擇是 Pearson 才有的,如果開始只選擇
Spearman,則此二項不能選。返回后,按 OK如圖 20:
圖 20
從圖 20 看到 Year 的 Pearson 系數(shù)為 0.219 ,Sig 值為 0.012 ,小于 P 45、 值 0.05 ,
與 Hstarts 顯著相關(guān), Month 的 Pearson 系數(shù)為 0.058 ,Sig 值為 0.506 ,大于 P
值 0.05 ,則與 Hstarts 不顯著相關(guān)。從下圖 21 的 Spearman也同樣得到相同的結(jié)論。
圖 21
2.回歸
試建立回歸模型,看能否形成各變量間的關(guān)系式。選擇 Analyze->Regression->Curve Estima 46、tion ,出現(xiàn)圖 22
圖 22
把 hatarts 選入 Dependents 選項,Independent 選擇 Time,Models 選擇(Linear )
線性回歸,(Quadratic )二次曲線回歸,(Cubic )三次曲線回歸,( Exponential )
指數(shù)回歸,選擇 Include constant in equation 表示方程式有常數(shù)項, Pl 47、ot
models 則表示用圖表示,然后按 OK,出現(xiàn)圖 23
圖 23
線性方程: Y=70.43 0.135X
二次曲線方程: Y=64.171 0.415X-0.02X 2
2 3
三次曲線方程: Y=87.68-1.667X 0.037X ( 0X )
指數(shù)曲線方程: Y=68.229xe0.002
從 Sig 值判斷,都小于 0.05 ,都接受回歸成立,這樣,只能從 R擬合度和 F 值較大來 48、判斷三次曲線方程的擬合程度比較高。
注意,如果方程成立的話, 想要增加預(yù)測, 則可以在 Save 選項中選擇 Predicted Values 一項,如果還想預(yù)測未來的數(shù)值, 則可以在原表上增加若干行 (如 1 行),然后選擇 Predict Cases 下面 Predict through ,在 Year 填入 1976,在 Month 填入 1,這樣就表示預(yù)測值到 1976 年的一月。如圖 24 所示。
49、
圖 24
注意,在 Independent 選擇 Time 和把 ID 選入結(jié)果一樣,則因為 ID 是以時間為序來排,所以結(jié)果一樣。
3.時間序列
因為 R 的似合度分別為 0.05 , 0.064 ,0.199 和 0.039 ,都比較低,方程的效果
不太好,如果要預(yù)測數(shù)值還是選擇時間序列比較合適,因為從剛才 Sequence的圖也可以觀察到,數(shù)據(jù)是以后的時間來波動的變化關(guān)系。
選擇 Analyze->Time Series->Exponential Smoothing ,出現(xiàn)圖 25
50、
圖 25
把 hstarts 選入 Variables 選項,并在 Model 選擇 Winters (注意,三種不同的
模型的選擇:簡單指數(shù)平滑適用于不包含長期趨勢和季節(jié)成分的數(shù)據(jù); Holt 方法適合于包含長期趨勢但不包含季節(jié)成分的數(shù)據(jù); Winters 方法適合于包含季節(jié)成分(以及長期趨勢)的數(shù)據(jù)。 EXCEL中只有簡單的指數(shù)回歸,與這里的絕不相
同,從這里也可以看到專業(yè)分析軟件的優(yōu)勢更具體更仔細),又按 51、Save 鍵,如
圖 26
圖 26
Predict Case 選項中選擇 Predict through ,并在 Year 欄填入 1976, month 填
入 6,這樣就可以得到 1976 年 1-6 月份的預(yù)測值( 注意,此處與上面的回歸不同,不需要增加 6 個 ID ,不然結(jié)果會顯示有缺失值 )。返回,按 Parameters 鍵,如圖 27
52、
圖 27
分別把 Alpha(截距項的平滑系數(shù)), Gamma(趨勢項的平滑系數(shù))和 Delta (季節(jié)指數(shù)的平滑系數(shù)),設(shè)為從 0 到 1 之間以步長 0.05 搜索最優(yōu)的參數(shù)值,其它選項采用默認值。返回按 OK,出現(xiàn)結(jié)果如圖 28:
圖 28
從圖可看到平滑指數(shù)分別是 Alpha =0.75 ,Gamma=0, Delta=0 ,而更重要的是,可以直接得到預(yù)測值, 53、如圖 29:
圖 29
除了 Fit 一項的預(yù)測外,可以得到 1976 年 1-6 月的預(yù)測結(jié)果。同時,可以通過 FIT 1 的預(yù)測情況與上面三次曲線回歸方程比較,采用平均絕對誤差、均方根誤差和平均絕對百分誤差的結(jié)果選擇更佳的答案。
與 EXCEL表現(xiàn)的比較和補充
這一點是針對像我這樣開始只懂得用 EXCEL的人來說。從個人的體會來說, 二種軟件有一定相似,操作都簡便,同時又有一些可以互補的地方。
一、圖型的表 54、現(xiàn)力是 SPSS的主要優(yōu)點之一
應(yīng)該說, EXCEL的圖型表現(xiàn)主要是簡便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn), SPSS就更為詳細和準確,這一點據(jù)說在所有統(tǒng)計軟件中都突出。因為大多的書里面都談到,這里從略。
二、通過 SPSS檢驗方差齊性和數(shù)據(jù)分布
假設(shè)檢驗中,采用的 t 檢驗和方差檢驗都需要滿足二個要求,即
1.樣本方差齊性
2.樣本總體呈正態(tài)分布
在 EXCEL中,提供了 F 檢驗來檢驗方差齊性問題。 也就是可以先通過 F 檢驗確定方差齊性與否來選擇下一步用哪個 T 檢驗或方差檢驗分析工具。 但只要數(shù)據(jù)多于二組則無從下手; 通過描述統(tǒng)計大約能從峰度 55、和偏度來了解樣本的分布 (實際工
作中,只要分布單峰且近似對稱分布,也可應(yīng)用 注 2),但要具體確定樣本的分布
也有難度。這二個問題在 SPSS就可以解決。
A、用 SPSS檢驗方差齊性
同樣以 University of Florida graduate salaries.sav 文件作為例子來檢驗性別數(shù)據(jù)是否方差齊性
a. 選擇 Analyze->Descriptive Statistics->Explore ,再選擇 Dependent List->Graduate ,F(xiàn)actor List->Gender , Display->Both ,如圖 30
56、
圖 30
b. 點擊 Plot 按鍵,在對話框里選擇 Boxplots->None ,Spread vs.Level with Levene Test->Untransformed ,在 Descriptive 選擇中取消 Stem-and-leaf 一項,如圖 31
圖 31
然后,按 OK鍵,結(jié)果如圖 32 顯示:
圖 3 57、2
圖 32 中可以看出 , 顯著值 sig 都大于 0.05 ,因此不能拒絕 H0 方差齊性的假設(shè),即數(shù)據(jù)的方差齊性。
提示,在 SPSS中,應(yīng)用 t 檢驗是不需要單獨檢驗方差齊性問題。結(jié)果中就有 Levene 檢驗的結(jié)果,從中就可以選擇方差分別作為相等與不等假設(shè)時的結(jié)果,如圖 33
圖 33
而在方差檢驗中, Option 的按鍵有一個 Homogeneity of Variance test 的按
鍵,選擇后,輸出就有方差齊性的檢 58、驗結(jié)果。
B、用 SPSS檢驗樣本總體的分布。
以軟件自帶文件 World 95 for Missing Values.sav 作為例子檢驗出生率的分布
是否服從正態(tài)
a. 選擇
Data->Weight Cases
,并把
Birth rate per 1000 people
選入
Weight
cases by
的選項,如圖
34
59、
圖 34
b. 選擇 Analyze->Nonparametric Tests-> 1 sample K-S,把 Birth rate per 1000 people 選入 test Variable List 選項, Test distribution 選 Normal,如圖 35
60、
圖 35
c. 按 OK可以看到結(jié)果如圖 20,兩側(cè)檢驗率為 0,則表示拒絕接受 Ho(數(shù)據(jù)整體服從正態(tài)分布)的假設(shè),數(shù)據(jù)分布不服從正態(tài)分布。
圖 36
提示,除了正態(tài)( Normal)外,還可以檢驗其它分布,只要在圖中選項中選擇 Uniform (均勻分布), Poisson (泊松分布), Exponential (指數(shù)分布)即可。當然,如果樣本過大,可 61、能 SPSS也會拒絕運算。
三、感覺在數(shù)據(jù)和表格處理上, EXCEL要強一點。像圖 11 中,想把男性和女性的
個數(shù)和個數(shù)百分比各自合為一列,結(jié)果不能做到。又如在運算方面, EXCEL就能直接在單元格上操作,而 SPSS則要下拉菜單,不但麻煩,而且觀察和調(diào)整的效果也不如 EXCEL理想。
四、作為專業(yè)的統(tǒng)計軟件, SPSS感覺比 EXCEL更豐富,也更準確, EXCEL也有自身方便性的優(yōu)點。 可以根據(jù)個人喜歡來選擇。 最后用毛炳寰先生的勸導(dǎo)來結(jié)束這篇東西:
1. 用自己熟悉,有把握的方法來做分析
2. 仔細處理初級數(shù)據(jù),所謂“ Garbage in , garbage out ”。
3. 引用的時候不需要全部都羅列出來,同時也不用刻意的去搞清楚每一項表示的內(nèi)容。(對這最后一個,本人有點保留,但也確實在這個探索過程令我沮喪,覺得還是忠言)
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高考政治一輪復(fù)習(xí):統(tǒng)編版選擇性必修1-3【共3冊重點知識點匯總】
- 2025年高考政治一輪復(fù)習(xí):七冊教材重點考點匯總
- 2025年高考生物一輪復(fù)習(xí):高中生物必修+選必修5冊教材重點知識點匯總
- 2025政府工作報告要點速覽發(fā)展總體要求和政策取向
- 《哪吒2》與DEEPSEEK年輕力量的崛起助力中國突破重圍
- 建設(shè)金融強國做好金融五篇大文章的指導(dǎo)意見
- 落實高質(zhì)量發(fā)展要求如期完成既定目標任務(wù)更新理念科學(xué)統(tǒng)籌切實增強規(guī)劃執(zhí)行的系統(tǒng)性整體性協(xié)同性
- 如何成為一名暖護暖護的概念與職責
- 藥品儲存與養(yǎng)護醫(yī)療護理藥品儲存藥品養(yǎng)護藥品常識
- 手術(shù)室職業(yè)暴露與防護診療護理等過程中被患者血液體液等污染自身皮膚或黏膜導(dǎo)致的感染
- XX企業(yè)中層管理者領(lǐng)導(dǎo)力提升培訓(xùn)課程
- 醫(yī)院新員工入職培訓(xùn)醫(yī)院新員工必備主要職業(yè)意識醫(yī)院新員工必備工作觀
- 人工智能技術(shù)介紹人工智能DeepSeek人工智能的未來展望與發(fā)展
- 養(yǎng)娃要有松弛感家庭教育讓孩子在具有松弛感的家庭里慢慢成長
- 醫(yī)院新員工入職培訓(xùn)醫(yī)院新員工必備主要職業(yè)意識