《回歸分析2回歸方程的檢驗.ppt》由會員分享,可在線閱讀,更多相關《回歸分析2回歸方程的檢驗.ppt(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 2.4 回歸方程的顯著性檢驗及精度估計,,,,,,,,回歸方程的顯著性檢驗 原因:雜亂無序,無相關關系的散點也可以擬合成一條直線或曲線,但無意義。 內(nèi)容:回歸方程擬合度的檢驗 回歸方程線性關系顯著性檢驗 回歸變量的顯著性檢驗, 2.4 回歸方程的顯著性檢驗及精度估計,在解決工程實際問題時,一般說來,事先并不能斷言 與 間一定具有線性關系。因此,當我們按線性回歸模型來處理后,所得到的 關于 的線性回歸方程是否能代表實際問題呢?這就是統(tǒng)計上常說的假設檢驗問題,即要檢驗線性回歸方程是否有顯著意義。如果顯著,我們就可以用線性回歸模型代表實際問題,否則該模型不能代表實際問題。,,,
2、,,,,,模型合適嗎?,此外,在檢驗得知線性回歸方程是顯著之后,我們還可以進一步判斷在線性回歸方程中,哪些變量 是影響 的重要變量,哪些變量是不重要變量,由此分析可對回歸方程作更進一步簡化,從而得到最優(yōu)回歸方程。這就是所謂的對每個變量 要進行顯著性檢驗問題。, 2.4 回歸方程的顯著性檢驗及精度估計,設 是已求得的回歸方程。 是第 個試驗點 代入回歸方程所求的回歸值。 這里稱試驗值(觀察值) 與其平均值 的離差平方和為總離差平方和。記為,,,,,,,,,,,, 2.4 回歸方程的顯著性檢驗方差分析, 2.4 回歸方程的顯著性檢驗方差分
3、析,,,,,,,這里 作為樣本函數(shù)即統(tǒng)計量,其自由度為 。如果觀測值給定, 是確定的?,F(xiàn)將 進行分解。, 2.4 回歸方程的顯著性檢驗方差分析,其中, ,事實上,由式(2.8) 可知, 2.4 回歸方程的顯著性檢驗方差分析,又由式(2.5)知,上式最后等式右端每一項 均等于0,于是 因此 式(2.12)中,記 稱為回歸平 方和。,,,(2.12),,,,, 2.4 回歸方程的顯著性檢驗方差分析,它反映了自變量 的變化所引起的對 的波動。其自由度為 。 式(2.12)中,記 稱為 剩余平方和(或殘差平方和),它是由試驗誤差以及其他因素引起的。它的
4、大小反映了試驗誤差及其他因素對試驗結(jié)果的影響程度,其自由度為 。, 2.4 回歸方程的顯著性檢驗方差分析,于是 由式(2.13),我們可對所建立的回歸方程能否 代表實際問題作一個判斷。這是因為在式(2.13) 中,當 確定時, 越小, 越大,則 就越 接近 。于是,我們可用 是否趨近于1來判斷回 歸方程的回歸效果好壞。,,,,,,(2.13),,,,,,, 2.4 回歸方程的顯著性檢驗方差分析,由式(2.13) 定義 為復相關系數(shù),顯然 。 越接近1,回歸效果就越好。,,,,,,, 2.4 回歸方程的顯著性檢驗方差分析,然而在實際工程計算中,當實驗樣本點較 小時,計算出
5、的一般都較接近1,這給我們 判斷所建的回歸方程的回歸效果是否顯著 帶來麻煩,因此在實際計算中應注意變量 個數(shù)與樣本個數(shù)的適當比例,一般認為樣本個數(shù)至少應是變量個數(shù)的5到10倍。, 2.4 回歸方程的顯著性檢驗方差分析,由于在解決實際問題時,我們往往不能事先斷言變量 與變量 之間是否確有線性關系,在建立數(shù)學模型時,往往是先假定實際問題可能具有線性性,由此建立起線性回歸模型。顯然在這樣的假設前提下所建立起的線性回歸模型到底能否代表實際問題,或者通俗地說所建立的線性回歸方程能否用于實際問題,需要判定(檢驗),該如何檢驗呢?這是統(tǒng)計學中假設檢驗問題。,,,,,,, 2.4 回歸方程的顯著性檢驗F
6、檢驗,我們是這樣考慮的,如果線性回歸模型能代表實際問題(也就是線性回歸模型顯著),我們可以認為線性回歸模型的系數(shù) 不全為零;如果線性回歸模型不顯著,我們認為線性模型系數(shù) 全為零。于是按統(tǒng)計假設檢驗原則提出假設:,為此應用統(tǒng)計量,不全為零,( ), 2.4 回歸方程的顯著性檢驗F檢驗,對于給定檢驗水平 ,查 分布表可得臨界 值 ,并由 檢驗,作出如下判斷: 如果由統(tǒng)計量 計算所得的數(shù)值有 ,則表示在檢驗水平下,拒絕 ,從而認為線性回歸模型有顯著意義,即線性回歸模型能代表實際問題,工程中可大膽使用該模型。 如果 ,則在檢驗水平 下,接受 ,即認為線性回
7、歸模型不顯著,即線性回歸模型不能代表實際問題,該模型在工程實際問題中不能使用。,,,,,,,,,,,,,,, 2.4 回歸方程的顯著性檢驗F檢驗,在多元線性回歸模型中,我們并不滿足于線 性回歸方程是顯著的這個結(jié)論。因為回歸方程顯 著并不意味著每個自變量 對因變量 的影響都重要,也就是并不能說這 個變量在模 型中都重要。換句話說模型中 個自變量中有重 要的,也有不重要的自變量,一種自然的想法就 是在模型中保留重要變量,剔除不重要或者可有 可無的變量,按照這種思想來建立模型,實際上 是對原線性回歸模型進行精簡。,,,,,,,,,,,,,, 2.4 回歸方程的顯著性檢驗F檢驗,具體操作該如何
8、進行呢?我們是這樣考慮的,如果某個自變量 對 的作用不顯著,也就是說 對 不重要(或可有可無),則認為它前面的系數(shù) 應取零值,因此檢驗自變量 是否顯著(重要),就是等價于檢驗假設 為此,應用統(tǒng)計量,, 2.4 回歸方程的顯著性檢驗F檢驗,其中, 為式(2.10)中 的對角線上 第 個元素。 對于給定的檢驗水平 ,查 分布表可得臨界值 ,并由 檢驗作出如下判斷:如果由統(tǒng) 計量 計算所得的數(shù)值 則拒絕 ,即認為 對 是重要變量,應留在模型中; 如果 ,則在水平 之下接受 ,認 為 對 不重要,可從模型中剔除。 一般一次 檢驗只剔除一個自變量,且這個自變量
9、 是所有不顯著自變量中 值最小值,然后再建立回歸模 型,并繼續(xù)進行檢驗,直到建立的回歸模型及各個自變 量均顯著為止。,,,,,,,,,,,,,,,,,,,,, 2.4 回歸方程的顯著性檢驗F檢驗,2.5 線性回歸模型預測精度估計,通過對模型及變量的顯著性檢驗后,我們可用所建立的回歸模型進行預測或控制。但用模型進行預測,所得結(jié)果的精度如何?即真值(實際值)與模型預測值的誤差有多大?這是我們關心的問題,應該作出估計,為此給出剩余標準差 式中, 為進入回歸模型的變量個數(shù)。,,,,,,,,,,,,由統(tǒng)計學區(qū)間估計理論知,在隨機變量服從正態(tài)分布情況下,任一給定的自變量值 ,所對應因變量 的真值
10、 ,以95的概率落在區(qū)間 是 的回歸值,即預測值 與真值 之差有95%的概率,使得 ,所以 越小其預測精度就越高。,2.5 線性回歸模型預測精度估計,,YYX代入由B為回歸系數(shù)的方程后得到的因變量矩陣; U回歸平方和; Q剩余平方和; R復相關系數(shù); FF檢驗值,即回歸方差與剩余方差之比; SS剩余標準差; Y1,Y2,Y3,f1,f2中間變量。,,2Matlab函數(shù): inv()矩陣求逆; mean()求均值; sum()求和; sqrtm()開方。,,2.4.2 程序(略) 2.4.3 例題 例2.2 平爐煉鋼過程的熔化期中,總的去碳量 與所加的兩種礦料(天然礦石
11、與燒結(jié)礦料)的量 , 及熔化時間 有關,熔化時間愈長則去碳量愈多。經(jīng)實測某平爐的49組數(shù)據(jù)見表2.2,求 對 、 、 的線性回歸方程。,表2.2 平爐煉鋼過程的數(shù)據(jù),,,,,,,,,,,,,,,,,,,,,,,,,,,,預測,建立回歸模型,解 打開數(shù)據(jù)文件dd2data.mat,將因變量數(shù)據(jù)錄入一維數(shù)據(jù)矩陣Y1n中, 將自變量數(shù)據(jù)錄入mn維數(shù)據(jù)矩陣Xmn中,本題中自變量數(shù)m=3,樣本容 量n=49。執(zhí)行程序如下: load dd1data dd1(X,Y,3,49),,,,計算機運行結(jié)果如下: B = %回歸方程系數(shù) 0.9838 0.1644 0.1173 0.0279,U = %回歸平方和 14.2843 Q = %剩余平方和 30.8513 R = %復相關系數(shù) 0 .5843 F = % F檢驗值 6.9451 SS = %剩余標準差 0.8280 所以,回歸方程為: Y=0.9838+0.1644 +0.1173 +0.0279,,,,,,,,,,,