計量地理學(xué)第三章統(tǒng)計分析方法2回歸分析.ppt
《計量地理學(xué)第三章統(tǒng)計分析方法2回歸分析.ppt》由會員分享,可在線閱讀,更多相關(guān)《計量地理學(xué)第三章統(tǒng)計分析方法2回歸分析.ppt(67頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第三章 統(tǒng)計分析方法,,,1 地理要素間的相關(guān)分析 2 地理要素間的回歸分析 3 時間序列分析法 4 系統(tǒng)聚類分析方法 5 主成分分析方法 6 馬爾可夫預(yù)測方法 7 地理系統(tǒng)的空間趨勢面分析,2 地理要素間的回歸分析,地理回歸分析的意義和作用 一元地理回歸模型的建立 多元地理回歸模型的建立,一、地理回歸分析的意義和作用,相關(guān)分析揭示了地理要素之間相互關(guān)系的密切程度。若能在某些難測難控的要素與其他易測易控的要素之間建立一種近似的函數(shù)表達(dá)式,可以比較容易地通過那些易測易控要素的變化情況,了解那些難測難控要素的變化情況 回歸分析方法,是研究要素之間具體的數(shù)量關(guān)系的強(qiáng)有力的工具,運用這種方法能夠建立反映地理要素之間具體的數(shù)量關(guān)系的數(shù)學(xué)模型,即回歸模型,,回歸分析 就是對具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個合適的數(shù)學(xué)模式,用來近似地表達(dá)要素間平均變化關(guān)系。這個數(shù)學(xué)模式稱為回歸模型(回歸方程),回歸分析與相關(guān)分析的區(qū)別與聯(lián)系 研究對象和內(nèi)容上: a.相關(guān)分析主要是研究要素(變量)之間是否存在關(guān)系和關(guān)系的密切程度,沒有自變量與因變量之分 b.回歸分析主要是研究要素之間聯(lián)系的形態(tài)、確定要素之間關(guān)系的方程式,即回歸方程,可用于對未來進(jìn)行預(yù)測,對某些要素進(jìn)行控制?;貧w分析有自變量與因變量之分。回歸分析尚有地理預(yù)測的性質(zhì) 從相關(guān)可以獲得回歸的一些重要信息,反之從回歸也能獲得相關(guān)的一些重要信息。故它們之間是緊密相連的兩個概念,,回歸分析的主要內(nèi)容 從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學(xué)表達(dá)式,即回歸模型 根據(jù)一個或幾個要素(自變量)的值來預(yù)測或控制另一個要素(因變量)的取值 從某一地理過程中的許多要素中,找出哪些要素(變量)是主要的,哪些要素是次要的,這些要素之間又有些什么關(guān)系 回歸分析的分類 一元地理回歸模型和多元地理回歸模型,,二、一元地理回歸模型的建立,(一)一元地理回歸模型類型的判斷方法 作圖法 差分法 曲度法 計算器法等,作圖法,若將地理要素(x,y)的數(shù)據(jù)點繪在普通方格紙上,散點圖呈直線,則一元地理回歸模型為直線型,,若將地理要素(x,y)的數(shù)據(jù)點繪在雙對數(shù)格紙上,散點圖呈直線,則一元地理回歸模型為冪函數(shù)型,,若將地理要素(x,y)的數(shù)據(jù)點繪在單對數(shù)格紙上,而其橫坐標(biāo)取對數(shù)分格,其縱坐標(biāo)為普通分格時呈直線,則一元地理回歸模型為對數(shù)函數(shù)型,,若將地理要素(x,y)的數(shù)據(jù)點繪在單對數(shù)格紙上,而其橫坐標(biāo)為普通分格,其縱坐標(biāo)取對數(shù)分格時呈直線,則一元地理回歸模型為指數(shù)函數(shù)型,(二)一元線性地理回歸模型的建立,假設(shè)有兩個地理要素(變量)x和y,x為自變量,y為因變量。則一元線性回歸模型的基本結(jié)構(gòu)形式為:,A、B為選定參數(shù) α=1,2,…,n為n組觀測數(shù)據(jù)(x1,y1), (x2,y2), … (xn,yn) εα為隨機(jī)變量,設(shè)a、b分別為參數(shù)A和B的最小二乘估計值,于是便得到一元線性回歸模型。它是代表x與y之間關(guān)系的最佳擬合直線,通常稱為回歸直線,a為常數(shù),它就是y的截距 b為回歸系數(shù),也就是直線的斜率,它表示在x中變更一個單位則在y中變更b個單位 b0,表示要素一齊增加或一齊減小 b0,表示一個要素增加而另一個則要減小 b值的大小,反映了變化率的大小 是y的估計值,亦稱回歸值。,1、參數(shù)a和b的最小二乘估計,實際觀測值yi與回歸值^yi之差ei=yi- ^yi ,刻畫了yi與^yi的偏離程度,即表示實測值與回歸估計值之間的誤差大小。參數(shù)a與b的最小二乘擬合原則要求yi與^yi的誤差ei的平方和達(dá)到最小,即,根據(jù)取極值的必要條件,要使Q取最小值,必須使Q對a、b的一階偏導(dǎo)數(shù)分別等于零,即,,整理后可得,此方程通常稱為正規(guī)方程組。又可寫成矩陣形式,,解此方程組,即可得到,,2、一元線性回歸模型的具體建立方法與步驟,將計算表中的相應(yīng)數(shù)值代入?yún)?shù)計算公式得到a、b,,3、一元線性地理回歸模型的效果檢驗,回歸模型的估計誤差 回歸模型的顯著性檢驗,(1)回歸模型的估計誤差,標(biāo)準(zhǔn)估計誤差是一個非常重要的量,由于它的單位和y的單位相同,所以在實際地理問題中便于比較和檢驗,只要比較S與允許的偏差就行了,因此,它是檢驗回歸效果的極其重要的標(biāo)志,同時也是衡量地理預(yù)測精度的指標(biāo),(2)回歸模型的顯著性檢驗(F檢驗法),在回歸分析中,y的n次觀測值y1,y2,…,yn之間的差異,可以用觀測值yi與其算術(shù)平均值的離差平方和來表示,它稱為總的離差平方和,,Q是所有觀測點yi離回歸直線的殘差平方和,它表示除x對y的線性影響以外的一切因素對y的變異影響,故稱為剩余平方和(殘差平方和) U反映了在y的總變差中由x與y的線性關(guān)系而引起y的變化部分,稱為回歸平方和,一個回歸效果的好壞取決于U和Q的大小,或者說取決于U在總平方和lyy中所占的比例U/lyy的大小,這個比值越大,回歸效果越好;反之,則回歸效果越不好,,統(tǒng)計量F F越大,模型的效果越佳。統(tǒng)計量F~F(1,n-2)。在顯著水平α下,若FFα,則認(rèn)為回歸方程效果在此水平下顯著。一般地,當(dāng)FF0.10(1,n-2)時,則認(rèn)為方程效果不明顯。,,方差分析表 (以北京市氣溫與地溫關(guān)系為例),(三)一元非線性回歸模型的建立,選配曲線的方法 根據(jù)理論分析、過去的經(jīng)驗或觀測數(shù)據(jù)的分布趨勢與特點,來確定兩個要素之間的曲線類型及其函數(shù)形式,從而求非線性地理回歸模型的過程及其方法叫做曲線選配,,地理上常見的非線性回歸模型的建立方法 冪函數(shù)型 y=axb 對上式兩邊取常用對數(shù)或自然對數(shù) Lny=Lna+bLnx或Y=A+bX,,指數(shù)函數(shù)型 兩個地理要素(變量)之間的指數(shù)函數(shù)表達(dá)式為 Y=aebx或y=ae-bx,y=abx 兩邊取常用對數(shù)或自然對數(shù),則得 Lny=Lna+bx或Y=A+bx,,對數(shù)函數(shù)型 y=a+bLnx 則y=a+bX,非線性關(guān)系線性化的幾種情況 對于指數(shù)曲線 ,令 , 可以將其轉(zhuǎn)化為直線形式: , 其中, ; 對于對數(shù)曲線 ,令 , ,可以將其轉(zhuǎn)化為直線形式: ; 對于冪函數(shù)曲線 ,令 , ,可以將其轉(zhuǎn)化為直線形式: 其中, ;,非線性回歸模型,對于雙曲線 ,令 ,轉(zhuǎn)化為直線形式: ; 對于S型曲線 ,可 轉(zhuǎn)化為直線形式: ; 對于冪乘積 ,只要令 ,就可以將其轉(zhuǎn)化為線性形式 其中, ;,對于對數(shù)函數(shù)和 只要令 ,就可以將其化為線性形式 例:表3.2.1給出了某地區(qū)林地景觀斑塊面積(area)與周長(perimeter)的數(shù)據(jù)。下面我們建立林地景觀斑塊面積A與周長P之間的非線性回歸模型 。,表3.2.1 某地區(qū)各個林地景觀斑塊面積(m2)與周長(m),解:(1)作變量替換,令: , ,將表3.2.1中的原始數(shù)據(jù)進(jìn)行對數(shù)變換,變換后得到的各新變量對應(yīng)的觀測數(shù)據(jù)如表3.2.2所示。,表3.2.2 經(jīng)對數(shù)變換后的數(shù)據(jù),,(2) 以x為橫坐標(biāo)、y為縱坐標(biāo),在平面直角坐標(biāo)系中作出散點圖。很明顯,y與x呈線性關(guān)系。,圖3.2.2 林地景觀斑塊面積(A)與周長(P) 之間的雙對數(shù)關(guān)系,(3)根據(jù)所得表中的數(shù)據(jù),運用建立線性回歸模型的方法,建立y與x之間的線性回歸模型,得到 對應(yīng)于(3.2.19)式,x與y的相關(guān)系數(shù)高 達(dá) =0.966 5。 (4)將(3.2.19)還原成雙對數(shù)曲線,即,(3.2.19),(3.2.20),一元非線性回歸模型的效果檢驗,相關(guān)指數(shù)R2 Q是剩余平方和,lyy是總平方和 相關(guān)指數(shù)的平方根也可稱為相關(guān)系數(shù) 相關(guān)指數(shù)越大,表明選配的回歸曲線效果越好,剩余標(biāo)準(zhǔn)差越小,其回歸模型的預(yù)測精度就越高,一元線性回歸模型內(nèi)容復(fù)習(xí),模型的基本形式 模型參數(shù)的確定 效果檢驗,,,三、多元地理回歸模型的建立,(一)多要素線性地理回歸模型的建立 1、方法 設(shè)某一要素y受k個要素x1,x2,…,xk的影響,其內(nèi)在聯(lián)系是線性關(guān)系,通過N組觀測,得到一組地理數(shù)據(jù)為(y;xα1,xα2,…,xαn ),α=1,2,…,n。設(shè)其數(shù)學(xué)結(jié)構(gòu)模型為 β0,β1,…,βk為待定參數(shù),εα為隨機(jī)變量,,為了估計β,仍采用最小二乘法,則得回歸模型為 式中,b0為常數(shù)項,b1,b2,…,bk為偏回歸系數(shù),參數(shù)的確定過程,依最小二乘法原理,,將上式分別對b0,b1,…,bk求偏導(dǎo)數(shù),并令其等于零,方程組(3.2.15)式稱為正規(guī)方程組。 引入矩陣,(3.2.15),,則正規(guī)方程組(3.2.15)式可以進(jìn)一步寫成矩陣形式,求解得 引入記號,(3.2.16),正規(guī)方程組也可以寫成,例如,某一國家某一經(jīng)濟(jì)區(qū)內(nèi)木材生產(chǎn)指數(shù)y(以1955年為100)受該區(qū)森林蓄積量指數(shù)x1、木材價格指數(shù)x2和運輸距離指數(shù)x3的影響,如表5-10所示,試建立三元線性回歸模型,并檢驗其有無實際意義,原始數(shù)據(jù)表,,設(shè)所求的線性回歸模型為,,,,其正規(guī)方程組可寫成 及,,,,,,根據(jù)原始數(shù)據(jù)計算后得到正規(guī)方程組 解此方程得出參數(shù)值,從而得到趨勢面方程,,,,,2、回歸模型的顯著性檢驗,① 回歸平方和U與剩余平方和Q: ② 回歸平方和 ③ 剩余平方和為 ④ F統(tǒng)計量為 計算出來F之后,可以查F分布表對模型進(jìn)行顯著性檢驗。,,2、多元線性回歸模型的顯著性檢驗,,若F0.10(k,n-k-1)≤F≤ F0.05(k,n-k-1),則反映線性回歸在0.10水平上顯著,并在F值右上角打上一個星號“(*)” 若F F0.10(k,n-k-1),則稱線性回歸不顯著,它表示y與k個自變量的線性關(guān)系不密切,,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計量 地理學(xué) 第三 統(tǒng)計分析 方法 回歸 分析
鏈接地址:http://zhongcaozhi.com.cn/p-2882928.html