多種類型的回歸模型



《多種類型的回歸模型》由會員分享,可在線閱讀,更多相關(guān)《多種類型的回歸模型(21頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、數(shù)學(xué)建模第二次作業(yè) 例一:(線性模型) 針葉松數(shù)據(jù)該數(shù)據(jù)包含70棵針葉松的測量數(shù)據(jù),其中y表示體積(單位立方英 尺), X為樹的直徑(單位:英寸), 1 x2為樹的高度(單位: 英尺)。 No. 1 2 3 4 ^5 ??? 69 70 _X1_ 4.6 4.4 5.0 5.1 5.1 … 19.4 23.4 _X2- 33 38 40 49 37 … 94 104 y 2.2 2.0 3.0 4.3 3.0 … 107.0 163.5 解答: (1)問題分析: 首先根據(jù)這組數(shù)據(jù)做自變量與因變量之間的關(guān)系圖
2、,如圖1.1。由圖可知y隨 x「x2的增加而增加,從而可大致判斷y與%,x2呈線性關(guān)系。判斷是線性回歸 模型后進(jìn)行細(xì)節(jié)的量綱分析,得出具體模型,從而利用已知的線性模型,借助R 軟件求解出估計(jì)量、,P 1,P 2的值得出最終結(jié)果。 圖1.1 (2) 模型基礎(chǔ) 設(shè)變量Y與變量X],X2,…,XP間有線性關(guān)系 Y= p + p X + p X + ... + p X + £ 0 1 1 2 2 P P 其中£?N (0, b 2 )也,p1,...,pp和b 2是未知參數(shù),p > 2,稱上述模型為多元線 性回歸模型,則模型可以表示為: y = p+ p x + ... + p x
3、 + £ , 1 = 1,2,...,n 1 0 1 i1 p ip 1 其中£. 1 即令 N (, b 2),且獨(dú)立分布 y — * 1 y :2 ,p = [p 01 pl , X — [1 1 : x 11 x 21 : x 12 x 22 : ??? ??? x 1p x 2p , 8 = 8 1 8 :2 y L 口」 p L p」 1 x n1 x n2 ??? x np 8 n 則多元線性回歸模型可表示為 Y = XP + 8 ,
4、其中Y是由響應(yīng)變量構(gòu)成的n維向量,X是nx (p+1)階設(shè)計(jì)矩陣,P是p+1維 向量,并且滿足 E ( 8)=0, Var ( 8)= c 21 n 與一元線性回歸類似,求參數(shù)P的估計(jì)值8,就是求最小二乘函數(shù) q 次)=I - X。)I - xp) 達(dá)到最小的8的值。 p的最小二乘估計(jì) p = (tX )1XTy 從而得到經(jīng)驗(yàn)回歸方程 y = p + p1X1 +... + ppXp (3)問題求解: 由于體積與長度的量綱不一致,為了使等式兩邊量綱統(tǒng)一,首先利用excel軟件 對數(shù)據(jù)進(jìn)行預(yù)處理,即對y進(jìn)行三次開方的處理。 其中,選擇線的性模型為:S = P + x p +
5、 x p +8,i=1,...,70 A i 0 1i 1 2i 2 i 3「計(jì)算結(jié)果如下表1.1 表1.1 1.30 1.26 1.44 1.62 1.44 … 4.75 5.47 利用R軟件中的回歸函數(shù),可以求得 p0 =0.0329 p 1 =0.1745 p2 =0.0142 根據(jù)計(jì)算結(jié)果可以將x1,x2的值帶入回歸方程求解y值,將所得y值(實(shí)驗(yàn)值) 與真實(shí)y值(觀測值)進(jìn)行比較達(dá)到檢驗(yàn)?zāi)P湍M優(yōu)度的目的,得下圖1.2 由圖1.2得,回歸系數(shù)和回歸方程檢驗(yàn)都是顯著的,模型模擬結(jié)果較好。 則該題結(jié)果為:聲.=0. 00329 + 0. 1745x1. + 0
6、. 0142x2. (4)模型評價(jià): ① 模型優(yōu)點(diǎn):選取線性回歸模型有效反應(yīng)了自變量與因變量之間的內(nèi)在關(guān)系, 在利用線性模型的基礎(chǔ)上,注意到保持等式兩邊量綱的一致性,體現(xiàn)模型的嚴(yán) 謹(jǐn)性。 ② 模型缺點(diǎn):當(dāng)x值增大時(shí),y實(shí)驗(yàn)值增長速度加快,模擬出現(xiàn)偏差。 例二:(非線性模型)歐洲野兔 No. 1 2 4 5 … 70 71 X 15 15 18 28 … 768 860 y 21.66 22.75 31.25 44.79 … 232.12 246.70 這組數(shù)據(jù)包含71組觀測值,其中y為在澳大利亞的歐洲野兔干燥眼球重量(單 位:毫克)的對數(shù)值,
7、x為野兔相應(yīng)的年齡(單位:天)。、 解答: (1) 問題分析:要求澳大利亞的歐洲野兔年齡與干燥眼球重量之間的關(guān)系,首 先應(yīng)該大致分析兩者之間的線性關(guān)系。確定其大致性關(guān)系后進(jìn)一步具體化分析, 得出澳大利亞的歐洲野兔年齡與干燥眼球重量之間的具體模型并建立函數(shù)模型, 通過對未知參數(shù)的求解得出最終結(jié)果。本題中,通過spss模型進(jìn)行初步估計(jì)后 建模具體求解 (2) 問題求解: 利用spss軟件對野兔年齡(自變量x)與干燥眼球重量(因變量y)進(jìn)行畫圖初步分 析,所得結(jié)果如圖2.1 246.70242.40232.12224.02203.30195.31 ■ 1 59.66= 186
8、.801 06.09- 177.68= 173.73- 重 1 61.29B 155.30- I 45.72140.581 30.68- 104.30= 94.6091.0073.0963.4750.25- 4Q.55- 22.30- O0 1 「80 O 40 O 20 圖2.1 由圖2.1可知,x、y兩者呈非線性關(guān)系,故需用非線性回歸模型進(jìn)行進(jìn)一步估計(jì)。 (2)由(1)知x、y兩者呈非線性關(guān)系,則用曲線估計(jì)中的線性、對數(shù)、逆模型、 二次項(xiàng)、立方、幕次、復(fù)合、S. logistic、增長、指數(shù)分布等11種模型進(jìn)行擬合, 所得結(jié)果如表
9、2.1,擬合效果圖見圖2.2. 表2.1 模型匯總和參數(shù)估計(jì)值 因變量:重量 方程 模型匯總 參數(shù)估計(jì)值 R方 F df1 df2 Sig. 常數(shù) b1 b2 b3 線性 .762 217.236 1 68 .000 82.217 .264 對數(shù) .970 2184.028 1 68 .000 -173.394 62.940 倒數(shù) .636 118.830 1 68 .000 186.705 -3748.419 二次 .950 636.309 2 67 .000 37.172 .
10、689 -.001 三次 .979 1016.731 3 66 .000 17.289 1.035 -.002 1.061E-6 復(fù)合 .559 86.313 1 68 .000 76.813 1.002 冪 .936 999.744 1 68 .000 7.021 .571 S .860 416.599 1 68 .000 5.279 -40.205 增長 .559 86.313 1 68 .000 4.341 .002 指數(shù) .559 86.313 1 68
11、 .000 76.813 .002 Logistic .559 86.313 1 68 .000 .013 .998 觀片野向-<5.二||七 已淅對反二三5寤EJB 圖2.2 由表2.1知三次模擬的R方值0.979與其他10種模擬中相比最大,證明三次模 型模擬的效果最好。觀察圖2.2可進(jìn)一步驗(yàn)證三次模型模擬所得曲線與觀測值最 接近,故用三次模型進(jìn)行具體模擬。 (3) 由(2)知x、y兩者符合三次非線性模型,則設(shè)x、y之間的函數(shù)關(guān)系為 yi=b1-b2(xi-b3)A(-1)+c過spss軟件求解得相關(guān)參數(shù)bl、b2、b3、c如表2.2
12、 表2.2 模型匯總和參數(shù)估計(jì)值 因變量:重量 方程 模型匯總 參數(shù)估計(jì)值 R方 F df1 df2 Sig. 常數(shù) b1 b2 b3 三次 .979 1016.731 3 66 .000 17.289 1.035 -.002 1.061E-6 自變量為年齡。 由表2.2知,b1=1.035、b2=-0.002、b3=1.061 x 10-6、c=17.289,則x、y之間函 數(shù)關(guān)系為: yi=1.035 --0.002)*(xi-1.061 x 10一6)+ 17.289。其函數(shù)圖象如圖2.3 圖2.3 (3)模型評價(jià):
13、 ① 模型優(yōu)點(diǎn):該模型充分考慮x、y變量之間的非線性關(guān)系,經(jīng)過多種模擬模型 的相互比較篩選,得出模擬效果最好的三次非線性模型模擬函數(shù),結(jié)果比較可 靠,從函數(shù)圖象來看模擬值與真實(shí)值之間較為接近,模擬效果較好。 ② 模型缺點(diǎn):從最終的模擬模式圖中我們可以看到當(dāng)自變量年齡較大時(shí),重量 的真實(shí)值與模擬值差異增大,模擬效果變差。 例三(分類數(shù)據(jù)模型):降雨數(shù)據(jù) 年份 x1 x2 x3 x4 y 1951 0.58 82.0 44.0 40.6 1 1952 0.40 83.0 18.0 43.0 3 1953 0.55 85.0 36.0 30.7 3
14、 ??? ??? ??? ??? ??? ??? 1973 0.53 83.0 23.0 61.3 2 1974 0.48 84.0 19.0 23.2 3 1975 0.30 85.0 27.0 17.5 3 北京市25年有關(guān)降雨資料,x1,x2,x3x4是4個預(yù)報(bào)因子,y表示降雨情況:y=1表 示偏少,y=2表示正常,y=3表示偏多。 解答: (1)問題分析 考慮多因素的影響時(shí),對于反應(yīng)變量為分類變量時(shí)(如本題的預(yù)報(bào)因子),用線 性回歸模型就不合適,因此可以采用logistic回歸模型進(jìn)行統(tǒng)計(jì)分析,由于題目 中響應(yīng)變量(降雨情況)
15、是由3種不同的取值,于是便可以利用多分類的Logistic 模型。 (2) 模型基礎(chǔ) ①設(shè)y是一個響應(yīng)變量有c個取值,從0到c-1,并且y=0是一個參照組, 協(xié)變量x=( x1,x2,_ ,xp),那么可以得到y(tǒng)的條件概率: egk(x) P (y=k|x)= 1 + X c-1 egi(x) 其中k=0,1,2,…,c-1.由此得到相應(yīng)的logistic'回回歸模型: 「P = kx =Ox)卜 pk0 + pk1 + …+ pkpxp e gk(x)= ln LP ②最小二乘估計(jì) 對y每一個取值進(jìn)行n次獨(dú)立觀測,可以得到如下矩陣: 1 y 11 y
16、21 y 12 y 22 y1p ] y 2P 11 x 11 x 21 x1p ] x 2p 1p 10 p 11 p 20 p 21 ...p ...p \ -1,0 c - 1,1 n1 y n2 1 y y I1 11 Y= 21 y 12 y 22 x n1 \ 1p y y 2p np p1p X= i1 p 2p x 11 x 21 ...P c-1,p 〃 x ) 1p x 2p y n2 yn -1 J 1P 10 p 11 B= p 2
17、0 p 21 I1 …pc-1,。' .p c -1,1 x n1 記 B=(p「p 廣...,p "p ' 1p p 2p ),則有Y=XB成立. c-1 于是可以得到p的最小二乘估計(jì): p = XtX LxtY ③ 似然函數(shù) 規(guī)定如果y=0那么 為構(gòu)造似然函數(shù),利用二進(jìn)制編碼表示觀測值, y0=1,y1=y2=...=yc-1=。;如果 y=1,那么 y0=0,y1=1,y2=…=yc-1=0;以此類推, 可以得出無論y取何值,總有 1 (p
18、) 項(xiàng)儂o(xi)y0i K 1(xi)y1i ..五 c -1 =1成立,可得似然函數(shù): (x.)yc - 1i (*) =jx ) 其中兀.《.)=P 對(*)式兩端取對數(shù)得似然函數(shù): L ( & ) = £丈"y Ink (x )] ji i i j=0 i=1 (3)模型求解: 本題中,c=3,可以取y=2作為參照組,通過Stata軟件中的mlogit命令, 建立多類結(jié)果的logistic回歸,如下圖3.1 y Coef. Std. Err. z P>|z| [95% Conf. Interval] 1 X1 543.85
19、71 162330.5 0.00 0.997 -317618.1 318705.8 -12.156 5003.195 -0.00 0.998 -9818.239 9793.927 x3 7.363029 2159.486 0.00 0.997 -4225.151 4239.877 -1.710764 726.7509 -0.00 0.998 -1426.116 1422.695 _cons 504.2257 334110.6 0.00 0.999 -654340.6 655349 2 (base outcome} 3 心 -4.378456 8.657183 -0.
20、51 0.€13 -21.34622 12.58931 1.109713 .5992927 1.85 0.064 -.0648788 2.284306 S3 -.0571044 .0841236 -0.68 0.497 -.2219837 .1077749 .0062997 .0474767 0.13 0.894 -.086753 .0993525 _cons -90.17692 50.26632 -1.79 0.073 -188.6971 8.343253 圖3.1 從圖中可以得出: logit( y1 r y2)=543.86x1 - 12. 16x2 + 7
21、. 36x3 - 1. 71x4 + 504. 23 logit( y3 r y2)= - 4. 38x1 + 1. 11x2 - 0. 57x3 + 0. 01x3 - 90. 18 (4)模型評價(jià) 本題將二分類logistic回歸模型的知識推廣到多分類logistic回歸模型,有效的解 決了多種響應(yīng)變量的分類數(shù)據(jù)問題。 例4.非參數(shù)模擬實(shí)驗(yàn) 數(shù)據(jù)產(chǎn)生自 Y. = r G / n)+ b£ ,i = 1, ,n, 其中,n=10OO,b = °.1,£. ~ N(0,1),估計(jì)函數(shù)表達(dá)式 解答: (1)問題分析: 對于非參數(shù)回歸主要有核回歸,樣條回歸以及局部多項(xiàng)式回歸,利
22、用所給公式通 過matlab生成的1000個隨機(jī)數(shù)據(jù),考慮到核回歸多用于密度估計(jì)的隨機(jī)樣本回 歸,便采用非參數(shù)回歸中的核回歸,通過最小均方誤差比較,選取最優(yōu)核 Epanechnikov核,然后通過缺一交叉驗(yàn)證選取帶寬h=0.04,模擬出離散曲線圖。 最后通過曲線圖,估計(jì)出函數(shù)表達(dá)式。 (2)模型基礎(chǔ) 在非參數(shù)核函數(shù)估計(jì)領(lǐng)域里,有兩個基本工具:核函數(shù)K(u)和帶寬(h), 前者包含點(diǎn)x區(qū)間中觀測值的權(quán)重,而后者主要控制包含觀測值的多少 在核函數(shù)回歸中,需要進(jìn)行核函數(shù)和帶寬的選擇,其中和函數(shù)有4種不同 的形式,依據(jù)最優(yōu)均方誤差可以發(fā)現(xiàn) Epanechnikov核是最優(yōu)的核函數(shù),即 K (
23、1)= 3(1 - u2)I(u),其中I(.)為示性函數(shù),滿足 4 1(U)= IO! 利用缺一交叉驗(yàn)證選擇帶寬: CV (h)= n i =1 y — r (x) i] _ £ i ii 這里r(—i)指未用數(shù)據(jù)點(diǎn)(、,Yi)時(shí)所得到的估計(jì),Lii為光滑矩陣L的第i個對角元,其中 L= (1 (x1),…,l (xn)) T (3)模型求解 首先由原始數(shù)據(jù)畫出相應(yīng)散點(diǎn)圖進(jìn)行趨勢預(yù)估,所得圖形見下圖4.1 0.0 r 圖4.1 接著,用樣條回歸以及局部多項(xiàng)式回歸進(jìn)行擬合分析,Epanechnikov核函數(shù) 進(jìn)行平滑估計(jì)。得到如圖4.2左圖所示趨勢
24、圖。將原始數(shù)據(jù)與平滑曲線相互統(tǒng) 后畫出散點(diǎn)趨勢圖如圖4.2右圖所示 圖4.2 由圖4.2可知,函數(shù)擬合效果與真實(shí)數(shù)據(jù)趨勢相近,但存在一些波動的點(diǎn), 接下來我們進(jìn)行進(jìn)一步的模型檢驗(yàn)。 ② 缺一交叉驗(yàn)證: 利用matlab通過缺一交叉驗(yàn)證選取帶寬h=0.04,計(jì)算求出cv(h)的結(jié)果。 其中,所得cv(h)=0.0377,該值小于帶寬h=0.04,證明擬合效果較好。 ③ 函數(shù)求解 從擬合圖像中,可以看到函數(shù)具有正弦函數(shù)特征,與doppler函數(shù)圖有一致 性,故用matlab進(jìn)行具體函數(shù)參數(shù)求解。首先用sin函數(shù)擬合,發(fā)現(xiàn)當(dāng)所疊加的 正余弦函數(shù)增加時(shí),擬合度增大,當(dāng)其達(dá)到8次疊加時(shí)
25、,擬合效果最好,故設(shè) F1(x)=a0+a1*cos(x*w)+b1*sin(x*w)+a2*cos(2*x*w) + b2*sin(2*x*w) + a3*cos(3*x*w) + b3*sin(3*x*w) +a4*cos(4*x*w) + b4*sin(4*x*w) + a5*cos(5*x*w) + b5*sin(5*x*w) +a6*cos(6*x*w) + b6*sin(6*x*w) + a7*cos(7*x*w) + b7*sin(7*x*w) + a8*cos(8*x*w) + b8*sin(8*x*w) 進(jìn)一步觀察x較小時(shí)的擬合情況,發(fā)現(xiàn)差異較大,由此我們猜想最后的函數(shù)由
26、兩 個函數(shù)疊加而成。通過尋找,發(fā)現(xiàn)指數(shù)函數(shù)在x較小時(shí)特征與圖中起始段接近, 故再次設(shè)指數(shù)函數(shù)為: F2(x)=a0 +a1*cos(x*w)+b1*sin(x*w)+a2*cos(2*x*w)+b2*sin(2*x*w) + a3*cos(3*x*w) + b3*sin(3*x*w) + a4*cos(4*x*w) + b4*sin(4*x*w) + a5*cos(5*x*w) + b5*sin(5*x*w) + a6*cos(6*x*w) + b6*sin(6*x*w) + a7*cos(7*x*w) + b7*sin(7*x*w) + a8*cos(8*x*w) + b8*sin(8*x
27、*w) 將兩個函數(shù)疊加即可求得最終函數(shù),即F(X)=F1(x)*F2(x),其中,正弦函數(shù)與指數(shù) 函數(shù)各參數(shù)值見下表4.11及4.12 a0 0.04889 a5 -0.0953 al bl 0.1437 b5 a2 b2 a3 b3 a4 b4 -0.03541 0.04867 a6 b6 -0.2151 a7 0.1666 0.01951 b7 a8 0.1144 -0.01195 b8 w 0.01149 0.07141 -0.05863 0.00623 0.06512 -0.04734-0.04572 6.844 表 4.11 al
28、bl cl a2 b2 c2 a3 b3 c3 a4 b4 c4 -435. 2 0.437 5 0.103 5 0.666 3 0.75 0.072 64 0.023 85 0.814 6 0.008 3 0.824 7 0.295 2 0.028 37 a5 b5 c5 a6 b6 c6 a7 b7 c7 a8 b8 c8 -0.00 3565 0.710 8 0.001 976 0.543 2 0.842 7 0.084 76 -0.45 57 0.779 5 0.
29、104 9 435.7 0.437 5 0.103 3 表 4.12 最終模擬出離散曲線圖如下圖4.3 由擬合圖4.3我們可以看到當(dāng)x較小時(shí)模擬值與真實(shí)值變化趨勢一致,隨著 x的增大模擬值與真實(shí)值不斷接近后趨于一致,說明模型建立較為合理。 (4)模型評價(jià) 模型優(yōu)點(diǎn):擬值與真實(shí)值不斷接近后趨于一致,模型的建立較為合理,所尋 找的模擬函數(shù)比較嚴(yán)謹(jǐn); 模型缺點(diǎn):對數(shù)據(jù)事先未進(jìn)行預(yù)處理一一異常數(shù)據(jù)的刪除與剔除,對結(jié)果有 一定影響,使得模擬結(jié)果不夠完善 例5.豬數(shù)據(jù) Week Pig 1 2 3 4 5 6 7 8 9 1 24.0 32
30、.0 39.0 42.5 48.0 54.5 61.0 65.0 72.0 2 22.5 30.5 40.5 45.0 51.0 58.5 64.0 72.0 78.0 3 22.5 28.0 36.5 41.0 47.5 55.0 61.0 68.0 76.0 4 24.0 31.5 39.5 44.5 51.0 56.0 59.5 64.0 67.0 5 24.5 31.5 37.0 42.5 48.0 54.0 58.0 63.0 65.5 6 23.0 30.0 35.5 41.0
31、 48.0 51.5 56.5 63.5 69.5 7 22.5 28.5 36.0 43.5 47.0 53.5 59.5 67.5 73.5 8 23.5 30.5 38.0 41.0 48.5 55.0 59.5 66.5 73.0 9 20.0 27.5 33.0 39.0 43.5 49.0 54.5 59.5 66.5 10 25.5 32.5 39.5 47.0 53.0 58.5 63.0 69.5 76.0 : : : : : : : : : : 47 29.5
32、 37.0 46.0 52.5 60.0 67.5 76.0 81.5 88.0 48 28.5 36.0 42.5 49.0 55.0 63.5 72.0 78.5 85.5 注:48頭豬連續(xù)9個星期的體重測量值 解答: (1) 問題分析:根據(jù)表中數(shù)據(jù)可知,這是縱向數(shù)據(jù)模型,通過觀察48頭豬體 重隨時(shí)間曲線,可發(fā)現(xiàn)他們呈線性遞增,因此可以觀察他們曲線斜率的變 化和初始體重的差異,用最小二乘核估計(jì)得到未知參數(shù)。 (2) 模型基礎(chǔ) ①先設(shè)P已知,估計(jì)m(.),基于 Y. - pTZ. = m(X.)+ £ 選擇帶寬hn,得到m(x)的核估計(jì):
33、 m(, p)=£w Q - pt]Ew(x)z ni i ni i i=1 i=1 其中W 0= Kf二^]/Kfy^'。 ni h h k n)i =1 k 氣 J 記 ② 估計(jì)P,基于 y. -1^《)=pt(z. - m2k,+ 七 得到p的最小二乘估計(jì)由。 ③ 得到m(x)的最終估計(jì): m(()= £w(x)y - pT£w(x)z ni i ni i i=1 i=1 ④ 調(diào)整帶寬h直到得到滿意的結(jié)果 n (3)模型求解 根據(jù)體重和時(shí)間的數(shù)據(jù),得到他們的線形圖像如圖5.1 908070如 M W30賣 (空二揚(yáng)蕓 圖5.1 從圖像可以看出48頭
34、豬的體重隨時(shí)間呈線性增加,構(gòu)造線性回歸方程 (1)線性遞增 X. = J,8 N(o,b2) i=1, ...,48,j=1,...,9 (2)初始體重的差異 U.?N(0, v 2) y,, = a + gx. + U. + 8.., (3)斜率的變化 y.. = a + px. + U. + W.x. + 8.. W. ~ N(0,t2) 用向量的形式表示為: y = x p + Z b + 8 , i i i i i y i =(y ,. i,i ..,y )T, i,9 P = (a, p )T, 「1 1 1 1 1 1 1
35、1 1]T X =Z = i i 1 2 3 4 5 6 7 8 9 b = G , W)~ N (0, D),D = diagjv2, t2} i i i2 8=(, 所以1 a =1.043 …,匕9)~ N(0,b2I9) p =0.876 例6.葡萄糖數(shù)據(jù) Hour(Control) No. 0 0.5 1 1.5 2 3 4 5 1 4.3 3.3 3.0 2.6 2.2 2.5 3.4 4.4 2 3.7 2.6 2.6 1.9 2.9 3.2 3.1 3.9 :
36、 13 4.7 3.1 3.2 3.3 3.2 4.2 3.7 4.3 Hour(Obese) No. 0 0.5 1 1.5 2 3 4 5 14 4.3 3.3 3.0 2.6 2.2 2.5 2.4 3.4 15 5.0 4.9 4.1 3.7 3.7 4.1 4.7 4.9 : : : : : : : : : 33 4.6 4.4 3.8 3.8 3.8 3.6 3.8 3.8 注:20個肥胖病人和13個對照者的葡萄糖耐受試驗(yàn),數(shù)據(jù)(血漿中無機(jī)磷酸鹽
37、) 從服從標(biāo)準(zhǔn)計(jì)量的葡萄糖后0,0.5, 1,1.5, 2, 3, 4和5小時(shí)的實(shí)驗(yàn)者的血樣 里取得,目的是研究對照組和肥胖病人組是否有顯著差異。 解答: (1) 問題分析: 根據(jù)所給數(shù)據(jù),畫出肥胖病人和對照組血液的葡萄糖含量的離散點(diǎn),并依據(jù)離散 點(diǎn)大致判斷出曲線模型為拋物線模型,通過對比控制組與肥胖組的無機(jī)磷平均測 量值,利用分段線性模型求出估計(jì)量的大小。 (2) 模型解答: 首先求出全體病人的無機(jī)磷平均測量值如表6.1 表6.1 23.5 4.53 4.14 3.78 3.48 3.195 3.375 3.7 4.015 然后畫出全體病人無機(jī)磷平均測量值圖
38、
4.
5
3. 芝匚蘭 ecl_ 39、
「1 1 1 1 1 1 1 1]T
( \
y =(y,…,y》x.=
0 0.51 1.52222
i i1 i8 , i
0 0 0 0 0 1 2 3
y = X P+ Zb +,,|=14,...,33
i i i i
p=(p1, P2, p >
附錄
例題一代碼:
volume<-data.frame(
X1=c(4.6,4.4,5,5.1,5.1,5.2,5.2,5.5,5.5,5.6,5.9,5.9,7.5,7.6,7.6,7.8,8,8.1,8.4,8.6,8.9, 9.1,9.2,9.3,9.3,9.8,9.9,9.9,9.9,10 40、.1,10.2,10.2,10.3,10.4,10.6,11,11.1,11.2,11.5,11.7,1 2,12.2,12.2,12.5,12.9,13,13.1,13.1,13.4,13.8,13.8,14.3,14.3,14.6,14.8,14.9,15.1,15.2, 15.2,15.3,15.4,15.7,15.9,16,16.8,17.8,18.3,18.3,19.4,23.4),
X2=c(33,38,40,49,37,41,41,39,50,69,58,50,45,51,49,59,56,86,59,78,93,65,67,76, 64,71,72,79,69,71,80,8 41、2,81,75,75,71,81,91,66,65,72,66,72,90,88,63,69,65,73,69,77, 64,77,91,90,68,96,91,97,95,89,73,99,90,90,91,96,100,94,104),
Y=c(1.30,1.26,1.44,1.63,1.44,1.43,1.52,1.50,1.71,1.93,1.86,1.78,1.97,2.18,2.00,2. 30,2.23,2.56,2.39,2.55,2.72,2.57,2.61,2.69,2.58,2.88,2.80,2.85,2.83,2.80,3.00,3.00,3. 01,2.93,2. 42、94,2.95,3.20,3.28,2.96,3.07,3.11,3.04,3.19,3.46,3.56,3.16,3.36,3.16,3.51,3. 32,3.51,3.46,3.89,4.03,3.90,3.46,3.95,4.06,4.09,4.18,4.04,3.81,4.19,4.04,4.15,4.31,4. 54,4.61,4.75,5.47) )
lm.sol<-lm(Y~X1+X2,data=volume)
summary(lm.sol)
Call:
lm(formula = Y ~ X1 + X2, data = volume)
Residuals:
Min 1 43、Q Median 3Q Max
-0.182052 -0.043575 -0.000207 0.030547 0.272404
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.0328978 0.0382649 0.86 0.393
X1
0.1744526
0.0037541
46.47
<2e-16 ***
X2
0.0141562
0.0008655
16.36
<2e-16 ***
---
Signif. codes:
0 ‘***’
0.001 ‘**’
0.01
44、
‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.0752 on 67 degrees of freedom
Multiple R-squared: 0.9938, Adjusted R-squared: 0.9936
F-statistic: 5376 on 2 and 67 DF, p-value: < 2.2e-16
例題三代碼:
.mlogit
y
x1
x2 x3
x4
Iteration
0:
log
likelihood =
-26.852306
Iteration
1:
log
like 45、lihood =
-11.741686
Iteration
2:
log
likelihood =
-9.2828456
Iteration
3:
log
likelihood =
-7.8941646
Iteration
4:
log
likelihood
=
-7.1510985
Iteration
5:
log
likelihood
=
-6.9007646
Iteration
6:
log
likelihood
=
-6.8404666
Iteration
7:
log
likelihood
=
-6.8279326 46、
Iteration
8:
log
likelihood
=
-6.8257308
Iteration
9:
log
likelihood
=
-6.8252199
Iteration
10:
log
likelihood
=
-6.8250961
Iteration
11:
log
likelihood
=
-6.8250714
Iteration
12:
log
likelihood
=
-6.8250674
Iteration
13:
log
likelihood
=
-6.8250664
Iteration
1 47、4:
log
likelihood
=
-6.8250662
Multinomial logistic regression N
umber of obs = 25
LR chi2(8)= 40.05
Prob > chi=0.0000
Log likelihood = -6.8250662
Pseudo R2 = 0.7458
例題四代碼
(1)擬合代碼
clear;clc;
data二csvread('Doppler data.csv',0,0,[0 0 999 1]);
data(:,1);
for n=1:1000
s=0;
ss=0;
for 48、 i=1:n
u(i)=(data(n,1)-data(i,1))/0.04;
if abs(u(i))<=1
Iu=1;
else
Iu=0;
end
ku(i)=3/4*(1-u(i)*u(i))*Iu;
s=s+ku(i);
end
for i=1:n
Lx(i)=ku(i)/s;
ss=ss+Lx(i)*data(i,2);
end
rx(n)二ss;
end
u';
ku;
rx';
plot(data(:,1),rx)
(2) 交叉驗(yàn)證代碼
clear;clc;
data二csvread('Dopplerdata.csv',0,0,[00 49、9991]);
data(:,1);
forn=1:1000
s=0;
ss=0;
fori=1:n
u(i)=(data(n,1)-data(i,1))/0.04;
ifabs(u(i))<=1
Iu=1;
else
Iu=0;
end
ku(i)=3/4*(1-u(i)*u(i))*Iu;
s=s+ku(i);
end
fori=1:n
Lx(n,i)=ku(i)/s;
ss=ss+Lx(n,i)*data(i,2);
end
rx(n)二ss;
end
u';
ku;
rx';
sss=0;
fori=2:1000
fenzi二data 50、(i,2)-rx(i);
fenmu=1-Lx(i,i);
pingfang=(fenzi/fenmu)*(fenzi/fenmu);
sss=sss+pingfang;
end
cv=sss/1000
(3) 函數(shù)近似擬合代碼
f(x)=
a0 + a1*cos(x*w) + b1*sin(x*w) +
a2*cos(2*x*w) + b2*sin(2*x*w) + a3*cos(3*x*w) + b3*sin(3*x*w) + a4*cos(4*x*w) + b4*sin(4*x*w) + a5*cos(5*x*w) + b5*sin(5*x*w) + a6*cos(6* 51、x*w) + b6*sin(6*x*w) + a7*cos(7*x*w) + b7*sin(7*x*w) +
a8*cos(8*x*w) + b8*sin(8*x*w) a0 = 0.04889 (0.04419, 0.0536)
al =
0.1437
(0.1367, 0.1507)
bl =
-0.03541
(-0.04462, -0.02621)
a2 =
0.04867
(0.03115, 0.06619)
b2 =
-0.2151
(-0.2221, -0.2082)
a3 =
-0.1666
(-0.1736, -0.1597)
b3 =
0 52、.01951
(0.002284, 0.03673)
a4 =
0.1144
(0.1076, 0.1212)
b4 =
-0.01195
(-0.02464, 0.0007377)
a5 —
-0.0953
(-0.1021, -0.08847)
b5 =
0.01149
(-0.001948, 0.02493)
a6 =
0.07141
(0.06125, 0.08158)
b6 =
-0.05863
(-0.06908, -0.04818)
a7 =
-0.00623
(-0.01569, 0.00323)
b7 =
0.06512
(0 53、.05819, 0.07206)
a8 =
-0.04734
(-0.05905, -0.03562)
b8 =
-0.04572
(-0.05654, -0.03491)
w =
6.844
(6.788, 6.9)
f(x)=
a0 + a1*cos(x*w) + b1*sin(x*w) +
a2*cos(2*x*w) + b2*sin(2*x*w) + a3*cos(3*x*w) + b3*sin(3*x*w) + a4*cos(4*x*w) + b4*sin(4*x*w) + a5*cos(5*x*w) + b5*sin(5*x*w) + a6*cos(6* 54、x*w) + b6*sin(6*x*w) + a7*cos(7*x*w) + b7*sin(7*x*w) + a8*cos(8*x*w) + b8*sin(8*x*w)
al = -435.2 (-8.273e+06, 8.272e+06)
b1 =
0.4375
(0.4112, 0.4637)
c1 =
0.1035
(-1.91, 2.117)
a2 =
0.6663
(-11.77, 13.1)
b2 =
0.75 (0.6539, 0.8461)
c2 =
0.07264
(-0.07378, 0.2191)
a3 =
0.02385
(-0.01 55、945, 0.06715)
b3 =
0.8146
(0.8031, 0.8262)
c3 =
0.0083
(-0.01057, 0.02717)
a4 =
0.8247
(0.7699, 0.8795)
b4 =
0.2952
(0.2945, 0.296)
c4 =
0.02837
(0.0267, 0.03004)
a5 —
-0.003565
(-0.08559, 0.07846)
b5 =
0.7108
(0.674, 0.7475)
c5 =
0.001976
(-0.05161, 0.05556)
a6 =
0.5432
(-16.08, 17.17)
b6 =
0.8427
(0.2355, 1.45)
c6 =
0.08476
(-0.1546, 0.3242)
a7 =
-0.4557
(-25.15, 24.24)
b7 = 0.7795
c7 = 0.1049
a8 = 435.7
b8 = 0.4375
c8 = 0.1033
(-0.2541, 1.813)
(-0.2728, 0.4826)
(-8.272e+06, 8.273e+06)
(0.4097, 0.4653)
(-1.908, 2.115)
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 離心泵的檢修各零部件檢修標(biāo)準(zhǔn)
- 金屬材料疲勞強(qiáng)度的八大主要影響因素
- 機(jī)械安全知識
- 電機(jī)的工作原理與種類
- 設(shè)備點(diǎn)檢內(nèi)容
- 有效防止液壓系統(tǒng)漏油的技術(shù)要領(lǐng)
- 鈑金和管工機(jī)械安全操作規(guī)程
- 閥門的100個專業(yè)術(shù)語
- 某單位機(jī)械設(shè)備安全檢查表
- 離心泵的汽蝕與吸入特性
- 過濾網(wǎng)目數(shù)標(biāo)準(zhǔn)
- 減少設(shè)備潤滑故障的措施
- 離心泵機(jī)械密封安裝使用規(guī)則
- 閥門常見故障與原因
- 呼吸閥和真空破壞閥基礎(chǔ)知識總結(jié)