《最小二乘法與回歸分析.ppt》由會員分享,可在線閱讀,更多相關(guān)《最小二乘法與回歸分析.ppt(20頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、5化學(xué)計量學(xué)方法,6.1引言6.2線性回歸分析6.3化學(xué)因子分析6.4人工神經(jīng)網(wǎng)絡(luò)6.5小波分析6.6獨立成分分析6.7支持向量機分類與回歸,本課程的教學(xué)內(nèi)容,最小二乘法與回歸分析化學(xué)因子分析人工神經(jīng)網(wǎng)絡(luò)小波分析獨立成分分析支持向量機分類與回歸分析,5.2回歸分析及檢驗,回歸分析是研究隨機現(xiàn)象中變量之間關(guān)系的一種數(shù)理統(tǒng)計方法,它在生產(chǎn)實踐和科學(xué)研究及實驗中有著廣泛的應(yīng)用。目前在尋找經(jīng)驗公式,探索新配方,制定新標(biāo)準(zhǔn),預(yù)言效果等方面都已取得不少成績。在科學(xué)研究及生產(chǎn)實驗中,常常會遇到在同一個事物中有多個變量存在,而且它們相互關(guān)聯(lián),相互制約。這種關(guān)聯(lián)和制約表明它們之間客觀存在一定數(shù)學(xué)的或其他的關(guān)系。
2、但要找出它們之間數(shù)學(xué)關(guān)系的數(shù)學(xué)解析式是非常困難的,有時是不可能的。因此需要用數(shù)量統(tǒng)計的方法,在大量的試驗中,尋找出隱藏在各變量間的統(tǒng)計規(guī)律性或近似的數(shù)學(xué)模型,這種關(guān)系稱之謂回歸關(guān)系。有回歸關(guān)系的計算方法及理論叫做回歸分析。,回歸分析的主要內(nèi)容,從一組數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式;對這些關(guān)系的可信度進行統(tǒng)計檢驗;尋找某一個應(yīng)變量和哪些自變量有關(guān),其影響程度如何;利用上述關(guān)系,進行預(yù)報和控制;選擇較少的試驗點,獲得更多的信息,對試驗進行較好的設(shè)計。,,5.2.1最小二乘法原理,設(shè)實測數(shù)據(jù)為(xi,yi)(i=1,2,…,n),其近似符合函數(shù)y=φ(x,a1,a2,…,am)(n>m;a1,
3、a2,…,am是待定系數(shù))當(dāng)用測定值x=xi(i=1,2,…,n)代入(4.6-1)可計算出y值,記作,,,不要求近似函數(shù)通過全部觀測點,計算值與實測值不一定完全相等,之間的差稱為殘差,殘差的大小是衡量待定參數(shù)a1,a2,…,am好壞的重要標(biāo)志。,如何確定殘差?,,殘差和殘差絕對值和殘差平方和,這樣問題就歸納為求多元函數(shù)Q(a1,a2,…,am)極小值點,,,,…,解此方程即得參數(shù)aj(j=1,2,…,m)近似函數(shù)y=φ(x,a1,a2,…,am)這就是曲線擬合的最小二乘法原理。,應(yīng)用舉例-1,問題:改變某有色有機酸H2L的溶液的pH,測得溶液的吸光度A,計算該有機酸的離解常數(shù)Ka1,Ka2。
4、解:根據(jù)吸光度的加和性可得:A=AH2L+AHL+AL將它們用[H+]及Ka1、Ka2表示,則有,AH2L、AHL和AL為溶液全部以H2L、HL-或L2-形式存在時的吸光度。其中AH2L和AL都可由實驗直接測定,因為在足夠高的酸度下,有機酸將全部以H2L形式存在,這時溶液的吸光度即AH2L;同理,在足夠高的pH值時,測得的吸光度為AL。所以只剩下AHL不易測準(zhǔn)。,令y=(AH2L-A)[H+]2,x1=A[H+],x2=A-AL,x3=-[H+],Ka1=a1,Ka1Ka2=a2,AHLKa1=a3,這是三元一次方程組,理論上講只要測得三組數(shù)據(jù)(pH1,A1),(pH2,A2)和(pH3,A3
5、),就可以解出三元一次方程組,算出a1,a2和a3。但是在實驗中,常常帶有實驗誤差,只憑三組測量值進行計算會使結(jié)果很不可靠,所以,通常要測量許多組實驗數(shù)據(jù)pH1,A1pH2,A2;pH3A3;…;pHn,An,得到n個方程,因為n>>3,該方程組為矛盾方程組,可用最小二乘法求解。,,上機作業(yè),用光度法測定間苯二酚的離解常數(shù)Ka1,Ka2,測得溶液的pH和A的數(shù)據(jù)如下:──────────────────────────pH2.903.003.103.203.303.403.503.603.70A0.3700.3740.3780.3820.3870.3930.3980.4030.407─────
6、─────────────────────pH4.284.384.464.544.644.724.784.854.91A0.4070.4030.3980.3930.3870.3820.3780.3740.370──────────────────────────并且測得AH2L=0.353,AL=0.337。要求:將由實驗測定所得pH和A經(jīng)換算后得到課堂所講y,x,a等形式,編程語言任選;矛盾方程組求解可以編程實現(xiàn),或由統(tǒng)計軟件中的多元線性回歸分析而得;將數(shù)據(jù)預(yù)處理程序及結(jié)果、數(shù)據(jù)處理最后結(jié)果等以附件l形式交送至化學(xué)信息學(xué)網(wǎng)絡(luò)課堂.,5.2.2線性回歸分析,一元線性回歸通過一組實驗數(shù)據(jù)進行最小
7、二乘法回歸處理,求出直線的斜率和截矩,并根據(jù)一定的統(tǒng)計方法處理,得到較多的統(tǒng)計信息,對實驗數(shù)據(jù)線性相關(guān)性進行檢驗及進行預(yù)報等。,平均值差方和,回歸分析結(jié)果,回歸方程檢驗,相關(guān)系數(shù)總差方和(S)=剩余差方和(Q)+回歸差方和(U)│r│≤1。r越大,表示相關(guān)性越好。r>0,正相關(guān),直線的斜率為正;r32kg/mm2,延伸率y2>33%,且要求有95%的把握滿足上述要求,問含碳量在什么范圍。合金鋼成分及性能實測數(shù)據(jù)━━━━━━━━━━━┳━━━━━━━━━━━━x(%)y1(kg/mm2)y2(%)┃x(%)y1(kg/mm2)y2(%)───────────╂────────────0.0340
8、.540.0┃0.1546.040.50.0441.534.5┃0.1648.033.00.0542.541.5┃0.1753.037.00.0643.037.5┃0.1850.036.50.0739.536.0┃0.2052.537.00.0842.040.0┃0.2156.031.00.0942.534.5┃0.2360.032.50.1043.539.0┃0.2456.032.40.1142.531.5┃0.2554.535.50.1249.041.0┃0.2661.533.30.1343.037.5┃0.2959.531.00.1449.040.0┃0.3264.032.0━━━━━━
9、━━━━━┻━━━━━━━━━━━,解將例實測數(shù)據(jù)進行線性回歸處理得如下結(jié)果:對抗拉強度:回歸方程y1=85.6093x+36.02剩余標(biāo)準(zhǔn)差σ1=2.3673顯著性檢驗F=205.7相關(guān)系數(shù)r=0.9504對延伸率:回歸方程y2=-25.1589x+39.89剩余標(biāo)準(zhǔn)差σ2=2.7970顯著性檢驗F=12.72相關(guān)系數(shù)r=0.6050若有95%的把握滿足題中條件,則應(yīng)85.6093x+36.02+22.3673>3285.6093x+36.02-22.3673>32-25.1589x+39.89+22.770>33-25.1589x+39.89-22.770>33解之得0.0083
10、元線性回歸方程的檢驗總差方和(S)=剩余差方和(Q)+回歸差方和(U)復(fù)相關(guān)系數(shù)方差比剩余標(biāo)準(zhǔn)偏差,S的自由度fS=n-1U的自由度fU=mQ的自由度fQ=n-m-1,,,,例7N,N-二甲基-2-溴苯乙胺衍生物是腎上腺阻斷劑當(dāng)Y和Z接上不同的取代基,其生物活性是不一樣的,Y和Z取代基的結(jié)構(gòu)信息參數(shù)通常取其疏水值π和電子參數(shù)σ,其結(jié)果如下表所示。,,REGRESSMultiplelinearregressionusingleastsquares.b=REGRESS(y,X)returnsthevectorofregressioncoefficients,b,inthelinearmodely=Xb,(Xisannxpmatrix,yisthenx1vectorofobservations).,[B,BINT,R,RINT,STATS]=REGRESS(y,X,alpha)usestheinput,ALPHAtocalculate100(1-ALPHA)confidenceintervalsforBandtheresidualvector,R,inBINTandRINTrespectively.ThevectorSTATScontainstheR-squarestatisticalongwiththeFandpvaluesfortheregression.,