《高中數(shù)學(xué) 第三章 統(tǒng)計(jì)案例章末高效整合課件 新人教A版選修2-3》由會(huì)員分享,可在線閱讀,更多相關(guān)《高中數(shù)學(xué) 第三章 統(tǒng)計(jì)案例章末高效整合課件 新人教A版選修2-3(57頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第 三 章 統(tǒng)計(jì)案例 章 末 高 效 整 合 知能整合提升 1兩個(gè)基本思想(1)回歸分析的基本思想回歸分析包括線性回歸分析和非線性回歸分析兩種,而非線性回歸分析往往可以通過(guò)變量代換轉(zhuǎn)化為線性回歸分析,因此,回歸分析的思想主要是指線性回歸分析的思想 注意理解以下幾點(diǎn):確定線性相關(guān)關(guān)系線性相關(guān)關(guān)系有兩層含義:一是具有相關(guān)關(guān)系,如廣告費(fèi)用與銷(xiāo)售量的關(guān)系等在一定條件下具有相關(guān)關(guān)系,而氣球的體積與半徑的關(guān)系是函數(shù)關(guān)系,而不是相關(guān)關(guān)系;二是具有線性相關(guān)關(guān)系 判斷是否線性相關(guān)的依據(jù)是觀察樣本點(diǎn)的散點(diǎn)圖;引起預(yù)報(bào)誤差的因素對(duì)于線性回歸模型ybxae,引起預(yù)報(bào)變量y的誤差的因素有兩個(gè):一個(gè)是解釋變量x,另一個(gè)是
2、隨機(jī)誤差e;回歸方程的預(yù)報(bào)精度判斷回歸方程的預(yù)報(bào)精度是通過(guò)計(jì)算殘差平方和來(lái)進(jìn)行的,殘差平方和越小,方程的預(yù)報(bào)精度越高 簡(jiǎn)單來(lái)說(shuō),線性回歸分析就是通過(guò)建立回歸直線方程對(duì)變量進(jìn)行預(yù)報(bào),用回歸方程預(yù)報(bào)時(shí),需對(duì)函數(shù)值明確理解,它表示當(dāng)x取值時(shí),真實(shí)值在函數(shù)值附近或平均值在函數(shù)值附近,不能認(rèn)為就是真實(shí)值; 回歸模型的擬合效果判斷回歸模型的擬合效果的過(guò)程也叫殘差分析,殘差分析的方法有兩種,一是通過(guò)殘差圖直觀判斷,二是通過(guò)計(jì)算相關(guān)指數(shù)R2的大小判斷 (2)獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想類(lèi)似于反證法要確認(rèn)兩個(gè)分類(lèi)變量有關(guān)系的可信程度,先假設(shè)兩個(gè)分類(lèi)變量沒(méi)有關(guān)系,再計(jì)算隨機(jī)變量K2的觀測(cè)值,最后由K2
3、的觀測(cè)值很大在一定程度上說(shuō)明兩個(gè)分類(lèi)變量有關(guān)系 進(jìn)行獨(dú)立性檢驗(yàn)要注意理解以下三個(gè)問(wèn)題:獨(dú)立性檢驗(yàn)適用于兩個(gè)分類(lèi)變量;兩個(gè)分類(lèi)變量是否有關(guān)系的直觀判斷:一是根據(jù)22列聯(lián)表計(jì)算|adbc|,值越大關(guān)系越強(qiáng);二是觀察等高條形圖,兩個(gè)深色條的高度相差越大關(guān)系越強(qiáng)獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)分類(lèi)變量有關(guān)系的可信程度的判斷,而不是對(duì)其是否有關(guān)系的判斷獨(dú)立性檢驗(yàn)的結(jié)論只能是有多大的把握確認(rèn)兩個(gè)分類(lèi)變量有關(guān)系,而不能是兩個(gè)分類(lèi)變量一定有關(guān)系或沒(méi)有關(guān)系 2兩個(gè)重要參數(shù)(1)相關(guān)指數(shù)R2相關(guān)指數(shù)R2是用來(lái)刻畫(huà)回歸模型的回歸效果的,其值越接近1,殘差平方和越小,模型的擬合效果越好(2)隨機(jī)變量K2隨機(jī)變量K2是用來(lái)判斷兩個(gè)分
4、類(lèi)變量在多大程度上相關(guān)的變量獨(dú)立性檢驗(yàn)即計(jì)算K2的觀測(cè)值,并與教材中所給表格中的數(shù)值進(jìn)行比較,從而得到兩個(gè)分類(lèi)變量在多大程度上相關(guān) 3兩種重要圖形(1)散點(diǎn)圖散點(diǎn)圖是進(jìn)行線性回歸分析的主要手段,其作用如下:一是判斷兩個(gè)變量是否具有線性相關(guān)關(guān)系,如果樣本點(diǎn)呈條狀分布,則可以斷定兩個(gè)變量有較好的線性相關(guān)關(guān)系;二是判斷樣本中是否存在異常 (2)殘差圖殘差圖可以用來(lái)判斷模型的擬合效果,其作用如下:一是判斷模型的精度,殘差點(diǎn)所分布的帶狀區(qū)域越窄,說(shuō)明模型的擬合精度越高,回歸方程的預(yù)報(bào)精度越高;二是確認(rèn)樣本點(diǎn)在采集中是否有人為的錯(cuò)誤 熱點(diǎn)考點(diǎn)例析 線性回歸分析的應(yīng)用點(diǎn)撥:回歸分析的基本步驟為:(1)確定研
5、究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;(2)畫(huà)出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系; (3)由經(jīng)驗(yàn)確定回歸方程的類(lèi)型;(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù);(5)得檢查回歸模型的擬合程度,如分析殘差圖、求相關(guān)指數(shù)R2等 一個(gè)車(chē)間為了規(guī)定工時(shí)定額,需確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了10次試驗(yàn),測(cè)得的數(shù)據(jù)如下表:零件數(shù)x(個(gè)) 10 20 30 40 50 60 70 80 90 100加工時(shí)間y(min) 62 72 75 81 85 95 103 108 112 127 (1)畫(huà)出散點(diǎn)圖,并初步判斷是否線性相關(guān);(2)若線性相關(guān),求回歸直線方程;(3)求出
6、相關(guān)指數(shù);(4)作出殘差圖;(5)進(jìn)行殘差分析;(6)試制訂加工200個(gè)零件的用時(shí)規(guī)定 思維點(diǎn)擊明確各相關(guān)概念求出回歸直線方程是解題關(guān)鍵注意正確使用公式和準(zhǔn)確計(jì)算 (1)散點(diǎn)圖如圖所示由圖可知,x,y線性相關(guān) 將數(shù)據(jù)代入相應(yīng)公式可得數(shù)據(jù)表: (3)利用所求回歸方程求出下列數(shù)據(jù): 1為了研究3月下旬的平均氣溫(x)與4月20日前棉花害蟲(chóng)化蛹高峰日(y)的關(guān)系,某地區(qū)觀察了2007年至2011年的情況得到下面數(shù)據(jù):年份2006 2007 2008 2009 2010 2011x(C) 24.4 29.6 32.7 28.7 30.3 28.9y(天) 19 6 1 10 1 8 點(diǎn)撥:非線性回歸問(wèn)
7、題的處理技巧一般地,有些非線性回歸模型通過(guò)變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關(guān)系的兩個(gè)變量之間的關(guān)系(1)如果散點(diǎn)圖中的點(diǎn)分布在一個(gè)直線狀帶形區(qū)域,可以選用線性回歸模型來(lái)建模;(2)如果散點(diǎn)圖中的點(diǎn)的分布在一個(gè)曲線狀帶形區(qū)域,要先對(duì)變量作適當(dāng)?shù)淖儞Q,再利用線性回歸模型來(lái)建模非線性回歸問(wèn)題 xi 0.05 0.06 0.25 0.31 0.07 0.10yi 0.10 0.14 1.00 1.12 0.23 0.37xi 0.38 0.43 0.14 0.20 0.47yi 1.19 1.25 0.59 0.79 1.29 ui 20.000 16.667 4.00
8、0 3.226 14.286 10.000vi2.3031.966 0 0.1131.4700.994ui 2.632 2.326 7.143 5.000 2.128vi 0.174 0.2230.5280.236 0.255 2電容器充電后,電壓達(dá)到100 V,然后開(kāi)始放電,由經(jīng)驗(yàn)知道,此后電壓U隨時(shí)間t變化的規(guī)律公式UAebt(b0)表示,觀測(cè)得時(shí)間t(s)時(shí)的電壓U(V)如下表所示:試求電壓U對(duì)時(shí)間t的回歸方程t 0 1 2 3 4 5 6 7 8 9 10U 100 75 55 40 30 20 15 10 10 5 5 解析:對(duì)UAebt兩邊取自然對(duì)數(shù)得ln Uln Abt,令yln
9、 U,aln A,即ybta,由所給數(shù)據(jù)可得t 0 1 2 3 4 5 6 7 8 9 10ln U(y) 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6 其散點(diǎn)圖為: 點(diǎn)撥:1.獨(dú)立性檢驗(yàn)的一般步驟:(1)提出假設(shè)H0:和沒(méi)有關(guān)系;(2)根據(jù)22列聯(lián)表計(jì)算K2的觀測(cè)值;(3)根據(jù)K2的觀測(cè)值與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷獨(dú)立性檢驗(yàn) 2可以用反證法的原理來(lái)解釋獨(dú)立性檢驗(yàn)原理.反證法原理獨(dú)立性檢驗(yàn)原理在一個(gè)已知假設(shè)下,如果推出一個(gè)矛盾,就證明了這個(gè)假設(shè)不成立在一個(gè)已知假設(shè)下,如果出現(xiàn)一個(gè)與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個(gè)假設(shè)不成立,且該推斷犯錯(cuò)誤的概率
10、不超過(guò)這個(gè)小概率 從上述對(duì)比中可以看出,假設(shè)檢驗(yàn)的原理和反證法原理類(lèi)似不同之處:一是獨(dú)立性檢驗(yàn)中用有利于H0的小概率事件的發(fā)生代替了反證法中的矛盾;二是獨(dú)立性檢驗(yàn)中接受原假設(shè)的結(jié)論相當(dāng)于反證法中沒(méi)有找到矛盾把獨(dú)立性檢驗(yàn)的基本思想具體化到獨(dú)立性檢驗(yàn)中,就可以通過(guò)隨機(jī)變量K2的值的大小來(lái)研究?jī)蓚€(gè)分類(lèi)變量是否有相關(guān)關(guān)系 調(diào)查某醫(yī)院某段時(shí)間內(nèi)嬰兒出生的時(shí)間與性別的關(guān)系,得到下面的數(shù)據(jù)表,試問(wèn)嬰兒的性別與出生的時(shí)間是否有關(guān)系?出生時(shí)間性別晚上白天總計(jì)男嬰15 31 46女?huà)? 26 34總計(jì)23 57 80 思維點(diǎn)擊根據(jù)列聯(lián)表,將相應(yīng)數(shù)據(jù)代入公式求K2. 3為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了33
11、9名50歲以上的人,調(diào)查如下表所示:試問(wèn):50歲以上的人患慢性氣管炎與吸煙習(xí)慣是否有關(guān)系?患慢性氣管炎未患慢性氣管炎合計(jì)吸煙43 162 205不吸煙13 121 134合計(jì)56 283 339 解析:5是斜率的估計(jì)值,說(shuō)明x每增加一個(gè)單位,y平均減少5個(gè)單位答案:B 4若由一個(gè)22列聯(lián)表中的數(shù)據(jù)計(jì)算得K26.630,則判斷“這兩個(gè)分類(lèi)變量有關(guān)系”時(shí),犯錯(cuò)誤的最大概率是()A0.025 B0.01C0.005 D0.001解析:P(K25.024)0.025,又K26.6305.024,犯錯(cuò)誤的最大概率為0.025.答案:A 5若由一個(gè)22列聯(lián)表中的數(shù)據(jù)計(jì)算得K24.073,那么在犯錯(cuò)誤的概率
12、不超過(guò)_的前提下認(rèn)為兩變量有關(guān)系,已知P(K23.841)0.05,P(K25.024)0.025.解析:查表可知K2的觀測(cè)值k4.0733.841,因此在犯錯(cuò)誤的概率不超過(guò)5%的前提下認(rèn)為兩變量有關(guān)系答案:5% 7某產(chǎn)品的廣告費(fèi)支出x與銷(xiāo)售額y(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):請(qǐng)畫(huà)出散點(diǎn)圖并用散點(diǎn)圖粗略地判斷x,y是否線性相關(guān)x 2 4 5 6 8y 30 40 60 50 70 解析:散點(diǎn)圖如圖從散點(diǎn)圖可以看出散點(diǎn)呈條狀分布,所以x,y具有較強(qiáng)的線性相關(guān)關(guān)系 8某研究者欲考察某一高考試題的得分情況是否與性別有關(guān)系,統(tǒng)計(jì)結(jié)果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人試根據(jù)這些數(shù)據(jù)判斷這一高考試題的得分情況與性別是否有關(guān)系 解析:根據(jù)題中數(shù)據(jù)得如下列聯(lián)表:及格不及格總計(jì)男生290 160 450女生100 350 450總計(jì)390 510 900