《廣西2020版高考數(shù)學一輪復習 第十章 算法初步、統(tǒng)計與統(tǒng)計案例 10.4 變量間的相關關系、統(tǒng)計案例課件 文.ppt》由會員分享,可在線閱讀,更多相關《廣西2020版高考數(shù)學一輪復習 第十章 算法初步、統(tǒng)計與統(tǒng)計案例 10.4 變量間的相關關系、統(tǒng)計案例課件 文.ppt(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、10.4變量間的相關關系、 統(tǒng)計案例,知識梳理,雙基自測,2,3,4,1,5,1.變量間的相關關系 (1)定義:當自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系.與函數(shù)關系不同,相關關系是一種. (2)散點圖:表示具有相關關系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,它可直觀地判斷兩個變量的關系是否可以用線性關系表示.若這些點分布在從左下角到右上角的區(qū)域,則稱兩個變量;若這些點分布在從左上角到右下角的區(qū)域,則稱兩個變量. (3)線性相關關系、回歸直線:如果散點圖中的點的分布從整體上看大致在,那么就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.,非確定性關系
2、,正相關,負相關,一條直線附近,知識梳理,雙基自測,2,3,4,1,5,(4)非線性相關:若散點圖上所有點看上去都在 附近波動,則稱這兩個變量為非線性相關.此時,可以用來擬合. (5)不相關:如果所有的點在散點圖中,那么稱這兩個變量是不相關的.,某條曲線(不是一條直線),一條曲線,沒有顯示任何關系,知識梳理,雙基自測,2,3,4,1,5,2.回歸分析 對具有相關關系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析.在線性回歸模型y=bx+a+e中,因變量y的值由自變量x和隨機誤差e共同確定,即自變量x只能解釋部分y的變化,在統(tǒng)計中,我們把自變量x稱為,因變量y稱為.,解釋變量,預報變量,知識梳理,雙基
3、自測,2,3,4,1,5,知識梳理,雙基自測,2,3,4,1,5,4.相關系數(shù) ,它主要用于相關量的顯著性檢驗,以衡量 它們之間的線性相關程度.當r0時表示兩個變量正相關,當r<0時表示兩個變量負相關.|r|越接近1,表明兩個變量的線性相關性;當|r|接近0時,表明兩個變量間幾乎不存在.,越強,線性相關性,知識梳理,雙基自測,2,3,4,1,5,5.獨立性檢驗 (1)分類變量:變量的不同“值”表示個體所屬的,像這類變量稱為分類變量. (2)列聯(lián)表:列出兩個分類變量的,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22
4、列聯(lián)表)為 22列聯(lián)表,不同類別,頻數(shù)表,知識梳理,雙基自測,2,3,4,1,5,(3)獨立性檢驗:利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關系”的方法稱為兩個分類變量的獨立性檢驗.,a+b+c+d,2,知識梳理,雙基自測,3,4,1,5,1.下列結論正確的打“”,錯誤的打“”. (1)相關關系與函數(shù)關系都是一種確定性的關系,也是一種因果關系.() (2)利用散點圖可以直觀判斷兩個變量的關系是否可以用線性關系表示.() (3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值. () (4)若事件X,Y的關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.(),答案,知識梳
5、理,雙基自測,2,3,4,1,5,答案,解析,知識梳理,雙基自測,2,3,4,1,5,3.廣告投入對商品的銷售額有較大影響.某電商對連續(xù)5個年度的廣告費和銷售額進行統(tǒng)計,得到統(tǒng)計數(shù)據(jù)如下表(單位:萬元):,萬元時的銷售額約為() A.101.2萬元B.108.8萬元 C.111.2萬元D.118.2萬元,答案,解析,知識梳理,雙基自測,2,3,4,1,5,4.高三年級267位學生參加期末考試,某班37位學生的語文成績、數(shù)學成績與總成績在全年級中的排名情況如下圖所示,甲、乙、丙為該班三名學生. 從這次考試成績看, (1)在甲、乙兩人中,其語文成績名次比其總成績名次靠前的學生是; (2)在語文和
6、數(shù)學兩個科目中,丙同學的成績名次更靠前的科目是.,答案,解析,知識梳理,雙基自測,2,3,4,1,5,5.為了考察某種病毒疫苗的效果,現(xiàn)隨機抽取100只小鼠進行試驗,得到如下列聯(lián)表: 參照附表,在犯錯誤的概率最多不超過(填百分比)的前提下,可認為“該種疫苗有預防這種病毒感染的效果”.,答案,解析,知識梳理,雙基自測,2,3,4,1,5,自測點評 1.若散點圖上的點大致分布在某條直線附近,整體上呈線性分布,則這兩個變量具有很強的相關關系. 2.K2越大,“X與Y有關聯(lián)”的把握程度越大. 3.注意回歸分析時對應的結果均是估計值,不要誤認為是真實值. 4.要理解回歸直線方程中的參數(shù)是用最小二乘法得
7、出的,目的是使距離的平方和最小,不是看具體某一個距離的大小,這樣使用求平方和也避免了討論絕對值和正負問題.,考點1,考點2,考點3,例1(1)為研究語文成績和英語成績之間是否具有線性相關關系,統(tǒng)計某班學生的兩科成績得到如圖所示的散點 圖(x軸、y軸的單位長度相同),用回歸直線方程 近似地刻畫其相關關系,根據(jù)圖形,以下結論最有可能成立的是() A.線性相關關系較強,b的值為1.25 B.線性相關關系較強,b的值為0.83 C.線性相關關系較強,b的值為-0.87 D.線性相關關系較弱,無研究價值,考點1,考點2,考點3,(2)甲、乙、丙、丁四位同學各自對A,B兩個變量的線性相關性做試驗
8、,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m如下表: 則哪位同學的試驗結果體現(xiàn)A,B兩個變量有更強的線性相關性() A.甲B.乙C.丙D.丁 思考如何判斷兩個變量有無相關關系?,答案,解析,考點1,考點2,考點3,解題心得判斷兩個變量有無相關關系有兩個方法:一是根據(jù)散點圖,具有很強的直觀性,直接得出兩個變量是正相關或負相關;二是計算相關系數(shù)法,這種方法能比較準確地反映相關程度,相關系數(shù)的絕對值越接近1,相關性就越強,相關系數(shù)就是描述相關性強弱的.,考點1,考點2,考點3,對點訓練1(1)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是() A.r2
9、
10、,,n)都在直線y=-3x+1上,所以回歸直線方程是y=-3x+1,可得這兩個變量是負相關,故這組樣本數(shù)據(jù)的樣本相關系數(shù)為負值,且所有樣本點(xi,yi)(i=1,2,,n)都在直線y=-3x+1上,則|r|=1,相關系數(shù)r=-1,故選C.,考點1,考點2,考點3,例2一次考試中,五名學生的數(shù)學、物理成績(單位:分)如下表所示:,(1)要從5名學生中選2人參加一項活動,求選中的學生中至少有一人的物理成績高于90分的概率; (2)根據(jù)上表數(shù)據(jù),作出散點圖,并求變量y與x的相關系數(shù)說明物理成績y與數(shù)學成績x之間線性相關關系的強弱.如果具有較強的線性相關關系,求y與x的線性回歸方程(系數(shù)精確到0.0
11、1);如果不具有線性相關關系,請說明理由.,考點1,考點2,考點3,思考對已知的兩個變量的一組數(shù)據(jù)如何做回歸分析?,考點1,考點2,考點3,解:(1)從5名學生中任取2名學生的情況共有10種,其中至少有一人的物理成績高于90分的情況有7種,故選中的學生中至少有一人的物理成績高于90分的概率為 .,可以看出,物理成績與數(shù)學成績高度正相關. 散點圖如圖所示.,考點1,考點2,考點3,從散點圖可以看出這些點大致分布在一條直線附近,并且在逐步上升,故物理成績與數(shù)學成績正相關.,考點1,考點2,考點3,解題心得1.求線性回歸直線方程的步驟 (1)用散點圖或進行相關性檢驗判斷兩個變量是否具有線性相關關系
12、;,考點1,考點2,考點3,2.對變量值的預測方法 主要是由給出的變量的值預測與其有相關關系的變量的值.一般方法如下:,考點1,考點2,考點3,對點訓練2下表提供了某廠節(jié)能降耗技術改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(單位:噸)與相應的生產(chǎn)能耗y(單位:噸標準煤)的幾組對照數(shù)據(jù). (1)請畫出上表數(shù)據(jù)的散點圖; (2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的線性回歸方程 (3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標準煤,試根據(jù)(2)求出的線性回歸方程,預測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤? (參考數(shù)值:32.5+43+54+64.5=66.5),考點1,考點
13、2,考點3,考點1,考點2,考點3,考點1,考點2,考點3,例3為了調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老年人,結果如下:,考點1,考點2,考點3,(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例; (2)能否在犯錯誤的概率不超過0.01的前提下認為該地區(qū)的老年人需要志愿者提供幫助與性別有關? (3)根據(jù)(2)的結論,能否提出更好的調(diào)查方法來估計該地區(qū)的老年人中,需要志愿者提供幫助的老年人的比例?說明理由.,思考獨立性檢驗的方法是什么?,考點1,考點2,考點3,解 (1)調(diào)查的500位老年人中有70位需要志愿者提供幫助, 因此該地區(qū)老年人中
14、,需要幫助的老年人的比例的估計值為 由于9.9676.635,所以在犯錯誤的概率不超過0.01的前提下認為該地區(qū)的老年人需要志愿者提供幫助與性別有關.,(3)由(2)的結論知,該地區(qū)老年人是否需要幫助與性別有關,并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此,在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣的方法取得樣本.可知分層抽樣的方法比采用簡單隨機抽樣方法更好.,考點1,考點2,考點3,解題心得獨立性檢驗的方法 (1)構造22列聯(lián)表; (2)計算K2的觀測值k; (3)查表確定有多大的把握判定兩個變量有關聯(lián). 注意:查表
15、時不是查最大允許值,而是先根據(jù)題目要求的百分比找到第一行對應的數(shù)值,再將該數(shù)值對應的k值與求得的K2的觀測值k相比較.另外,表中第一行數(shù)據(jù)表示兩個變量沒有關聯(lián)的可能性p,所以其有關聯(lián)的可能性為1-p.,考點1,考點2,考點3,對點訓練3某校衛(wèi)生所成立了調(diào)查小組,調(diào)查“按時刷牙與不患齲齒的關系”,對該校某年級800名學生進行檢查,按患齲齒和不患齲齒分類,得匯總數(shù)據(jù):按時刷牙且不患齲齒的學生有160名,不按時刷牙但不患齲齒的學生有100名,按時刷牙但患齲齒的學生有240名. (1)該校4名校衛(wèi)生所工作人員甲、乙、丙、丁被隨機分成兩組,每組2人,一組負責數(shù)據(jù)收集,另一組負責數(shù)據(jù)處理,求工作人員甲、乙
16、分到同一組的概率. (2)能否在犯錯誤的概率不超過0.001的前提下認為該年級學生按時刷牙與不患齲齒有關系?,考點1,考點2,考點3,解:(1)4人分組的所有情況如下表.,因此4人分組的情況共有6種,其中工作人員甲乙分到同一組有2種,所以工作人員甲、乙分到同一組的概率是,(2)根據(jù)題意,列22聯(lián)表如下.,考點1,考點2,考點3,所以在犯錯誤的概率不超過0.001的前提下認為該年級學生按時刷牙與不患齲齒有關系.,考點1,考點2,考點3,2.回歸分析是處理變量相關關系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關關系,如果有就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀測值,預測變量的
17、取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程. 3.根據(jù)K2的值可以判斷兩個分類變量有關的可信程度,并用來指導科研和生活實際.,考點1,考點2,考點3,1.相關關系與函數(shù)關系的區(qū)別 相關關系與函數(shù)關系不同,函數(shù)關系中的兩個變量之間是一種確定性關系.例如正方形面積S與邊長x之間的關系S=x2就是函數(shù)關系.相關關系是一種非確定性關系,即相關關系是非隨機變量與隨機變量之間的關系.例如商品的銷售額與廣告費之間的關系是相關關系.兩個變量具有相關關系是回歸分析的前提. 2.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值.,