《高三數(shù)學一輪復習 第十二章 統(tǒng)計 第75課 變量的相關性與統(tǒng)計案例學案 文》由會員分享,可在線閱讀,更多相關《高三數(shù)學一輪復習 第十二章 統(tǒng)計 第75課 變量的相關性與統(tǒng)計案例學案 文(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第75課 變量的相關性與統(tǒng)計案例
1. 兩個變量的線性相關
(1)正相關:在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.
(2)負相關:在散點圖中,點散布在從左上角到右下角的區(qū)域, 對于兩個變量的這種相關關系,我們將它稱為負相關.
(3)相關系數(shù)r=,當r>0時,兩變量正相關,當r<0時,兩變量負相關,當|r|≤1且|r|越接近于1,相關程度越高,當|r|≤1且|r|越接近于0,相關程度越低.
(4)線性相關關系、回歸直線
如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回
2、歸直線.
2.回歸方程
(1)最小二乘法:求回歸直線,使得樣本數(shù)據(jù)的點到它的距離的平方和最小的方法叫做最小二乘法.
(2)回歸方程:方程是兩個具有線性相關關系的變的一組數(shù)據(jù) , , … , )的回歸方程,其中是待定參數(shù).
,
3.兩個分類變量的獨立性檢驗的一般步驟:
(1)列出兩個分類變量的列聯(lián)表:
(2)假設兩個分類變量無關系;
(3)計算(其中為樣本容量);
(4)把的值與臨界值比較,確定有關的程度或無關系.
【例1】對變量有觀測數(shù)據(jù),得散點圖⑴;對變量有觀測數(shù)據(jù),得散點圖⑵. 由這兩個散點圖可以判斷( ?。?
A.變量與正相
3、關,與正相關 B.變量與正相關,與負相關
C.變量與負相關,與正相關 D.變量與負相關,與負相關
【變式】為了解某商品銷售量(件)與銷售價格(元/件)的關系,統(tǒng)計了的10組值,并畫成散點圖如圖,則其回歸方程可能是( )
A.
B.
C.
D.
【例2】(2020新課標II卷)某地區(qū)2020年至2020年農(nóng)村居民家庭人均純收入(單位:千元)的數(shù)據(jù)如下表:
年份
2020
2020
2020
2020
2020
2020
2020
年份代號t
1
2
3
4
5
6
7
人均純收入y
2.9
3.3
3.6
4.4
4.
4、8
5.2
5.9
(Ⅰ)求關于的線性回歸方程;
(Ⅱ)利用(Ⅰ)中的回歸方程,分析2020年至2020年
該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,
并預測該地區(qū)2020年農(nóng)村居民家庭人均純收入.
附:回歸直線的斜率和截距的最小二乘估計公式分別為:
【解析】(Ⅰ)由所給數(shù)據(jù)計算得:,
,
,
==,
,,
所求回歸方程為.
(Ⅱ)由(Ⅰ)由知,,故年至年該地區(qū)農(nóng)村居民家庭人均純收入逐 年增加,平均每年增加千元.
將年的年份代號代入(Ⅰ)中的回歸方程,得,
故預測該地區(qū)年農(nóng)村居民家庭人均純收入為千元.
【變式】 (2020江門一模)某產(chǎn)品的廣
5、告費用與銷售額的統(tǒng)計數(shù)據(jù)如下表:
根據(jù)上表數(shù)據(jù)用最小二乘法求得關于的線性回歸方程中,,則據(jù)此模型預測,廣告費用為萬元時,銷售額約為 .
【答案】萬元
【解析】∵,,
∴,
∴廣告費用為萬元時,銷售額約為(萬元).
【例3】今年春節(jié)黃金周,記者通過隨機詢問某景區(qū)110名游客對景區(qū)的服務是否滿意,得到如下的列聯(lián)表:
性別與對景區(qū)的服務是否滿意(單位:名).
(1)從這50名女游客中按對景區(qū)的服務是否滿意采取分層抽樣,抽取一個容量為5的樣本,問樣本中滿意與不滿意的女游客各有多少名?
(2)從(1)中的5名女游客樣本中隨機選取兩名作深度訪談,求選到滿意與不滿意的女
6、游客各一名的概率;
(3)根據(jù)以上列聯(lián)表,問有多大把握認為“游客性別與對景區(qū)的服務滿意”有關.
【解析】(1)由題意,樣本中滿意的女游客為名,
不滿意的女游客為名.
(2)記樣本中對景區(qū)的服務滿意的3名女游客分別為,對景區(qū)的服務不滿意的2名女游客分別為.
從5名女游客中隨機選取兩名,共有10個基本事件,分別為,,,,.
其中事件:選到滿意與不滿意的女游客各一名包含了6個基本事件,分別為,,,
∴所求概率.
(3)假設:該景區(qū)游客性別與對景區(qū)的服務滿意無關,則應該很?。?
根據(jù)題目中列聯(lián)表得:.
由可知:有99%的把握認為該景區(qū)游客性別與對景區(qū)的服務滿意有關.
【變式】以
7、下四個命題: ①在一次試卷分析中,從每個試室中抽取第5號考生的成績進行統(tǒng)計,是簡單隨機抽樣;②樣本數(shù)據(jù):,,,,的方差為;③對于相關系數(shù),越接近,則線性相關程度越強;④通過隨機詢問名性別不同的行人,對過馬路是愿意走斑馬線還是愿意走人行天橋進行抽樣調(diào)查,得到如下列聯(lián)表:
由可得,
, 附表
則有在犯錯誤率不超過的條件下認為“選擇過馬路方式與性別有關”.其中正確的命題序號是 .
第75課 變量的相關性與統(tǒng)計案例的后作業(yè)
1.在回歸分析中,殘差圖中縱坐標為( )
A.殘差 B.樣本編號 C. D.
【答案
8、】A
2.(2020韶關一模)已知回歸直線的斜率的估計值為,樣本點的中心為,則回歸直線方程為( )
A. B. ?C.? D.
【答案】C
【解析】依題意可得, ∴ ,∴ .
3.已知與之間的一組數(shù)據(jù):則與的線性回歸方程必過點 ( )
A. B. C. D.
【答案】D
【解析】,.
4.對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是 ( )
A. B. C. D.
【答案】A
【解析】易知題中圖(1)與圖(
9、3)是正相關,圖(2)與圖(4)是負相關,且圖(1)與圖(2)中的樣本點集中分布在一條直線附近,則.
5. (2020·江西高考)某人研究中學生的性別與成績、視力、智商、閱讀量這4個變量之間的關系,隨機抽查52名中學生,得到統(tǒng)計數(shù)據(jù)如表1至表4,則與性別有關聯(lián)的可能性最大的變量是( )
A.成績 B.視力 C.智商 D.閱讀量
【答案】D
【解析】因為K==,K==,K==,K==,則有K>K>K>K,所以閱讀量與性別關聯(lián)的可能性最大.
6.某班主任對全班30名男生進行了作業(yè)量多少的調(diào)查,數(shù)據(jù)如下
10、表:該班主任據(jù)此推斷男生認為作業(yè)多與喜歡玩電腦游戲有關系,則這種推斷犯錯誤的概率不超過________.
【答案】
【解析】計算得 的觀測值為,則推斷犯錯誤的概率不超過 .
7.某數(shù)學老師身高176 cm,他爺爺、父親和兒子的身高分別是173 cm、170 cm和182 cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為________ cm.
【答案】
【解析】兒子和父親的身高可列表如下:
父親身高
173
170
176
兒子身高
170
176
182
設線性回歸方程為,由表中的三組數(shù)據(jù)可求得,且過中心點,故,故線性回歸方程為,
11、將代入得孫子的身高為cm.
8.從某居民區(qū)隨機抽取10個家庭,獲得第個家庭的月收入(單位:千元)與月儲蓄(單位:千元)的數(shù)據(jù)資料,算得,,,.
(1)求家庭的月儲蓄對月收入的線性回歸方程;
(2)判斷變量與之間是正相關還是負相關,并說明這10個家庭月儲蓄對于月收入的變化情況;
(3)若該居民區(qū)某家庭月收入為7千元,預測該家庭的月儲蓄.
附:線性回歸方程中,,, 其中,為樣本平均值.
9. 某中學研究性學習小組,為了研究高中學生的作文水平是否與愛看課外書有關系,在本校高三年級隨機調(diào)查了50名學生.調(diào)查結(jié)果表明:在愛看課外書的25人中有18人作文水平好,另外
12、7人作文水平一般;在不愛看課外書的25人中有6人作文水平好,另外19人作文水平一般.
(1)試根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表,并運用獨立性檢驗思想,指出有多大把握認為高中學生的作文水平與愛看課外書有關系;
愛看課外書
不愛看課外書
總計
作文水平好
作文水平一般
總計
(2)將其中某5名愛看課外書且作文水平好的學生分別編號為1,2,3,4,5,某5名愛看課外書且作文水平一般的學生也分別編號為1,2,3,4,5,從這兩組學生中各任選1人進行學習交流,求被選取的2名學生的編號之和為3的倍數(shù)或4的倍數(shù)的概率.
參考公式:,其中.
參考數(shù)據(jù)
13、:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【解析】(1)2×2列聯(lián)表如下:
愛看課外書
不愛看課外書
總計
作文水平好
18
6
24
作文水平一般
7
19
26
總計
25
25
50
因為
由表知 ,
所以有 的把握認為高中學生的作文水平與愛看課外書有關系.
(2)設“被選取的2名學生的編號之和為3的倍數(shù)”為事件,“被選取的2名學生的編號之和為4的倍數(shù)”為事件.
則基本事件為
1
2
3
4
14、
5
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
2
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
3
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
4
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
共25個,
因為事件所包含的基本事件為(1,2),(1,5),(2,1),(2,4),(3,3),(4,2),(4,5),(5,1),(5,4),共9個,所以 ;事件所包含的基本事件為(1,3),(2,2),(
15、3,1),(3,5),(4,4),(5,3),共6個,所以.
因為事件、互斥,所以 ,
即被選取的2名學生的編號之和為3的倍數(shù)或4的倍數(shù)的概率為.
轎車A
轎車B
轎車C
舒適型
100
150
z
標準型
300
450
600
10.一汽車廠生產(chǎn)A,B,C三類轎車,每類轎車均有舒適型和標準型兩種型號,某月的產(chǎn)量如下表(單位:輛):
按類用分層抽樣的方法在這個月生產(chǎn)的轎車中抽取50輛,其中有A類轎車10輛.
(1)求z的值;
(2)用分層抽樣的方法在C類轎車中抽取一個容量為5的樣本.將該樣本看成一個總體,從中任取2輛,求至少有1輛舒適型轎車的概率;
(
16、3)用隨機抽樣的方法從B類舒適型轎車中抽取8輛,經(jīng)檢測它們的得分如下:
9.4 ,8.6 ,9.2 ,9.6 ,8.7 ,9.3 ,9.0 ,8.2,把這8輛轎車的得分看成一個總體,從中任取一個數(shù),求該數(shù)與樣本平均數(shù)之差的絕對值不超過0.5的概率.
【解析】(1)設該廠這個月共生產(chǎn)轎車n輛,由題意得,所以,
則 .
(2)設所抽樣本中有a輛舒適型轎車,由題意得,則.
因此抽取的容量為5的樣本中,有2輛舒適型轎車,3輛標準型轎車.用A1,A2表示2輛舒適型轎車,用B1,B2,B3表示3輛標準型轎車,用E表示事件“在該樣本中任取2輛,其中至少有1輛舒適型轎車”,則基本事件空間包含的基本事
17、件有:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),共10個.
事件E包含的基本事件有:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),共7個.故P(E)=,即所求概率為.
(3)樣本平均數(shù)=(9.4+8.6+9.2+9.6+8.7+9.3+9.0+8.2)=9.
設D表示事件“從樣本中任取一個數(shù),該數(shù)與樣本平均數(shù)之差的絕對值不超過0.5”,則基本事件空間中有8個基本事件,事件D包含的基本事件有9.4,8.6,9.2,8.7,9.3,9.0,共6個,所以P(D)==,即所求概率為.