《人教版高中數(shù)學(xué)高二選修2-3 第三章《回歸分析》教案1》由會員分享,可在線閱讀,更多相關(guān)《人教版高中數(shù)學(xué)高二選修2-3 第三章《回歸分析》教案1(5頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、?
?
?
n
?
打印版本
§3.2 回歸分析(1)
教學(xué)目標(biāo)
(1)通過實例引入線性回歸模型,感受產(chǎn)生隨機(jī)誤差的原因;
(2)通過對回歸模型的合理性等問題的研究,滲透線性回歸分析的思想和 方法;
(3)能求出簡單實際問題的線性回歸方程.
教學(xué)重點,難點
線性回歸模型的建立和線性回歸系數(shù)的最佳估計值的探求方法.
教學(xué)過程
一.問題情境
1. 情境:對一作直線運動的質(zhì)點的運動過程觀測了 8 次,得到如下表所示的數(shù) 據(jù),試估計當(dāng) x=9時的位置 y 的值.
時刻 x /s
1 2
3
4
5 6 7 8
位置觀測值 y
2、/cm
5.54 7.52 10.02 11.73 15.69 16.12 16.98 21.06
根據(jù)《數(shù)學(xué) 3 (必修)》中的有關(guān)內(nèi)容,解決這個問題的方法是: 先作散點圖,如下圖所示:
從散點圖中可以看出,樣 本點呈直線趨勢,時間 x 與位 置觀測值 y 之間有著較好的線 性關(guān)系.因此可以用線性回歸 方 程 來 刻 畫 它 們 之 間 的 關(guān) 系.根據(jù)線性回歸的系數(shù)公
式,
ì n
x y -nx y i i
?b = i =1
í ?x 2 -n ( x ) 2 ? i
i =1
??a=y-bx
可以得到線性回歸方為 y =
3、3.5361+2.1214x ,所以當(dāng) x =9 時,由線性回歸方 程可以估計其位置值為 y =22.6287
2.問題:在時刻 x =9 時,質(zhì)點的運動位置一定是 22.6287cm 嗎?
二.學(xué)生活動
思考,討論:這些點并不都在同一條直線上,上述直線并不能精確地反 映 x 與 y 之間的關(guān)系, y 的值不能由 x 完全確定,它們之間是統(tǒng)計相關(guān)關(guān)系,
y 的實際值與估計值之間存在著誤差.
三.建構(gòu)數(shù)學(xué)
1.線性回歸模型的定義:
高中數(shù)學(xué)
n
n
?
?
?
n
?
n
n
?
?
i
i
打印版本
4、
我們將用于估計 y 值的線性函數(shù) a +bx 作為確定性函數(shù);
y 的實際值與估計值之間的誤差記為 e
,稱之為隨機(jī)誤差;
將 y =a +bx +e稱為線性回歸模型.
說明:(1)產(chǎn)生隨機(jī)誤差的主要原因有:
①所用的確定性函數(shù)不恰當(dāng)引起的誤差;
②忽略了某些因素的影響;
③存在觀測誤差.
(2)對于線性回歸模型,我們應(yīng)該考慮下面兩個問題:
①模型是否合理(這個問題在下一節(jié)課解決);
②在模型合理的情況下,如何估計 a , b ?
2.探求線性回歸系數(shù)的最佳估計值:
對于問題②,設(shè)有 n 對觀測數(shù)據(jù) ( x , y ) (i =1,2,3
5、, , n) ,根據(jù)線性回歸模
i i
型,對于每一個 x ,對應(yīng)的隨機(jī)誤差項 e =y -( a +bx ) ,我們希望總誤差越
i i i i
小越好,即要使
?
e
2
i
越小越好.所以,只要求出使 Q (a,
b) =?( y -bx -a)
i i
2
i =1
i =1
取得最小值時的 a , b 值作為 a , b 的估計值,記為 a , b .
注:這里的 e
i
就是擬合直線上的點
(
x , a +bx i i
)
到點 P
6、
i
(
x , y
i i
)
的距離.
用什么方法求 a , b ?
回憶《數(shù)學(xué) 3(必修)》“2.4 線性回歸方程”P71“熱茶問題”中求 a , b 的方法:最小二乘法.
利用最小二乘法可以得到 a , b 的計算公式為
ì n
( x -x )( y -y ) i i
?b = i =1
í ?( x -x ) 2 ? i
i =1
??a=y-bx
=
?
i =1
?
i =1
x y -nx y i i
x 2 -n ( x) 2 i
,
7、1 n 1 n
其中 x = x , y = y
n n
i =1 i =1
由此得到的直線 y =a +bx 就稱為這 n 對數(shù)據(jù)的回歸直線,此直線方程即
為線性回歸方程.其中 a , b 分別為 a , b 的估計值, a 稱為回歸截距, b 稱
高中數(shù)學(xué)
打印版本
為回歸系數(shù), y 稱為回歸值.
在 前 面 質(zhì) 點 運 動 的 線 性 回 歸 方 程 y =3.5361+2.1214x 中 , a =3.5361 , b =2.1214 .
3. 線性回歸方程 y =a +bx 中 a ,b 的意義是:以 a 為基數(shù), x 每增加 1
8、個單位,
y
相應(yīng)地平均增加 b 個單位;
4. 化歸思想(轉(zhuǎn)化思想)
在實際問題中,有時兩個變量之間的關(guān)系并不是線性關(guān)系,這就需要我 們根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q, 把非線性方程轉(zhuǎn)化為線性回歸方程,從而確定未知參數(shù).下面列舉出一些常 見的曲線方程,并給出相應(yīng)的化為線性回歸方程的換元公式.
(1) y =a +
b 1
,令 y ' =y , x ' = ,則有 y ' =a +bx ' . x x
(2) y =ax b ,令 y ' =ln y , x ' =ln x , a ' =ln a ,則
9、有 y ' =a '+bx ' .
(3) y =ae
bx
,令 y ' =ln y , x ' =x , a ' =ln a ,則有 y ' =a '+bx ' .
b
(4) y =ae x
1
,令 y ' =ln y , x ' = , a ' =ln a ,則有 y ' =a '+bx ' .
x
(5) y =a +b ln x ,令 y ' =y , x ' =ln x ,則有 y ' =a +bx ' .
四.?dāng)?shù)學(xué)運用
1.例題:
例 1.下表給出了我國從1949 年至 1999 年人口數(shù)據(jù)資料,試根據(jù)表中
10、數(shù)據(jù)估 計我國 2004 年的人口數(shù).
年份 1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999
人口數(shù)/百 萬
542 603 672 705 807 909 975 1035 1107 1177 1246
x
y
解:為了簡化數(shù)據(jù),先將年份減去1949 ,并將所得值用 x 表示,對應(yīng)人口數(shù) 用 y 表示,得到下面的數(shù)據(jù)表:
0 5 10 15 20 25 30 35 40 45 50 542 603 672 705 807 909 975 1035 1107 1177 1246
作出 11
11、 個點 (x,y )構(gòu)成的
散點圖,
由圖可知,這些點在一條直 線附近,可以用線性回歸模
高中數(shù)學(xué)
型 y =a +bx +e
打印版本
來表示它們之間的關(guān)系.
根據(jù)公式(1)可得
ì?b?14.453,
í
??a?527.591.
這里的 a , b 分別為 a, b 的估
計值,因此線性回歸方程
為 y =527.591+14.453x
由 于 2004 年 對 應(yīng) 的 x =55 , 代 入 線 性 回 歸 方 程 y =527.591+14.453x 可 得 y =1322.506 (百萬),即
12、 2004 年的人口總數(shù)估計為 13.23 億.
例 2. 某地區(qū)對本地的企業(yè)進(jìn)行了一次抽樣調(diào)查,下表是這次抽查中所得到 的各企業(yè)的人均資本 x (萬元)與人均產(chǎn)出 y (萬元)的數(shù)據(jù):
人均
資本
3
4
5.5 6.5 7 8 9 10.5 11.5
14
x /萬元
人均
產(chǎn)出
y /萬元
4.12 4.67 8.68 11.01 13.04 14.43 17.50 25.46 26.66 45.20
(1)設(shè) y 與 x 之間具有近似關(guān)系 y ?ax 計 a 和 b 的值;
b
( a, b 為常數(shù)
13、),試根據(jù)表中數(shù)據(jù)估
(2)估計企業(yè)人均資本為 16 萬元時的人均產(chǎn)出(精確到 0.01 ).
分析:根據(jù) x , y 所具有的關(guān)系可知,此問題不是線性回歸問題,不能直接
用線性回歸方程處理.但由對數(shù)運算的性質(zhì)可知,只要對 y ?ax
b
的兩邊取對
數(shù),就能將其轉(zhuǎn)化為線性關(guān)系.
解( 1)在 y ?ax b 的兩邊取常用對數(shù),可得 lg y ?lg a +b lg x ,設(shè) lg y =z , lg a =A , lg x =X ,則 z ?A +bX .相關(guān)數(shù)據(jù)計算如圖 3 -2 -7 所示.
A
B
C
14、
D
E
F
G
H
I
J
人 均 資
1
本 x / 萬
3
4
5.5
6.5
7
8
9
10.5
11.5
元
高中數(shù)學(xué)
打印版本
人 均 產(chǎn)
2
出 y / 萬
4.12 4.67
8.68 11.01 13.04 14.43 17.5 25.46 26.66
元
3
X =lg x
0.47712
0.
60206
0.74036 0.81291 0.8451
15、0.90309 0.95424 1.02119 1.0607
4
z =lg y
0.6149 0.66932 0.93852 1.04179 1.11528 1.15927 1.24304 1.40586 1.42586
仿照問題情境可得 A ,b 的估計值 A ,b 分別為
ì?A=-0.2155, í
??b=1.5677,
由 lg a =-0.2155
可得 a ?0.6088 ,即 a , b 的估計值分別為 0.6088 和 1.5677 .
(2)由(1)知 y =0.6088x1.5677
.樣本數(shù)據(jù)及回歸曲線的圖形如圖 3 -2 -8(見
書本 P
102
頁)
當(dāng) x =16 時, y =0.6088 ′161.5677 ?47.01(萬元),故當(dāng)企業(yè)人均資本為16 萬 元時,人均產(chǎn)值約為 47.01 萬元.
高中數(shù)學(xué)