《生物統(tǒng)計(jì)學(xué) 第3章第一節(jié) 抽樣與抽樣分布》由會(huì)員分享,可在線閱讀,更多相關(guān)《生物統(tǒng)計(jì)學(xué) 第3章第一節(jié) 抽樣與抽樣分布(49頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、1統(tǒng)計(jì)方法統(tǒng)計(jì)方法2描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)3樣樣本本總體總體樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量例如:樣本均值例如:樣本均值 比例、方差比例、方差總體均值、總體均值、比例、方差比例、方差第一節(jié)第一節(jié) 抽樣與抽樣分布抽樣與抽樣分布 第二節(jié)第二節(jié) 參數(shù)估計(jì)基本方法參數(shù)估計(jì)基本方法第三節(jié)第三節(jié) 總體均值和總體比例的區(qū)間估計(jì)總體均值和總體比例的區(qū)間估計(jì)第四節(jié)第四節(jié) 兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)第五節(jié)第五節(jié) 正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計(jì)正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計(jì)41.1.了解抽樣和抽樣分布的基本概念了解抽樣和抽樣分布的基本概念2.2.理解抽
2、樣分布與總體分布的關(guān)系理解抽樣分布與總體分布的關(guān)系3.3.了解點(diǎn)估計(jì)的概念和估計(jì)量的優(yōu)良標(biāo)準(zhǔn)了解點(diǎn)估計(jì)的概念和估計(jì)量的優(yōu)良標(biāo)準(zhǔn)4.4.掌握總體均值、總體比例和總體方差的掌握總體均值、總體比例和總體方差的區(qū)間估計(jì)區(qū)間估計(jì)5一. 總體、個(gè)體和樣本二. 關(guān)于抽樣方法三. 樣本均值的分布與中心極限定理四. 樣本方差的分布五. 兩個(gè)樣本方差比的分布六. T 統(tǒng)計(jì)量的分布6總體總體(Population)(Population):調(diào)查研究的事物或現(xiàn)象的全體個(gè)體個(gè)體(Item unit)(Item unit):組成總體的每個(gè)元素樣本樣本(Sample)(Sample):從總體中所抽取的部分個(gè)體樣本容量樣本容
3、量(Sample size)(Sample size):樣本中所含個(gè)體的數(shù)量71.1.概率抽樣:根據(jù)已知的概率選取樣本概率抽樣:根據(jù)已知的概率選取樣本 簡(jiǎn)單隨機(jī)抽樣:簡(jiǎn)單隨機(jī)抽樣:完全隨機(jī)地抽選樣本完全隨機(jī)地抽選樣本 分層抽樣:分層抽樣:總體分成不同的總體分成不同的“層層”,在每一層內(nèi)進(jìn)行抽樣,在每一層內(nèi)進(jìn)行抽樣 整群抽樣:整群抽樣:將一組被調(diào)查者(群)作為一個(gè)抽樣單位將一組被調(diào)查者(群)作為一個(gè)抽樣單位 等距抽樣:等距抽樣:在樣本框中每隔一定距離抽選一個(gè)被調(diào)查者在樣本框中每隔一定距離抽選一個(gè)被調(diào)查者2.2.非概率抽樣:不是完全按隨機(jī)原則選取樣本非概率抽樣:不是完全按隨機(jī)原則選取樣本 非隨機(jī)抽
4、樣:非隨機(jī)抽樣:由調(diào)查人員自由選取被調(diào)查者由調(diào)查人員自由選取被調(diào)查者 判斷抽樣:判斷抽樣:通過(guò)某些條件過(guò)濾來(lái)選擇被調(diào)查者通過(guò)某些條件過(guò)濾來(lái)選擇被調(diào)查者3.3.配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者調(diào)查者891.所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布2.是一種理論概率分布3.隨機(jī)變量是 樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量 樣本均值, 樣本比例和樣本方差等4.結(jié)果來(lái)自容量相同容量相同的所有所有可能樣本1011設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體元素?cái)?shù)N=4。4 個(gè)元素分別為X1=1、X2=2、X3=3 、X4=4 總體的均值、方差
5、及分布如下12現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的所有可能的n n = 2 的樣本(共的樣本(共16個(gè))個(gè))13計(jì)算出各樣本的均值如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值14式中:M為樣本數(shù)目比較及結(jié)論比較及結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望)等于總體均值2. 樣本
6、均值的方差等于總體方差的1/n15 = 2.5 2 =1.2516 =10Xn = 4Xn =16當(dāng)總體服從正態(tài)分布N(, 2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值 也服從正態(tài)分布, 的數(shù)學(xué)期望為,方差為2/n。即 N(, 2/n)17當(dāng)樣本容量足夠大時(shí)(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理中心極限定理:設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個(gè)任意分布的總體1819 設(shè)總體服從正態(tài)分布N(, 2 ), X1,X2,Xn為來(lái)自該正態(tài)總體的樣本,則樣本方差S2 的分布為將2(n
7、1)稱為自由度為(n-1)的卡方分布卡方分布是統(tǒng)計(jì)學(xué)家PearsonPearson于1900年首先提出的??ǚ椒植际侵匾慕y(tǒng)計(jì)分布。在假設(shè)檢驗(yàn)、區(qū)間估計(jì)、方差分析、回歸分析和試驗(yàn)設(shè)計(jì)等數(shù)理統(tǒng)計(jì)均有重要應(yīng)用。2021 選擇容量為n 的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算卡方值2 = (n-1)S2/2計(jì)算出所有的 2值 2 2df=1=1df=4=4df=10=10df=20=20總體1.1.所有可能的樣本均值的標(biāo)準(zhǔn)差,測(cè)度所所有可能的樣本均值的標(biāo)準(zhǔn)差,測(cè)度所有樣本均值的離散程度有樣本均值的離散程度2.2.小于總體標(biāo)準(zhǔn)差小于總體標(biāo)準(zhǔn)差 ?3.3.計(jì)算公式為計(jì)算公式為222324設(shè)X1,X2, ,Xn
8、1是來(lái)自于一個(gè)正態(tài)分布總體X N(1,12 )的一個(gè)樣本, Y1,Y2, ,Yn2是來(lái)自正態(tài)總體YN(2, 22)的一個(gè)樣本,且Xi(i=1,2,,n1),Yi(i=1,2, ,n2)相互獨(dú)立,則將F(n1-1 , n2-1 )稱為第一自由度為(n1-1),第二自由度為(n2-1)的F分布25不同自由度的抽樣分布F 分布是統(tǒng)計(jì)學(xué)家R. A. FisherR. A. Fisher于1924年首先發(fā)現(xiàn)的。F 分布在假設(shè)檢驗(yàn)、區(qū)間估計(jì)、方差分析、回歸分析和試驗(yàn)設(shè)計(jì)等數(shù)理統(tǒng)計(jì)均有重要應(yīng)用。26英國(guó)統(tǒng)計(jì)學(xué)家威廉西利戈塞特(Willam Sealy Gosset)在1908年提出。2728設(shè)X1,X2,X
9、n是來(lái)自正態(tài)總體N(1, 12)的一個(gè)樣本, 稱t t 分布分布正態(tài)分布正態(tài)分布不同自由度的不同自由度的t t分布分布一.點(diǎn)估計(jì)二.點(diǎn)估計(jì)的優(yōu)良性準(zhǔn)則三.區(qū)間估計(jì)2930矩估計(jì)法矩估計(jì)法最小二乘法最小二乘法最大似然法最大似然法順序統(tǒng)計(jì)量法順序統(tǒng)計(jì)量法估估 計(jì)計(jì) 方方 法法點(diǎn)點(diǎn) 估估 計(jì)計(jì)區(qū)間估計(jì)區(qū)間估計(jì)31321.從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)例如: 用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì)2.點(diǎn)估計(jì)沒(méi)有給出估計(jì)值接近總體未知參數(shù)程度的信息3.點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等331. 用于估計(jì)總體某一參數(shù)的隨機(jī)
10、變量用于估計(jì)總體某一參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本中位數(shù)等例如: 樣本均值就是總體均值的一個(gè)估計(jì)量如果樣本均值 x = 3 ,則 3 就是 的估計(jì)值2. 2. 理論基礎(chǔ)是抽樣分布理論基礎(chǔ)是抽樣分布34無(wú)偏性:無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)35無(wú)偏無(wú)偏有偏有偏36一個(gè)方差較小的無(wú)偏估計(jì)量稱為一個(gè)更 有效的估計(jì)量。如,與其他估計(jì)量相比, 樣本算術(shù)平均值是一個(gè)更有效的估計(jì)量一致性:一致性:隨著樣本容量的增大,估計(jì)量越來(lái)越接 近被估計(jì)的總體參數(shù)37381.根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍2.給出總體參數(shù)落在這一區(qū)間的概率3.例如: 總體均值落在5070之間,置信度為
11、95%39402 已知2 未知 均 值方 差比 例置 信 區(qū) 間41x_XX = Zx1.總體未知參數(shù)落在區(qū)間內(nèi)的概率p1(x1,x2,,xn) 2 (x1,x2,,xn)= 1 - 2. 1 1 - - 為置信度、置信水平或置信概率 為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率 3.常用的置信水平值有 99%, 95%, 90% 相應(yīng)的相應(yīng)的 為0.01,0.05,0.1042431.數(shù)據(jù)的離散程度,用 來(lái)測(cè)度2.樣本容量3.置信水平 (1 - ),影響 Z 的大小44X = Zx請(qǐng)陳述統(tǒng)計(jì)分布的定義和內(nèi)涵陳述中心極限定理的內(nèi)容什么是置信水平47請(qǐng)檢索矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法方法及其在生命科學(xué)領(lǐng)域的具體應(yīng)用示例。兩周后提交。4849