您现在的位置:首页 > >

2019年第三章 抽样分布.ppt_图文

发布时间:

第三章 抽样分布 生物统计学的最基本问题 ? 生物统计学的最基本问题是研究总体与样本间的关系。 总体有两类:一是由实际研究对象构成的总体;二是 数字的总体。前者可转化为后者。生物统计研究的是 数字总体。 ? 总体与样本之间的关系,有以下两个途径: ? 总体已知,研究样本的分布规律,即由总体到样 本; ? 总体未知,由样本推断,即由样本到总体。 ? 本章研究的是第一个问题:即从总体到样本的研究过 程。 4.1 从一个正态总体中抽取的样本统计量的分布 随机样本 均值 ? ? ?X?= 50 总体 抽样分布:从一个 ? ??? ? ? ? ? ? ?? ? ? ? ? ?? 已知的总体中,独 立随机的抽取含量 为 n 的样本,研究所 随机样本 得 的 样 本 的 各 种 统 计量的概率分布。 均值 ?X?= 50 如样本平均数的抽 样 分 布 即 为 ( X, 随机样本 P(X) ) 组合 均值 ? ??X = 52 一、 样本平均数的分布 1、总体标准差已知时,样本平均数的分布服从u 分布(正态分 布) 从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本, 则 ? x ? ?, ? x ? ? n ?2 n 由此可知,样本平均数是一服从正态分布的随机变量,记为 X 服从 N ( ? , ) 将平均数标准化,则 u ? x ? ? ,其中标准化的分母为平均数的标准误。 ? n 从一正态总体中抽样 ?集中趋势 ?离散趋势 ?x ? ? (样本平均数间的差异程度) 总体分布 ??= 10 ? ?x ? n ?样本平均数正态分布的标准化 ? = 50 X u? x?? 抽样分布 n = 4? ? ?X = 5 - = 50 ?X ? n n =16? ??X = 2.5 X 例1:在总体X~N(80,202)中随机地抽取一容量为 100 的样本,问样本均值与总体均值的差的绝对值大于 3的概率是多少? 解:设 W是样本均值变量,因总体服从正态分布, 所以W~N(μ,σ2/n) 这里μ=80,σ2=202,n=100,即W~N(80,22) P{∣W-μ∣>3}=P{∣W-80∣>3} = 1-P{∣W-80∣≤3} = 1-P{77≤W≤83} ? ? 83 ? 80 ? ? 77 ? 80 ?? ? 1 ? ?F ? ? ? F? ?? ? 2 ?? ? ? 2 ? = 1-[F(1.5)-F(-1.5)] = 2 [ 1-F(1.5)] = 0.1336 例 2 :在总体 X~N(μ,0.5) 中要以 99.7 %的概率保证偏差 ∣X -μ∣<0.1,问抽取的样本其容量n应取多大? ? ? ? ? ? ? ? X ?? 0.1 ? ? ? ? 1 ? 2 F ? ? 0.1 ? 即, P?? ? ? ? 0.5 ? ? 0.997 0.5 ? ? 0.5 ? ? ? ? n ? n ? ? ? n 解:P {∣ X -μ∣<0.1}= 0.997 ? ? ? ? 0.1 ? 得, F? ? ? 0.0015 ? 0.5 ? n? ? 所以, 0.1 ? 2.97 0.5 n ? n ? 442 二、总体标准差未知时,样本平均数的分布服从t分 布 ? σ 未知时可用样本标准差 s 代替,标准化变量并不服从正态分 布,而服从具n-1自由度的 t 分布 t ? x ? ? ,其分母为样本标准 s 误差。 n ? 自由度:独立观测值的个数。在这里因为计算 s 时所使用的 n 个观测值,受到平均数x的约束,这就等于有一个观测值不能独 立取值,因此自由度 df =n-1。 ? t 分布的密度函数:(不要求掌握) ? t 分布的特征数: ? t ? 0(df ? 1) df ?t ? (df ? 2) df ? 2 t 分布曲线 ? t分布受自由度的制约,每一个自由度都有一条 t 分布密度曲线。 ? t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布 密度函数取得最大值。 ? 与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而 平。df 越小这种趋势越明显。df 越大,t分布越趋近于标准正 态分布。 ?当n >30时,t分布与标准正态 分布的区别很小; ?n >100 时, t 分布基本与标准 正态分布相同; ?n→∞时,t 分布与标准正态分 布完全一致。 t 分布的单侧分位数与双侧分位数的查表方法(附表4) 与正态分布表的查法一致,表示方式也与u分布相同。 例:自由度为9的t分布图如下图所示,求t1的值,使其满足 ? 右边阴影的面积=0.05 t1 =1.83 ? 全部阴影的面积=0.05 t1 =2.26 ? 全部非阴影面积=0.99 t1 =3.25 ? 左边阴影的面积=0.01 t1 =2.82 ? 左边的总面积 =0.90 t1 =1.38 二、 样本方差s2的分布——χ2分布 ? 从方差为σ2的正态总体中,随机抽取含量为n的样本,可计 算出样本方差s2。在讨论样本方差s2的分布时,通常并不直 接谈s2的分布,而是将它标准化,得到一个不带任何单位的 纯数。该纯数服从n-1自由度的卡方分布。 ? 卡方值:χ2df=(n-1) s2 /σ2 ? χ2分布是概率曲线随自由度而改变的一类分布(其密度函数 较复杂 ,不要求掌握) χ2分布曲线: ? χ2分布是连续型变量的分 布,每个不同的自由度都 有一个相应的χ 2分布曲线; ? 对于较小的自由度,其分 布曲线明显右倾, df=1 时曲线以纵轴为渐近线; ? 随着自由度的增加,其偏 斜度和峭度接近于 0 ,这 时的分布近似于正态分布。 样本方差(卡方)分布的几个特征数: ?s ? ? 2 2 ?s2的理论平均数(数学期望)是σ2。 ?s ?? 2 2 2 df ?s2 的偏斜度及峭度均只跟自由度有 关,随着 df 的增加,


热文推荐
猜你喜欢
友情链接: 工作计划 总结汇报 团党工作范文 工作范文 表格模版 生活休闲