您现在的位置:首页 > >

2019年-MSR4-抽样调查-20191010-PPT精选文档_图文

发布时间:

第四讲 一 二 三 四 抽样调查 抽样调查的概念与术语 抽样的程序 概率抽样 非概率抽样 ▲著名的抽样失败案例 1936,美国《文学文摘》(Literary Digest )预测总统候选人A. Landon 和F. Roosevelt的得票率。 从电话薄的车牌登记名单中抽出1000 万人,收到200万人回应。 抽样调查预测A. Landon的支持率为 57%, F. Roosevelt的支持率为43%,但实 际他以61%的优势获胜。 ▲抽样成功案例 1968,G. Gallup 的美国民意调查研究 所(American Institute of Public Opinion) 仅用2000人作为样本成功地预 测总统候选人R. Nixon的得票率(抽样调 查预测的支持率为43%,实际得票率 42.9%)。 一、抽样调查(Survey Sampling)的概念与术 语 普查(General Survey) 概率抽样(Probability Sampling) 抽样调查 非概率抽样(Nonprobability Sampling) ▲概率抽样包括: 简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样 概率比例抽样 ▲非概率抽样包括: 偶遇抽样 目标或判断抽样 定额抽样 滚雪球抽样 1 . 要 素 / 元 素 ( Element ) 与 抽 样 单 位 (Sampling Unit) 要素 = 搜集信息的单位(人,家庭,组织,社 区;文章,词,杂志,歌曲;汽车) 抽样单位 = 抽样各阶段中选取的要素或要素集 合(省,市,县 / 区,街道 / 乡,居委会 / 村, 家庭/个人) 2.总体(Population)=研究总体(袁方书) 研究总体=理论上界定的研究要素的特定集合体 (内容,单位,范围,时间) 如:妇女(15-50岁),人,中国,2019年 3.调查总体(Study Population)=研究者从中 实际抽取调查样本的全体要素的总和 如(上例):除台湾以外、不在医院和监狱里 的 4.抽样框(Sampling Frame) 抽样框=各阶段抽样单位的实际名单(全部省,市, 县/区,街道/乡,居委会/村,家庭/个人名单) 5.参数值(Parameter)与统计值(Statistic) 参数值=总体中某变量的综合描述 统计值=调查样本中某变量的综合描述 二、抽样的程序 1.界定总体和调查总体 ▲要考虑调查总体是否代表总体 (《文学文摘》抽样失败案例) 2.编制抽样框 3.设计和抽取样本 设计:各阶段抽取多少(根据抽样方法的要求计算) 例:入户访问填答问卷时 不在家或拒答的情况:二访或三访/选左邻 4.评估样本并对总体进行估计 (1)准确性:抽样严格按随机原则;设法 减少无回答率 (2)精确性:比较随机抽取的样本与总体 的特征是否符合(如调查人均受教育年 限时抽取的样本的性别比;调查家庭人 均收入时抽取的样本的户均人口数分布) 三、概率抽样(Probability Sampling) ▲抽样的核心原则: 使样本能代表总体 => 使任何要素都具有 同等的、独立于任何其他事件的被抽到 的概率(如抽样过程中要素之间的影响) =>要素的特征的结构与总体相似 1 . 简 单 随 机 抽 样 ( Simple Random Sampling ) 和 系 统 抽 样 ( Systematic Sampling) 简单随机抽样=建立了合适的抽样框后, 编码,然后利用随机数字表来抽样 (1)利用随机数字表来进行简单随机抽样 例:从1100人中抽100人 ---把1100人编号 ---确定4位随机数字 ---确定4位随机数字的选择方法 (方法要固 定) ▲ 注意: ---只挑在1—1100间的数 ---若碰到了以前选过的数:跳过 (2)系统抽样(=等距抽样):每隔K (抽样间距)个要素抽一个 ▲ 术语: 抽样比率=样本数/总体数 抽样间距(K)=总体数/样本数 ▲ 要求:(两个随机) ---抽样框中要素在抽样前随机排列 ---开始抽的第一个号码须随机 ▲ 危险:当抽样框中要素,依照其某个特征 变量的值发生有规律的排列时,抽样结果有可 能会产生重大偏误.特别注意如下两种情况: (1)循环排列(Cyclical Pattern) (2)高低有序排列(如学生按成绩从高到底排) 解决方法: ---打乱,使之随机 ---在每个间隔内用简单随机抽样 ■简单随机抽样与系统抽样的比较 简单随机抽样在编码前无须使之随机; 系统抽样须在排列时使之随机 2.分层抽样(Stratified Sampling) Q :当总体异质性高时,为了避免抽取过 大的样本,如何抽样? 操作方法: 1)选择分层变量:要与想描述的变量紧密 相关 例1:调查各类人员对经济体制改革的看法 例2:调查高校在校生的就职倾向 例3:调查企业职工读书的数量 2)进行分层抽样: 方法 1 :按相对比例从分层得到的次级集 合中随机抽样/系统抽样 方法 2 :把各次级集合连续列表,然后对 列表进行一个随机起始的系统抽样 Q1:在方法2中,能否对各次级集合的连续 列表进行简单随机抽样? 注意:在方法2中,不能对各次级集合的连 续列表进行简单随机抽样!因为这样一来 又回到了简单随机抽样 ( 简单随机抽样对 要素的排列顺序无任何要求) Q2:为什么这样抽样的误差小?换言之,为 什么在同样精度要求下 , 分层抽样可以降 低样本数量? ▲分层抽样适合于异质性高的总体 3.整群抽样(Cluster Sampling) 当总体中的要素明显分成许多子群,且 子群间同质性高,子群内异质性高时, 抽出若干子群就能代表总体(抽中的子 群内所有要素均成为样本) ▲抽子群的方法:随机抽样/系统抽样 例:一个城市中的若干小学;居委会;一 个县的若干村 ▲分层抽样与整群抽样的比较 4 . 多 阶 段 整 群 抽 样 (Mu


热文推荐
猜你喜欢
友情链接: 工作计划 总结汇报 团党工作范文 工作范文 表格模版 生活休闲