蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 6981|回复: 32
收起左侧

[统计基础] 统计杂谈之假设检验和P值

[复制链接]
药生
发表于 2015-8-14 09:14:18 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 蜗牛98 于 2016-2-16 16:27 编辑

统计杂谈之假设检验和P
     假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
关于假设检验我们通过下面一个例子,边计算,边进行说明。
例题: 对某产品制粒工序产品的产量统计,已知上一年的年平均产量为72.2kg。今年生产的100批该颗粒的平均产量是71.8kg,产量数据的标准差为0.4kg。这两年的产量是否相同?
解:
1.对于这个问题,通常有两种结果:两年的颗粒产量没有什么区别和两年的颗粒产量有区别。
根据这两种结果会产生两种相应的假设,两个假设分别称为"原假设"和“备择假设”。通常在原假设都认为比较的双方没有区别(不管是不是和你预期不一样,因为有时候我们的预期是两者的不同,但是在假设检验中的原假设就是认为两者一致)
原假设(H0,原假设通常用H0表示):两年的颗粒产量一致,均值μ=72.2kg。如果接受原假设,则说明去年的72.2kg和今年的71.8kg,是在正常范围内的波动,实质上和去年的产量差不错,不需要特别的关注。
那么备择假设就是在原假设被否定后需要接受的假设,通常是与原假设相反的结果。
备择假设(H1,备择假设通常用H1表示):两年的颗粒产量不一致,就是μ≠72.2kg。如果接受了H1,则说明今年的颗粒产量要比上一年的低,就有麻烦了。
2. 产量数据是连续随机数据,符合正太分布。
如果H0正确,需要计算今年产量数据出现的概率是多少,如果得到的概率太小可能会拒绝H0而接受H1,就是计算出得到颗粒产量均值是71.8,标准差是0.4的概率是多少。
假设原假设是正确的,计算这个数据产生的概率,首先考虑的是抽样样本的正太分布。样本的数据量是100>30,说明样品抽样样本均值的分布符合标准正太分布。学习过统计杂谈之样本均值的抽样分布的同学应该知道,抽样样本的均值等于总体样本的均值μ=72.2,抽样样本的总体标准差,通过样本的标准差进行估算σ≈S/sqrt(n)=0.4/ sqrt(100)=0.4/10=0.04。
3. 因为抽样样本的分布符合标准正太分布,这里要计算的是标准z值
z=|μ-X|/σ=|72.2-71.80|/0.04=0.4/0.04=10
好吧,这个z值够大,大家知道在正太分布中μ±3σ的区域的占整个面积的99.73%,也就是数据出现在3σ外的概率一共才0.27%,在这里z=10的时候,大概查了一下表,出现在这个位置的概率大概是6.22E-21。这个出现的概率值我们通常称为p值。
4. 通过计算我们知道,均值为71.8,标准差0.4的数据,在原假设中出现的概率p=6.22E-21。在一般的假设中会给出显著水平α值,通常为0.05或0.01.当p<α的时候,我们拒绝原假设,接受备择假设。
也就是说,我们拒绝了两年的生产数据相同的假设,从而接受两年的生产数据不同的备择假设。就是说今年的颗粒产量比去年底,已经成为事实。针对产量的降低,需要生产部门对原因进行调查了。
回复

使用道具 举报

药徒
发表于 2015-8-14 10:24:34 | 显示全部楼层
版主,这个光用文字说好像有点难懂吧,呵呵。有点统计学基础的看起来不费劲。

点评

假设检验 主要是两个假设,太饶人了,容易让人头晕  详情 回复 发表于 2015-8-14 10:37
回复

使用道具 举报

大师
发表于 2015-8-14 10:31:43 | 显示全部楼层
讲的很细,对我这样基础的非常有帮助
回复

使用道具 举报

药徒
发表于 2015-8-14 10:33:59 | 显示全部楼层
基础差,没太看明白
回复

使用道具 举报

药生
 楼主| 发表于 2015-8-14 10:37:16 | 显示全部楼层
jackyang81329 发表于 2015-8-14 10:24
版主,这个光用文字说好像有点难懂吧,呵呵。有点统计学基础的看起来不费劲。

假设检验
主要是两个假设,太饶人了,容易让人头晕
回复

使用道具 举报

大师
发表于 2015-8-14 11:15:54 | 显示全部楼层
呵呵,这个工具应该目前在药厂用的少呀

点评

假设检验,应该不少的 很多时候,换换壳的事情  详情 回复 发表于 2015-8-14 11:54
回复

使用道具 举报

药生
 楼主| 发表于 2015-8-14 11:54:28 | 显示全部楼层
北重楼 发表于 2015-8-14 11:15
呵呵,这个工具应该目前在药厂用的少呀

假设检验,应该不少的
很多时候,换换壳的事情
回复

使用道具 举报

药徒
发表于 2015-8-14 13:35:37 | 显示全部楼层
本帖最后由 leehwadong 于 2015-8-14 13:43 编辑

楼主所举例缺数据,应有上一年的批数和标准差才能进行分析。假设上一年生产了6批,平均值是72.2,标准差是0.4,则有95%把握认为这两年生产的平均值没有差别(P值=0.063)。
把上一年当总体理解是不对的。

点评

嗯 有道理 不过,假设检验的判定标准是很多的,这里只是一个简单的说明一下假设检验 以后的t检验,卡方检验……等等这些方法有可能说到 方差相同和方差不同,展开了说,内容就太多了 这边就是让大家对假设检验有  详情 回复 发表于 2015-8-14 13:40
回复

使用道具 举报

药生
 楼主| 发表于 2015-8-14 13:40:30 | 显示全部楼层
leehwadong 发表于 2015-8-14 13:35
楼主所举例缺数据,应有上一年的批数和标准差才能进行分析。假设上一年生产了6批,平均值是72.2,标准差是0 ...


有道理
不过,假设检验的判定标准是很多的,这里只是一个简单的说明一下假设检验
以后的t检验,卡方检验……等等这些方法有可能说到
方差相同和方差不同,展开了说,内容就太多了
这边就是让大家对假设检验有个认识
可以看成是方差相同的,均值比较那个。
其实有时候我也弄的不是很清楚,平时都是软件自己算了
回复

使用道具 举报

药徒
发表于 2015-8-14 20:26:13 | 显示全部楼层
蜗牛98 发表于 2015-8-14 10:37
假设检验
主要是两个假设,太饶人了,容易让人头晕

是的,我经常忘了哪个是h0哪个是h1

点评

简单点 H0就前后出现的数据一致,都在一个置信区间里面,没有区别,差值没有意义 H1是前后出现的数据不一致,不在一个数据区间,有区别,差值有意义  详情 回复 发表于 2015-8-14 20:36
回复

使用道具 举报

药徒
发表于 2015-8-14 20:27:26 | 显示全部楼层
北重楼 发表于 2015-8-14 11:15
呵呵,这个工具应该目前在药厂用的少呀

这个用的多的,尤其是现在和以往的比较之类的,用处特别大。
回复

使用道具 举报

药生
 楼主| 发表于 2015-8-14 20:36:41 | 显示全部楼层
jackyang81329 发表于 2015-8-14 20:26
是的,我经常忘了哪个是h0哪个是h1

简单点
H0就前后出现的数据一致,都在一个置信区间里面,没有区别,差值没有意义
H1是前后出现的数据不一致,不在一个数据区间,有区别,差值有意义
回复

使用道具 举报

药徒
发表于 2015-8-14 22:28:01 | 显示全部楼层
看得懂,本科学过这些,可惜我实际没有用过,生产部看着你的统计分析,肯定头大的

点评

其实我就是生产部的  详情 回复 发表于 2015-8-15 09:48
回复

使用道具 举报

药徒
发表于 2015-8-14 22:38:59 | 显示全部楼层
hlmxjzb@163.com 发表于 2015-8-14 22:28
看得懂,本科学过这些,可惜我实际没有用过,生产部看着你的统计分析,肯定头大的

几个意思,寡人就是生产部的,我们自己做,比质量部的还专业……
回复

使用道具 举报

药徒
发表于 2015-8-15 08:52:12 | 显示全部楼层
jackyang81329 发表于 2015-8-14 22:38
几个意思,寡人就是生产部的,我们自己做,比质量部的还专业……

我因为你是质量部的
回复

使用道具 举报

药生
 楼主| 发表于 2015-8-15 09:48:27 | 显示全部楼层
hlmxjzb@163.com 发表于 2015-8-14 22:28
看得懂,本科学过这些,可惜我实际没有用过,生产部看着你的统计分析,肯定头大的

其实我就是生产部的
回复

使用道具 举报

药徒
发表于 2016-1-31 08:43:27 | 显示全部楼层
回复

使用道具 举报

发表于 2016-2-6 15:34:58 | 显示全部楼层
感谢这么详细的分析,虽然公式看得有点晕,但是结果是理解的。
回复

使用道具 举报

发表于 2016-2-16 15:35:56 | 显示全部楼层
学习了                 
回复

使用道具 举报

药徒
发表于 2016-2-16 16:08:43 | 显示全部楼层
版主,我也正好在看统计学的书,刚好看到检验这部分。关于H0和H1的理解和你解释的相同,即无区别的应该是H0.但是书上有一个例子讲有区别作为原假设,这是否错误还是我理解有误?
IMG1.jpg
IMG2.jpg

点评

这个看假设吧,其实按照一般情况原假设和备择假设都是非此即彼,接受一个就要拒绝另外一个 按照例题给出来的,这么假设也没有问题。没有必要纠结  详情 回复 发表于 2016-2-16 16:21
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-3-31 14:22

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表