蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 9190|回复: 25
收起左侧

[统计基础] 假设检验 从“女士品茶”谈起

[复制链接]
药生
发表于 2016-9-13 12:56:02 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
那是20 世纪20 年代后期,在英国剑桥一个夏日的午后,一群大学的绅士和他们的夫人们,还有来访者,正围坐在户外的桌旁,享用着下午茶。在品茶过程中,一位女士坚称:把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。在场的一帮科学精英们,对这位女士的“胡言乱语”嗤之以鼻。这怎么可能呢?他们不能想象,仅仅因为加茶加奶的先后顺序不同,茶就会发生不同的化学反应。然而,在座的一个身材矮小、戴着厚眼镜、下巴上蓄着的短尖髯开始变灰的先生,却不这么看,他对这个问题很感兴趣。他兴奋地说道:“让我们来检验这个命题吧!”并开始策划一个实验。

于是一群人就热心帮忙准备实验,准备了若干杯奶茶,有些是先放茶再加牛奶,有些先放牛奶再加茶,并将这些奶茶随机排序让这位女士品茗。在设计实验时,为了避免许多不相关的因素影响这位女士的口味辨别,还需要将茶和牛奶充分混合的时间、泡茶的时间及水的温度控制一样等等。

最后,在决战来临的气氛中,蓄短胡须的先生为那位先生为那位女士奉上第一杯茶,女士品了一小会儿,然后断言这一杯是先倒的茶后加的奶。这位先生不加评论地记下了女士的说法,然后,又奉上了第二杯……

剑桥那个夏日午后的情形正是如此,那个留着短胡须的先生就是罗纳德·艾尔默·费歇尔(Ronald Aylmer Fisher),当时他只有三四十岁。后来,他被授予爵士头衔。1935 年,他写了一本叫《实验设计》(The Design of Experiments)的书,书的第2 章就描述了他的
“女士品茶”实验 (The Lady Tasting Tea Test)。在书中,他把女士的断言视为假设问题,他考虑了各种可能的实验方法,以确定那位女士是否能做出区分。设计实验时的问题是,如果只给那位女士一杯茶,那么即使她没有区分能力,她也有50%的机会猜对。如果给两杯茶,她仍可能猜对。事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)。

同样,即便这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热。

至于前面所说的女士品茶-那个在剑桥晴朗的夏日午后所做的实验中,那位女士怎样了呢?费歇尔没有描述这项实验的结果,但史密斯教授告诉我,那位女士竟然正确地分辨出了每一杯茶!




Fisher.jpg
回复

使用道具 举报

药士
发表于 2016-9-13 13:00:08 | 显示全部楼层
谁哪有闲情雅趣听这个啊

点评

你还真以为这是讲女士品茶?这本书可算得上写得非常精彩的统计学发展史  详情 回复 发表于 2016-9-29 17:02
回复

使用道具 举报

药徒
发表于 2016-9-13 13:06:21 | 显示全部楼层
zysx01234 发表于 2016-9-13 13:00
谁哪有闲情雅趣听这个啊

井底蛙、自以为是。哈哈

点评

靠  详情 回复 发表于 2016-9-13 13:11
回复

使用道具 举报

药士
发表于 2016-9-13 13:11:47 | 显示全部楼层
回复

使用道具 举报

药徒
发表于 2016-9-13 13:16:44 | 显示全部楼层
从福尔摩斯探案开始,不放过任何一个蛛丝马迹,找出排除的理由或是证据

点评

卷福听到了应该会很开心  详情 回复 发表于 2016-9-13 16:10
回复

使用道具 举报

药士
发表于 2016-9-13 13:18:28 | 显示全部楼层
佛手罗汉 发表于 2016-9-13 13:16
从福尔摩斯探案开始,不放过任何一个蛛丝马迹,找出排除的理由或是证据

真相往往只有一个
回复

使用道具 举报

药徒
发表于 2016-9-13 13:19:39 | 显示全部楼层
那么问题来了,市面上的奶茶是把茶加到奶里还是把奶加到茶里?

点评

市面上的奶茶既不含奶,也不含茶!鉴定完毕!  详情 回复 发表于 2016-9-13 16:08
回复

使用道具 举报

药徒
发表于 2016-9-13 13:22:29 | 显示全部楼层
yuansoul 发表于 2016-9-13 13:18
真相往往只有一个

是的,真相往往只有一个
回复

使用道具 举报

药徒
发表于 2016-9-13 13:51:19 | 显示全部楼层
什么理论都能讲出渊源,加深理解
回复

使用道具 举报

药徒
发表于 2016-9-13 14:06:11 | 显示全部楼层
故事而已,任你发挥你的想象
回复

使用道具 举报

发表于 2016-9-13 16:08:17 | 显示全部楼层
在生产过程中,物料的加入顺序有时很重要,也很关键
回复

使用道具 举报

药徒
发表于 2016-9-13 16:08:44 | 显示全部楼层
yjj3706 发表于 2016-9-13 13:19
那么问题来了,市面上的奶茶是把茶加到奶里还是把奶加到茶里?

市面上的奶茶既不含奶,也不含茶!鉴定完毕!
回复

使用道具 举报

药徒
发表于 2016-9-13 16:10:00 | 显示全部楼层
佛手罗汉 发表于 2016-9-13 13:16
从福尔摩斯探案开始,不放过任何一个蛛丝马迹,找出排除的理由或是证据

卷福听到了应该会很开心

点评

你已经先他一步开心过了,你看你笑的,好那啥  发表于 2016-9-13 16:14
回复

使用道具 举报

药生
 楼主| 发表于 2016-9-14 09:52:00 | 显示全部楼层
《女士品茶》的感悟 : 小概率事件在一次试验中几乎不可能发生。它是假设检验的依据。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件在一次试验中是几乎不可能发生的; 小概率事件发生,否定原假设。<0.05的事件称为小概率事件


1909年,法国数学家勃莱尔在其专著《概率论原理》中,为了阐述字母排列的随机性,举了一个有趣的例子“打字猴子”。这个例子说的是:让一群猴子在打字机上乱敲,最后可能打出巴黎国家图书馆的全部藏书内容。这个例子被后来人趣称为“无限猴子定理”,即让无限多的猴子,或给一只猴子无限多的时间,最后会在打字机键盘上打出莎士比亚的全部作品。



回复

使用道具 举报

药生
 楼主| 发表于 2016-9-15 12:35:03 | 显示全部楼层
假设检验的基本思想

  • 检验假设所依据的原理是小概率事件原理:概率很小的事件,在一次试验中把它看成是不可能发生的。
  • 检验假设的方法称为概率性反证法:为了检验一个假设是否为真,先假定它为真,看由此会产生什么结果,如果导致了一个不合理现象的出现(即小概率事件在一次观察中认为不会出现),则表示原假设不真,因此,应该拒绝原假设 ,这就意味着接受备择假设 ;如果由此没有导致不合理现象的出现,则不能拒绝原假设。


这是Fisher的假设检验的基本思路。他调配出了八杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶,其中两类各四个 - 先茶后奶和茶。他假设女士没有这个鉴别能力(这个假设被称为原假设),然后如果女士很好的鉴别了这八杯茶,那就说明在原假设成立的情况下,发生了非常反常的现象 (概率很小的事件),以至于说明原假设是令人怀疑的。那就有理由怀疑原假设的真实性。


回复

使用道具 举报

药生
 楼主| 发表于 2016-9-15 16:00:38 | 显示全部楼层
在书中,他把女士的断言视为假设问题,他考虑了各种可能的实验方法,以确定那位女士是否能做出鉴别。设计实验时的问题是,如果只给那位女士一杯茶,那么即使她没有鉴别能力,她也有50%的机会猜对。如果给两杯茶,她仍可能猜对。

Fisher 设计了如下的试验来检验该女士的说法。

8杯茶平分成2组有70种不同组合。女士靠瞎猜将8杯茶全部正确分类的概率很小, 只有1.4%。Fisher 检测依然不能完全排除女士是猜对的可能性。只是说,她都是猜对的可能性很小。他可以通过让女士喝更多的茶进一步降低这种可能性,但是他永远不可能把这种可能性降到0。显然,一个人即使在完全缺乏辨别能力下进行大量的重复实验也将会取得可靠的成功,这个从大量试验中得出的概率是可计算的。

既然绝对的证明原假设是不可能的,他认为5%就是一个合理的阈值 (临界值)。如果我们假定某个原假设是正确的,却发现在原假设下观察到这种数据的概率不到5%,那我们就可以很安全地“拒绝”假设了。那位女士没有鉴别能力。

Fisher 计算出了各种不同实验结果的概率。看图。4杯对的概率远远小于Fisher的5%阈值,只有1.4%。

Fisher.jpg
回复

使用道具 举报

药生
 楼主| 发表于 2016-9-18 07:45:55 | 显示全部楼层
Fisher 强调原假设永远不会被证明或确定,但有可能被否定个实验存在的目的都不过是为了给事实提供一个机会去推翻假设Fisher 不是去试图证明女士可以尝出两种茶的区别,而是试图驳斥这样的假设:“女士的选择是随机的”。如果女士全说对了,这时的显著性水平为 1.4%随机试验的结果构成一个不利于原假设的显著性证据,因此应该否定原假设。即认为她具有鉴别能力。
回复

使用道具 举报

药生
 楼主| 发表于 2016-9-19 09:47:35 | 显示全部楼层
本帖最后由 kslam 于 2016-9-19 09:48 编辑

Fisher指出可争论的是如果一个实验可以否定这假设实验对象不具有从感官上分辨两种不同类别的能力,它也必须能够证明相反的假设,即她可以做出这种区分。但是,这后一个假设,虽然可能是合理的甚至是正确的,却不符合作为假设被用于检验,因为它是不确切的。如果声称实验对象在她的判断下永不出错,我们应该再有一个确切的假设,而且很容易发现这个假设会被一次失败所推翻但永远无法通过任何有限实验的证明。因此很明显,原假设必须确切,远离含糊不清或模棱两可,因为它必须提供“分布问题”的基础,而这一类问题需要用显著性检验来解答。一个原假设的确会包含独断性的成分,而且在更复杂的情况下常常会这样表达:例如,假设断言两种动物的死亡率是一样的,而没有具体说明死亡率是多少。在这种情况下, “等价”显然是该实验的目的而非测试任何死亡率的具体值,而这有可能被否定。


如何合理地设立原假设是假设检验中的关键问题。综上所述, 我们不难总结归纳出,在显著性检验中,把不能轻易否定的作为原假设。若没有充足的理由,原假设不能轻易被拒绝。原假设应该是过去经验与已获得的信息的总结。当证据不足以否定原假设,我们称拒绝原假设失败,但并不意味着原假设是正确的

回复

使用道具 举报

药士
发表于 2016-9-29 17:02:24 | 显示全部楼层
zysx01234 发表于 2016-9-13 13:00
谁哪有闲情雅趣听这个啊

你还真以为这是讲女士品茶?这本书可算得上写得非常精彩的统计学发展史
回复

使用道具 举报

药生
 楼主| 发表于 2018-3-10 10:22:04 | 显示全部楼层
上面的故事告诉我们可以使用Minitab单比率的方法进行假设检验, 以确定检验结果在统计意义上是否显著

选择正态近似作为计算 Z 值的方法。




p^        观测到的概率 x/n
x        n 个试验中观测到的事件数
n        试验数
p0        假设概率


Z 值可用于计算 p 值。

P 值 ≤ α:比率的差值在统计意义上显著(否定 H0)
P 值 > α:比率的差值在统计意义上不显著(无法否定 H0)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  京ICP证150354号  互联网药品信息服务证书编号: (京)-非经营性-2024-0033

GMT+8, 2024-11-14 01:39

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表