蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
12
返回列表 发新帖
楼主: 觉明智慧
收起左侧

[统计基础] 深入浅出正态分布

[复制链接]
大师
发表于 2021-4-1 10:54:32 | 显示全部楼层
寿命似乎不是正态的

点评

sxp
我记得寿命是Weibull 分布  详情 回复 发表于 2021-4-1 11:04
回复

使用道具 举报

药生
发表于 2021-4-1 10:56:39 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 10:49
控制图的原理就是中心极限定理,没有这个原理, 你没有办法用控制图这个工具。

我说的不是原理,我从来没说原理错误,我是说,在控制图中强调中心极限定理是很容易掉坑里,因为在控制图的应用中是不需要直接使用中心极限定理的。
没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。
这是你上边的回复,在你回复之前:
再看看我的回复:以前有个流毒已久的说法:,只要数据足够多,比如超过30个,就不用考虑是否正态,因为中心极限定理的原因

点评

没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。 这段话是我打快了,属于我的失误。 前有个流毒已久的说法:,只要数据足够多,比如超过30个,就不用考虑是否正态,因为中心极限定理的原因  详情 回复 发表于 2021-4-1 11:06
回复

使用道具 举报

药生
发表于 2021-4-1 11:00:54 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 10:49
控制图的原理就是中心极限定理,没有这个原理, 你没有办法用控制图这个工具。


没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。
这是你上边的回复,在你回复之前:

我的回复:以前有个流毒已久的说法:,只要数据足够多,比如超过30个,就不用考虑是否正态,因为中心极限定理的原因

你现在我觉得认识到这个问题了,这个坑我在刚学时也掉过,所以提醒一下。

中心极限定理还有大数定律很重要,是我们计算推测总体均值以及置信区间的基础,你说是控制图的基础我也不反驳,但是这个不能的出不考虑样本和总体的分布就做控制图
回复

使用道具 举报

药生
发表于 2021-4-1 11:04:55 | 显示全部楼层
九三 发表于 2021-4-1 10:54
寿命似乎不是正态的

我记得寿命是Weibull 分布
回复

使用道具 举报

药生
发表于 2021-4-1 11:06:02 | 显示全部楼层
sxp 发表于 2021-4-1 10:56
我说的不是原理,我从来没说原理错误,我是说,在控制图中强调中心极限定理是很容易掉坑里,因为在控制图 ...

没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。
这段话是我打快了,属于我的失误。
前有个流毒已久的说法:,只要数据足够多,比如超过30个,就不用考虑是否正态,因为中心极限定理的原因。
问题在哪里,30个数据没有错,控制图就靠中心极限定理也没有错,错在哪里,错在非连续型数据不能直接套用正态分布模型,因为正态分布模型不适用于这类数据。
那么连续型数据(因为测量原因导致不符合非正态,或者就是非正态分布的)可以用吗,可以,不会有特别大的干扰。

点评

sxp
这样基本就清楚了,不用在争论了,不过你说连续型数据不会有特别大的干扰这个我是不同意的,不过这个也不需要争论,从数学上我也说不清,只能说我看到的资料(比较权威的)是不太赞成这一点的  详情 回复 发表于 2021-4-1 11:16
还有,这30个数据不是样本数据,是30个均值数据。我估计很多人错在这里。  详情 回复 发表于 2021-4-1 11:09
回复

使用道具 举报

药生
发表于 2021-4-1 11:09:28 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 11:06
没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。
这段话是我打快了,属于我的失 ...

还有,这30个数据不是样本数据,是30个均值数据。我估计很多人错在这里。

点评

sxp
你说的对,是这样的,  详情 回复 发表于 2021-4-1 11:13
回复

使用道具 举报

药生
发表于 2021-4-1 11:13:51 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 11:09
还有,这30个数据不是样本数据,是30个均值数据。我估计很多人错在这里。

你说的对,是这样的,

点评

那可以用样本数据吗,可以,这30个数据应该是按照取样计划时间点测量的单值(此时相当于均值,即单点只测一次),采用单值-移动极差画控制图即可。(不过,有可能出现这组数据其实不是连续型的数据,要靠经验的)  详情 回复 发表于 2021-4-1 11:19
回复

使用道具 举报

药生
发表于 2021-4-1 11:16:33 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 11:06
没有糊涂,控制图不需要知道样本、总体的分布模型,按正态分布计算即可。
这段话是我打快了,属于我的失 ...

这样基本就清楚了,不用在争论了,不过你说连续型数据不会有特别大的干扰这个我是不同意的,不过这个也不需要争论,从数学上我也说不清,只能说我看到的资料(比较权威的)是不太赞成这一点的

点评

其实统计分析需要有经验的,有些数据是需要先分层或者分组的,很多干扰是因为数据分组没有处理好。  详情 回复 发表于 2021-4-1 11:21
回复

使用道具 举报

药生
发表于 2021-4-1 11:19:48 | 显示全部楼层
sxp 发表于 2021-4-1 11:13
你说的对,是这样的,

那可以用样本数据吗,可以,这30个数据应该是按照取样计划时间点测量的单值(此时相当于均值,即单点只测一次),采用单值-移动极差画控制图即可。(不过,有可能出现这组数据其实不是连续型的数据,要靠经验的)

点评

sxp
我认为是可以的,或者绝大部分情况适用  详情 回复 发表于 2021-4-1 11:25
回复

使用道具 举报

药生
发表于 2021-4-1 11:21:31 | 显示全部楼层
sxp 发表于 2021-4-1 11:16
这样基本就清楚了,不用在争论了,不过你说连续型数据不会有特别大的干扰这个我是不同意的,不过这个也不 ...

其实统计分析需要有经验的,有些数据是需要先分层或者分组的,很多干扰是因为数据分组没有处理好。
回复

使用道具 举报

药生
发表于 2021-4-1 11:25:50 | 显示全部楼层
永春膏药-小戴 发表于 2021-4-1 11:19
那可以用样本数据吗,可以,这30个数据应该是按照取样计划时间点测量的单值(此时相当于均值,即单点只测 ...

我认为是可以的,或者绝大部分情况适用

点评

OK,其实不是流毒太深,我估计还是没有培训到位,毕竟这一块很多企业似是而非。  详情 回复 发表于 2021-4-1 11:56
回复

使用道具 举报

药生
发表于 2021-4-1 11:56:10 | 显示全部楼层
sxp 发表于 2021-4-1 11:25
我认为是可以的,或者绝大部分情况适用

OK,其实不是流毒太深,我估计还是没有培训到位,毕竟这一块很多企业似是而非。
回复

使用道具 举报

发表于 2021-4-8 15:49:24 | 显示全部楼层
那么什么是正态分布? John D. Cook 的文章是哪一篇文章可推荐一下吗?另外能否推荐正态分布的资料?谢谢!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-2-16 06:40

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表