欢迎您注册蒲公英
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 沁人绿茶 于 2015-6-6 05:24 编辑
统计杂谈之中心极限定理 拿到中心极限定理任务的时候,真的不知道怎么来写,直接抄度娘的,大家还是看不懂。要不这个样子,编一个题目,“难吃的包子”,希望看过以后能够知道什么是中心极限定理。 好吃包子铺,早上只卖包子,一笼包子六个,可是做包子馅的工艺不稳定,总是弄的一笼包子里面有好吃的,有难吃的的。遇上好吃的还行,遇上难吃的实在……(巴中江北车站旁边的包子真难吃)。有5个人每天5笼包子,每笼6个。从这里可以知道难吃的包子出现在每笼里面次数的集合就是{1,2,3,4,5,6},每次统计自己吃到的难吃包子的个数,把所有的难吃包子数出现的频率进行作图,就可以得到一个单值1,2,3,4,5,6组成的柱形图。但是把5位每次吃到的难吃包子数作为作为一组数的话,就就可能是{An,Bn,Cn,Dn,En},其中An~En(n>0)可能是An~En={1,2,3,4,5,6}中的任意一个数。当去吃的次数多了,就形成了N组数据,每组就是一个抽样样本,组内的数据就是个体数据。当我们将这N组样本内的数据计算和或者计算平均值的时候,所得到的N个和或N个平均值,符合正太分布。这个就是中心极限定理要说明的事情。 也就是说:当对一定的离散数据进行定容量的反复的进行抽样,所得的N个样本的和或均值符合正太分布。其中常用到的是样本均值的正太分布,统计学上称为样本均值的抽样分布(或者中心极限定理)。 一般认为,当样本容量n≥30的时候,我们认为样本均值数据符合正太分布B(μ,σ2/n),μ为总体数据的均值,σ为样本总体的方差。当n<30的时候符合t分布。(这句话基本上是抄度娘的) 我记着模拟器给出的结果,当样本容量n≥5,样本数足够大(N≥30)时,样本均值近似正太分布。对于质量回顾分析上给出的是25组样本,好像也有的地方写的样本数有20组也可以。这个也是“当使用分组数据进行质量回顾分析的时候,不用去做总体数据样本正态性检测”这种说法出现的原因。
备注:蒲公英原创,转载请与作者联系授权 |