欢迎您注册蒲公英
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
微生物和悬浮粒子数的数据统计应用初探
自从仿制药开始做一致性评价后,数据统计分析忽然之间成为大家关注的话题了。那么微生物数和悬浮粒子数,如何进行统计分析呢? 在谈如何分析之前,首先需要澄清一个基本概念,即微生物数和悬浮粒子数是服从“泊松分布”的,如果不明确这个概念,那么其后会走入误区。2015版《 中国药典》四部 的第386页“样品中微生物定量检验方法的验证”中,明确指出“微生物菌落计数服从泊松分布,因此采用泊松分布的统计方法对计数结果进行数据处理优于采用正态分布的统计方法。” 正如药典所述,如果是习惯用正态分布的方法时,也不能直接使用,而要用对数转换,或者加1后开方的方法,将原始数据转换为正态分布数据后,才可以再进行统计分析;总之,我们得到的菌落数和悬浮粒子数的原始数据,要么用泊松分布的方法去分析,这种方法准确;要么需要经过转换为正态分布数据才可以分析,不能拿来直接就用正态分布的方法分析,而且用正态的方法不准确。 我们先来看看泊松分布的术语定义,泊松分布是“单位时间或空间内随机事件发生的次数。”如:在一年内,机器设备出现的故障次数;或某洁净区某个操作间在某天检测时沉降菌数量等等。从这个定义看,洁净区空气中悬浮粒子数也同样是服从泊松分布的。 对于洁净区悬浮粒子也同样是服从泊松分布的,可以从2015年新版的“ISO14644-1:2015”内容中得出;而“ISO14644-1:2015”相较于“ISO14644-1:1999”其修订是彻头彻尾的,为什么这么说,1999版,其统计方法是以正态分布为依据(且数据也没有进行转换)的,这是错误的(而我们国家现行标准“GBT-16292-2010-医药工业悬浮粒子测试方法”显然也是错误的);而2015版的ISO14644-1,在其简介中,明确提出其对取样点的抽样是采用了超几何分布;同时在其附录B分级计算举例中,其对采样点数据的判定是以“泊松分布”原理和公式进行的,只不过,这点在这版标准中并没有明确指出来,而是隐含的,这是这版标准修订过程中不应当出现的失误,也许这是ISO有意为之的技术壁磊,也未可知吧。 因为泊松分布存在一种特殊的情况,即“欠离散或过离散”,所以相关的数据分析时,需要特别关注。 1、数据的过度离散
如果您的数据中的变异度超过您根据泊松分布预期的变异度,则说明存在过度离散。传统泊松分布的U控制图(适用于泊松分布的控制图)假设您的缺陷持续保持恒定不变。但是,非特殊原因导致的外部噪声因子通常总是会导致缺缺陷随时间推移而出现某些变异。
在子组更大时,传统U控制图上的控制限范围会变得更窄。如果子组足够大,过度离散就会导致点看起来似乎要失控,而实际上并非如此。
传统U控制图上子组大小和控制限之间关系类似于功效和单样本t检验之间的关系。样品数越大,t检验检测差异的功效就越强。但是,如果样品足够大,则即使没有任何意义的非常小的差异也会变得非常显著。例如,如果样品具有1,000,000个观测值,则t检验会确定样本平均值50.001与50之间有显著差异,尽管小到0.001的差异,实际对过程没有任何实际影响。
2、数据的欠离散
欠离散与过度离散相反。如果您的数据中的变异度低于您根据泊松分布预期的变异度,则说明出现欠离散情况。如果相邻的子组相互相关,也称为自相关,则会出现欠离散情况。例如,由于工具磨损,缺陷数量可能增大。在多个子组中的缺陷数量增大会使这些子组之间更加相似,超过它们之间偶然出现的相似性。
当数据显示出欠离散情况时,传统U控制图(适用于泊松分布的控制图)上控制限可能会显得过宽,则您可能会忽视特殊原因,误认为它是常见原因变异。
3、如何检测过度离散和欠离散,如何处理这些情况? 如果数据显示出过度离散或欠离散情况时,使用minitab 17中的 laney U′控制图可以得到反映真实情况的过程控制情况。
以纯化水中需氧菌总数和D级区悬浮粒子的数据分析为例进行分析(数据收集是按时间顺序收集和排列的,且是实际数据。): 1、使用传统的U控制图(适用于泊松分布的控制图)分析,得下图: 从上图可以看出,由于数据存在过度离散的情况,使用传统的U控制图,所得结果显示过程非常不稳定,到处都是失控点,悬浮粒子的U图,控制上下限很窄几乎所有点均超控制限。 2、使用laney U′控制图,再进行分析,得下图: 从上图可看出,过程仍然有失控点,但已不是几乎所有点超限的状态了,而悬浮粒子的上下控制限也适当了。
3、进一步分析,将警戒限(2SL)、行动限/纠偏限(3SL)和规格限,加入控制图中,便于使用和给出结论,得下图: 从上图可以得: 1.纯化水总回水口需氧菌过程不稳定,有3个点超过纠偏限,但没超规格限,需要进行调查。 2.可以考虑建立警戒限=38cfu/ml,纠偏限=53cfu/ml的控制图;
3.如果是首次建立控制图,那么,这时是“分析用的控制图”,暂不能用做日常生产控制使用,需要找出3个超限点的根本原因,并整改后,将过程调控稳定后,再进行分析,建立“控制用控制图”,投入日常使用。 从上图可以得: 1.D级洁净区缓冲间其0.5μm的悬浮粒子,有2个点超过纠偏限。 2.上图中超过纠偏限的点,离规格限很远,增加规格限后,如下图所示: 3.相对于D级区0.5μm悬浮粒子,其标准很宽,工程上很容易达到,从统计上看,这时候这个控制限就没有什么意义了;从专业上看,对于D级区,悬浮粒子不是必需进行控制图这样的分析与控制的。
对于悬浮粒子的抽样和计算判定,ISO14644-1:2015 做了相对详细的规定,但其中有一些不正确的地方,还需进一步的探讨。
|