ICS 03.120.30__“’询日中华人民共和国国家标准GB/T 6379.2--2004/ISO 5725-2:1994部分代替GB/T 6379-1986GB/T 11792一1989测量方法与结果的准确度(正确度与精密度)查含0立IT2、74心卜杖二砚士知“遥基州七.之土C奋难1淞卜训尸.,-r,.,司尸谈二梦.J,,....,碑,,.-.了,口‘二翻二二.了诊,...啥‘己‘云口,如叮…,‘..性,竺,甲r,_【d一J.止~.4弓.-J--J-、J. 勺界现11生削量小力达Accuracy(trueness and precision) of measurement methods and results-Part 2:Basic method for the determination of repeatability andreproducibility of a standard measurement method(ISO 5725一2:1994,IDT)2004-06-02发布2005-01-01实施中华人民共和国国家质量监督检验检疫总局., 小蔺、菌发布www.bzfxw.comwww.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:1994月U胃GB/T 6379((测量方法与结果的准确度(正确度与精确度)))分为六部分,其预期结构及对应的国际标准为:—第1部分:总则与定义(ISO 5725-1:1994,IDT)—第2部分:确定标准测量方法的重复性和再现性的基本方法(ISO 5725-2:1994,IDT)—第3部分:标准测量方法精密度的中间度量(对应ISO 5725-3;1994)—第4部分:确定标准测量方法正确度的基本方法(对应ISO 5725-4:1994)—第5部分:确定标准测量方法正确度的可替代方法(对应ISO 5725-5;1998)—第6部分:准确度值的实际应用(对应ISO 5725-6;1994)本部分为GB/T 6379的第2部分。GB/T 6379的本部分等同采用国际标准ISO 5725-2:1994((测量方法与结果的准确度(正确度与精确度)第2部分:确定标准测量方法重复性和再现性的基本方法》及ISO于2002-05-15发布的对1994版ISO 5725-2的技术修改单。GB/T 6379第1部分至第6部分作为一个整体代替GB/T 6379-1986和GB/T 11792-1989。标准中将原精密度加以扩展,增加了正确度;除重复性条件和再现性条件外,增加了中间精密度条件。本部分的附录A和附录B为规范性附录,附录C为资料性附录。本部分由中国标准化研究院提出。本部分由全国统计方法与应用标准化技术委员会归口。本部分起草单位:中国标准化研究院、中国科学院数学与系统科学研究院、辽宁出人境检验检疫局、广州出人境检验检疫局。本部分主要起草人:于振凡、冯士雍、刘文、姜健、丁文兴、王斗文、肖惠、李成明。本部分于2004年首次发布。GB/T 6379.2-2004/ISO 5725-2:1994引言0. 1 GB/T 6379用两个术语“正确度”与“精密度”来描述一种测量方法的准确度。正确度指大量测试结果的(算术)平均数与真值或接受参照值之间的一致程度;而精密度指测试结果之间的一致程度。0. 2 GB/T 6379. 1中对上述诸量给出了一般性的考虑,在GB/T 6379本部分中不再重复。GB/T 6379. 1应与GB/T 6379所有其他部分(包括本部分)结合起来读,因为GB/T 6379. 1给出了基本定义和总则。0. 3 GB/T 6379本部分只考虑重复性标准差和再现性标准差的估计。虽然其他类型的试验(如分割水平试验)也可用于某些情形的精密度估计,GB/T 6379本部分中并没有涉及这方面内容,这将在ISO 5725-5中进行讨论。GB/T 6379本部分也没有考虑精密度两个主要度量之间的任何其他中间度量问题,这将是GB/T 6379.3的内容。0.4在某些情况下,为进行精密度估计得到的试验数据也可用于估计正确度。正确度的估计也不在本部分中给予考虑,有关正确度估计的所有内容将是GB/T 6379.4的目标。www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:1994测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复性与再现性的基本方法1范围1. 1 GB/T 6379的本部分—给出了一些通过协同试验室间试验获得测量方法精密度的数值估计的试验设计中应遵循的一般原则。—提供估计测量方法精密度所常用的基本方法的详细而实用的说明。—为所有关心精密度估计的试验设计、执行和结果分析人员提供指南。注1:为特定目的而对基本方法进行某些修正改变的内容在GB/T 6379其他部分中给出。附录B提供了一些通过试验估计测量方法精密度的实际例子。1. 2 GB/T 6379本部分所涉及的测量方法特指对连续量进行测量,并且每次只取一个测量值作为测试结果的测量方法,尽管这个值可能是一组观测值的计算结果。1.3假定在精密度试验的设计和执行过程中,已经遵循了在GB/T 6379. 1中给定的所有原则。基本方法是在每一个实验室使用相同数目的测试结果,并且每一个实验室都对测试样本的相同水平进行分析,即进行平衡均匀水平的试验。基本方法适用于那些标准化的且在很多实验室常规使用的程序。注2:标准附录部分给出了几个实际例子来说明平衡一致的测试结果。在一个例子中,单元中的重复测试数有变化(非均衡设计);在另一个例子中一些数据缺失了。这是因为一个均衡设计的试验最终可能变成非均衡的。也考虑了岐离值和离群值。1. 4 GB/T 6379. 1-2004第5章中的统计模型被用作解释和分析测试结果的基本模型,且认为测试结果是近似服从正态分布的。1. 5 GB/T 6379本部分估计测量方法精密度的基本方法用于下列情形:a)需要确定在GB/T 6379. 1中定义的重复性和再现性标准差时;b)当使用的物料是匀质的,或不均匀性的影响能包括在精密度值中时;。)当可以采用平衡均匀水平设计时。1.6对尚未标准化的或非常规使用的测量方法进行初步精密度估计时也可以使用同样的方法。2规范性引用文件下列文件中的条款通过GB/T 6379本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版本均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。ISO 3534-1:1993统计学词汇和符号第1部分:概率和一般统计术语GB/T 6379.1-2004测量方法与结果的准确度(正确度与精密度)第1部分:总则与定义3定义ISO 3534-1和GB/T 6379. 1中给出的定义在GB/T 6379本部分中仍适用。GB/T 6379使用的符号由附录A给出。www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:19944甚本模型中的参数估计4. 1 GB/T 6379本部分给出的程序是建立在GB/T 6379. 1-2004第5章的统计模型基础上的,这些程序在GB/T 6379.1-2004的1. 2中进行了详细的阐述。特别是,这些程序是基于GB/T 6379. 1-2004第5章中的式(2)到式(6)0基本模型是:y=m+B+e其中,对给定的受试物料:m—总平均值(期望);B—重复性条件下的偏倚的实验室分量;e—在重复性条件下每一次测量产生的随机误差。4.2 GB/T6379.1-2004第5章中的式(2)到式(6)表示的是所考虑总体标准差的真值。实际情况中,这些标准差的确切值是未知的,精密度的估计值通过从全体实验室组成的总体抽取少量的实验室来获得的。而在这些实验室内部,该估计值由所有可能测试结果的一个小样本获得。4.3在统计实践中,如果标准差的真值。未知,则以样本进行估计并替代,此时,符号。用‘代替,、表示。的估计值。下列估计值可根据GB/T 6379. 1-2004的式(2)到式(6)得出:si:实验室间方差的估计值;Sw:实验室内方差的估计值;s; : Sw的算术平均值,并且是重复性方差的估计值;这个算术平均值是在剔除了离群值后对所有参与准确度试验的实验室计算的。SR:再现性方差的估计值:SR=、兑+::··························,···……(1)5对精密度试验的要求5.1试验安排5.1.1在用基本方法进行试验安排时,取自4批物料的样本分别代表4个不同测试水平,被分到p个实验室,每一个实验室都在重复性条件下对每一水平得到同样n次重复测试结果。这种试验称为平衡均匀水平试验。5.1.2这些测量工作应在如下规则下组织进行:a)任何设备的预检应按标准方法中的规定进行;b)同一水平中一组n次测量应该在重复性条件下进行,即在短暂的时间间隔内,由同一操作员测量;除非是作为整个测量过程的一个环节,测量过程中间不允许对设备进行任何的重新校准。c)一组n次测试要求在重复性条件下独立地进行是十分重要的,就像是在对n种不同的物料进行的n个测试。然而,事实上,操作员会知道他是对同一物料进行测试。应在说明书中强调的是,测试的整个意图就是要考察在实际测试中测试结果能发生多大的的变化。尽管有这样的提示,为避免前面的测试结果对随后的测试产生影响,从而影响重复性方差,可考虑在全部4个水平,每个水平上要求n个独立测试的样本,混合进行编号,使得操作员不知道所进行的测试是哪个水平的。不过,这样的程序也可能会产生另一个问题,即能否保证重复性条件适用于这些重复的测试。只有当所有qn个测量可以在一个很短的时间内完成时,上述条件才能得到保证。d)没有必要要求所有q组的n次测量都严格在一个很短的时间内进行;不同组的测量可以不在同日内进行;e)所有q个水平的测量都将由同一个操作员做出,此外,在给定水平上做出的n个测量要自始至www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:1994终使用同一设备;f>如果在测量过程中一个操作员因故不能完成全部测量,那么可以由另一个操作员继续剩下的测量,只要这个人员变更不是发生在同一水平同一组的n个测量上,而是发生在4组中的两个不同组上。任何这样的人员变更都要随测试结果一起上报。9)应该给出一个时间限制,所有的测量应该在该时间区间内完成。把该时间限制在收到样本的日期和测量完成的日期之间;h)所有的受试样本都应该用标签标明测试名称并对样本进行编号。5. 1.3对5.1.2和GB/T 6379本部分的其余章节中“操作员”加以说明。对于某些测量,事实上可能由一组操作员进行,每一操作员执行测量程序的某一规定部分。在此情况下,这一组操作员将统一看作“操作员”,这一组中出现任何人员的变更都将被看成是不同的“操作员”。5. 1.4在商业实践中,对测试结果的修约可能做得很粗。但在精密度试验中,测试结果要比标准方法中规定的有效数字位数至少多一位。如果该方法没有规定有效数字位数,那么修约的误差不能超过重复性标准差估计值的1/2。当精密度依赖于水平m时,对于不同的水平就要有不同的修约程度。5.2实验室征集5.2. 1在GB/T 6379. 1-2004的6.3中给出了关于参与实验室间协同试验的实验室征集工作的一般原则。在征集所需数目的协同实验室时,要明确规定这些实验室的条件。图1中给出了一个实验室调查征集的例子。5.2.2一个“实验室”在GB/T 6379本部分中被认为是操作员、设备和测试场所的一个组合,一个测试场所或通常意义的一个实验室可以产生几个“实验室”,只要它能够为几个操作员提供独立的仪器设备和测试场地。5.3物料准备5.3. 1在GB/T 6379. 1-2004的6.1中给出了精密度试验中选择物料时需要考虑的要点。5.3.2在决定试验所需的物料数量时,应该考虑到在获得某些测试结果时会出现偶然的洒出和称量误差,从而需用到额外的物料。需要准备的物料数量应当足以满足测试之用,并且允许适当的储备。夕图1实验室间协同研究调查表www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:19945.3.3应考虑在得到正式的测试结果之前一些实验室为了熟悉测量方法而获得某些初步测试结果是否可取,如果可取,那么也应考虑是否应该提供额外的物料(非精密度试验样本)。5.3.4当一种物料必须要进行匀质化时,应对该种物料以最合适的方式进行匀质化。当要进行测试的物料不是匀质时,就要以该方法中规定的方式准备样本,这是很重要的,最好对每个水平都用不同批的商业物料。对于不稳定的物料,应给出特殊的储藏和处置说明书。5.3.5如果容器一旦被打开物料就有变质的危险(例如被氧化,损失挥发或吸湿物料),那么对于每一水平下的样本,应对每个试验室使用n个不同的容器。在物料不稳定的情况下,应给出特殊的储藏和处置说明书。应该采取一些预防措施来确保样本直到进行测量时相同。如果要测量的物料是由不同相对密度的粉状物料混合而成或由不同大小的颗粒组成的,那么由于震动可能会产生分离(例如在运输过程中),因此需要特别注意。当受试样本可能与空气发生反应时,样品可以被封在被抽空或者用惰性气体填充的玻璃瓶内。对于食品或血样这样的易变质的物料,有必要将其以冷冻状态送到参与的实验室,并对其融化程序进行详细的说明。6参与精密度试验的人员注3:不同的实验室其操作方法不尽相同。因此,本章的内容仅仅作为一个指南,在特定情况下可作适当修改。6. 1领导小组6.1.1领导小组宜由熟悉该测量方法及其应用的专家组成。6. 1.2领导小组的任务是:a)计划和协调试验;b)决定需要的实验室数量、水平和要求的测量数,以及要求的有效数字位数;c)指定其中某位成员承担统计方面的职责(见6.2);d)指定其中一位成员为执行负责人(见6. 3) ;e)考虑给每个实验室的测量负责人下发除了标准测量方法以外的操作说明书;f)决定是否允许某些操作员进行少量的非正式测量,以便在间歇很长时间后(这些测量结果不应作为协同试验的正式样本)重获测量方法方面的经验;g)测试结果分析完成后,讨论统计分析报告;h)确定重复性标准差和再现性标准差的最终值;i)决定是否需要就改进测量方法标准及对那些测试结果被作为离群值而拒绝的实验室采取进一步的措施。6.2统计专家的职责领导小组中至少有一个成员应具有统计设计和试验分析方面的经验。他的任务是:a)用专业知识进行试验设计;b)对数据进行分析;c)按7. 7. 1中的规定向领导小组提交一份报告。6.3执行负责人的职责6.3. 1把试验实际的组织工作委托给某个实验室。领导小组任命该实验室的一名成员为执行负责人,对此工作负全责。6.3.2执行负责人的任务是:a)征集必要数目的协同实验室,并且负责任命每个实验室的测量负责人;b)组织和监管测试物料、样本的准备以及样本的分配;对每个水平,应该预留足够量的备用物料;c)起草涵盖5. 1. 2中a)至h)各项要点的操作说明书,将说明书尽早地提前分发给各实验室测量负责人,以便他们能对其提出意见,确保所选的操作员在常规操作中能正确地进行测量;www.bzfxw.comGB/T 6379.2-2004八S05725-2:1994d)设计适当的表格,以便操作员用于工作记录、测量负责人用于报告测试结果的有效数字位数;(表格可以包括操作员的姓名、收到和测量样本的日期、所使用的设备和其他有关的信息等);e)处理各实验室在测量操作中出现的问题;f)关注试验的进度,使试验按规定日程进行;g)收集数据表并把它们提交给统计专家。6.4测f负责人6.4. 1每个参与试验的实验室应指定一名成员负责实际测量的组织、按执行负责人的指令工作并报告测试结果。6.4.2测量负责人的任务是:a)确保所选的操作员在日常操作中能正确地进行测量;b)按执行负责人的指令把样本分发给操作员(必要时还要为熟悉试验操作提供物料);c)对测量的执行进行监管(测量负责人不应参与测量操作);d)确保操作员进行规定次数的测量;e)确保测量工作按时间进度进行;f)收集测试结果,要求结果记录的小数位数与要求一致,以及测试中遇到的任何困难、异常现象和操作员反映的意见。6.4.3每个实验室的测量负责人应撰写一份包括下面信息的全面报告:a)原始测试结果,由操作员以清晰字迹记录在所提供的表格上,而不要转录或打印(计算机或测试机器打印输出的结果除外);b)最初的观测值或读数(当测试结果由这些读数计算得出时),由操作员以清晰字迹记录在所提供的表格上,而不要转录或打印;c)操作员提出的关于测量方法标准方面的意见;d)在测量期间发生的任何非常规或干扰的信息,包括可能发生的操作员变更,指明哪位操作员做了哪些测量,以及对任何数据缺失原因的说明;e)样本收到的日期;f)每个样本被测量的日期;9)使用的相关设备信息;h)其他有关的信息。6.5操作员6.5. 1在每个实验室中,测量应该由一个选定的操作员完成,该操作员是在通常操作中可能执行该测量任务的操作员代表。6.5.2因为试验的目的是对全体使用该标准测量方法的操作员确定标准测量方法的精密度,因此一般不宜给操作员以拓展测量方法标准的权利。然而,也应该对操作员指出,测试的目的之一是发现测试结果在实际中的变化,这样他们就不会对不一致的测量结果进行丢弃或重测。6.5.3尽管操作员通常没有对标准测量方法进行补充性修订的任务,但是也应鼓励他们对标准做出评价,尤其是指出标准中的说明是否足够明确而不模糊。6.5.4操作员的任务是:a)根据标准测量方法实施测量;b)报告测试中遇到的异常现象和困难;报告一个错误要比调整测试结果更为重要,因为缺失一两个测试结果不会毁坏整个试验,多数情况下反而反映了测量标准本身的不足。c)为评价标准中的说明是否合适;操作员应在遇到的任何不能按试验说明进行测试的情况时随时报告,因为这也反映了标准本身的不足。www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:19947精密度试验的统计分析7.1初步考虑7.1.1数据的分析是一个统计问题,应由统计专家来解决,它包括以下三个相继的步骤:a)对数据进行检查,以判别和处理离群值或其他不规则数据,并检验模型的合适性;b)对每个水平分别计算精密度和平均值的初始值;c)确定精密度和平均值的最终值,且在分析表明精密度和水平m之间可能存在某种关系时,建立它们之间的关系。7.1.2对每个水平,首先计算以下诸量的估计值:一一重复性方差:s;—实验室间方差:s%—再现性方差:、zSR = s:十s%—平均值m7.1.3统计分析包括对离群值的统计检验的系统应用,在文献中有许多方法可以用于GB/T 6379本部分。从实际应用考虑,在7.3中将这些方法选择整理成几种方法。7.2结果列表和所用记号7.2. 1单元一个实验室和一个水平的组合称为精密度试验的一个单元。理想的情况是,一项有p个实验室和q个水平的试验,列成pq个单元的表,每个单元包含n次重复测试结果,以此来计算重复性标准差和再现性标准差。然而,由于多余数据、缺失数据和离群值的发生,这种理想情况在实际中并不总是能够得到的。7.2.2多余数据有时一个实验室可能进行且报告了多于正式规定的n个测试结果。在此情形下,测量负责人应报告为什么会这样?哪些是正确的测试结果?如果答案是这些测试结果都是同样有效的,则宜在这些测试结果中随机抽取原定数量的数据用于分析。7.2.3缺失数据另一种情形是,一些测试结果可能缺失,例如,因为样本的丢失或在测量时操作的失误。在7.1中推荐的分析程序是对完全空白的单元简单地将其忽略,而对部分空白的单元则通过标准计算程序给予考虑。7.2.4离群值离群值是原始测试结果或由此生成的一些数值,与其他测试结果或同样产生的其他数值相差很大,不一致。经验告诉我们,离群值不能完全避免,须与缺失数据一样作类似处理。7.2.5离群实验室当某个实验室在几个不同水平出现无法解释的非正常测试结果,在所测试水平下,实验室内方差和(或)系统误差过大时,可将它作为离群实验室。有理由舍弃离群实验室的部分或全部数据。GB/T 6379本部分没有提供如何判断可疑的离群实验室的统计检验程序。对此应由统计专家做出初步决定,但是所有被除外的实验室都应该报告给领导小组以便采取进一步的行动。7.2.6错误数据有明显错误的数据应进行核查并予以更正或剔除。7.2.7平衡均匀水平测试结果理想的情况是对p个实验室(编号为i=1,2,...p),q个水平(编号为j=1,2,...妇,每个水平都重复n次测试的情形,总共获得pqn个测试结果。由于数据缺失(7.2.3)、离群的测试结果(7.2.4)、离群实验室(7. 2.5)或错误数据((7.2.6)的存在,这种理想的情况并不总能得到。在这些情况下,在7.2.8到www.bzfxw.comGB/T 6379.2-2004/ISO 5725-2:19947.2. 10中的记号和7. 4中的程序允许测试结果数不全不同。图2给出用于统计分析的推荐的原始数据的列表格式,为方便起见,分别简称为A表、B表和C表。一一川仁导一1 212il二止』图2分析结果整理的推荐格式7.2.8原始测试结果图2的A表中,n。是第i个实验室在水平i1这个单元的测试结果数;yi,*是该单元第k个测试结果((k=1,2-二n;;)p,是J水平至少有一个测试结果的实验室数(在剔除了所有离群值和错误的测试结果后)。7.2.9单元平均值(图2的B表)由A表按下式计算单元平均值:www.bzfxw.com