临床检验质量指标:室内质量控制和室间质量评价
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节 概述

一、质量控制和患者风险

任何实验室质量控制计划的关键目标是减少因错误结果对患者造成伤害的风险。在使用风险管理方法来制定QC策略时,导致错误患者结果的三个方面的失效应考虑:①失效的可能性有多大(概率);②如果失效未被发现,对患者的潜在伤害有多严重(严重度);③如果失效发生,QC策略能检测出失效的可靠性有多大(检测度)

实验室造成患者伤害主要涉及其报告的错误患者结果不符合预期用途。实验室QC是为了限制实验室报告的错误的患者结果的数量(由于出现失控状况而导致的错误结果)。被测量和患者群体不同,错误的结果导致不恰当决定或行为而对患者造成的伤害的可能性以及伤害的严重程度可能会有所不同。实验室对报告错误结果的容忍度应取决于对危害的风险评估。如果错误的结果造成患者伤害的可能性越高或造成的患者伤害越严重的,实验室在识别出失控状态时就应越严格,以尽量减少报告中错误结果的数量。

当质控策略没有检测到有医疗影响的失控状态时,患者安全的风险会增加。当错误的患者结果被报告,并以此作出不恰当的医疗决策(作为或不作为),失控状态也就造成了损害。可以导致危害的情形,如:质控策略没有检测出失控状态、质控策略在失控影响患者结果之后的一段时间才检出失控状态、对假失控的反应引起结果报告的延迟影响了患者管理的决定。

设计良好的质控策略应能可靠地检测出在测量程序性能中可能导致危害患者结果的预期医疗用途风险的变化,并且能足够快速地检测出那些变化,以使有影响的患者结果的数量最小化。实验室选择的质量控制策略应在超出临床质量要求之前,能够可靠地检测出性能的变化,同时使假失控概率最小化。通过适当的频率测量和评估质控品使得可能影响患者结果最小化。

二、质量控制的要求

实验室应选择性能特征满足结果的预期医疗用途的测量程序。允许总误差(TEa)通常用于建立医学质量要求的参数。TEa建立了不影响医疗决定时能容忍的最大误差,故为给定测量程序建立了“误差预算”。目前还没有全球统一的能定义影响临床决定误差量级的可接受标准。因此,实验室主任应根据测量程序结果在实验室所服务的人群中的应用来决定TEa的范围。

对每个被测量都应该建立TEa。由于TEa取决于被测量结果的医疗应用,它独立于测量程序的实际性能特征而建立的。此外,因为不同的患者需求,相同测量程序TEa在不同地点也可能不同。实验室主任很大程度上依赖于每个被测量已公布信息来决定TEa,包括临床研究、生物变异性数据和专业实践指南或推荐。

在稳定的分析性能中,测量误差超过TEa的可能性要尽可能低,以保证使用统计质量控制技术可以有效地监测到测量程序的性能。如果在稳定运行中测量变异的分布勉强在TEa限内,那么测量程序性能的一个很小的变化(用统计质控手段难以检出)可以导致测量误差超出TEa的可能性非常高。相反,如果在稳定运行中测量变异比允许总误差小很多,那么需要测量程序性能发送很大的变化(该变化能被统计质控技术检测到)才会导致测量误差超出TEa

例如,如果允许的总误差是10%,测量程序稳定的分析不精密度为3%,那么在稳定的运行过程中,测量误差超出TEa的可能性大约为每1 165次测量中的1次。如果有6%的偏移发生(相当于稳定的分析不精密度的两倍),测量误差超出TEa的可能性增加到大约测量的9%(图8-1A)。另一方面,如果测量程序稳定分析的不精密度是CV=2%,那么在稳定的运行过程中,测量误差超出TEa的可能性少于每1.7百万次测量中的1次。6%的失控变化(一次改变相当于稳定分析的不精密度的三倍)使测量误差超出TEa的可能性增加到只有测量的2%(图8-1B)。

三、与质量要求相关的方法性能

测量程序误差在统计质量控制的环境下通常被认为由两部分组成:恒定误差(或称偏倚)和随机误差(或称不精密度)。与稳定分析性能有关的预期误差和临床目标的比较可以分别针对每个组分或组合进行。

图8-1 在不同的TEa条件下测量误差中偏移的影响

虚曲线代表稳定运行状态下测量误差的分布(可由质控结果反映),实曲线代表测量程序中6%偏移后的测量误差的分布。CV,变异系数;TEa,允许总误差

1.偏倚

偏倚是系统测量误差的估计值。评估相对于性能目标的偏倚具有挑战性。关于建立质控策略来有关的偏倚方法有三种。最理想的方法是比较使用测量程序和参考测量程序测量新鲜患者标本获得的结果(见CLSI文件EP09)。但这个方法对大多数实验室来说不切实际。医学实验室报告的很多被测量没有建立参考测量程序。此外,参考测量程序很难被建立和维护,而且对于常规试验是不实际的。在某些情况下,实验室建立了参考测量程序,接受或分享标本来估计偏倚。然而,被认可的参考实验室并不常见,而且也不支持全部被测量。偏倚也可以通过回收试验来评价,CLSI文件EP15里描述的方法。但参考物质也很难获得。因此,估计实际的或者真正的偏倚是很难的,通常也是不可能实现的。

第二种方法就是评估相对偏倚。当实施一个新的测量程序时,实验室通常会执行比对研究。这些研究提供有关新测量程序与将被替代的程序之间的相对差异。虽然是有用的信息,但这些估计值一般不提供新测量程序实际偏倚的好估计值,主要是因为用于对比的测量程序的偏倚通常是未知的。另一种评估相对偏倚的方法是根据实验室间的质控数据或者能力验证试验(prof i ciency testing,PT)/室间质量评价(external quality assessment,EQA),将实验室结果与组均值进行比较。使用实验室间质控数据应当意识到其可能具有有限性,包括用于产生数据的统计方法和参与的实验室数量。相比于新鲜患者标本的检测结果,最常用的质控数据和能力验证/室间质量评价结果常有基质相关的偏倚,从而隐藏真正的患者标本偏倚。因此,该方法仅评估了实验室相对于使用相同的测量程序的其他实验室的明显差异,而不考虑同组测量程序的固有偏倚。对于某些测量程序,基质相关的偏倚可以随着试剂批号而变化,所以这些明显的偏倚在每一个批次的试剂表现不同。在这种情况下,由来自多种试剂批号结果组成的同组数据或许不具真正的代表性。有条件时,PT/EQA项目使用的样品应证明与新鲜患者标本具有互通性,以更合理地评估偏倚。虽然使用互通性的样品并不适用于所有被测量,但越来越多的项目可实现。实验室可能有不止一种相同测量程序用于患者检测。在这种情况下,单个测量程序的相对偏倚可能以其与实验室多个测量程序的组均值来确定。与和同组实验室比较相对偏倚一样,与实验室组均值比较的单个测量程序的相对偏倚不考虑实验室测量程序组的任何固有偏倚。

以质控设计为目的估计偏倚的最后一种方法就是假设偏倚等于零。这种方法认为许多测量程序的校准可溯源至国际公认标准,校准过程应当使实际偏倚最小化。虽然实际的偏倚不可能为零,但对于许多测量程序,偏倚已小至可视为零。这种认识到评估测量程序的实际偏倚或许不太实际,而且使用相对偏倚估计值可能会曲解实际的偏倚,对质控计划没有太大的作用。当偏倚被假设为零,质控计划被用于识别稳定运行状况下的偏差。得到偏倚的恰当方法取决于评估偏倚的技术限制和各实验室可获得的资源。

2.不精密度

定量测量程序的不精密度通常用SDCV表示。在产品说明书(使用说明)和描述单个测量程序性能的临床化学文献中,由两类精密度通常使用SD和/或CV:重复性(也叫批内精密度)和实验室内精密度(也叫设备内精密度或中间精密度或以前也称总精密度)。重复性指短时间内的变异,通常少于24小时。实验室内精密度指更长一段时间内的变化。

从临床的角度看,很少关注批内精密度。一般来说,实验室内精密度估计值与临床更相关,因为它们反映了随时间变化的变异性,对慢性病或者治疗反应进行监测的患者的重复测量区间在某种程度上更具代表性。同样出于质控目的,实验室内精密度与测量程序的稳定以及质控策略所监测的长期性能更相关。

用于质控策略的实验室内SD的估计值应基于足够长时间获得的结果以充分代表可能贡献测量程序长期的在控的不精密度的影响类型。例如,来自电子噪音、移液器性能、检测器性能、温度控制、日常再校准的影响及类似的来源可采用代表中等周期的数据表示,比如几周。然而,周期性校准的影响、试剂瓶间变化、试剂或校准品批号的变化、保养程序,以及类似的发生频率更低的事件,则需要更长时间(如几个月或者更久)才能代表这些因素在估计反映测量程序稳定长期性能的SD的影响。

产品说明书通常基于CLSI EP05文件报告实验室内精密度,该文件包含了一个估计不精密度的标准化方案,其主要局限于单个场所精密度研究设计,要求使用一个批号的试剂和单台仪器在最短20天内进行测量。相似的方案也常见于大多数已发表的研究。这样的研究通常在一个月内完成,但这个时长低于许多测量程序的临床相关时长。

基于不到一个月获得测量的SD将会低估了代表稳定、长期、在控性能的SD,其对有效的统计质控和基于西格玛度量的有效性能评估十分重要。获取所有重要变异来源的可靠代表所需要的时间取决于测量程序。例如,每天需要校准的程序,超过20天的测量能相当可信地代表变异来源,以及每天发生的其他变异性的来源(如吸样误差)。然而,如果程序每周重新校准一次,那么获取同样可靠的校准变异代表需要花费四个月以上的时间。类似地,对测量程序的长期性能有影响的重要的周期性或偶然的变异来源,需要数月使其具有足够的代表性。

因此,由产品说明书或独立文献提供的实验室内精密度估计值充其量被视为SD的下限,用于有效的质控策略或测量程序性能的西格玛度量评估,这也是质控策略所需信息的一部分。实验室面对的挑战,包括如何估计新引进的测量程序在短期内估的相关SD,以及SD估计值还没有实现足够的可信度时,如何对违反质控规则的事件作出反应。

3.西格玛(sigma或σ)度量

过去,结合偏倚和不精密度并比较总误差估计值与允许总误差的方法是使用了一项指数,将估计的总分析误差与质量要求相关联。这个指数被称为过程能力。近来,在医学实验室中,这个指数涉及六西格玛质量监测概念,被称为西格玛度量。西格玛度量用数字表示,并与测量程序发生失效的风险成负相关。六西格玛(6σ)或更高代表极其低的失效率,三西格玛(3σ)代表较高的失效率。计算每个测量程序的西格玛可用来指导实验室人员设计恰当的质控计划。一般来说,较高的西格玛值意味着可以使用不那么严格的质控策略,而较低的西格玛值表明测量程序可能需要较多的质控来检测过程失效。

西格玛度量值的计算可以用重复性或者实验室内不精密度作为SD的估计值。但对最有用的西格玛度量的估计,实验室内SD是最好的选择。一般认为几个月确定的SD最能表示描述测量程序长期稳定的性能。西格玛计算公式如下:

浓度为x水平的σ值可以计算为:

式中,TEax)、biasx)、SDx)是浓度为x时的TEabiasSD

如果TEa是百分数,那么:

西格玛度量有个缺点是,它依赖允许总误差以及偏倚的计算。仅仅通过选择一个不同的允许总误差或使用不同的偏倚评估方案,就可使计算的结果发生显著变化,从不可接受的性能变为可接受的性能。西格玛度量的另一个局限性是,没有单个度量值能描述整个测量区间中的测量程序性能,在大多数情况下,也不适用指定的实验室测量程序结果的不同医疗用途。相反,通常有多个西格玛度量,每种度量值都与不同被测量浓度或实验室测量程序的医疗用途相关。因此,质控品的每个浓度水平或者实验室测量程序的每个不同医疗用途可能有不同的西格玛度量。尽管有这些局限性,了解给定浓度的西格玛值是有用的,因为实验室可以确定医学决定限的质量要求。如果可行,基于最严格的西格玛度量性能制定的质控策略是使患者遭受伤害风险最小化的保守方法。

四、失控状况的类型与质控规则

失控类型通常有两种:暂时性和持续性。表8-1里表明了每种类型的一些例子。暂时失控会在短时间内对单一样品或多个样品有影响。由于这种状况的暂时特性,这类状况可能不会出现在下次质控事件,故不能被检测到。持续失控会持续存在直至被检测到并且根本原因得到消除。持续失控分为两类:改变了固有误差或测量程序偏倚的失控状况,以及改变了随机误差或测量程序不精密度的失控状况。对于偏倚和不精密度统计质控策略均可以检测到。通常,质控策略主要关注检测测量系统偏倚的改变,因为偏倚一般是较大的临床影响。

表8-1 可能导致失控情况的例子

增加测量程序偏倚的失控通常表现为与稳定靶值相比的质控观察值的变化。这种变化会在短时间内突然发生,这通常被称为偏移(shift),或更常见的是发生在较长一段时间内,这种变化被称为漂移或趋势。导致测量程序随机误差变化的失控通常表现为在稳定靶值的正向和负向都出现失控频率增加。随机误差的改变可通过近期一组质控结果的SD比稳定SD大而识别。一般来说,统计质控只是设计用于检测导致SD持续性增加的失控的随机误差的情况。

质控策略涉及选择哪种质控品和选多少浓度水平,何时安排质控测量,以及选择什么样的质控规则来评估质控结果。质控规则是正式的决策过程,根据一个或更多的质控测量结果判断测量程序在稳定在控状况内运行(质控规则在控),还是测量程序不在稳定在控状况内运行(质控规则失控)。