上QQ阅读APP看书,第一时间看更新
第二节 临床工程研究中的工程学研究方法
临床工程的研究过程与单纯的临床医学研究不同,不仅涉及基础的科研方法,也涉及很多专业的工程学知识,是一种跨学科的研究。因此,研究人员需要了解工程学研究方法。本节主要介绍当前国际上在临床工程研究中常用的一些工程学研究方法。这些方法不仅适用于研究,也适用于临床工程的日常工作中。
一、 可靠性分析
(一)可靠性的定义
可靠性通常指产品在规定的条件下和规定的时间内完成规定功能的能力。在这里,产品是一个非限定性术语,可以是某个装备系统,也可以是组成系统中的某个部分乃至元器件等。在可靠性定义中,以下“三个规定”是很重要的。
1.规定的功能
可靠性是保证完成规定功能的质量特性,定义产品的可靠性,首先要定义和规定其功能。许多产品规定的功能并不是单一的,而是多种多样的。显然,工厂制造出来的合格产品本来是具有完成规定功能的能力的,但如果出了故障,就不能完成规定的功能。可靠性就是要产品不出毛病,能完成规定功能。但是应当强调,①规定的功能是指产品技术文件中规定的功能;②功能应指规定的全部功能,而不是其中的部分功能,即要注意产品功能的多样性;③规定功能还应包括故障或完成功能的判断准则。
2.规定的时间
这是可靠性定义的核心。因为离开时间就无可靠性可言,而规定时间的长短又随产品对象不同和使用目的不同而异。产品的规定时间是广义的时间或“寿命单位”,可以使用小时数(如电视机、雷达、电视等)、行驶公里数(如汽车、坦克)、射击发数(如枪、炮、火箭发射架),也可以是储存年月(如弹药、导弹等一次性使用而长期储存的产品)。
3.规定的条件
这是产品完成规定功能的约束条件,包括多方面,如装备使用(工作)时所处的环境(如温度、湿度、振动、风、砂、霉菌等)、运输、储存、维修保障和使用人员的条件等。这些条件对产品的可靠性都会有直接的影响,在不同条件下,同一产品的可靠性也不一样。
(二)可靠性的分类
从体现的目标出发,可靠性可分为任务可靠性和基本可靠性。装备的任务可靠性是在任务剖面规定的时间内和规定的条件下完成规定任务的能力。任务可靠性是保证装备工作效能的一个因素,装备的任务可靠性高,表示该装备具有较高的完成规定任务的概率。基本可靠性又称后勤可靠性,是装备在规定条件下无故障的持续时间或能力。它说明装备经过多长时间可能要发生故障需要维修。后勤可靠性可评估装备或部件对维修的要求。
为了比较装备在不同条件下的可靠性,可将可靠性区分为固有可靠性和使用可靠性。固有可靠性是装备在设计、制造过程中被赋予的,在理想的使用及保障条件下的可靠性,也是可靠性的设计标准。具体装备设计、工艺确定后,装备的固有可靠性是固定的。使用可靠性是装备在实际使用过程中呈现的可靠性,涉及设计、安装、质量、环境、使用维修的综合影响。
对于工作时间极短,不工作时间(待命、储存等时间)较长的装备(如一些军用装备),可将可靠性分为工作可靠性和不工作可靠性。
(三)可靠度函数
产品在规定的条件下和规定的时间(t)内,完成规定功能的概率称为产品的可靠度函数,简称可靠度,即R(t)。
设T是产品在规定条件下的寿命,产品的可靠度函数R(t)可以看作事件“T>t”的概率,即
显然,这个概率值越大,表明产品在t内完成规定功能的能力越强,产品越可靠。
二、 可用性分析
(一)可用性的定义
可用性是在某个考察时间,系统能够正常运行的概率或时间占有率期望值。考察时间为指定瞬间,则称瞬时可用性;考察时间为指定时段,则称时段可用性;考察时间为连续使用期间的任一时刻,则称固有可用性。它是衡量设备在投入使用后实际使用效能的指标,是设备或系统的可靠性、可维护性和维护支持性的综合特性。
20世纪80年代中期出现了“对用户友好”的口号,这个口号被转换成人机界面的“可用性”概念。人们给可用性下了许多定义:
ISO9241/11中的定义是:一个产品可以被特定的用户在特定的境况中,有效、高效并且满意地达成特定目标的程度。
GB/T3187-97对可用性的定义:在要求的外部资源得到保证的前提下,产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力。它是产品可靠性、维修性和维修保障性的综合反映。
比较常用的是Shakel(1991)对可用性的定义:可用性是指技术的“能力(按照人的功能特性),它很容易有效地被特定范围的用户使用,经过特定培训和用户支持,在特定的环境情景中完成特定范围的任务”。这个定义包含了几个方面含义。第一,可用性不仅涉及界面的设计,也涉及整个系统的技术水平。第二,可用性是通过人因素反映的,通过用户操作各种任务去评价的。第三,环境期间因素必须被考虑在内,在各个不同领域,评价的参数和指标是不同的,不存在一个普遍适用的评价标准。例如,计算机在飞机上,在财务管理上,在网络教学中,对于专家与新用户,对于数据处理和绘图,可用性参数和指标各不相同。因此,可用性测试十分强调环境期间因素的重要性,往往包含用户类型、具体任务、操作环境等(这个定义提出时,很少有人从用户操作心理角度分析可用性的含义,因此没有提出相关内容)。第四,要考虑非正常操作情况,如用户疲劳、注意力比较分散、紧急任务、多任务等具体情况下的操作。
一般来说,可用性被表达为“对用户友好”、“直观”、“容易使用”、“不需要长期培训”、“不费脑子”等。
(二)可用性的测试方法
所谓可用性评估,即检验其是否达到可用性标准。目前的可用性评估方法超过20种。按照参与可用性评估的人员不同,可以将可用性评估分为专家评估和用户评估;按照评估所处的软件开发阶段不同,可以将可用性评估分为形成性评估和总结性评估。形成性评估是指在软件开发或改进过程中,请用户对产品或原型进行测试,通过测试后收集的数据来改进产品或设计,直至达到所要求的可用性目标。形成性评估的目标是发现尽可能多的可用性问题,通过修复可用性问题实现软件可用性的提高。总结性评估的目的是横向评估多个版本或多个产品,根据评估数据进行对比。
网站可用性测试的步骤为:定义明确的目标和目的,安装测试环境,选择合适的受众,进行测试和报告结果。
(三)可用性的评估方法
1.认知预演
是由Wharton等(1990)提出的。该方法首先要定义目标用户、代表性的测试任务、每个任务正确的行动顺序、用户界面;然后进行行动预演,并不断提出问题,包括用户能否建立任务目的,能否获得有效的行动计划,能否采用适当的操作步骤,能否根据系统的反馈信息评价是否完成任务;最后进行评论,诸如要达到什么效果,某个行动是否有效,某个行动是否恰当,某个状况是否良好。该方法的优点在于能够使用任何低保真原型,包括纸原型;缺点在于评价人不是真实的用户,不能很好地代表用户。
2.启发式评估
由Nielsen和Molich(1990)提出。多位评价人(通常4~6人)根据可用性原则反复浏览系统各个界面,独立评估系统,允许各位评价人在独立完成评估之后讨论各自的发现,共同找出可用性问题。该方法的优点在于专家决断比较快,使用资源少,能够提供综合评价,评价机动性好;不足之处在于会受到专家的主观影响,没有规定任务,会造成专家评估的不一致,评价后期阶段由于评价人的原因造成信度降低,专家评估与用户的期待存在差距,所发现的问题仅能代表专家的意见。
3.用户测试法
就是让用户真正使用软件系统,由实验人员对实验过程进行观察、记录和测量。这种方法可以准确地反馈用户的使用表现,反映用户的需求,是一种非常有效的方法。用户测试可分为实验室测试和现场测试。实验室测试是在可用性测试实验室里进行的,而现场测试是由测试人员到用户的实际使用现场进行观察和测试。
用户测试之后,评估人员需要汇编和总结测试中获得的数据(例如完成时间的平均值、中间值、范围和标准偏差,用户成功完成任务的百分比,用户做出各种不同倾向性选择的直方图等),然后对数据进行分析,并根据问题的严重程度和紧急程度排序,撰写最终测试报告。
三、 故障模式与影响分析
故障模式与影响分析(failure modes and effect analysis,FMEA)是识别潜在的工艺和技术故障,意图消除它们或减少它们的可能性,防患于未然的一个系统过程,也就是提前分析相关不良事件的发生风险。FMEA始于20世纪40年代,并进一步在航空航天、汽车等行业发展,在20世纪60年代末开始应用于医疗流程。在医疗行业,FMEA已发展为一个系统评估临床过程的主动方法,用以确定在哪里以及如何失败,并评估相关影响。
FMEA的理由是,错误是不可避免但可预测的,因此可以预期和(或)通过设计使其最小化。
FMEA的重点是故障模式(由于物理或人为原因,一个子系统或部件的不正确行为)、效果(在操作、功能或功能性,或者某些临界项的状态失败的结果)以及潜在的危险(failure mode effects and criticality analysis,FMECA,失败将发生并严重影响系统或子系统的概率的组合)。换句话说,FMEA或FMECA旨在确定和分析:①一个系统所有的可能故障模式和系统部件;②故障对于一个系统和系统的一部分的影响;③怎样避免或减少故障发生的可能性或减轻故障对系统的影响。
以下是FMEA的步骤说明:
1.定义FMEA的主题
写一个明确的被研究的过程。
缩小审查范围,使其易于管理,而且行动是切实可行、能够实现的。
2.装备团队
包括所有受影响地区的专家代表,保证团队的多学科性。
确定团队的领导者/协调者。
3.准备程序的图文描述
创建与核实流程图。
对每一个处理步骤进行编号。
对于复杂的流程,指定集中区域。
确定并创建子进程的流程图。
4.进行风险分析
对每一个处理过程或子处理过程,列出所有可能的或潜在的故障模式。
列出所有可能引起故障模式的情况(每个故障模式可能有多个引发原因)。
确定“严重”、“可能性”、“可检测的”。
确定风险级别数(RPN=S×P×D)。
根据风险分级,确定下一步行动。
5.行动和结果的措施
为每个故障模式确定行动或策略来降低风险。
四、 根因分析
根本原因分析(root cause analysis,RCA)简称根因分析,是一项结构化的问题处理方法,用以逐步找出问题的根本原因并加以解决,而不是仅关注问题的表征。RCA是一个系统化的问题处理过程,包括确定和分析问题原因,找出问题解决方法,并制订问题预防措施。RCA是一个分析工具,用于执行关键事件的一个全面的、基于系统的审查。它包括鉴定根因和促成因素,决定降低风险的策略,并制订有效的行动计划以及战略评估计划。不同于故障模式与影响分析,RCA是一个积极的预防过程,通过回顾特定的、有害的活动进行风险防范。
RCA的主要目的是揭示导致不良事件的各种影响因素。研究范围越大,系统越能通过本事件预防下一个事件发生的可能性。
(一)根因分析的应用
RCA的目标是找出问题(发生了什么)、原因(为什么会发生)和措施(什么办法能够阻止问题再次发生)。
所谓根本原因,就是导致问题发生的最基本的原因。引起问题的原因通常有很多,人为因素、设备原因、物理环境、材料供应、系统行为或流程管理等因素都可能是引发问题的原因。通过科学分析,有可能发现不止一个根源性原因。
(二)根因分析的步骤
1.制订行动计划
落实组织的策略,以降低将来发生类似事件的风险。
包括执行、监督,适当的试验测试,时间线和测量所述措施有效性的策略。
2.明确发生了什么事/事件的事实
有关患者信息。
详细的事件实录。
采用访谈、头脑风暴或书面说明等方式。
3.探讨为什么发生
一一列举导致事件的因素。
4.识别根本原因
5.将问题再次发生的风险最小化/监测改进过程
认真衡量每一个要实施的具体动作。
根因分析有一系列不尽相同的具体方法,用于解决具体的组织问题。
(三)根因分析的工具
1.因果图
这是一种描述一个结果和所有可能对它有影响的原因之间关系的方法。其步骤包括:定义问题,作图,描述所有相关任务,复核图表,确定纠正行动。
2.头脑风暴法
这是揭示所有可能的原因和选择方案,并找出纠正措施的一种有效方法,一般在发生问题的相关团队成员中进行,鼓励发散性思维。
3.因果分析——鱼骨图
①清楚地陈述问题或目标;②确认3~6个主要的原因类别;③运用头脑风暴法在每个类别下填写原因,并将每个原因联系到主要类别上去;④针对每个原因思考可能对其起作用的因素,把这些因素放在从原因出发的一条线上;⑤讨论每个因素和它如何对某个原因起作用,将该信息列在原因旁;⑥对最可能的原因达成一致,将它们圈出来,寻找那些重复出现的原因;⑦团队成员一致同意将要采取的步骤,收集数据确认原因或通过采取纠正措施消除原因。
4.因果分析——WHY-WHY图
这是一种简单而有效的方法,通过层层分解原因,找出导致一个问题不断发生的根本原因,主要有4个步骤:选择问题,确定该问题为何出现,确定那些原因为何发生,找出最重要的原由(可能不止一个)。
WHY-WHY图的使用:①确定问题或目标,把它写在图的最左边的一个方框内,并确保所有成员都知道这个问题或目标;②确定原因或任务,写在方框右边的分枝上;③继续阐明原因或任务,并在右边画上新的分枝;④重复上述步骤,直到每个分枝到达它的逻辑终点;⑤检查树状图,确定是否需要增加其他信息或者在层次上是否有欠缺的地方;⑥制订行动计划。
(四)根因分析的案例
RCA包括对问题的复查和评估问题的可能原因,过程的每一步都要注重效果、关注有数据支持的目标,深入分析这些“因”怎么导出故障的“果”。
下面以可靠性工程分析为例,简述RCA的过程(图2-1):
图2-1 RCA过程
1.界定问题,明确与问题相关的条件,找出可能和不可能与特定问题有关的因素。
2.描述并界定特定问题的可能原因。通过背景资料和数据[可来自故障树分析(fault tree analysis,FTA)、FMEA或其他工程失效分析结论、试验结果、仿真研究结果、预试验结果等]说明每个原因。为了挖掘根本原因及其影响,可能需要预先进行假设,并对假设进行定量或定性的验证。
3.通过统计分析工具或工程判断,将可能原因列表,评估后判定最有可能的根本原因。采用的评估判定方法可以是假设检验或利用试验分析技术进行定量统计。如果数据是定量的,就运用决策技术(可有或无统计数据)找出主要原因,或采取格式化的(决策树或效益矩阵)或者非格式化的(比较分析)决策技术来缩小根本原因所在的范围。
4.通过现场试验、实验室试验或过程描述提供准确定位真正原因的有效信息。用有助于再现问题的手段,在不同环境条件下多次模拟,可以提高置信水平。
RCA提供了一个分析问题的简单易行的方法,该方法通过正确的提问来引导思考,快速有效地定位问题的原因。这个分析工具可用于产品的设计和生产阶段的失效模式鉴别。做好RCA工作的几点好处是:①提供了一个鉴定和证实特定问题原因的逻辑思维方法;②有助于使组织完成失效模式鉴定的方式规范化,有助于证实产品设计和生产过程中FMEA分析的失效模式,进而更准确地进行风险评估;③提供了一个简单、恰当的决定和评估可能原因的方式;④适用于产品研发过程的各个阶段,有助于许多工程领域问题的根本原因分析。
五、 权重分析
(一)层次分析法
1.定义
层次分析法(analytic hierarchy process,AHP)是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70年代初,在为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。
所谓层次分析法,是指将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,作为目标(多指标)、多方案优化决策的系统方法。其基本思路与人对一个复杂的决策问题的思维、判断过程大体上是一样的。
2.基本步骤
(1)建立层次结构模型:
这是AHP法中的关键一步(图2-2)。首先,把复杂问题中所包含的因素分解为不同层次。同一层次的因素作为准则对下一层次的某些因素起支配作用,同时,它又受上一个层次因素的支配。这种从上到下的支配关系形成了一个递阶层次结构。
以经济承载能力分析为例:①目标层:处于最上层,一般是分析问题的预定目标(以经济承载能力作为目标,以综合指标表示经济承载能力的总体状况);②制约层:构成经济承载能力系统的各个子系统,是制约经济承载能力的主要因素;③要素层:要素是子系统的组成部分,在经济承载能力评价指标体系中,要素就是构成指标体系的各个指标。
图2-2 AHP的递阶层次结构
(2)构造成对比较矩阵:
在建立递阶层次结构以后,上下层元素间的隶属关系就被确定了,下一步是要确定各层次元素的权重。对于大多数社会经济问题,特别是比较复杂的问题,元素的权重不容易直接获得,这时就需要通过适当的方法推导出它们的权重。AHP利用决策者给出判断矩阵的方法导出权重。假定A层中元素与下层次B中元素有联系,则将B中元素成对比较,构成如下判断矩阵:
其中,P ij=W i/W j表示对人而言,第i个元素(因素)与第j个元素(因素)重要度之比。
(3)计算权向量并做一致性检验:
对每一个成对比较阵计算最大特征根及对应特征向量,利用一致性指标、随机一致性指标和一致性比率做一致性检验。若检验通过,特征向量(归一化后)即为权向量:若未通过检验,需重新构造成对比较阵。
AHP采用一个数量标准来衡量判断矩阵A的不一致程度(表2-1)。
表2-1 判断矩阵标度及其含义
P表示重要性强度,2、4、6、8、1/2、1/4、1/6、1/8表示介于表内数值之间的赋值
一致性指标CI的值越大,表明判断矩阵偏离完全一致性的程度越大,CI的值越小,表明判断矩阵越接近于完全一致性。一般判断矩阵的阶数n越大,人为造成的偏离完全一致性指标CI的值便越大;n越小,人为造成的偏离完全一致性指标CI的值便越小。一致性检验的公式为:
其中CR为随机一致性比率,RI为平均随机一致性比率,CI为一致性指标。对于1~9标度法,平均随机一致性比率RI的值见表2-2。
当阶数≤2时,可判定矩阵具有完全随机一致性;当CR<0.1时,同样可接受判断矩阵一致性的假设。
表2-2 平均随机一致性指标
(4)各指标权数的计算:
判断矩阵的最大特征值和特征向量的计算方法有根法、和法两种方法。下面介绍用根法计算特征根的方法:
a.计算判断矩阵A各行各个元素m i的乘积:
b.计算m i的n次方根
c.对向量 进行归一化处理。
则 向量即为所求权重向量
d.计算判断矩阵的最大特征根
其中(P iW) i表示向量PW的第i个元素
(5)层次总排序:
确定某层所有因素对于总目标相对重要性的排序权值过程,称为层次总排序。这一过程是从最高层到最底层依次进行的。对于最高层而言,其层次单排序的结果就是总排序的结果。
最底层(方案层)得到的层次总排序,就是n个被评价方案的总排序。若上一层次A包含m个因素A 1、A 2……A m,其层次总排序权值分别为a 1、a 2……a m,下一层次B包含n个因素B 1、B 2……B n,它们对于因素A j的层次单排序的权值分别为b 1j、b 2j……b nj(j=1、2……m),此时B层次的总排序权值见表2-3。B层次的层次总排序为:
AHP最终得到方案层各决策方案相对于总目标的权重,并给出这一组合权重所依据整个递阶层次结构所有判断的总一致性指标。据此,决策者可以做出决策。
表2-3 层次总体排序及组合权数
(二)人工神经网络
人工神经网络(artificial neural network,ANN)是一种并行的分布式信息处理结构,通过称为连接的单向信号通路将一些处理单元(具有局部存储并能执行局部信息处理能力)相互连接而组成。人工神经网络是能获取、存储和利用经验知识的物理细胞系统。
人工神经网络具有以下主要特点:具有非线性映射能力;不需要精确的数学模型;擅长从输入、输出数据中学习有用知识;容易实现并行运算;由大量的简单计算单元组成,容易用软硬件实现。它的工作过程主要有学习期和工作期两个阶段。学习期主要对神经网络连接权值进行修改;工作期主要对于给定的输入进行计算,得到识别结果。
近年来,人工神经网络的研究工作不断深入,已经取得了很大进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
1.基本特征
人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。人工神经网络具有4个基本特征:
(1)非线性:
非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制两种不同的状态,这种行为在数学上表现为一种非线性关系。具有阈值的神经元构成的网络具有更好的性能,可以提高容错性和存储容量。
(2)非局限性:
一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。
(3)非常定性:
人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化,而且在处理信息的同时,非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。
(4)非凸性:
一个系统的演化方向,在一定条件下将取决于某个特定的状态函数。例如能量函数,它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值,故系统具有多个较稳定的平衡态,这将导致系统演化的多样性。
2.网络模型
人工神经网络模型主要考虑网络连接的拓扑结构、神经元的特征、学习规则等。目前,已有近40种神经网络模型,包括反传网络、传感器、自组织映射、Hopfield网络、波耳兹曼机、适应谐振理论等。根据连接的拓扑结构,基础的神经网络模型可以分为前向网络和反馈网络。
(1)前向网络:
网络中各个神经元接受前一级的输入,并输出到下一级,网络中没有反馈,可以用一个有向无环路图表示。这种网络实现信号从输入空间到输出空间的变换,它的信息处理能力来自简单非线性函数的多次复合,网络结构简单,易实现。反传网络是一种典型的前向网络。
(2)反馈网络:
网络内神经元间有反馈,可以用一个无向的完备图表示。这种神经网络的信息处理是状态的变换,可以用动力学系统理论处理。系统的稳定性与联想记忆功能有密切关系。Hopfield网络、波耳兹曼机均属于这种类型。
3.神经网络的种类
神经网络目前已经有几十种不同的模型,通常可按以下5个原则归类:①按照网络的结构分为前向网络和反馈网络;②按照学习方式分为有导师学习和无导师学习型;③按照网络性能分为连续型和离散型,随机型和确定型;④按照突触性质分为一阶线性关联和高阶非线性关联型;⑤按照对生物神经系统的层次模拟分为神经元层次模型、组合式模型、网络层次模型、神经系统层次模型和智能型模型。
4.应用分析
经过几十年的发展,神经网络理论在模式识别、自动控制、信号处理、辅助决策、人工智能等研究领域取得了广泛的成功。下面介绍神经网络在一些领域中的应用现状。
(1)信息领域:
在处理许多问题的过程中,信息来源可能不完整并且包含假象,决策规则有时相互矛盾,有时无章可循,这给传统的信息处理方式带来很大困难,而神经网络能很好地处理这些问题,并做出合理的识别与判断。
1)信息处理:
现代信息处理要解决的问题是很复杂的,人工神经网络具有模仿或代替与人的思维有关的功能,可以实现自动诊断、问题求解,解决传统方法所不能或难以解决的问题。人工神经网络系统具有很高的容错性、鲁棒性及自组织性,即使连接线遭到很大程度的破坏,它仍能处在优化工作状态,这点在军事系统电子设备中得到广泛应用。现有的智能信息系统有智能仪器、自动跟踪监测仪器系统、自动控制制导系统、自动故障诊断和报警系统等。
2)模式识别:
模式识别是通过对表征事物或现象的各种形式的信息进行处理和分析,对事物或现象进行描述、辨认、分类和解释的过程。该技术以贝叶斯概率论和申农的信息论为理论基础,对信息的处理过程更接近人脑的逻辑思维过程。现在有两种基本的模式识别方法,即统计模式识别和结构模式识别。近年发展起来的人工神经网络模式的识别方法逐渐取代了传统的模式识别方法。经过多年的研究和发展,模式识别已成为当前比较先进的技术,被广泛应用到文字识别、语音识别、指纹识别、遥感图像识别、人脸识别、手写体字符的识别、工业故障检测、精确制导等方面。
(2)医学领域:
由于人体和疾病的复杂性、不可预测性,在生物信号与信息的表现形式上、变化规律(自身变化与医学干预后变化)上,对其进行检测与信号表达,获取的数据及信息的分析、决策等诸多方面都存在非常复杂的非线性联系,适合人工神经网络的应用。目前的研究几乎涉及从基础医学到临床医学的各个方面,主要应用在生物信号的检测与自动分析、医学专家系统等。
1)生物信号的检测与分析:
大部分医学检测设备都是以连续波形的方式输出数据的,这些波形是诊断的依据。人工神经网络是由大量的简单处理单元连接而成的自适应动力学系统,具有巨量并行性、分布式存贮、自适应学习和自组织等功能,可以用来解决生物医学信号分析处理中常规方法难以解决或无法解决的问题。神经网络在生物医学信号检测与处理中的应用主要集中在对脑电信号的分析、听觉诱发电位信号的提取、肌电和胃肠电等信号的识别、心电信号的压缩、医学图像的识别和处理等。
2)医学专家系统:
传统的专家系统是把专家的经验和知识以规则的形式存储在计算机中,建立知识库,用逻辑推理的方式进行医疗诊断。在实际应用中,数据库规模的增大将导致知识“爆炸”,知识获取途径也存在“瓶颈”问题,致使工作效率很低。以非线性并行处理为基础的神经网络为专家系统的研究指明了新的发展方向,解决了专家系统的以上问题,并提高了知识的推理、自组织、自学习能力,在医学专家系统中得到广泛的应用和发展。麻醉与危重医学等相关领域的研究涉及多生理变量的分析与预测,临床数据中存在一些尚未发现或无确切证据的关系与现象,信号的处理、干扰信号的自动区分检测、各种临床状况的预测等都可以应用人工神经网络技术。
(3)经济领域
1)市场价格预测:
对商品价格变动的分析可归结为对影响市场供求关系的诸多因素的综合分析。传统的统计经济学方法因其固有的局限性,难以对价格变动做出科学的预测。人工神经网络容易处理不完整、模糊、不确定或规律性不明显的数据,进行价格预测有着传统方法无法相比的优势。从市场价格的确定机制出发,依据影响商品价格的家庭数、人均可支配收入、贷款利率、城市化水平等复杂、多变的因素,建立较为准确可靠的模型,可以对商品价格的变动趋势进行科学预测,并得到准确、客观的评价结果。
2)风险评估:
风险是指在从事某项特定活动的过程中,因其存在的不确定性而产生的经济或财务的损失以及自然破坏或损伤的可能性。防范风险的最佳办法就是事先对风险做出科学的预测和评估。应用人工神经网络的预测思想是根据具体现实的风险来源,构造出适合实际情况的信用风险模型的结构和算法,得到风险评价系数,然后确定实际问题的解决方案。利用该模型进行实证分析能够弥补主观评估的不足,取得满意的效果。
(4)控制领域:
由于独特的模型结构、固有的非线性模拟能力以及高度的自适应和容错特性等突出特征,人工神经网络在控制系统中获得了广泛的应用。它在各类控制器框架结构的基础上,加入了非线性自适应学习机制,从而使控制器具有更好的性能。基本的控制结构有监督控制、直接逆控制、模型参考控制、内模控制、预测控制、最优决策控制等。
(5)交通领域:
近年来,人们对神经网络在交通运输系统中的应用开始了深入的研究。交通运输问题是高度非线性的,可获得的数据通常是大量并且复杂的,用神经网络处理相关问题有巨大的优越性。其应用范围涉及汽车驾驶员行为的模拟、参数估计、路面维护、车辆检测与分类、交通模式分析、货物运营管理、交通流量预测、运输策略与经济、交通环保、空中运输、船舶的自动导航及船只的辨认、地铁运营及交通控制等领域,并已经取得了很好的效果。
(6)心理学领域:
神经网络模型从形成开始,就与心理学有着密不可分的联系。神经网络模型是自神经元的信息处理功能中抽象出来的,其训练则反映了感觉、记忆、学习等认知过程。人们通过不断研究,改变人工神经网络的结构模型和学习规则,从不同角度探讨神经网络的认知功能,为其在心理学领域的应用奠定了坚实的基础。近年来,人工神经网络模型已经成为探讨社会认知、记忆、学习等高级心理过程机制的不可或缺的工具,还可以对脑损伤患者的认知缺陷进行研究。
虽然人工神经网络已经取得了一定的进步,但是还存在许多缺陷和有待提高之处,例如:应用的面不够广、结果不够精确;现有模型算法的训练速度和集成度不够高;需要在理论上寻找新的突破点,建立新的通用模型和算法;需进一步对生物神经元系统进行研究,不断丰富人们对人脑神经的认识。
(三)模糊逻辑决策
模糊逻辑指建立在多值逻辑基础上,运用模糊集合的方法来研究模糊性思维、语言形式及其规律的科学。
模糊逻辑是模仿人脑的不确定性概念判断、推理思维方式,对于模型未知或不能确定的描述系统,以及强非线性、大滞后的控制对象,应用模糊集合和模糊规则进行推理,表达过渡性界限或定性知识经验,模拟人脑方式,实行模糊综合判断,推理解决常规方法难以解决的规则型模糊信息问题。模糊逻辑善于表达界限不清晰的定性知识与经验,它借助于隶属度函数概念,区分模糊集合,处理模糊关系,模拟人脑实施规则型推理,解决因“排中律”的逻辑破缺产生的种种不确定问题。
模糊逻辑是二元逻辑的重言式:在多值逻辑中,给定一个MV-代数A,一个A-求值就是从命题演算中公式的集合到MV-代数的函数。如果对于所有A-求值,这个函数把一个公式映射到1(或0),则这个公式是一个A-重言式。因此对于无穷值逻辑(比如模糊逻辑、武卡谢维奇逻辑),设[0,1]是A的下层集合,获得[0,1]-求值和[0,1]-重言式(常称为求值和重言式)。Chang发明MV-代数来研究波兰数学家扬·武卡谢维奇在1920年提出的三值逻辑以及由此衍生的多值逻辑。Chang的完备定理(1958,1959)声称,任何在[0,1]区间成立的MV-代数等式也在所有MV-代数中成立。通过这个定理,证明了无穷值的武卡谢维奇逻辑可以被MV-代数所刻画。这同样适用于模糊逻辑。这类似于在{0,1}成立的布尔代数等式在任何布尔代数中也成立,布尔代数因此刻画了标准二值逻辑。
(四)支持向量机
支持向量机(support vector machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
支持向量机(还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据、识别模式,用于分类和回归分析。其主要思想可以概括为:它针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。
1.基本特征
(1)SVM学习问题可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法(如基于规则的分类器和人工神经网络)都采用一种基于贪心学习的策略来搜索假设空间,一般只能获得局部最优解。
(2)SVM通过最大化决策边界的边缘来控制模型的能力。尽管如此,用户必须提供其他参数,如使用核函数类型和引入松弛变量等。
(3)通过对数据中每个分类属性引入一个哑变量,SVM可以应用于分类数据。
(4)SVM一般只能用在二类问题,对于多类问题效果不好。
2.基本原理
SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来样本空间中非线性可分的问题转化为在特征空间中线性可分的问题。简单地说,就是升维和线性化。升维就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,因而人们很少问津,但是作为分类、回归等问题,很可能在低维样本空间无法线性处理的样本集,在高维特征空间却可以通过一个线性超平面实现线性划分(或回归)。一般的升维都会带来计算的复杂化,SVM方法巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”.这要归功于核函数的展开和计算理论。
选择不同的核函数可以生成不同的SVM。常用的核函数有以下4种:①线性核函数K(x,y)=x·y;②多项式核函数K(x,y)=[(x·y)+1]^d;③径向基函数K(x,y)=exp(-|x-y|^2/d^2);④二层神经网络核函数K(x,y)=tanh[a(x·y)+b]。
六、 物流系统建模与仿真
物流系统是指在一定时间和空间内,由需位移的物资与包装设备、搬运装卸机械、运输工具、仓储设施、人员和通信联系等若干相互制约的动态要素所构成的,具有特定功能的有机整体。物流系统的目的是实现物资的空间和时间效益,在保证社会再生产顺利进行的前提条件下,实现各种物流环节的合理衔接,并取得最佳的经济效益。
物流系统的正常活动需要投入大量人力、物力、资金、信息,通过物流管理、物流信息管理、物流技术措施等转化处理活动,产生一定的经济效益,为客户提供一定的服务,同时对环境也产生一定的影响。这些信息将反馈给物流节点,以便能调整和修正物流系统的活动。其基本模式如图2-3所示。医院医疗器械和设备也需要物流系统的支持。
图2-3 物流系统基本模型
(一)物流系统建模
在物流系统领域,建立各种系统模型并利用模拟技术进行物流优化已成为研究与实践中的一个重要方法。物流系统模型是对物流系统特征要素、有关信息和变化规律的一种抽象表达,描述了系统各要素之间的相互关系、系统与环境之间的相互作用,以反应系统的某些本质。
物流系统模型具有3个特点:①实体的抽象或模仿;②由与分析问题有关的因素所组成;③用来表明这些因素间的关系。物流系统模型的主要参数包括周期数、库存量、初始库存、库存价格、库存成本、进(出)货量、延迟时间、运输价格、运输成本、总成本。当然,由于物流系统的研究目的与优化目标不同,对不同环节模拟需求也不一样,其主要参数当然也不同,上述10个参数只针对运输与仓储等子系统的模拟而言。在具体物流系统模型中,还有其他一些参数,在具体应用时根据实际需求加以增减。
常见的物流系统模型有:资源分配型、存储型、输送型、等待服务型、指派型、决策型和其他模型。
1.物流模型构建的原则
为了使模型可以较好地反映和解决各种各样的物流管理和决策问题,通过对物流现状的总结,针对我国当前物流的特点,物流研究的模型建立过程应该注意以下4点:①模型构造的系统化;②物流模型简单化;③物流研究多方位化;④物流模型构建的规范化。
建立物流系统模型一般要遵循以下原则:准确性、可靠性、简明性、实用性、反馈性。
2.物流系统建模步骤
不同条件下的建模方法虽然不同,但是建模的全过程始终离不开了解实际系统、掌握真实情况、抓住主要因素、弄清变量关系、构造模型、反馈使用效果、不断改进以逐步向实际逼近。
建立物流系统模型时需要注意:保持足够的精度;简单实用;尽量借鉴标准形式。其步骤可以归纳为以下几步。
(1)弄清问题,掌握真实情况:
通过观测,清晰、准确地了解系统的规模、目的和范围以及判定准则,确定输出、输入变量(即影响因素和决策变量)及其表达形式。
(2)收集整理资料:
收集真实可靠的资料并全面掌握,对资料进行分类,概括出本质内涵,分清主、次变量,挑选已研究过或成熟的经验知识或实例进行作为基本资料,供新模型选择和借鉴,将本质因素的数量关系尽可能用数学语言来表达。在这一步要注意确保信息资料的正确性和有效性。
(3)确定各因素之间的关系:
确定本质因素之间的相互关系,列出必要的表格,绘制图形和曲线等。在存在因素很多的情况下,要根据物流系统研究的目的进行取舍。
(4)构造模型:
在充分掌握资料的基础上,根据系统的特征和服务对象,构造一个能代表所研究系统的数量变换数学模型。这个模型可能是初步的、简单的,但必须能合理解释观测结果,尽管这种解释是受某些假设条件约束的。
(5)求解模型:
通过数学演算或逻辑推理,利用解析法或数值法按所建立的物流系统数学模型预测实际系统的运动状态,即求解模型最优解或可行域。对于较复杂的模型,有时需绘制框图和编制计算机程序来求解。
(6)检验模型的正确性:
检验模型的正确性一般通过实验来进行。验证模型是否在一定精确度的范围内正确地反映了所研究的问题,必要时要进行修正和反复订正,如模型不能在一定精度的约束下反映原物流系统的问题,则要求找出原因,并根据原因对模型的结构进行调整或增减一些变量,改变变量性质或变量间的关系以及约束条件等,使模型进一步符合实际情况,满足在可信度范围内可解、易解的要求后投入使用。
3.物流系统建模技术
(1)物流系统建模方法:
建立一个合适的系统模型既需要综合运用各种科学知识,还需要充分发挥人的创造性,针对不同系统对象,或建造新模型,或巧妙利用已有的模型,或改造已有的模型。因此,物流系统模型的建造也是一种艺术,没有现成的、通用的方法。
1)系统优化方法:
所谓最优化,就是在一定的约束条件下,求出使目标函数为最大(或最小)的解。求解最优化问题的方法称为最优化方法。一般来说,最优化技术所研究的问题,是对众多方案进行研究并从中选择一个最优的方案。系统最优化离不开系统模型化,先有模型化而后才有系统最优化。物流优化方法可以运用线性规划、整数规划、非线性规划等数学规划技术来描述物流系统的数量关系,以便求得最优决策。
2)模型仿真方法:
系统模型是由实体系统经过变换而得到的一个映像,是对系统的描述、模仿或抽象。物流系统仿真的目标在于建立一个既能满足用户要求的服务质量,又能使物流费用最小的物流网络系统。
仿真方法是利用数学公式、逻辑表达式、图表、坐标等抽象概念来表示实际物流系统的内部状态和输入、输出关系,以便通过计算机对模型进行试验,通过试验取得改善物流系统或设计新的物流系统所需要的信息。
3)启发式方法:
是针对优化方法的不足,运用一些经验法则来降低优化模型的数学精确程度,并通过模仿人的跟踪校正过程求取物流系统的满意解。启发式方法能同时满足详细描绘问题和求解的需要,比优化方法更为实用。其缺点是难以知道什么时候好的启发式解已经被求得。
4)网络技术:
又称计划评审法(program evaluation review technique,PERT)。网络技术是以工作之间的逻辑关系和所需时间为基础的“网络图”来反映整个物流系统运作的全过程,并能指出影响全局的关键所在,从而对整体系统做出比较切实可行的全民规划和安排。利用网络模型来模拟物流系统的全过程以实现其时间效用和空间效用是最理想的。
5)预测技术方法:
在规划与设计时,要预测需求的发展与变化规律,以决定设施、设备等供应的提供模式;在管理与经营时,要预测市场的变化规律,制订正确的经营管理方案。在定性分析方面,常见的方法有德尔菲法、模糊评判法、主管概率法、历史类比法等。在定量分析方面,常见的方法有时间序列分析、增长系数法、相关(影响)系数法、因果分析法、数学规划法等。此外,调查分析、决策论等技术也较广泛地应用于物流系统的研究中。
(2)物流系统主要建模技术:
物流系统属离散事件动态系统。近些年,研究人员对离散动态系统的建模、分析、优化等方面的研究取得了很大进展,开发了很多新的建模技术。概括地讲,这些建模方法可分为两大类:形式化建模技术和非形式化建模技术。
1)形式化建模技术:
指采用大量数学工具,通过状态方程对系统进行描述和分析,如排队网络法、极大代数法、扰动分析法、Petri网法等。
排队网络法、极大代数法、扰动分析法都是对系统的动态过程建立严格的动态方程。在现实中,大量的实际系统无法用严格的数学方程来描述,因此其实用性受到限制。同时,这些状态方程无论是建模还是分析都需要大量的数学知识,其抽象的表述也不符合人们的思维方式,因此这些建模方法不宜推广使用。
相比较而言,Petri网模型向前迈出了一步。Petri网特别适用于模拟含有相互作用的并行分支的系统。由于对系统动态特性,如并发性、异步性、分布式、非确定性、并行性进行了较好的描述,同时图形的表示法易于理解和接受,Petri网模型已经成为目前离散动态系统建模中最常用的建模技术之一。各种各样的网系统已经被开发出来,如条件/事件网、库所/迁变网、有色网系统等。这些网系统的开发极大地扩展了对复杂系统的建模能力。条件/事件网由条件和事件组成,条件由圆圈代表,事件由方框代表(图2-4)。
2)非形式化建模技术:
指采用图形符号或语言描述等较贴近人们思维习惯的方式,对系统进行描述和分析,这种分析主要借助计算机程序实现,如活动循环图、模拟语言、面向对象技术等。
图2-4 Petri网络物流系统模型
活动循环图:又称ACD图。它认为系统中的每一种实体都按各自的方式循环地发生变化。在这一循环中又只有两种状态——静止状态和活动状态。这两种状态交替出现。活动循环图以图形方式直观地显示系统。
流程图法:是计算机程序设计时所用的系统模型,它通过信息(数据)的传递和转移来描述系统。这种方法主要用来做程序设计,对系统的状态缺乏直接描述。
面向对象的建模技术:可以使对现实世界的描述更接近实际。传统的面向过程的系统主要由一些算法构成,对每一种算法,输入、输出关系是确定的,类似控制理论中的代数系统。这种描述与实际系统有较大的差距。面向对象则将系统的属性映射为一组数据结构,将系统与外界的交互映射为一组操作,系统外部对系统状态的方向必须经过操作进行,类似于控制理论中的动力学系统。这种描述更接近客观实际,更有利于进行系统集成。
3)系统动力学建模技术:
系统动力学是一门基于系统论,吸取反馈理论与信息论的精髓,并借助计算机模拟技术的交叉新学科。系统动力学能定性与定量地分析研究系统,它采用模拟技术,以结构-功能模拟为其突出特点。不同于功能模拟(也称黑箱模拟)法,它是从系统的微观结构入手建模,构造系统的基本结构,进而模拟与分析系统的动态行为。这样的模拟适合用于研究复杂系统随时间变化的问题。
在系统动力学的建模过程中,人们将更充分地了解系统的结构与功能的相互关系。系统动力学从系统的微观结构入手建立系统的模型,为研究系统结构与功能的关系提供了科学的方法。
4)Agent与多Agent模型应用:
Agent作为分布式人工智能概念模型,具有自己的行为、目标和意图,能在环境中自主地执行任务,具有自主性、响应性、智能性、结构分布性、社会性及合作协调性等特点。
多Agent系统(multi-agent system,MAS)是由多个Agent基于一定协调机制组成的自由组织系统。在多Agent理论方面,BDI理论(Belief-Desire-Intention)被认为是MAS的理论基础之一。它从哲学上对人的行为意图进行了深入的研究,认为只有保持信念、愿望(Desire)和意图(Intention)的理性平衡才能有效地解决问题。
目前MAS的体系结构大致可分为3类:审思式、反应式和混合式。根据自组织原理,简单个体按照一定的体系组织起来,通过交互协调,可以产生复杂的整体行为。当问题变得复杂,一个Agent无法解决时就需要多Agent系统。物流与供应链系统是一个复杂的系统,其中一个任务在某人看来是原子过程(不可分割),但是其他人未必苟同。比如客户发出购买订单,他认为货物来自一个原子过程,但在制造商看来这是一个复杂的、可以分得非常细的制造过程。对应于MAS,Agent的自主性和系统的协调机制使得多Agent模型系统在描述供应链这一复杂系统方面具有独特的优势。
(二)物流系统仿真
早期的物流系统仿真主要是通过建立数学模型进行处理,即一般仿真技术中的数学仿真。因此,物流系统的数学仿真一般过程与物流系统模型的建立类似。然而,试图建立一个一般的统一模型来对整个物流系统进行优化必然存在一种和实际系统的偏差,而且这种偏差对物流系统优化而言将是致命的。
1.物流系统仿真的特点和类型
物流系统仿真就是要找出适合物流系统特征的技术方法,对其进行完整科学的描述,一般来讲具有以下几个特点:物流系统中物流的仿真、排队的仿真、人的因素的仿真。
目前,在物流系统领域进行仿真应用主要体现在以下几个方面:
(1)在新建与改建工厂或物流中心时,第一步是进行规划和设计。现代科技可先通过模仿现实物流中心的机械设备以及人员操作等,在电脑上构建虚拟物流中心,完成各种系统验证操作,以便能建设出“工期短、成本低、质量高”的物流中心。
(2)仓库建设是一项大型的系统化工程,涉及前期可行性研究、规划、设计、设备选型、制造、安装、调试等诸多环节,可通过应用三维动画物流仿真系列软件,使人们在新建或改建仓库时,先通过模仿现实物流中心的机械设备及人员操作等,在电脑上构建虚拟的物流中心。医院的设备仓库同样适用这一技术,但更复杂。
(3)在机构使用新的设计或概念时,由于时间和资金限制,人们无法承受失败所带来的风险,仿真技术有助于减轻失败的风险。
物流系统仿真的类型包括连续系统模型和离散系统模型。根据仿真时钟推进方式不同,物流系统仿真又可分为下次事件时间推进法、固定增量时间推进法和主导时钟推进法。
2.物流系统仿真的主要步骤
图2-5显示出在一般情况下一个物流系统典型、完整的仿真步骤以及各步骤间的关系。对于一些简单的、特殊的或复杂的物流系统仿真,可根据情况相应简化、减少或增加仿真过程的步骤。
3.物流系统仿真的应用
(1)仿真技术在物流行业中的发展前景:
计算机仿真技术目前已广泛应用于电力、航空、通信、交通运输、军事、化工、生物、经济等各个领域,并且将发挥更加重要的作用。我国现代物流产业刚刚兴起,在规划设计自动化物流系统中应用计算机仿真技术,不仅可以避免新开展的许多物流项目的重大失误,而且可以使新建的自动化物流系统更科学、更合理。
物流系统仿真技术主要应用概况见表2-4。
图2-5 物流系统仿真步骤
表2-4 物流系统仿真技术主要应用概况
续表
(2)物流系统仿真技术的研究热点:
仿真系统性能评估一直是系统仿真领域研究的重点与热点。物流系统仿真的可靠性直接决定仿真技术在物流领域应用的实际效果、应用范围和实施风险。
建模是仿真的基础。物流仿真模型所要描述的是客观世界中的物流系统的特性,而自然环境的建模和虚拟环境的建模是相当复杂的。此外,从最近的研究来看,新的建模方法主要集中在交叉学科,如有学者根据食物链这一生态现象提出新的优化算法。
通过抽取事物的属性特征,寻求使模型研究者更自然地参与仿真活动的方法,从而更好地开发仿真系统:该方面新的研究热点不是局限在具体的应用领域,而是以方法论为出发点,对仿真技术研究从学科体系研究理论的制高点,开展高层次的研究。目前相关研究主要集中在以下三方面:面向对象仿真(object oriented simulation,OOS)、定性仿真(qualitative simulation,QS)和智能仿真(intelligence simulation,IS)。
仿真结果分析:要想通过模拟仿真得出正确、有效的结论,必须对仿真结果进行科学的分析。早期的经典仿真软件都是以大量数据的形式输出仿真的结果,因此有必要对仿真结果数据进行整理和各种统计分析,以得到科学的结论。仿真的结果分析应能贴近生产作业的实际,因而要求新一代仿真软件应采用可视化技术,通过图形、图表,甚至动画以生动逼真地显示出被仿真对象的各种状态,使模拟仿真的输出信息更加丰富、详尽和有利于科学分析。如何进行此类结果分析,以及分析结果的人性化也是研究的热点。
七、 实效研究方法
保障与提高医疗器械临床应用实效属于医疗器械卫生技术评估方面研究的内容,包括临床应用效果和经济效益。
(一)治疗和诊断器械患者报告结果研究
在计划和评估治疗干预时,患者对待慢性疾病或失能时对生命质量的主观感受是重要的考量因素。在评估疗法的潜在效益时,应该考虑患者的偏好和承受能力。正如患者受疾病影响一样,他们同样受治疗的影响。药物治疗的长期作用和影响本身也会产生问题。比较极端的例子是,疗法所带来的不适可能比它所治疗的疾病还要令人难以忍受。如果患者认为某种疗法的副作用比疾病本身的状况还要差,就可能会拒绝或不配合这种治疗方案。
患者报告结果(patient-reported outcomes,PRO)由于遵循标准化的评估,使患者间比较变得可能,并提供了更好地理解疾病及其治疗方法的机会。PRO被定义为患者对健康状况及其治疗方案的生命相关方面的影响的评估。因此,它是所有关于健康和治疗的患者陈述的总称,包括健康相关生命质量(health-related quality of life,HRQOL)、功能、满意度、偏好、健康、症状等方面。PRO有时候也包括生产力评估以及疾病与治疗对生产力的影响评估。
PRO通常从患者角度考虑,通过一份包含患者经历相关“范围领域”的问卷来测量。为了让PRO成为有用的卫生服务结果测量方式,需要一个可靠且有效的问卷来评估特定疾病和患者相关的领域。领域也称“维度”、“成分”、“概念”或“尺度量表”,定义为问卷中的一系列条目或问题。条目的每一条是一个领域,生成一个“量表得分”,代表对患者生活某个特定方面的评估。
PRO作为更多传统方法的替代指标,用来评估疾病的严重性或不同治疗选择的有效性。当考虑到某些没有传统临床评价手段、技术上有挑战、昂贵或对患者有负担的疾病时,这会特别有用。PRO最常被用于评估治疗设备,也可用于评估诊断设备,以评价与更早或更准确诊断相关的患者获益。PRO在以下几个方面的应用越来越广泛:①研究反映疾病进展的生理因素;②作为发病率和死亡率的预后指标;③测试治疗的疗效(关键试验);④检查干预的有效性(上市后研究);⑤在项目评估和政策分析上确立重点;⑥分配资源。
测量方法
(1)数据收集方法:
PRO问卷调查可以是患者自填式或调查员代填式。自填式纸质调查问卷可以邮寄给调查对象,也可在临床环境中有监督或无监督地由调查对象自主完成。电子化问卷由调查对象在可获得电脑的情况下自主完成。
自填式纸质问卷通常成本更低、时间花费更少,但发生错误的可能性更大。自填式纸质问卷相关的错误包括:漏填、问题跳转错误、单选题选择多个答案、答案不在要求范围内等。基于计算机的问卷调查有可能减少这些错误。同时,基于计算机的问卷调查无须手动将调查数据录入数据库,因而可以消除数据录入错误。虽然电脑化可以最大化降低数据缺失的可能性,但是仍然无法避免由于受试者对问题的误解而导致的错误这一自填式问卷的潜在问题。例如,受试者可能误解或无法理解一个术语的含义,进而基于自己对这个词含义的猜测做出回答。
研究的规模和范围也可以对恰当的调查方式的选择产生影响。纸质问卷可能是获取小规模研究中PRO数据更合适的手段,因为基于计算机的问卷调查的编码会花费大量时间和成本。对于更大规模的研究,基于计算机的问卷调查的效益将大于编程增加的成本。基于计算机的问卷可能不适合用于主要针对老年患者的设备试验。
另外,问卷调查可以由经过培训的人员面对面或通过电话进行调查。对某些群体的访问式问卷调查可能带来更高的应答率和更低的漏题率。调查人员可以对受试者不理解的内容进行解释,因而由于错误理解问题而导致错误的可能性(如单选题选择多个答案或提供超出范围的答案)也减少了。与自填式问卷调查相比,调查员代填式问卷调查数据可能会更完整,但是成本也会更高,因为后者需要更多的资源,包括调查人员的培训和调查人员进行调查花费的时间。电话访问式调查也可以最小化理解错误和数据的丢失。但是由于调查对象在访谈期间无法看到完整的问卷,电话访问式调查只能针对答案简短、问题简单,不需要复杂的定义和说明的问卷。在面对面和电话访问问卷调查中,都必须对调查人员进行适当的培训,以确保调查的一致性。
另外,调查人员还可以通过交互式语音应答(interactive voice respond,IVR)系统或网络系统等交互式的方式收集PRO数据。IVR系统是一个自动化电话系统,可与受试者互动进行PRO问卷调查。用这套系统可以对自填式调查表根据受试者的回答进行修订。IVR系统具有以下优势:减少实施者和受试者的负担,节省进行问卷调查的时间。此外,当受试者完成问卷时,其回答会自动进入数据库,而不需输入数据。然而,当IVR系统有设计缺陷,如指示或选项不清楚、自动化的语速太快等时,IVR系统可能会给受试者带来困扰。研究表明,IVR系统尽管还存在潜在问题,但它可以收集到与访谈一样可靠的数据。基于网络的问卷也可以被用于通过网络来实施交互式的问卷调查。通常,“动态”这个词被用来描述基于问卷数据库生成一个基于网络的问卷和可能的回答,并实现通过网络的客户端浏览器实时连接控制的过程。例如,“动态SF-36(36题的短时健康调查)可以根据受试者对最初几个问题的回答定制其问题的数量和类型。与之相反,“静态”的基于计算机或纸质版本的SF-36,不管受试者对最初几个问题的反应如何。均采用相同的36道题。基于网络的调查问卷在答案输入时就可以进行即时编辑检查,也可以要求受试者要成功完成问卷必须回答每一道题。
受试者可能无法在没有帮助的情况下完成一个调查问卷。在这样的情况下,可以由代理人代表受试者完成问卷。虽然代理人可能高估或低估受试者的生命质量,但有研究表明代理人能够可靠地代替受试者提供回答,特别是对那些相对客观或者可以观察到的问题,如生理功能。然而对于较主观的问题,如情感状态,代理人无法代表受试者准确地回答。
(2)回答选项:
问卷通常包括“是”或“否”的两个选项(如七等级的李克特量表)和连续的视觉模拟评分(visual analogue acale/acore,VAS)。选项类型可分为评分量表、事件日志、图片量表和检查表(表2-5)。
表2-5 回答选项的类型
续表
数据来源:美国食品药品监督管理局
(3)语言和翻译:
许多问卷都是以英文形式发明的,问卷的翻译一方面有利于调查人员进行国际临床研究,另一方面有助于在美国等国家对那些母语不是英语的人群进行问卷调查。要获得不同国家和文化间可比的数据,翻译的问卷除了语言要等效外,还必须在观念、功能、可操作性、条目和量化标准上等价。翻译后的问卷必须在适当的人群中进行心理测量评估,以确保翻译的版本是有效的和可靠的。对问卷进行翻译时应该考虑以下步骤:
第一步:初步的语言版本的发展。
两个独立的正向翻译版本(由两类经验丰富的国内顾问分别翻译:一类是以目标语言作为母语的人员,另一类是英语双语人员)。
一个一致的正向翻译版本(由上述两类顾问合作,得到一个一致的正向翻译版本)。
一个反向翻译版本(由以英语作为母语,同时对目标语言双语的人员核对)。
评价反向翻译的内容是否等价(变化将在第二步“认识述谈”被测试以确保对其含义的理解)。
将反向翻译评估报告交付给问卷开发人员审查。
形成正向和反向翻译报告。
形成初步的语言版本(将修订后文本以需要的格式呈现)。第二步:认知述谈。
招聘5个患目标疾病的受访者。
进行认知述谈,对文档进行评估,并形成报告。
对在正向和反向翻译阶段对于文档的所有修订进行评估(基于调查对象对问卷的理解)。
第三步:确定最终语言版本。
对国际协调会议对于语言版本的最终修改进行讨论。
对最终的测量进行校对和排版。
形成最终的报告并交付该语言版本。
Wild和其同事的一份工作报告在以下方面提供了有用的信息:①为各个国家选择需要的翻译版本提供帮助;②为讲相同语言的不同国家选择合适的使用方法提供帮助;③在针对同一PRO测量使用不同的语言版本收集数据时,为收集方法的选择提供帮助。
(4)通用与疾病特异性问卷:
PRO问卷一般包括通用的、疾病特异性的、症状特异性的和治疗特异性的问题。通用问卷被用于评估不同情况和患有不同疾病的受试者的一般健康状况。SF-36问卷是被广泛验证和使用的健康状况通用量表之一。虽然通用问卷调查可以比较不同的患者群体,但因为不是专为某一个特定疾病设计的,所以不能够检测小的、临床上重要的变化。而疾病特异性问卷包含针对特定疾病或研究者感兴趣的特定情况的问题。
已被用于器械试验的SF-36评估健康相关生命质量包括以下8个方面:生理功能、由于身体健康原因造成的职能限制(身体相关职能)、身体疼痛、一般健康状况、活力、社会功能、由于情绪问题造成的职能限制(心理相关职能)和心理健康。除了可以量化以上8个方面外,SF-36还可生成两个总结性的评估——身体组件总结和心理组件总结。
(5)时间:
PRO问卷的使用频率应足以检测器械对受试者生命质量的影响。评估的时间安排取决于多种因素:①病情的严重程度;②死亡和副作用的风险;③可以观察到治疗效果的期望时间;④预期的对器械的最大应答;⑤研究持续的时间;⑥调查对象的可接受性。
PRO评估的时间安排通常和临床治疗时间一致,但生活质量的变化不一定和临床变化一致。评估的时间间隔应足以消解安慰剂的效应,并能观察到生活质量的变化。
像评估的时间间隔设计一样,回忆期的设计应该要在短时间内检测生活质量的改变。一般来说,与长时间间隔相比,受试者对短时间间隔事件的回忆更准确。当时间间隔太长(如一年前),受试者不能很好地回忆起时,回忆偏倚可能带来严重的问题。回忆期的设定各有差异,主要取决于疾病的病程和器械作用的方式。当需要调查对象回忆详细内容时,调查者应该询问调查对象最坏(或最佳)的经历,或要求调查对象通过写日记的方式来加强记忆。
(二)经济学评估方法
1.基本原则
成本效益分析以及其他经济学工具是用来分析卫生技术对于公众的价值的。这些评价方法对传统的市场价值评价进行了补充,通过患者或资助方所愿意支付的价格来决定市场价值。正确使用经济学评价方法(如成本效益分析或成本效果分析)来测量新卫生技术的价值与影响可以提高卫生专业人员、第三方支付者以及患者对于该项目的接纳与成功率。卫生相关领域与卫生非相关领域在不断竞争社会中有限的资金与资源。
一项完整的经济学评价需要对至少两项卫生干预措施进行比较并检验所有的成本与效果。整体框架如表2-6所示。
表2-6 经济学评价整体框架
最基本的经济学评价包括成本-效果分析、成本-效益分析,以及疾病成本、最小成本分析以及成本-效用分析。表2-7对这些分析方法进行了比较。
表2-7 经济学评价方法对比
DC.直接成本;IC.间接成本;C.总成本;n.时间段的数量;t.时间段;r.贴现率;E.效果;B.总收益;U.效用;
表2-7中罗列出了不同评价方法测量投入和产出单位的不同。在传统运筹学中(投入与产出的比较),器械的投入包括临床的使用时间测量以及器械成本,产出则是接受治疗和诊断器械的患者人数。总的来说,成本-效果分析的产出是指所挽救的生命数、累计调整生命年、预防伤残日等。成本-效益分析则使用金钱价值来衡量相关项目的产出。
2.成本分类
卫生经济学分析通常将消耗的资源分为三大类:①直接成本,指直接用于某卫生服务干预项目的卫生资源,如实物商品成本、劳动力成本和时间成本;②间接成本,通常指由于发病或死亡而导致的生产力损失(应注意在不同经济学领域,间接成本的内涵不同;③无形成本,指以货币衡量的,由于疾病或疾病的诊疗而带来的疼痛、焦虑和痛苦等。这三种类别在评估中被不同程度的使用,其中使用最多的是直接成本。具体应该分析哪种成本取决于经济学分析的角度、承担的实体和受托方。
3.成本收集
在卫生经济学分析中收集成本数据的步骤如下:
第一步:明确识别分析的受托方以及他们的需求和期望。这可以预先确定分析的类型(如成本最小化分析或成本-效用分析)、所需的角度(如第三支付方的角度或社会的角度)和考虑的范畴(如整个国家的卫生系统或一个特定社区或私人健康计划)。这一步非常重要,因为这些预先条件可以决定使用的方法,进而驱动其他所有工作,尤其是可以决定必须要收集哪些成本数据。
第二步:成本的测量。
干预或疾病的直接成本的估算有以下两种方法:
自下而上法(又称微成本核算):通过把干预过程中消耗的单个成本(成本单元)相加来估算干预项目的成本。
自上而下法:用于从接受某一干预或具有某类特征的所有患者的总成本推算(如某急性心肌梗死患者的平均成本)。
间接成本的估算有以下两种方法:
人力资本法:通过将个人将来的收入贴现到当前来估算人力资本的价值,从而估算由于死亡、疾病或损伤造成的生产力的损失。
摩擦成本法:通过在等待其他人接替其工作期间,患者本应有的收入来估算人力资本的价值。这仅能反映疾病、伤残和过早死的的短期结果。
尽管无形成本评估极少被作为一项单独的评估,但越来越多的卫生经济学评估开始包含无形成本(通常将其包含在效用中)。和许多其他没有市场价格的商品(如健康改善和疼痛减轻)一样,可以用特殊方法(如条件价值评估法)来估算无形成本,如利用问卷调查个体对某一假想情况的最大支付意愿,或者将其隐性包含在对结果的测量中(如质量调整生命年)。
第三步:成本展示。所有成本应该是可比的(如不会比较苹果和橘子),并且以同一年为基准,因此成本展示是必需的。经济学分析中考虑的成本实际上大部分是价格。两者除了理论上的不同外,实际应用中也会有差异。