第一节实验设计_医学统计方法学及SPSS软件应用（全国中医药行业高等教育“十四五”创新教材）-QQ阅读男生中文轻小说网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第一节　实验设计

一、基本要素

实验设计(experiment design)是根据研究目的和统计学要求制定适当的研究方案、技术路线和评价标准，对实验研究的总体计划和合理安排。其基本因素是受试对象、处理因素和实验效应，这三个要素贯穿于整个实验研究过程，共同决定着实验研究的结果。

(一)受试对象

受试对象(subject)又称研究对象，是实验中接受处理因素的客体。如动物、标本、特定病患者、健康志愿者、器官、细胞及正常人群等。应根据研究目的与内容规定明确条件，主要包括：

1.同质性条件　如地域、年龄、性别、病种和病情等一致性，动物的种类、品系、年龄、性别、体重和窝别等特征的一致性。

2.代表性条件　在同质的基础上，遵循随机抽样原则和保证样本含量。

3.纳入标准和排除标准　是同质特征的细化条件，如疾病诊断机构级别、国内诊断还是国际诊断、诊断包含的具体项目及指标范围等。

(二)处理因素

处理因素(treatment factor)也称实验因素，是根据研究目的欲施加给受试对象的某种干预，并呈现观察和评价效应。处理因素可以是生物的、化学的、物理的和心理的，如手术、药物、咨询和护理措施等；也可以是受试对象自身的某些特征，如年龄和性别等。

每个实验因素在量级或者强度的不同，称为水平(level)。为了保证研究结果的准确性和可靠性，确定处理因素时应注意以下问题:

1.确定主要处理因素　一般按研究假设和要求来确定处理因素及其数目，一般对结果影响较大的主要因素进行研究。

2.区分处理因素和非处理因素　在实验研究过程中，除了处理因素外，还会存在一些对研究结果会产生影响的非处理因素。例如，研究某药治疗某病的疗效，病人的病情、病程、职业、性别等可能对研究结果产生干扰作用。应采取随机、配对和区组等措施控制非处理因素，使其尽可能在所比较组间均衡分布，以控制其对研究结果的影响。

3.处理因素需要标准化　处理因素在整个研究过程中要保持一致性和程序规范化。一般要先通过查阅文献或开展预试验，明确处理因素的强度、频率、持续时间与施加方法等。

(三)实验效应

实验效应(experimental effect)是处理因素作用于受试对象的客观反映和结局，常通过观测指标来表达，也称为效应指标。选择恰当的效应指标应注意以下几点：

1.选择客观的指标　客观的指标是通过精密仪器来测定数据，可排除人为因素的干扰，真实显示试验效应的大小或性质，从而使得研究结果更可靠。主观性指标来自观察者或受试对象的主观感受，易受心理状态与暗示作用的影响，误差较大，在科研中应尽量少用。若研究中一定要用主观指标，如中医的辨证，应采取措施尽量减少主观心理因素的影响。

2.选择精确性高的指标　精确性具有精密度与准确度双重含义，精密度指几次平行测定结果相互接近的程度，而准确度指测定值与真实值符合的程度。研究中最好能选择一个既准确又精密的指标来反映实验效应。

3.选择灵敏度与特异度高的指标　灵敏度高的效应指标，对处理因素反应灵敏，能将处理因素的效应显示出来，减少受试对象出现假阴性的可能；而特异度高的效应指标，与所研究的问题具有本质性联系，特异性强，不易受非处理因素的影响，可减少受试对象出现假阳性的可能。因此，为了得到准确可靠的研究结果，医学研究中最好选择那些灵敏度和特异度均较高的指标来反映实验效应。

二、基本原则

在实验设计时，为了控制非处理因素对结果的影响，以较少的受试对象取得较为可靠的信息，达到科学研究的目的，必须遵循随机、对照、均衡和重复的原则。

(一)随机原则

随机(randomization)指在抽样或分组时，每一个研究对象都不受研究者或研究对象主观因素的影响，机会均等地被抽取或分配到某一组。主要包括：①随机抽样，即根据研究目的所确定，符合纳入标准的受试对象都有同等机会被选入样本。②随机分组，指通过随机方法，使总体中每一个受试对象都有同等概率被抽取分配到实验组或对照组。

随机化的目的是保证样本的代表性。方法可有抽签、抓阄、投掷硬币和摸球法，但实验中常用的方法是随机数字表法与计算机的随机数法。

1.随机抽样　常用的随机抽样方法的类别有：

(1)单纯随机抽样(simple random sampling)　将总体中的观测单位进行编号，再用随机数字表或计算机随机程序随机抽取部分观测单位组成样本。其优点是计算比较简单，缺点是要对所有观测单位编号，费时费力，实际工作困难。

(2)系统抽样(systematic sampling)　又称等距抽样，是把总体观测单位按一定顺序分为n个部分，从各部分随机抽取相同k位次的观测单位，由这些观测单位组成样本。优点是简单易行，容易得到一个按比例分配的样本，抽样误差小于单纯随机抽样。缺点是抽取的各个观测单位不一定彼此独立，总体观测单位有周期趋势或单调增减趋势时，易出现明显的偏倚。

(3)整群抽样(cluster sampling)　总体N个观测单位分为K个群，随机抽取其中某个或几个群，以这些群中的全部观测对象组成样本。优点是便于组织、节省经费、容易控制调查质量。缺点是当样本例数一定时，其抽样误差一般大于单纯随机抽样。

(4)分层抽样(stratified sampling)　按总体人口学特征或影响观测值变异较大的某种特征(如年龄和病程等)分成若干层，再从各层随机抽取一定数量比例的观测单位组成样本。不同层可以采用不同的抽样方法、独立进行分析。分层的优点是增加了层内同质性，层内抽样误差减小；各层样本量相同时，层间抽样误差较小。

四种抽样方法的抽样误差从大到小依次为：整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。可以把几种抽样方法结合起来使用，如分层整群随机抽样。

2.随机分组　常用的方法是随机数字表和计算机的随机数法。

随机数字表(random number table)是统计学家根据概率论原理编制的用于随机抽样与分组的工具表(附表15)。使用时可从任意行、列的数字开始，沿任意方向，按任意顺序依次录取任意多的随机数字。采用随机数字表法进行随机分配，不仅能做到真正随机，而且不受样本大小及分组多少的限制。

随机数是由计算机或计算器产生的介于0与1之间均匀分布的数字，若要得到0和100之间的随机数，将每个数乘以100，取整即可。同一软件用相同种子数所产生的随机数是一样的，称为随机数的可重复性。

【例2-1】试将20例合格受试者随机分配至A、B两组。

(1)随机数字表法

1)先将受试对象依次编为1～20号。

2)然后从随机数表(附表15)的第10行第1列开始向右读取20个一位数的随机数字，并依次标在受试对象编号下面。将随机数字依次排列如下：

3)令随机数字为单数者分入A组，为双数和零者分入B组。按此规则的分配结果为：

4)平衡两组例数：上述AB两组的例数不等，A组为9例，B组为11例，若要使两组的例数相等，需从B组调出1例入A组。调出哪一例也应随机。此时可取两位数，仍在随机数字表中接着原顺序往下继续查随机数字，依据表中1～11范围内的随机数字，哪一个先出现即为调出的顺序号者。如本例先出现的是09，则B组顺序第九的15号受试对象调入A组。最终的分配结果如下：

(2)计算机随机化　先将受试对象依次编为l～20号。取种子数为100，用SPSS 25.0产生20个随机数，对这20个随机数编秩次，秩次为1～10、11～20的随机数对应的受试对象分别归于A组、B组，结果见表2-1。

表2-1　应用SPSS对20例受试对象随机化分组结果

这样编号为7、15、11、1、19、4、12、18、14、6的受试对象为A组；10、8、16、5、17、13、3、9、20、2的受试对象为B组。

(二)对照原则

对照(control)即在调查或实验过程中，确立可供相互比较的参照组。其目的在于控制各种混杂因素、鉴别处理因素与非处理因素的差异，消除和减少实验误差，提高研究结果的真实性和可靠性。常用的对照有以下几种：

1.空白对照　即对照组不施加任何处理因素。这种方法用于动物实验中，由于伦理道德的要求一般不宜用于临床疗效研究。原理见图2-1。

图2-1　空白对照示意图

2.实验对照　指对照组不施加处理因素，但施加某种与处理因素相同的实验条件。凡实验因素夹杂重要的非处理因素，对实验效应产生影响时宜采用此法。原理见图2-2。

图2-2　实验对照示意图

3.安慰剂对照　安慰剂(placebo)是外观、剂型、大小、颜色、重量、气味和口味等都与研究药尽可能相同或相似，但不含有任何药理活性物质的制剂。目的在于消除研究者、受试者和参与评价人员由于心理因素等对药物疗效的影响，评价研究药物所引起的不良反应。

4.标准对照　采用目前标准的、公认的和通用的方法作对照。在评价某新药的疗效时，为了不延误患者的治疗，对于急性病、危重病和特殊疾病，应用已知的被公认的、疗效比较好且比较稳定的同类药物作标准对照。

5.历史对照　以旧疗法为对照组，以新疗法为试验组。历史对照比较方便，但偏倚较大，对比结果往往不能作为推理的依据。

6.自身对照　是在同一受试对象的不同时间、对称部位、不同器官采取不同处理措施的对照，并对效果进行对比分析。自身对照节省病例数，易控制实验条件，用于慢性病的临床研究。

7.相互对照　不设立对照组，各实验组间互为对照。如比较几种药物对某种疾病的疗效时，若研究目的是比较其疗效差别，不必另设对照组，各实验组可以互为对照。

(三)盲法原则

盲法(blind)是指研究者和研究对象的一方或多方均不知道研究分组与所接受的处理等情况。其目的是为了避免来自受试者和研究者的主观因素对研究结果的影响，以保证研究结果的真实可靠。

根据盲法的运用程度，可分为单盲、双盲、三盲和开放试验4种类型。

1.单盲　单盲是只有研究对象不知道试验的分组情况。由于避免了来自研究对象主观因素的影响，研究者了解分组情况，可及时处理发生的意外问题，并决定是否终止试验或改变方案，保证了研究对象在试验过程中的安全性。

2.双盲　双盲是指研究对象和观察结果的研究者均不知道研究对象的分组和接受处理的情况，而是由研究设计者安排和控制全部试验。可避免研究对象和观察者的主观因素所导致的偏倚，但方法复杂，较难实行，且一旦有意外，由于观察者不清楚研究对象的分组情况，较难及时处理发生的意外问题。因此，实施双盲要有另外的监督人员负责监督试验的全过程，以保证研究对象的安全。

3.三盲　三盲是指研究对象、观察者和统计分析者均不知道研究对象的分组和处理情况。可最大限度地减少或消除来自各方面的主观偏性，但操作的难度较大。

4.开放试验　开放试验是指无法设盲的公开进行的试验。一般用于有客观观察指标且难以实现盲法的试验，如大多数的外科手术治疗、行为疗法和减肥等。该法易于设计和实施，研究者了解分组情况，便于及时处理意外反应，但容易产生信息偏倚。

(四)重复原则

重复(replication)是指研究的实验组和对照组应有一定数量的重复观测，即实验单位要达到一定的数量。重复的意义在于控制和估计实验中的随机误差。

(五)均衡原则

均衡(balance)是指除处理因素不同之外，其他对实验结果可能有影响的非处理因素在各组间分布均衡。实验对象的特征基本一致，如年龄、性别、病情、社会地位、文化和收入等；实验条件一致，如实验过程、药品性状、仪器和辅助治疗等；测定结果和疗效评定确保一致，如调查的地点、询问的方式、疗效的评判标准和指标的测量过程等。

三、常用实验设计的类型

根据研究目的、设计类型、资料性质、样本含量及分布特征等条件选择统计分析方法。不同的设计类型都有相对应的统计分析方法。

(一)完全随机设计

1.概念　完全随机设计(completely randomized design)是根据研究的分组数将同质的全部实验对象按随机化的原则分配至若干组，然后再按组别实施不同处理的设计。

2.特点　优点是设计和实施比较简单，出现缺失值时仍可进行统计分析。缺点是只能安排一个因素，其检验效率低于配对设计和随机区组设计。

3.统计分析方法的选择　对于正态分布且方差齐的计量资料，采用单样本及成组资料的t检验、单因素方差分析；对于非正态分布或方差不齐的资料，采用两独立样本比较的Wilcoxon秩和检验、多个独立样本比较的Kruskal-Wallis H检验；对于计数资料，可采用χ2检验等。

(二)配对设计

1.概念　配对设计(paired design)是将实验对象按某些特征或条件配成对子，再将每对中的两个实验对象随机分配到不同处理组中的实验设计。配对的因素一般是影响研究结果的主要非处理因素。配对设计主要有：①自身配对：同一实验对象分别接受两种处理。如实验前后，左右侧，同一实验分别接受不同处理。②异体配对：将两个特征相近、同质性好的实验对象配成一对进行处理或观察。在动物实验中，常以窝别、性别相同，月龄和体重相近的两只动物配成对子；临床试验常将病种、病型和年龄等相近的患者配成对子。

2.特点　与完全随机设计相比，配对设计具有同质可比性强、样本含量较小、检验效能高等优点。

3.统计分析方法的选择　对于差值服从正态分布的计量资料，采用配对t检验；若差值不服从正态分布，可采用Wilcoxon符号秩和检验。对于计数资料，可采用配对χ2检验。

(三)配伍设计

1.概念　配伍设计(randomized/paired block design)也称为随机区组设计，是配对设计的扩展，将几个受试对象按窝别、性别和体重等条件配成区组，再将每一区组的受试对象随机分配到各个处理组中。同一区组内要求各试验对象尽可能一致，不同区组间的试验对象允许存在差异，每一区组内的试验对象随机分到不同处理组，每种处理在一个区组内只能出现一次。尽量选择对试验结果影响较大的非处理因素形成区组。

2.特点　优点是处理组间同质性较好，检验效能较高。缺点是若有数据缺失，对资料分析的影响较大，故尽可能使观察值不缺失，达到平衡完全区组设计。

3.统计分析方法的选择　如果各组数据服从正态分布且方差齐，采用随机区组设计方差分析；若各组数据不服从正态分布，则采用随机区组设计多个样本的秩和检验(Friedman M test)。

(四)交叉设计

1.概念　交叉设计(cross-over design) 是在自身配对设计基础上发展的双因素设计。将整个设计分为两个或多个阶段，各阶段分别给予不同的干预措施，然后比较各阶段效应间的差异(图2-3)。主要用于评价慢性易复发疾病。常用的有2×2(二处理二阶段)和2×3(二处理三阶段)交叉设计，处理组分别按AB与BA、ABA与BAB的顺序进行实验，见表2-2和表2-3。

图2-3　2×2交叉试验设计模式示意图

表2-2　2×2交叉设计

表2-3　2×3交叉设计

2.特点

(1)能控制时间因素对实验效应的影响，优于自身对照设计。

(2)消除个体间及实验时期间的差异对实验效应的影响，可提高试验的效率。

(3)各实验对象都接受了处理因素和对照的因素，均等地考虑了每一个患者的利益，符合医德要求。

(4)可在每个研究对象身上观察多个时期的两种处理的效应。

(5)节省样本含量。

(6)适用于病程较长的慢性疾病。

(7)如有患者退出试验，不仅造成数据的缺失，也增加了统计分析的困难。

3.统计分析方法选择　资料满足正态性、方差齐性时，采用交叉设计方差分析。

(五)拉丁方设计

1.概念　拉丁方设计(Latin square design)是按拉丁字母组成的方阵安排实验的三因素等水平设计。最常用的有3×3、4×4、5×5等阶拉丁方(图2-4)。行、列代表控制因素的水平；方阵中的字母代表处理因素的水平。拉丁方设计要求：①三个因素无交互作用。②三个因素水平数相等。③方差齐。

图2-4　几种基本型拉丁方设计

2.特点　是在随机区组设计的基础上，多安排了一个对实验结果有影响的非处理因素，即行和列两个方向皆成区组，增加了均衡性，减小了误差。因此，拉丁方设计的检验效能更高，且节约样本含量。缺点在于要求三因素无交互作用且水平数相等，使其实际应用具有一定的局限性。

3.统计分析方法的选择　采用三因素无重复试验的方差分析。

(六)析因设计

1.概念　析因设计(factorial experimental design)是一种将两个或多个因素的各水平进行全面交叉组合的实验设计，主要评价各因素的主效应、单独效应和交互作用。在医学研究中，常要评价联合用药效应，尤其是处理因素的个数k≥2，各因素在试验中所处的地位基本平等，而且因素之间存在一级(即2因素之间)、二级(即3因素之间)以及交互作用时，析因设计是一种非常理想的实验设计。

析因设计是对各因素不同水平进行全部组合的实验设计，总的实验组数是各因素水平数的乘积。设有m个因素，每个因素有n1，n2，…，nk个水平，那么共有G=n1×n2×…×nk个处理组。例如4个因素同时进行实验，每个因素取2个水平，实验的总组合数有24=16个，即这16种组合都要进行实验。因此，析因设计分析的因素数不超过4个，每个因素水平数不超过3个。

常用的设计有2×2析因设计和2×2×2析因设计。2×2析因设计属于两因素两水平析因设计，即试验中有A、B两个因素，每个因素各有两个水平，共有4种组合(表2-4)。2×2×2析因设计属于三因素两水平析因设计，即试验中有A、B、C三个因素，每个因素各有两个水平，共有8种组合，见表2-5。

表2-4　2×2析因设计模型

表2-5　2×2×2析因设计模型

2.特点

(1)析因设计属于全面试验的设计，不仅能获取各因素内部不同水平间有无差别，还能分析因素间的交互效应。

(2)节约样本量。

(3)当因素增加时，实验组数呈几何倍数增加，实验量大，负担太大。

(4)部分交互效应，特别是对于高阶交互效应，从专业上不好解释。

3.统计分析方法选择　因设计资料的方差分析或析因设计资料的秩和检验。

(七)重复测量设计

1.概念　重复测量设计(repeated measurement design)指医学研究中将同一观察对象先后重复地施加不同的实验处理，或在不同场合和时间点进行多次测量的一种试验设计方法。目的是推断处理因素、时间因素对于受试对象某一观察指标的影响作用，分析该观察指标在不同时间点上的变化趋势。

2.特点

(1)重复测量设计处理因素各水平是在区组间随机分配的，同一区组内受试对象接受的处理是相同的，只是时间点的不同。

(2)区组内数据间存在相关性。

3.统计分析方法的选择　重复测量设计的处理因素：g个水平，每个水平有n个试验对象，共计gn个试验对象。时间因素：同一试验对象在m(≥2)个时点获得m个测量值，共计gnm个测量值。数据处理分析可用方差分析。前后测量设计是重复测量设计的特例，即g=1，m=2，见表2-6。

表2-6　高血压患者治疗前后的舒张压(mmHg)

当前后测量设计的重复测量次数≥3时，称为重复测量设计，见表2-7。

表2-7　健康人血滤液不同放置时间的血糖浓度

四、样本含量估计的常用方法

样本含量(sample size)，即实验研究或调查研究中受试对象的数量。医学研究中，在保证研究结论具有一定可靠性前提下，常需在实验设计阶段估算出适宜的样本含量。

(一)样本含量估计的影响因素

1.检验水准α　α越小，所需样本例数越多。一般取α=0.05，还应结合专业要求判断是单侧检验还是双侧检验。α相同时，双侧检验要比单侧检验需要更大的样本量。

2.检验效能1-β　1-β又称把握度，即在特定的α水准下，H1为真时检验做出正确判断的符合概率。1-β越大，所需样本例数越多。通常取1-β为0.90。

3.允许误差δ　是需控制的样本和总体间或两个样本间某统计量的差别大小。如δ=μ1-μ2，或δ=π1-π2。δ越小，所需样本量越多；反之，亦然。通常根据预实验和查阅文献做事前预定。

4.总体变异度σ　即总体标准差，σ越大，所需样本量越多；反之，所需样本量越少。

(二)样本与总体比较的样本量估计

1.样本均数与总体均数比较　确定α和β后，令δ=μ-μ0，σ为实验结果的总体标准差，其样本量的计算公式为

(公式2-1)

式中：α有单、双侧之分，β只取单侧，zα和zβ为相应的正态分位数。

【例2-2】据报道，高血压患者舒张压的均数和标准差分别为98.58mmHg和13.45mmHg。现某医师采用中西医结合治疗，期望疗效结果至少使舒张压平均下降5mmHg，问至少需要观察多少病例？

本例：α=0.05，β=0.1，σ=13.45，δ=5。由标准正态分布表(附表1)查出双侧界值z0.05/2=1.96，单侧z0.10=1.282，代入公式2-1得出

(例)

因此，至少需要观察77例患者。

2.样本率与总体率比较的样本量估计　样本率与总体率的比较确定α和β后，π0为已知总体率，π为实验结果的总体率，π0≠π，令δ=π-π0，σ为实验结果的总体标准差，其样本量的计算公式为

(公式2-2)

公式2-2中：α有单双侧之分，β只取单侧，zα和zβ为相应的正态分位数。

【例2-3】已知某中药治疗皮肤病的显效率为70%，现试验一种特色中药治疗法，预计有效率为85%，规定α=0.05(单侧)，β=0.10，求所需样本例数。

本例：π0=0.70，π=0.85，δ=0.85-0.70=0.15

单侧界值z0.05=1.645，单侧z0.10=1.282，代入公式2-2，得

(例)

至少需要观察80例患者。

(三)完全随机设计两样本比较的样本量估计

1.两独立样本均数比较的样本量估计　当两样本例数要求相等时，先估计两个总体参数间的差值，即δ=μ1-μ2。μ1及μ2往往未知，可分别以及作为近似估计；同样，σ以合并标准差s作为近似估计；α常取0.05，β常取0.10。每组所需样本例数为

(公式2-3)

式中：δ为允许误差，以两样本均数之差近似替代，σ为总体标准差或其估计值。

【例2-4】某医院欲研究某中药治疗某病的临床疗效，以血沉作为疗效指标，该中药可使患者血沉平均下降3.4mm/h，标准差为1.2mm/h，西药可使患者血沉平均下降4.8mm/h，标准差为2.5mm/h，为了观察该中药的疗效，问：需要观察多少病例数？

本例：取α=0.05，β=0.1，1-β=1-0.1=0.90，双侧界值z0.05/2=1.96，单侧z0.10=1.282，δ=4.8-3.4=1.4，σ=2.5 ，代入公式2-3，得

(例)

每组所需观察病例数68，两组至少需要观察136例患者。

2.两独立样本率比较的样本量估计　令n为每组所需例数，p1、p2分别为已知的两个样本率，p为合计率，当设两组例数相等时，即p=(p1+p2)/2。q=1-p，则其样本含量计算公式为

(公式2-4)

【例2-5】某医院用中医、中西医结合两种方法治疗慢性气管炎患者，经初步观察，用中医治疗组的控制率为35%，中西医结合治疗组的控制率为45%。现拟进一步试验，问每组需观察多少病例，才可能在α=0.05的水准上发现两种疗法控制率有差别？

本例:p1=0.35，p2=0.45，p=(0.35+0.45)÷2=0.40，q=1-0.40=0.60，代入公式2-4

(人)

每组需观察192人，两组共观察384人。

(四)完全随机设计多个样本比较的样本量估计

1.多个独立样本均数比较的样本量估计

(公式2-5)

公式2-5中：n为各组样本所需的例数，σi为各总体的标准差，μi为各总体均数，μ=∑μi/k，k为所比较的样本组数，φ值是由α、β、ν1=k-1、ν2=∞查表得出。

【例2-6】某中医院呼吸内科医生应用中西医结合治疗肺气虚、脾气虚、肾气虚COPD患者，并以单纯西药为对照组，观察中西医结合治疗COPD患者不同中医证型的肺功能改善效果[FVC(L)]，根据查阅相关资料，肺气虚的FVC(L)为2.44±0.32，脾气虚为2.40±0.36，肾气虚为2.31±0.29，对照组为2.51±0.32。问该项临床研究估计需要观察多少病例数？

本例：取α=0.05，β=0.1，将各组的μi的估计值2.44、2.40、2.31、2.51，及σi的估计值0.32、0.36、0.29、0.32代入公式2-5，计算μ=∑μi/k=(2.44+2.40+2.31+2.51)/4=2.415；按α=0.05，β=0.1,ν1=4-1=3，ν2=∞，查附表11得φ=2.17，代入公式2-5得