第4章 医学心理学的方法学
4.1 复习笔记
一、概述
(一)医学心理学研究的基本目的与策略
1.基本目的
(1)进行行为描述和估计总体参数;
(2)检验变量间关系的假设。
2.基本策略
(1)描述研究策略
包括观察、测量和记录在现实世界中所发生的行为现象,研究者主要关心的是对受试者的行为或自我报告做出清楚的描述。
描述性研究的研究方法:①自然观察法;②个案研究法;③调查法;④测验法。
(2)相关研究策略
在相关研究中,研究者采用相关系数来考察两个或更多变量间是否有关系及关系的程度。
(3)操纵研究策略
研究者操纵受试者环境中的一些因素或有计划地改变受试者自身的状况,以观测记录他们行为上的变化。
(二)科学研究的信度与效度
1.信度
信度又称可靠性,代表着研究结果的可重复性。
2.效度
效度代表研究结果或推论的真实性,即与实际相符合的程度。分为内效度和外效度,内效度是指研究的结论在进行此研究的范围内被证实的程度,而外效度指此结论可概括到其他人、其他条件、场合和情境的程度。
3.信度与效度的关系
信度是效度的必要条件,但不是充分条件。信度水平高的研究结果未必真实有效,效度高的研究必定有高的信度。
(三)期待效应与客观性原则
1.期待效应
又称罗森塔尔效应,指研究者个人的态度、倾向、期待和人格等既可影响被研究者的行为,又会歪曲对被研究者行为的观测、记录与分析,从而使测量带有较多的主观成分。
2.客观性原则
为了保证研究的信度和效度,研究者必须严格坚持客观性原则。
二、常用的心理学研究方法
(一)观察研究法与生理测量
1.观察法
(1)定义
观察法是一种最基本的研究方法,又称自然观察法,指在完全自然的或不加控制的条件下,对被观察者的可观察的行为进行有目的、有计划的观察和记录。
(2)分类
依研究者是否参与被观察者的活动,观察法可分为“参与性观察”和“非参与性观察”。前者是指研究者或观察者直接参与、但不干预被观察者的活动;后者中观察者作为一个局外人观察、记录被观察者的行动。
(3)设计方案的考虑因素
①行为对观察者的可接近性;
②有关行为发生的频度;
③有关行为的关键的反应属性;
④搜集资料的目的;
⑤所需资料的广度;
⑥研究者可以利用的人力、金钱和物力。
(4)观察法的优点
①用途广,使用方便;
②由于是在完全自然的条件下进行研究,所以由观察研究中可以得到许多基本的、较真实的资料。
(5)观察法的不足
①不适于用来评定临床研究者常常更为感兴趣的病人内隐的认识评价、态度、思考和情感活动;
②某些行为的观察是不现实的、不可能的或不道德的;
③观察到的行为可能是多种因素作用的结果,并常带有主观性和偶然性;
④需要花费较长时间才能对所感兴趣的低频行为现象积累足够多次的观察,这在人力和时间上都是不经济的。
2.生理测量
(1)定义
人体内伴随着情绪应激而发生的生理生化变化,利用现代心理生理学手段和生物化学分析技术,可将这些变化变成“可观察的行为”。
(2)基本假设
①刺激——反应的特异性
指特定的刺激会在大多数人身上引起同样型式或同样层次的生理反应。
②行为型式——生理反应的特异性
指特定的行为型式会导致个体遇到刺激时产生某些普遍性的生理反应,即行为型式同生理反应之间有特异关系。
③症状的特异性
指个别反应的群体特异性。
④一般的激活或唤起水平
人的大脑功能状态、身体活动或外显行为以及植物神经紧张度等,都可反映激活水平。
(3)生理测量的优点
①测量装置可以自动观察记录,不受实验者偏向或期望影响;
②只要保证测量条件,生理仪器所获数据可准确反映受测者体内的变化情况;
③生理仪器可以持续监视,资料可再现,对变化趋势便于作数量化分析;
④便于观察、记录同时发生的许多现象或事件,如环境条件的变化、生理变化和不断进行的活动。
(二)调查法与测验法
1.调查法
(1)定义
调查法是借助于各种问卷、调查表和晤谈等了解人们的心理(如态度、意见、感受、行为方式、人格倾向)的一种研究方法。
(2)调查法的优点
使用方便,基本不受时间、空间限制,可在短期内获得大量资料,适用范围广泛。
(3)调查法的不足
调查所得到的自我报告资料只代表着被调查者愿意公开的部分,研究者虽然可以采取一些措施检验受调查者回答的诚实程度,但并不能保证他们真实地回答问题,从而可能会损害研究结果的真实性。
(4)分类
①按取样的特点,可将调查分为普查、抽样调查和典型调查。
a.普查:指对某一范围内所有的被研究对象无一遗漏地进行调查;
b.抽样调查:指从欲研究的总体中抽取一具有代表性的样本进行调查;
c.典型调查:指对某一范围内的少数典型对象进行调查;
②按照获取资料的方式,可将调查分为问卷调查、晤谈调查和电话调查。
a.问卷调查:指利用问卷来搜集资料的调查方法;
b.晤谈调查:指通过调查者同被调查者面对面的谈话方式而进行的调查。
晤谈按其目的,可分为诊断性晤谈、治疗性晤谈和以调查研究为目的的晤谈;按照其组织方式,晤谈又可分为结构式晤谈和非结构式晤谈。
c.电话与信函调查:优点是不受地理位置和距离的限制,进行较大规模的调查研究;缺点是不能保证受调查者按期寄回对问卷的回答。
2.测验法
测验法是利用标准化心理测验来测量和评定个体的能力、态度、性格、成就和心理(情绪)状态等心理特征的一种研究与诊断方法。
3.自我报告评定法的一些方法学问题
(1)定义
自我报告评定研究法是以标准化的问卷或量表为基础,借助于晤谈、问卷和量表为研究者提供一个集中地搜集、考察被研究者有关行为资料的机会。
(2)方法学问题
①工具的问题
利用自我报告调查表的研究者希望能依所得资料评定和预见人们的行为;自我报告调查表和问卷无法保证受测者真实地回答问题。
②实施的问题
包括受试者的选择、测量工具的选择以及测量程序等。
③解释的问题
研究者必须将测量结果视作多种因素相互作用的结果,充分考虑到各种替代性的解释,才不致得出错误的推论。
④证实的问题
研究者需进行重复的研究加以证实,肯定的结果有助于证实自我报告的信度,并为其效度的研究奠定基础;否定的结果则可为问卷和测验的修订以及调查设计的完善化提供资料和依据。
(三)个案研究法和相关研究法
1.个案研究法
(1)定义
对某现象的一个特例进行广泛深入的研究,这种研究法称作个案研究法。
(2)与样本研究的区别
①样本研究的研究对象必须有代表性,是可选择的;个案研究不强调代表性,研究对象是无选择的。
②就研究的时间特点而言,样本研究可以是横断的,也可以是纵向研究;而个案研究多为纵向的、前瞻研究。
③样本研究试图由样本结果推断或概括出总体特征或一般规律,是一个从个别到一般的过程;而个案研究则着重于对研究对象本身的分析,并进行科学的抽象。
2.相关研究法
(1)定义
相关研究法是考察两个变量是否有共变关系的一种研究方法,介于观察法与实验法之间。相关关系不等于因果关系。
(2)相关研究的优点
相关研究不要求对变量实施控制或操纵,允许研究者在更大范围内确定研究的变量或变量水平,也不要求随机分派被研究者。
(四)实验研究法
1.定义
实验法是在控制的条件下观察、测量和记录个体行为的一种研究方法,在控制的条件下,实验者系统地操纵或改变一个或几个自变量,观察、测量和记录对因变量的影响。
2.医学心理学实验的分类
(1)前实验
前实验实际上不能算作真正的实验研究,因为它没有对变量做必要的控制,不能有效地考验变量间的因果关系。例如不设任何对照组的前测验一操纵一后测验式设计。
(2)准实验
典型的准实验包括对照组,但对照组与实验组在某些方面不完全相当或匹配,这会导致实验操纵与两组受试者的选择间交互作用。准实验的常用设计方法有以下三种:
①不相当的独立组设计
此法适用于比较不同疾病的病人或正常人,也适用于比较一种或几种实验操纵对在一项心理测验中得高分和低分的人的影响。
②匹配组设计
根据一个或几个与因变量有关的因素,将来自两个不同总体或同一总体的两极的受试者匹配起来,使之具有可比性或相当性。
匹配组设计适用于下列情况:匹配的变量与因变量有关,两个总体在匹配的变量方面平均数相同或接近。
③次系设计
从同一总体随机地选择受试者,每一个受试者都接受一种或几种实验操纵或处理,在每一处理的前和后分别对因变量作多次测量。多用于治疗效果研究和异常行为的矫正实验。
(3)真实验
真实验的必要条件是有与实验组相当的对照组,即除了被作为自变量而加以操纵的因素外,在所有与因变量有关的方面,两组都相当。真实验可以最有效地考验变量间的因果关系。
真实验常用的实验设计有如下三类:
①独立组设计
从同一总体随机地选取受试者,而后又随机地分派到各组去。可以只操纵一个自变量,也可采用几个,每个自变量又可有若干个水平。
②随机化的区组设计
随机化的区组设计是一种从同一总体随机地选取受试者,分派到各组去的方法。随机化区组设计的分派方法有两种:
a.如果有k种处理条件,首先将随机选自同一总体的受试者按因素匹配成若干个小组,使每一小组内包含类似的k个受试者;而后再分别将每一小组内的人随机地分派到k种处理条件中的某一种。
b.轭合控制式的随机化区组设计:要求将随机选自同一总体的受试者匹配成对,而后随机地将每一对中的一个受试者或者分派到实验组,或者分派到“轭合对照组”。
三、神经生物学方法
(一)脑电图
1.自发性的脑电节律
(1)脑皮层电图与脑电图
在脑组织内部和大脑皮层表面记录到的自发性电位波动,称为脑皮层电图;在头皮表面记录到的电位变化,称为脑电图。
(2)脑电波的分类
在不同的状态下,脑电波的波形特征有明显的不同。按照脑电波频率的快慢,可将脑电波分为δ、θ、α、和β四种波型。
人在兴奋状态时,其脑电图主要表现为低振幅快波。当人在清醒和静息状态时,α节律便逐渐减少。随着睡眠的加深,α节律随之逐步消失,被高振幅的慢波所代替,在脑电图上以θ波或δ波为主。如果人处于昏迷状态时,脑电图将全部出现β节律(如图4-1所示)。
图4-1 不同状态下人的脑电图特征
2.诱发电位
(1)定义
诱发电位是指一个特定的刺激作用于动物或人的感觉系统或脑的某一部位,因而使脑的任何部位产生可测出的电位变化,又称事件相关电位(ERP)。
(2)波峰的潜伏期
研究者通常使用波峰的潜伏期来表达诱发电位。波峰的潜伏期是指从刺激开始到某个波峰的顶端所需的时间,常以毫秒为单位。
(3)关联负变化
关联负变化或伴随性负变化是诱发电位中的一种特殊类型(如图4-2所示)。
图4-2 关联负变化
(4)10~20系统
国际脑电图和临床神经生理学联合会规定,正式采用统一的“10~20系统”。按照这个系统,就能较容易地确定每个电极的确切位置(如图4-3所示)。
图4-3 10~20系统的电极位置示意图
(二)脑成像技术
1.计算机断层扫描术
计算机断层扫描是将X射线连续地对头部的断层进行扫描,并用电子计算机技术进行分析和处理。
由于正常的脑组织和病变的脑组织对X光的吸收量是不同的,有助于了解颅脑内有无占位性病变和脑的结构性变化,并提供有价值的诊断依据。
2.核磁共振成像
磁场中的高频脉冲穿过人体,人体各种组织内的原子核便反射性地发射能量,这些能量经吸收和处理后可形成逼真的组织构像,即核磁共振成像。
它能观察到脑内的血流分布,以及有关脑区血液流动的动态过程,并且能记录到大脑活动过程中代谢的迅速变化。
3.正电子发射断层扫描术
当大脑进行活动时,有关脑区血流增加、局部的代谢活动加快,利用有些能发射正电子的同位素将它们作为标记物参与脑内特定的代谢过程,即正电子发射断层扫描术。
四、定量研究与定性研究的应用
(一)定量研究
定量研究是从量的含义或度量的目的出发了解现象和寻求规律。将某些主客现象分级定量,用数字表示某种现象或感受的等级水平和严重程度,又称A型研究。
(二)定性研究
定性研究又称个案研究或B型研究,是对个案进行调查研究,描述和判断推理,综合分析来阐明事物的本质,是定量研究的基础。
1.研究方法
定性研究要根据研究的不同内容,选择的不同课题来考虑其研究设计。例如考虑研究的目的,意义,研究的内容,搜集资料的方法,样本的确立,样本特征,取样方法等。
2.个案资料分析
不同的研究者可站在不同的角度,使用不同的方法来分析,也可根据实地调查资料,结合个人既往经验,使用创造性的分析方法来论证事物的内涵。
3.个案访谈步骤
(1)研究者首先要自我介绍其姓名,工作单位,身份,来访目的等。
(2)访谈员要深入体察被访者的感受,态度,动机等。
(3)整理访谈记录,书写访谈报告。
五、医学心理学中的统计学方法的应用
(一)统计学的性质与目的
1.性质
统计学是对观察样本产生的量化资料进行分析的理论与方法。
2.目的
(1)简约性
有助于对观察结果进行科学地归纳和总结;
(2)归纳性
有助于揭示总体与样本间的关系;
(3)提高研究的科学性
用较为客观的方法决定接受或拒绝一个特定的研究假设,从而提高科学研究的科学性;
(4)提高推论的可靠性
使用不同的样本的研究结果,有助于揭示事物间的本质联系。
(二)测量
1.测量的本质
测量是指按照某种方法对被研究事物或事件指派数字的过程。
(1)测量过程的前提
①属性是可以定义的;
②属性可藉感官或仪器而被观察;
③属性具有质的或量的差异。
(2)测量过程的因素
①属性特征
②指派法则与程序
③量表构成
2.测量水平
(1)称名水平
用不同数字表示不同类别事物的测量水平。
(2)顺序水平
欲测事物属性在拥有程度上如果可以排序的话,就可以进行顺序水平测量。
(3)间隔水平
间隔水平测量除含有称名、顺序水平测量所有性质外,且含有相等的单位间隔,这些间隔表现被测量事物属性间的差异。
(4)比例水平
这是测量的最高水平,是指既有绝对零度,又有相等单位的测量量表,绝对零度具有经验水平意义。
(三)描述性统计与推论性统计
1.描述性统计
适用于对观察数据的组织、汇总和描述,目的是计算出具有代表性的统计值、简化数据、使数据集合所包含的信息能以清晰的条理表现出来。
(1)次数分布
描述一组数据中每个分数或数值出现的频次。具体步骤包括:
①求观测值全距;
②决定组距和组数;
③列出分组阶段;
④将观测值列入相应的组内;
⑤计算观测值频次。
(2)集中趋势
这是一组观测值的代表值,表明一组数据的典型情况和分布的特征。常用的集中趋势统计值有如下几种:
①众数:一组观测数据中出现频次最多的一项数据的数值,有可能不止一个。
②中位数:将一系列观测值按由大到小顺序排列、在序位上居于中间者的数值,即为中数。
③平均数:一组观测值的总和平均值即为平均数,较之众数和中位数,更能代表一组观测值的集中趋势的特征。
(3)离散趋势
反映了观测数据集合的差异情况、波动范围。离散趋势统计量有:
①全距:指观测数据集合的变化幅度,以一组观测值的最大值与最小值的差表示,亦称极差。
②标准差与方差:标准差是离均差平方和平均数的算术平方根,将标准差平方即得到方差。标准差与平均数分别反映了一组观测值的离散趋势和集中趋势。
③离散系数:是一种相对离散程度的统计量,以标准差与平均数之商的百分比表示:
④四分位差:在一组观测数据中,第3四分位数Q3数值与第一四分位数Q1数值之差的一半。
(4)相关关系
相关关系是指变量间存在相互伴随的关系,可能是较为稳定的函数关系,也可能是受多种因素影响的随机关系。
①相关分析
以一个样本为基础去研究具有同等重要性的随机变量之间的关系。常用的相关关系的系数有:
a.积矩相关系数:x与x是二元频数分布的随机变量、两变量都有间隔水平以上测量单位,其分布为正态。
b.ф相关:两个被分成二分变量的变量间相关关系。
c.列联相关:先对rxc列联表进行X2计算,求出X2值再代入公式求得相关系数。
式中:C:列联相关系数X2:X2值;N:总数。
d.斯皮尔曼等级相关:表示两顺序水平变量间的相关关系。计算公式为:
式中:D:二变量等级之差;N:二变量成对总数目。
当评价人为k时,评价N个被评价对象时,或同一评价人先后k次评价N个被评价对象,可采用肯德尔和谐系数W(Kendallsw),其计算公式为:
式中:k:评价人数目或评价难度;N:评价对象数;Ri:每一评价对象的评分等级总数。
w的变化幅度为0~1.0之间。若w=1则表明评价结果完全一致;若w=0则表明评价结果完全不一致。
②回归分析
a.定义
回归分析是在确定变量间存在相关关系后,根据研究目的,制定自变量与因变量并建立两变量之间函数关系的近似表达式,进行解释或预测的数理统计方法。
b.表示及计算
回归分析中用直线y=α+βx表示自变量X与因变量Y之间的一般数量关系,其中X是非随机的,用以进行预测的变量;Y是随机的,被预测的变量。这条直线称为Y对的“回归直线”,β称为“回归系数”,α为回归直线在直角坐标中的Y截距。
如果两个变量是一个二元正态分布随机变量的分量,就存在两条回归直线:第一条是由X推断Y;第二条是由Y推断X。这两条回归直线相交于X-Y直角坐标中的(X,Y)点,两条直线的夹角取决于两变量x、Y的相关系数r,夹角越小,r越大。|r|=1时,两条回归直线重合,即存在线性关系,r=0时,两条回归直线相互垂直且与坐标轴平行(随机独立),(如图4-4所示):
图4-4 不同相关系数的两条回归直线关系
c.多元线性回归
进行回归分析时,所涉及的变量可能不止两个,而是p+1个变量的集合,此时,就要进行多元线性回归的统计。
多元回归分析有两个重要的统计量:复相关系数和偏相关系数。
设P+1个变量Y,x1,x2:…xp均为随机变量,且服从多元正态分布。假定样本(y1,,X11,x21,Xp1),…,(yn,Xln。,Xn,…,Xpn)是用随机抽取n个个体方法得到,则复相关系数的估计量ry,x1...xp可以表示为:
式中:SSR:回归平方和;SSr:总平方和,此估计值取非负值。
复相关系数估计量有两项用途:①度量y对所有自变量的依赖关系;②复相关系数估计量的平方是y的方差中被Y对x1,…,xp的线性回归所解释部分的贡献量。
复相关系数是Y和变量集合{X1,…,Xp}之间线性相关的度量,而偏相关系数则是当c中变量的值保持不变时l与h之间线性相关的度量。复相关系数与偏相关系数间的关系也很密切,对于变量集合y,x1,x2…,
复相关系数的值域为偏相关系数的值域为-1至+1之间。
2.推断性统计
推断性统计是以对样本的调查、统计结果推断总体特征的方法,也就是对统计结果的一种概判。推断性统计有两个重要组成部分,一个是从样本的统计值估计总体的参数;另一个是通过样本研究对研究假设进行检验。
(1)参数估计
在统计分析中,直接从样本计算得出的结果称为统计值,而把总体各种相应的量数称为总体参数。推断性统计中估计的任务就是如何根据样本统计值对总体的数值特征作出估计。例如:
用“样本平均值”来作为均值Eζ的估计值。
用“样本方差”,来作为方差的估计值。
用“样本标准差”,来作为标准差的估计值。
(2)参数估计的常用方法
①点估计
又称为单值估计,是使用单一的估计值估计相应总体参数的方法。由于点估计没有考虑到抽样误差,所以很难从数量方面说明估计的准确程度和可靠程度。
②极大似然估计法
对未知参数最优估计的办法,但使用的条件是已知变量的分布函数的类型,由之可以使给定的样本出现概率极大的参数值的估计。
(3)参数估计需满足的条件
①参数估计值必须是无偏的;
②参数估计值必须是一致的或相合的;
③参数估计值必须是有效的;
④参数估计值必须是充分的。
(4)区间估计的程序
①根据研究需要,选定显著性水平;
②计算标准误;
③根据样本统计值和标准误计算出总体参数值域的可能范围。
(5)区间估计的方法
①总体平均数的估计
a.确定显著性水平;
b.根据样本容量分别确定Z值(大样本)或t值(小样本);
c.计算平均数的标准误:
式中:=样本标准差;n=样本数;
d.依公式确定置信区间:
大样本为:小样本为:。Z或t可从标准正态分布表中查得。
表4-1给出了置信区间、置信概率与显著性水平的关系。
②总体相关系数的区间估计
在广泛使用计算机统计程序之前,进行总体相关系数的区间估计是十分复杂的。主要程序为:
a.确定显著性水平,以Z表示;
b.根据相关系数r转换表求出Zr;
c.计算Zr标准误;
d.确定Zr置信区间:;
e.将Zr还原为P(总体参数)。
③总体回归系数和总体因变量的区间估计
a.计算回归系数标准误;
(回归系数byx的标准误)
(回归系数bxy的标准误)
b.确定显著性水平;
c.计算总体回归系数置信区间;
d.总体因变量Y的标准误公式为:
依此公式计算出Y的标准误再根据显著性水平即可计算出区间估计。
④总体比例和百分比的区间估计
总体比例和百分比的区间估计的计算公式与总体平均数的区间估计相仿,不同的是计算标准误的公式不同。
式中,p为样本统计值。
在进行百分比的区间估计时,只要将比例值换算为百分比即可。
3.统计假设检验
假设是有关两个或两个以上变量间关系的一种推测性陈述。
(1)假设检验的一般性程序
①提出研究问题,对研究问题进行描述和确定,收集观测数据;
②分析、归纳基本部分以形成假设或理论的基础;
③提出理论假设、预测结果;
④收集新数据检验研究假设或预测。
(2)假设检验处理的问题
①根据已有的对总体特征的认识,通过探索性实验提出假设,然后用抽样的方法检验这一假设;
②对从两个或更多样本得出的统计值之间的差异进行显著性考验,并由之推断样本所代表的总体的种种性质。
(3)统计假设检验的程序
①根据研究目的和对总体特性的初步了解,提出适当的研究假设H1;
②选择显著性水平;
③依照实测样本得出的统计量计算出所能达到的显著性水平;
④检验研究假设H的对立假设H0是否可以被接受。
(4)统计假设检验的要点
①虚无假设主要处理两类问题:一类是某随机样本来自特定的总体;另一类是两个随机样本来自同一个总体。
②确定显著性水平对接受或拒绝假设十分重要。
(5)统计假设检验的类型
①平均数差异的显著性检验
对两个来自不同总体的平均数之间是否存在真实性差异进行检验时要使用平均数差异的显著性考验。
a.先计算两平均数标准误
式中:分别为第一样本与第二样本平均数的标准误;S1、S2分别为两个样本的标准差;n1、n2分别为两个样本的样本容量。
b.计算两个平均数的差异显著性指标,即两样本平均数之差与其标准误的比率。在统计中,这个值为t值:
c.将t值与确定的显著性水平上t值相比较,作出统计假设检验,接受或推翻虚无假设。进行平均数差异的显著性检检时,要注意样本容量,当两个样本容量相等时,或是样本容量为大样本(N≥30),为小样本(N<30)时,对应的计算公式有所不同。
②方差分析
在有些问题中需要比较总体方差,设有两个正态总体,相应地抽取容量为n1和n2的样本,要求检验假设H:
a.分别求出两样本的样本方差。
b.计算两样本方差之比,进行计算时要把较大的方差S1放在分子上,较小的差S2放在分母上。
c.根据确定的显著性水平a,由查表可得使
d.若计算的F值满足否定H0,反之接受H0。
进行方差分析还可以从两个样本扩展到多个样本的情况,同时比较两个以上平均数间差异的显著性。方差分析的基本原理是把所有观测值离均差平方和至少分解为四部分,其自由度也分解为相应的部分,每部分表示一定的意义。
(四)多元统计分析方法
1.多元统计分析方法的发展
多元统计分析的对象是具有多个变量观测值的个体的集合。这个集合可能是某类事物的总体也可能是从总体中抽取的一个样本。观测变量可能是分类的,也可能是连续变量。
2.多元统计分析方法简介
(1)变量间的关系
①对事物属性的分析与综合;
②属性特征的空间分布;
③属性与时间变化间关系。
(2)研究目的
①简化结构:通过统计分析把多元数据集合进行数据约简;
②样方分类:根据多元研究变量的观测值将样方进行分类排序;
③变量分类与组合:根据样方集合在多元空间中的分布,对变量进行分类和重新组合;
④相依性分析:分析变量间的相依性;
⑤依赖性分析:分析一个变量或几个变量间是否存在依赖性关系;
⑥提出与检验假设。
不同研究人员对多元统计分析方法的分类有所不同(如表4-2、图4-5、图4-6所示)。
表4-2 多元变量分析法分类(林清山,l983)
图4-6 各种多元统计分析方法的关系(陈湛匀,1990)
(3)多元统计方法
①因素分析
根据观测变量的内在联系将多变量综合为少数因素,使几个变量之间的相关关系转化为这n个变量与m(n>m)个因素之间的相关关系。
②主成份分析
分析观测变量(或协方差矩阵)内部依赖结构的研究方法。
③聚类分析
按多种指标对样品进行分类或按样品对多种指标进行分类的方法。
④判别分析
根据两类(或几类)个体的某些属性或特征对个体进行分辨的统计方法。
⑤典范相关分析
分析两个变量集合。x1,x2…xp与y1,y2,…yq的各自线性组合间的相关关系与相关结构。
x变量的线性组合:
Y变量的线性组合:
典范相关分析的任务就是寻求合适的线性组合的系数c和d,使线性组合分数X与Y的
相关系数为最大。这一系数即为典范相关系数。
⑥数量化理论
分为数量化理论I、Ⅱ、Ⅲ、Ⅳ四种,这类理论可以处理定性数据和定量数据间关系的问题,即将定性数据转换为定量化数据,以便进行多元统计分析。
数量化理论中的自变量X1,X2,…Xm,观测结果可能是定性的,也可能是定量的。数理化理论I即是类似于一般的回归分析。不同的是回归方程。
其中:
按上述将定性变量转换为定量变量规则:
用最小2乘原则可以求出回归系数bjk,即可求出预测方程:
数量化理论Ⅱ与数量化理论I的思路一致,差别在于数量化理论I的因变量是定量的变量,数量化理论Ⅱ的因变量是定性的变量。这两种方法的差异表现在对上述预测方程中的系数b的确定方式。在数量化理论I中,bjk是按回归分析方法确定系数,而数理化理论Ⅱ则是按判别分析方法确定系数;即使组间方差与总方差之比为最大:
对应于每个有数值、每套与提供一个判别函数,若有G个类目的话,就会产生g-1个判别函数。根据判别函数Yn或n个判别函数的组合就可把不同的样品分别划归不同的类别之中,而使其判别失败率最小。
数量化数理论In与聚类分析相似。样品N在观测变量Xi(i=1,2,…,m)中的反应为
有或无两种情况。数量化理论Ⅲ即是对这一观测变量的集合进行Q型或R型分类,进行分类时要使用样品得分与变量得分相关性最大的原则求出各变量、各样品的得分,再进一步按得分加以分类。这种方法可以同时对样品与观测变量进行分类,与多元统计中的对应分析(相一致。