第一节 医学统计学的定义、内容和特点
一、医学统计学的定义
1.统计学(statistics) 是研究数据的收集、整理和分析的一门科学。早期的这个定义相对偏重于方法学层面。现代定义为统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。统计学通过事物或现象的数量分析揭示其特征、相互关联及其规律性,越来越重视统计设计并提出设计优先原则。
2.医学统计学(medical statistics) 是根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科。医学统计学是统计学的重要分支,同样强调统计设计和优先原则。学习医学统计方法不仅要系统把握其基本理论、知识和方法,更要逐步建立统计思维和培养运用能力。
二、医学统计方法研究的内容
1.研究对象 医学统计方法的研究对象是医学随机事件(random event),即有变异的医学事物或现象。这些事物或现象实际是人的疾病或健康状况及其与影响因素的关系,可通过相应指标数据的统计分析揭示其特征和规律性,并应用于医疗卫生实践,达到防治疾病、促进康复、促进健康的目的。
2.研究内容 随着医学统计方法研究内容的日益广泛性和复杂性,学者们几乎一致的共识是医学统计研究的内容应包含设计部分,且设计与计划优先,否则,研究工作会事倍功半或偏离预期结果,甚至出现错误结论。
(1)研究设计(research design) 是按照研究目的和要求所制定总目标和总任务的计划,包括专业设计和统计设计。专业设计(specialized design)是从专业的角度回答做什么、为什么要做、怎么做、有何意义、有何条件及预期结果等问题所制定的计划,目的在于保证成果的实用性、可行性和创新性。统计设计(statistical design)是遵循统计学理论和原则要求围绕确定研究对象、样本含量、观察指标、资料收集整理分析方法、结果解释等问题所制定的计划,目的在于保证研究工作的质量和效率、科学性和可靠性。
(2)统计描述(statistical description) 用统计图表、统计指标、数学模型等方法揭示或表达样本资料信息特征,以便进一步比较差异、分析关联性及探讨规律,是整个统计学的基础。
(3)统计推断(statistical inference) 用样本统计量推论总体参数特征的过程,包括参数估计(estimation of parameter)和假设检验(hypothesis testing)两方面的内容。
三、医学统计方法的特点
医学统计方法的特点主要包括变异性、数量性、随机性和概率性,熟悉其特点对本门学科理论、知识和方法体系的整体把握及建立统计学思维具有重要意义。
1.变异性(variability) 统计研究对象的变异性是同质个体指标数量方面的差别性或不一致性。其根源是由于人及生物个体差异性,每个人都是世界上独一无二的,不可能与他人等同。统计研究方法的数量性是由变异性决定的,是通过量变探讨质变的思维过程,即通过指标的量化和大量数据的观察与分析认知事物或现象的本质规律。否则,就会被变异性的表象所迷惑。
2.随机性(randomness) 具有变异性的事物或现象在自然状态下所呈现结果的不确定性,即随机性,则该事物或现象称为随机事件(random event)。如50次掷硬币试验中出现正面次数或反面次数具有不确定性,属于随机事件。随机性结果和事物间不确定的关系,使人们在探寻客观规律和因果关系时如雾中看花,正是概率论的引入和应用帮助研究者辨明真伪及其可能性的大小。
另一方面,概率分布和抽样分布是统计学的重要基础理论。抽样研究理论使得近似总体数据观察与分析的条件要求,在较小适宜样本含量时也能进行,由此大大地提高了研究工作的效率。抽样的随机性是统计学的原则要求,即研究总体中的每个个体有同等机会被抽取到研究样本中,其意义在于消除任意性或主观性干扰。遵循了随机原则和足够数量要求所获得的样本,称为代表性样本;由代表性样本研究所获得的统计学结论才具有可信性和可靠性。
3.概率性(probability) 由于研究对象的变异性、结果表现的随机性以及事物或现象间关联的不确定性,只有通过概率论的统计学方法进行研究,才能得到客观结论和正确表达。其概率性特点主要包括理论和应用两方面:理论上讲,概率论是统计工作的认识论和方法论基础;在实际研究工作中,具体研究对象的抽样误差、差异比较的检验假设、统计学意义的判断等方面的概率应用。