第一节 医学统计学的基本概念
远古时代,人类为获取食物、分配食物,采用各种原始工具进行计数活动,便是统计实践的萌芽。18世纪后叶至20世纪初期为近代统计学的发展时期,人们开始重视运用统计指标和统计图表对数字资料进行统计描述。20世纪初期至今为现代统计学的发展时期,特别是20世纪中叶以来,随着电子计算机技术的发展和应用,促进了统计学的应用与发展。
一、统计工作与统计学
统计工作是指对数据的搜集、整理和分析的活动,具有信息职能、咨询职能和监督职能。如药品生产经营企业统计药品产量与销售量,医院统计病床使用情况、医疗费用、诊断水平、治疗效果等。统计学是一门搜集数据、分析数据,并根据数据进行推断的科学和艺术,是研究随机现象数量规律性的应用数学。统计学的基本工作步骤包括统计设计、搜集资料、整理资料、分析资料和结果表达等。
法国统计学家J.Gavarret于1840年出版了《医学统计学》,是世界上第一部医学统计教科书。我国医学统计学的主要奠基人之一郭祖超于1948年出版了《医学与生物统计方法》一书,在中国首次系统地介绍了医学统计学,将统计分析与医学研究融为一体,对于医学统计学在中国医学界的推广、应用和提高,起到了不可忽视的启蒙作用。20世纪50年代,我国的官方采用当时苏联的《卫生统计学》名称,因此《医学统计学》和《卫生统计学》在我国并存,随着科学和社会的发展,其内涵和外延都得到了极大的拓展。
医学统计学的研究内容主要包括统计设计和统计分析两个方面。统计设计是根据统计研究的目的和研究对象的特点,明确统计指标和指标体系,以及对应的分组方法和分析方法的统计活动。统计分析主要包括统计描述、统计推断和统计联系,通过对统计数据由浅入深、由点到面的深入分析,以描述数据分布,推断数据变异,挖掘数据联系,帮助我们去粗取精、去伪存真,透过现象去发掘问题的本质。如2019年底至2020年初,一场突如其来的新型冠状病毒肺炎(corona virus disease 2019,COVID-19)大流行迅速席卷全球,专家们充分利用统计技术分析新冠肺炎流行趋势,指导制定防控措施,客观评价中西医防治措施的效果,筛选出目前最佳的中西医结合治疗方案,对于疫情的有效控制起了关键作用,大量临床观测数据的统计分析也为中医药走向世界提供了有力的科学证据。
二、总体与样本
总体(population)是根据研究目的所确定的同质观察单位某种变量值的集合。观察单位是指被研究的总体中的基本单位,即个体。如观察某社区60岁以上男性血压水平,则该社区所有60岁以上的男性居民的血压测量值就构成所描述的总体,该地每个60岁以上的男性居民就是一个观察单位。总体具有同质性、群体性和差异性三个主要特点。
样本(sample)是从总体中随机抽取的具有代表性的个体的集合。一个样本所包含的观察单位数目称为样本(含)量或样本数。抽样研究(sampling study)是从总体中抽取样本,通过对样本的定量或定性测量结果来推断总体的特征。抽样研究的目的是用样本的特征来正确地推断总体的特征,所以样本必须对总体具有良好的代表性,抽样研究时应注意样本的构成分布与总体构成分布基本上保持一致,样本量要足够大,并遵循随机抽样的原则抽取样本。
三、参数与统计量
参数(parameter)是反映总体的统计指标,一般用希腊字母表达,如μ(总体均数)、σ(总体标准差)、π(总体率)等;统计量(statistics)是反映样本的统计指标,通常用英文字母来表达,如(样本均数)、S(样本标准差)、p(样本率)等。在书写时一般都要用斜体形式。在抽样研究中,样本统计量与总体参数之间总是不可避免地存在着抽样误差。因此,必须作用于统计学技术来估计抽样误差的大小,以得到相对可信的结论。
四、频率与概率
若在相同条件的控制下对某随机事件进行n次重复试验,某种结果出现的次数称为频数,频数与总试验次数之比称为频率(frequency),均属于样本统计量。
概率(probability)是反映随机事件发生的可能性大小的度量,用P表示,取值范围为0~1之间。概率属于总体参数,在统计学中,人们通常将P≤0.05或P≤0.01的随机事件称为小概率事件。