人工智能基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 应用统计

2011年诺贝尔经济学奖获得者Thomas J.Sargent在世界科技论坛上表示人工智能都是利用统计学来解决问题。随机性在自然现象和社会现象中普遍存在,应用统计学作为一门收集、整理、描述、显示和分析数据的科学,在测量、通信、质量控制、气象、水文、地震预测等多个领域都有重要的应用。

2.2.1 参数估计

掌握某个随机现象的统计规律,就是要掌握描述该随机现象的随机变量的分布。在实际应用中,我们无法通过大量抽样的方法得到观测数据,所以需要对分布的某些数字特征进行估计。我们可以把几个参数分为两类:当总体分布的形式已知时,分布的未知因素体现在总体分布的某个参数上,这类参数有一个显著的特点,总体分布可以随着参数的确定而确定,而且总体参数虽然未知,但是它可能的取值范围是已知的。当总体分布的形式未知时,即使对未知参数作出了估计,仍无法确定总体的分布。

参数估计的方法有点估计法和区间估计法两种。

2.2.2 假设检验

假设检验是统计推断中另一类重要的问题。在假设检验中,先假设总体分布的形式或总体的参数具有某种特性,然后利用样本提供的信息来判断原先的假设是否合理。若合理,则承认假设的正确性,否则便否认原先的假设,从而对所需研究的问题作出分析和判断。

假设检验通常可以分为以下5个步骤。

(1)提出假设,写明原假设H0和备择假设H1H0的对立面)的具体内容,H0H1是互补的假设。

(2)选择检验统计量,根据H0的内容,选取适当的统计量,要求此统计量的分布是可确定的。

(3)给定检验水平a,对于实际的问题应根据不同的需要和侧重,选取不同的水平,为了查表方便,一般选取a=0.01,0.05,0.10,…,n

(4)确定拒绝域(或接受域),由假设的内容选取的统计量和给定的ɑ,用分步的分位数表来确定拒绝H0的临界值,并表示成一般的拒绝形式——拒绝域。

(5)作出判断,由样本值算出统计量的值,若所算出的统计值落入拒绝域中,则在检验水平a下拒绝H0,而认为H1是真的;否则,接受H0

2.2.3 回归分析与方差分析

回归分析和方差分析是数理统计中常用的方法,用于研究变量与变量之间的相关关系。在实践中,我们可以发现,变量之间的关系可以分为两种,一种是各变量之间存在完全确定的关系;另一种变量之间的关系是非确定性的,这种关系无法用一个精确的数学式来表示,可以称为相关关系或统计依赖关系。另外,在相关关系的变量中,仍分为几种不同的情况。第一种情况是,这些变量全部为随机变量,可以将变量中的任一个作为“因变量”,其余则作为“自变量”。第二种情况是,某些变量是可以观测和控制的非随机变量,另一个变量与之有关,但它是随机变量,可以把随机变量作为因变量,可控变量作为自变量,此时变量的地位不可交换。回归分析方法是处理第二种情况的重要工具,回归的内容包括:确定预报变量与响应变量之间的回归模型,根据样本观测数据检验回归模型;利用所得回归模型根据一个或几个变量的值预测或控制另一个变量的取值,并给出这种预测或控制的精度。

方差分析与回归分析的要求与方法都不同。方差分析是根据实验结果进行分析,鉴别各有关因子对实验结果的影响程度。在方差分析中,因子可以不是数量化指标,而是不同的条件,它可以用来检验“多个正态总体均值是否有显著性差异”。