机器学习:从公理到算法
上QQ阅读APP看书,第一时间看更新

第3章 密度估计

桃李不言,下自成蹊。

——《史记·李将军传》

已知一个服从密度函数px)的随机变量xN个观测x1x2,…,xN,但不知px),这里px)称为期望学到的密度函数,试求px)。这个问题称为密度估计问题。假设学到的密度函数为,令X=Y={x1x2,…,xN},。因此,密度估计问题可以看作具有归类输入和归类输出的归类问题,即密度估计问题是单类归类问题。显然,px)是输入类表示,是输出类表示。

由于密度估计是单类问题,易证。对于密度估计问题,一般不成立。因此,类表示唯一公理对于密度估计问题不成立。但是为了简单起见,一般假设类表示唯一公理成立,即。因为px)未知,首先需要做的是得到。只要得到了,也就得到了px)。如果知道px)的部分信息,比如px)属于某个概率分布族,计算就成为了参数估计问题。如果除X外任何有关px)的信息都不知道,此时计算就是非参数估计问题。