基于机器学习的数据缺失值填补:理论与方法
上QQ阅读APP看书,第一时间看更新

3.4 针对缺失数据不确定性的填补方法

缺失值是数据集中的未知因素,在一定程度上导致分析结果不确定。针对缺失数据的不确定性问题,多重填补法和基于证据理论的填补方法将不完整数据分析过程分为填补、分析与合并3个阶段,通过执行多次填补得到若干组填补值,在此基础上求解多个分析结果并对这些结果实行有效合并。相比于单一填补法,此类方法合理考虑缺失值不确定性对分析结果造成的影响,从而获得更为合理的推断。