偏最小二乘法优化及其在中医药领域的应用研究
上QQ阅读APP看书,第一时间看更新

3.1 数据清理

中医药中的数据和现实生活中其他的数据一样,往往是不完整的、脏的和不一致的。设备产生故障导致部分数据被删除,或人为不小心地输入错误数据,或输入字段格式不一致等问题都有可能会导致上述数据问题。因此,我们就需要通过清理数据来提高数据质量。

本节讨论的数据清理,旨在通过填写缺失值数据、光滑噪声数据、识别离群点以及处理不一致数据等方法来达到数据清理的目的。数据清理是数据预处理的主要步骤之一,是其中至关重要的一步。3.1.1节和3.1.2节分别对缺失值处理方法和数据光滑技术进行介绍。