上QQ阅读APP看书,第一时间看更新
1.5 算法和数据的辩证关系
算法和数据是机器学习解决实际问题不可或缺的两大因素,缺一不可。早期的机器学习十分依赖特征的提取,提取出关键的特征,往往可以事半功倍。深度学习的快速发展,人们发现通过增加训练数据量,让机器从大量基础特征中可以自动关联出潜在关系,自动学习出更高级的特征,所以有种说法被很多人接受,就是当数据量足够大时,不同的算法对效果的影响不大。但是在实际工作中,很难保证各种场景下都有足够的数据进行训练,这个时候不同算法的检测效果可能会差别很大,在本书后面的例子中,大家可以发现相同的问题和训练集下,使用不同算法结果就会有明显差异。