1.1.3 推荐系统的天时地利
推荐系统之所以能在互联网的各领域中都得到广泛的应用,与机器学习算法近年来的高速发展息息相关,但并非所有应用机器学习算法的领域都像推荐系统一样幸运,享受到如此大的算法发展的红利。这一结果绝非偶然,接下来我们细数一下推荐系统具备哪些天时地利。
1.机器学习技术发展红利
没有绝对完美和最优的推荐系统,每个推荐系统从诞生之初就需要不断地迭代升级和优化来提升其准确性和价值。推荐算法从早期的基于后验的统计到后来升级为协同过滤,然后从传统机器学习LR、GBDT、FM等一路升级到深度学习。推荐系统一路收割了机器学习技术发展的红利,只要新的算法和技术相比原先旧的方法有更高的价值和收益,就可以持续迭代升级。
尤其是深度学习在近些年有着井喷式的发展和突破。多个优秀的深度学习框架的开源使得模型的设计和实现犹如搭积木般容易上手,常用的深度学习框架有TensorFlow、PyTorch、Keras、Caffe等。充足的样本数据和算力使得深度学习在推荐系统领域发挥了巨大的威力,直接推动整个领域技术跃上了新台阶。
2.丰富的数据样本
80%的数据+20%的算法=更好的人工智能。数据和算法作为智能系统最重要的元素,共同决定着一个智能系统的可行性。相比于人工智能的很多场景,推荐系统获取样本的途径、规模及可信度都有天然的优势。如语音识别或者图像识别的一些场景,样本的获取是阻碍机器学习算法落地的最大难题,需要耗费大量的人力去构造或者标注样本数据。
在推荐场景中,用户对信息的每一个操作行为都可以产生一条样本。而用户具体的操作又可以视为含义相对明确的样本标签,以点击率预估模型为例,用户对推荐信息的每个点击行为都是点击率预估模型的正样本。
3.模型优化目标和业务目标强相关
在推荐场景中,很多时候用户行为的转化率既是模型的建模目标也是平台的业务目标。以电商平台为例,要提升用户的下单率,就可以直接建模用户的下单行为,模型的优化目标直接就是平台的业务目标。而从业务角度出发,模型收益以极大比例转化成了业务收益,通过优化模型基本就能达到业务目标。也正因为如此,在整个业务中算法占了绝对的主导地位,这使得推荐系统能够乘着算法发展的东风持续提升。