Python预测分析与机器学习
上QQ阅读APP看书,第一时间看更新

1.3 预测分析在各行业中的应用

简单了解预测分析后,我们来看一看近年来它在各领域的应用。

内容推送是一种十分常见的预测分析应用,里面包括广告推送、视频推送、文章推送等。算法可以通过用户的个人设定、浏览记录、与平台交互记录(如点赞留言)等,结合内容本身价值与受众群体,为每个用户提供特制的内容清单。个性化的内容推送提高了用户花在每个内容上的时间和停留在平台上的总时长。例如当我们点入一段视频分享平台,如果主页上的内容标题和缩图引起了我们的兴趣,我们会有更大的可能性点入视频本体,同时观看一下一个同类视频。相反,如果两三次下滑屏幕后仍未找到足够感兴趣的视频,我们可能会选择退出平台。平台能否吸引更多时长的注意力,往往取决于平台的推送算法能否从海量内容中预测出个体用户的兴趣偏好。用户注意力是平台获取收益量的重要因素。好的视频或文章推送算法在为用户提供大量有效信息的同时,也更容易从用户群体中得到反馈,转化为企业价值。

广告推送属于内容推送的一种,其运营原理与视频和文章推送相似:通过用户的浏览记录分析其需求,再结合现有的广告方,预测可能收获最大点击率的广告植入。合适的广告不仅可直观地为平台提供商业价值,同时也可为平台用户创造更舒适的浏览环境。假如我们在观看与编程教学相关的教程时,平台推送了一个非常适合现阶段学习的教程广告。我们会感到这一广告植入的侵入性低,甚至会认为这一广告属于有价值的内容。相反,如果平台推送的广告与我们目前的专注点大相径庭,广告则更像打断了浏览体验的“入侵者”,降低了我们对平台本身的观感。这也是为什么谷歌广告价格中有一个质量因素(quality score):制作更优的广告可以提高用户对平台的观感,因此广告本身对平台的价值也相应提高,广告商也可以获得更低的推送价格。

风险管理是预测分析中的另一大类应用。许多财务机构可以通过这类应用降低损失。例如银行批准转账前,可以根据此用户以往花销模式,预测这笔转账是否存在欺诈的可能性,以此判断该笔转账是否需要进一步认证身份。银行也可以根据一个用户的财务状况、月支出分配和家庭情况等来预测用户按时归还借款的概率,由此决定是否批准贷款或是增加信用额度。学习历史数据的机器风险预测可以有效帮助审核人员,降低银行与银行用户的损失。同样,一些汽车保险公司也会根据客户的行车记录和个人信息,预测客户交通事故概率,由此制订不同的保险额。

日常生活中的天气预测也属于一种预测分析。根据实时仪器探测数据及过往数据趋势,我们得以每天查询近几日的天气预报,降低我们的计划被天气因素打破的概率。天气预测的结果在别的领域也可以被用作机器学习的数据。例如在零售业中,预测某种天气下某类产品的售量,结合近期的天气预报准备适当的库存运输。

零售业的供应链本身也可以通过预测分析得到大量优化。这类优化大多与合理的库存运输有关。供应链中库存把握的精准度很大程度上决定了收益量及损失量,因此许多数据分析项目会定义不同的问题,但问题本质都是预测未来某产品的需求量。对需求量准确的预测不仅可以提高零售企业的收益,还可以减少因供应过剩导致的食品浪费。在这里回顾一下1.2节中讲到的预测性分析和处方性分析关系:假如把问题定义成“下一个月方便面的需求量会是多少?”这便是预测性分析,机器提供给我们的结果将是一个对下个月需求量的预测数字,而决策者可以根据这个数字分配供应量;但假如把问题定义成“下一个月增加方便面的供应量会增加多少收入?(收入可为负数,代表供应量提升会导致损失)”对于机器来讲,输出的数据仍然是一个数字,不过这一次是对收入增长的预测。由此可见,只要掌握了预测性分析的基本工具,通过对问题的重新定义,数据分析师便可以成功地将预测性分析系统改装成处方性分析系统。

预测分析还可以用来辅助医疗系统,通过收集病人的个人信息(年龄、性别等)、病史和疾病复发规律,预测疾病复发的概率和复发的时间,或其他慢性病发展的可能性,以此规划及时复查和适当的药物控制。

这些例子只是现有应用中的一部分,但从此已经可以看出预测分析应用之广泛和颠覆性的潜力。各行各业的数据中还有更多可以被挖掘的价值,更多可以辅助解决的问题,只是等待一个创新应用的构想。希望本书可以帮助读者学习预测分析所需要的技术基础,提供一些有用的解决问题的思路,方便读者在工作、个人项目,或创业项目中实验自己的创新构想。