数据学习效应的力量
数据学习效应可以使赢家通吃
当规模经济很高,且客户对品种多样化的需求也很高时,市场倾向于单一技术。当成本在边际基础上随着产量的增加而降低时,就会产生规模经济。多样化是客户对许多不同功能或产品的需求。参看表1-2规模经济示意表右下框,顾客在网上购物时需要品种多样化,而仓库越大,运营成本就越低,因此亚马逊公司在电子商务中就占据了主导地位。参看表1-2左下框,我们希望自己的消息来源多样化,但在传统媒体时代,记者每天只能写那么多文章——他们难以扩大规模——所以只有几家大型报社。
表1-2 规模经济示意表
在一个市场中,如果只有一家公司积累了最多的资源(如投资、生态系统等),那么,这家公司就是唯一一个可以为该市场的客户投资生产多种产品的公司。规模最大的公司可以提供最多种类的产品,而在这个转折点之后,它将主导整个市场。
数据学习效应有着很高的数据规模经济,因为它们需要大量的数据才能够开始。数据学习效应可以做出各种各样的预测,因为模型根据反馈数据不断地产生出不同的预测。此外,人工智能优先产品的客户天生就对多样性有着很高的需求,因为每个客户都需要一个可以针对自己的业务进行预测的模型。因此,数据学习效应更倾向于只有一个赢家的市场。
数据学习效应使产品更有用
数据学习效应往往是在幕后而非前台和中心发挥作用。一些产品在前景中展示其效用,另一些产品则在后台展示其效用。在前景中展示意味着,对于终端用户来说,效用的增加是显而易见的,他们看到添加一些数据可以为他们生成更准确的预测,或者立即引发新的见解。例如,添加自己的销售数据,可以让他们立即看到与竞争对手的销售进行对比之后的自己的销售状况。在后台显示效用意味着,效用增加对用户来说并不明显。用户看不到添加一些数据会为他们产生更好的预测,也看不到任何他们还未拥有的信息。
通过使用数据学习效应,Square Capital成为前景表现比较好的一家公司,该公司向其销售点终端系统(POS机)客户发放贷款。商家,比如餐馆老板,只需往他们的POS系统中添加数据,几乎立刻就可以获得与其收入情况相符的贷款。Square Capital能够通过将商户上传的数据与之前从Square Capital获得贷款的其他商户进行比较,向他们提供贷款。用户(商户)看到了添加数据的直接好处(提供贷款),因为该产品利用数据学习效应运行了一个贷款预测系统,该系统提供了这样一个产品:一个基于商户偿贷能力而预测的借贷利率。不添加数据,你就无法获得贷款;而你之所以有资格获得贷款,是因为你的数据可以与其他数据进行比较,从而生成预测。这个产品基于数据学习效应,在前景中表现得比较好。
使用数据学习效应,在后台表现较好的一款产品是Cloudflare,一款专注网站性能优化和安全管理的产品。客户——比如新闻网站等——可以将Cloudflare数据收集机制添加到自己的网络中,该机制为网站浏览者提供页面请求,同时屏蔽不良浏览者的请求。Cloudflare通过区分哪些请求对其他客户不利,来提供上述保护。使用“不利”一词,意思是有一种请求,试图用流量淹没网站,或者利用其他安全漏洞使其关闭(一种拒绝服务,或称为DoS攻击)。在添加Cloudflare数据收集机制后,客户(网站所有者)没有立即看到拒绝一个特别危险请求的警报,但该产品一直在不断地学习,并针对潜在的错误请求发出警报。如果不允许Cloudflare查看你的网络请求,你就不会收到这些警报。该产品基于数据学习效应,并在后台变得更好。
数据学习效应比网络效应的复合效应更快
当数据学习效应从客户那里获得数据时,它会产生更快的复合效应。网络效应的燃料是数据,客户为该系统提供燃料,最终使他们自己获益。
具有入门级数据网络效应的产品,通常会获得数据客户,有时被称为赠予-回报模式。每一个客户都提供数据,使产品变得更加有用,从而吸引更多的客户。高质量的数据会使产品变得更好,客户们也可以贡献一些这样的数据。
具有下一级数据网络效应的产品,可以从客户那里获取数据,不过这些数据通常是在客户使用产品时提供的,有时被称为反馈数据,但——至关重要的是——这些数据会进入一个模型,该模型会将其转换为预测,从而使其价值成倍增加。
例如,客户每次获得信用评分时都会提交数据,信用评分机构使用这些数据来提供更准确的分数(然后卖给第三方)。这是入门级的数据网络效应。下一级数据网络效应可能是一个贷款应用程序,客户通过允许对其支出状况的持续访问来获得贷款。接下来,提供贷款的公司可以预测贷款是否或者何时能够得到偿还,来确定客户的信誉,并据此发放大额贷款或者切断贷款。这两种数据网络效应之间的差异,在于反馈数据和预测模型。
一个飞轮带动另一个飞轮
自动化收集数据和生成信息的过程是下一级的开始,此时共享大脑开始对其所学的东西与其所学的其他东西进行比较。这就是将一种网络效应推向另一种更强大的网络效应的“飞轮”。
亚马逊公司就是这样做的。首先,它收集了大量产品数据,然后将这些数据放入产品列表,同时提供带有结构化产品信息的对照表,来帮助客户做出更好的购买决定。更多的信息意味着可以更好地比较和决策。随后,亚马逊公司投资了一个团队,来建立机器学习的搜索和推荐系统:A9。这个团队有效地获得了产品数据,并将其与购买数据进行匹配,以了解客户想要购买哪些产品,这样亚马逊就可以在列表页面和搜索结果中,向这些客户推荐类似的产品。收集大量数据是入门级网络效应的开始:对消费者来说,亚马逊过去是最有用的购物网站之一,因为它拥有的产品信息最多。对这些数据进行学习开启了下一级网络:对消费者来说,亚马逊现在仍然是最有用的购物网站之一,因为它提供了最好的推荐和最好的搜索体验。一个飞轮带动另一个飞轮的效果模型如图1-7所示。
图1-7 一个飞轮带动另一个飞轮的效果模型
数据学习效应造就成本优势
数据学习效应可以让企业自动降低产品生产成本,成本优势是通过减少收费,或者保持收费不变,从而提供更多价值来实现的。
使用数据学习效应制造产品的初始成本,分摊给了每个新增加的客户。构建智能系统成本高昂:需要投资购买、收集、清理和存储数据。聘用数据科学家和机器学习工程师也需要很多钱。通常情况下,一家公司必须花费大量资金,才能让客户看到预测的价值。不过,一旦客户开始使用这些产品并提供数据,成本就会降低。他们可能会标注或者存储自己的数据,通过界面重新配置模型的功能,通过反馈系统有效地承担收集和处理数据的成本,降低生产和维护成本,从而形成成本优势。
数据学习效应使产品更有价值。更多的数据使客户能够做出更准确的预测和更好的决策。基础模型性能的提高为客户创造了价值,这意味着他们的投资获得了更高的回报。分母(价格)在价值上升时保持不变。
顺便说一句,成本优势可能有助于快速建立数据学习效应。成本优势是一种吸引更多客户的策略,而这些客户反过来会产生更多的数据。为了积累提高人工智能准确度所需的临界量数据,使其对客户有用,该策略可能会在不考虑效益的情况下,在某个时间段内被用到极致。数据学习效应造就成本优势如图1-8所示。
图1-8 数据学习效应造就成本优势
数据学习效应与价格优化
数据学习效应可以实现更准确地定价。价格合理的产品销量更大,更多的客户就能够收集更多的数据,从而为数据学习效应提供动力。成本优势不同于价格优化,更好的定价可以助推数据学习效应。
定价是一种信息游戏,通过准确地计算出某人将为某事支付多少钱来赢得胜利。预测系统用于定价实验,以生成测试价格。开展定价实验的一种方法是根据经验观察、猜测或其他因素来选择价格;另一种方法是使用之前实验的数据,来预测什么样的价格可能被接受。第二种方法更有可能找到最合适的价格。
电子商务网站通常会进行个性化定价。一个购物者看到的产品价格通常与另一个购物者在同一个网站上看到的价格不同,或者同一个产品,购物者在手机上看到的价格可能与在笔记本电脑上看到的不一样。这是因为人工智能在不断地运行实验,根据客户的身份(是否登录到包含以前购物和客户统计信息的配置资料)、居住地、刚刚点击的内容等,来确定他们可能会为某件商品支付多少费用。复杂的购物网站在每个人身上使用数百个数据点,从客户偏好的数据集,以及不同人群的数十亿数据点,到产品定价。这些网站经常举办一些可能会赔钱的促销活动——以低于成本的价格销售产品——但这最终会产生一些关于客户购买意愿的有用数据。
手动个性化过程应该包括观察,利用观察来确定实验使用的下一个价格,然后开展下一个实验,并进行更多观察,以此类推。自动个性化过程可能需要使用机器学习,方法是将数据输入一个系统,该系统会根据它认为的达到最优价格的曲线梯度生成一个要测试的价格。
航空公司开发了一些最早的价格优化系统,通常被称为收益管理系统,该系统根据各种变量对每个座位进行定价,例如:飞机上的座位数量、飞机在既定航线上的飞行成本、座位位置、一年中特定时间的预期需求等。这些系统依赖于线性优化数学概念,这是一些机器学习系统的基础。如今,这些系统为座位定价,而且频繁改变价格,同时将这些价格分发到无数可以购买机票的地方。
此外,还有一些销售给企业的软件产品的预测定价示例。其面临的挑战是,关于商业客户将为一个产品支付多少费用的数据通常较少,不仅因为他们很少做出较大的购买决定,还因为他们在做这些决定时的行为,不像消费者浏览购物网站那样容易被观察到。
如果将利润重新投资到数据学习效应,就会产生更好的定价,而更好的定价就会带来更多利润,同时提高数据学习效应。
●更好的定价产生利润,从而为机器学习的研发提供资金。
●更好的定价可以吸引客户,进而获得更多数据(无成本),创造更多利润,从而加大对研发的投入。
●更好的定价意味着更少的销售和营销支出,创造更多的利润,从而加大对研发的投入。