数据网络效应
数据学习网络效应将数据规模经济与数据处理能力和数据网络效应相结合。我们在第3章“获取数据”中提供了扩展数据资产的策略;从第2章“精益人工智能”开始,整本书都在提供处理这些数据的方法。现在,我们对数据网络效应进行深入的研究。
数据网络效应有两种形式:入门级和下一级。每一级都需要在数据、人才和合作伙伴关系方面进行不同的投资。入门级数据网络效应是指,在信息价值方面,数据的添加为现有数据提供边际效益。下一级数据网络效应是指,在信息价值方面,数据的添加为现有数据在信息价值方面,提供复合边际效益,而其依靠的则是从现有数据中创建新数据的模型,例如机器学习模型。第一种是直接的,第二种是间接的。入门级数据网络效应更容易构建:只要让用户、客户和合作伙伴提供信息,向网络中添加信息即可。添加信息是数据网络具备的可以增强竞争优势的第一个因素。而下一级数据网络效应则需要构建能够自动扩大网络规模的其他系统,比如一个能够生成信息的系统。升级会带来更快的增长,因为升级是数据网络具备的可以增强竞争优势的第二个因素。表1-1显示了数据网络效应在数据、技术、人才、客户和合作伙伴方面的相对投资。
表1-1 数据网络效应在数据、技术、人才、客户和合作伙伴方面的相对投资
例如,建立入门级数据网络效应,需要收集大量有关客户产品偏好的信息。可靠的业务发展代表可以通过达成交易的方式获取产品、购买信息。而建立下一级数据网络效应,可能不需要手动收集信息,但可能需要建立一个机器学习模型,通过观察顾客的购买情况,然后推断出他们的喜好信息,进而了解他们的偏好。
传统的网络效应是入门级的网络效应。该网络的价值是随时间(t)增加的节点数(n)的平方乘以常数(C)。这表明,网络中额外节点的边际值保持不变,但在现实世界中通常并非如此,因为超过一定规模的网络往往效应会递减。
数据网络效应有时是这样,但有时也会随着自动生成的信息被添加到网络中而升级。升级会将上述等式中的指数更改为大于2的数字,使得网络价值增长更快。
入门级数据网络效应
当向网络中添加信息使网络上的产品更有用时,数据网络效应就出现。这与人工智能无关。这些信息对网络来说是外源性的:即来自外部的新信息。想象一个简单的数据表,然后向该表中添加另一行数据;该表现在变得更有用了,因为它有更多的数据可以分析并转化为信息。决策是在头脑中做出来的,如果人们有更多的数据可以分析,就可能会产生更好的决策。当信息有助于做出更好的决策时,这些入门级数据网络效应就会非常强大(如图1-3所示)。
图1-3 入门级数据网络效应
大数据时代,大约为21世纪10年代,基本上关注的是这些入门级数据网络效应,见证了存储、管理、分析和可视化海量数据技术的发展。
实际上,当产品有效地收集信息,并向客户呈现时,这些入门级数据网络效应就产生了。这里有一个简单的例子:当你拥有更多的选择以及选择能力更强时,线上购物就会变得更加顺畅。与线上购物对应的是线下购物,即在一家百货商店买东西,那里摆放了很多产品,店员会帮你挑选产品。更多的选择来自采购清单——这不是数据网络效应。更强的选择能力来自收集、组织和展示这些产品的信息——这就是数据网络效应。电子商务网站上有每种产品的信息——例如扬声器的频率范围,或者电动牙刷的电池寿命——这里是购物的好地方。通常,产品数据以客户评论的方式呈现。每一个评论都是一条信息,让你能够从一个更为广阔的视角来看待这个产品,提高你做出明智购买决定的能力。通过阅读评论,你可以从每一位在你之前写过评论的人身上获益。当你购买了一件产品,然后写下自己的评论,那么数据网络效应就开始出现:最后一个写评论的人往往会影响你的购买决定,然后,如果你购买了产品并留下评论,现在你们都在帮助商家把东西卖给下一个人。这样一来,入门级数据网络效应就能够与向网络中添加的外部信息相结合,因此,它们需要来自外部的信息才能成长。
下一级数据网络效应
通过添加数据加上可以生成信息的其他东西——如人工智能——而使某物变得更有用时,数据网络效应便会升级。换句话说,一旦这些网络有了来自外部的数据,它们就会生成自己的信息并成长。这就是升级的力量:网络效应拥有了自我维持能力,可以以指数(方程式中的2)的倍数(方程式中的C)增长。下一级数据网络效应如图1-4所示。
实际上,当一种产品的每一位客户都生成数据,而这些数据又被提供给将数据转化为信息的系统时,这一切就发生了。该产品的客户有效地形成了一个数据贡献者网络,并从新贡献者添加的数据中受益,因为它能够产生信息。例如,网上购物通常从搜索开始,当你能够更快地找到想要购买的东西时,购物体验就会更好。由机器学习模型驱动的搜索引擎,可以使用从人们在搜索框中输入过、点击过、购买过和积极评价过的商品中收集的数据,在搜索结果页面上灵活推送产品——力图做到首先呈现最相关的结果。无论购物者是点击搜索结果,还是忽略搜索结果,机器学习模型都会学习。
图1-4 下一级数据网络效应
共享的大脑
入门级数据网络效应的实际情况是,人们利用自己的神经网络(大脑)来积累数据,将其转化为信息,与其他信息进行比较,学习一些东西,做出预测,进行决策,然后从决策的效果中学习更多东西。任何升级都受其大脑中神经网络的限制。在这种情况下,学习未被分享,只是做个决定,然后继续前行。有数据输入的大脑如图1-5所示。
图1-5 有数据输入的大脑
例如,你正在查看一个显示生产线上塑料瓶盖缺陷类型的数据面板,并将其与你亲眼在次品箱中看到的缺陷产品进行比较。你会发现,每次温度超过250℃时,塑料瓶盖的顶部都会变形。根据这一信息,你可以确定,如果将温度限制在250℃,则顶部不会变形,所以你决定对塑料挤出机的温度实施限制。这可能是一个很好的改变,但没有办法以系统化或网络化的方式从中学习。也许在未来,你会看到更少的缺陷,但也许你会忙于另一个项目。
当我们超越自己的神经网络,利用更大的、可进行大规模计算的共有网络时,就会出现真正的升级。网络效应的扩展速度会更快,复合网络效应会更大,因为它可以在很多的地方(包括计算机上)以及更多的数据上运行。
再次使用上述例子,你可以使用一个系统,一次在多条生产线上改变1℃的温度,通过分析塑料盖的图像来测量缺陷率,然后自动决定最佳注塑温度。该系统使用来自多条线路、传感器以及运算得出的信息,然后自动反馈到一个预测系统中,该系统对下一步运行的最佳实验做出决策。
入门级网络效应是一种集体智慧,因为从群体中获取更多的信息,有助于做出更好的决策。这就像我们人类世世代代共享信息一样,这是人类的超级能力。而21世纪更为强劲的动力则是人工智能。通过在互联网上共享更多的信息,我们可以利用自己的智慧进行学习。
下一级数据网络效应是一种学习速度更快的高级智能形式。跨系统共享信息,使它们能够根据更好的信息做出更好的决策。有数据输入的共享大脑如图1-6所示。
图1-6 有数据输入的共享大脑
构建什么类型的数据网络效应?
构建数据网络效应的类型取决于可用数据、人才和客户。只需要添加数据就可以进行建设,这是入门级数据网络效应建设所具有的显著的比较优势。然而,随着时间的推移,需要更多数据来增加网络的价值——添加数据不是自动的。
决定何时提高投资水平取决于可用数据是否能够训练出一个自我学习系统,以及客户是否会从这样一个系统的预测中受益。在这两种情况下,都有充足的理由启动数据学习效应,因为系统的集体智能会随着网络数据的增加而增加。