前言
互联网的快速发展改变了整个世界。从门户网站到搜索引擎,从社交网络到电子商务,从免费Wi-Fi到应用市场,层出不穷的在线服务方便了人们的生活,甚至颠覆了原有的产业。更为神奇的是,这些服务大多是免费的。在今天,“互联网思维”这个名词被越来越多互联网行业内外的人们追捧和畏惧,而其中很多人的困惑都在于:这么多免费的服务是如何获得收入,乃至赚得盆盈钵满的呢?实际上,如果把多样的互联网产品或服务看成各式硬币的正面,那么我们会发现,其中许多硬币的背面都有着一样的图案,这就是以广告为核心的后向变现体系。正面的免费服务是为了获得流量和数据,而背面的广告业务则将这些流量和数据变成金钱。这就是互联网最关键的思维模式之一。
在能够获得充分的流量或高价值的数据后,我们认为,
。这样的观点对许多传统行业商业模式的影响是深远的,也是我们认为大家应该在互联网时代深入了解广告、了解变现产品的原因。因此,本书虽然以介绍互联网广告的产品和技术为核心,但并不是想让大家都学会搭建一个广告系统。本书的核心目的,是让读者在清晰地了解互联网广告全貌的基础上,在遇到与后向变现相关的产品问题时,能够以合理的思维逻辑和背景知识来应对。实际上,在互联网时代,不论你身处哪个行业,只要用心留意,就会发现这类问题可能比你想象的更为常见,也更为重要。对其中最重要的几类问题,我们来看看下面几个具体的例子。(1)
例如,电影是一种边际成本很低、信息传播量又很大的典型商品。那么现在电影的票价为什么这么高?能否探索一种售价很低,而充分利用其信息传播能力的电影行业发行模式,获得更高的经济效益和社会效益?(2)
例如,互联网电视厂商除了硬件销售的回报以外,还可以获得一部分用户流量。这些流量的性质和价值如何,应该以什么样的方式变现?(3)
例如,室内导航技术是近年来快速发展的新型互联网应用,如果以向用户免费的方式运营室内导航产品,会得到什么有价值的数据资产,从而支撑相应的后向变现,又应该采用哪种具体的商业产品来支撑?(4)
例如,团购、游戏联运、返利购买、积分墙这些推广模式与一般的展示广告或搜索广告有什么内在联系?是否可以共用某些产品和技术平台?这4类问题的典型性和价值不言而喻。不过,要回答这些问题,仅靠独立的深入思考是不够的,还必须对当前互联网流量和数据变现市场的商业逻辑和产品现状有相当程度的了解,并在需要具体产品实施时有相应的方案可以参考和选择。为读者提供这方面的帮助,正是本书希望做到的。
从传统的视角看广告,会有人认为互联网服务中的广告破坏了用户体验。这实际上是一种观念上的误解。首先,互联网广告不再像线下广告那样,以宣教性的横幅为主,而是以各种自动决策的付费信息的方式存在,这其中既包括传统的创意形式,也包括游戏联运、团购、返利、原生广告等更加契合用户意图的新传播形式。另外,虽然从微观上看,部分不顾及媒体价值、盲目变现的广告产品确实存在破坏用户体验的问题,但从宏观上看,恰恰是因为广告这一后向变现模式的存在,互联网产品的整体用户体验才达到了前所未有的高度。在传统企业中,一般会根据产品线分设若干事业部,每个事业部在研发自己产品的同时,还要对营收和利润负责。而在互联网企业或者按照互联网方式运营的企业中,还存在另外一种组织方式,即面向用户的免费产品部门只负责优化产品体验,不对营收负责,而专门面向客户的商业产品部门通过广告等后向变现方式为企业创造营收。实践证明,在这样的组织方式下,用户产品部门往往能够心无旁骛,专心为了提高用户体验而努力。因此,我们会看到,比起传统软件企业,互联网企业的产品在把握用户需求、优化用户体验方面往往能够做得更加优秀。
因此,在互联网的世界里,广告不再只是广告公司的事,而是每一个互联网公司都要关心的事。从结果来看,在线广告实际上成了互联网最重要的“发动机”。从营收上看,它支撑着互联网业务的大半壁江山。当然,广告的概念本身在互联网业务中也已经发生了脱胎换骨的变化。首先,在互联网广告中,服务于中小商家、以直接销售为目的的广告取代品牌广告成为主流,这也创造了全新的巨大市场;其次,它的关键不再是创意、策略等人工服务,而是以数据支撑的流量规模化交易为典型特点。也就是说,机器和算法取代了人员与服务,成为在线广告最鲜明的特色。可以说,互联网广告的灵魂就在于数据与计算,因此,也就产生了“计算广告”这个名词,以及其背后复杂的产品与技术。
计算广告这个课题在以Google AdWords为代表的竞价广告业务产生以后逐渐成形,并且在展示广告进入程序化交易阶段以后愈加成熟,而将其整理成一个新的研究方向,则要归功于时任Yahoo!广告首席科学家的Andrei Broder。他在斯坦福开设的“Computational Advertising”这门课,第一次全面而系统地介绍了在线广告中的计算挑战,以及工业界中的实用算法。既然有了计算广告的相关课程,为什么还要再编写这本计算广告的书呢?首先当然是因为这一领域变化太快,在“计算广告”这个词诞生后的几年里,它的内涵和外延都已经发生了重大的变化,而且这几年的变化使这个领域逐渐完备起来。因此,有必要在此时对当下的计算广告领域做一个阶段性的小结。另外还有一个重要原因,那就是我们在几次计算广告的教学实践中发现,对在校学生或者刚刚接触此领域的人来说,最主要的理解障碍不在于算法和技术本身,而在于广告的商业逻辑和产品目标。以此为出发点,本书将以广告产品为核心进行组织。在清楚地了解计算广告的产品逻辑与商业价值的基础上,我们再有针对性地讨论其中的算法和架构问题。因此,商业逻辑驱动的在线广告产品和技术的升级,将是本书最重要的一条主线。
另外,本书还有一条潜在的主线,即数据的加工、利用与交易。熟悉计算广告业务和产品的读者会有认识,广告业务的收益只能来自3个方面,即数据、流量或品牌属性。其中后两点是媒体的专属,而大量的广告平台在做的事情,主要就是数据的加工与利用。不夸张地说,计算广告对于数据利用的广度和深度是空前的,而且产业的各个环节也是比较完备的。在各行各业都在强调大数据思维与方法的今天,深入了解计算广告产品与技术具有特别强的范本意义。因此,我们在内容组织上将特别强调数据这条线索,努力将广告产品进化过程中是如何一步步更有效利用数据的这一点解释清楚。
当下人工智能的火热,也让我们从这个视角重新审视计算广告业务的本质。实际上,人工智能在今天的快速发展,正是得益于深度学习的计算效率大大提高以后对大数据的挖掘和使用能力大大加强。而广告领域最重要的特点也是处理的数据规模巨大,并且机器对这些用户行为数据的解读潜力远远大于人类制定的规则。在计算广告发展的第一阶段,虽然我们已经在处理大量的数据,但用的方法往往是比较浅的模型,但是今天,以深度学习为代表的方法论和技术,正在计算广告领域得到越来深入的应用。在这一版中,我们也将对深度学习的基础方法论及其目前在计算广告中的关键应用进行介绍。
本书的读者对象
既然在线广告不再只是广告公司的事,那么需要了解这一业务及其背后产品技术的人群也就相当广泛了。我们希望下面几类读者可以从本书中找到有价值的内容。
(1)
对互联网公司来说,商业化产品中最重要的就是广告产品,不过我们发现,囿于各公司具体的产品形态,仅从自己的业务中了解广告产品技术的全貌并不容易。因此,本书最主要面向的读者就是与这些广告产品相关的人员,希望他们通过阅读本书,对互联网广告的全貌以及复杂的技术产品系列有整体的了解,避免“只见树木,不见森林”。(2)
计算广告在各种个性化系统中具有典型性,又因其商业逻辑而相对复杂;此外,计算广告还催生了对大规模数据利用和变现的直接市场。因此,推荐等个性化系统的产品技术人员,以及大数据相关的产品技术人员,都非常有必要通过了解计算广告的产品和技术,对个性化系统架构约束下的效果优化、大数据变现和交易等诸多问题在实际工业界的落地有一定的理解。(3)
传统企业在互联网化的过程中,需要借鉴的绝不仅仅是利用互联网的技术和产品,更重要的是按照互联网企业形成的高效运营和变现模式来改造传统业务。从这个意义上说,互联网企业以广告为基础的后向变现体系是整个互联网化过程中至关重要的一环。因此,在这样的传统企业中,互联网化进程的决策者对广告的原理和市场必须有一定程度的了解。(4)
传统广告业务与互联网广告业务既有密切的联系,又存在着巨大的差别。以技术为导向、精准地面向受众的广告策略,正深刻地影响着整个广告市场。同时,随着互联网广告规模的迅速扩大,这样的策略越来越为广告主接受和青睐。因此,传统广告业务的从业者必须要顺应潮流,理解和运用计算广告的方法与策略,将线下资源与线上资源整合起来,才能更好地服务于广告主和媒体。(5)
我们接触过不少互联网行业的创业者,对他们来说,找到用户产品的痛点并漂亮地解决往往并不是十分困难。但是,一个企业最终需要的是利润,而许多对变现逻辑和思考方法不熟悉的创业者,往往面对产品得到的流量和数据不知所措,而商业化进程的缓慢也会大大拖慢用户产品的运营进度,甚至因此错过企业的黄金发展机会。从这个意义上说,了解一些流量与数据变现的思路,无疑会对创业方向的选择、创业过程的加速、创业果实的收获有巨大的帮助。(6)
计算广告人才在互联网行业相当稀缺,而目前学校的教育对这种与工业界关系密切的实际问题是有些脱节的。我们整理本书的一个重要目的,是希望为具有一定的计算机科学基础并且对工业界实际问题有兴趣的学生提供一些指导,让他们对思考和设计商业产品、运用技术解决产品问题形成正确的思考方法。本书的内容组织
前面说过,我们整理本书并不是简单地为了介绍计算广告的产品和技术,更重要的目的是希望提供一个新的视角,让大家通过了解广告变现的内在逻辑,进而对互联网时代的用户产品如何将体验做到极致、将变现做到最高效有宏观的认识。在我们看来,如果不了解广告变现产品和市场,就谈不上真正透彻地了解互联网,也一定会在用户产品的设计和运营上有诸多掣肘。出于这样的目的,本书在核心内容组织上包括以下3个部分。
第一部分是在线广告市场与背景,这部分介绍在线广告领域的一些基本问题和背景知识。虽然内容比较容易理解,但这部分是全书的基础,特别是很多相关概念和术语的集中介绍,请不要略过。
第二部分是在线广告产品逻辑,这部分主要面向产品、运营和销售等人员,以及互联网产品的宏观决策者,其内容重点是介绍计算广告的市场结构、交易模式和主要产品。这部分内容将以在线广告产品发展的顺序展开,希望能帮助读者理解各种复杂的广告产品和交易机制产生的内在规律。
第三部分是计算广告关键技术,这部分主要面向系统工程师、算法工程师和架构师。与前一部分的广告产品相对应,这部分也以在线广告产品发展的顺序展开,重点阐释实现各种广告产品的关键技术挑战,并提供基础的解决方案。
一般来说,对于那些想运营在线广告业务,或者想了解如何用在线广告对用户产品进行变现的读者来说,可以重点阅读前两部分,并且对其中的产品与商业逻辑要深入理解;对那些重点关注工程实现和收入优化的读者来说,在了解了前两部分之后,还要花一些精力深入阅读第三部分,特别是其中与自己关注的广告产品相关的技术章节。计算广告这个领域的复杂性在于,对于任何一项产品或技术,都需要放在相应的商业背景下去判断其合理性,而要理解商业产品上能达到的目标,又需要对技术的现状和难点有相当的认识。因此,我们推荐的阅读方式还是尽可能地通读全书,对其中确实不相关或者知识背景上无法理解的部分简单跳过就可以了。
在讨论在线广告市场产品技术的过程中,会涉及大量的术语和专业名词。对于对变现业务不太熟悉的读者,这些术语会给阅读带来一定的障碍。为了帮助读者检索和查找术语的相关内容,我们在附录中对主要术语及缩写给出了索引,以方便阅读。
由于篇幅限制,本书中有些内容的细节或背景知识无法全面展开,在这种情形下给出了相应的参考文献。但是,由于本书并非学术著作,在引用文献时并不会保证完备性,因此当正文足以说明观点和方法时,其原始文献不一定还会列出,请读者谅解。另外,在本书的第三部分中,为帮助读者理解,会对一些比较关键的算法给出相应的代码片段。不过本书中的代码都是示例性代码,目的只是更清楚地描述逻辑,而并非可以直接编译执行的程序,其中一些特别容易理解和实现的子函数调用,也可能会略去其具体实现。
本书的内容主要是由刘鹏在清华的公开课以及在北大、北航的研究生课程内容整理加工而成的,并且在整理过程中针对更广泛的读者群体做了内容本身和顺序上的调整。在两位作者中,刘鹏为主要执笔者,负责主体部分的写作和内容的整体组织,王超负责其中产品案例和算法示例代码的部分。由于作者的水平有限,再加上时间仓促,书中难免出现错漏之处,敬请各位读者多多批评指正。此外,在本书撰写的过程中,我们邀请了一些业内的专家和从业者帮助对内容进行把关,得到了他们很多有益的建议,这些建议使本书更加完备和实用,我们在此一并表示感谢,并将其中部分专家对本书的评语附在书中。