书名:计算广告 互联网商业变现的市场与技术(第2版)(全彩精装版)
ISBN:978-7-115-52431-7
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 刘 鹏 王 超
责任编辑 杨海玲
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
计算广告是一项新兴的研究课题,它涉及大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学等诸多领域的知识。本书从实践出发,系统地介绍计算广告的产品、问题、系统和算法,并且从工业界的视角对这一领域进行具体技术的深入剖析。
本书立足于广告市场的根本问题,从计算广告各个阶段所遇到的市场挑战出发,以广告系统业务形态的需求和变化为主线,依次介绍合约广告系统、竞价广告系统、程序化交易市场等重要课题,并对计算广告涉及的关键技术和算法做深入的探讨,还加入了深度学习的基础方法论及其在计算广告中的应用。
无论是互联网公司商业化部门的产品技术人员,还是对个性化系统、大数据变现或交易有兴趣的产品技术人员,传统企业互联网化进程的决策者,传统广告业务的从业者,互联网创业者,计算机相关专业研究生,都会从阅读本书中受益匪浅。
以下点评分领域以点评人的姓氏笔画为序排列。
在线广告市场是比较复杂的体系,它涵盖了互联网生态链的各种角色。本书既从商业角度介绍了在线广告,也深入到了广告的技术和算法层面,还涉及了大规模竞价市场在市场设计方面的相关原理和优化手段。这本书不仅是了解在线广告市场的途径,也是了解互联网商业和盈利模式设计的窗口,对于互联网产品设计也有很好的参考作用。
—— 王华,前阿里巴巴副总裁,阿里妈妈负责人
这是一本非常系统、全面地介绍计算广告的书,一本在线广告专业人员必读的书,一本值得强烈推荐给想利用互联网力量的企业主和决策制定者以及对大数据价值感兴趣的研究人员和工程师的书。虽然我亦曾目睹广告业在20 世纪90 年代开始的革命,一直积极参与在线广告的演变,但阅读完这本书,我对计算广告整个图景以及很多细微之处有了更多更深刻的理解。
—— 毛建昌,微软Distinguished Engineer 和Bing 广告工程负责人,
前雅虎实验室广告科学副总裁
十多年的实践证明,互联网最有效的商业模式莫过于可以把流量直接变现的在线广告模式。从最初铺天盖地的横幅广告起步,到人群及兴趣精准定向的搜索广告与推荐引擎,再到与内容环境融为一体的原生广告,用户需求与口味的不断变迁促使广告产品与技术持续不断地升级与发酵。本书最大的亮点在于,作者从中国互联网广告发展全过程亲历者的视角,极为系统地讲述了计算广告的产品设计思维与技术理论基础,涵盖从广告呈现到计价策略乃至算法实现并直接运用于互联网流量变现课题的方方面面。无论是产品经理还是工程师,只要准备投身于这一互联网最大的金矿领域,本书就是手边必须常备的工具书与教材。
—— 刘子正,有信CEO,微博研发副总经理
本书内容全面且与时俱进,对核心技术的介绍深入浅出,是计算广告领域一本难得的好书。本书视野宽阔,涵盖了在线广告市场及核心技术的各个方面,除主流技术以外,对其他著作很少涉及的方面,如广告创意优化、反欺诈、隐私保护等也进行了介绍。本书内容新颖,把近年来涌现的一些新的广告形式和技术,如实时竞价的广告交易、原生广告等,都囊括其中。另外,本书行文流畅、逻辑清晰,对核心技术的介绍深入到位,包含了重要的算法细节以及理论探讨,对计算广告的从业者而言,是一本非常实用的参考书。
—— 刘铁岩,微软亚洲研究院首席研究员
刘鹏博士是我以前在微软工作时的同事,他博学睿智,融会文理,给我留下深刻印象。他将多年积累的相关经验与成果整理成一部正式出版的计算广告著作,值得向大家强烈推荐。本书将该领域的实际商业问题与技术解决方案结合起来,让读者对计算广告的理论与实践、应用与技术、系统与方法有全面深入的了解和认知。对于已经掌握了机器学习、数据挖掘技术想进入计算广告及其相关领域的从业者、技术人员、教师和学生,这是一部实用的指南。
—— 李航,字节跳动人工智能实验室总监,前华为诺亚方舟实验室主任
我们的团队花了大量精力查找相关资料和文献,却一直苦于没有一套相对完整的知识体系来帮助我们的业务和技术人员加快学习、少走弯路。因此,我期待这样一本书的出现至少已经有两三年的时间。作为一个方兴未艾而发展迅猛的新兴产业,我相信刘鹏的这套科学且实际的知识体系,将对数字营销领域的同仁有非常大的指导作用。程序化营销、大数据应用是发展异常迅猛的产业,涉及大量的产品、工程以及算法方面的知识,也涉及相当多的商业逻辑的深刻洞察。而刘鹏通过对产业内在逻辑的诠释和推演,阐述了程序化营销产业的发展,对真正把握大数据给各个产业带来的深刻变化和影响,具有深刻的指导意义。
—— 杨炯纬,360高级副总裁
如果说当年雅虎广告首席科学家Andrei Broder 在斯坦福开设的课程第一次把计算广告学作为一门学科,那么本书堪称这门新兴学科的标准教科书,因为它是首次全面系统地阐述计算广告学的著作,覆盖了商业逻辑、产品结构、关键技术、工程实践和应用实例。在内容结构编排上,本书由浅入深地讲述了从宏观背景到技术细节、从经典的搜索广告到最新的实时竞价等诸多内容,既适合作为从事在线广告的商务运营人员的参考书,也适合作为一线技术开发人员的实战指导。
—— 余凯,地平线公司创始人,前百度深度学习实验室主任
互联网业内人士都清楚流量的作用,流量之于互联网,正如血液之于人体。不同之处在于,互联网上的流量是趋利的,变现能力决定了流量的方向和价值。计算广告是流量变现最重要的方式之一。只有了解了互联网广告的精髓,才能真正懂得互联网上流量的奥秘,也才能懂得互联网的奥秘。本书作者对互联网广告的市场、产品和技术做了全面、深刻的剖析,为业内外人士理解并踏入这个领域提供了一条捷径。尽管本人从事互联网广告研发多年,也是第一次读到如此系统的著作,受益匪浅!
—— 沈抖,百度高级副总裁
计算广告近年来特别热,全球大小互联网公司有大量的算法工程师、系统工程师、数据科学家在从事与此相关的工作。正如刘鹏在书中指出的,流量变现和数据变现是很多互联网公司商业模型的核心。虽然学术界和工业界有大量与计算广告相关的文章,但或侧重于算法,或侧重于系统,抑或侧重于商业逻辑,却很少能像本书一样把这几个维度融会贯通地串在一起,既有连贯性、有广度,又有足够的深度。刘鹏过去几年中花了大量的精力在清华大学、北京大学以及一些在线教育平台分享他对计算广告的深刻理解,影响了不少人,我过去和现在的团队都有他的粉丝、他的学生。现在刘鹏又把他对计算广告的深刻理解集结成书,能影响到更多的人。为刘鹏点赞!
—— 张小沛,瓜子二手车CTO,前宜信CTO,前Hulu 全球副总裁
在互联网深入改造传统行业的进程中,所谓“羊毛出在猪身上” 的后向变现商业策略至关重要。市场上并不缺少关于这一策略的推崇和讨论,不过本书从实战的角度出发,对其中关键的商业逻辑和产品结构做了全面的梳理,而这些对于商业化战略的落地至关重要。因此,我推荐所有正处在互联网化变革的行业的从业者阅读本书,相信你们结合自身的知识背景和行业问题,一定可以从本书中找到有指导意义的内容。
—— 陈彤,一点资讯总裁,前小米副总裁
计算广告学纷繁复杂,刘鹏以科学的实践家的态度抽丝剥茧,全面、系统地阐述了其技术架构与产品生态,为入门者普及了概念,为从业者开阔了眼界。
—— 罗征,腾讯广点通总经理
很高兴看到刘鹏博士把自己在互联网广告领域的多年经验和智慧整理成书,其中既有他对商业产品的理解,也有算法和工程实现的总结。本书不仅全面梳理了互联网广告产品形态,针对每个产品描述了相应的核心算法和系统实现,而且全面描述了以媒体和广告主为核心的生态圈,以及技术如何一步步促使生态圈演化,不断创造出更大的商业价值。对互联网广告从业者来说,读后一定获益良多。
—— 贾志峰,汽车之家技术副总裁
互联网广告在近十余年里一直保持着爆炸式的发展,支撑着谷歌、脸书、阿里、百度等数个百亿、千亿级互联网公司。或许其发展过于迅猛,或许其涉及领域过于宽泛,以至于近几年来一直没有一本优秀的书能够系统、全面地对互联网广告加以介绍。本书作者把这件早就应该有人去做的事情漂亮地完成了。从业务模式到技术架构,从算法模型到工程实现,从理论基础到实现细节,从历史背景到最新动态,本书都做了翔实、系统的讲解。相信对于每一位置身于互联网广告业的朋友,不论其在这纷繁复杂的行业里承担什么样的角色,本书都值得一读。
—— 顾大伟,小米广告负责人
这本书中所介绍的技术环节,除了广泛应用在互联网广告领域,在搜索和推荐领域也有很多相通之处。本书作者将这些关键技术抽象出来整理成书,对互联网行业的初学者有很大帮助。此外,书中提及的前沿技术方向对从业人员也具有一定的参考价值。
—— 黄荣升,百度主任架构师
如果你正从事互联网广告相关的工作或正准备进入互联网广告行业,本书应该是你的职业生涯中必不可少的读物之一。作者不仅立足中国而且放眼世界,以其更深、更广的视角向读者展示了当今互联网行业的市场与技术。本书让中国互联网从业者(包括产品技术人员)在享受互联网大数据带来乐趣的同时,还能通过书中介绍的中西市场案例开拓创新思维。本书为推动中国互联网发展做出了自己的贡献。
—— 闫曌,AdMaster 创始人、CEO
今天,大数据浪潮正在席卷全球。数字技术正在改变我们的生活方式,同样也在驱动着商业、营销和广告业的未来发展。营销不再只是关于策略、创意和想法的,更与技术的发展紧紧地捆绑在一起。进入2015 年后,我们看到全行业正在迎接大数据的风口,从数据的沉积分析和管理到数据的真正打通,这是一场时代的演进。刘鹏博士的这本书正是这个变革时代营销技术变化的实录,他对最新数字广告技术方方面面的精到剖析,不仅是对广告知识体系的实时更新,更是对未来新的数字营销体系架构的有益探索。希望今天我们勇于探索和开拓的也正是未来被写进历史的故事。
—— 吴明辉,秒针系统创始人、董事长兼CEO
随着互联网的高速增长,广告开始往精细化发展,如何在有限的资源里获得最大化的广告综合收益是一个非常复杂、重要且有趣的问题,这也是计算广告研究的方向。刘鹏作为这个方向的专家,在本书中从计算广告问题的提出开始,介绍了计算广告的产品形态以及关键技术。本书非常适合互联网广告的从业者系统性地了解计算广告领域。
—— 周霖,搜易贷联合创始人,前搜狐高级副总裁
本书逻辑清晰,非常贴近实战,值得网络广告从业人员仔细阅读与思考。无论是媒体、广告代理还是广告主,谁能更好地获取数据、理解数据、应用数据,谁就能在日益激烈的市场竞争中脱颖而出。
—— 赵士路,WiseMedia 创始人、CEO
互联网和移动互联网广告生态圈正在发生翻天覆地的变化,广告形式、产品形态、市场格局及产业链模式不断推陈出新,让人目不暇接。同时,基于营销大数据的计算广告技术也日益成熟。刘鹏博士的这本书将两者有机结合起来,既能帮助从业人员了解互联网广告全貌及流量变现的现状,也能帮助技术人员掌握计算广告的核心技术,是一本兼顾商业产品逻辑和技术实践的难得一见的作品。
—— 唐健,爱点击CEO
互联网广告是一个千亿元级的市场。如果把互联网比作一辆车的话,互联网广告就是“汽油”,因为大多数网站都要依靠广告盈利。刘鹏博士的这本书涉及大量的基础知识、概念和商业模式,是目前此领域比较全面的一本广告技术著作。书的内容深入浅出,讲述了搜索广告、广告交易平台、广告基本算法以及开源系统等重要概念,也介绍了不少相关广告技术公司以及他们在互联网广告这个产业链上的各种典型产品,非常适合从业人员以及有兴趣进入这一阳光产业的人学习。
—— 唐朝晖,艾德思奇创始人、CEO
过去5 年是移动互联网发展最快的时期,开发者创造出如此多的应用和内容,用户行为习惯和数据积累发生惊人变化。在此过程中,在线广告作为最主要的变现形式,逐渐成为广大从业人员必须掌握的知识和技术。然而,由于此领域学习门槛较高,对很多从业人员来说迷雾重重。大部分相关文章只是对与广告相关的一些术语进行了罗列或介绍,无法让读者“知其然且知其所以然”。本书的出版将弥补这一空白,它系统性地介绍了在线广告的发展历史和逻辑,以及流行的程序化购买的关键技术与算法。更为可贵的是,刘鹏在本书中融入了自己对计算广告领域的理解和多年积累下来的宝贵经验,使整本书的思路和编排极为流畅。本书既适合想了解此领域的初学者或业务人员泛读,也适合专家以及产品人员对特定的知识点进行精读。本书将成为广大互联网从业人员理想读物,特此重点推荐给大家。
—— 崔晓波,TalkingData 创始人、CEO
本质上讲,互联网经济与广告经济都属于信息经济的具体技术形态或产业形态,核心要素是数据,经济学特征则是“所有能够传播信息的商品,其售价都会趋向其边际成本”。因此,确定数据商业化与广告产品化之间转换的逻辑、方法和路径极为重要,计算广告恰恰是这样一种经过多年实践的有效体系。刘鹏先生所著的这本书对相关的技术、创新与商业做了极好的刻画、梳理与论述。
—— 马旗戟,原尼尔森高级副总裁
我有两个身份,既是从20 世纪开始工作的广告主,又是大学老师,但面对的却是一样的问题和困惑。营销方法尤其是广告形式推陈出新,新技术层出不穷,受限于我自身的学问背景,不可能全部都了解,所以有拜读本书内容的机会我特别欣喜,终于有一本由业内专家执笔且技术含量特别高、非常实用的书了!广告主可以从中了解不同的展现方式,利用书中的广告主在线营销决策过程择善而为。媒体也可以凭借类似的广告变现决策,揭示未来的发展方向。专业人员可以进一步了解背后的技术,找出最有针对性的广告投放方式,提升推广成果。因此,我非常推崇本书的实用价值及参考价值。
—杨仕名,香港大学SPACE 中国商业学院副总监,营销与传媒管理中心主任
广告带来的后向变现是互联网经济中核心的变现模式之一,也是互联网商业模式的重要根基,而本书对这一领域做了一次全面的总结。我们希望互联网企业、广告服务和技术公司以及艾瑞这样的数据服务公司,以本书的出版为契机,认真探讨互联网商业模式上的分工协作,推动行业的变革与发展。
—— 杨伟庆,艾瑞咨询总裁
世界上有一种沟通是付费的,这就是广告的本质。然而,近几年互联网改变了整个广告生态的格局,目前世界上最叱咤风云的互联网公司几乎都依赖广告。刘鹏博士的这本书系统性地介绍了这种深层次的变化,以及整个产业链迸发出的各种技术手段与学问。本书由浅入深,系统地介绍了几乎每个互联网广告的生态位置以及其背后运作的机理,是我目前见过国内最系统的计算广告方面的著作。本书对互联网、媒体、广告公司、市场营销人士,甚至消费者,都是一本了解互联网广告的佳作。
—— 张迪,Adexchanger.cn 创始人
有了互联网才有了计算广告学:计算广告学把传统的无法定向投放和无法度量的广告变得可以定向投放和可以量化度量效果。刘鹏博士在工作之余,把计算广告学的系统性知识和多年实战经验总结成书,对从事计算广告的工程师和想了解计算广告的工程师都非常有帮助。
—— 张栋,前谷歌研究员
本书于我而言,是打开了一扇窗,让我看见了在巨大的互联网广告产业后面蕴含的数学模型和算法基础。计算广告学中蕴含的各种方法让我想到了管理方法论中很著名的一句话:“If you can’t measure it, you can’t manage it!”(不能量化,就无法管理。)量化的方法使计算广告学成为计算机科学与工程的一个崭新和重要的方向。非常感谢作者的知识分享。
—— 陈怀临,弯曲评论创始人
对计算广告技术和商务人才的需求近两年迅速高涨,但计算广告是一个新兴交叉学科,一直缺乏全面系统的著作。本书全面介绍了这一领域的商业背景知识、业务需求和详细的技术实现思路。本书一个重要特色是将该领域的商业挑战与技术的选择、应用、实现进行了融汇中西的系统化介绍,让不同知识背景的读者都能从中获得认识提升。此外,本书对于整个计算广告技术知识体系的梳理全面、准确,囊括了从业人士和学术研究需要关注和了解的主要知识点,已有一定基础和实践经验的读者也能从中温故知新和查遗补缺。本书的出版对于促进中国相关行业人才池的增长大有裨益。
—— 范秋华,RTBChina 创始人
互联互通正领跑,眼球经济网民包。创收多多靠广告,变现书籍好难找。计算广告学走俏,廿年蔚然成林悄。理论实践兼顾到,刘鹏此书及时抛。入门登堂先介绍,市场规模大蛋糕。产品技术两面刀,块块切尝大与小。搜索推广竞价搞,合约展现包推销。程序交易争分秒,移动平台憋新招。信息流起人社交,原生广告置混淆。探索利用平衡高,点击建模测验校。背景逻辑打夯牢,核心技术窥其奥。照葫芦可画出瓢,立竿见影编码跑。十载面壁勤思考,刘鹏功成发大招。油翁多年练广告,情不自禁拇指挑!
—— 洪涛,打油诗人,前百度高级科学家
2009年11月,我在香港参加CIKM’09,听Andrei Broder 等几位学者讲了一个导学课—Introduction to Computational Advertising(计算广告导论),耳目一新,觉得在我们的大学中应该有这样一门课。回来后了解了一下周围青年教师的情况,没有发现能够开这种课的人。后来,好像首先是在微博上,知道了刘鹏是这方面的专家。一联系,果然如此。与其探讨在北大开一次这种课的可能性,他欣然应允。时间定在2013 年夏天,我安排实验室的青年教师彭波做助教,目的之一,就是希望通过助教工作学会计算广告这一套知识,然后独立在北大开出课来。刘鹏的课进行得很顺利,彭波每次都参加,我也去听过一次。2014 年秋,彭波勇敢地开出课来了。课程结束后我问他感觉怎么样,他说内容太多,把握得还不好,而且没有教材,对老师学生都是个困难。
其实,最初我请刘鹏来上课的时候就谈到过教材的问题。他答应考虑,但因为他在公司里的工作很忙,所以需要比较长的时间。但他没有忘记!两年多过去了,一天他给我发邮件说书稿完成了,希望我能为他的书写个序,令我十分欣喜。
这本书不厚,但比较全面地覆盖了基于互联网服务的广告的市场背景、产品逻辑与关键技术,给出了一个宽阔的视野。作者基于多年的从业经验,从市场行为出发演绎对产品与技术的需求,而不是就技术讲技术,提高了本书的立意,因而也适合更广泛的读者群,包括计算机相关专业的研究生。应该说,这本书的风格不同于通常的教材,如果直接用于教学,对教师的要求会比较高,但不失为一本优秀的教学参考书。尤其是在其内容铺陈中展现出来的数据加工、利用与交易的思维主线,能让计算机专业的学生看到活生生的技术需求。而在互联网广告的背景下对数据的充分强调,让读者对大数据的意义有了一种更具体的体会。
国内一些大学中的计算机专业教育(尤其是高年级和研究生的)现在困难和问题还比较多。比较明显的一点就是,教学内容的时代感不够强。这一点在广度和深度上都有反应。跟不上业界的发展,一些重要的课程不能及时有效地开,我认为“计算广告”就是其中之一。这种情况和蓬勃发展的信息技术和产业是不相适应的。因此,我们欢迎业界中对技术和产业有比较透彻理解且对教育有情怀的专家参与到大学教学活动中来,让我们的学生学到更多的真本事,适应产业发展的需要。刘鹏2013 年在北大首开“计算广告”课程就是这样一种表率,他这本书的面世也是这个意义上的一种奉献,当予祝贺。
李晓明
北京大学计算机系教授
所有互联网公司都对广告变现的地位和价值并不陌生。在每一个用户产品成长的各个阶段,除了认真解决需求痛点、优化用户体验,也应该不断地对流量和数据的价值进行评估,并积极探讨商业变现的战略与产品。而在各种商业化产品当中,以计算为导向的广告变现无疑是最为重要的。
在产品选型、开发和运营的初期阶段,如果能对产品未来产生的数据和流量价值有正确的评估,并了解如何利用广告产品将这些资产变现,对于判断该产品的成长空间和商业价值非常重要。另外,早期的产品推广会用到许多广告营销产品,而对于计算广告原理的深入了解也将有利于高效地做好营销。
当产品得到市场认可,获得了一定的用户规模以后,积极制定系统性的商业化战略,用合理的变现方式获得现金流,从而支撑产品的快速发展,则是每一个互联网公司成长过程中必须经历的关键步骤。如果能洞悉互联网广告市场的产品技术全貌,无疑对此阶段的决策大有帮助。
虽然广告技术在互联网行业至关重要,长期以来,却只有一些只鳞片爪的专题文章,对业界系统架构与算法的介绍,从世界范围来看,都非常缺乏系统性的整理和总结。这一方面是由于广告市场发展迅速,从搜索竞价到程序化交易,再到移动互联网下的原生广告趋势,日新月异的产品进化速度让整个工业界来不及停下脚步做小结;另一方面是广告产品的内在逻辑不像用户产品那样直觉,要进行全面透彻的整理和剖析,需要兼有丰富的实践经验和相当的理论抽象能力。也正由于缺乏系统性的资料,互联网工业界在这方面的人才培养也不够系统,导致在广告产品技术这样一个重要的领域,人才一直是短缺的。
刘鹏博士曾经与我在搜狐集团有过一段时间的同事经历。从简短的几次接触中,我知道他在对媒体的流量变现和需求方广告产品方面都有丰富的实践经验,并曾在Yahoo! Labs 对计算广告领域进行过系统性的研究,是对这一领域做全面总结的合适人选。如今,终于看到他不吝时间和精力,将计算广告领域的产品技术和商业逻辑整理成书,这将是令整个互联网工业界受益之举。
带着期待读完本书,我的第一印象是,其内容全面而富有条理:本书既有计算广告全线产品的介绍,又有对其商业逻辑和原理的透彻解剖,还有对应的技术架构和关键算法的深入讨论。另外,除了受众定向、点击率预估、实时竞价等热点问题的讨论,还有详尽的周边产品和技术的介绍。相信认真读完此书的读者,一方面会对整个广告生态的全貌有全局性的了解,不会只见树木,不见森林;另一方面又可以按图索骥,再碰到各种实际问题时在本书中找到具体思路甚至解决方案。
当然,本书的另外一项重要意义就是,它是计算广告领域第一本系统性的正式出版物。非常希望以此为契机,从合理配置资源的角度出发,整个互联网领域能够在流量和数据变现上逐渐走向标准化与分工协作。这也许会从一个侧面促进中国互联网企业摆脱恶性竞争的囚徒困境,走向合作共赢之路。
最后,祝贺此书的出版,并希望它能够给你些许启示。
王小川
搜狗公司CEO
广告营销处在历史转折点,技术对传媒的驱动和融合趋势让数字营销充满变数,这变化颇有乐趣却又让人不安。原因很简单:一方面,技术驱动下的数字生态百花齐放,程序化营销渐入佳境;另一方面,数字世界各式各样的广告技术概念让市场营销者感到困惑。
不可否认,营销行业有专业的技术型人才和数据科学家帮助我们实践和创新这些技术,似乎有了需要的一切。可想象一下,某个下午时光,当和我们的客户坐在一起,他可能会问起这样的问题:未来你们能帮我们做什么?
如果说技术代表营销的未来,那么技术到底是什么呢?技术为什么存在?技术可以帮助人们做些什么?我常想,要拨开这些技术迷雾,营销人具备的知识背景应该能跨越技术理解的盲点,能洞察到真正关键且清晰的归因,把这些问题的答案清晰和简单地传递给我们的客户。所以我期待行业中有人能把广告技术的真实情况和作用讲出来,无论是DSP、DMP 或是RTB 这些商业产品概念,还是“预测模型”“机器学习”“人群定向”之类的技术名词。
带着这个期待,我阅读了刘鹏博士这本广告技术专著。我想说,我的这些疑惑在阅读这本书的过程中都得到了解答或者找到了线索。
刘鹏博士在互联网领域,特别是广告变现产品领域有着非常丰富的从业经验。从雅虎全球研发中心到微软研究院,再到今天作为360 首席商业架构师,他既主持过需求方营销产品和供给方变现产品的设计开发,又兼有从产品到系统和算法的全面把握能力,而这些经验都成了本书丰富实用内容的基础。
一本好的广告书不会大谈趋势,而是会从细节观察出发,探知商业逻辑;一本好的技术书不会大谈常识,而是剖析实践领域的真知灼见。刘鹏博士编写的这本书就是这样一部跨越领域、兼而有之的作品。
很愿意分享两点阅读感受。第一点是繁纷复杂的数字生态和技术说辞,刘鹏对此做了系统的梳理和介绍,即使高度专业的产品概念、逻辑及算法应用,非技术背景的读者也能对这些概念建立统一的认识。第二点是概念之外,书中列举了国际国内经典的广告平台产品,分析其形态、技术、策略,描绘了商业和产品之间相互关联、相互促进的有趣演进。这些来自于作者多年从业实践和积累并给营销人带来“互联网+”的思考角度更难能可贵。而书中列举了很多翔实的数据和图例,反映了刘鹏博士对技术和治学的严肃态度。
如果你需要了解在线广告的产品和技术,就应该马上行动,打开这本书,努力去学习和探索。
愿每位从事数字广告事业的营销人,都能读到此书。
李桂芬
前安吉斯媒体集团大中华区首席执行官
互联网的快速发展改变了整个世界。从门户网站到搜索引擎,从社交网络到电子商务,从免费Wi-Fi到应用市场,层出不穷的在线服务方便了人们的生活,甚至颠覆了原有的产业。更为神奇的是,这些服务大多是免费的。在今天,“互联网思维”这个名词被越来越多互联网行业内外的人们追捧和畏惧,而其中很多人的困惑都在于:这么多免费的服务是如何获得收入,乃至赚得盆盈钵满的呢?实际上,如果把多样的互联网产品或服务看成各式硬币的正面,那么我们会发现,其中许多硬币的背面都有着一样的图案,这就是以广告为核心的后向变现体系。正面的免费服务是为了获得流量和数据,而背面的广告业务则将这些流量和数据变成金钱。这就是互联网最关键的思维模式之一。
在能够获得充分的流量或高价值的数据后,我们认为,所有能够传播信息的商品,其售价都会趋向其边际成本。这样的观点对许多传统行业商业模式的影响是深远的,也是我们认为大家应该在互联网时代深入了解广告、了解变现产品的原因。因此,本书虽然以介绍互联网广告的产品和技术为核心,但并不是想让大家都学会搭建一个广告系统。本书的核心目的,是让读者在清晰地了解互联网广告全貌的基础上,在遇到与后向变现相关的产品问题时,能够以合理的思维逻辑和背景知识来应对。实际上,在互联网时代,不论你身处哪个行业,只要用心留意,就会发现这类问题可能比你想象的更为常见,也更为重要。对其中最重要的几类问题,我们来看看下面几个具体的例子。
(1)商业模式探索。例如,电影是一种边际成本很低、信息传播量又很大的典型商品。那么现在电影的票价为什么这么高?能否探索一种售价很低,而充分利用其信息传播能力的电影行业发行模式,获得更高的经济效益和社会效益?
(2)流量变现。例如,互联网电视厂商除了硬件销售的回报以外,还可以获得一部分用户流量。这些流量的性质和价值如何,应该以什么样的方式变现?
(3)数据变现。例如,室内导航技术是近年来快速发展的新型互联网应用,如果以向用户免费的方式运营室内导航产品,会得到什么有价值的数据资产,从而支撑相应的后向变现,又应该采用哪种具体的商业产品来支撑?
(4)商业产品建设和运营。例如,团购、游戏联运、返利购买、积分墙这些推广模式与一般的展示广告或搜索广告有什么内在联系?是否可以共用某些产品和技术平台?
这4类问题的典型性和价值不言而喻。不过,要回答这些问题,仅靠独立的深入思考是不够的,还必须对当前互联网流量和数据变现市场的商业逻辑和产品现状有相当程度的了解,并在需要具体产品实施时有相应的方案可以参考和选择。为读者提供这方面的帮助,正是本书希望做到的。
从传统的视角看广告,会有人认为互联网服务中的广告破坏了用户体验。这实际上是一种观念上的误解。首先,互联网广告不再像线下广告那样,以宣教性的横幅为主,而是以各种自动决策的付费信息的方式存在,这其中既包括传统的创意形式,也包括游戏联运、团购、返利、原生广告等更加契合用户意图的新传播形式。另外,虽然从微观上看,部分不顾及媒体价值、盲目变现的广告产品确实存在破坏用户体验的问题,但从宏观上看,恰恰是因为广告这一后向变现模式的存在,互联网产品的整体用户体验才达到了前所未有的高度。在传统企业中,一般会根据产品线分设若干事业部,每个事业部在研发自己产品的同时,还要对营收和利润负责。而在互联网企业或者按照互联网方式运营的企业中,还存在另外一种组织方式,即面向用户的免费产品部门只负责优化产品体验,不对营收负责,而专门面向客户的商业产品部门通过广告等后向变现方式为企业创造营收。实践证明,在这样的组织方式下,用户产品部门往往能够心无旁骛,专心为了提高用户体验而努力。因此,我们会看到,比起传统软件企业,互联网企业的产品在把握用户需求、优化用户体验方面往往能够做得更加优秀。
因此,在互联网的世界里,广告不再只是广告公司的事,而是每一个互联网公司都要关心的事。从结果来看,在线广告实际上成了互联网最重要的“发动机”。从营收上看,它支撑着互联网业务的大半壁江山。当然,广告的概念本身在互联网业务中也已经发生了脱胎换骨的变化。首先,在互联网广告中,服务于中小商家、以直接销售为目的的广告取代品牌广告成为主流,这也创造了全新的巨大市场;其次,它的关键不再是创意、策略等人工服务,而是以数据支撑的流量规模化交易为典型特点。也就是说,机器和算法取代了人员与服务,成为在线广告最鲜明的特色。可以说,互联网广告的灵魂就在于数据与计算,因此,也就产生了“计算广告”这个名词,以及其背后复杂的产品与技术。
计算广告这个课题在以Google AdWords为代表的竞价广告业务产生以后逐渐成形,并且在展示广告进入程序化交易阶段以后愈加成熟,而将其整理成一个新的研究方向,则要归功于时任Yahoo!广告首席科学家的Andrei Broder。他在斯坦福开设的“Computational Advertising”这门课,第一次全面而系统地介绍了在线广告中的计算挑战,以及工业界中的实用算法。既然有了计算广告的相关课程,为什么还要再编写这本计算广告的书呢?首先当然是因为这一领域变化太快,在“计算广告”这个词诞生后的几年里,它的内涵和外延都已经发生了重大的变化,而且这几年的变化使这个领域逐渐完备起来。因此,有必要在此时对当下的计算广告领域做一个阶段性的小结。另外还有一个重要原因,那就是我们在几次计算广告的教学实践中发现,对在校学生或者刚刚接触此领域的人来说,最主要的理解障碍不在于算法和技术本身,而在于广告的商业逻辑和产品目标。以此为出发点,本书将以广告产品为核心进行组织。在清楚地了解计算广告的产品逻辑与商业价值的基础上,我们再有针对性地讨论其中的算法和架构问题。因此,商业逻辑驱动的在线广告产品和技术的升级,将是本书最重要的一条主线。
另外,本书还有一条潜在的主线,即数据的加工、利用与交易。熟悉计算广告业务和产品的读者会有认识,广告业务的收益只能来自3个方面,即数据、流量或品牌属性。其中后两点是媒体的专属,而大量的广告平台在做的事情,主要就是数据的加工与利用。不夸张地说,计算广告对于数据利用的广度和深度是空前的,而且产业的各个环节也是比较完备的。在各行各业都在强调大数据思维与方法的今天,深入了解计算广告产品与技术具有特别强的范本意义。因此,我们在内容组织上将特别强调数据这条线索,努力将广告产品进化过程中是如何一步步更有效利用数据的这一点解释清楚。
当下人工智能的火热,也让我们从这个视角重新审视计算广告业务的本质。实际上,人工智能在今天的快速发展,正是得益于深度学习的计算效率大大提高以后对大数据的挖掘和使用能力大大加强。而广告领域最重要的特点也是处理的数据规模巨大,并且机器对这些用户行为数据的解读潜力远远大于人类制定的规则。在计算广告发展的第一阶段,虽然我们已经在处理大量的数据,但用的方法往往是比较浅的模型,但是今天,以深度学习为代表的方法论和技术,正在计算广告领域得到越来深入的应用。在这一版中,我们也将对深度学习的基础方法论及其目前在计算广告中的关键应用进行介绍。
既然在线广告不再只是广告公司的事,那么需要了解这一业务及其背后产品技术的人群也就相当广泛了。我们希望下面几类读者可以从本书中找到有价值的内容。
(1)互联网公司商业化部门的产品、技术和运营人员。对互联网公司来说,商业化产品中最重要的就是广告产品,不过我们发现,囿于各公司具体的产品形态,仅从自己的业务中了解广告产品技术的全貌并不容易。因此,本书最主要面向的读者就是与这些广告产品相关的人员,希望他们通过阅读本书,对互联网广告的全貌以及复杂的技术产品系列有整体的了解,避免“只见树木,不见森林”。
(2)对个性化系统、大数据变现或交易有兴趣者。计算广告在各种个性化系统中具有典型性,又因其商业逻辑而相对复杂;此外,计算广告还催生了对大规模数据利用和变现的直接市场。因此,推荐等个性化系统的产品技术人员,以及大数据相关的产品技术人员,都非常有必要通过了解计算广告的产品和技术,对个性化系统架构约束下的效果优化、大数据变现和交易等诸多问题在实际工业界的落地有一定的理解。
(3)传统企业互联网化进程的决策者。传统企业在互联网化的过程中,需要借鉴的绝不仅仅是利用互联网的技术和产品,更重要的是按照互联网企业形成的高效运营和变现模式来改造传统业务。从这个意义上说,互联网企业以广告为基础的后向变现体系是整个互联网化过程中至关重要的一环。因此,在这样的传统企业中,互联网化进程的决策者对广告的原理和市场必须有一定程度的了解。
(4)传统广告业务的从业者。传统广告业务与互联网广告业务既有密切的联系,又存在着巨大的差别。以技术为导向、精准地面向受众的广告策略,正深刻地影响着整个广告市场。同时,随着互联网广告规模的迅速扩大,这样的策略越来越为广告主接受和青睐。因此,传统广告业务的从业者必须要顺应潮流,理解和运用计算广告的方法与策略,将线下资源与线上资源整合起来,才能更好地服务于广告主和媒体。
(5)互联网创业者。我们接触过不少互联网行业的创业者,对他们来说,找到用户产品的痛点并漂亮地解决往往并不是十分困难。但是,一个企业最终需要的是利润,而许多对变现逻辑和思考方法不熟悉的创业者,往往面对产品得到的流量和数据不知所措,而商业化进程的缓慢也会大大拖慢用户产品的运营进度,甚至因此错过企业的黄金发展机会。从这个意义上说,了解一些流量与数据变现的思路,无疑会对创业方向的选择、创业过程的加速、创业果实的收获有巨大的帮助。
(6)计算机相关专业研究生。计算广告人才在互联网行业相当稀缺,而目前学校的教育对这种与工业界关系密切的实际问题是有些脱节的。我们整理本书的一个重要目的,是希望为具有一定的计算机科学基础并且对工业界实际问题有兴趣的学生提供一些指导,让他们对思考和设计商业产品、运用技术解决产品问题形成正确的思考方法。
前面说过,我们整理本书并不是简单地为了介绍计算广告的产品和技术,更重要的目的是希望提供一个新的视角,让大家通过了解广告变现的内在逻辑,进而对互联网时代的用户产品如何将体验做到极致、将变现做到最高效有宏观的认识。在我们看来,如果不了解广告变现产品和市场,就谈不上真正透彻地了解互联网,也一定会在用户产品的设计和运营上有诸多掣肘。出于这样的目的,本书在核心内容组织上包括以下3个部分。
第一部分是在线广告市场与背景,这部分介绍在线广告领域的一些基本问题和背景知识。虽然内容比较容易理解,但这部分是全书的基础,特别是很多相关概念和术语的集中介绍,请不要略过。
第二部分是在线广告产品逻辑,这部分主要面向产品、运营和销售等人员,以及互联网产品的宏观决策者,其内容重点是介绍计算广告的市场结构、交易模式和主要产品。这部分内容将以在线广告产品发展的顺序展开,希望能帮助读者理解各种复杂的广告产品和交易机制产生的内在规律。
第三部分是计算广告关键技术,这部分主要面向系统工程师、算法工程师和架构师。与前一部分的广告产品相对应,这部分也以在线广告产品发展的顺序展开,重点阐释实现各种广告产品的关键技术挑战,并提供基础的解决方案。
一般来说,对于那些想运营在线广告业务,或者想了解如何用在线广告对用户产品进行变现的读者来说,可以重点阅读前两部分,并且对其中的产品与商业逻辑要深入理解;对那些重点关注工程实现和收入优化的读者来说,在了解了前两部分之后,还要花一些精力深入阅读第三部分,特别是其中与自己关注的广告产品相关的技术章节。计算广告这个领域的复杂性在于,对于任何一项产品或技术,都需要放在相应的商业背景下去判断其合理性,而要理解商业产品上能达到的目标,又需要对技术的现状和难点有相当的认识。因此,我们推荐的阅读方式还是尽可能地通读全书,对其中确实不相关或者知识背景上无法理解的部分简单跳过就可以了。
在讨论在线广告市场产品技术的过程中,会涉及大量的术语和专业名词。对于对变现业务不太熟悉的读者,这些术语会给阅读带来一定的障碍。为了帮助读者检索和查找术语的相关内容,我们在附录中对主要术语及缩写给出了索引,以方便阅读。
由于篇幅限制,本书中有些内容的细节或背景知识无法全面展开,在这种情形下给出了相应的参考文献。但是,由于本书并非学术著作,在引用文献时并不会保证完备性,因此当正文足以说明观点和方法时,其原始文献不一定还会列出,请读者谅解。另外,在本书的第三部分中,为帮助读者理解,会对一些比较关键的算法给出相应的代码片段。不过本书中的代码都是示例性代码,目的只是更清楚地描述逻辑,而并非可以直接编译执行的程序,其中一些特别容易理解和实现的子函数调用,也可能会略去其具体实现。
本书的内容主要是由刘鹏在清华的公开课以及在北大、北航的研究生课程内容整理加工而成的,并且在整理过程中针对更广泛的读者群体做了内容本身和顺序上的调整。在两位作者中,刘鹏为主要执笔者,负责主体部分的写作和内容的整体组织,王超负责其中产品案例和算法示例代码的部分。由于作者的水平有限,再加上时间仓促,书中难免出现错漏之处,敬请各位读者多多批评指正。此外,在本书撰写的过程中,我们邀请了一些业内的专家和从业者帮助对内容进行把关,得到了他们很多有益的建议,这些建议使本书更加完备和实用,我们在此一并表示感谢,并将其中部分专家对本书的评语附在书中。
本书由异步社区出品,社区(https://www.epubit.com/)为您提供相关资源和后续服务。
作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。
当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“提交勘误”,输入勘误信息,单击“提交”按钮即可。本书的作者和编辑会对您提交的勘误进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。
我们的联系邮箱是contact@epubit.com.cn。
如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。
如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区在线提交投稿(直接访问www.epubit.com/selfpublish/submission即可)。
如果您来自学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。
如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。
“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT技术图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT技术图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。
“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近30年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、AI、测试、前端、网络技术等。
异步社区 微信服务号
在线广告,也称网络广告、互联网广告,顾名思义,指的是在线媒体上投放的广告。与传统广告不同的是,在线广告在其短短十几年的发展过程中,已经形成了以人群为投放目标、以产品为导向的技术型投放模式。它不仅为广告主带来了以准确接触目标受众为方法论的全新营销渠道,也为互联网免费产品和媒体找到了规模化变现的手段。可以说,不论在做用户产品还是商业产品,不深入了解在线广告,就不可能全面了解互联网业务。因此,互联网行业的从业者花一些时间把现代在线广告原理和产品搞清楚是必需的。
另外,从数据的角度来看,在线广告开启了大规模、自动化利用数据改善产品和提高收入的先河。不夸张地说,在过去相当长的一个时期内,大数据(big data)这一方法论唯一形成规模化营收的落地行业就是在线广告。即便在今天,计算广告仍然是大数据应用中最成熟、市场规模最大的行业,因此,对大数据感兴趣的读者认真研究在线广告中的技术挑战和产品问题,会对探索其他的大数据应用有很大帮助。
在线广告领域的产品形态和业务逻辑相当复杂。为了对在线广告有宏观上的把握,本章将从两个方面来探讨:一是其内涵,即在线广告这种商业活动的定义与目的;二是其外延,即在线广告发展历史中产生的关键产品形态。对其中的许多概念和观点,读者未必能够马上形成清晰的印象,但随着内容的展开,读者可以剥茧抽丝般层层递进地加深理解。另外,本章还有另外一个目的,就是尽可能集中地介绍互联网广告的产品和技术术语,以方便后面的讨论。
与线下广告相比,在线广告的产品和创意形式由于互联网媒体在形态、交互方式等方面存在差异,也呈现出各种各样的表现形式。我们将简要介绍其中比较常见的创意形式,帮助读者对在线广告的具体表现建立直观了解。
本章的内容与计算基本无关,目的在于让读者在进入计算广告领域之初就建立起一些重要观念。首先,广告不完全等同于搜索或推荐,它首先是一项商业活动,然后才是一项技术;其次,在这一商业活动中,广告主、媒体和用户的利益都需要被认真考虑和满足,这样才能达到整个市场的平衡和不断发展。在线广告市场所有产品和商业形式的演进,都是在这一主题下发生的。在商业逻辑的框架下思考和探索计算广告技术对理解本书中提到的产品、架构和算法非常关键。
大家都知道,互联网产品的网站、应用等软件产品,往往以免费的形式服务用户;另外一些互联网公司也在以直接利润微薄甚至亏损的情形下,出售手机、电视等硬件产品。无论是软件的免费,还是硬件的低价销售,都可以称为免费模式。那么什么是免费模式的本质呢?我们的观点是:
免费模式的本质是将那些能够规模化、个性化传播信息的商品,以边际成本的价格出售。
考察上面提到的例子,网站等软件产品多服务一个用户的边际成本很小,因此这些产品都不收费,这是狭义的免费,而手机等硬件产品,边际成本即是量产成本,因此以毛利为零左右的价格出售,这是广义的免费。当然,这些产品的共同特点是能够传播信息,并且能够对不同用户个性化地传播信息,而像矿泉水、充电器这类无法传播信息的商品,是无法被互联网的免费模式改造的。
既然产品本身没有利润,这些产品的开发者的利润从哪里来呢?其实,这类免费产品在传播信息的过程中,获得了3项可变现的核心资产,这就是流量、数据和影响力。
(1)流量。流量的价值是,有人使用你的产品,你便可以在产品本身的功能之外夹带一些付费内容(sponsored content),或者称为广告,这样就把流量变成了收入。
(2)数据。有人在使用你的产品的过程中留下了一些行为和属性,比如搜过某个关键词,浏览过某个商品,填写过自己的性别,这些都是数据。根据这些数据,你可以更好地了解该用户的属性、偏好等信息。基于这些信息,可以调整投放付费内容的策略以提高效率。
(3)影响力。影响力指的是你的产品或内容获得了高于普通水准的关注与信任。当然,你投放的付费内容也就同时获得了更好的关注效果,而这些对于提高转化率同样是至关重要的(参见2.1节)。因此,具备影响力的产品或内容在投放广告时可以获得品牌溢价。
值得指出的是,近年来迅速崛起的大量网红和自媒体,实际上主要靠影响力而非流量和数据变现。如果将从公众号软文(影响力变现)标价与文末展示广告(流量和数据变现)收入进行对比,前者的价格往往是后者的数十倍。现有的在线广告体系并不能很好地处理这种以影响力为主要资产的媒体变现,这也是未来一个有趣的探索方向。
将这3项资产通过商业产品的形式转变成收入的过程,即商业化(monetization)过程,与用户使用免费产品的过程是分离的,因此称为后向变现。从上面的介绍可以看出,无论是数据变现还是影响力变现,都是建立在流量变现的基础上的,而这样的体系也就是计算广告技术所支撑的、现代的商业化产品体系。
近年来,大数据思维和技术渐成显学。然而,大数据这一概念迄今并没有一个内涵上准确的界定。在参考文献[73]中,作者用规模(volume)、多样性(variety)、高速(velocity)和价值(value),即所谓的4V特征来描述大数据问题的特性,但并没有给出这类问题的界定标准。但是,从实践的角度来看什么是大数据问题,或许要比理论上的定义要简单一些:自从互联网公司开始挖掘海量用户行为数据中的价值,大数据这一概念就进入实践阶段了。它在工业界最显著的特点是区别于以往数据处理系统的低成本、分布式计算架构。从数据来源、处理方式和应用方向这3个角度来看,大数据问题都有鲜明的特点。
(1)行为数据。传统的数据处理任务往往面对的是交易数据。所谓交易数据指的是商业活动中必须记录的数据,如电信运营商的话费充值、通话记录,银行的存取款、利息等。交易数据处理的规模往往并不太大,但是对一致性和实时性的要求非常高,IOE(IBM、Oracle和EMC)的计算架构为交易数据处理提供了成熟的方案。与此相对,商业活动中产生的非必须记录的数据,就是行为数据。电信运营商采集到的用户位置、银行的窗口排队以及网站的用户访问日志等,都属于行为数据。与交易数据相比,行为数据的加工有两个特点,首先是规模巨大,其次是对一致性的要求要低得多,例如,网站的日志丢失千分之一,往往并不是什么严重事故。由于这两个特点,传统的IOE架构并不合适,这些是大数据架构产生的原动力。
(2)全量加工。如果数据规模很大,并且问题无法通过采样来降低处理的复杂程度,那就必须利用一些专门为海量数据处理而设计的计算和存储技术(如MapReduce、NoSQL数据库等)来实现。如图1-1所示,我们考察某数据处理过程的目标函数,就有可能存在如下两类有代表性的情形。
图1-1 大数据问题的特性示意
(3)自动化应用。使用数据的应用有两种类型。一种是洞察(insight)应用,即对数据进行统计分析后得到整体的结果报表,再由决策者根据结果进行决策。洞察应用传统典型的例子是企业的财务报表,而商业智能(Business Intelligence,BI)也属于洞察应用。另外一种是自动化(automation)应用,即将数据处理的结果直接送给对业务进行自动决策的引擎。计算广告正是典型的自动化应用,从用户行为数据收集,到受众定向,再到线上根据用户标签的自动决策,整个过程都是自动进行的,人的作用只是建立流程和调整策略。电商的自动进货系统,也是一种大数据的自动化应用。
洞察应用由于业务决策过程中有人的参与环节,因此报表的数据规模不能太大,这会带来一定的信息量损失。另外,对洞察报表的解读和决策,实际上需要相当专业的训练,这一点读者想想财务报表的例子就可以明白。而自动化应用由于是由机器进行决策的,数据可以在个体粒度上进行处理,这使得数据能够发挥更大的效果。因此,我们认为,相对于传统的洞察应用,自动化应用才是真正发挥大数据优势的应用形态。
由于上述3个特点的存在,面向中等规模交易数据的存储和计算的传统IOE架构变得不再合适,必须寻找新的方案。这些需求催生了Google的GFS、MapReduce和BigTable这“三驾马车”,也产生了Hadoop和Spark等开源技术方案。
从行为数据、全量加工和自动化应用这3个关键点来看,在线广告中的计算问题是非常典型的大数据应用。实际上,在以往相当长的一段时期里,唯一得到充分商业化和规模化的大数据应用,就是计算广告。它为各行各业大数据的落地提供了非常有价值的借鉴样本,下面几点尤其值得了解和关注。
(1)计算广告为规模化变现流量和数据提供了完整产品和解决方案,并创造了互联网大部分的利润。
(2)在线广告孵化了较成熟的数据加工和交易产业链,值得所有涉及大数据从业者学习和借鉴。
(3)由于存在商业上的限制条件,计算广告产品和技术比推荐系统更加复杂。因此,理解其产品和市场对于设计高效的商业产品大有益处。
因此,如果你是一位大数据、商业变现或用户增长领域的产品经理、工程师或管理者,我们建议你认真了解广告的产品和技术,相信你一定会有很大收获,也会快捷地了解到这一领域真正有挑战的问题。本着这样的目的,本书的内容将会以广告市场的产品和技术演进作为一条明线,而以对数据的利用程度作为一条暗线来展开。
在了解计算广告之前,我们先讨论一下广告的一般目的。什么是广告?可以参考William F. Arens在《当代广告学》[4]中给出的定义:
广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。
这一定义中有两个关键点。首先,它指出了广告活动的两个主动参与方,即出资人(sponsor)和媒体(medium)。在数字广告复杂的市场结构中,可以用一般性的术语来描述它们:需求方(demand)和供给方(supply)。前者可以是广告主(advertiser)、代表广告主利益的代理商(agency)或其他技术形态的采买方;后者可以是媒体,也可以是其他技术形态的变现平台。另外,广告还有一个被动的参与方,即受众(audience)。请大家从现在开始,就牢牢建立起这样的概念:出资人、媒体和受众这三者的利益博弈关系是广告活动的主线,这一主线将贯穿于商业和产品形态的整个演化过程。另外,该定义还阐明了广告必须是有偿的、非人员的信息传播活动,这两点限制,前者使广告的目标变得明确,后者使这一目标可以用计算的方式来优化,这些都是计算广告产生的基础。
广告的本质目的是什么呢?不同时代对这一问题存在不同的认知。在传统媒体时代,供给方与需求方在市场地位上有相当的距离,不论是电视台、机场还是杂志,都与大多数广告主需要的转化行为之间有相当大的差距。因此,传统广告的目的主要是借助媒体的力量来快速接触大量用户,以达到宣传品牌形象,提升中长期购买率与利润空间的目的。我们称这种目的的广告为品牌广告(brand awareness)。当然,也有许多广告商希望能利用广告手段马上带来大量的购买或其他转化行为,我们称这种目的的广告为直接效果广告(direct response),有时简称为效果广告。
传统媒体投送和优化效果广告的能力显然是缺乏的。这是因为,对短期效果的追求要求广告精准地送达目标人群,而这在传统媒体上缺乏有效的技术手段。我们能够想起的以效果为目的的传统广告,恐怕只有在写字楼下散发的快餐传单,这被称为直接营销(Direct Marketing,DM)。而数字媒体的出现使效果广告空前蓬勃地发展起来,这主要有两方面的原因:一是数字媒体的特点可以让我们低成本地投送个性化广告,这本质上是在变现流量;二是一些在线服务,如搜索、电子商务,由于可以更清楚地了解用户的意图,也就使广告效果的优化更加容易,这本质上是在变现数据。
在线广告兼有品牌和效果两方面的功能。不过,互联网广告行业的高速发展主要是因为效果广告市场带来的巨大红利。我们可以看一下表1-1中的数据[1]:从2007年到2015年,网络广告的市场规模发展迅猛,目前已经全面超越了电视广告,在中国甚至占据了整个广告市场的一多半份额;与此同时,传统广告渠道则增长乏力或快速下降。对比来看,在线广告的迅猛成长并没有导致电视广告市场的显著萎缩。这是因为网络广告的主要场景仍然集中在搜索引擎营销、移动应用下载、电商再营销等直接效果广告上,而这部分相对于电视广告更多的是增量而非替代。另外,报纸广告快速下降,这首先是因为报纸占据的用户时间大幅被互联网抢走,其次是因为报纸上部分分类信息广告与互联网效果类广告重叠较大。目前,随着数字媒体越来越多地占据了人们的时间,以及在线视频等冲击力更强的媒体越来越普及,在线广告也必将在品牌广告方面有更大的空间。
表1-1 中美主要广告市场规模(单位:亿美元)
国家 | 广告类型 | 2007年 | 2008年 | 2009年 | 2010年 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 |
---|---|---|---|---|---|---|---|---|---|---|---|
中国 | 网络广告 | 17 | 27 | 33 | 52 | 83 | 122 | 179 | 233 | 317 | 420 |
广播电视广告 | 97 | 114 | 127 | 153 | 182 | 207 | 212 | 219 | 226 | 223 | |
美国 | 网络广告 | 212 | 234 | 226 | 260 | 317 | 366 | 428 | 495 | 596 | 725 |
电视广告 | 719 | 394 | 359 | 401 | 685 | 721 | 745 | 657 | 663 | 713 | |
报纸广告 | 486 | 344 | 246 | 228 | 207 | 194 | 180 | 167 | 151 | — |
既然有品牌和效果这两种目标,究竟如何描述广告这种商业活动的根本目的呢?我们仍然借用《当代广告学》中的见解:
广告的根本目的是广告主通过媒体达到低成本的用户接触。
也就是说,按某种市场意图接触相应的人群,进而影响其中的潜在用户,使他们选择某产品的概率增加,或者对产品性价比的苛求程度降低,这才是广告的根本目的。至于短期内的转化效果,由于市场意图或媒体性质的不同,并不是直接可比的。换句话说,如果仅仅以转化效果为目的来思考问题,可能会背离投放广告的正确方法论。举个例子,某感冒药广告商如果以短期效果为导向,那么最佳的策略是把广告投放给那些现在已经感冒的人,不过这显然是一个荒谬的决策;再比如,某汽车广告商为了提升自己的品牌形象,希望对自己竞品品牌的用户加强宣传,而对于这部分人群,广告的直接效果甚至有可能比随机投放还要差。认清这一概念,有助于在遇到多种广告渠道的效果比较时,避免得出偏颇的结论。
广告的“低成本”是与那些由市场或销售人员完成的劝服活动成本相对而言的,实际上是广告搭了媒体流量和影响力的便车。要确定是否真的成本较低,需要用到投入产出比(Return on Investment,ROI)这一评价指标,即某次广告活动的总产出与总投入的比例。实践中,广告活动的总投入容易确定,但总产出却不一定明确且可衡量,特别是在投放以中长期收益为目标的品牌广告时。因此,绝对的ROI有时难以计算,不过通过各个渠道之间的对比,我们仍然可以评估广告的成本是否令人满意。
在互联网环境中,广告的本质虽然没有变化,但是由于大量直接效果需求的产生,其表现形式越来越丰富和灵活。不论是与线下类似的横幅、搜索竞价排名,还是软文,甚至是表面上与广告并不相干的游戏联运,其本质都是付费的信息推广,从产品的角度来看都可以归在广告的范畴下。因此,对于互联网广告,我们有如下认识:
一切付费的信息、产品或服务的传播渠道,都是广告。
那么,在线广告主要有哪些表现形式呢?我们将在1.4节中介绍。
在线广告与用户接触的表现形式有多种多样的选择,并且随着移动互联网的发展变得越来越丰富。下面我们就简单介绍其中一些常见的类型。请读者注意,下面介绍的各种广告形式概念上有交叠,并不是并列的关系。
(1)横幅广告(banner ad)。这是展示广告中最传统的形式。它是嵌入在页面中的图片,往往需要占据固定大小的版面。目前,横幅广告大多数也都不再是静止的图片,而是由Flash或HTML5等方式实现的动态素材。图1-2给出了横幅广告的一个示例。
图1-2 横幅广告示例
(2)文字链广告(textual ad)。这种广告的素材形式是一段链接到广告主落地页的文字,是搜索广告的主流形式,在展示广告中也被广泛采用。文字链广告有时像横幅广告那样占据固定版面,有时则穿插在大量内容链接条目中。图1-3给出了文字链广告的一个示例。
图1-3 文字链广告示例
(3)富媒体广告(rich media ad)。这类广告利用视觉冲击力较强的表现形式,向用户侵入式地投送广告素材。富媒体广告常见的形式有弹窗、对联、全屏等。它比较适合在高质量的媒体做品牌性质较强的广告投放,但是对用户的使用体验往往影响也较大。一些门户网站的首页有时会为某个品牌广告主提供专门定制的、交互形式很复杂的富媒体广告,这样的广告不太采用按受众投放的逻辑,主要强调创意的冲击力和交互形式的特色。图1-4给出了一个富媒体广告中的弹窗广告示例。
图1-4 富媒体广告示例
(4)视频广告(video ad)。视频广告指的是广告的创意由静态素材变成了一段视频,其信息的传播量和冲击力都得以大大提高。可以说,视频化已经成为在线广告最重要的趋势之一。有关视频广告的效果评价,除了点击率等,还可以采用用户观看时长等更接近用户印象的指标。
视频广告有几种主要的形式。
图1-5 视频广告示例:前插片广告(左),暂停广告(右)
(5)交互式广告(playable ad)。视频广告承载了更多的创意信息,因此会带来较好的推广效果。于是,在移动场景下,业界开始探索让用户直接在创意上完成交互,体验被推广产品的交互式方案。
在移动应用和游戏推广中,交互式创意可以让用户不用下载App就可以体验其内容,有时可以带来更高的转化率,但同时对媒体也有用户注意力上的损失。交互式创意有两种技术方案:一是服务端交互的方案,二是HTML5模拟的方案。这两种方案我们将在16.1.3节中具体介绍。图1-6给出了交互式广告的一些示例。
图1-6 交互式广告示例
(6)社交广告(social ad)。社交网络的兴起给广告传播的渠道和能力都赋予了新的空间。在社交网络中嵌入的广告,可以统称为社交广告。社交广告中最典型的形式是插入在信息流中的广告,这种方式最早见于Twitter的“Promoted Tweets”产品。它力求在用户的交互过程中尽可能自然地插入广告,被归于原生广告的范畴中。“社交广告”与“社交网络中的广告”是两个不同的概念,例如,在社交网络页面上竞价售卖的文字链或横幅广告,其本质与普通网站上的展示广告并无太大区别。社交广告希望达到的效果是通过用户的扩散式传播获得更大的影响力,从这个意义上讲,在信息流的交互中挖掘价值前景光明。图1-7给出了社交网络信息流广告的一个示例。
图1-7 社交网络信息流广告
(7)移动广告(mobile ad)。移动互联网在近几年爆发式成长,并且大有取代桌面互联网之势。严格来说,移动广告与桌面广告没有本质的区别,只是由于移动原生应用的大量普及,广告也由Web页面搬进了应用里。于是,也产生了在应用中插入广告的SDK和相应的广告产品。移动广告目前典型的形式有横幅、开屏、插屏、积分墙或推荐墙等。图1-8给出了移动广告形式的一些示例,我们将在第8章中具体讨论与移动广告和原生广告相关的产品问题。
图1-8 移动广告形式示例
(8)邮件营销广告(Email Direct Marketing,EDM)。这是通过电子邮件向用户推广信息的一种营销手段。与上面各种广告形式都不同,EDM是一种主动营销方式,可以随时向合适的用户发送信息。不过也正因为如此,EDM非常容易变成垃圾邮件的主要来源。对EDM的运营者而言,精准地把握用户兴趣,非常有节制地向用户提供相关信息非常关键。比起展示广告,EDM中受众定向的利用更加直接,也更为重要。图1-9给出了邮件营销广告的一些示例。另外,通过短信、iMessage等方式投放的广告,与邮件营销广告也非常相似。
图1-9 邮件营销广告(EDM)示例
(9)激励广告(incentive ad)。数字广告区别于传统广告的重要特点是可以产生直接转化,因此很容易想到的一个策略,就是直接激励用户产生转化以提高效果,这类广告称为激励广告。激励广告的典型代表之一是移动上常用的积分墙模式,如图1-10所示。
图1-10 积分墙广告示例
返利购买是电商行业常见的一种推广模式,它采用折扣或积分激励用户购买,也属于激励广告的一种。显然,这种方式可以获得任意高的投资回报率(ROI),但是也会带来一些老用户转由返利网下单。
除了积分墙、返利,激励型广告还有内容锁、锁屏等多种形式。特别需要注意的是,天下没有免费的午餐,激励广告虽然能显著提高转化效率,但是由于用户对产品的真实需求并不强,因此后续效果会大打折扣,特别是在获取新客方面的价值比较差。因此,激励广告的价格一般会显著低于非激励广告。
(10)团购。团购本质上是一种按照效果付费的泛广告产品,其本质也是一种激励性广告。团购推广的主要广告主是一些本地化的店铺,主要目的是为了获得新客。如图1-11所示,对团购平台来说,团购商品的排序与广告是一样的问题。传统的团购销售很少采用竞价的方式,而多是预先约定价格,不过目前各团购网站也在采用竞价的方式直接售卖。另外,团购的广告库中是付费信息而非创意,这有利于发展原生广告的推广方式,具体讲解参见第8章。
图1-11 团购产品示例
(11)游戏联运。游戏联运是根据用户的最终游戏内消费在推广渠道和游戏开发商之间分成的商业产品,这仍然是一种按效果付费的泛广告产品。在页游和手游的推广中,联运是一种非常常见的发行模式,读者在各种产品中看到的图1-12所示的游戏下载专区,其背后的商业模式往往都是联运。实际上,在中国的各大Android应用市场中,游戏联运的收入远远超过其他类型广告的收入。不同的联运渠道分成比例可能相差很大,在Apple Store这样典型的国外市场中,渠道的分成比例一般为30%,但是在中国,有些强势的联运渠道分成比例甚至可以达到90%以上。游戏联运完全可以按照广告产品思路来设计和运营。
图1-12 游戏联运产品示例
(12)固定位导航。这主要包括网址导航站的位置入口(如图1-13所示)、应用分发平台的推荐位置等付费推广位置。一般来说,这种产品的销售都采用按时间付费的模式,而不是动态的竞价模式。这是因为广告主除了引流以外,往往更加关注这些入口位置的橱窗效应。这种广告的销售和运营模式与按天购买的合约广告相同。
图1-13 网址导航产品示例
上述这些广告产品和泛广告产品往往在一家公司内部同时存在。同时运营多种类型的广告产品时,广告产品之间甚至和用户产品之间经常会出现争夺广告位或其他入口资源的问题。面对这样的问题,最合理的分配方式是通过它们之间的竞价来决策,这是非常重要的内部流量货币化的运营理念。
在讨论广告技术之前,我们先看一下在线广告发展的历程。因为广告市场的概念、技术和术语繁多,所以如果不是对这些有基本的了解,就很难深入探讨具体的产品。
在20世纪末,那时的在线媒体(如AOL、Yahoo!等网站)刚刚产生不久。它们的流量规模很大,投资人当然希望这些媒体也能够给自己带来真金白银。要对这些线上流量进行变现,或者称为商业化,最直接的方法就是把网站页面当成杂志版面,在里面插入广告位。线下的广告代理公司也就把这些网站当成新的杂志,按既往思路和逻辑进行采买。我们称这种在互联网上展示横幅广告的产品形式为展示广告(display advertising),也称显示广告。我们称上述的展示广告售卖模式为合约广告(agreement-based advertising),即采用合同的方式约定某一广告位在某一时间段为特定广告主所独占,并且根据双方的要求,制订广告创意和投放策略。如图1-14中左半部分所示,例如,这样一个广告位一天的售卖价格是10 000元。显然,这样的采买模式并没有用到数字媒体可以对不同用户投放不同内容的个性化特征。
图1-14 流量与数据变现示意
互联网广告运营者经过探索,很快就发现了数字媒体不同于传统媒体的本质特点:可以对不同的受众呈现不同的广告创意。在今天看来再平常不过的这个观念,实际上是在线广告效果和规模不断发展的核心驱动力。认识到这一点,媒体找到了一条能使广告位报价继续提高的思路。如图1-14所示的情形,由于剃须刀广告只需要男性受众,我们将该广告位的男性用户流量分配给它,价格变成6 000元,而对女性受众展示某化妆品广告,价格也是6 000元。这样的广告投放方式,称为定向广告(targeted advertising)。对于广告主来说,用更低的成本获得了与原来通投广告位一样的有效受众,而对于媒体来说,总收入变成了12 000元,多出来的2 000元,就是数据(这里为每一个用户的性别数据)变现的价值。请读者注意:
在广告业务中,数据变现是附着在流量变现的基础上的。
很显然,定向广告系统对计算技术提出了两个需求:一是受众定向(audience targeting),即通过技术手段标定某个用户的性别、年龄或其他标签,二是广告投放(ad serving),即将广告投送由直接嵌入页面变为实时响应前端请求,并动态决策和返回合适的广告创意。由于是从传统广告延伸而来,此时的定向广告仍然以合约的方式进行:媒体与广告主约定广告位、时间段和投放量,并在此基础上确定合同的总金额以及量未达标的情况下的赔偿方案。这种担保式投送(Guaranteed Delivery,GD)的交易方式,逐渐成为互联网合约式广告的主要模式。一般来说,这样的合约仍然主要面向品牌广告主,并且按照按千次展示付费(Cost per Mille,CPM)的计费方式。
GD广告系统中有一个重要的计算问题,即保证满足各合约目标量的要求的同时,尽可能为广告主分配到效果更好的流量。这个问题有两个难点:一是如何有效地将流量分配到各个合约互相交叉的人群覆盖上;二是要在在线的环境下实时地完成每一次展示决策。这就是在线分配(online allocation)问题。如果将各合约的量看作约束条件,将广告效果看作目标函数,则可以利用带约束优化(constrained optimization)的数学框架来解决。为了得到在线环境下切实可行的方案,学术界和工业界的同仁进行了大量理论和工程方面的研究,有一些高效且简便的方案已经为各媒体实际采用。
展示广告领域定向投放的最初动机,是媒体为了拆分流量以获得更高的营收。但是如果提供非常精细的定向,反而会造成售卖率的下降,因此,最初的定向标签往往是人口属性等粒度较粗的标签。不过,精细受众定向显然更符合需求方的口味和利益——不要忘了,广告市场的钱全部是来自需求方的,他们的利益被满足得越好,市场的规模就会越大。因此,受众定向产生以后,有两方面的发展趋势:一是定向标签变得越来越精准,例如具体某件商品的购物兴趣;二是广告主的数量不断膨胀。在这些趋势下,按照合约方式售卖广告遇到了越来越多的麻烦:首先,很难对这些细粒度标签组合的流量做准确预估;其次,当一次展示同时满足多个合约的时候,仅按照在线分配策略决策,有可能浪费了部分本可以卖得更贵的流量。既然量的约束带来了这些麻烦,有没有可能抛弃它呢?这样的思路催生了计算广告历史上革命性的产品模式——竞价广告(auction-based advertising)。在竞价模式下,供给方只向广告主保证质即单位流量的成本,但不再给出量的保证。对于每一次展示,则按照收益最高这样的简单原则来决策。
上面是从展示广告的发展看竞价产生的原因,但竞价广告产生的最初场景,是在互联网广告最主要的金矿——搜索广告(search ad)中。在以Google为代表的搜索引擎技术成熟以后,迅速成为互联网新的入口点。与门户网站不同,搜索引擎从一开始就没有被当作媒体来看待,因此搜索流量的变现也采用了付费搜索(paid search或sponsored search)的模式。从广告的视角来看,付费搜索显然也是一种定向广告,即根据用户即时兴趣定向投送的广告,而即时兴趣的标签就是关键词。搜索广告从一开始就直接达到了非常精准的程度,也就很自然地采用了竞价的售卖方式。
除了变现搜索流量本身,搜索引擎也开始考虑将关键词竞价的方式推广到其他媒体上:如果将用户的搜索词换成正在页面中的关键词,可以将此产品从搜索结果页照搬到媒体页面上,这就产生了上下文广告(contextual advertising)。
从宏观市场上看,竞价广告与合约广告有很大的不同。没有了合约的保证,大量的广告主处在一个多方博弈的环境中。与直觉不同的是,在如何向广告主收取每次竞价费用这一点上,并不是按照微观上最优的方案实施就可以达到整个市场最大的收益。关于定价机制的深入研究,产生了广义第二高价(Generalized Second Price,GSP)这一竞价重要的理论。
基于竞价和精准人群定向这两个核心功能,产生了广告网络(AD Network,ADN)这种新的产品形式。它批量地运营媒体的广告位,按照人群或上下文标签售卖给需求方,并用竞价的方式分配流量。广告网络的结算以按点击付费(Cost per Click,CPC)的方式为主,这里有数据和业务等方面的原因,我们将在2.3.2节中具体探讨。这种产品的千次展示收益(Revenue per Mille,RPM)一般来说达不到合约广告的水平,但它使大量媒体的剩余流量(remnant inventory),即没有能力通过合约售卖的流量,有了可行的变现手段:这些媒体可以直接把自己的库存(inventory)托管给ADN,借助ADN的销售和代理团队让自己的流量变现。
搜索广告、广告网络只有出价接口,是否意味着广告主不再需要量的保证呢?实践中,往往还会由需求方产品来保量。竞价广告产生以后,流量采买形式发生了变化:一是更多地面向受众而非广告位进行采买;二是越来越需要技术手段保证广告主量的要求,并在此基础上优化效果。这又是一个与在线分配类似的带约束优化问题。但是实际上,这个问题有很大不同:因为只能在供给方定义好的标签组合上指定出价,而不能控制每一次展示的出价,市场看起来更像一个黑盒子,所以需求方只能靠选择合适的标签组合,以及阶段性调整出价来间接控制效果。这种面向多个ADN或媒体按人群一站式采买广告,并进行量和质优化的需求方产品,称为交易终端(Trading Desk,TD)。
广告网络的竞价过程是内部进行的,这无法满足广告主定制化的人群选择和优化要求。设想下面的两种情形。
(1)某电商网站准备通过广告召回它的流失用户。
(2)某银行准备通过已有的信用卡用户找到相似的潜在用户群,并通过广告触达他们。
显然,这些人群仅靠广告平台自己的数据无法得到。这样的需求催生了一种开放的竞价逻辑,让需求方按自己的人群定义来挑选流量,这就是实时竞价(Real Time Bidding,RTB),它将竞价过程由广告主预先出价,变成每次展示时实时出价。只要把广告展示的上下文页面URL,以及访客的用户标识等信息传给需求方,它就能进行完成定制化的人群选择和出价。于是,市场上产生了聚合各媒体流量,采用实时竞价方式进行变现的新产品形态——广告交易平台(AD Exchange,ADX)。这个名称让我们很容易联想起股票交易所。事实上,如果我们把ADN的交易方式想象成场外交易市场(over-the-counter market),那么ADX与股票交易所确实有着类似的作用。
通过实时竞价,按照定制化人群标签采买广告,这样的产品就是需求方平台(Demand Side Platform,DSP)。由于实时竞价一般采用按展示次数计费的方式(原因6.3节中会具体讨论),DSP需要尽可能准确地估计每一次展示的期望价值。在这一点上,DSP比TD要方便多了,因为充分的环境信息使得深入的计算和估计成为可能。基于DSP的广告采买,非常类似于股票市场上的程序交易,我们把这样的广告采买方式也叫作程序化交易(programmatic trade)。除了RTB以外,还有其他几种程序购买的交易方式,我们将在6.2节中具体介绍。总体而言,在线广告中程序化交易的地位将会不断加强,这是由广告主利益最大化的趋势所决定的。
初次接触在线广告的读者可能对上面提到的大量概念和商业逻辑感到无所适从。不过没关系,上面所有用楷体字标出的关键概念,在本书后续章节都会有详细的讨论,这部分内容的目的只是让读者对本书讨论的范畴有一个全局性认识,从而在后续章节中接触到某个具体问题时不会只见树木,不见森林。
由于在线广告存在着较复杂的市场结构,LUMA Partners将全球市场的主要代表公司作了非常全面的总结,并绘制成了图1-15中的“DISPLAY LUMAscape”。这一图谱的骨架与上面我们介绍的在线广告简史有着非常紧密的联系,因此也是本书在广告产品方面重要的提纲。简要地说,这一图谱是从两端向中间逐渐发展和形成的:首先是合约阶段,广告主通过代理公司从媒体方采买广告,而媒体方的广告投放机则负责完成和优化各个广告主的合约;然后,市场进化出了竞价售卖方式,从而在靠近供给方产生了ADN这样的产品形态,而需求方的代理公司为了适应这一市场变化,孵化出了对应的媒介采买平台(media buying platform);最后,当市场产生了程序化交易时,供给方进化出了ADX,而需求方则用DSP与其对接来投放广告。图中的下半部分,多是一些对这一骨干市场结构起支持作用的产品,或者在细分领域的特异化产品。我们在后面介绍到相关内容时,将会给出相应的介绍。
图1-15中的个别术语与本书略有区别,例如媒介采买平台,我们会在书中用相近似的产品概念TD来代替,请大家留意。
图1-15 LUMA总结的展示广告市场结构和代表公司图谱
总结一下,在线广告发展的历史上,定向技术和交易形式的进化是一条主线。从最初的固定位置合约,发展到进行受众定向、按展示量结算的合约,再到竞价交易方式,并最终发展成开放的实时竞价交易。这条主线的核心驱动力是让越来越多的数据源为广告决策提供支持,从而提升广告的效果。除了这条交易形态的主线,互联网广告产品还有另外一条发展线路,即产品展现逻辑上的发展:在展示广告的最初阶段,广告位被作为与内容相对独立的单元来决策和运营,并且完全以优化收入为目标;同时,人们从搜索广告和社交网络信息流广告中得到了启发——将内容与广告对立起来,未必是一个好的选择,前面这两种广告产品,正是由于与内容的展现和触发逻辑有着高度的一致性,才使得它们的效果很突出。沿着这样的思路,将内容与广告以某种方式统一决策或展示的产品形式——原生广告(native ad)在近年来得到了越来越多的关注。如何将原生的决策方式与已经比较成熟的广告交易相结合,是目前移动互联网广告发展的热点。有关这方面的问题,我们将在第8章中具体讨论。
[1] 数据来源于IAB和艾瑞等机构的市场调研报告。
从本章开始我们会接触在线广告中与计算有关的问题。广告中的计算是为了解决什么问题,以及解决这些问题需要什么样的业务描述框架,是本章重点关注的内容。
我们会先对从传统广告中发展起来的广告有效性理论做简要回顾。把广告产生效果的过程分解为若干阶段,并讨论其中各阶段关键的影响因素,可以对在线广告中受众定向、创意优化等有价值的技术点的原理有感性认识。虽然这部分内容与具体的计算技术无关,却对计算广告中的一些根本原理有深入的揭示,希望读者有所了解。
在互联网广告中,计算之所以可以发挥巨大的作用,与它的一些根本技术特点有很大关系,这是本章的出发点。总的来说,可衡量的效果以及相应的计算优化,是在线广告区别于线下广告的主要特点。在这些特色的基础上,我们对Andrei Broder提出的计算广告核心挑战稍作推广,得到贯穿本书的计算广告核心问题,即利润优化问题的概念性框架。
在大多数广告产品中,可以通过计算优化的主要是收入部分,而千次展示期望收入(expected Cost per Mille, eCPM)正是计算广告中最为核心的量化指标之一。与广告的信息传达过程相关,eCPM又可以分解为点击率和点击价值的乘积,这两个指标是各种广告产品在计算过程中经常遇到的,也是产品运营需要深入理解和重点关注的。
同时,这样的收入分解方法还对在线广告产品的市场结构和计费方式的理解很有帮助。读者将会看到,在线广告多种多样的计费方式实际上反映着市场结构的分工不同。具体来说,计费方式与供给方和需求方如何分工估计点击率和点击价值,从而完成整个市场的资源优化配置有关。对若干常见计费方式的深入理解,对于把握计算广告领域的核心问题,以及评估每个问题在特定情形下的难度,有很重要的指导意义。
本章的最后还将介绍若干广告和在线广告领域中重要的行业协会。了解这些协会在广告业务中代表的利益方,以及他们对整个在线广告市场产品和技术形态的推动作用,对有志从事广告技术和业务的读者来说也是必要的。
为了探讨用技术手段优化广告效果,我们先看看广告从用户接触开始是如何产生最终效果的。这一问题是广告领域一个重要的传统研究课题,我们直接借鉴了前人的研究成果,用一个三段式信息传播模型来解剖广告由物理上产生到最终产生转化行为的全过程,广告转化的有效性模型如图2-1所示。
图2-1 广告效果产生过程示意
如图2-1所示,广告的信息接收过程分为3个大阶段,即选择(selection)、解释(interpretation)与态度(attitude),或者进一步分解为6个子阶段,即曝光(exposure)、关注(attention)、理解(comprehension)、接受(acceptence)、保持(retention)与决策(decision)。下面我们分别来讨论每个阶段的意义和关键点。
(1)曝光阶段。这一阶段指的是广告物理上展现出来的过程,其有效程度往往与广告位的物理属性有关,并没有太多可以通过技术优化的空间。实际的广告实践中,因为曝光的有效性对最终结果的影响往往远远高于其他技术性因素,所以才会有“位置为王”的说法。像纽约时代广场那组著名的广告牌(见图2-2的左图),以及北京东三环北端京信大厦外立面正对着东三环北路的广告牌(见图2-2的右图),就有非常好的曝光效果。在互联网广告中,位置的影响有时会更加显著。因此。如何从算法上消除由此带来的点击率的偏差,是一个重要的实际问题。
图2-2 曝光效果突出的广告位示例(左:纽约时代广场;右:北京东三环京信大厦)
(2)关注阶段。这一阶段指的是受众从物理上接触到广告,到意识上关注到它的过程。对广告而言,曝光并不一定意味着关注。举个例子,有一位好友某天在浏览社交网站时,他的小儿子在旁边喊道:“爸爸,快看网页上的恐龙!”而这位朋友找了一分多钟都没有找到恐龙。实际上,恐龙就在网页上端最醒目的广告位上。这个例子说明,强曝光并不能等同于用户实际有效的关注。
如何提高关注阶段的效率呢?首先,尽量不要打断用户的任务。这一点是上下文定向的原理基础,也是讨论原生广告产品的出发点之一,上面的例子也可以用这个原则来解释,当用户明确辨识出某个固定的广告位,并且不再认为它与当前网页的任务有关联时,他会下意识地屏蔽其内容;其次,明确传达向用户推送此广告的原因,这一点是受众定向广告创意优化的重要方向;最后,内容符合用户的兴趣或需求,这是行为定向的原理基础。
(3)理解阶段。用户关注到了广告的内容并不意味着他一定能理解广告传达的信息。再举一个例子,作者有一次试玩了一款网页游戏,然后被某游戏广告定向到,并多次看到某宣传“四维城战新模式”的游戏广告。应该说这样的定向是精准的,我也认真地看了广告的内容,不过由于我不能直观理解这些内容,也就谈不上后续转化。
如何提高理解阶段的效率呢?首先,广告内容要在用户能理解的具体兴趣范围内,这说明真正精准的受众定向有多么必要;其次,要注意设定与关注程度相匹配的理解门槛。例如,在电视广告中,可以用有一定情节的短故事来宣传品牌;在路牌广告中,创意制作原则是将若干主要市场诉求都表达出来;而对于互联网广告,由于用户的关注程度非常低,我们应该集中强调一个主要诉求以吸引用户的注意力。
(4)接受阶段。受众理解了广告传达的信息,并不表示他认可这些信息。广告领域有一句名言:“我知道有一半的广告预算浪费了。”实际情况还有可能更糟,如果表达的信息不适当,甚至有可能有三分之一的广告展示起到负面效果!在使用幽默、性感这样非常规的广告手段时,要特别注意这一点。
广告的上下文环境对广告的接受程度有着很大的影响,同一个广告出现在某游戏社区上和门户网站首页上,用户会倾向于认为后者更具说服力,这也就是优质媒体的品牌价值。在定向广告越来越普遍的今天,如何让合适的广告出现在合适的媒体上,即广告安全(ad safety)的问题,正在引起越来越多的关注。
(5)保持阶段。对于追求长期效果的品牌广告商,当然希望广告传达的信息给用户留下鲜明的记忆,以长时间影响他的选择。品牌广告商在创意设计上花了大量的精力提高这一阶段的效果。想想那些充满艺术性或浪漫气质的电视广告,就可以对此有直观的认识。
(6)决策阶段。成功广告的最终作用是带来用户的转化行为,虽然这一阶段已经离开了广告的业务范围,但好的广告还是能够为转化率的提高做好铺垫的。特别是对于电商或团购业务,在创意上强调哪些信息以打动那些价格敏感的消费者,是有相当学问的。
定性地说,越靠前的阶段,其效果对点击率的影响越大;而越靠后的阶段,其效果对转化率的影响越大。但是,以上各个阶段的划分绝非孤立和绝对的,而某一项具体的广告策略或技术,也往往会对几个阶段的效果同时发生影响。虽然有关广告有效性模型的讨论多见于传统广告的研究中,然而其规律也对在线广告特别是定向广告的产品方向有很强的指导作用。
从前面的讨论中,大家一定已经发现了不少在线广告不同于传统广告的特点,其中有一些特点对我们正确理解在线广告市场,探究合适的效果优化方案,有着重要的指导意义。
(1)技术和计算导向。数字媒体的特点使在线广告可以进行精细的受众定向,而技术又使得广告决策和交易朝着计算驱动的方向发展。实际上,受众定向这一思想在线下广告中也曾经被尝试过,比如,试图把信用卡纸质账单背面的广告按照信用卡用户的年龄和性别做一些定制化,不过由于非数字的媒体上这么做的成本太高,因而无法规模化。在数字媒体上进行受众定向,其成本可以控制得非常低,这直接催生了在线广告的计算革命。除了受众定向,由于在线广告存在着独特的竞价交易方式,因而广告效果精确的预估和优化能力尤为重要。
(2)效果的可衡量性。在线广告刚刚产生的时候,大家对它最多的称道之处是它可以以展示和点击的形式直接记录和优化广告效果。不过,点击率这一指标从是否在绝对意义上能够反映广告效果是值得探讨的。从1998年到今天,横幅展示广告的平均点击率从10%一路降低到0.1%,难道这说明广告的效果下降了两个数量级吗?快速增长的市场规模显然给出了否定的回答。我们认为,在不同的产品或时代中,点击率绝对值的比较并没有那么重要,而在一个特定时期不同广告和算法表现出来的差异,才是更有意义的。从这一点来看,可衡量性仍然可以认为是在线广告的一个重要特点。
(3)创意和投放方式的标准化。标准化的驱动力来自于受众定向与程序化交易。既然需求方关心的是人群而非广告位,创意尺寸的统一化与一些关键接口的标准化非常关键。这些接口标准中,比较典型的有视频广告的VAST标准[53]和实时竞价的OpenRTB标准[54]等。在PC广告市场,有越来越多的广告平台愿意根据这些标准来设计自己的产品,因为这样大家可以充分利用整个市场的流动性,更快地创造价值。不过,在移动时代,与内容表现一致的原生化需求比创意的标准化需求更加急迫。因此,移动时代的创意标准可能会有完全不同的思路。
(4)媒体概念的多样化。随着Web 2.0和移动互联的普及,赋予了更多交互功能的互联网媒体与线下媒体有了本质差别。根据功能的不同,这些媒体与转化行为的距离也不同。举个例子,对电商行业而言,门户网站、垂直网站、搜索引擎、电商网站、返利网,在转化链条上一个比一个更靠近购买行为。我们从直觉上就可以知道,越接近转化的媒体上的广告,其带来的流量就可以达到越高的ROI,同时离“引导潜在用户”这样的广告目的也就越远。因此,在从需求方看在线广告时,应该注重各种性质媒体的配合关系,并从整合营销的角度去审视和优化整体效果。试想,如果一家电商只用返利网作为线上广告渠道,ROI一定可以做到很高,可是这样的营销能给他带来大量潜在用户吗?[1]
(5)数据驱动的投放决策。与工业革命时期机器化的根本驱动力——电力相类比,互联网化的根本驱动力可以认为是数据的深入加工和利用。这一点在大数据概念被广泛认知的今天已经成为老生常谈。前面提到的在线广告的计算技术,在很大程度上也要依赖于对于数据的大规模利用。广泛收集用户的行为数据和广告反馈数据,利用云计算的基础设施对用户打上合适的标签,同样根据数据在多个广告竞争同一次展示时做出决策,再将投放的结果统计数据反馈给广告操作人员以调整投放策略,这已经成为在线广告的基本投放逻辑。因此,可以认为现代的在线广告系统就是一个大数据处理平台,而且其对数据处理的规模和响应速度的要求都相当高。可以说,从来没有任何传统广告形式像在线广告那样,需要大规模地收集并利用数据,而这正是在线广告最吸引人之处。
Andrei Broder在提出计算广告这一课题的同时,也给出了其核心研究挑战(注意是“核心挑战”而非“定义”)。对此,他的表述是“Find the best match between a given user in a given context and a suitable advertisement”[2]。我们结合近年来市场的发展以及实际业务中的一些体会,对此表述稍做加工,给出计算广告的核心问题如下:
计算广告的核心问题,是为一系列用户与上下文的组合找到最合适的广告投放策略以优化整体广告活动的利润。
与Andrei Broder的表述相比较,我们主要进行了两点调整:首先,强调广告问题优化的是一组展示上的效果,而非孤立的某一次展示上的效果。这是由于广告活动中普遍存在着量的约束,在这一约束下优化利润,其最优解往往与每次展示独立决策时有很大的不同;其次,描述中去掉了“given”的字眼,这是由于在某些广告产品中,系统并不一定能拿到确定的用户或上下文唯一标识,但这并不意味着无法进行计算优化。同样,我们也强调优化的结果是“广告投放策略”而不一定是具体的广告,这也是因为有些产品的策略并不是直接决定最后的展示。相信读完本书后面的部分,读者就能更深入地体会这些调整的原因。
上面的计算广告核心挑战可以用一个最优化问题来表达:
(2.1)
这里的i代表从第1次到第T次之间的某一次广告展示。我们优化的目标就是在这T次展示上的总收入(r)与总成本(q)的差,即总体的利润。对于某一个具体的广告主k,有时存在预算的限制,有时存在投放量的保证,这也是广告作为一项商业活动的关键特征之一,这构成了式(2.1)中的约束,即需求方约束。由于此约束的存在,广告系统的优化与底层技术较相似的搜索、推荐等有很大的不同。
当总体预算一定,即是一个常数时,很容易验证式(2.1)与另一个更常见的目标
也是一致的。进一步考虑收入与成本具体依赖的因素,上面的优化问题可以写成:
(2.2)
表达式中的a, u, c 这3个变量分别代表广告、用户与上下文,即广告活动的3个参与主体,显然,广告展示的收入或成本与这3个因素都有关。实际上,对除DSP以外的大多数广告产品来说,要么是自营或包断资源,要么按以收定支的方式与媒体分成,其成本也对应为常数或正比于收入,在这种情形下,成本部分可以从上面的优化公式中去掉。在约束中,每次约束产生的成本d除了与a, u, c有关,还与具体某个广告主k有关。
注意,这里有一个隐含的假设,即整体的收入或成本可以被分解到每次展示上。显然,这一假设并不合理,但是考虑到实际线上决策时,必须对每次展示马上完成计算,从实用角度出发我们仍然采用这一假设。在实际系统中,可以采用频次控制、点击反馈等方法来解决多次展示之间效果相关性的问题。
在具体的广告产品中,优化式(2.2)可能会省略掉一些内容或参数,而约束的具体形式也各有不同或者并不存在,这将构成该广告产品独特的优化问题。在后面谈到若干广告产品的关键技术时,我们会给出其具体形式。
我们再来看看对广告收入r的进一步分解,引出关于在线广告计费方式的重要分析。对一个广告市场中具体的产品形态,能够主动优化的往往是收入而非成本,因此,可以主要关注收入的优化。在一次广告展示产生后,有可能发生哪些后续行为呢?参见图2-3。当用户在媒体的广告位上看到广告以后,如果产生兴趣,首先产生的是点击行为,广告点击与广告展现的比率称为点击率(Click Through Rate,CTR);点击行为成功以后,将会打开广告主的落地页(landing page),落地页成功打开次数与点击次数的比例称为到达率,这是在广告主网站上发生的;如果用户从落地页开始,进一步完成下单等操作,则称为转化,转化次数与到达次数的比例称为转化率(Conversion Rate,CVR),这是在广告主网站上或线下发生的。按照媒体网站和广告主网站上的行为对收入r进行分解,是实践中比较合理且容易操作的方式:
(2.3)
后文都将沿用这样的符号表示:µ表示点击率,ν表示点击价值(click value),即单次点击为广告主带来的收益。前者描述的是发生在媒体上的行为,后者描述的是广告主站内的行为。而这两部分的乘积定量地表示了某次展示的eCPM[2]。请读者特别关注eCPM这个指标,因为它是计算广告中最常被提及,也是最关键的定量评估收益的指标,本书的计算问题大都是围绕它展开的。在对多个候选排序时,是根据eCPM还是CTR排序,也是区别广告产品和用户产品的重要策略特征。进一步,如果我们将所有的点击价值都等同起来,那么根据eCPM排序和根据CTR排序实际上将得到一样的结果。因此,可以认为根据CTR排序是根据eCPM排序的一种特例,这也使得将内容与广告统一排序的原生广告成为可能。
图2-3 在线广告产生效果的步骤
eCPM一般指的是估计的千次展示收益,它有两个很相近的概念:如果讨论的是千次展示收入,往往用RPM;如果讨论的是千次展示成本,往往用CPM。这3个术语有时在实用中的区别并不明显。
根据图2-3所示的流程,点击价值还可以进一步分解为到达率、转化率和客单价的乘积。由于这部分的深入解剖与行业密切相关,而且更多地属于站内运营而非广告的范畴,因此在本书中将只在15.2.3节中做简要的讨论。
对于大多数广告产品来说,需要计算给定(a, u, c)三元组的eCPM以进行决策。可是由于广告市场的协作关系复杂,并非每个广告产品都可以对eCPM分解后的两个变量(即µ和ν)做出合理的估计。根据eCPM的分解决定哪部分由谁来估计是广告市场各种计费模式产生的根本原因,也是广告市场中商业逻辑与产品架构衔接的关键一环。下面我们就来逐一分析一下市场上主要的几种广告计费模式。
(1)CPT(Cost per Time)结算。这是将某个广告位以独占式方式交给某广告主,并按独占的时间段收取费用的方式。严格来说,这是一种销售方式而非计费模式,因为价格是双方事先约定的,无须计量。这种方式主要适用于一些强曝光属性、有一定定制性的广告位。在一般的展示广告中,这种方式在欧美市场并非经常采用,但在中国的门户网站广告中,CPT仍然是一种主流模式。CPT这种独占式的售卖虽然有一些额外的品牌效果和橱窗效应产生,但是非常不利于受众定向和程序化交易的发展,因而长期看来比例会有下降的趋势。
(2)CPM(Cost per Mille)结算。即按照千次(mille)展示结算,这里的“mille”是拉丁文“千次”的意思。这种方式是供给方与需求方约定好千次展示的计费标准,至于这些展示是否能带来相应的收益,由需求方来估计和控制其中的风险。对于品牌广告,由于目标是较长时期内的回报,很难通过短期数据反馈直接计算点击价值,而点击率也因为对于用户接触的核心要求变得不是唯一重要的因素。在这种情况下,由需求方根据其市场策略与预算控制流量单价,并按CPM方式结算,是比较合理的交易模式。实际上,在大多数互联网品牌广告、特别是视频广告中,CPM都是主流的结算方式。
(3)CPC(Cost per Click)结算。即按点击结算。这种方式最早产生于搜索广告,并很快为多数效果类广告普遍采用。在CPC结算方式下,点击率的估计是由供给方(或者中间市场)完成的。点击价值的估计则由需求方完成,并通过出价的方式向市场通知自己的估价[3]。这样的分工对于以效果为目标的在线广告而言,有着清晰的合理性:供给方通过其收集的大量用户行为数据,可以相对准确地估计点击率;而转化效果是广告主站内的行为,当然他们自己的数据分析体系也就能更准确地对其做出评估。因此,以CPC方式结算,在效果类广告市场中具有接近垄断的地位。
(4)CPS(Cost per Sale)/CPA(Cost per Action)/ROI结算,即按照销售订单、转化行为或投入产出比来结算,这些都是按照转化付费的一些变种。这是一种比较极端的结算方式,即需求方只按照最后的转化收益来结算,从而在最大程度上规避了风险。在这种结算方式下,供给方或中间市场除了估计点击率,还要对点击价值做出估计,这样才能合理地决定流量分配。这里存在一个明显的问题:转化是用户在广告商站内的行为,并非供给方能够直接监测和控制,也无法进行准确的估计和优化。因此,只有那些转化流程和用户体验类似的广告商组成的广告平台,按转化付费才比较可行,典型的例子就是淘宝客广告(转化流程都发生在淘宝上)和移动应用下载广告(转化流程都发生在Apple Store或Google Play中);另外,由于DSP需要完全代表广告主利益,也会有跟广告主之间按照CPS计费的情形。总体而言,对于与广告主收益直接挂钩的需求方产品来说,CPS在一定条件下是可行的;但是对于普遍的中间广告市场来说,CPS并不是一种最合理的结算方式。
CPA结算的广告中有两种特殊的类型:一类是某些收集销售线索的直接效果广告,按照收集到的线索数结算,这称为CPL(Cost per Lead)方式;另一类是移动应用下载的直接效果广告,按照安装数结算,这称为CPI(Cost per Install)方式。
(5)oCPM(optimized CPM)结算。oCPM是Facebook主推的一种新结算方式,意思是广告平台仍然按照CPM结算费用,但会根据转化率进行优化。也就是说,虽然结算方式仍然是CPM,但是供给方会承担点击率和点击价值估计的任务。实践中,oCPM往往是向某个广告主提供CPA结算之前的一种过渡方式。对于新广告主,由于无法确定其转化率,直接采用CPA结算对平台来说风险较高,采用oCPM结算,可以鼓励广告主将自己的转化数据对接给广告平台,在积累到一定转化量,从数据上判断CPA结算可行以后,平台即向其开放CPA结算方式。通过这样的市场策略,Facebook利用CPA结算极大地降低了广告主的投放工作量,快速吸引了大量应用下载类广告主,而oCPM正是其中最关键的产品环节。另外,这种模式也可以更一般地推广到所有结算方式与优化目标不一致的场景,例如按CPC结算,却按照CPA优化的oCPC方式。
以上几种结算方式的概要对比如表2-1所示。综合起来看,可以认为,对于效果广告,CPC计费方式最有利于发挥供给方和需求方的长处,因而在市场上被广泛接受;而对于品牌广告,由于效果和目的有时不便于直接衡量,可以考虑按照CPM的方式计费;而CPS/CPA/ROI的计费方式,只在一些特定的环境下才比较合理。oCPM则是数据能力较强的广告平台向CPA方式的一种巧妙过渡。
表2-1 在线广告结算方式比较
结算方式 |
点击率估计 |
点击价值估计 |
优缺点 |
适用场景 |
---|---|---|---|---|
CPT |
需求方 |
需求方 |
可以充分发挥橱窗效应 |
高曝光的品牌广告 |
CPM |
需求方 |
需求方 |
可利用受众定向选择目标人群 |
有受众选择需求的品牌广告 |
CPC |
供给方 |
需求方 |
可以精细划分受众人群 |
竞价广告网络 |
CPS/CPA/ROI |
供给方 |
供给方 |
需求方无任何风险 |
效果类广告联盟 |
oCPM |
供给方 |
供给方 |
向CPA方式的稳健过渡 |
数据能力较强的广告平台 |
既然广告有计费需求,也就同时产生了第三方监测的需求。在CPM类品牌广告中,由于曝光在媒体上产生,广告主往往会委托第三方的广告监测公司对曝光量、点击量等指标作技术核实,并以此作为结算的依据。在CPC或CPS结算的广告交易中,由于计费的指标,即点击或转化,在广告主的网站上产生,所以并不需要特别的监测服务。因此,可以认为广告监测的主要服务对象是品牌广告主。随着CPM广告定向方式越来越复杂,广告监测也从简单的展示和点击计数到频次、人口属性等信息的验证和计量。另外,对于CPA类型的广告,实际执行中存在广告主故意扣量,从而低成本赚取大量品牌曝光的可能。因此,往往需要第三方的归因(attribution)监测工具来保证转化数和计费的公正。关于这方面的问题和技术,我们将在第16章中介绍。
由于供给方和需求方的博弈关系,需要一些行业协会来约束和规范市场,关注这些行业协会的立场与使命,对更清晰地认识广告的商业逻辑大有帮助。以最重要的北美市场为例,主要有以下3个行业协会需要了解。
交互广告局(Interactive Advertising Bureau,IAB)成立于20世纪末,是在线广告领域最重要的行业协会。IAB主要是站在供给方的长远利益上来研究和影响市场。换句话说,IAB主要关注的是在线广告供给方的利益。正如IAB在自己网站标题上声明的那样,这一组织存在的使命,是“dedicated to the growth of interactive advertising market”,即致力于交互广告市场的壮大。而这个方向的受益者,主要是各在线媒体与广告技术公司。因此,IAB的典型会员是Google、Facebook、Yahoo!、Microsoft这样的广告供给方,以及AudienceScience和MediaMath这样的广告技术公司。广告技术公司和产品的发展是为了更好地服务广告主和提升在线广告效果,以利于更多的预算进入在线广告领域。从具体工作上看,IAB与互联网大量媒体和广告平台合作,制定了一系列意义重大的标准和规范,这些都极大地促进了在线广告行业的健康发展。其中包括如下几个重要的规范。
(1)展示广告创意尺寸标准。根据2001年IAB公布的标准仅仅支持7种创意尺寸,即120 × 600(摩天大楼)、160 × 600(宽摩天大楼)、180 × 150(长方形)、300 × 250(中级长方形)、336 × 280(大长方形)、240 × 400(竖长方形)、250 × 250(正方形弹出)。创意尺寸的统一化,对于在线广告市场淡化广告位概念、推广受众定向有着非常根本的促进作用。中国市场与此对比,由于广告位尺寸非常复杂,因而各个网站之间的壁垒较高,非常不利于定向广告和程序采买的发展。
(2)视频广告标准VAST(digital video ad serving template)。由于视频广告创意和展示形式比较复杂,消耗资源也较多,IAB制定了一套统一的XML schema用于向在线视频媒体投放视频流内的广告,并对其用户进行相应的规范化的描述,这一标准实际上减少了进入视频广告领域的技术障碍,使得视频广告市场规模快速发展成为可能。
(3)通用实时竞价接口标准OpenRTB。实时竞价的技术我们将在第6章中介绍,简单来说,这种采买方式是为了方便需求方按照自己的受众划分高精准地采买流量。假设各个广告交易平台的实时竞价接口不同,则意味着需求方需要付出几倍的技术成本以完成广泛的市场对接。于是,IAB制定了统一的OpenRTB标准,将横幅广告、视频广告、移动广告情形下的实时竞价接口做了统一的规范。
美国广告代理协会(American Association of Advertising Agencies,简称4A)并不是一个专门从事互联网广告的组织,而是线上线下各种广告,特别是品牌广告的代理商在美国的行业协会。4A公司向其会员代理公司约定,至少要向广告主收取一定比例的服务费用,这一方面是为了避免行业内的恶性竞争,另一方面也是确保广告代理公司能够站在广告主的利益角度考虑问题,而后一点对于市场的长期健康发展是有很大帮助的。4A公司的典型代表有奥美(Ogilvy & Mather)、智威汤逊(JWT)、麦肯(McCann)等。值得注意的是,由于4A是一个美国协会,因此严格意义上的4A公司都是美国公司,不过对于另外一些国际影响力较强、业务方式和准则与其类似的非美国广告代理公司,我们也往往都将其归为广义4A公司的行列,典型的例子如日本的电通(Dentsu)公司。
美国国家广告商协会(Association of National Advertisers,ANA)是一个广告主的协会,也是最彻底地代表需求方利益的组织。其会员多是AT&T、宝洁(P&G)、NBA这些拥有大量广告预算的广告主。ANA对广告主利益的维护可以从一件小事中得到体现:在微软宣布考虑在IE10支持限制第三方cookie滥用的“do not track”(DNT)协议时,是ANA明确声明对这样的计划表示反对,因为这样将会使得在线广告市场精确投送广告的能力受到很大影响,而这显然是与广告主的利益相违背的。
[1] 2012年年底,淘宝发布声明,宣布中止与以现金形式返利的淘宝客网站的合作,正是反映了市场对此问题的认知正在趋向一致和理性。
[2] 由于CPM是千次展示的收益,因此eCPM实际上还要乘以1000才能与其相比较,为了表达简单,我们在本书中略去1000这一固定系数。
[3] 当然需求方不会完全按照其点击价值来出价,而是会寻求更低的价格以获得套利空间。因此,如何在市场机制上避免广告主积极地调整出价,以促进市场竞争的激烈程度,是竞价体系设计的关键。我们将在第5章中讨论这一问题。