数据在市场营销中的作用越来越重要,至少BAT、Facebook、Google试图让你相信这点。单从营销领域而言,可以按照数据组织的主体,将数据产品划分成三类:
以人为数据的主体与核心:典型的如DMP,Data Management Platform;BAT和数字营销代理公司都提供DMP。
以用户行为数据为主体与核心:典型是Web Analytics WA工具,如Google Analytics、Omniture;在移动端,提供App内行为监测的工具也是此类,如Talkingdata、友盟等都提供App内行为监测数据,指标包括留存率、留存时间、渠道来源等。
以品牌/品类/产品为核心:典型的如Social Listening工具,他们根据预设的关键词,定向爬取互联网上公开的内容,然后进行分析。百度指数也是该类型的工具。
典型的DMP提供3种功能:人群提取、人群洞察与人群拓展。
人群提取是指在DMP中创建一个人群包,数据来源可以是广告主自己上传的消费者手机号码、设备号、IDFA、MAC地址等能映射到唯一一个消费者的识别码。当然,现在很多DMP是跟程序化广告投放端打通的,客户投放的广告的曝光、点击互动人群也可以通过DMP进行提取。此外,通过布置pixel、JS代码、添加SDK或者通过API回传官方、App内访问、浏览、点击、付费等用户,这些用户ID也可以形成一个个人群包。人群包的本质是多个人群ID。
此外,部分DMP还提供人群包之间交并差计算功能。例如A人群包的定义是官网到访人群,B人群包定义是官网购买人群。假设B是A的子集,我们想提取到访但是没有购买转化的人群,也可以利用DMP把B包包含的ID从A包ID中排除出去。
人群洞察则是利用DMP提供的标签化的数据,帮助广告主分析某个人群包的特征。典型的DMP会提供性别、年龄、地域、兴趣、App安装等维度数据,简而言之为基本属性+兴趣爱好。基本结构可以抽象成如下图的格式:最终DMP统计一下在给定的人群包中,多少的比例被打上了Tag1、多少的比例被打上了Tag2。当然,在广告投放的业务环境中,每个ID被打上标签,并不是这里简单的0或者1的关系,而是一个分布在[0, 1]的得分。这个得分反映的是该ID在这个标签下的行为强度和时间新鲜度。举例而言,一个人最近频繁打开携程、飞猪、蚂蜂窝,相比另外一个人1个月前只打开过1次携程,其在“旅游”这个标签上的分值显然更高。
人群拓展则是一个黑箱的功能。在广告投放业务场景中,显然每一个广告主都希望触达新客群体,除了利用投放端提供的人群标签进行定向之外,利用第一方购买人群做人群拓展,则是另一个重要的定向方式,这个功能被称为lookalike。lookalike会找到跟第一方人群相似性最高的人群,所谓相似性,则是基于用户的属性和行为来计算的,如地域、年龄和性别分布,以及使用手机的系统、安装的App等等,多大几百万个维度。lookalike的基本假设是:对于一个品牌的偏好和产品使用,人群有典型特征。比如,购买奔驰的人群,收入在中高端,这个时候lookalike是有效果的。相反,对于一些大众的产品或者品牌,lookalike并不一定能带来预期的广告效果就是这个道理。
与DMP以人为Key组织数据和操作逻辑不通,WA工具则更关注人的行为本身。这是现在Google Analytics提供的5个模块。除了第一个查看当前实时数据之外,Audience跟DMP类似,提供访客人群的兴趣、地域、手机操作系统等静态数据,也能帮助广告主进行LTV、cohort分析。Acquisition模块关注的是人群来源,Behavior则注重用户站内浏览行为,如浏览的时长、退出率、二跳率等。Conversions则关注用户在站内的浏览路径与转化行为。
Social Listening,有时候又被称为社交聆听、社交舆情监测,是对互联网内容(当前主要是对文本内容)进行监测和分析的方式。原理本身很简单,监测系统通过爬虫或者API接口获取文本内容,通过扫描文本内容里是否含有预设好的关键词,如果有则记录和分析。比如,各大汽车厂商都会不断扫描汽车之家、易车网上是否有针对自己品牌的讨论。分析的维度,无外乎声量(提及次数)、情感度(正负面)和讨论话题(基于词共现)。我把百度指数也放在这个分类下面,因为这个分类关注的是内容本身,它跟人的属性、行为无关(虽然它是由用户或者媒体产生的行为)。
Social Listening的典型应用是监测负面,特别是在社交媒体环境下,一个危机往往由一个小话题引爆。此外,通过Social Listening了解消费者对品牌评价、产品使用心得,也是现在正在探索的一个方向。然而,当前自然语言处理技术还不能很好“理解”文本内容,要进行更加细致的分析,需要大量人工介入。