414数据挖掘会议简报(1)

caoz 整理

会议时间:2001年4月14日
会议地点:LWA中国公司会议室

前言:

这次参与研讨会的人非常少,只有7个人,这本身就说明作为主持人,我的吸引关注的策略并不成功,通过网上论坛组织主题沙龙也算是一种广告行销的案例,就此的总结如下:

第一,话题有些“阳春白雪”,对于一些以交朋友,找关系为目标的圈内人士而言,研讨会意义不大,导致参与者骤减。

第二,未采取有效主动联系手段,导致部分有兴趣的潜在受众无法与会议主持方进行实质联系,造成新受众发展的制约。

第三,没有采用名人效应,比如没有吕勇,小马哥这种“人气”人物的参与,虽然风流倜傥的henry得以莅临讨论现场,但是在事先并不知道,没有把他的名头打出来,损失了不少MM目光。

第四,时间不合理,加班工作和有事情的朋友特别多,好像现在周六加班成为风气了。

第五,缺乏物质激励手段,没有腾讯那样好玩的小企鹅和抽奖活动。

当然尽管如此,但是有一点值得庆幸的是与会者的专业程度和行业背景,除本人外都相当深厚,话题深入程度和与会者各自的经典案例分析都让我不枉此行。换言之失去了数量却保证了会议质量,这一点还是略感欣慰的。

结论1:数据采集和挖掘目前的应用意义

数据采集和挖掘宏观上都是提升网络行销的品质和效果,细分的意义主要有两方面,一种是通过数据整理和挖掘进行行销和广告的行为导向,另外一种是进行行为的总结,当然行为的总结是为未来的网络广告和行销行为做导向,所以还是从属于一个主体方向的。

行为导向的数据采集和挖掘再分为两种,一种是通过对用户数据的掌握进行行为导向,比如知道谁是IT人士,那么针对这个行业的专业行销就可以定向为这个人进行广告的投放和1 to 1 的e-marketing联系接洽。通过用户数据对行为做导向需要掌握用户数据库,目前虽然说网易,新浪,腾讯以及诸多电子邮局等等都拥有海量的用户数据库,但是真正有价值,可信度的用户数据库并不多,这里大家认可的是作为电子商务网站,如my8848,卓越等等的用户数据的真实性还是相当可靠的,这方面的数据挖掘工作也开始有一些准备了。

行为导向还有一种数据分析方式是关联性分析,也就是不需要了解用户数据的情况下,对用户网上行为习惯,浏览习惯的跟踪获取用户的购买兴趣,并作为广告投放的标准,目前doubleclick,allyes等等相当多广告投放系统在这方面都进行了挖掘,小马哥应该出来讲讲案例就好了。

其实关联性分析在传统领域也很普及,比如超市发现购买可乐的人通常喜欢再买一包薯片,那么他们就把可乐和薯片放在接近的位置以便于用户购买并增加销售。作为电子商务网站,关联性数据挖掘也有具体案例,比如amazon很早就有书籍购买的关联分析,买了一本某书籍的人通常会买的其他的书籍会做连接到这个书籍的购买页面上,在国内,金山卓越的购买程序也做了这样一个功能。(我记得最清楚的他们网站上列举了购买了小朋友满舟那本垃圾的网络安全书籍的人通常又购买了一些和IT毫无关系的消遣书籍,由此可以看到满舟的水平究竟能够糊住什么行业的人士,当时觉得很有趣,这次发现也是关联数据分析的一个案例)。在没有用户数据库的情况下,关联分析的工作就成为数据挖掘和定向投放的重要基础,但是这里面涉及的最大的问题是,用户浏览行为的跟踪和收集本身还不是特别困难的事情,但是进行关联分析并得出有效结论的数学模型目前对于中国的相关技术人而言还十分陌生;如金山卓越这种分析相对简单,但是更大规模和更多尺度的关联分析的做法应该说还是需要不少传统咨询经验和相关背景的支持。

行为总结的数据采集和挖掘也分两种,一种是线上用户浏览行为的总结,一种是线上注意力转化为线下行为的总结。

作为前者,目前国外一些开放中介广告公司提供第三方的深入行为监测和开放式反向选择的广告代理业务,并且由于CPS广告形式的特性,业务逐步发展中。另外如webtrendslive,和微软的bcentral都提供公正和可信度高的第三方行为检测(不仅仅是流量检测)。但是国内的第三方检测提供商就显得相当不够,CNNIC没有深入跟踪分析能力,易数丢失数据严重,而且没有信誉,其他的更加不用说。

线上浏览行为的总结对于线上消费作为主要回报的网站和广告而言是投入回报分析最重要的数据来源,比如电子商务网站访客的兴趣集聚性的总结,消费转化率的总结,持续消费力的总结以及不同广告所带去客户转化率区分的总结,在线上消费成为消费主体构成部分的时候,这些数据就将成为网络广告核心的回报分析体系的构成部分,当然由于这些数据不完全取决于广告载体,也不完全取决于线上消费网站的建设,因此这些数据就目前而言仅仅具有参考价值,并不具有独立完成效果评测的价值。

线上注意力转化为线下行为和线下品牌影响力是最难测定的,但是也是目前最有前景的,因为如果希望说服那些不具备在线营销平台的传统企业,特比是在线消费整体市场空间极为有限的前提下,做线上注意力线下消费转化的测量和评估就显得特别有意义了。

这里面在西方国家有很多不错的案例,谈到这个话题后我突然意识到以前忽视的一些东西,在国外一些开放广告中介中有不少广告主是做记帐卡,消费卡和信用卡的,第一,这种在线售卡,因为卡具有直接消费特性,并有严格认证体系,(一般是社会保险号码)因此用户数据库十分完整和清晰,这些用户数据库本身就具有数据库营销的基础。第二这些卡在线下的消费将直接记录,并能够和持有人个性信息完整结合。(不同于无法形成完整消费循环流程elong卡形式),因此对线下消费的统计和核算,对个性消费习惯的跟踪和定向的营销过程就具备相当的基础。正好这次聚会结束后晚上发回来看中央二台商务电视的盈家节目,恰好一个国内的创业者就是从这个环节上动了脑筋。虽然网上利用某种卡的形式和网下结合的手段已经被不少公司采用,但是能够完整跟踪线下消费并能完整获取个性资料以精确结合的在国内目前还没有谁能够做到,这是一个十分值得关注的方向。

结论2:中国目前数据挖掘和分析所面临的问题

目前大家的共识是,就数据的挖掘和深入分析的能力和手段而言,中国和美国有十分明显的差距,如果把所有问题归结于广告主和广告人的弱智是不公平的,毕竟在中国整个行业共同面临的很多问题是美国没有的。

第一个问题是需求不畅,销售空间不够,数据挖掘和检测的成本成为主要瓶颈。

举例而言,腾讯的马化腾绝对不会比我傻,我看到了他的数据利用度太低,很多人都看到了,他不可能看不到,但是看到了也很难做到充分挖掘,这个问题在哪里呢?

从深度挖掘而言,他们需要负担相当的成本,第一是获取客户真实资料的成本,这一点上次腾讯研讨会总结我提到了,腾讯市场部赵庆和我说,他们已经意识到了这个问题,期望通过某种让利回馈手段,包括抽奖以及其他手段获取用户的真实资料。获取真实客户资料需要成本投入已经是一个行业共识,通过免费服务获取的资料一般而言不具备可信度是已经被证明了的。第二是数据检测和行为导向的成本,我上次也提到了,把数据检测的技术难度什么的给一些广告公司解释殊无必要,对方也不感兴趣,直接折算成检测成本很简单,第三方检测的价格早就是基本透明的了,腾讯的广告报价按照流量折算下来比检测成本和精确导向投递的成本都要低,就这一点而言怎么做第三方检测和精确定向?第三是深入的行为跟踪分析的成本,腾讯浏览器有一个“谁与我同在”的项目,其实可以看作是一个访客行为跟踪的模块,我们可以把使用腾讯浏览器的客户群当作一个网上访客的样本,这个样本的容量相当惊人,比netvalue那5000个点的采样数量上多的太多了,当然这个样本本身具有偏差,但是由于所有采样方式都不能避免偏差,这种采样对于部分数据挖掘工作是有意义的,但是腾讯也没有做,这也是存在成本问题。

有成本问题就有回报问题,腾讯付出这些成本,最直接的想法就是能够提高单位点击的质量,提高腾讯广告品位,可是这又面临一个大问题是我以前忽视的,腾讯是目前国内举足轻重的网络广告载体,他提升了质量,提升了单价都很好,但是并不是说他提升了质量就能够用更高的价格卖出去!换句话说市场需求没有的达到这种程度,付出了成本而得不到回报,马化腾是不会犯这个傻的。

 

 回目录│  <<<上一页下一页>>>

版权所有:网络营销论坛