流星小说网 > 其他小说 > 一本书读懂24种互联网思维 > 23大数据思维
    大数据思维带来三个革新:不是分析随机样本,而是分析全体数据;不是执迷于数据的精确性,而是执迷于数据的混杂性;知道“是什么”就够了,没必要知道“为什么”。

    数据就是资产

    金山董事长、小米创始人雷军在他的两会建议中提出希望“政府应充分认识大数据的重要性和战略地位,从整个国家的角度积极布局,引导大数据全面发展。在国家高等院校、科研机构建立大数据人才培养机制,国家资助或成立专项基金支持大数据关键技术研究”,呼吁政府重视大数据基础设施的建设。

    早在1980年,著名未来学家阿尔文?托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。

    最早提出大数据时代已经到来的机构是全球知名咨询公司麦肯锡。麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。麦肯锡的报告发布后,大数据迅速成为计算机行业争相传诵的热门概念。事实上,全球互联网巨头都已意识到大数据时代数据的重要意义。包括EMC、惠普、IBM、微软在内的全球IT巨头纷纷通过收购大数据相关厂商来实现技术整合,这足以看出它们对大数据的重视。

    不过,大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。

    大数据是当前市场炙手可热的话题,联合国、美国政府、法国政府等组织都对其给予了高度重视,美国奥巴马政府甚至将其上升至国家战略高度。2012年3月29日,美国政府宣布“大数据研究和发展倡议”来推进从大量的、复杂的数据集合中获取知识和洞见的能力。该倡议涉及联邦政府的6个部门。这些部门承诺投资总共超过2亿美元来大力推动和改善与大数据相关的收集、组织和分析工具及技术。此外,这份倡议中还透露了多项正在进行中的联邦政府各部门的大数据计划。

    在维克托?迈尔-舍恩伯格和肯尼斯?库克耶所著的《大数据时代:生活、工作与思维的大变革》一书中,大数据的概念得到了较为权威的辨析。所谓大数据,更接近于“全数据”。与传统分析抽样的、部分的数据的方法不同,大数据分析近乎总体的、所有的数据。

    大数据具有规模大(Volume)、速度快(Velocity)、类型多(Variety)和价值大(Value)的4V特征,其不仅是适应时代发展的技术产物,更是一种全新的思维理念,即基于数据资产的商业经营模式。

    对所谓大数据最直白的理解是海量数据,通常用来形容一个公司创造的大量非结构化和半结构化数据。

    一项调查发现,九成企业的数据量在迅速上涨,其中16%企业的数据量每年增长一半甚至更多。调研机构IDC在2011年6月的报告显示,全球数据量在2011年已达到1.8ZB,在过去5年里增加了5倍。1.8ZB是什么样的概念呢?如果把所有这些数据都刻录存入普通DVD光盘里,光盘的高度将等同于从地球到月球的一个半来回也就是大约72万英里。相当于每位美国人每分钟写3条推特微博,而且还要不停地写2.6976万年,IDC预测全球数据量大约每两年翻一番,2015年全球数据量将达到近8ZB,到2020年,全球将达到35ZB。

    2013年,国外著名的社交网站Facebook预计将实现60亿美元的收益,而创造这么多收益的Facebook居然没有向用户收取一分钱。

    Facebook的价值正是数以亿计的用户在使用过程中不知不觉积累的大数据形成的。通过分析用户的喜好、身份资料、个人信息和浏览习惯,Facebook就能够猜测到每个用户的喜好,比如,你最容易被哪类广告吸引,每个网站页面都有一个“喜好”按钮,哪怕你从来不摁,你的信息也会被反馈给Facebook。

    随着互联网技术的不断发展,数据本身就是资产,这一点在业界已经形成共识。马化腾说,数据成为资源。大家现在谈大数据和云计算非常多,因为我们连接多了,传感器很多,服务很多,像搜索引擎、电子商务,社交网络,都聚合了大量的数据,这些数据成为了企业竞争力和社会发展的重要资源。

    电商现在非常热,为什么电商可以转向金融,借助用户和商家的信用提供信贷,都是大数据在背后起作用。

    我们想象,人的社交属性是不是可以成为一个信用排序和算法迭代的思路呢?以后可能会出现一个“人品排名”,拼人品就出来了。你交的朋友人品比较好,你的“人品排名”就高。如果你的人品不好,你的朋友就不会跟你交友。这是我们的设想,是一个前瞻性的研究,我们希望能够做出一些成绩。

    任正非说,未来的3

    ~5年是华为抓住“大数据”机遇、抢占战略制高点的关键时期。要抢占大数据的战略制高点,占住这个制高点,别人将来想攻下来就难了,我们也就有明天。大家知道这个数据流量有多恐怖啊,现在图像要从1k走向2k,从2k走向4k,走向高清,小孩拿着手机啪啦啪啦照,不删减,就发送到数据中心,你看这个流量的增加哪是你想象的几何级数啊,是超几何级数的增长,这不是平方关系,而是立方、四次方关系的增长的流量。这样管道要增粗,数据中心要增大,这就是我们的战略机会点,我们一定要拼抢这种战略机会点,所以我们不能平均使用力量,组织改革要解决这个问题,要聚焦力量,要提升作战部队的作战能力。

    塔吉特的“读心术”

    有了“数据资产”,就要通过“分析”来挖掘“资产”的价值,然后“变现”为用户价值、股东价值甚至社会价值。

    塔吉特百货是美国的第二大超市。一天,一名男子闯入塔吉特的店铺,他怒吼道:“你们怎么能这样!竟然给我的女儿发婴儿尿片和童车的优惠券,她才17岁啊!”这家全美第二大的零售商,居然会搞出如此大的乌龙?店铺经理觉得肯定是中间某个环节搞错了,于是立刻向来者道歉,并极力解释说:“那肯定是个误会。”然而,这位经理不知道,公司正在运行一套数据预测系统,男子的女儿会收到这样的优惠券,是一系列数据分析的结果。一个月后,那位父亲非常沮丧地打来电话道歉,因为塔吉特的广告并没有发错,他发现他女儿的确怀孕了。

    在这名男子自己都还没有发觉的时候,塔吉特居然就已经知道他女儿怀孕了,为什么呢?难道塔吉特有神奇的读心术么?当然不是。这件事看起来非常不可思议,但背后是有规律可循。

    原来,孕妇对于零售商来说是一个含金量很高的顾客群体,商家都希望尽早发现怀孕的女性,并掌控她们的消费。塔吉特的统计师们通过对孕妇的消费习惯进行一次次的测试和数据分析得出一些非常有用的结论:孕妇在怀孕头3个月过后会购买大量无味的润肤露;有时在头20周,孕妇会补充如钙、镁、锌等营养素;许多顾客都会购买肥皂和棉球,但当有人除了购买洗手液和毛巾以外,还突然开始大量采购无味肥皂和特大包装的棉球时,说明她们的预产期要来了。在塔吉特的数据库资料里,统计师们根据顾客内在需求数据,精准地选出其中的25种商品,对这25种商品进行同步分析,基本上可以判断出哪些顾客是孕妇,甚至还可以进一步估算出她们的预产期,在

    最恰当的时候给她们寄去最符合她们需要的优惠券,满足她们最实际的需求。这就是塔吉特能够清楚地知道顾客预产期的原因。

    塔吉特根据自己的数据分析结果,制订了全新的广告营销方案,而它的孕期用品销售呈现了爆炸式的增长。塔吉特将这项分析技术向其他各种细分客户群推广,取得了非常好的效果,从2002年到2010年,其销售额从440亿美元增长到670亿美元。这家成立于1961年的零售商能有今天的成功,数据分析功不可没。

    那么,塔吉特是怎么收集数据的呢?塔吉特会尽可能地给每位顾客一个编号。无论顾客是刷信用卡、使用优惠券、填写调查问卷,还是邮寄退货单、打客服电话、开启广告邮件、访问官网……所有这一切行为都会记录进顾客的编号。这个编号会对号入座地记录下顾客的人口统计信息:年龄、婚姻状况、子女、住址、住址离塔吉特的车程、薪水、最近是否搬过家、信用卡情况、常访问的网址,等等。塔吉特还可以从其他相关机构那里购买顾客的其他信息,如种族、就业史、喜欢读的杂志、破产记录、婚姻史、购房记录、求学记录、阅读习惯,等等。这些看似凌乱的数据信息,在塔吉特的数据分析师手里,将转换出巨大的能量。

    塔吉特是如何分析数据的呢?塔吉特并不知道孕妇开始怀孕的时间,但是,它利用相关模型找到了她们的购物规律,并以此判断某位女士可能怀孕了。这个案例揭示了企业对于数据应用的一个新阶段。企业不仅利用商品的相关性促销,进而利用事物的相关性预测消费者的消费活动。这种预测是利用事物相关性来发现事情的变化规律的。

    大数据时代带给我们的是一种全新的“思维方式”,思维方式的改变在下一代成为社会生产中流砥柱的时候就会带来产业的颠覆性变革!分析全面的数据而非随机抽样;重视数据的复杂性,弱化精确性;关注数据的相关性,而非因果关系。

    沃尔玛的数据挖掘

    20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

    在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就

    会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。

    由此,沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入。

    数据挖掘(DataMining,DM)是目前人工智能和数据库领域研究的热点问题,它伴随着大数据的神话而崛起。所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。

    有一天,LinkedIn忽然发现来自雷曼兄弟的来访者多了起来,但是并没有深究原因。第二天,雷曼兄弟就宣布倒闭了。原因何在?雷曼兄弟的人到LinkedIn找工作来了。谷歌宣布退出中国的前一个月,有人在LinkedIn上发现了一些平时很少见的谷歌产品经理在线,这也是相同的道理。

    国内许多互联网公司拿着“鱼翅当萝卜”。基于数据挖掘的营销才能带来利益。坐拥金山而不懂得使用,金山与土丘无异。

    美国电视剧《纸牌屋》的制作就是利用大数据分析进行生产的典型例子。其制作方Netflix每天都会对其海量用户的行为数据进行分析。通过分析,Netflix知道其用户喜欢哪个导演,喜欢哪个演员,偏好搜索什么类型的内容,把三者结合,就产生了一炮而红的《纸牌屋》。

    大数据分析的核心目的就是“预测”,在海量数据的基础上,通过“机器学习”相关的各种技术和数学建模来预测事情发生的可能性并采取相应措施。预测股价、预测机票价格、预测流感等等。

    你的用户不是一类人,而是每个人

    随着科技发展和生活方式的转变,生活中无时无刻不在产生数据,而这些数据的价值需要科学的挖掘和研究。数据本身不会创造价值,只有充分发现和合理利用这些数据才能让其改变营销,改变生活!

    2012年,可口可乐在澳洲推出了名为“ShareACoke”的宣传活动,可口可乐统计了“Amy”“Kate”等澳洲最常见的150个名字,并把这些名字印在了可乐瓶、罐上。活动受到了年轻人的热烈欢迎,很多人都会去购买包装上印有自己

    或朋友名字的可口可乐。

    2013年,可口可乐考虑在中国也举办一次类似的活动,最终,可口可乐在中国发起了“昵称瓶活动”。

    可口可乐通过大数据分析发现,可口可乐的目标消费人群对于昵称使用很频繁。这些昵称有一些只在网络上盛行,还有一些则连传统媒体上也时不时可以看到。而且,这些昵称被年轻人使用的频率非常高,不只是网络上,就连在日常生活对话中也经常使用,例如,年轻人不讲猫、狗,而是讲喵星人和汪星人,对自己则自称为“蓝星人”或“愚蠢的人类”。这就是一种网络文化的延伸。

    那么,可口可乐的昵称瓶上的那么多昵称都是怎么选择的呢?可口可乐的相关负责人做了这样的回答:“我们对这个概念进行了本地化处理,把大家在社会化媒体上使用最多、最耳熟能详的热门关键词印上了瓶。至于抓取和分析这部分,选择了与精硕科技公司(AdMaster)合作,利用精硕科技社会化媒体聆听系统抓取网络社交平台上过亿热词大数据的捕捉,把网民使用频度最高热词抽取出来,然后通过三重标准,即声量、互动性以及发帖率的删选,最终确认300个积极向上且符合可口可乐品牌形象的特色关键词。”

    在可口可乐这次营销活动中,收集海量社交媒体数据并提炼出“昵称瓶活动”固然是神来之笔,但数据在此次活动中的表现远不止如此。

    考虑到这次活动鲜明的社会化特点,如何在话题刚开始时就和消费者互动起来成了一个至关重要的问题。如果完全依赖广告公司进行人工搜索再进行互动,这样时效性会很低,广告公司的多人协作以及后续沟通也会变得非常困难。为此,AdMaster为可口可乐建立了一套完整的系统社会化媒体聆听系统,通过实时数据挖掘第一时间告知广告公司,哪些名单需要互动了,并将互动记录保留下来供后续沟通使用。

    你可能会买到一瓶贴上“有为青年”标签的可口可乐回来。而“宅男”“文艺青年”“天然呆”“氧气美女”“邻家女孩”“高富帅”“型男”“纯爷们”“粉丝”“闺蜜”“技术男”“积极分子”“表情帝”“小清新”等60多个热门昵称也出现在了消费者的视野中。

    采用这些昵称后,可口可乐与消费者拉近了距离。从销售结果来看,成绩非常不错,2013年6月初,昵称装可口可乐在中国的销量较去年同期实现了两位数的增长。可口可乐的营销,把接地气、接近年轻人的文化体现在瓶子上,可以表达年轻人的一种态度,也让年轻

    人更认同可口可乐这个品牌。

    中欧商业评论的潘东燕先生分析说:“可口可乐,其成功的根本在于充分挖掘了这个时代目标消费者的想法、感受,并将品牌理念与之建立联结,在社会化媒体时代,大胆地讲述了一个‘昵称瓶’的好故事,这个故事既体现了可口可乐的品牌理念,又接地气地契合了当下消费者的消费心理,使消费者发自内心地参与分享与传播,通过故事实现品牌理念与消费者的深度交融。”

    大悦城的大数据营销

    2011年,北京朝阳大悦城销售额突破10亿元。对于地处非核心商圈的大悦城来说,这个成绩已经是相当不错的了。大悦城成功的因素可能不少,而它们的数据团队是绝对不能忽视的一个重要因素。

    大悦城数据团队的主要任务是不断实验并以数据为驱动打造一个全新购物的中心。在数据部员工招聘中,有一次的考试题目是“分析米兰时装周流行趋势”。而其中最有特色的回答来自一个技术宅男。这个技术宅男自己编写了一个关键字搜索器,对所有网上搜到的时装周图片说明进行关键字抓取,然后排序……最后将一份图文并茂、用数据说话的流行趋势报告摆在了主考官的桌上,最后成功入选。

    这个数据团队干了些什么事呢?在大悦城的某处有一根柱子,数据团队在分析客流量的时候发现,很多消费者走到这儿后很容易因为视线被遮挡的缘故忽视了柱子后面的商铺,直接往左或者往右去了。于是大悦城在柱子的位置弄了个洞,消费者走到这里时,会对这个洞感到奇怪,于是就会进去看看,这样也就引导了消费。此外,团队还对电梯进行了调整。朝阳大悦城有12层,整个项目里面各种电梯有上百部,怎样利用电梯把客流输送到重点商铺,去提升整个项目的销售是个问题。经过数据分析后,数据团队取消了在南部和北部的两部电梯,以免破坏整个顾客流动线,对租金测算以后,再把这两边共计400平方米的面积进行出租,既多了两家商铺的租金收入,又提升了整个项目的销售情况。

    日常数据分析是这个数据团队每天必做的功课。对朝阳大悦城来说,车流的变化对销售有非常重要的意义,车流增长快就说明今天客流量的增长会比较快,销售也会联动上涨;再比如今天是大风天气,根据经验,销售可能会下降2%,而且集中在零售业,那么,大悦城会马上组织“限时抢购”之类的针对性营销策略。2011年的一天,朝阳大悦城的销售量和客流量突然出现了一个小的高峰,经过种种数据测算和比对,在排除节

    假日、推广促销等因素后,造成销售额增长的竟然是当天是“世纪对称节”——2011年11月02日。这个很多成熟人士可能不屑一顾的“脑残”节日,却受到不少年轻人的热烈追捧。受“对称节”销售小高潮的启发,大悦城开始为每年的各种稀奇古怪的节日提前做促销和推广的准备,比如对号称2012年最值得期待的“金星凌日”天象,大悦城就推出了相关的天文主题活动。如果不是通过数据分析,很难猜测到销售额产生异动的真正原因,推广部门也会错失一系列的活动主题。

    而数据和推广最漂亮的一次配合是2011年的圣诞平安夜。根据2010年的历史数据,数据团队推算出2011年圣诞平安夜的当天销售额应该在800万元。而上午的10~12点、下午2~4点是客流的低谷期,如果能提高这两个时段的客流和销售额,将对全天的销售额起到带动效果。这两个时段主要是家长带孩子来逛,所以推广部门向家长们推送“买1000返100”的最大幅度优惠。到了晚上9点到12点,平安夜的重头戏浪漫情侣档上演,这时候推送的信息变成时尚品牌折上折的“疯狂三小时”。由于针对全天的不同时段进行差异化营销,2011年的平安夜,朝阳大悦城的销售额超过1000万元人民币,远远超过同行业的增长率。

    大悦城的数据团队和推广部门的这次合作,是一次漂亮的大数据营销。现在,很多企业都在做着类似的事情,它们开设网站、论坛,注册新浪微博企业号、落户微信公众平台,通过各种方式与消费者联系互动,维持已有粉丝的情感联系并增加新的粉丝。它们利用大数据分析,找到它们的消费者的典型特征,根据消费者关注的话题来确定主题并策划活动,都取得了不错的效果。

    云计算是新一代服务工具

    2007年夏天,27岁的谷歌工程师克里斯托夫?比希利亚将一份云计划的报告摆在总裁施密特的案头上,9个月前发端于教育领域的Google101项目,已发展成为一个战略级计划——云计划。施密特敏锐地意识到,这项计划将创造一个重构世界的机会,开放、免费和随时随地将成为这个新世界的主要特征。

    随后的4年发展,证明了施密特的敏锐。云计算果然开始在全球各地、各行业一朵朵地浮起,虽然分散,但足以引起注意。

    2010年,贝佐斯在亚马逊股东大会上大谈特谈云计算,他认为“云计算有潜力发展到和我们的零售业务一样大。亚马逊已经比行业里大部分竞争对手都做得更

    好了。云计算是一个很大的领域,从我们的观点看,它的效率是非常低的。任何时候,一些大的事情效率低下时都会创造出机会。

    起初只是一家图书零售商,靠着为客户提供种类齐全的图书以及快速的物流,Amazon很快流行起来。亚马逊利用算法向我们推销同类用户购买的产品,很快亚马逊便主宰了电子商务领域。如今预测分析扮演了关键性角色,亚马逊将以前所未有的方式使用客户数据,实现一种叫作“预测发货

    的销售方式。最终将实现在客户未作出购买决定前,Amazon已经准确地选择货物并发送给客户,分析客户的个人行为使这一切成为可能。

    对亚马逊(Amazon)而言,数据技术的应用更是为其成为一家“信息公司

    ,独占电商领域鳌头奠定了稳定的基础。为了更深入地了解每一个用户,亚马逊不仅从每个用户的购买行为中获得信息,还将每个用户在其网站上的所有行为都记录下来:每个页面的停留时间,用户是否查看Review,每个搜索的关键词,每个浏览的商品等等,在亚马逊去年11月推出的KindleFire中,内嵌的Silk浏览器更是可以将用户的行为数据一一记录下来。这些数据的有效分析使得亚马逊对于客户的购买行为和喜好有了全方位的了解,对于其货品种类、库存、仓储、物流、及广告业务上都有着极大的效益回馈。

    这波随互联网席卷而来的云变革巨浪,正在挑战甚至颠覆企业的传统运作。在PC唱主角的时代,计算能力只分布在每台独立的电脑上。彼时,电脑的性能成为用户最关注的因素。然而,随着云计算时代的到来,计算全交由云服务器处理,用户只需一台可以上网的终端设备。此时,诸如单核还是多核、CPU还是GPU(GraphicProcessingUnit图形处理芯片)这样的问题,都已不再重要。用户将更多的注意力放在能够得到什么服务,以及这些服务是否能满足自身需求上。

    这也意味着,“以设备为中心

    的时代已经一去不复返了,人类已经进入“以服务为中心

    ?)

    的时代。IBM中国开发中心首席技术官毛新生称,可以浅显地把云计算理解为新一代服务经济的基础设施和工具,它带来一种全新的生产力,带领我们迈向全新的服务经济时代。!