西墙网: 电商创新&创业

最新电商领域会议、活动、沙龙信息

在中国:大数据的前世今生及未来

首页 论坛 国内电商创业&创新资讯 在中国:大数据的前世今生及未来

正在查看 0 条回复
  • 作者
    帖子
    • #1270
      西墙网
      管理员

      首先我们看看大数据的概念。2008 年《Nature》先提出Big Data 的概念,后来主要由IBM 和麦肯锡把大数据概念做起来。

      大数据通俗的讲是四个V:数据的总量很大;数据具有多样性;数据是高速产生的又需要高速处理的;数据本身有潜在的价值,但价值比较分散。

      大数据和云计算结合起来,有可能会带来我们在信息产业中的第三次高峰,第一次是信息高速公路,第二次是互联网的话,第三次其实就是我们讲的数据加计算。站在国家战略层面上讲,我们希望大数据和云计算加在一起能够成为第三次工业革命,因为它会带来新的能源、材料,以及新的加工工艺。

      今天主要给大家讲一些商业方面的东西。总体来说,我们认为大数据是一个基于多元异构、跨领域关联的这种数据运用,通过深入和分析产生的运用,它会带来我们生活各个方面的变化,这是一个理念的变化,也是未来所有的新型企业甚至包括新型政府和国家的一个核心战略。如果大数据是一个时代就像互联网化一样,它是能够影响和摧毁一切的时代。我相信每一个企业都需要做好这方面准备。

      商业模式的变革

      下面回到商业模式的变革,因为我们自己做了十几家企业,所以体会到大数据持有中整个商业模式会有什么变化。

      大数据商业模式的变化不是一蹴而就的,本质上是原来的商务智能的一个延展。商务智能的报表数据实际上是一个结构化数据,一般的商务智能是从结构化数据,输入是结构化数据,输出也是结构化数据,中间也非常简单,比如线类回归,决策树等等。大数据1.0 的创新实际上是商务智能的延展,它的逻辑是一致的,都是自身的业务上产生大量的数据。利用更深入的分析方法,分析这个数据并不断优化,优化之后的业务产生更多数据,这是一个正向的循环,它跟商务智能最大的不一样是在于其分析技术得到很深的发展。

      举一些例子,比如国外提出一个概念叫“量化自我”,我们也做了一个国内的社区,它的思路是用一些非单一的手段,比如腕环,腕表,戒指,项链,眼镜等等地,利用这些东西采集我们身体的信号,包括血压、心跳、基本的代谢指数等等,这些数据能够给我们做一些健康管理,看看我们每天运动情况,代谢怎么样,建议我们吃一些什么东西,对一些特定的病如心脏早搏、癫痫等能够进行早期的预警。

      这对一些特定的人群,比如老年人、慢性病患者、婴儿还可以做更深入的。

      比如我们和一个硬件厂商做一个产品,我们通过12个压力传感器和2个事物传感器给婴儿做了一个床垫,我们知道小孩是有很多问题的,比如有很少量的小孩会打鼾,这些小孩在两岁到三岁的时候明显比同龄小孩的智力偏低,这是因为小孩大脑对氧气需求量非常大,而打鼾会降低他的供氧量。小孩打鼾没有很大的声音,我们不能体会到,但在床垫(压力传感器)上出现很明显的出现这种震荡,通过不停的数据来进行时时预警。

      刚才这一块可能会用到一些比较难的机器学习的技术,但它总体在逻辑上并没有创新。大数据在商业模式和逻辑上的创新是从2.0开始的。而2.0的一个关健词就是“外化”,就是怎么样把自身业务的数据用来解决业务以外的其它问题,或者怎么样用业务以外的数据解决自身业务的问题。

      比如说谷歌用五千个搜索关健词搜索的数据来预测电价和传染病的流行,它低价买入电、高价卖出电赚了很多钱。这典型是把自己业务的数据(搜索的数据)用来解决其它的很多问题。

      同样,搜索互联网评论,还有电网的数据,以及自来水的数据这些数据加在一起实际上是可以预测房价、地价。如果再加上GPS、交通线费、手机的数据,可以预测未来整个城市的布局规划,可以预测整个城市规模上未来人口的分布。

      很多重要的问题都需要多元数据的混合。我举三个问题:

      第一个问题是未来我们整个中国最好物流的布局是什么,怎么样让我们物流的成本降低。

      另外,华为、大唐电信、中兴等公司关心在5G的网络时代中国的基站怎么建,每个基站副站要怎么建,我们要不要建流动基站,要不要建车载基站等。这些基础设施的投入都是千亿、万亿级别。

      还有一个问题是整个中国交通路的布局是什么样,中国走城镇化的道路走了这么多年,未来城镇化到底是什么样趋势,是从东部往西部集联,还是在几个点选择中心城市,再用卫星城市带动整个中国发展。还是说中国要走一些网络化、扁平化,未来这些中心超大城市要消失掉。

      这三个问题的解决都来源于我们要预测未来中国的整个人群人口的分布情况,以及未来中国有钱的人、商务的人和普通的人分别的分布情况,还有不同年龄结构的人口分布情况,在全国的尺度,省的尺度,城市的尺度及小区的尺度。

      像这样的问题,任何划一小块过来都是一个对商业上都有大的好处,但这种大的问题的解决绝对不是一个单一的数据可以解决的,我们需要运营商,需要腾讯,需要淘宝很多地方,也包括我们各个政府来做。

      我们讲这个例子实际上是想说正是这些数据的外部才会产生更大的价值。

      像做房地产的要想一下,一座房子最大的问题是要考虑的是进不进入这个城市。如果是全国范围,这是第一考虑问题。第二考虑的问题是,拿哪个地方未来会发展什么规划,不要把别墅修在高铁旁边,那基本是没有戏的。

      同样的道理,当你房子修好之后,你怎么定价,怎么找你的消费群,在哪个地方打广告,找什么样的代言人,广告效果怎么样,这一切完全可以从数据完全定量化的。

      房地产我们做得比较少,我们做得比较多的是金融方面。金融方面我们给企业和个人做预售信,包括信用卡的发放,因为在互联网上申请一个信用卡,填的信息非常少。

      比如国内某商业银行的审核率在20%~25%之间,换句话说每五个人在互联网上填,它有四个人会毙掉,因为你的信息比较少。我们在他网上签订一个代码和我们的数据打通,因为我手头有2亿人购物的数据,和2亿人个性化资讯的数据,通过这样一些,几乎通过50%的网购在买什么东西,他的消费情况,消费价格等等。这个时候就可以给他补充很多信息,做很多这样的事。

      另外,我们有一家企业——百分点科技做电子商务的大数据的应用,这家企业是IDG、东方星空、名信中国共同投资的。他主要给电子商务提供一些个性化推荐。

      比如一号店,我们基于你的购买推荐一些东西。我们还做导购,你买了360、QQ 的导购栏,要在上面投放我们自己的广告,赚取差价。我们也做电子邮件的营销,比如给库巴,陀陀公社做一些个性化的业务营销。

      这里面有一些技术是比较独特的,比如我们在做推荐的时候实际上是打通了所有的数据,换句话说,如果你到耐克,阿迪达斯去看了很多篮球鞋,但最后觉得贵没有买,当你到这个网站的时候,我们直接就给你一些相对便宜,但类似款式的李宁的篮球鞋。去年在我们平台上可以追踪到的销售大概是5千亿,我们是仅次于淘宝的第二大平台,人数也是比较多的。淘宝大概有5亿人,我们有2点几亿。

      在个性化E链里面我们有比较独特的一些技术,比如我们发出去的E 链,实际上你每一次打开它都变了。比如今天你去沱沱工社买了一些生鲜食品,收到一封E链你没有打开它,过了两三天,如果推荐不变的话,这个特惠和优惠已经消失不在了,但是你打开邮件的一瞬间,我们直接和主通电脑有一个响应,你拿到的是最近的购买记录,最新的消费,所以你的邮件,我们叫lini—Email(音),永远是活的邮件,不是死的邮件。

      大数据时代的投资布局

      最后讲一下整个大数据的投资。做大数据的公司有四五百家,其中一百多家拿到了投资。我们把中国和美国一百多家放在一起,大概分基础设施和应用产品两类。

      基础设施分成四块(采集、存储、分析和计算),应用产品主要是行业垂直和应用分析。国内做基础设施的创新是非常少,比如做存储、计算加速,平台,新的数据非常少。基础设施方面投资可能比较大,行业垂直之内的比较小,这是平均而言。

      国内大数据创新泡沫更大,因为我们接触特别多的过来的计划,绝大部分都不是大数据,仅仅技术上我们都能知道,它仅仅是捆绑了一些概念或者有一点点数据。在座有投资想法的,遇到大数据的投资还是要小心一点,很多其实都不是大数据。尤其是行业垂直的应用比较危险——很多都是以前传统的模式,只是套了一个大数据名字而已。

      整个国内大数据的投资落后国外大概一年半左右,这是我们把国外投资的公司所在的方向错位的比较,发现错到一年半的左右的时候,跟国内的投资整个Pearson关联是最强的,所以我们基本上可以说国外领先了我们大概18个月。起步来说也大概领先18个月。国外大概在2010年中起步的,而国内是在2012年初起步的,18个月还可以追赶。

      大家做产业布局,如果你们是投房地产有关产业,我建议如果有机会的话可以和我聊,也可以通过孵化的形式投一些房地产大数据公司,这个公司实际上就成为你公司的一个战略资源,其实投一个孵化公司只有几百万,对于房地产来说不大。这家企业实际上和你们企业有很密切的业务网络,它能够做一些比如整个房价地价的预估,判断,包括精准的营销,品牌的宣传,广告验证,它实际某种意义上说是看成你们数据营销的一个部门,但它是独立的公司。

      如果要投整个大数据企业,这些东西要关注:

      第一,数据本身有没有稀缺性、独立性。

      举个例子,很多投资方把大数据公司捆绑在淘宝上,淘宝现在相对在走一个比较封闭的趋势,它把流量封在自己里面,不放流量出去了。后来百度把流量提高了,这时候如果你单一依赖新浪,或者单一依赖淘宝或者百度流量话,那你受到的限制就会非常大。所以我们希望数据要么稀缺,这个数据只有你才有;要么独立,你是自己的产生数据,要么你有多个来源,依赖一个太单一了。

      第二,数据要流动起来,能够给你投给其他的企业服务,比如这家可能为你的房地产其他部门服务。还有如果你投了多家的话,这些数据是最好互补的,能够一加一产生大于二的价值。

      硬技术创新的投资更有价值。有两个风险,一个是数据积累作用的滚雪球作用,一般需要几年时间才能积累,所以早期企业的成本要控制起来。另外一个风险,一般来说我们投的我做孵化、天使,早期做得比较多,一般商业运作比较欠缺,小的投资团队技术可能很好,但怎么从垂直领域找到商业出口这比较困难。

      我给大家几个建议。投大数据的公司,多看数据价值,而不是看财务报表;多看早期的团队,而不是看后期的团队,早期的团队带来的价值增量和创新更多,更有趣。

      投轻资产,不要投重资产的项目。尽量关注传统行业,而不是新兴行业,这个可能很多人觉得很怪异,因为像移动互联网这样的信息行业,第一竞争非常激烈,第二里面的人都会大数据,大家都是大数据,淘宝、阿里巴巴、百度都是大数据。所以在这上面只不过包含新的概念,公司的本质创新它有,但不是有飞跃性的提高。

      但反过来,在农业,工业,制造业,食品安全,包括金融,保险,房地产,这些行业还有能源,材料,这些传统行业里面如果有比较清楚的商业模式用大数据,它能带来的创新是从0到1的飞跃式创新,价值更大。这个趋势是大家抵挡不了的。房地产抵挡不了,其它行业也抵挡不了。

      (作者:周涛 电子科技大学互联网中心)

正在查看 0 条回复
  • 抱歉,回复话题必需登录。

Comments are closed.