无障碍说明
腾讯科技科技 > 要闻 > 移动互联 > 正文

中联通陈一昕:运营商要把握大数据的仓库

腾讯科技[微博]2013年08月15日10:00

腾讯科技讯 8月15日消息,中国联通(微博)研究院大数据及云计算首席专家陈一昕在2013年中国互联网大会上表示,大数据是一个金矿,运营商主要的战略和环节就是把握大数据的仓库。

陈一昕表示,移动互联网运营商有大量的数据和无限的应用。运营商知道用户每天上网的时间、地点、人物、事件以及使用什么样的套餐,和谁通话等数据。这些数据在金融、电子商务等领域都有非常非常广的应用。面对这样一座大金矿,运营商没有必要和其他的企业比拼如何打造金戒指,我们要做的是把金矿管理好,把金条做好。

陈一昕介绍说,中国联通开发了沃云作为大数据的支撑平台,也开发移动上网大数据平台,每天上网的数据会传输到后台的大数据平台,同时开放数据挖掘的能力。

以下为陈一昕演讲实录:

陈一昕:今天我跟大家汇报一下我们在移动互联网时代运营商大数据的一些问题。这是我们去年董事长提出的随着移动互联网的发展,我们已经进入了信息海洋的时代,这是一个很有前瞻性的观点。今年,大数据炒的很火,信息海洋就是大数据。移动互联网就是每天产生的大数据,比如说在中国联通我们每天移动互联网就会产生600亿条,数据的速度总量和种类都是有着非常大的突破。今天我讲三点:一个是移动互联网大数据有什么价值,第二汇报一下中国联通在这方面的发展,第三探讨一下在这方面有哪些挑战。

讲大数据的价值不得不讲什么是小数据。人类的发展史可以说就是小数据的挖掘史,比如说牛顿是一个伟大的科学家,他的主要贡献,牛顿三大定律,就是对小数据进行分析,从而得到的。比如说小时候做过物理试验,一个小推出,加一些力搜集一些数据,画一条线,该可以得到牛顿第二定律。华佗著名的医生,做的也是小数据挖掘,看到的是我有一些病人,得到一些经验,总结出一些规律。小数据时代人类的发展,一直到最近为止都是分析小样本的数据,从中抽取一些一般性的规律,一些大概率的事件。另外,人类最聪明的地方就是在于运用逻辑,善于发现事物的因果性。

比如说牛顿三大定律可以推导出经典力学,但是随着云计算、互联网、存储能力的高度发展,我们已经进入了大数据时代。大数据会不会对我们人类的发展带来新的变革呢?我想大数据有三个创新点。

首先当你数据量非常大的时候,你对于数据的质量要求就比较低。比如说我们想发现两个变量之间的关系,你数据量很小的时候,有一定的数据,模型就会错掉。但是如果说当你数据非常多的时候,我们就可以容忍数据当中的噪音。

第二,我们看下面的模型,数据量越来越多的时候,这条直线小数据样本一条直线非常好的模型,当你数据非常大的时候,我们会发现中间这个地方出现了一个凹点,这个要点是我们更感兴趣的内容。也许我们有一个大数据的模型可以更好的发现更有价值的东西。大数据可以让我们发现小概率事件,发现突出性事件。往往突发性的事件更有价值,比如说金融危机,海啸、地震、金融欺诈都是突发性事件。

第三,在大数据时代我们可能更加关注的是数据之间体现出来的关联性,而不是因果性。因为这个世界很多事情太复杂,没有办法完全靠因果性推理。包括牛顿三大定理,我们也没有办法完全解释。

我认为大数据其实会给我们人类的历史、科技、带来非常大的突破。将来数据分析得到的结果,比科学家几千年做的结果还要好。做举个例子,国华盛顿大学医院有些病人会突然发病,我们医院有世界一流的医生,每次当他们发现这个病人情况不正常的时候,往往已经为时过晚。我就做了这么一个工作,我们把医院里面2005年开始10万多个病人的数据进行分析,这个数据是大数据,只要住院,每隔4个小时护士就会测量你的生命体征。我做的这个模型可以提前48个小时预测这个病人会不会发病,会得什么样的病,不可能100%的准确,但是准确率非常高。我让世界著名的医生看这48小时的数据,这个医生看不出来有任何问题,他做的是小样本的分析,只看到几个数据点,做大数据是全貌,可以发现突发事件。

这就总结了大数据三个特点,第一利用所有的数据,第二注重事物的关联性而不是因果性,我也不是医生,我不理解医学原理是什么,我做的某种意义上比医生做的还要好。

回到移动互联网运营商,我们有大量的数据,可能有无限的应用。大家知道只有做不到,没有想不到,在我们联通我们知道移动互联网用户每天上网的时间、地点、人物、事件付什么样的套餐,和谁通话,这些都知道。这些领域,金融、电子商务都有非常非常广的应用。如何体现这些价值,这张图显示大数据产业链,作为运营商我们应该把握住哪个环节。在联通我们主要的战略,就在这个环节,把握大数据的仓库,像刚才杭总讲的一下我们是掌握的一个金矿,没有必要和其他的企业比拼如何打造金戒指,我们要做的是把金矿管理好,把金条做好。

介绍一下中国联通的发展,我们开发的沃云是大数据的支撑平台,也开发移动上网大数据平台,每天上网的数据会传输到后台的大数据平台,同时开放数据挖掘的能力。

最后讲一下移动互联网时代大数据的挑战。这是有四个层面,数据搜集、云计算、数据挖掘还有应用。结构化和非结构化如何整合,如何来支持数据,当你处理能力能不能满足速度。这里面有非常非常多的挑战。

举个例子讲一下数据挖掘模型,以前的模型是采用非常小规模的数据,需要多次访问。我讲一下大数据时代最大的挑战可能是人才,到了2018年具有深度大数据分析的人才可能缺少达到60%以上,大数据人才不光需要有理工科的知识,数学建模的知识,需要了解企业商业的痛点在哪里,我们在联通也在着力打造这样一支团队。我的讲话结束了。

谢谢大家!

注:2013互联网大会于8月13日至15日在北京召开,腾讯科技作为本届互联网大会的官方战略合作门户和官方指定合作新闻中心,在现场进行全方位的视频和图文直播。并特设立2个现场专访间,力邀业界专家与企业代表共同探讨产业现状,指点未来趋势。

作为大会官方微博合作伙伴,腾讯微博(http://t.qq.com/)上发起了#向CEO提问#的活动,所有网友都可以提前向您关注的互联网行业CEO提问。其中部分问题将被选中,在互联网大会现场提出,并得到嘉宾的正面解答。

[责任编辑:lincelkong]

相关专题:

  • ·2013中国互联网大会订阅
您认为这篇文章与"新一网(08008.HK)"相关度高吗?

阅读更多

网友评论

热门评论

最新评论