以“从大数据中挖掘大价值”为主题的“第二届中国大数据应用论坛”于2013年7月21日在北京大学英杰交流中心阳光大厅隆重举办。本次活动由北京大学信息化与信息管理研究中心和北京大学CIO班教务办公室主办,北达软协办,CIO时代网承办。各企事业单位信息化负责人、北大CIO班学员及有关媒体代表200多人荟萃于此,对大数据的众多议题进行了热烈讨论。
“第二届中国大数据应用论坛”论坛对话
论坛最后是对话,由北大信息化与信息管理研究中心秘书长姚乐先生主持,中国电子技术标准化研究院信息技术研究中心信息化与系统室副主任杨瑛女士、北京燃气集团信息中心主任韩金丽女士、华为IT中国区MKT总工张军先生、文思海辉大中华区副总裁王俊鹏先生、安邦保险集团IT副总马兆林先生、EasyHadoop开源社区创始人、国信达软Hadoop专家童小军先生作为嘉宾参加了对话,围绕“大数据的应用场景”和“大数据的解决方案”两个议题进行了讨论。他们各自发表了对议题的不同见解。
姚乐:有请对话嘉宾上台,中国电子技术标准化研究院信息技术研究中心信息化与系统室副主任杨瑛女士,北京燃气集团信息中心主任韩金丽女士,华为IT中国区MKT总工张军先生,文思海辉大中华区副总裁王俊鹏先生,安邦保险集团IT副总马兆林先生,EasyHadoop开源社区创始人、国信达软Hadoop专家童小军先生。各位专家请就坐。这次对话的专家比较多,首先请各位嘉宾做个自我介绍。
杨瑛:大家好,我是来自中国电子技术标准化研究院的杨瑛,我们研究院一直专注于在标准化方面的一些研制,包括标准推广应用和与标准相关的检测以及工具研发和验证。
韩金丽:各位老师、各位同学,大家下午好!我是来自北京燃气集团信息中心的韩金丽,非常感谢姚老师和北大邀请我参加本次论坛,我也从中学习了很多,也希望把我们对于大数据的一些想法及初步探索和大家进行分享,谢谢。
童小军:大家好,我是来自EasyHadoop开源社区的童小军,我们一直做关于Hadoop方面的大数据普及和推广活动,我们做了九次技术推广活动,同时在上海、北京、广州等多地举办Hadoop相关的技术培训,通过推广和技术培训提供相应的解决方案,也通过今天的活动收集了很多大数据应用的案例,也希望跟大家一起分享,谢谢。
王俊鹏:大家好,辛苦了,我是来自文思海辉的王俊鹏。非常感谢有这样的机会就企业内部和为客户做服务的角度跟大家做分享,谢谢。
张军:我是来自华为公司IT产品线中国区marketing的总工张军,我负责云计算和大数据产品的规划和研发工作,也感谢这次有机会来北大跟大家一起分享华为在大数据方面的研发情况,谢谢大家。
马兆林:各位下午好,我来自安邦保险集团信息中心,安邦保险集团下设财产险、寿险、健康险公司以及资产管理公司等,今天很荣幸受到主办单位的邀请跟大家做大数据应用方面的分享,谢谢。
姚乐:好的,感谢各位嘉宾。对话是一个自由畅谈的环节,首先请台上嘉宾围绕对话主题谈一下各自的观点,接下来会请台下观众进行提问。今天有两个议题--大数据应用场景和大数据解决方案,我们将两个议题结合起来谈。下面请台上嘉宾谈一下,针对大数据有哪些好的应用场景,针对这些应用的场景我们有什么好的解决方案。
杨瑛:特别感谢姚老师给我这个机会,让我有机会分享我们从标准化的机构在大数据方面的研究和我个人的观点。我很认可主办方对于大数据的定位,就是要从大数据当中挖掘它的价值,没有价值的数据对我们会是一种负担。从大数据应用来看,我觉得一会儿在座的各位嘉宾会介绍很多应用案例,我现在要分享的是,我们在推动智慧城市标准化建设和智慧城市应用过程当中对于大数据的一些理解和看法。
在智慧城市建设当中,在城市这一级的数据应用和数据建设中,其实大数据的发展不是从头开始的,以前我们在数字化的城市建设中,其实各个城市基于空间地理基础信息上面有了很多初步的大数据应用的雏形,比如说基于空间图层叠加了土地资源项目审批和对于土地资源的监管,在它初显成效之后,相应的城市管理部门把我们关注的,比如:管线、燃气、人口管理数据、业务管理的数据,包括对于城市的环保数据都叠加在图层上。我们原来有过一个初步分析,就是在城市这一级,有关的数据跟图层相关的业务数据,可能能占到70%到80%。现在很多城市对于城市应急管理平台搭建都是基于图层数据进行展示和表现的,这是大数据一个很好的雏形和应用于城市管理的一个基础。
在推动智慧城市、政务城市建设当中,其实国际上也有对应用模式的创新和探索。比如美国,在2008年就推动政府数据公开,它有专门网站,基于网站形式探索政府数据公开和政府数据共享。我们在国内有做得比较好的城市,比如北京市,现在也有这样的一个推动数据共享、数据开发带动全社会力量开展大数据应用和数据应用的模式,这是一个比较好的探索。大家有时间可以看一下bjdata.jov.cn,这个网站是一个很简单的应用模式,政府把比较规范化的主数据,这是北京市信息化委员会联合27个政府部门把相应的数据按照比较规范化的方式组织,移植到网站的平台上,让大家可以看到他们的目录,他们有各种目录,同时还提供了工具(相应的API工具),他鼓励的是第三方可以免费调用、下载这些数据,你在调用、下载数据过程当中提供你共享的服务,你也可以把你开发的共享服务、应用上传到他的网站上。这是一个模式的探索。
我想说,国际、国内都在关注大数据发展应用模式创新和发展环境的建设。我们所有的应用其实都是在数据上可以让大家共享、让大家使用的,但是要在有一个比较好的数据采集和比较好的数据管理的一套机制和技术规范的前提之下,去做的数据推动。谢谢。
姚乐:感谢杨瑛主任。杨主任负责大数据标准工作,刚才她也以智慧城市为例讲了大数据的应用。大家知道,除了互联网企业,政府应该是最大的拥有大数据的机构,国际上都在推行这样的实践,刚才杨主任也说北京市也在推动这样一个网站,其实国外政府也推出政府公开数据,让社会从大数据当中挖掘价值。有很多例子,如纽约市政府开放数据政策,让第三方基于政府开放的数据开发一些针对老百姓的服务。感谢杨主任,下面请韩主任分享。
韩金丽:传统企业搞大数据确实是困难重重。作为传统行业我们需要补课的地方太多了。我们作为传统行业的IT人,刚刚把“信息孤岛”要推平,移动互联来了;刚刚做编码的时候,大数据来了;刚刚开始做信息安全的时候,斯诺登又来了,所以真的是步步紧追。但是在这个过程当中看到了,也确实从中获益了IT带给我们的改变和效率的提高。我想说两个方面:第一是大数据展望。第二是大数据要脚踏实地。
[page] 大数据展望,从我们燃气行业来说它有两个大的方向,而且这两个大的方向我也想给在座的一个期望,我觉得这确实是IT人的一个值得感兴趣、值得你们去投入的两块新的蓝海。一个是生产网络监控,一个是生产运营平台跟大数据的关联,这两块涉及到上游和下游。北京燃气承担着北京的供气,千家万户的用气管理和公共服务、基础设施、流动的燃气汽车(公交车、出租车在用燃气)的运营管理,我们是城市的运营的燃气公司,相当于中下游,但是在整个链条上我们还有上游,气源从上游(中石油、中石化、中海油来的),因此生产监控受制于两个层次,一个是怎么把气源管理好,另外就是不间断地连续供应好燃气。在监控运营层面上来讲,实时的在产生大量的数据。现在在我们市里,上万个监测点(目前来看还远远不够),在上游不仅把气源供应保证好。大家也知道最近天然气上游对非居民用户进行了调价,其实这个调价跟石油供应汽油的价格联动机制也一样,未来天然气的期货市场交易一定是要放开的,那么这块的基础交易数据来源就是供应的基础数据。如果没有供应的基础数据,没有这个平台的话,这个是无法交易成功的,所以整个的上游气源管理需要大数据;另外就是下游的中期监控运营、城市的运营管理需要大数据。
另外一个大数据的方向就是用户的管理,一个是用户用气行为的大数据,还有一个是我们作为供应企业的,我们的服务、我们应该怎么样精准的、个性化的给居民用户和非居民用户提供更好的服务。在这两块,也是大数据的应用方向。这是我们燃气行业对于大数据应用的展望。
从目前来讲,我们进行基础工作遇到的困难比较多,现在主要做的是消除原有的“信息孤岛”,其主要障碍就是数据标准。我一直在听各个专家提到的关于大数据的概念,我确实挺振奋的。刚才王小雷先生也提到主数据,我们现在就在做主数据,跟杨总做燃气数据化标准的工作。虽然我们很振奋大数据的概念,但是作为IT运营者和管理者,这个基础工作不可逾越,必须要打好基础才能给概念造势创造条件。我们要把独立的系统数据打通,怎么能够把他们的标准统一化,同时我们也有一个想法,在燃气的数据采集、应用、管理方面,北京燃气可以多做工作,把标准制定好,为其他企业以借鉴,不让他们再走弯路,使他们一步到位,为千家万户以及广大使用燃气的用户提供更好的服务。谢谢。
姚乐:非常感谢韩主任的分享,作为一个传统的企业怎么样面对大数据,根据韩主任的经验,虽然大数据带来了很多机遇,但是我们在小数据时代所要做的基础性工作是必须要往下做,主数据管理、数据标准化,这些基础性工作还是要做好。接下来请童小军先生跟大家做分享。
童小军:我来自于互联网行业,早期的时候在暴风影音工作时有一个体会,大数据的方向,包括后来做普及和推广的时候有一个感觉,我觉得大数据核心点在于大数据如何指导决策。指导决策这个方向又分了几类:一类是如何利用群体智慧指导个体;一类是Google、百度他们不断的抓取各种各样的数据形成群体智慧,当我们搜索时,它会给我们提供服务。他不会因为我们不去搜索而停止抓取。一类是将人与人之间的信息尽可能结合起来,指导个体。这类就像平常生活当中的QQ、微信。将我们生活当中的各种各样数据输入进去。另外就是通过收集企业数据指导领导决策。我认为大数据更大的应用方向在于如何个性化的指导个体决策。
关于大数据应用的技术,前几天我去深圳做一个关于Hadoop的培训。其中有一个例子让我印象很深刻,他是一家管理海洋船舶的公司。他说几乎几秒钟就要收集船舶的信号,数据量非常之大。我就想,他用这些数据要做什么。我们可以发挥一下想象,假如我们获得大量的船舶信息,那A船舶和B船舶之间,他们之间距离如果相近的话就会报警,他们是收集群体信息指导个体船舶的行为。另外我们也可以知道船舶行驶到哪个地方,这里会不会有暗礁或者冰山。如果说泰坦尼克号拥有这么大规模数据指导就不会撞上冰山。
在运用技术上面,他们使用了Hadoop技术,并且在Hadoop基础之上使用HBase。其实这在很多的企业里,包括船舶、电信、银行等逐步应用开源的Hadoop解决方案。当然这些开源的解决方案,它的根基是开源的,但通过EMC、英特尔等一系列解决方案。我们在选择方案时,我给一个建议,就是尽可能选一个它可能会成为未来标准的东西。比如说处理大数据方面,我们可以选择一个封闭的体系,也可以选择一个开放的体系,在这里我们给的建议是,选择开放体系会获得更长远的发展。谢谢。
姚乐:童小军先生在咱们国家推广Hadoop里面是一个重要的参与者,也举办了很多开源社区活动推广Hadoop。大家知道,Hadoop是互联网企业在这么大规模数据存储和处理利用的基础上被逼出来的,我们不用I小机和传统关系型数据库,而是以廉价的X86方式去部署,而且能够快速的、易扩展的、相对安全地处理这些大的数据。互联网企业用的这些技术对很多传统企业也是有很多应用场景。因为不光是互联网企业,其实很多的传统企业也有大量的非结构化数据需要处理,特别是图象、视频、用户行为数据,我想慢慢地,很多传统企业,包括下午龙总也提到,也用Hadoop做他们的数据存储分析,我相信随着大数据时代到来,越来越多的传统企业也会应用这样的技术手段进行大数据的存储、分析和处理。下面有请文思海辉的王俊鹏先生为大家做分享。
王俊鹏:大家好。我觉得今天是一个很好的交流机会。我是做IT的,我在文思海辉工作了15年,以前做传统的工作,现在随着这几年语音、Mobile、移动互联网、社会化相关的应用发展,这些新的技术在不断驱动业务、企业商业模式的变化。从这个视角来看,我自己是觉得挺兴奋得,所以这里分享一下我的理解。我觉得大数据时代已经早早就到来了,比如最近的Gartner报告,两个月前,就提到,到2020年大数据不存在了。或者说到2020年大数据会变成一个家喻户晓,非常习以为常的围绕着我们的生活、工作、学习很自然的环境。刚才各位嘉宾也提到了,在目前的环境中可以看到你已经享受到很多大数据的服务,比如说到Google上搜索,包括雷健波先生,我第一次见他,我对他的演讲感受很多,也很感兴趣,我在Google上就很容易查到他的经历。所以就会看到大量不同形态的数据已经在我们身边了。
我个人是这么看的,有点像人类发展这么多年历史过程当中,有点像我们从山洞搬到别墅。或者说面对新鲜事物时,内心深处总有一些担忧、害怕。我倒是建议大家以开放的心态拥抱大数据,着眼未来,及早了解大数据是什么。比如说今天早上也有专家提到,对它的认知就决定着你更好的使用它。
我上个星期很偶然的机会有幸见到《大数据时代》的作者,他在会上提了几个话题我觉得挺好。他提到,一开始尝试大数据,在实践摸索过程当中你可以从很小的点开始。提了三个关键词,我觉得大家可以参考一下:
首先是Skill,就是自己擅长的东西、比较强的东西;其次是对其深入的理解和认知,以及场景的捕获,计划用比较好的技术怎么帮助自己擅长的地方发挥所长,或者在你更关注的地方。比如龙总在南航实践过程当中,分享的内容特别好。讲到怎么样跟客户、常旅客进行交互。第三个就是Technology。
[page] 其实我有点稍微不太认同,刚才有位置嘉宾讲到现在是IT人的时代,在其中起到主导作用。我觉得应该拓展到业务部门。我的理解是,我们业务的很多人员陆陆续续也越来越多的接触、认知,思考这些问题,去了解、接近技术。运用成功的团队,我个人观点是,这是一个跨界的团队,要对两者有很好的了解,也有很好的实践。所以我建议在座的CIO,如果要尝试的话,这里我也稍微分享一下我们的做法。你可以有一个很小的团队结合起来,由业务骨干在擅长关注的地方,结合新的方向、可以看到的最佳实践的场景,还有与不同工具结合到一起做尝试。我相信在这个过程当中会找到很多适合我们发展的方向。
从我们企业自身来讲,我们是做服务外包相关的。就我们内部来讲,因为我们公司宣传上比较低调,在业内来讲大家了解我们更多的是我们的大块服务,也就是服务外包,实际上我们还有很多产品、解决方案、咨询业务,比如说航空,我们在山航、川航等都有服务。还有金融,我们也提供了一些解决方案和产品。我们自己内部有一个“创新中心”,中心负责人在业内也做了非常多的创新。
回到今天的主题,我讲两个例子,一个例子是我们内部的尝试,另外一个是我们客户的情况。早在几年前我们就做大数据的探索,为什么?因为跟我们的自身发展有关,从95年创办公司到现在我们有两万四千人的员工规模,在全球九个国家有49个分支机构,从国内来讲我们的规模是排在第一位的。相比于国际上的公司,我们还是很小。所以未来要进行长足发展,管理5到10万人的企业,也是有很多挑战。
对于我们做服务的企业来讲,最重要的是人。因此内部会围绕员工,人力资源和IT部门结合起来就做尝试,怎么让员工在项目、协同办公环境当中随着很多数据的产生对他们有更深入的了解,帮助他们更好的服务客户的同时找到他们自己的成长路径。
员工成长有两个重要的数据,首先是薪资、福利待遇。其次就是个人成长方面,我们是服务于全球的客户,我们有更多业务来自于海外,包括美国、新加坡等等,在美国,我们有一个大数据平台,我们是他们的合作伙伴,推广Hadoop的相关应用。我们人力资源部在人员入职、面试当中,把他们的信息放在平台里,有非常大量的数据。我们会进行不断收集,对他们了解更多,对他们进行更好的定位,告诉他需要哪些培训,让他们把工作当成乐趣,这样才能提供更好的服务。
第二个例子,就是给Web客户做的案例。我们在香港有400多员工,服务了很多不同客户。包括台湾,我们有60个员工。在香港这边有一个客户是博彩的客户,1971年开始做博彩,这个有点像游戏,投注和彩票的环节,他们弄的比较复杂,有点像游戏过关一样,通常过了一关会有相应积分,鼓励你过后面的关卡,一路过下去,到第八、第九关就可以有奖金回报。这有一个大数据的应用,我们在深圳和北京建了两个大的研发中心,从2007年就开始了,在这个环节当中,当时香港政府对这个行业有一个硬性要求,要求你做相应的投注活动,因为他们有两百多万投注点,这本身就是很大量的数据采集。在投注过程当中,政府要求,必须要提前经过测算满足要求,有一个硬性指标是收进来的相应彩票、游戏收入其中60%要回馈给参与这个游戏的市民(买家),这个测算要非常精准。如果回馈更多的话也不是特别合适。所以有大量的数据分析。
在这其中我们参与了很多。在满足这个场景下,尝试了两年,两年之后香港政府又颁布了一个新的法律,“防成瘾的政策”,就是保证大家在买的时候不能超过一个金额。所以在这个环节当中,又要进行平衡。同时要保证参与量,也要保证不能在这个过程当中制造更多场景,使大家成瘾。所以要对受众进行分析,其中包括结构化数据、非结构化数据。
最后,我想说一下,我觉得大数据是一个很好的引领工具。以前企业之间的竞争用赛马的方式比,现在大数据、云计算给了你一种可能,用车的方式,用更高级、更好的方式跟竞争者竞争。如果你张开怀抱拥抱的更早,就会结合的更好。我们公司还有几个重大的方向:社会化有关的个性化东西,尤其是80后、90后、00后,他们消费习惯非常不一样。还有就是全渠道、移动、分析,还有就是云。谢谢大家!
姚乐:刚才王总首先把他个人和他所听到的关于大数据的一些见解跟大家做了分享,也通过内部和外部的例子分享了他们的实践成果。下面有请华为张总跟大家做分享。
张军:通过今天上午和下午的演讲,我觉得对大数据有了更新的认识。今天的演讲首先从哲学层面演讲有很多,我原先看到一个材料,就是人认识的过程,首先是数据、信息,然后是知识、智慧,这么一个逻辑上升的层次。最早是数据,而现在是信息社会,信息阶段已经到了。那么下一个阶段是知识和智慧的时代,大数据这个概念之所以这么热,它其实是指引大家向智慧的阶段来进行演进。
对于企业、设备制造商来讲,我们怎么来帮助使用者实现智慧业务,这是我们要考虑的问题。对于企业来讲,创新不在大小、智慧不在大小,一定要和业务相关,不要太好高骛远看互联网企业,搞这么大的创新,就一定要搞什么东西。从我们的角度来说还是要结合企业实际创新。华为老板有一个说法叫“微创新”,对于企业来说更多是要微创新。上午也讲了华为IT创新的地方,比如财务报表系统、怎么能够在当天就把整个季度或全年度的财报做出来,其实这里面就有一些我们自己的创新,这也就用了我们华为的大数据系统,这个系统有非常强大的分析能力。
华为报表从数据上来讲,每年要增加20T报表的数据,现在的数据仓库技术(设计)已经不能满足我们的需求了,今年华为采购一套新研发的设备,这个设备具有很强的处理能力,原来几天处理的数据现在几分钟就能处理完,而且能支持上千用户的同时查询的能力。所以在大数据时代,首先要根据自己的需求来进行创新。
另外华为系统的安全性,我们在安全控制方面做的非常严格,怎么既不影响信息共享提升研发效率又能保证数据安全?这就是企业的切实需求。在华为的系统里就有一套大数据的分析系统,你把人的行为信息、访问信息监控起来,如果出现违规或者把公司的材料拷贝出去,它是会发现的。华为15万员工,如果靠物理的手段来解决这个问题,是不现实的。以前我们确实走过弯路,最早把机箱封起来不让你访问,这是最笨的方式。现在就用了一套软件的方式来解决这个问题。我想,这就是一个真实的在我身边的大数据的例子。
华为首先认为,大数据是一个创新。这是大数据的灵魂,如果没有创新的意识,即使建了一套大数据的系统也不能发挥它的作用。这是第一个层面的问题。第二个层面,华为在大数据做了一些什么样的研发和研究。
[page] 从大数据的概念来说,因为我们接触企业比较多,它的概念还是比较宽泛的,包括非结构化数据、结构化数据,我们现在有很多企业都没有利用好。那怎么样把原有的数据利用好,同时又结合新的趋势能够真正做到对业务有利,这是我们在研发当中需要考虑的问题。比如在结构化数据处理方面,从这个技术方向上讲,原来由小机+存储结构逐步向分布式架构转化,这个架构里头最新的方式可以让数据库做得非常大,性能也非常高。我们知道现在Oracle数据库顶多到100个TB就不可用了,如果通过新的技术创新就能使数据库做到很大的规模。所以现在有分布式数据库+MPP架构融合一体机的解决方案帮助我们来解决这个问题。
另外就是数据存储的问题。不可避免的是,数据爆炸会带来数据海量存储的需求。这就对新的存储架构产生一个动力,因为原来的存储是集中式的架构,扩展能力、支持大数据的能力是非常弱的。另外就是处理能力的需求,需要设备具备很强的弹性、很强的扩展能力,而且以前的访问模式是我们要处理数据,把数据从存储里拷到计算节点里然后再放回去。而现在怎么办,现在是存储和计算融合的架构。Hadoop就是一个比较好的例子,把计算能力放到存储上,Hadoop一般用存储性服务器做(当然Hadoop也有问题,Hadoop其实在存储上有一些问题,比如说数据安全、数据保护方面),所以华为会针对客户切实的问题,新一代的大数据存储架构,分布式的计算和存储合一的大数据架构已经研发出来,我们自己内部叫“N9000系统”。
另外我们在Hadoop也有一个团队做相关的研发,我们现在有Hadoop的商业版,也已经发布了。华为Hadoop社区投入也是非常大的。Hadoop13个委员会里头,我们有一个委员。我们也是敏感的捕捉到大数据、Hadoop这块的方向,也进行了相关的投入研发。
作为厂商,我们希望和客户一起创新,共同迎接大数据时代。以前有一个说法,在美国大数据的工程师薪酬是60万,而这样的人才很难招,大数据其实需要他要懂得技术、专业知识,同时又是一个数据专家,因此要把这个工作做好要靠厂家、客户一起创新,厂家懂技术、客户懂业务,两者结合起来才能真正把大数据做好。谢谢。
姚乐:感谢张总的分享。特别是在大数据架构下面华为要做的产品和服务。最后请安邦保险的马总给大家做分享。
马兆林:首先要谢谢各位留到最后来听我谈的观点。我讲内容是很直接,就是应用场景和解决方案,三个场景。
第一个场景,大家知道在中国有多少乙肝携带者?9200万乙肝携带者,已经发病的有两千万,那七千多万怎么办,是不是很大的社会压力?我们国家在1998年开始,保监会批筹了四家健康保险公司,就是要有专业健康保险产品满足市场需要。近一两年,国内推出第一款乙肝保险产品,它可以对未发病乙肝携带者进行承保,只要没有肝硬化、肝癌就可以承保。发病之后保险公司进行理赔。为什么近年才有所突破?是因为有大数据的出现成果,大家知道发病、理赔率、费用是概率的事件,有了大量这类数据的积累为承保已病人群成为可能,当然已病人群还是可以再细分状态量化级别的。这是一个很好的案例,说明大数据对于民生、对于大家所带来的便利。这个健康保险产品应该是对保险的“社会管理职能”的最好诠释和贡献,是突破目前保险市场困境和张扬保险本质正能量的有益探索和突破。再有,目前我们国家已经逐渐进入了老龄化社会,老有所依,老有所养,逐渐为社会关注,最近国家也在批筹养老保险公司,养老险保险公司推出之后必定要适合退出满足市场需要的养老的商业保险产品,那么更需要诊疗、医疗费用等数据方面的支撑。现在把大数据强调提出来打通数据壁垒,应用于医疗行业、保险行业,这对社会是一个好事情,毕竟我们都会老去。这是第一个场景。
第二个场景,在这里我也做一个调查。我相信在座的各位都有车,有多少人买车之后做过车险理赔,包括刮蹭?为什么要说这个?在一两年内国内保险公司已经推出移动查勘服务,当车出事故之后(包括刮蹭),保险公司查勘员会带着iPad、iPhone移动查勘设备到现场进行查勘取证,进行资料上传,之后车损事主只需开车到4S店修理就可以了,不必两个事主都到4S店参与定损,节省了大量时间,而且理赔金额在3000元以下的案件,将在2天之内完成理赔结案。这是一个非常好的客户体验。我们讲的大数据应用创意和数据的有效应用,最后毕竟要在前端实现。大数据如果给我们带来很好的效益、节省时间,那么它的价值就出来了。所以这也是一个非常好的场景(应用)。
刚才我之所以讲第二个场景,这里还有一个数据跟大家分享,根据统计,70%的车的理赔案在3000元以下。换句话说,我解决了70%客户的服务问题是不是得到绝大多数客户的满意,这也是二八定律的最佳实践。
第三个场景,我再做个调查,五年内大家做置换车的有多少?看来现场还是有些人的。保险公司已经推出移动出单服务。你在4S店买商业保险,它的利润是比较高的,第一次买商业险没有办法要到4S店买,但是对于第2年车险续保可以有更多的选择,通过移动终端,比如iPad,只要你输入车牌号,更直观的选择你的参保内容就可以快速出单。这也为大家节省了时间,提升了服务。
我刚才说的这三个应用场景看似非常简单,但确实是大数据是作为基础进行支撑着,从效果看确实加强了客户的服务体检。
姚乐:感谢马总在金融保险行业分享的大数据的应用场景和好的实践。下面我们进行提问环节。
现场提问:主持人好,各位嘉宾好。刚才听杨主任讲了大数据在智慧城市的应用,受益匪浅,智慧城市包括智慧交通、一卡通等等,其中应急指挥是大数据应用联动比较核心的部门,我的问题是,现在各个城市信息化水平不一样,导致了它在建设过程当中会根据自己的情况建设,就导致了建设层参差不齐。那么应急指挥这块有没有标准的出台?有没有这些方面的规划?
另外,现在智慧城市大数据主要来自于两个方面,一个是互联网、一个是专网,互联网分为网络行为,包括用户资料、上网习惯等等,第二个就是专网,包括应急资源、专家、救援队伍、预案等等,这两个数据怎么融合?对于这两方面的数据有没有相应的模型、算法?谢谢。
杨瑛:谢谢!看来您是一线在做智慧城市的实践者,所以您提的问题也是各个城市普遍面临的问题。第一个问题,在应急指挥这块,国家有没有标准的出台。据我所知,现在还没有。为什么没有呢?因为对于应急指挥建设更多的现在是在城市一级做平台建设。而我们国家推动电子政务、信息化标准是从顶往下走的。2002年的时候,原国信办和国标委联合成立过“电子政务标准化课题组”,当时出台了一批国家标准,而这些标准更多的是解决的对于主数据的规范,有一套系列标准,是一套资源目录,利用原技术数据实现资源规范化、资源目录建立和梳理,还有一个“政务资源信息交换标准”,通过技术来实现有交换需求的,在一个共享平台上怎么实现这种数据的交换。
从应用角度和从城市建设角度来看,对这方面的标准是比较缺的。我们现在也在推动智慧城市的标准化建设,姚老师也在参与这方面的工作,我也在合作,国家也关注智慧城市的建设,对智慧城市这块标准化的推进也有相应的组织机构、相应标准机制也在建立。这是第一个问题。到目前为止没有一个成熟可用的应急的标准。
第二个问题,我们在不同网络环境下数据怎么实现共享和融合。我的理解是这样的一个问题。这个问题也是信息化建设中的一个难题,工具交换、数据共享,大数据融合、汇聚是机制设计上的难题,再加上在不同网络环境下的数据共享、交换,就会更难。它更多涉及的是,比如说政务内网数据建设,有它相应的一套信息安全管理机制,至于说互联网环境下相关数据的安全和保护,从国家层面来讲对于它的等级保护,也是按照等保做的,也有一套等级保护的规定,它是处于不同的级别。
如果具体到一个应用场景来看,怎么实现数据关联,现在来看,还是要通过等级保护要求之下怎么通过数据技术手段去实现数据的处理。目前来看,这方面的解决方案,我觉得它不是标准的问题,从标准问题可能无法解决不同网络环境下数据实现共享和交换,更多的应该是机制和技术手段。所以我刚才也一直想说的是,为什么我说刚才说到网站的共享模式,其实对于大数据发展,特别是在城市建设当中,更多的是模式创新(包括技术模式、业务模式)。
姚乐:最后请台上的嘉宾用一句话描述一下大数据的应用前景。
马兆林:金融大数据,实现客户体验,提升生活品质。
张军:大数据依靠创新。
王俊鹏:大数据它就在那里。
童小军:通过大数据加速反馈决策,提升效率。
韩金丽:大数据给我们从事这个行业的人带来一个很大的挑战,就是从台后走到台前、从技术变成复合型人才,要懂应用,这是很大的挑战。大数据把世界变成精彩。
杨瑛:我今天特别受胡老师讲的信息化论对于大数据的发展的影响,他讲的观点特别好,语重心长。我觉得胡老师、姚老师对于资源开发利用也有很多的应用、探索。所以我想说,大数据发展其实关注于信息资源提升整合设备信息资源开发利用水平,需要脚踏实地发展、脚踏实地去做。
姚乐:谢谢各位的分享!工信部杨学山副部长前不久在北大的座谈会上提到“在新技术推动下很多软件会被颠覆掉,包括ERP软件,特别是一些管理和服务领域的软件将很快被颠覆掉”。那么大数据会不会给我们软件行业、IT行业甚至是很多传统行业产生颠覆性效果?我认为也是肯定的,因为已经很多行业就已经在被颠覆。今天大家也举了这个例子,Google一个典型的大数据处理模式,不用小型机、Oracle数据库来做数据的存储和处理,这就是颠覆性的。还有阿里巴巴放贷的例子,也是在数据里面分析客户去放贷,去抢占了银行的业务,这也是颠覆性的创新。我相信,我们还有很多机会。今天的主题是“从大数据挖掘大价值”,价值在哪呢?我认为至少有两个层面:
一是对于搞IT的人来讲,数据存储和处理层面,我们可以用Hadoop、HBase等方式做数据处理,用廉价的方式,特别是对大数据量、非结构化的数据,这对很多行业有机会。另外一个层面就是分析的层面。还有很多的行业的数据等待我们去拥有和分析。包括冯总讲到的医疗领域,我们今后是不是通过对人体大数据的分析,今后的一些医院是不是面临倒闭了,因为计算机基于大数据的看病可能比医生看病还要准确。这是一个大胆的畅想。
我相信大数据确实给我们很多行业带来颠覆性效果,希望在座的各位能在你们的行业、企业发现这样的价值,希望今天的论坛给大家带来启发,今天的论坛到此结束,谢谢大家!