中国大数据产业峰会日前正式开幕,李克强总理出席并致辞,致辞中提及中国经济发展方式应从过度依赖自然资源转向更多依靠人力资源开发。因自然资源是有限的,但人力资源是无限的,蕴藏着无穷的创造力。
所以发展大数据产业要有人才,有能力,有创新。有创新意识的人才虽不多得,但发展大数据产业所需要提升的能力却可以进行培养,这里就“提升数据利用能力”与大家作个分享。
峰会中,总理也特别说到了自己的一个小故事。他说自己所穿的西装,是中国企业为他做的。他当时问这家企业,说你们进行了数据采集过程没有,企业回答说我们在中国已经采集了两百五十万个样本,但同时他告诉总理,如果他能做到两千万个样本的采集,他为总理所做的西装一定会做得更好。
一个小故事,透露着大数据让整个时代走上了一个全新的台阶,同时也体现出我国传统行业对数据的利用能力还有待提高。提升数据利用能力,要从数据资源挖掘入手,对于许多传统行业来说,数据挖掘是一个新兴词汇,似乎永远和IT、计算机、云计算绑定在一起,与传统行业关联不大。
然而现代经济中,信息化浪潮席卷各行各业,大数据、云计算、物联网等的大力崛起,使得发展新经济、新动能成为把握市场机遇的必然选择。为推进产业转型,推动信息化与实体经济深度融合发展,传统行业也开始了信息化建设,甚至是携手大数据大力发展创新。但传统行业面临的最大问题就是技术的短缺,网页抓取工具在培养数据利用能力方面则做出了较大贡献。
网页抓取工具被广泛用来抓取网络中公开的数据信息,比如交通记录、医疗健康数据、社交数据等,拥有数据资源,才有下一步利用过程的实施。在不具备专业IT知识的情况下,以火车采集器为代表的网页抓取工具能够帮助和引导我们进行简单的采集配置,并实现数据的自动化高效抓取。
火车采集器为我们呈现的是完全可视化的操作流程,而非冗杂的源代码,所以网页抓取工具对操作人员的技术要求并不高,自动化运行又可以节省大量的时间,不需要传统企业花费大量人力和精力去完成数据挖掘的高难度任务。
数据挖掘得以轻松解决,拥有数据就拥有决策权,就能够与传统业务结合思考数据能带来哪些创新,怎样才能更好的被利用,这正是李克强总理所强调的“大数据创新意识与传统工匠精神相结合”。
减少数字鸿沟,打破信息孤岛,人在干、数在转、云在算!正如总理所说,有些企业今天还是“小个子”,未来就可能产生一些“小巨人”,甚至享誉世界。