人工智能中文网
  • 主页
  • 线代考研视频
  • 线性代数
  • Python机器学习与算法
  • 大数据与机器学习
  • Python基础入门教程
  • 人工智能中文网
    教程目录
    阅读:

    大数据是什么,大数据的含义

    < 上一篇:没有了 下一篇:大数据市场前景及人才需求 >
    大数据,近几年来都一直非常火热的一个名词,似乎是伴随着“互联网”的逐渐发展所出现的一个新名词。我们在天天听着“互联网+”的同时也在听说“大数据+”。

    大数据其实是一个比较抽象和笼统的概念,应该说这个词是为了涵盖性地表达一系列生产和业务行为的一个统称。但是也正是由于这种抽象和过于简略的称谓方式,让每个人都容易对这个词产生见仁见智的不同视角的印象或者看法。

    大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,同时也是由多种行业分工和协同配合而产生的一个复合性极高的行业。

    大数据产业生产流程从数据的生命周期的传导和演变上可分为这样几个部分:数据收集数据存储数据建模数据分析数据变现

    其中每个环节都是非常重要的数据生命环节,每个环节的生产加工行为都是有其价值的,并且每个环节做到极致都可以成就一个伟大的公司。整个完整的产业生态圈就是大数据,它的缩影也渗透在任何一家以数据作为运营基础的公司中。

    根据麦肯锡 2011 年发布的一份研究报告,到2018年世界范围内将会出现高达 14 万~19 万的“大数据”岗位空缺。而艾瑞咨询集团在“2014 年会”上曾指出,全球数据量每 18 个月翻一番,到 2015 年,中国专用数据分析人员预计缺口 1400万。

    可以看到,在仅仅三四年的时间间隔上,两家咨询公司做出的预测都很大胆,但是两个估算数字相差也确实非常悬殊。究竟哪个数字更贴近“事实”并不好判断,因为大家对“大数据”的概念边界理解可能有很大的偏差,估算出现偏差是必然的,但是有一点可以肯定,大数据人才缺口一定是未来几年非常显著的问题。

    2015 年 12 月 21 日,全球第一家大数据交易所——贵阳大数据交易所经过半年多的发展,交易金额巳突破 6000 万元人民币,会员数量超过300家,接入贵阳大数据交易所的数据源公司超过 100 家,数据总量超过 10PB,已发生实际交易的会员超过70家。预计在未来 3~5 年,交易所日交易额将突破 100 亿元。

    截至目前,中国境内除了贵阳大数据交易所以外,还有长江大数据交易所、武汉东湖大数据交易中心、崇州大数据交易所等十余家大数据交易所挂牌营业。

    2016 年 1 月,阿里云的“数加”大数据平台和金山云的KMR平台等国内大品牌云产品供应商的重磅产品先后登场,几乎所有有远见的云产品巨擘资本都在向大数据产业链集中。但是这块蛋糕似乎有点太大了,只能边烘焙边分割,谁也没办法一下子全吃掉。

    对大数据的理解

    “大数据”这个人造词汇其实很容易产生不少误解,尤其是这个“大”字,很容易让人感觉,数据量必须大,而且特别大,越大越能形成产业,也越有价值。这是“大数据”给人带来的误导。大数据产业的存在其实和其他产业并无二致,本身是为了给其他产业提供服务。

    做个假设,假如现在给石油产业冠以“大石油”产业的名字,那么会影响石油行业本身对其他行业的服务样态吗?应该不会。

    在“大石油”产业里,同样有人从事着这样的工作内容:石油勘探、石油开采、石油运输、石油提炼、石油产品销售等多个细分领域和环节。

    最后提供给社会的是由大量人工和智慧凝结在石油产品上的服务,而这些服务极大地方便并满足了社会各领域对于工业能源、建筑材料、食品包装、服装面料、模型器具、日杂用品等多种制造与使用的需求。

    试想,如果没有石油,也就没有廉价汽车与航空动力,尤其是没有乙烯等重要化工原材料的来源,是否存在塑料这样一种廉价的工业制造材料都很难说,那么各个产业则需要用其他造价更为高昂的材料对其进行取代,更不用提家用的天然气和液化石油气了,人们只能再去寻找其他能源:要么不洁净——如柴火和煤炭,要么价格昂贵——如氢气。人们之所以选用石油作为整个产业链的根源,并把它发展成一个完整的产业也是由于这样的原因,大概这个逻辑是比较容易理解的。

    类比一下“大数据”产业,数据收集、数据传输、数据存储、数据建模、数据分析、数据交易贯穿了大数据产业的完整产业链。在这个产业链里同样蕴含着和“大石油”一样的东西,这个东西是什么?

    数据通过各种软件进行收集,通过网络进行传输,通过云数据中心进行存储,通过数据科学家或者行业专家进行建模和加工,最后数据分析得到的是一种知识,是一种人们通过数据洞悉世界的能力。

    数据之间潜在关系错综负载,会使大量孤立而多来源的数据同时出现在一个舞台,换句话说,大量看似不相关的事情却能够通过观察与分析后告诉人们更多背后的因果。

    这些因果联系的意义会让人们在各个方面能够推测未来趋势,减少试错的机会,减少成本,降低风险,解放劳动力。这才是大数据产业本身的价值与意义所在。
    < 上一篇:没有了 下一篇:大数据市场前景及人才需求 >