世界

虽然对所谓的“大数据革命”进行了大量关注和讨论,但数据本身以及它正在实现令人兴奋的新应用 - 从谷歌的自动驾驶汽车到CSIRO和塔斯马尼亚大学更好的牡蛎养殖者信息系统 - 较少关注基础技术和推动这些技术的人才

大数据运动的核心是一系列下一代数据库技术,这些技术能够以迄今未见的规模和速度积累和分析数据

全球在线服务,如谷歌,亚马逊和Facebook,实时为全球数十亿人提供服务,这是由于新技术将数千个分布式计算机中的任务和文件分开

传统的数据库技术围绕许多信息表构建,例如带有行和列的电子表格,以及以结构化方式询问这些表的问题的方法

询问这些数据集合的问题的结构化方式最初命名为SEQUEL(结构化英语查询语言),后来缩写为SQL

这是Oracle在20世纪70年代开创的技术,从那时起它就成为了无可争议的数据库技术之王

如果您熟悉Excel,那么您将熟悉这种技术适合表示的信息类型

随着时间的推移,公司账户,营销和销售数据当然是完美的

但是,还有其他类型的数据不容易以这种方式存储,例如在社交网络(Facebook)中存储关系,或存储在网络(Google)上的文档索引,或者用于大量数字音乐和视频(Netflix)

幸运的是,还有其他方法可以存储除表格之外的信息,例如树,图表或带索引的列表

其中一些方法更适合于数据集和数据集,这些数据集自然不适合一系列表格

存储和分析大量信息的不断增长的需求以及不易于存储在表格中的信息(非结构化数据)导致这些替代类型的数据库技术的普及迅速增长

他们总是被称为NoSQL技术

此类别中的许多领先技术不是由甲骨文或微软等公司开发的,而是开源的 - 由开放的公司网络和独立的开发人员和贡献者开发,类似于维基百科或Linux的开发方式

下一代NoSQL数据技术有五种关键类型

它们是:并且这些类别中的主要技术分别是:注意Apache Hadoop也是一种领先的技术,不包含在此列表中,因为它是一个框架和文件系统而不是数据库技术(但可以支持许多这些)

通过查看世界各地拥有最多员工技能的公司,我们可以获得对下一代大数据应用程序最前沿组织的独特见解

基于更广泛的研究,下面是一个覆盖40个全球领先组织的地图,这些组织在前五大下一代数据库技术中拥有最多的专家

更详细的逐国分析显示,伦敦的Sky,纽约的高盛等一些组织在这些新兴领域拥有技能的人数领先



作者:苏赋