Gartner:2016年数据仓库和数据管理解决方案关键能力报告

2016年7月13日,Gartner公司新发布了2016年《数据仓库和分析型数据管理解决方案关键能力》(Critical Capabilities for Data Warehouse and Data Management Solutions for Analytics)报告。

2016年7月13日,Gartner公司新发布了2016年《数据仓库和分析型数据管理解决方案关键能力》(Critical Capabilities for Data Warehouse and Data Management Solutions for Analytics)报告,该报告由分析师Rick Greenwald、Mark A. Beyer和Roxane Edjlali共同撰写,共对19家数据库厂商进行评估,是2016年2月25日Gartner公司《数据仓库和分析型数据管理解决方案魔力象限报告》(Magic Quadrant for Data Warehouse and Data Management Solutions for Analytics)的姊妹篇。

该报告基于现有客户经验的调查数据评估供应商的能力,帮助数据集成和数据分析负责人选择正确的技术发展信息基础设施,以支持多样化和发展的分析需求。

Gartner这份报告中的分数表示供应商在市场中的地位,当然这些分数都不是绝对的,只能说明在某份具体年度报告中的情况。在今年的研究报告中,对其他数据类型的支持的变化以及调查结果和分析师的研究之间的平衡已受到影响。

Gartner公司将“关键能力”(Critical Capabilities)定义为“在质量和性能上使某类产品/服务形成差异化优势的属性”。该研究报告围绕传统、操作、逻辑和上下文无关的四大数据仓库使用案例对各厂商进行评估。

关键能力用例图

img-gartner-2016dw001

图1 传统数据仓库使用案例的供应商产品分数

img-gartner-2016dw002

图2 操作数据仓库用例的供应商产品分数

img-gartner-2016dw003

图3 逻辑数据仓库用例的供应商产品分数

img-gartner-2016dw004

图4 上下文无关的数据仓库用例的供应商的产品分数

在传统数据仓库使用案例评估中(图1),Teradata获评最高产品得分。Teradata提供数据库管理系统解决方案,数据仓库设备以及云数据仓库解决方案。其产品包括传统和逻辑数据仓库解决方案,这是Teradata所说的统一数据架构(UDA)的一部分。

Teradata在操作数据仓库用例方面的得分也比较高,居MemSQL和IBM之后的第三位。三分之二的Teradata受访者使用该公司操作数据仓库用例的产品。

在操作数据仓库用例的供应商产品分数(图2)评估中,MemSQL获得最高分。今年MemSQL位列操作数据仓库用例榜首,在很大程度上基于连续数据加载和操作型BI查询用例的调查得分。

MemSQL结合基于磁盘的列存储分析,为使用案例提供了一个内存中的数据库管理系统。从用户的角度来看,MemSQL客户报告的平衡允许它在数据科学实验室设置专门高级功能,这对数据科学家和数据挖掘家更有利。但MemSQL客户没有足够的经验应对升级或版本迁移带来的困难。

有三分之二的Teradata受访者使用该公司操作数据仓库用例的产品。越来越多的Teradata应用与Aster和Hadoop相结合,进一步证明了采用Teradata逻辑数据仓库和上下文无关的数据仓库用例的比例依然较高。

在四大数据仓库使用案例类型评估中,除了Teradata和MemSQL有亮眼表现,Oracle、IBM、MapR等供应商的产品也分别位居各项评估分数前列。

传统的数据仓库用户

在今年的关键能力计算中,业务分析师和临时用户被归类为传统的数据仓库用户,而数据科学家和数据挖掘家被归类为发现用户。

今年,Gartner依旧定义了四种基本类型的用户技能集:

数据科学家:统计专家,抽象数学,编程,业务流程,沟通和领导能力。

数据挖掘:数据专家,统计软件,统计模型,充分意识到计算机处理的“陷阱”或错误。

商业分析师:利用联机分析处理和三维工具来创建新的对象,用计算机语言和计算机处理技术。

临时用户:定期使用门户和预置接口,最小可设计三维分析(如果有的话)。

数据仓库四大用例

传统的数据仓库

这个用例涉及管理来自不同结构源的历史数据,数据主要通过批量加载。

传统的数据仓库可以管理大量的数据,主要是用于标准的报告和仪表板。它也用于自由形式的查询和挖掘,或操作查询,但它需要较高的系统可用性和管理能力。

业务数据仓库

此用例管理在应用程序中不断加载的结构化数据,支持应用程序中的嵌入式分析、实时数据存储和操作数据存储。

这种情况下,主要是支持报告和自动查询,并需要高可用性和灾难恢复能力,以满足业务需求。管理不同类型的用户或工作负载,如专案查询和挖掘。

逻辑数据仓库

此用例管理结构化和其他数据类型的数据种类和数据量。

除了来自事务性应用程序的结构化数据,还包括其他内容的数据类型,如机器数据,文本文档,图像和视频。由于附加的内容类型可以驱动大数据量,管理大容量是一个重要的标准。逻辑数据仓库还需要满足不同的查询功能,支持不同的用户技能。这种使用的情况下,可以支持查询其他来源的数据,并不仅仅是来自数据仓库的数据库管理系统。

上下文无关的数据仓库

它表明了新的数据值,数据形式的变体和新的关系。它支持搜索,图形和其他先进的能力,以发现新的信息模型。

这种使用的情况下,主要用于自由形式的查询,预测建模或数据挖掘,以及支持多个数据类型和来源的查询。它没有业务要求,并有利于如数据科学家或业务分析人员等专业人士,可以实现多个数据类型的自由形式的查询。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
小胖的头像小胖编辑
上一篇 2016-08-23 17:21
下一篇 2016-08-25 11:47

相关文章

关注我们
关注我们
分享本页
返回顶部