Gartner数据库报告解读及数据库技术发展方向预测


联盟会员单位SequoiaDB巨杉数据库入选Gartner “2017年数据库厂商推荐报告”。SequoiaDB巨杉数据库第一时间对Gartner数据库报告进行了解读,并介绍数据库技术发展创新的方向。

 

Gartner报告解读

 

近期,国际知名行业分析机构Gartner发布了“2017年数据库厂商推荐报告”(Other Vendors to Consider for Operational DBMSs 2017)。自Gartner发布数据库行业报告以来,第一次收录了来自中国的数据库厂商,分别是阿里云Alibaba Cloud、SequoiaDB巨杉数据库以及南大通用Gbase,标志着中国数据库产业发展已经迈出了一大步。

 

本次报告收入的中国数据库厂商,除了阿里云这样的大型互联网公司的数据库产品,也同样出现了专注于数据库和企业级市场的SequoiaDB巨杉数据库和南大通用Gbase,这也充分证明中国的数据库技术在互联网行业以外得到了全球的高度认可。

 

以下是Gartner对于三家中国企业的介绍:


1. Alibaba Cloud 阿里云


Based in Hangzhou, China, Alibaba Cloud offers several operational DBMSs under its ApsaraDB dbPaaS brand. ApsaraDB for RDS (Relational Database Service) supports EnterpriseDB Postgres Plus Advanced Server (PPAS), Microsoft SQL Server, MySQL and PostgreSQL. ApsaraDB for MongoDB provides monitoring and backup services for MongoDB Community Edition. ApsaraDB for Redis provides highly available Redis instances compatible with existing tools and clients. In our reference survey, Alibaba Cloud was one of only a few vendors scoring above the mean for all criteria and very high for security.

 

对于阿里云,Gartner主要看重的是阿里云RDS(AsparaDB)在云数据库方面的覆盖能力,集成和整合了市面上所有主流数据库产品的特性,阿里云也是少数实现覆盖所有数据库功能特性的产品之一。

 

2. SequoiaDB 巨杉数据库


SequoiaDB, based in Guangzhou, China, offers a highly available, distributed SQL multimodel DBMS that is designed to scale geographically and elastically. SequoiaDB also supports a block storage engine for content and file management use cases. Finally, SequoiaDB supports an MPP- style architecture for analytics processing. SequoiaDB had very high survey scores for service and support, ease of operation and programming, value for the price and high availability, with all respondents showing zero downtime.

 

SequoiaDB巨杉数据库作为分布式、多模型(Multimodel)、高可用的SQL数据库,针对内容和文件的非结构化数据管理引擎、跨地域分布式部署和灵活扩展的能力,以及基于Mpp分布式架构的数据分析操作等方面获Gartner高度认可。与阿里云不同的是,SequoiaDB在稳定性和企业级支持服务、开发应用友好度、性价比和高可用安全等方面的评价非常高。

 

3. Gbase南大通用


Based in Tianjin, China, General Data Technology offers GBase 8m, an on-premises in-memory, high-concurrency transactional RDBMS. GBase 8m supports high availability, multiversion concurrency control (MVCC), and provides autoscaling at runtime. The company also offers GBase 8a, a massively parallel processing (MPP) analytic engine for OLAP and data warehousing use. General Data Technology had high scores for security, value of the product, pricing model and professional services. Respondents also reported that implementation was very fast. GBase 8m, whose users are primarily in Asia/Pacific, did not meet the geographic distribution requirements for inclusion in the 2017 Magic Quadrant.

 

南大通用的8m内存数据库以及8a Mpp OLAP数据库/数仓产品得到了推荐。 两款产品的性能和安全、定价和服务获得较高的认可,但是在用户全球化分布方面明显处于弱势地位。

 

评选标准:


Gartner对于技术厂商和产品的选拔要求十分严格,不仅考察技术先进性、产品成熟度,还要考察企业的市场规模、营收状况,同时也考察大型企业的应用案例和客户全球化布局。

 

其中,金融等行业用户的认可是重要的评价条件之一。 金融行业在企业级技术和应用中一直保持领先,金融行业的技术体系也一直在政府和监管部门的严格监管下不断的发展。金融行业正在转变为“技术驱动型行业”,但是整个行业的IT和数据管理系统的迭代演进却十分谨慎,既要满足严格的监管要求,同时还要在保证稳定情况下兼容复杂的传统系统。

 

数据库技术发展展望

 

Gartner今年的多份报告中认为数据库未来需要在以下几个方面进行创新:

  • 分布式架构

  • Multimodel多模数据管理

  • 数据安全

  • 混合访问HTAP

  • 云架构整合

 

特别是Multimodel多模数据管理,是近年来数据库发展的重要新要求。

 

1. 分布式架构


分布式架构是数据库发展的大势。分布式架构显著提升大容量数据存储和管理能力,既保障面对大量用户的高并发需求,又保障了面对业务变化的弹性增长能力。分布式数据库的使用成本,也远低于传统数据库。

 

分布式数据库则可以用于复制传统的事务数据,以便通过增加移动访问和工作人员的分布来实现更高容量,只读需求,从而快速方便地访问传统的事务数据。例如,商业银行使用分布式数据库向网上银行用户提供交易信息访问查询。这从传统的数据库环境中消除了一些负载,从而降低了处理需求,降低了成本。传统关系型数据库产品,仅仅考虑在单个服务器上运行,然后通过ACID的特性来维护数据完整性,但是他们的设计和技术却没有考虑海量数据下的容量扩展。

 

对于数据库来说,分布式架构的优势十分明显:

  • 弹性扩容提升性能:需要弹性地扩容以应对PB级别以上的数据管理,这种弹性容量调整可以实现让所有数据保持在线。同时满足高并发业务操作需求,实现海量数据高性能读写以及实时访问查询。

  • 高可用与数据安全:分布式架构数据高可用保障。除了经典的主-从架构,数据库和存储方面还有类似Ceph的纠删码google spanner的原子钟分布式算法等等方式。

  • 简化开发运维节约成本。随着应用的增多,更需要分布式架构支持,进行数据分区管理,实现业务有效隔离。同时,保持系统的弹性、兼容性,大大简化运维开发。

 

2. Multi-Model 多模数据与非结构化数据


随着应用和业务的多样化,系统对于多类型数据的管理能力提出了新的要求。Multi-Model多模是指在单个数据库平台中支持非结构化结构化数据在内的多种数据类型。

 

一直以来,传统关系型数据库仅支持表单类型的结构化数据存储和访问能力,而对于层次型对象、图片影像等半结构化与非结构化数据管理无能为力。如今,随着应用类型的多样化和存储成本的降低,单一数据类型已经无法满足许多综合性业务平台的需求,例如,许多企业应用需要处理图表以及关系数据,这些平台需要能支撑Multi-Model多模数据管理的产品。一些传统的数据库产品能够处理XML和面向对象数据类型,Oracle这样的产品现在也渐渐开始支持JSON,甚至图形和键值K-V数据。

 

特别对于非结构化数据,当前企业管理的结构化数据只占信息总量的15%,而剩下85%的信息是非结构化数据。对于非结构化数据,企业需要实现数据的统一管理,并实现数据共享和数据流转,需要应对数据总量的飞速增长,同时还需要应对数据激增带来的管理成本和使用成本的快速增长。如金融企业在互联网金融等等新需求下,随着银行远程开户、柜面无纸化、面部识别等系统的建立和升级正在面临大量不同类型的非结构化数据(如图片,视频和文件)带来的挑战。

 

数据库层面的Multi-Model和非结构化数据管理,将能实现结构化、半结构化和非结构化数据的统一管理,实现非结构化数据的实时访问,大大降低了运维和应用的成本。

 

3. 容灾与双活与数据安全


伴随着在企业内部价值的不断提升,数据已经成为了金融企业的生命线与核心资产。作为承载着企业关键数据的数据库,其安全性、可靠性、稳定性一直是金融级数据库的核心价值。

 

但是,在分布式架构中完美实现高可用与容灾面临着诸多技术挑战。一般来说,以统计分析为目标的分布式数据库相对弱化了该部分的功能,而面向在线与交易业务的分布式数据库则对数据安全保持了高标准的严格要求。

 

高可用性是所有现在新的数据架构必备特性之一。高可用对于银行这样的企业级用户更是重要,中国银行业监督管理委员会要求所有银行数据中心必须进行高可用备份,包括数据中心的“两地三中心”能力,也就是银行数据存储管理整体架构的分布式架构转型成为了标准要求。这其中,数据库的分布式转型就将成为数据管理现代化的首要任务。

 

大多数银行数据中心还需要“双活”容灾的能力,即在两个数据中心实时进行备份,一旦失去一个中心,所有业务可以及时切换中心继续运行。同时,通过数据中心“双活”,在保证数据安全下,也将数据存储,数据处理的高可用性和灾难恢复相结合,这样数据管理可以以更低的成本实现连续的可用性,并以最少的努力最大限度地利用“双活”的数据中心。

 

4. HTAP混合事务/分析处理模式


新的业务需求下,数据库除了应对操作型业务,还会在业务实时数据监控,数据报告和决策辅助方面有许多数据实时应用的场景。传统架构中OLTP和OLAP两类业务是完全分离的。两者的隔离导致整个系统在数据一致性,数据平台管理上带来了巨大的阻碍。此前, RDBMS和大数据(Hadoop)分别成为数据处理的两个方面,一旦一种架构选择了一种场景,就不得不放弃另一种场景。

 

因此,HTAP混合事务/分析处理模式成为数据库发展的一个新要求。

 

根据Gartner的最新定义,混合负载(HTAP Hybrid Transactional/Analytical Processing)在保留原有在线交易功能的同时,也强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。

 

为了避免在线实时读写与批处理作业之间的资源干扰,混合负载型数据库通常使用读写分离或内存处理技术实现。一般来说,分布式数据库的多副本架构天然支持读写分离技术,而基于传统架构的数据库往往采用内存处理技术进行实现。


5. 云架构整合能力 


云架构整合对于数据库未来发展也是一个比较重要的特性,虽然分布式架构下是原生支持云架构的,但是对于数据库云DBaaS来说,仍有许多新的要求。

 

对于数据库云服务的定义,是具有一定程度自助服务的可伸缩的,弹性的多租户订阅服务。它由云服务提供商(CSP)本身或是基于了CSP的基础架构的第三方软件供应商提供的产品或是服务。同时数据库云服务,是不允许直接访问后台底层的系统服务如操作系统和存储软件的。这一领域上,Gartner也有意将DBaaS划分在 PaaS的层面,与IaaS或者IaaS+区分开。

 

对于DBaaS,除了基础的数据库功能,云架构下需要具备的能力还包括基础设施的管理,自主管理监控,多租户管理,快速扩容,在线升级等等。


供稿:SequoiaDB巨杉数据库

校对:王红玉

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

相关文章
相关标签/搜索