品觉导读:
1) 列存储数据库采用的不是“表格”,而是若干个列族(column family),其中包含着若干行。不同于RDBMS,你不需要预先知道所有的列,每行也未必拥有相同数量的列。
2)文档数据库并不把数据存储到表格的行和列中,而是存储到文档中,然后将这些文档汇集在集合中。每个文档都可以采用完全有别于其他文档的结构。
3)如果你的数据在大幅增长,就需要快速且有效的扩展性,NoSQL可能会适合你。但如果你的数据结构没有变化,增长速度适中可控,那么SQL技术可能最适合你。
原文翻译:
“SQL过时了。”“关系数据库管理系统(RDBMS)不再能满足企业的数据管理需求。”“NoSQL等新的数据库技术才是适合当今企业的解决方案。”这样的言论甚嚣尘上,无论是在数据库技术行业内部还是外部。但这些话说得对吗?SQL已经过时,而NoSQL才是符合未来发展方向的解决方案吗?
在本文中,我们将概述SQL和NoSQL之间的区别,各种NoSQL技术之间的差异,然后探讨一下RDBMS是否真的过时了。
SQL和NoSQL之间的区别
SQL | NoSQL | |
数据存储 | 存储在关系模型中,由行和列组成。行包含某个特定条目/实体的所有信息,而列是所有的独立数据点。例如,有一行是记录某辆汽车的,这一行里又分为“生产日期”、“型号”、“颜色”等列。 | “NoSQL”这个术语涵盖了多种数据库,每种数据库都有不同的数据存储模型,主要是文档、图形、键值和列存储。下文将讨论它们之间的差异。 |
架构和灵活性 | 每条记录都遵照固定的模式,列在输入数据之前就必须确定和锁定,每行必须包含对应着每列的数据。该架构允许进行事后修订,但会涉及到改变整个数据库和进入脱机状态。 | 采用动态架构。信息可随时添加,每“行”(或对等物)不必包含对应着每“列”的数据。 |
可扩展性 | 扩展是纵向的。基本上,更多的数据就意味着更大的服务器,费用会变得非常昂贵。利用多个服务器来扩展RDBMS 也有可能,但这是一个困难且费时的过程。 | 扩展是横向的,也就是分布于多个服务器上。这些服务器可以是价格便宜的商用硬件或者云实例,因此比纵向扩展更经济。很多NoSQL技术也能在不同服务器之间自动分配数据。 |
ACID合规性(原子性,一致性,独立性,持久性) | 绝大多数的关系数据库都具备ACID合规性。 | 各项技术之间有所不同,但很多NoSQL解决方案为了性能和可扩展性而牺牲了ACID合规性。 |
NoSQL的多面性
如果你认为归属于NoSQL的所有技术都采用相同的数据模型,这个错误是可以原谅的。实际上,NoSQL指的是一整套采取不同方式储存和处理数据的技术的集合。主要的方式包括:
文档数据库
下图来自于文档数据库解决方案CouchDB,很好地总结了RDBMS和文档数据库之间的区别:
文档数据库并不把数据存储到表格的行和列中,而是存储到文档中,然后将这些文档汇集在集合中。每个文档都可以采用完全有别于其他文档的结构。文档数据库的实例包括上文提到的CouchDB以及MongoDB。
键值存储数据库
数据存储于键值对的关联数组中。键是一个属性名,与一个值相关联。常见的键值存储数据库有Redis、Voldemort(由领英网开发)和Dynamo(由亚马逊开发)。
图形数据库
适用于关系可以在图形中得到充分体现的数据。数据被存储到图形结构中,基本构成要素为点(实体)、属性(实体的信息)和线(实体之间的联系)。这类数据库的例子有Neo4J和InfiniteGraph。
列存储(或“宽列存储”)数据库
列存储数据库采用的不是“表格”,而是若干个列族(column family),其中包含着若干行。不同于RDBMS,你不需要预先知道所有的列,每行也未必拥有相同数量的列。列存储数据库最适合用来分析庞大的数据集。著名的列存储数据库有Cassandra和Hbase。
SQL VS. NoSQL——选哪个?
SQL和NoSQL水火不容的想法是错误的,理由并不仅仅是因为很多公司都选择同时使用它们。就像我以前讨论过的所有技术一样,世上真的没有那种“万金油”的方法,要根据用例来选择恰当的技术。如果你的数据需求在迅速变化,就需要高通量来应对快速的增长,如果你的数据在大幅增长,就需要快速且有效的扩展性,NoSQL可能会适合你。但如果你的数据结构没有变化,增长速度适中可控,那么SQL技术可能最适合你。毫无疑问,SQL还没有消亡。
原文:SQL VS.NOSQL- WHAT YOU NEED TO KNOW
来源:http://dataconomy.com/sql-vs-nosql-need-know/
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。