NoSQL中的分布式、容错事务

2015年01月12日 16:32 133 次阅读 来源: 开源中国 作者: 路人甲
摘要 5年前,术语NoSQL才刚刚开始出现,那时很多 NoSQL 数据库的版本都还不到1.0,对于CAP理论来说,众多NoSQL数据库都选择了可用性要高于一致性的做法。ACID是一个沉重的负担,而BASE则被认为是未来的发展方向。时至今日,社区已经逐渐成熟起来,一些天花乱坠的宣传也都不见了踪迹,新一轮的NoSQL数据库开始寻求重新定义我们对NoSQL的期待,随之而来的是分布式、容错事务又开始出现在了人们...

        5年前,术语NoSQL才刚刚开始出现,那时很多 NoSQL 数据库的版本都还不到1.0,对于CAP理论来说,众多NoSQL数据库都选择了可用性要高于一致性的做法。ACID是一个沉重的负担,而BASE则被认为是未来的发展方向。时至今日,社区已经逐渐成熟起来,一些天花乱坠的宣传也都不见了踪迹,新一轮的NoSQL数据库开始寻求重新定义我们对NoSQL的期待,随之而来的是分布式、容错事务又开始出现在了人们的视野中。

        向分布式、容错事务领域的进军起始于2012年秋季,那时Google发布了Spanner数据库。Spanner是个全局分布式、容错、事务型的NoSQL数据库;这一系列属性在之前则被认为是自相矛盾的。不过,Google击碎了人们的这种误解,宣称他们已经在生产环境下使用该数据库一年多时间了。

        就在Google宣布Spanner数据库的几个月后,HyperDex团队默默地发布了Warp扩展,它为HyperDex带来了分布式、容错的事务功能。这标志着对这种事务的首个开源实现的发布。趋势开始发生了转移,不过还有很长的路要走。

        2013年5月,Kyle Kingsbury在RICON上谈到了Jepsen。在演讲中,Kingsbury披露了各种NoSQL数据库在各种失败情况下的一系列缺陷。甚至诸如MongoDB和Redis(一般情况下人们都认为他们可以保证一致性)这样的数据库都无法信守其承诺。Kingsbury的工作使得社区开始更多地关注于测试与形式化设计,在选择可用性优于一致性时能更好地理解这种折衷。

        出于对一致性的密切关注,FoundationDB发布了其键值存储的1.0版,这是第一个拥有分布式、容错事务支持的私有NoSQL数据库。FoundationDB团队深刻理解严格测试的必要性,同时对其测试框架Lithium给予了高度评价,这使得FoundationDB能够确保ACID特性。后来他们又可以通过Jepsen对FoundationDB进行测试。

        去年又涌现出了两款将支持分布式、容错事务作为设计目标的开源NoSQL数据库。CockroachDB尝试模仿Spanner的地理位置复制事务,它于去年初启动;Treode则在去年6月发布了最初的0.1版。这两个项目都认真地采取了形式化设计,并吸取了很多分布式系统的学术研究成果。

        这些事务型数据库已经逐步对NoSQL世界产生了影响,我们看到一致性的NoSQL数据库正在不断改进自己的承诺。比如说,Redis就面临着持续的压力,在构建器分布式功能时要求专注于形式化设计与测试。最近,Tokutek为MonogoDB发布了其新的Ark一致性算法。Ark基于Raft协议,旨在修复MongoDB已知的一致性问题。

        虽然现在还是Treode与CockroachDB的早期发展时段,但已经有不少公司在生产环境中使用了FoundationDB与HyperDex Warp。分布式、容错事务将会扎根于NoSQL,我们将会看到其产生的影响。


来源:http://www.infoq.com/cn/news/2015/01/distributed-fault-tolerant-nosql

还可以输入136 讨论区:
评 论