这可能是讲分布式系统最到位的一篇文章( 八 )


 
而网络问题又是一定会出现的异常情况,分区容错性也就成为了一个分布式系统必然需要面对和解决的问题 。
 
系统架构师往往需要把精力花在如何根据业务特点在一致性和可用性之间寻求平衡 。
 
集中式系统,通过数据库事务的控制,能做到数据的强一致性 。但是分布式系统中,涉及多服务间的调用,通过分布式事务的方案:

  • 两阶段提交(2PC)
  • 三阶段提交(3PC)
  • 补偿事务(TCC)
  • ...
 
虽然能实现数据的强一致,但是都是通过牺牲可用性来实现 。
 
BASE 理论
 
BASE 理论是对 CAP 原则中一致性和可用性权衡的结果:Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent(最终一致性) 。
 
BASE 理论,其来源于对大规模互联网系统分布式实践的总结,是基于 CAP 原则逐步演化而来的 。
 
其最核心思想是:即使无法做到强一致性,但每个应用都可以根据自身业务特点,采用适当的方式来使系统达到最终一致性 。
 
基本可用:是指分布式系统在出现不可预知故障的时候,允许损失部分可用性,这不等价于系统不可用 。
 
软状态:指允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据同步的过程存在延时 。
 
最终一致性:强调的是所有的数据副本,在经过一段时间的同步之后,最终都能够达到一致的状态 。
 
因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性 。
 
总的来说,BASE 理论面向的是大型高可用可扩展的分布式系统,和传统的事物 ACID 特性是相反的 。
 
它完全不同于 ACID 的强一致性模型,而是通过牺牲强一致性来获得可用性,并允许数据在一段时间内是不一致的,但最终达到一致状态 。
 
同时,在实际的分布式场景中,不同业务单元和组件对数据一致性的要求是不同的,因此在具体的分布式系统架构设计过程中,ACID 特性和 BASE 理论往往又会结合在一起 。
 
结语
 
分布式系统涉及到的东西还有很多,如:分布式锁、定时调度、数据分片、性能问题、各种中间件的使用等,笔者分享只是了解到的那一小部分的知识而已 。
 
之前本着学习的目的也写过一个非常简单的分布式服务框架 blackRpc,通过它了解了分布式服务框架内部的一些活动 。
 
本文中所有代码都能在该项目中找到,有兴趣读者可以看看:
https://github.com/wangshiyu/blackRpc
【这可能是讲分布式系统最到位的一篇文章】


推荐阅读