从横切到纵切,架构模式CQRS,提高系统进化能力

(168) 2024-04-11 09:01:01

曾几何时,你是否疑惑于VO、PO、DTO、BO、POJO、Entity、MODEL的区别?

你是否有过疑问,为什么Java里有这么多的以O为名称结尾的对象?!

你是否也厌倦了编写从这个O对象到那个O对象之间的转换代码?!

你有没有想过,这一切的根源在哪里呢?有没有办法解决这个问题呢?

本文试图给你答案!

分层架构的「原罪」

在架构风格:万金油CS与分层一文中提到,分层架构是个万金油架构,当你无法确定该使用哪种架构风格的时候,那么可以先使用分层架构。而实际上确实是这样,大部分的应用都采用了分层架构,特别是web应用。

以最简单的三层架构来说:

  • 展示层:展示数据给用户

  • 逻辑层:处理业务逻辑

  • 持久层:持久化数据

每一层都负责各自的任务、职责单一,开发也就相对简单。每一层相对独立,所以都能够独立进化,这是分层架构所宣称的优势!也是其「原罪」!

分层架构虽然将系统按层进行划分,但是层与层之间还是需要进行交互的。交互就需要有接口或协议以及传输的数据。

对于外部调用,我们可以使用TCP、HTTP、RPC、WebService等方式来进行通信;而对于内部交互来说,我们可以直接使用方法调用,使用接口来进行解耦。

但是传输的数据结构该如何定呢?

  • 第一种方式是直接使用基础数据结构,比如Map?这有几个问题:

  • 没有代码提示,包括IDE层面的提示以及业务层面的字段提示,手误的几率较大。将编译期的错误延后到了运行期,降低了开发效率

  • 没有较完备的基础设施,例如基于注解的字段校验

  • 性能相对对象会差一点

  • 第二种方式是使用一个对象进行传递,例如ActiveRecord或者直接使用Model。但是这会使各层强耦合,使得分层架构的优势消失。由于每层的进化速度不同:持久层相对比较稳定;逻辑层可能需要根据业务逻辑的不同而进行调整,例如打折策略;而展示层可能需要过一段时间调整,避免审美疲劳。其中一层对传输对象的调整都可能导致其它层跟着一起修改。

  • 第三种方式就是上面说的使用各种传输对象:各层之间的数据传输使用独立的传输对象,使得各层松耦合。但是增加了各种传输对象以及转换代码。同时转换也消耗了部分性能。

各层的独立进化,导致了交互的额外操作!这就是分层架构的「原罪」!也是需要这么多传输对象的其中一个原因!

而另外一个原因是表现力差异!

再谈表现力

在领域设计:聚合与聚合根聊到了表现力问题,「数据设计」的表现力要弱于「对象设计」!相对应的,其实「数据展现」的表现力也是弱于「对象设计」的!

我们还是以订单来举例!假设我下单购买了多个商品,也就是说一个订单包含了多个明细。那么订单与订单明细的这层关系在「持久层」是通过主键来表现的:

从横切到纵切,架构模式CQRS,提高系统进化能力 (https://mushiming.com/)  第1张

 

订单明细包含了订单的主键,表示哪些订单明细是属于哪个订单的。

而这层关系在「逻辑层」是通过对象引用来表现的:

从横切到纵切,架构模式CQRS,提高系统进化能力 (https://mushiming.com/)  第2张

 

订单对象中持有了指向订单明细列表的引用。

而到了「展示层」,订单和订单详情之间的关系就完全靠展示方式来表现了:

从横切到纵切,架构模式CQRS,提高系统进化能力 (https://mushiming.com/)  第3张

 

如果你不了解业务,光看代码,是看不出订单与订单明细之间的关系的。上面只是纯粹的展示了订单明细在订单信息的下面。

也就是说,当我们访问页面的时候,请求从「持久层」将扁平的数据查询到了「逻辑层」,组装成了结构化的对象,最后被传递到了「展现层」,又被拍扁了展示在我们面前。

由于每层表现形式的不同,亦导致了需要数据传输对象。

从横切到纵切

既然横向封层不可避免的需要数据传输对象来解耦各层之间的关系,那我们是否不使用横向封层,而使用纵向切分呢?这就是CQRS架构模式!

CQRS通过对系统进行纵向切分:将「数据读」和「数据写」分离开,使得数据读写独立进化,来解决数据显示复杂性问题。

CQRS架构如下:

从横切到纵切,架构模式CQRS,提高系统进化能力 (https://mushiming.com/)  第4张

 

流程如下:

  • 客户端构建命令对象CommandModel发送给服务端

  • 服务端通过命令总线CommandBus接收到命令,委托给对应的CommandHandler去处理

  • CommandHandler处理完业务,将此命令通过Repository进行持久化(不一定是DB,下面会具体说)

  • 同时会构建一个对应的事件Event,添加到事件总线EventBus中(该事件可以是同步事件、也可以是异步事件)

  • 对应的EventHandler会对该事件进行处理,比如处理成便于展示的模型,存储到ReadDB中

  • 客户端可以对服务端发送查询,服务端直接从ReadDB中获取数据,构建QueryModel返回

这又什么优势呢?

  • 首先,现在只需要CommandModel和QueryModel两个数据传输对象,不再需要那么多的中间传输对象了。也就是说,省略了这部分的代码和性能损耗。

  • 其次,读写分离,可以对读写进行专门的优化。

  • 最后,就是可以事件溯源EventSourcing。这个我们来详细说一下。

我们以订单保存和展示流程来详细的看一下CQRS的优势!

对于普通分层架构来说,在保存订单时需要一个DTO用于存储相关信息,然后转成多个对应的Model来进行持久化;而查询订单的时候,你需要查询出多个Model,然后组装成另一个DTO来存储查询的信息,因为展示的时候可能要展示更多的信息,比如买家和卖家相关信息。

同时由于数据都存储在数据库中,且表结构与Model是对应的,你能做的优化就是数据库相关的优化手段。

而在CQRS中,数据库被分成了读库和写库。那存在读库中的数据结构就可以完全按照展示逻辑来优化,比如:我可以有一张订单展示表,表中包含了买家信息和卖家信息。在展示时,直接查询这张表就可以了,不需要和用户表进行关联查询,提高了数据读性能。

而对于数据持久化来说,就不需要考虑数据展示了,只要提高持久化性能就可以了。例如不使用数据库,而使用顺序写入的文件方式。同时也不一定要存储数据本身,转而存储事件,就可以实现事件重演,这就是事件溯源。

事件溯源

在领域设计:Entity与VO一文中,提到了「状态」!

一般我们处理状态都是直接去修改它,像下面这样:

从横切到纵切,架构模式CQRS,提高系统进化能力 (https://mushiming.com/)  第5张

 

那么请问,这个开关刚才经历了什么?!这是典型的ABA问题,即你只知道这个开关目前的状态,但是它曾经有没有开过或关过,你就无从得知了。

我们对数据的处理也是这样,你只知道当前存在数据库中的数据是什么,而它曾经被修改过没有?被修改成过什么,你无从知晓。

因为我们存的只是「即时状态」,即「快照」!

事件溯源存储的不是数据「快照」,而是「事件本身」!即它记录了所有对该数据的事件。

如果你了解Redis的持久化方案,你对事件溯源就一定不会感到陌生。Redis有两种持久化方式RDB方式和AOF方式:

  • RDB:在指定的时间间隔内,执行指定次数的写操作,则会将内存中的数据写入到磁盘中。对当前数据快照进行持久化

  • AOF:将指令追加到文件末尾。通过指令重演来恢复数据

我们一般的持久化方式实际对应的就是Redis的RDB方式,而事件溯源就是AOF方式。

回到上图,在CQRS中,WriteDB可以通过类AOF的方式来存储命令,也就是事件溯源。当需要对ReadDB中的数据进行恢复操作时,可以通过命令重演的方式来恢复。

不过你应该发现问题了,命令重演的方式性能上有问题。所以我们可以参考Redis,使用快照+事件溯源的方式来存储。即WriteDB中存储事件,额外再定时对数据进行快照备份。恢复数据时先通过快照备份恢复,再从指定位置进行命令重演,来提高性能。

强一致性or最终一致性

读写分离后,导致的一个问题就是读写一致性。在原来的分层架构中,数据写入后再读取,是可以立即读取到写入的数据的(事务保障)。

但是读写分离后,读到的数据不一定是写入的最新数据。一般情况下,这个问题并不大。因为实际上你读的基本上都是历史数据!为什么这么说呢?因为你没法保证数据在展现到你面前的过程中,没有新的写入。除非展示是基于推送机制的。

但是对于特殊情况下,可能不能容忍这样的情况。有几种解决方案:

  • 临时性的显示先前提交给命令模型的参数

  • 在页面展示查询模型的时间

  • 使用类似Comet这样的长链接的方式或者事件模式来监听数据

     

    参考资料

  • CQRS:https://martinfowler.com/bliki/CQRS.html

  • 《实现领域驱动设计》

THE END

发表回复