两种高效的服务器设计模型：Reactor 和 Proactor 模型 - 今日头条

本文由简悦 SimpRead 转码，原文地址 www.toutiao.com

Reactor 模型 Reactor 模式是处理并发 I/O 比较常见的一种模式，用于同步 I/O，中心思想是将所有要处理的 I/O 事件注册到一个中心 I/O

Reactor 模型

Reactor 模式是处理并发 I/O 比较常见的一种模式，用于同步 I/O，中心思想是将所有要处理的 I/O 事件注册到一个中心 I/O 多路复用器上，同时主线程 / 进程阻塞在多路复用器上；一旦有 I/O 事件到来或是准备就绪 (文件描述符或 socket 可读、写)，多路复用器返回并将事先注册的相应 I/O 事件分发到对应的处理器中。

　　Reactor 是一种事件驱动机制，和普通函数调用的不同之处在于：应用程序不是主动的调用某个 API 完成处理，而是恰恰相反，Reactor 逆置了事件处理流程，应用程序需要提供相应的接口并注册到 Reactor 上，如果相应的事件发生，Reactor 将主动调用应用程序注册的接口，这些接口又称为 “回调函数”。用“好莱坞原则” 来形容 Reactor 再合适不过了：不要打电话给我们，我们会打电话通知你。

Reactor 模式与 Observer 模式在某些方面极为相似：当一个主体发生改变时，所有依属体都得到通知。不过，观察者模式与单个事件源关联，而反应器模式则与多个事件源关联。

在 Reactor 模式中，有 5 个关键的参与者：

描述符（handle）：由操作系统提供的资源，用于识别每一个事件，如 Socket 描述符、文件描述符、信号的值等。在 Linux 中，它用一个整数来表示。事件可以来自外部，如来自客户端的连接请求、数据等。事件也可以来自内部，如信号、定时器事件。
同步事件多路分离器（event demultiplexer）：事件的到来是随机的、异步的，无法预知程序何时收到一个客户连接请求或收到一个信号。所以程序要循环等待并处理事件，这就是事件循环。在事件循环中，等待事件一般使用 I/O 复用技术实现。在 linux 系统上一般是 select、poll、epol_waitl 等系统调用，用来等待一个或多个事件的发生。I/O 框架库一般将各种 I/O 复用系统调用封装成统一的接口，称为事件多路分离器。调用者会被阻塞，直到分离器分离的描述符集上有事件发生。
事件处理器（event handler）：I/O 框架库提供的事件处理器通常是由一个或多个模板函数组成的接口。这些模板函数描述了和应用程序相关的对某个事件的操作，用户需要继承它来实现自己的事件处理器，即具体事件处理器。因此，事件处理器中的回调函数一般声明为虚函数，以支持用户拓展。
具体的事件处理器（concrete event handler）：是事件处理器接口的实现。它实现了应用程序提供的某个服务。每个具体的事件处理器总和一个描述符相关。它使用描述符来识别事件、识别应用程序提供的服务。
Reactor 管理器（reactor）：定义了一些接口，用于应用程序控制事件调度，以及应用程序注册、删除事件处理器和相关的描述符。它是事件处理器的调度核心。 Reactor 管理器使用同步事件分离器来等待事件的发生。一旦事件发生，Reactor 管理器先是分离每个事件，然后调度事件处理器，最后调用相关的模板函数来处理这个事件。

可以看出，是 Reactor 管理器并不是应用程序负责等待事件、分离事件和调度事件。Reactor 并没有被具体的事件处理器调度，而是管理器调度具体的事件处理器，由事件处理器对发生的事件作出处理，这就是 Hollywood 原则。应用程序要做的仅仅是实现一个具体的事件处理器，然后把它注册到 Reactor 管理器中。接下来的工作由管理器来完成：如果有相应的事件发生，Reactor 会主动调用具体的事件处理器，由事件处理器对发生的事件作出处理。

应用场景

场景：长途客车在路途上，有人上车有人下车，但是乘客总是希望能够在客车上得到休息。

传统做法：每隔一段时间（或每一个站），司机或售票员对每一个乘客询问是否下车。

Reactor 做法：汽车是乘客访问的主体（Reactor），乘客上车后，到售票员（acceptor）处登记，之后乘客便可以休息睡觉去了，当到达乘客所要到达的目的地时（指定的事件发生，乘客到了下车地点），售票员将其唤醒即可。

为什么使用 Reactor

网络编程为什么要用反应堆？有了 I/O 复用，有了 epoll 已经可以使服务器并发几十万连接的同时，维持高 TPS 了，难道这还不够吗？

答案是，技术层面足够了，但在软件工程层面却是不够的。

程序使用 IO 复用的难点在哪里呢？

1 个请求可能由多次 IO 处理完成，但相比传统的单线程完整处理请求生命期的方法，IO 复用在人的大脑思维中并不自然，因为，程序员编程中，处理请求 A 的时候，假定 A 请求必须经过多个 IO 操作 A1-An（两次 IO 间可能间隔很长时间），每经过一次 IO 操作，再调用 IO 复用时，IO 复用的调用返回里，非常可能不再有 A，而是返回了请求 B。即请求 A 会经常被请求 B 打断，处理请求 B 时，又被 C 打断。这种思维下，编程容易出错。

形象例子：

传统编程方法就好像是到了银行营业厅里，每个窗口前排了长队，业务员们在窗口后一个个的解决客户们的请求。一个业务员可以尽情思考着客户 A 依次提出的问题，例如：

“我要买 2 万 XX 理财产品。“

“看清楚了，5 万起售。”

“等等，查下我活期余额。”

“余额 5 万。”

“那就买 5 万吧。”

业务员开始录入信息。

” 对了，XX 理财产品年利率 8%？”

“是预期 8%，最低无利息保本。“

” 早不说，拜拜，我去买余额宝。“

业务员无表情的删着已经录入的信息进行事务回滚。

” 下一个！“

用了 IO 复用则是大师业务员开始挑战极限，在超大营业厅里给客户们人手一个牌子，黑压压的客户们都在大厅中，有问题时举牌申请提问，大师目光敏锐点名指定某人提问，该客户迅速得到大师的答复后，要经过一段时间思考，查查自己的银袋子，咨询下 LD，才能再次进行下一个提问，直到得到完整的满意答复退出大厅。例如：大师刚指导 A 填写转帐单的某一项，B 又来申请兑换泰铢，给了 B 兑换单后，C 又来办理定转活，然后 D 与 F 在争抢有限的圆珠笔时出现了不和谐现象，被大师叫停业务，暂时等待。

这就是基于事件驱动的 IO 复用编程比起传统 1 线程 1 请求的方式来，有难度的设计点了，客户们都是上帝，既不能出错，还不能厚此薄彼。

当没有反应堆时，我们可能的设计方法是这样的：大师把每个客户的提问都记录下来，当客户 A 提问时，首先查阅 A 之前问过什么做过什么，这叫联系上下文，然后再根据上下文和当前提问查阅有关的银行规章制度，有针对性的回答 A，并把回答也记录下来。当圆满回答了 A 的所有问题后，删除 A 的所有记录。

在程序中：

某一瞬间，服务器共有 10 万个并发连接，此时，一次 IO 复用接口的调用返回了 100 个活跃的连接等待处理。先根据这 100 个连接找出其对应的对象，这并不难，epoll 的返回连接数据结构里就有这样的指针可以用。接着，循环的处理每一个连接，找出这个对象此刻的上下文状态，再使用 read、write 这样的网络 IO 获取此次的操作内容，结合上下文状态查询此时应当选择哪个业务方法处理，调用相应方法完成操作后，若请求结束，则删除对象及其上下文。

这样，我们就陷入了面向过程编程方法之中了，在面向应用、快速响应为王的移动互联网时代，这样做早晚得把自己玩死。我们的主程序需要关注各种不同类型的请求，在不同状态下，对于不同的请求命令选择不同的业务处理方法。这会导致随着请求类型的增加，请求状态的增加，请求命令的增加，主程序复杂度快速膨胀，导致维护越来越困难，苦逼的程序员再也不敢轻易接新需求、重构。

反应堆是解决上述软件工程问题的一种途径，它也许并不优雅，开发效率上也不是最高的，但其执行效率与面向过程的使用 IO 复用却几乎是等价的，所以，无论是 nginx、memcached、redis 等等这些高性能组件的代名词，都义无反顾的一头扎进了反应堆的怀抱中。

反应堆模式可以在软件工程层面，将事件驱动框架分离出具体业务，将不同类型请求之间用 OO 的思想分离。通常，反应堆不仅使用 IO 复用处理网络事件驱动，还会实现定时器来处理时间事件的驱动（请求的超时处理或者定时任务的处理），就像下面的示意图：

这幅图有 5 点意思：

（1）处理应用时基于 OO 思想，不同的类型的请求处理间是分离的。例如，A 类型请求是用户注册请求，B 类型请求是查询用户头像，那么当我们把用户头像新增多种分辨率图片时，更改 B 类型请求的代码处理逻辑时，完全不涉及 A 类型请求代码的修改。

（2）应用处理请求的逻辑，与事件分发框架完全分离。什么意思呢？即写应用处理时，不用去管何时调用 IO 复用，不用去管什么调用 epoll_wait，去处理它返回的多个 socket 连接。应用代码中，只关心如何读取、发送 socket 上的数据，如何处理业务逻辑。事件分发框架有一个抽象的事件接口，所有的应用必须实现抽象的事件接口，通过这种抽象才把应用与框架进行分离。

（3）反应堆上提供注册、移除事件方法，供应用代码使用，而分发事件方法，通常是循环的调用而已，是否提供给应用代码调用，还是由框架简单粗暴的直接循环使用，这是框架的自由。

（4）IO 多路复用也是一个抽象，它可以是具体的 select，也可以是 epoll，它们只必须提供采集到某一瞬间所有待监控连接中活跃的连接。

（5）定时器也是由反应堆对象使用，它必须至少提供 4 个方法，包括添加、删除定时器事件，这该由应用代码调用。最近超时时间是需要的，这会被反应堆对象使用，用于确认 select 或者 epoll_wait 执行时的阻塞超时时间，防止 IO 的等待影响了定时事件的处理。遍历也是由反应堆框架使用，用于处理定时事件。

Reactor 的几种模式

参考资料：Scalable IO in Java

在 web 服务中，很多都涉及基本的操作：read request、decode request、process service、encod reply、send reply 等。

1、单线程模式

这是最简单的单 Reactor 单线程模型。Reactor 线程是个多面手，负责多路分离套接字，Accept 新连接，并分派请求到处理器链中。该模型适用于处理器链中业务处理组件能快速完成的场景。不过这种单线程模型不能充分利用多核资源，所以实际使用的不多。

2、多线程模式（单 Reactor）

该模型在事件处理器（Handler）链部分采用了多线程（线程池），也是后端程序常用的模型。

3、多线程模式（多个 Reactor）

比起第二种模型，它是将 Reactor 分成两部分，mainReactor 负责监听并 accept 新连接，然后将建立的 socket 通过多路复用器（Acceptor）分派给 subReactor。subReactor 负责多路分离已连接的 socket，读写网络数据；业务处理功能，其交给 worker 线程池完成。通常，subReactor 个数上可与 CPU 个数等同。

Proacotr 模型

Proactor 是和异步 I/O 相关的。

在 Reactor 模式中，事件分离者等待某个事件或者可应用或个操作的状态发生（比如文件描述符可读写，或者是 socket 可读写），事件分离器就把这个事件传给事先注册的处理器（事件处理函数或者回调函数），由后者来做实际的读写操作。

在 Proactor 模式中，事件处理者 (或者代由事件分离者发起) 直接发起一个异步读写操作(相当于请求)，而实际的工作是由操作系统来完成的。发起时，需要提供的参数包括用于存放读到数据的缓存区，读的数据大小，或者用于存放外发数据的缓存区，以及这个请求完后的回调函数等信息。事件分离者得知了这个请求，它默默等待这个请求的完成，然后转发完成事件给相应的事件处理者或者回调。

可以看出两者的区别：Reactor 是在事件发生时就通知事先注册的事件（读写由处理函数完成）；Proactor 是在事件发生时进行异步 I/O（读写由 OS 完成），待 IO 完成事件分离器才调度处理器来处理。

举个例子，将有助于理解 Reactor 与 Proactor 二者的差异，以读操作为例（类操作类似）。

在 Reactor（同步）中实现读：

注册读就绪事件和相应的事件处理器
事件分离器等待事件
事件到来，激活分离器，分离器调用事件对应的处理器。
事件处理器完成实际的读操作，处理读到的数据，注册新的事件，然后返还控制权。

Proactor（异步）中的读：

处理器发起异步读操作（注意：操作系统必须支持异步 IO）。在这种情况下，处理器无视 IO 就绪事件，它关注的是完成事件。
事件分离器等待操作完成事件
在分离器等待过程中，操作系统利用并行的内核线程执行实际的读操作，并将结果数据存入用户自定义缓冲区，最后通知事件分离器读操作完成。
事件分离器呼唤处理器。
事件处理器处理用户自定义缓冲区中的数据，然后启动一个新的异步操作，并将控制权返回事件分离器。

现行做法

开源 C++ 框架：ACE

开源 C++ 开发框架 ACE 提供了大量平台独立的底层并发支持类 (线程、互斥量等)。同时在更高一层它也提供了独立的几组 C++ 类，用于实现 Reactor 及 Proactor 模式。尽管它们都是平台独立的单元，但他们都提供了不同的接口。ACE Proactor 在 MS-Windows 上无论是性能还在健壮性都更胜一筹，这主要是由于 Windows 提供了一系列高效的底层异步 API。(这段可能过时了点吧) 不幸的是，并不是所有操作系统都为底层异步提供健壮的支持。举例来说，许多 Unix 系统就有麻烦。因此， ACE Reactor 可能是 Unix 系统上更合适的解决方案。正因为系统底层的支持力度不一，为了在各系统上有更好的性能，开发者不得不维护独立的好几份代码: 为 Windows 准备的 ACE Proactor 以及为 Unix 系列提供的 ACE Reactor。真正的异步模式需要操作系统级别的支持。由于事件处理者及操作系统交互的差异，为 Reactor 和 Proactor 设计一种通用统一的外部接口是非常困难的。这也是设计通行开发框架的难点所在。

ACE 是一个大型的中间件产品，代码 20 万行左右，过于宏大，一堆的设计模式，架构了一层又一层，使用的时候，要根据情况，看从那一层来进行使用。支持跨平台。

设计模式：ACE 主要应用了 Reactor,Proactor 等；

层次架构：ACE 底层是 C 风格的 OS 适配层，上一层基于 C++ 的 wrap 类，再上一层是一些框架 (Accpetor,Connector,Reactor,Proactor 等)，最上一层是框架上服务；

可移植性：ACE 支持多种平台，可移植性不存在问题，据说 socket 编程在 linux 下有不少 bugs；

事件分派处理：ACE 主要是注册 handler 类，当事件分派时，调用其 handler 的虚挂勾函数。实现 ACE_Handler/ACE_Svc_Handler/ACE_Event_handler 等类的虚函数；

涉及范围：ACE 包含了日志，IPC, 线程池，共享内存，配置服务，递归锁，定时器等；

线程调度：ACE 的 Reactor 是单线程调度，Proactor 支持多线程调度；

发布方式：ACE 是开源免费的，不依赖于第三方库，一般应用使用它时，以动态链接的方式发布动态库；开发难度：基于 ACE 开发应用，对程序员要求比较高，要用好它，必须非常了解其框架。在其框架下开发，往往 new 出一个对象，不知在什么地方释放好。

C 网络库：libevent

libevent 是一个 C 语言写的网络库，官方主要支持的是类 linux 操作系统，最新的版本添加了对 windows 的 IOCP 的支持。在跨平台方面主要通过 select 模型来进行支持。

设计模式：libevent 为 Reactor 模式；

层次架构：livevent 在不同的操作系统下，做了多路复用模型的抽象，可以选择使用不同的模型，通过事件函数提供服务；

可移植性：libevent 主要支持 linux 平台，freebsd 平台，其他平台下通过 select 模型进行支持，效率不是太高；

事件分派处理：libevent 基于注册的事件回调函数来实现事件分发；

涉及范围：libevent 只提供了简单的网络 API 的封装，线程池，内存池，递归锁等均需要自己实现；

线程调度：libevent 的线程调度需要自己来注册不同的事件句柄；

发布方式：libevent 为开源免费的，一般编译为静态库进行使用；

开发难度：基于 libevent 开发应用，相对容易，具体可以参考 memcached 这个开源的应用，里面使用了 libevent 这个库。

改进方案：模拟异步

在改进方案中，我们将 Reactor 原来位于事件处理器内的 read/write 操作移至分离器 (不妨将这个思路称为 “模拟异步”)，以此寻求将 Reactor 多路同步 IO 转化为模拟异步 IO。

以读操作为例子，改进过程如下：

注册读就绪事件及其处理器，并为分离器提供数据缓冲区地址，需要读取数据量等信息。
分离器等待事件（如在 select() 上等待）
事件到来，激活分离器。分离器执行一个非阻塞读操作（它有完成这个操作所需的全部信息），最后调用对应处理器。
事件处理器处理用户自定义缓冲区的数据，注册新的事件（当然同样要给出数据缓冲区地址，需要读取的数据量等信息），最后将控制权返还分离器。

如我们所见，通过对多路 IO 模式功能结构的改造，可将 Reactor 转化为 Proactor 模式。改造前后，模型实际完成的工作量没有增加，只不过参与者间对工作职责稍加调换。没有工作量的改变，自然不会造成性能的削弱。对如下各步骤的比较，可以证明工作量的恒定：

标准 / 典型的 Reactor：

步骤 1：等待事件到来（Reactor 负责）
步骤 2：将读就绪事件分发给用户定义的处理器（Reactor 负责）
步骤 3：读数据（用户处理器负责）
步骤 4：处理数据（用户处理器负责）

改进实现的模拟 Proactor：

步骤 1：等待事件到来（Proactor 负责）
步骤 2：得到读就绪事件，执行读数据（现在由 Proactor 负责）
步骤 3：将读完成事件分发给用户处理器（Proactor 负责）
步骤 4：处理数据（用户处理器负责）

对于不提供异步 IO API 的操作系统来说，这种办法可以隐藏 socket API 的交互细节，从而对外暴露一个完整的异步接口。借此，我们就可以进一步构建完全可移植的，平台无关的，有通用对外接口的解决方案。上述方案已经由某公司实现为 TProactor。它有两个版本：C++ 和 JAVA 的。C++ 版本采用 ACE 跨平台底层类开发，为所有平台提供了通用统一的主动式异步接口。

Boost.Asio 类库

Boost.Asio 类库，其就是以 Proactor 这种设计模式来实现

需要 C/C++ Linux 服务器开发学习资料私信 “资料”（资料包括 C/C++，Linux，golang 技术，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK，ffmpeg 等），免费分享