基于 HiKariCP 组件,分析连接池原理 - 今日头条

本文由 简悦 SimpRead 转码, 原文地址 www.toutiao.com

池塘里养:Connection;一、设计与原理 1、基础案例 HiKariCP 作为 SpringBoot2 框架的默认连接池,号称是跑的最快的连接池,数

池塘里养:Connection;

HiKariCP 作为 SpringBoot2 框架的默认连接池,号称是跑的最快的连接池,数据库连接池与之前两篇提到的线程池和对象池,从设计的原理上都是基于池化思想,只是在实现方式上有各自的特点;首先还是看 HiKariCP 用法的基础案例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
import com.zaxxer.hikari.HikariConfig;
import com.zaxxer.hikari.HikariDataSource;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;

public class ConPool {
    private static HikariConfig buildConfig (){
        HikariConfig hikariConfig = new HikariConfig() ;
        // 基础配置
        hikariConfig.setJdbcUrl("jdbc:mysql://127.0.0.1:3306/junit_test?characterEncoding=utf8");
        hikariConfig.setUsername("root");
        hikariConfig.setPassword("123456");
        // 连接池配置
        hikariConfig.setPoolName("dev-hikari-pool");
        hikariConfig.setMinimumIdle(4);
        hikariConfig.setMaximumPoolSize(8);
        hikariConfig.setIdleTimeout(600000L);
        return hikariConfig ;
    }
    public static void main(String[] args) throws Exception {
        // 构建数据源
        HikariDataSource dataSource = new HikariDataSource(buildConfig()) ;
        // 获取连接
        Connection connection = dataSource.getConnection() ;
        // 声明SQL执行
        Statement statement = connection.createStatement();
        ResultSet resultSet = statement.executeQuery("SELECT count(1) num FROM jt_activity") ;
        // 输出执行结果
        if (resultSet.next()) {
            System.out.println("query-count-result:"+resultSet.getInt("num"));
        }
    }
}
  • HikariDataSource 类:汇集数据源描述的相关信息,例如配置、连接池、连接对象、状态管理等;
  • HikariConfig 类:维护数据源的配置管理,以及参数校验,例如 userName、passWord、minIdle、maxPoolSize 等;
  • HikariPool 类:提供对连接池与池中对象管理的核心能力,并实现池相关监控数据的查询方法;
  • ConcurrentBag 类:抛弃了常规池中采用的阻塞队列作为容器的方式,自定义该并发容器来存储连接对象;
  • PoolEntry 类:拓展连接对象的信息,例如状态、时间等,方便容器中追踪这些实例化对象;

通过对连接池中几个核心类的分析,也能直观地体会到该源码的设计原理,与上篇总结的对象池应用有异曲同工之妙,只是不同的组件不同的开发者在实现的时候,都具备各自的抽象逻辑。

https://p26.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/80909a967d504805b5914b25d7d26890?from=pc

通过配置信息去构建数据源描述,在构造方法中基于配置再去实例化连接池,在 HikariPool 的构造中,实例化 ConcurrentBag 容器对象;下面再从源码层面分析实现细节。

容器 ConcurrentBag 类提供 PoolEntry 类型的连接对象存储,以及基本的元素管理能力,对象的状态描述;虽然被 HikariPool 对象池类所持有,但是实际的操作逻辑是在该类中;

1.1 基础属性

其中最为核心的是 sharedList 共享集合、threadList 线程级缓存、handoffQueue 即时队列;

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
// 共享对象集合,存放数据库连接
private final CopyOnWriteArrayList<T> sharedList;
// 缓存线程级连接对象,会被优先使用,避免被争抢
private final ThreadLocal<List<Object>> threadList;
// 等待获取连接的线程数
private final AtomicInteger waiters;
// 标记是否关闭
private volatile boolean closed;
// 即时处理连接的队列,当有等待线程时,通过该队列将连接分配给等待线程
private final SynchronousQueue<T> handoffQueue;

1.2 状态描述

在 ConcurrentBag 类中的 IConcurrentBagEntry 内部接口,被 PoolEntry 类实现,该接口定义连接对象的状态:

  • STATE_NOT_IN_USE:未使用,即闲置中;
  • STATE_IN_USE:使用中;
  • STATE_REMOVED:被废弃;
  • STATE_RESERVED:保留态,中间状态,用于尝试驱逐连接对象时;

容器的基本能力是用来存储连接对象的,而对象的管理则需要很多扩展的跟踪信息,以有效地完成各种场景下的识别,此时就需要借助包装类的引入;

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
// 业务真正使用的连接对象
Connection connection;
// 最近访问时间
long lastAccessed;
// 最近借出时间
long lastBorrowed;
// 状态描述
private volatile int state = 0;
// 是否驱逐
private volatile boolean evict;
// 生命周期结束时的调度任务
private volatile ScheduledFuture<?> endOfLife;
// 连接生成的Statement对象
private final FastList<Statement> openStatements;
// 池对象
private final HikariPool hikariPool;

这里需要注意 FastList 类实现 List 接口,为 HiKariCP 组件自定义,相比 ArrayList 类,出于对性能的追求,在元素的管理时,去掉诸多的范围校验。

基于连接池的常规用法,来看看连接对象具体是如何管理,比如被借出,被释放,被废弃等,以及这些操作下对象的状态转换过程;

上文加载逻辑的描述中,已经提到在构建数据源的时候,会根据配置实例化连接池,在初始化的时候,基于两个核心切入点来分析源码:1. 实例化多少连接对象、2. 连接对象转换包装对象;

在连接池的构造中执行了 checkFailFast 方法,在该方法内执行 MinIdle 最小空闲数的判断,如果大于 0,则创建一个包装对象并放入容器中;

https://p26.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/aca0b636a1604a588c9d93a1c6d1c1df?from=pc

1
2
3
4
5
6
7
public HikariPool(final HikariConfig config) ;
private void checkFailFast() {
    final PoolEntry poolEntry = createPoolEntry();
    if (config.getMinimumIdle() > 0) {
        connectionBag.add(poolEntry);
    }
}

需要注意两个问题,创建的连接包装对象,初始状态是 0 即闲置中;另外虽然案例中设置 MinIdle=4 的值,但是这里的判断大于 0,也只在容器中预先放入一个空闲对象;

从池中获取连接对象时,实际调用的是容器类中的 borrow 方法:

1
2
public Connection HikariPool.getConnection(final long hardTimeout) throws SQLException ;
public T ConcurrentBag.borrow(long timeout, final TimeUnit timeUnit) throws InterruptedException ;

https://p26.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/1cb57f2149954b8e92663b038de63a4a?from=pc

在执行 borrow 方法时,涉及如下几个核心步骤与逻辑:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
public T borrow(long timeout, final TimeUnit timeUnit) throws InterruptedException
{
    // 遍历本地线程缓存
    final List<Object> list = threadList.get();
    for (int i = list.size() - 1; i >= 0; i--) {
       final Object entry = list.remove(i);
       final T bagEntry = weakThreadLocals ? ((WeakReference<T>) entry).get() : (T) entry;
       if (bagEntry != null && bagEntry.compareAndSet(STATE_NOT_IN_USE, STATE_IN_USE)) { }
    }
    // 增加等待线程数
    final int waiting = waiters.incrementAndGet();
    try {
        // 遍历Shared共享集合
        for (T bagEntry : sharedList) {
           if (bagEntry.compareAndSet(STATE_NOT_IN_USE, STATE_IN_USE)) { }
        }
        // 一定时间内轮询handoff队列
        listener.addBagItem(waiting);
        timeout = timeUnit.toNanos(timeout);
        do {
           final T bagEntry = handoffQueue.poll(timeout, NANOSECONDS);
        } 
    } finally {
        // 减少等待线程数
       waiters.decrementAndGet();
    }
}
  • 首先反向遍历本地线程缓存,如果存在空闲连接,则返回该对象;如果没有则寻找共享集合;
  • 遍历 Shared 共享集合前,会标记等待线程数加 1,如果存在空闲连接则直接返回;
  • 当 Shared 共享集合中也没有空闲连接时,这时当前线程进行一定时间的 handoffQueue 队列轮询,可能会有资源的释放,也可能是新添加的资源;

注意这里在遍历集合时,取出的对象都会对状态进行判断和更新,如果得到空闲对象,会更新为 IN_USE 状态,然后返回;

从池中释放连接对象时,实际调用的是容器类中的 requite 方法:

1
2
void HikariPool.recycle(final PoolEntry poolEntry) ;
public void ConcurrentBag.requite(final T bagEntry) ;

https://p26.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/ff0fac854576411b97d834d8ecaf3bf0?from=pc

在释放连接对象时,首先更新对象状态为空闲,然后判断当前是否有等待的线程,在 borrow 方法中等待线程会进入一定时间的轮询,如果没有的话则把对象放入本地线程缓存中:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
public void requite(final T bagEntry) {
    // 更新状态
    bagEntry.setState(STATE_NOT_IN_USE);
    // 等待线程判断
    for (int i = 0; waiters.get() > 0; i++) {
        if (bagEntry.getState() != STATE_NOT_IN_USE || handoffQueue.offer(bagEntry)) { }
    }
    // 本地线程缓存
    final List<Object> threadLocalList = threadList.get();
    if (threadLocalList.size() < 50) {
        threadLocalList.add(weakThreadLocals ? new WeakReference<>(bagEntry) : bagEntry);
    }
}

注意这里涉及到连接对象的状态从使用中转为 NOT_IN_USE 空闲;borrow 与 requite 作为连接池中两个核心方法,负责资源创建与回收;

最后本篇文章并没有站在 HiKariCP 组件的整体设计上构思,只是分析连接池这冰山一角,尽管只是部分源码,但是已经足够彰显出作者对于性能的极致追求,比如:本地线程缓存、自定义容器类型、FastList 等;能被普遍采用必然存在诸多支撑的理由。

|| Gitee 源码仓库 ||

https://p1.toutiaoimg.com/large/tos-cn-i-qvj2lq49k0/8d6fa88df27049f793898dab6440d598

专栏

https://p1.toutiaoimg.com/large/tos-cn-i-qvj2lq49k0/f1e47d9f04dc46408fe443d8cd909fe8

专栏

https://p26.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/089d02595d5540aba3840584dfdefd99?from=pc