数据库连接池简析

Published: 04 May 2014 Category: DB

序言

我参与的这些项目都用到了数据库连接池，这自然是有它的原因的。有时候我们可能会忘了当初为什么使用了某种设计模式或者某项技术，因此很有必要从头再推理一遍。每项技术或者技术决策肯定都有它的优势和劣势，如果发现它没有缺点的话，那你最好仔细想想是不是漏掉了什么。

数据库连接的生命周期

数据库的每一个读写操作都需要有一个连接。我们来看下数据库连接的调用流是什么样的：

数据库连接的调用流

调用流程是这样的：

应用程序的数据访问层请求DataSource来获取一个数据库连接。
DataSource使用数据库驱动来打开一个数据库连接。
创建数据库连接，同时打开了一个TCP socket。
应用程序进行数据库的读写。
连接已经不再需要了，因此关闭它。
关闭socket。

很容易可以看到，数据库连接的打开和关闭是非常昂贵的。PostgreSQL会为每个客户端连接分配一个单独的操作系统进程，因此高频率的打开关闭操作会使你的数据库管理系统负担很重。

重用数据库连接最主要的原因是：

减少应用程序与数据库之间创建/销毁TCP连接的开销
减少JVM的垃圾对象。

池还是非池

我们来将不用连接池的实现和HikariCP进行对比，HikariCP应该是最高效的连接池框架了。

测试程序会创建并关闭1000个连接。

private static final Logger LOGGER = LoggerFactory.getLogger(DataSourceConnectionTest.class);
 
private static final int MAX_ITERATIONS = 1000;
 
private Slf4jReporter logReporter;
 
private Timer timer;
 
protected abstract DataSource getDataSource();
 
@Before
public void init() {
    MetricRegistry metricRegistry = new MetricRegistry();
    this.logReporter = Slf4jReporter
            .forRegistry(metricRegistry)
            .outputTo(LOGGER)
            .build();
    timer = metricRegistry.timer("connection");
}
 
@Test
public void testOpenCloseConnections() throws SQLException {
    for (int i = 0; i < MAX_ITERATIONS; i++) {
        Timer.Context context = timer.time();
        getDataSource().getConnection().close();
        context.stop();
    }
    logReporter.report();
}

图中显示的是打开及关闭连接所花费的时间，当然这个时间越短则越好。

数据库连接池的测试

使用了连接池的实现要比没有连接池快600倍。我们的企业级系统中有大量的应用，光是一个批处理的系统每小时就会创建两百万的数据库连接，因此像这样两个数量级差距的优化当然是应该考虑的。

类型	不使用连接池的情况	使用了连接池的情况
最短时间	74.551414	0.002633
最长时间	146.69324	125.528047
平均时间	78.216549	0.128900
标准差	5.9438335	3.969438
中位数	76.150440	0.003218