分布式数据库中全局自增序列的实现方案解析

solihawk1024 · 2024 年3 月 3 日 17:36

文章探讨了分布式数据库中全局自增序列的实现方式，包括Sequence对象和自增列，并分析了不同数据库的方案及监控策略。

原文标题：分布式数据库中全局自增序列的实现

原文作者：牧羊人的方向

原文链接： http://mp.weixin.qq.com/s?__biz=MzI3MzUzMjIxNA==&mid=2247485594&idx=1&sn=ade134140bf8b9b6af02447aab3dffe7&

冷月清谈：

本文介绍了传统数据库和分布式数据库中实现全局自增序列的两种主要方式：Sequence 对象和自增列。

在传统数据库（Oracle、DB2、MySQL）中，Sequence 对象或自增列能够有效生成唯一 ID，满足主键、流水号等场景的需求。Oracle 和 DB2 使用 CREATE SEQUENCE 语句创建序列，并通过 CURRVAL 和 NEXTVAL 获取当前值和下一个值。MySQL 则通过 AUTO_INCREMENT 属性实现自增列功能，并通过系统变量控制自增列行为。

分布式数据库在兼容传统数据库语法的基础上，也支持 Sequence 对象和自增列，但需要解决分布式架构下的全局一致性问题。OceanBase 和 TiDB 等分布式数据库通过不同的机制实现了全局自增序列。OceanBase 支持 Sequence 对象和自增列，并针对自增列的跳变问题进行了优化。TiDB 也支持 Sequence 对象和自增列，并在新版本中实现了全局单调自增。GoldenDB 和 GaussDB for OpenGauss 依靠 GTM（全局事务管理器）统一分配和管理自增序列，确保全局唯一性。TDSQL for MySQL 支持 Sequence 对象和全局唯一数字序列，但后者在某些场景下可能出现空洞。

最后，文章讨论了非循环自增序列的监控策略，建议对 Sequence 对象的当前值和最大值进行比较，或者通过自定义视图监控自增列的使用情况，以便及时发现潜在问题。

怜星夜思：

1、文章提到了几种分布式数据库的全局自增ID方案，各有优劣。大家觉得在实际应用中，选择哪种方案更合适？有哪些关键的考量因素？
2、对于非循环自增序列的监控，文章提到的方法感觉还是比较基础。有没有更高级的监控方案，比如结合Prometheus、Grafana等工具进行可视化监控？
3、文章主要关注的是数据库层面的实现。在实际应用中，我们如何结合应用层的设计来更好地利用自增序列？比如，如何避免在高并发场景下对数据库的频繁请求？

原文内容

自增序列广泛使用于数据库的开发和设计中，用于生产唯一主键、日志流水号等唯一ID的场景。传统数据库中使用Sequence和自增列的方式实现自增序列的功能，在分布式数据库中兼容Oracle和MySQL等传统数据库语法，也是基于Sequence和自增列的方式实现分布式架构下的全局唯一ID。本文简要介绍了传统数据库和分布式数据库的自增序列实现方式，并且突出NOCYCLE非循环使用的自增序列在监控上的策略。

1、传统数据库的自增序列实现

在关系型数据库的开发过程中，自增序列或自增列使用场景非常广泛，可以生成唯一ID作为主键、生成唯一标识符，也可以生成顺序编号如交易流水号、订单编号等。因此在传统的Oracle、DB2和MySQL等数据库中通过Sequence这一特殊的数据库对象或者自增列的方式实现自增序列，满足应用开发中唯一ID的需求和性能要求。

1.1 Sequence对象实现

1.1.1 Oracle数据库

Sequence是Oracle数据库中的特殊的数据库对象，用于生成唯一的序列。Oracle数据库中创建Sequence语法如下：

CREATE SEQUENCE sequence_name  
    START WITH start_value  
    INCREMENT BY increment_value  
    [NO MAXVALUE] | [MAXVALUE max_value]  
    [NO MINVALUE] | [MINVALUE min_value]  
    [CACHE cache_value]  
    [NO ORDER] | [ORDER]  
    [CYCLE] | [NO CYCLE]  
[RESET ON START] | [NO RESET ON START];

2、分布式数据库中自增序列实现

上文看到在传统数据库Oracle、DB2和MySQL中对自增序列的支持，当然在国产分布式数据库中对传统数据库语法的兼容，也支持通过Sequence对象和自增列的方式实现自增序列。不过与传统集中数据库不同之处是，分布式数据库中如何保证自增序列在分布式架构下的全局一致性。

2.1 OceanBase数据库

OceanBase数据库中支持创建sequence对象和自增列两种方式实现自增序列。

1）Sequence实现

使用CREATE SEQUENCE语句可以创建sequence对象，语法如下：

CREATE SEQUENCE [ IF NOT EXISTS ] [ schema. ] sequence_name
{ START WITH int_value
|[ INCREMENT BY int_value ]
|[ MINVALUE int_value | NOMINVALUE ]
|[ MAXVALUE int_value | NOMAXVALUE ]  
|[ CACHE int_value | NOCACHE ]
|[ ORDER | NOORDER ]
|[ CYCLE | NOCYCLE ]  
}
;

语法上和传统数据库没有什么区别。创建序列后，可以在SQL语句中使用CURRVAL伪列返回序列当前值或使用NEXTVAL伪列返回递增的新值。

Cache指在内存中预分配的自增值个数，默认为20
CYCLE/NOCYCLE：CYCLE为默认值，指定序列在达到其最大值或最小值后无法生成更多值。

2）自增列AUTO_INCRREMENT

OceanBase作为分布式数据库，兼容MySQL的自增列特性，不同的是在分布式多实例的场景下自增列生成会出现跳变。

CREATE TABLE t1(id bigint not null auto_increment primary key, 
c1 varchar(50));
Query OK, 0 rows affected

在OceanBase数据库V4.x版本开始新增了ORDER模式的自增列，以避免NOORDER模式中多机多分区生成自增值和通过INSERT语句插入指定的最大值等比较常用的使用场景下发生自增值跳变的问题。

ORDER模式的自增列会在所有OBServer节点中选取当前集群的Leader作为自增列服务的Leader，其它作为Follower的OBServer节点需要通过发送RPC请求来从作为Leader的OBServer节点处申请自增值，而作为Leader的OBServer节点会从内部表申请自增区间来作为自增缓存。

因此，在大部分场景下和单机MySQL一样可以生成连续的全局自增序列，但是在大并发场景下，ORDER模式的性能会较差。并且在Leader节点重启或宕机、切主等极端情况下，仍然会出现自增值的跳变情况。为了避免切主场景下出现自增值跳变的问题，发生切主的时候会将将原Leader的OBServer节点上的缓存区间清理掉。

2.2 TiDB数据库

1）Sequence使用

TiDB数据库v4.0版本开始支持序列功能，具体语法如下：

CREATE [TEMPORARY] SEQUENCE [IF NOT EXISTS] sequence_name
    [ INCREMENT [ BY | = ] increment ]
    [ MINVALUE [=] minvalue | NO MINVALUE | NOMINVALUE ]
    [ MAXVALUE [=] maxvalue | NO MAXVALUE | NOMAXVALUE ]
    [ START [ WITH | = ] start ]
    [ CACHE [=] cache | NOCACHE | NO CACHE]
    [ CYCLE | NOCYCLE | NO CYCLE]
    [table_options]

Cache：指定每个TIDB实例本地缓存的大小，默认是1000
CYCLE/COCYCLE：指定序列用完之后是否循环使用

定义完Sequence后，可以通过NEXTVAL、LASTVAL获取下一个序列值和上一次使用的序列值，SETVAL可以设置序列的增长返回一个满足增长值的序列值。

SELECT nextval(seq);
SELECT lastval(seq);
SELECT setval(seq, 10);

2）自增列auto_increment

TiDB中兼容MySQL数据库的auto_increment特性，在v6.4.0版本之前TiDB数据库和OceanBase一样存在自增值跳变的问题，v6.4.0版本之后支持在所有TiDB实例上全局单调自增。建表时候创建自增列语法如下：

CREATE TABLE t(id int PRIMARY KEY AUTO_INCREMENT, c int);

TiDB 在v6.4.0版本实现了中心化分配自增ID的服务，当前中心化分配服务内置在TiDB进程，类似于DDL Owner的工作模式。其中有一个TiDB实例将充当“主”的角色提供ID分配服务，而其它的TiDB实例将充当“备”角色。当“主”节点发生故障时，会自动进行“主备切换”，从而保证中心化服务的高可用。

在建表时将AUTO_ID_CACHE设置为1，表示使用MySQL兼容模式，该模式下能保证ID唯一、单调递增，行为几乎跟MySQL完全一致。只有当中心化服务的“主”TiDB实例异常崩溃时，才有可能造成少量ID不连续。这是因为主备切换时，“备”节点需要丢弃一部分之前的“主”节点可能已经分配的ID，以保证ID不出现重复。

2.3 GoldenDB数据库

GoldenDB分布式数据库中的自增序列有sequence和auto_increment两种方式，自增序列值由全局事务节点GTM统一分配和维护管理。

1）Sequence创建

Sequence创建的语法：

CREATE SEQUENCE schema.sequence
INCREMENT BY num
START WITH num
MAXVALUE num | NOMAXVALUE
MINVALUE num | NOMINVALUE
CYCLE | NOCYCLE
CACHE | NOCACHE

SEQUENCE默认CACHE为100，修改步长时会导致当前CACHE丢失。由于SEQUENCE的值是在SQL语句执行之前向GTM申请，语句执行失败的情形下申请的SEQUENCE值不能够回收，所以表中的数据会有不连续的情形。

2）自增列auto_increment

GoldenDB数据库兼容MySQL的自增列特性，在建表时候指定auto_increment即可：

CREATE TABLE t1 (  
    id INT NOT NULL AUTO_INCREMENT,  
    c1 VARCHAR(50) NOT NULL,  
    PRIMARY KEY (id)  
);

GoldenDB数据库中的Sequence和自增列由GTM统一管理，定义后通过dbtool -gtm -show-seq命令可以查看自增列的信息：

dbtool -gtm -show-seq -clusterid=2
Send message to other module successfully!
The response message: RSP Code[0].{0:success; 1:provisional response; other: fail.}
Successful response: 
clusterid|database|name,start,step,minval,maxval,cache,cycle,curvalue
1|testdb1|t_seq,10,10,1,9223372036854775807,5,0,160610
2|testdb2 |seq_test1,1,1,1,9223372036854775807,1,0,16016
~success~

在多并发申请自增列的场景中，GTM会先将请求放到一个队列中，再统一分配自增值，这样可以减少自增序列请求交互的开销、保证自增列的连续性，不过在极少数高并发场景下可能会存在一定的性能瓶颈。

2.4 TDSQL for MySQL数据库

TDSQL for MySQL分布式数据库版本中支持创建sequence和自增列。

1）Sequence支持

TDSQL支持使用sequence，需要注意的是Sequence为保证分布式全局数值唯一，导致性能较差，主要适用于并发不高的场景。语法如下：

CREATE TDSQL_SEQUENCE {DATABASE | SCHEMA} [IF NOT EXISTS] sequence_name
[ TDSQL_INCREMENT BY increment ]
[ START WITH startvalue ]
[ TDSQL_MINVALUE minvalue] | [ TDSQL_NOMINVALUE ] 
[ TDSQL_MAXVALUE maxvalue] | [ TDSQL_NOMAXVALUE ]
[ TDSQL_CACHE cachevalue ] | [ TDSQL_NOCACHE ]
[ TDSQL_CYCLE ] | [ TDSQL_NOCYCLE ]
[ TDSQL_ORDER ] | [ TDSQL_NOORDER ]
-- 查看sequence建表语句
SHOW CREATE TDSQL_SEQUENCE sequence_name;

创建sequence后，可以通过nextval和lastval获取下一个序列值和上一次使用的值：

-- 使用Sequence获取下一个数值
select tdsql_nextval(test.seq2);
select next value for test.seq2;
-- 获取上一次的值
select tdsql_lastval(test.seq2);
select tdsql_previous value for test.seq2;

2）全局唯一序列auto_increment

TDSQL支持全局唯一数字序列（auto_increment）的使用；当前10.3.22版本暂时仅保证自增字段全局唯一和递增性，但是不保证单调递增（也就是OceanBase和TiDB之前版本出现的跳变问题）。全局唯一数字序列（auto_increment）长8字节，最大为18446744073709551616，建表时候创建自增列：

create table auto_inc 
(a int,
b int auto_increment,
key auto(b),
primary key p(a,b)) 
shardkey=a;

通过select last_insert_id()命令获取最新自增值，暂不支持直接从Insert返回包获取。目前select last_insert_id()只能跟shard表和广播表的自增字段一起使用，不支持noshard表。

MySQL [test]> select last_insert_id();
+------------------+
| last_insert_id() |
+------------------+
| 1009 |
+------------------+
1 row in set (0.00 sec)

由于auto_increment仅保证自增字段全局唯一和递增性，如果在节点调度切换、重启等过程中，自增长字段中间会出现空洞。

2.5 GaussDB for OpenGauss数据库

GaussDB分布式数据库（for opengauss）版本中也支持sequence对象和自增列方式实现自增序列，并由GTM（全局事务管理器）统一维护管理，保证序列号全局唯一性。

建表时声明字段的类型为序列整型，由数据库在后台自动创建一个对应的Sequence。
使用CREATE SEQUENCE自定义一个新的Sequence，然后将nextval('sequence_name')函数读取的序列值，指定为某一字段的默认值，这样该字段就可以作为唯一标识符。

1）Sequence对象

GaussDB中Sequence是一个存放等差数列的特殊表，该表受DBMS控制。这个表没有实际意义，通常用于为行或者表生成唯一的标识符。创建语法如下：

CREATE SEQUENCE name [ INCREMENT [ BY ] increment ]
    [ MINVALUE minvalue | NO MINVALUE | NOMINVALUE ] [ MAXVALUE maxvalue | NO MAXVALUE | NOMAXVALUE] 
    [ START [ WITH ] start ] [ CACHE cache ] [ [ NO ] CYCLE | NOCYCLE ] 
    [ OWNED BY { table_name.column_name | NONE } ];

Cache：为了快速访问，而在内存中预先存储序列号的个数，默认为1。
CYCLE/NOCYCLE：用于使序列达到maxvalue或者minvalue后可循环并继续下去。若定义序列为CYCLE，则不能保证序列的唯一性。

在GaussDB中，不建议同时定义cache和maxvalue或minvalue。因为定义cache后不能保证序列的连续性，可能会产生空洞，造成序列号段浪费。如对并发性能有要求，指定参数session_sequence_cache。cache指定了单CN/DN一次向GTM中申请的值；session_sequence_cache指定的是单个会话一次向CN/DN申请缓存的值，会话结束后会自动丢弃。

2）声明字段类型为serial

gaussdb=# CREATE TABLE T1
(
    id    serial,
    name  text
);

在后台会自动创建一个sequence序列。另外，将sequence和一个表的指定字段关联后，当删除那个字段或其所在表的时候会自动删除已关联的sequence。

2.6 自增序列的维护和监控

从上文可以看到各个分布式数据库产品中已经实现了自增序列的功能保证全局唯一性，在实际使用过程中开发关心的是全局序列的唯一性和并发访问时候的性能，从运维视角来看主要是自增序列的使用值监控。Sequence在定义的时候有CYCLE和NOCYCLE两种模式，业务使用场景中不是所有的都能使用CYCLE循环模式，毕竟无法保证它的唯一性。如果是NOCYCLE模式，肯定有个上限，申请的序列值达到上限后，业务访问会报错，如何做好监控和维护？

1）Sequence序列对象的监控

Sequence对象在定义的时候指定了MAXVALUE或者使用系统默认的最大value，通过SQL语句查询当前的VALUE值CURRVAL和最大值比较获得使用率，并以定时任务或脚本方式部署到监控中。有些数据库如GoldenDB和GaussDB中，本身有管理组件GTM对sequence维护管理，由数据库本身实现sequence使用率的监控。

2）自增列的监控

自增列auto_increment随着业务的插入操作，自增值不断增长。在MySQL系列的数据库中，通过自定义视图来监控自增列的使用情况，以下是一个例子：

##1、从information_schema.full_columns中查出table_name,table_schema,column_name,data_type,column_type等信息

##2、根据自增列的data_type得到最大值
case information_schema.full_columns.data_type when ‘tinyint’ then 255 when ‘smallint’ then 65535 when ‘mediumint’ then 16777215 when ‘int’ then 4294967295 when ‘bigint’ then 18446744073709551615)

##3、从表information_schema.full_tables中获取auto_increment使用值

以上是自增序列的监控手段，实际操作过程中需要增加自增序列的使用这一监控指标并定制监控策略。

参考资料：

https://www.oceanbase.com/docs
https://docs.pingcap.com/zh/tidb/stable/
https://cloud.tencent.com/document/product/557/47526
GoldenDB分布式数据库SQL指南
GaussDB云数据库操作指南

Pulse48v · 2024 年12 月 14 日 13:24

除了Prometheus和Grafana，还可以考虑ELK之类的日志分析平台。把自增序列的使用情况记录到日志中，然后通过ELK进行分析和可视化。这种方式可以更详细地记录自增序列的变化趋势，方便排查问题。

BlueJay945 · 2024 年12 月 15 日 13:36

我觉得选择哪种方案要看具体的应用场景。如果对ID的连续性要求很高，比如订单号，那么TiDB 6.4.0以后的版本或者GoldenDB这种由中心节点统一分配的方案可能更合适。但如果并发量非常大，性能优先，OceanBase的NOORDER模式或者TDSQL的自增列方案可能更值得考虑，即使ID会有一些跳跃。

Wisp43b · 2024 年12 月 15 日 23:41

其实我觉得最重要的是要根据实际情况选择合适的监控方案。如果只是简单的监控，文章提到的方法就足够了。如果需要更复杂的监控和分析，那么Prometheus、Grafana、ELK都是不错的选择。关键是要根据自己的需求和技术栈来选择。

Nexus38d · 2024 年12 月 17 日 11:18

如果一定要用数据库的自增序列，可以考虑批量获取ID。比如，一次性从数据库获取100个ID，然后在应用层进行分配。这样可以减少数据库请求的次数，提高效率。

RoaringTiger218 · 2024 年12 月 17 日 13:05

在高并发场景下，可以考虑在应用层实现一个ID生成器，比如使用Snowflake算法或者UUID。这样可以减少对数据库的依赖，提高性能。当然，也要根据具体的业务需求来选择合适的ID生成策略。

Void912s · 2024 年12 月 18 日 00:34

除了文章提到的，我觉得还要考虑数据库本身的特性。比如，如果你的应用本来就是基于MySQL的，那么选择兼容MySQL的TiDB或者TDSQL for MySQL可能更容易迁移和维护。另外，还要考虑数据库的成熟度、社区支持等等。

MidnightOwl519 · 2024 年12 月 18 日 09:41

Prometheus和Grafana确实是不错的选择。可以写一个Exporter，定期查询数据库中的Sequence或自增列信息，然后暴露给Prometheus，最后在Grafana上配置Dashboard进行可视化展示。这样可以更直观地监控自增序列的使用情况，设置告警规则也更方便。

Echo319s · 2024 年12 月 18 日 23:22

还可以考虑使用缓存。将常用的ID预先缓存到Redis之类的缓存数据库中，然后在应用层直接从缓存中获取。这样可以进一步减少数据库的压力。

Celeste49f · 2024 年12 月 19 日 04:26

性能肯定是首要考虑的，尤其在高并发场景下。我之前用过OceanBase，它的NOORDER模式性能确实不错，但ID跳跃有点让人头疼。还有就是维护成本，像GoldenDB和GaussDB的GTM方案，相对来说维护成本会低一些，但也要看GTM的稳定性。