分布式唯一ID生成方案
全局唯一ID使用场景分布式系统设计时,数据分片场景下,通常需要一个全局唯一id;在消息系统中需要消息唯一ID标识来防止消息重复;多系统打通需要一个全局唯一标识 (如集团各业务线面对不同用户,需要一个全局用户id)。如何生成一个全局唯一id?UUID概述Universally Unique Identifier 是自由软件基金会组织制定的唯一辨识ID生成标准,大多数系统已实现,如微软的GUID实现。
·
全局唯一ID使用场景
- 分布式系统设计时,数据分片场景下,通常需要一个全局唯一id;
- 在消息系统中需要消息唯一ID标识来防止消息重复;
- 多系统打通需要一个全局唯一标识 (如集团各业务线面对不同用户,需要一个全局用户id)。
如何生成一个全局唯一id?
UUID
概述
- Universally Unique Identifier 是自由软件基金会组织制定的唯一辨识ID生成标准,大多数系统已实现,如微软的GUID实现。
生成格式如:3d422567-f034-4ab4-b98f-a34fd263d0de
实现方案
- /usr/bin/uuidgen
- github.com/google/uuid
优缺点
- 优点:
- 性能高,本地生成,无依赖
- 缺点:
- 生成格式太长,不适合做数据库主键id;
- 基于mac地址生成算法可能导致mac泄露
Sequence表
概述
- 使用DB统一维护一张(N张)发号表, 使用主键自增值生成唯一ID。
生成格式如:1,2,3,4,5…(递增数字)
实现方案
- 表结构
id int(11) NOT NULL AUTO_INCREMENT COMMENT '自增id'
stub varchar(10) NOT NULL DEFAULT '' COMMENT '存根'
- 获取
BEGIN;
insert into sequence (stub) value ('x');
select LAST_INSERT_ID();
COMMIT;
优缺点
- 优点
- ID呈单调自增趋势,满足一些场景如搜索排序;
- 缺点
- 依赖DB,有单节点DB性能瓶颈;
- 如果DB采用主从架构,主从切换时可能会重复发号;
- 生成号码存在递增规律,如可推断出一天的新增订单量,两天在同一时间点分别下单,然后根据订单号相减
优化方案
- 提前从数据库读取一段放到代理服务器内存中,可减少数据库IO操作,提高性能
SnowFlake 雪花算法
概述
- Twitter实现的算法,使用时间戳+机器分配标识+自增序列组成64位数字ID。
生成格式如:1292755860950487050
实现方案
- github.com/sony/sonyflake
优缺点
- 优点
- 使用时间在高位,ID呈现递增趋势,满足一些场景如搜索排序;
- 不依赖其他组件,易于部署维护。
- 缺点
- 依赖机器时钟,因时钟回拨问题会导致发号重复或不可用,代码实现时采用循环等待下一时钟的方式,可能会有性能问题。
优化方案
- 多节点部署时,可使用zookeeper做节点分布式协调 一致性管理,当出现时钟回拨可由zk来同步时间或摘除节点。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献1条内容
所有评论(0)