全局唯一ID使用场景

  • 分布式系统设计时,数据分片场景下,通常需要一个全局唯一id;
  • 在消息系统中需要消息唯一ID标识来防止消息重复;
  • 多系统打通需要一个全局唯一标识 (如集团各业务线面对不同用户,需要一个全局用户id)。

如何生成一个全局唯一id?

UUID

概述

  • Universally Unique Identifier 是自由软件基金会组织制定的唯一辨识ID生成标准,大多数系统已实现,如微软的GUID实现。

生成格式如:3d422567-f034-4ab4-b98f-a34fd263d0de

实现方案

  • /usr/bin/uuidgen
  • github.com/google/uuid

优缺点

  • 优点:
    • 性能高,本地生成,无依赖
  • 缺点:
    • 生成格式太长,不适合做数据库主键id;
    • 基于mac地址生成算法可能导致mac泄露

Sequence表

概述

  • 使用DB统一维护一张(N张)发号表, 使用主键自增值生成唯一ID。

生成格式如:1,2,3,4,5…(递增数字)

实现方案

  • 表结构
id int(11) NOT NULL AUTO_INCREMENT COMMENT '自增id'
stub varchar(10) NOT NULL DEFAULT '' COMMENT '存根'
  • 获取
BEGIN;
insert into sequence (stub) value ('x');
select LAST_INSERT_ID();
COMMIT;

优缺点

  • 优点
    • ID呈单调自增趋势,满足一些场景如搜索排序;
  • 缺点
    • 依赖DB,有单节点DB性能瓶颈;
    • 如果DB采用主从架构,主从切换时可能会重复发号;
    • 生成号码存在递增规律,如可推断出一天的新增订单量,两天在同一时间点分别下单,然后根据订单号相减

优化方案

  • 提前从数据库读取一段放到代理服务器内存中,可减少数据库IO操作,提高性能

SnowFlake 雪花算法

概述

  • Twitter实现的算法,使用时间戳+机器分配标识+自增序列组成64位数字ID。

生成格式如:1292755860950487050

实现方案

  • github.com/sony/sonyflake

优缺点

  • 优点
    • 使用时间在高位,ID呈现递增趋势,满足一些场景如搜索排序;
    • 不依赖其他组件,易于部署维护。
  • 缺点
    • 依赖机器时钟,因时钟回拨问题会导致发号重复或不可用,代码实现时采用循环等待下一时钟的方式,可能会有性能问题。

优化方案

  • 多节点部署时,可使用zookeeper做节点分布式协调 一致性管理,当出现时钟回拨可由zk来同步时间或摘除节点。
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐