专业的JAVA编程教程与资源

网站首页 > java教程 正文

Java 的随机 UUID 真的是唯一的吗?

temp10 2024-09-08 09:28:56 java教程 10 ℃ 0 评论

Java的java.util.UUID类表示一个不可变的全局唯一标识符(UUID)。特别地,这个类的静态方法randomUUID()用于生成UUID,这在分布式系统中可作为唯一标识符使用。但是,这种UUID真的是唯一的吗?调用randomUUID()方法多次生成相同UUID的几率有多大?在分布式系统中进行这样的调用会产生重复标识符的几率又是多少呢?

UUID

RFC4122详细说明了完整的UUID规范。一个全局唯一标识符(UUID)代表一个128位的值,即16个字节。两个最重要的字段决定了UUID的结构:

Java 的随机 UUID 真的是唯一的吗?

  • 变体(Variant):变体字段决定了UUID的布局。变体字段由UUID的第8个字节的最高有效位的可变数量组成。Java的java.util.UUID类默认实现了变体2(Leach-Salz变体),因此,第8个字节的最高有效位的模式10x代表这个变体。
  • 版本(Version):UUID的版本号位于UUID的第7个字节的最高有效4位。不同的版本表示不同类型的UUID:基于时间的(版本1)、DCE安全(版本2)、基于名称的(版本3)、随机或伪随机生成的(版本4)、基于名称使用SHA-1(版本5)。

Java的java.util.UUID.randomUUID()生成的是类型4(伪随机生成)的UUID。这种UUID是使用加密强度高的伪随机数生成器(在Java中使用SecureRandom类)生成的。一个生成的UUID示例是c6725645-ccbf-4f98-ae9e-e91eddb3d6b2,其中粗体的“4”代表版本4,粗体的“a”代表变体2。

版本4的UUID是随机生成的。如我们所见,UUID总共128位中,有6位(变体的2位+版本的4位)是固定的。因此,随机生成部分由122位组成,这意味着可以有2122种可能的UUID。

生日问题

生日问题是概率论中一个著名的问题,它可以帮助我们理解UUID的唯一性问题:在n个随机选定的人中,至少有两个人拥有相同生日的概率是多少。

假设房间里有30个人。我们定义两个事件:

A:这30个人中的两个人共享他们的生日。

B:房间里的任意两个人都没有相同的生日。

我们将这个结果推广,如果房间里有n个人,总共有m个可能的生日,那么:


因为我们对版本4随机UUID的唯一性感兴趣,生日问题可以用来找到必须生成的UUID数量n与找到重复UUID的概率p之间的关系。注意,UUID中随机生成的总位数m = 2122。

对上述关系的两边取对数,我们可以得到:

UUID 的唯一性

在前一部分推导出的关系基础上,我们来看几组n和p的值:

当n = 23?时,p = 1.1 * 10?1?

当n = 2?1时,p = 4.5 * 10?13

当n = 2??时,p = 4.6 * 10?1?

有趣的是,据估计,一个人一年内被陨石击中的风险是170亿分之一(即6*10?11),这大约等同于生成数万亿个UUID后出现一个重复的概率。

在103万亿个UUID中找到一个重复的概率是十亿分之一。为了达到50%的重复概率,需要生成的UUID数量大约为2.71101?,即2.71亿亿个,这大约等同于每秒生成一亿个UUID,持续约86年(2.7110?秒)。

因此,我们已经看到,由Java的java.util.UUID的randomUUID()生成的UUID是一个变体2版本4的随机UUID。我们可以说,这些UUID被重复的概率几乎足够接近于零,以至于可以认为是可以忽略不计的。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表