java hashcode有什么用 - 穆世明博客

哈希是计算机科学的一个基本概念。

在 Java 中，高效的哈希算法支持一些最流行的集合，如 HashMap(查看这篇深入的文章)和 HashSet。

本文中，我们将重点介绍的工作原理、它在集合中的作用以及如何正确实现它。

在某些情况下，对集合进行最简单的操作可能效率低下。

为了说明，这会触发线性搜索，这对于大型列表来说非常低效：

Java 提供了许多数据结构来专门处理这个问题。例如，几个 Map 接口实现都是哈希表。

当使用哈希表时，这些集合使用 方法计算给定键的哈希值。然后，他们在内部使用这个值来存储数据，这样访问操作就更加高效了。

简单来说，返回一个由哈希算法生成的整型值。

相等的对象(依据其 )，必然返回同一个哈希码。不同的对象不需要返回不同的哈希码。

的通用合约规定：

在 Java 应用的执行过程中，每当在同一个对象上多次调用时，只要对象上的比较中使用的信息没有被修改，它就必须始终返回相同的值。此值不需要在该应用的一次执行到同一应用另一次执行之间保持一致。
如果根据方法，两个对象是相等的，那么在这两个对象上调用其方法必须返回同一个值。
如果依据方法，这两个对象不相等，那么在这两个对象上调用方法并不一定产生不一样的整型结果。不过，开发者应该清楚，不相等对象生成不同的整型结果可以改善哈希表的性能。

在合理可行的情况下，类定义的方法确实会为不同的对象返回不同的整数。(这通常是通过将对象的内部地址转换为整数来实现的，但这种实现技术不是 JavaTM 编程语言所要求必需的。)

一个完全遵守上述契约的简单实现实际上非常直接了当。

为了说明这一点，我们将定义一个覆盖该方法默认实现的示例类：

类为和提供了完全符合各自合约的自定义实现。更重要的是，让返回任何固定值并没有什么不合法的。

然而，这种实现将哈希表的功能降低到基本为零，因为每个对象都将存储在同一个桶中。

在这种情况下，哈希表查找是线性执行的，并没有给我们带来任何真正的优势。我们将在第 7 点中对此进行更多讨论。

让我们通过包含类的所有字段来改进当前的实现，以便它可以为不相等的对象产生不同的结果：

这个基本的哈希算法肯定比前一个好得多。这是因为它通过将和字段的哈希码与相乘来计算对象的哈希码。

一般来说，我们可以说这是一个合理的实现，只要我们保持实现与之一致。

用于计算哈希码的哈希算法越好，哈希表的性能就越好。

让我们来看看一个“标准”实现，它使用两个素数为计算哈希码增加更多的唯一性：

虽然我们需要了解和方法所扮演的角色，但我们不必每次都从头开始实现它们。这是因为大多数 IDE 都可以生成自定义的和实现。从 Java 7 开始，我们有一个基础方法来实现舒适的哈希运算：

IntelliJ IDEA 生成如下实现：

而 Eclipse 生成：:

除了上述基于 IDE 的实现，自动生成有效的实现也是可能的，比如使用 Lombok。

这种情况下，我们需要将 lombok 依赖添加到：

现在可以使用来注释类了：

类似的，如果使用 Apache Commons Lang’s HashCodeBuilder 类来生成实现，我们需要在 pom 文件中引入 commons-lang Maven 依赖：

而可以这样实现：

一般来说，实现没有通用的配方。我们强烈推荐阅读 Joshua Bloch 的《Effective Java》。它提供了一系列实现高效哈希算法的全面指南。

请注意，所有这些实现都以某种形式使用了数字 31。这是因为 31 有一个很好的属性。它的乘法可以用位移位代替，这比标准乘法更快：

哈希表的内在行为提出了这些数据结构的一个相关方面：即使使用高效的哈希算法，两个或多个对象即使不相等也可能具有相同的哈希码。因此，即使它们具有不同的哈希表键，它们的哈希码也会指向同一个 bucket。

这种情况通常被称为哈希冲突，有各种方法可以处理它，每种方法都有其优缺点。Java 的 HashMap 使用单独的链式方法来处理冲突：

“当两个或多个对象指向同一个 bucket 时，只是简单地存储在一个链表中。在这种情况下，哈希表是一个链表数组，每个具有相同哈希值的对象都附加到数组中 bucket 索引处的链表上。

在最坏的情况下，多个 bucket 都将有一个链表表，并且列表中对象的检索将线性执行。”

哈希碰撞方法简单地说明了为什么高效地实现如此重要。

Java 8 为 HashMap 实现带来了有趣的增强。如果桶大小超过特定阈值，树图将替换链表。这允许实现 O(logn) 查找，而不是悲观的 O(n)。

现在，我们将测试标准实现的功能。

我们来创建一个简单的 Java 应该，并添加一些对象到中，并使用 SLF4J 来日志记录每次调用该方法时控制台的消息。

这是示例应用的入口点：

而这是实现：

此处，值得注意的是，每次将一个对象存储到哈希表，并使用方法检查时，都会调用，并将计算出的哈希代码打印到控制台：

很明显，生成高效的实现通常需要一些数学概念(即素数和任意数)、逻辑和基本数学运算的混合。

尽管如此，我们可以无需诉诸这些技术而有效地实现。只需要确保哈希算法为不等对象生成不同的哈希码，并且它与的实现一致。

上一篇：指标体系构建方法有哪些?

下一篇：批处理文件命令

版权声明：
本文来源网络，所有图片文章版权属于原作者，如有侵权，联系删除。

本文网址：https://www.mushiming.com/mjsbk/13618.html

相关文章：