现代极小完美哈希:综述
Modern Minimal Perfect Hashing: A Survey

原始链接: https://arxiv.org/abs/2506.06536

arXivLabs是一个框架,允许合作者直接在我们网站上开发和分享新的arXiv功能。与arXivLabs合作的个人和组织都已接受并认同我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。有提升arXiv社区价值的项目想法吗?了解更多关于arXivLabs的信息。

Hacker News 的讨论线程关注一项关于现代最小完美哈希的调查,这是一种用于高效数据检索的技术。来自 HeavyDB 的 tmostak 指出它在实现各种数据类型(包括分箱数值和日期范围)的强大 group by 和 join 性能中的核心作用。 讨论探讨了完美哈希是否可以在查询期间动态构建,而不仅仅是在构建时构建。虽然“动态完美哈希”在理论上存在,但其实际应用仍然有限,高负载因子的技术(如分桶式 cuckoo 哈希)往往更受青睐。有人提到定期重建函数是一个可行的方案,因为现代算法可以很快地做到这一点。 该线程还深入探讨了针对特定数据集进行完美哈希的有效方法,并提到了 RecSplit 和位操作技巧等技术以实现最佳性能。一些参与者强调了考虑哈希函数运行时反序列化的启动时间的重要性,尤其是在预编译方法(如 gperf)对于较小的数据集可能更快的情况下。另一些人认为可以在编译时构建静态查找表。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com