分析现代英伟达GPU核心

分析现代英伟达GPU核心
Analyzing Modern Nvidia GPU Cores

原始链接: https://arxiv.org/abs/2503.20481

arXivLabs是一个框架，允许合作者直接在我们的网站上开发和分享新的arXiv功能。与arXivLabs合作的个人和组织都已接受并认同我们开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于这些价值观，并且只与遵守这些价值观的合作伙伴合作。有提升arXiv社区价值的项目想法吗？了解更多关于arXivLabs的信息。

Hacker News上的一篇讨论围绕着对现代Nvidia GPU内核的分析展开。最初的评论质疑了GPU仅限于线性代数和浮点运算的观点。随后的讨论深入探讨了GPU在密码学中的能力，特别是哈希函数和零知识证明。其他人则认为，虽然GPU擅长并行任务，但它们最适合矩阵乘法或GEMM，这一点在功耗、张量核以及稀疏性方面都进行了热烈的讨论。对话还涵盖了CUDA核心作为可编程核心，统一寄存器的存在和使用，以及Nvidia GPU产品线的命名约定。关键点包括新的GPU架构依赖于编译器引导的硬件来管理数据依赖关系并提高性能，这一概念让人联想起RISC编译器的目标。讨论最后以对GPU全部潜能的疑问以及GPU优化对性能的影响而告终。

深度混合：在 Transformer 中动态分配计算 2024-04-09

SplitQuantV2：无需GPU即可增强大型语言模型的低比特量化 2025-03-26

GPU 运行 Brrr 2024-05-14

Pydrofoil：加速基于帆的指令集模拟器 2025-04-21

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

分析现代英伟达GPU核心 Analyzing Modern Nvidia GPU Cores

分析现代英伟达GPU核心
Analyzing Modern Nvidia GPU Cores