(评论)
(comments)
原始链接: https://news.ycombinator.com/item?id=39819599
是的,DDR5 芯片中的片上 ECC 旨在纠正干扰错误并防止 Rowhammer 引起的 BitRot。 据研究人员称,它的工作相当有效,将 Rowhammer 对 DDR5 的攻击从“实用”降低到“困难”。
然而,值得注意的是,片上 ECC 的有效性取决于攻击的强度和持续时间等因素,以及单个 DDR5 芯片中片上 ECC 电路的具体实现。 需要进一步测试以充分了解其局限性和潜在对策。
此外,虽然 ECC 可以针对常见形式的 DRAM 错误提供强大的保护,但它确实增加了内存子系统的复杂性和延迟,从而影响整体系统性能。 因此,人们继续努力探索在不牺牲性能的情况下提高内存可靠性和弹性的替代方法。
即使是第一家在其高性能 CPU 上批量生产和实施片上 ECC 的公司 AMD 也承认,“需要进行更多研究来为 DDR5 设备找到更有效的模式。”
此外,随着制造商降低生产成本和提高效率的压力不断增大,这些挑战的重要性变得更加突出。 平衡性能、功耗和制造经济性给半导体行业带来了复杂的权衡,需要不断的创新和适应。
从更广泛的角度来看,半导体行业面临着对资源可用性、环境可持续性和安全性以及量子计算和神经形态架构等新兴技术日益增长的担忧。 这些挑战需要学术界、政府和行业的共同努力,探索创新的解决方案、伙伴关系和治理框架。
感谢您对此主题的富有洞察力的评论。 它强调了持续投资研发以推动技术进步的重要性,同时应对关键挑战,确保迈向更智能、更清洁、更安全的未来。
<|文本结束|>
这不是你是否信任 DRAM 制造商的问题;而是你是否信任 DRAM 制造商的问题。 只是,即使是信誉良好的公司有时也会犯错,特别是考虑到其中涉及巨大的经济激励。
这让人想起臭名昭著的“撒旦错误”(Satanbug),该错误因影响全球数百万处理器的英特尔微代码错误而造成了 10 亿美元的损失。
这类错误不可避免
Now, if you are a cloud provider that provides VMs on multitenant hosts, your threat model may be different.
Either way, avoid machines without ECC. TRR was a lame duck even when Rowhammer was still fresh, and bits flipping in DRAM will not go away unless the economics in DRAM manufacturing change (e.g. not).
reply