## 驱动统计 Q3 2025:摘要
Backblaze 的 Q3 2025 驱动统计显示,整体硬盘故障率略有上升至 1.55%,高于上季度的 1.36%,接近 2024 年的年平均值 1.57%。该报告分析了 328,348 个受管理存储驱动器的数据,包括新增的 2,400 个 24TB Toshiba MG11ACA24TE 驱动器。
四种驱动型号 – Seagate HMS5C4040BLE640 (4TB)、Seagate ST8000NM000A (8TB)、Toshiba MG09ACA16TE (16TB) 以及新的 Toshiba MG11ACA24TE (24TB) – 本季度未出现故障。然而,三种型号显示出显著较高的故障率(高于 5.88%):Seagate ST10000NM0086 (10TB)、Seagate ST14000NM0138 (14TB),以及值得注意的是 Toshiba MG08ACA16TEY (16TB),故障率为 16.95%。
东芝型号的高故障率归因于与东芝合作部署的固件更新,需要临时离线驱动器,被标记为故障。终身故障率保持在 1.31% 不变。完整数据集可供公开分析,Backblaze 鼓励通过其新闻通讯和社区论坛参与。该报告还详细介绍了在其系统中定义驱动器“故障”的复杂过程,依赖于 SMART 数据、内部监控工具和工单交叉引用。
## 从SQL到LLM:彻底改变保修索赔分类
主要汽车制造商面临着因车辆召回而产生的大量成本,这推动了对高效保修索赔分析的需求。 几十年以来,一家公司一直依赖复杂的SQL查询来对这些索赔进行分类,但车辆问题和语言的不断演变导致分类不准确以及分析师瓶颈。
2023年,一个项目开始使用监督机器学习来自动化此过程。 虽然最初使用XGBoost的模型显示出希望,但数据稀缺——源于漫长的标注过程和不断变化的优先级——阻碍了全面部署。
最近,该团队重新审视了大型语言模型(LLM),发现性能和成本效益得到了显著提高。 通过与Nova Lite进行六轮提示工程,他们在五个索赔类别中的四个类别中实现了与现有XGBoost模型相当,甚至超越了它们的水平。
这种转变代表着一种根本性的变化:分类不再受数据可用性的限制,而是受指令质量的限制。 LLM为动态领域提供了一种灵活的解决方案,在这些领域中,数据稀缺或需求变化迅速,有效地将一个缓慢、数据依赖的过程替换为更快、迭代的基于提示的方法。
## 软件权力动态的转变
多年来,软件一直服务*于我们*——响应我们的需求和命令。现在,这种关系发生了逆转。现代程序,通常被称为“应用程序”,越来越多地*要求*我们提供东西:强制账户(尽管通常是不必要的),持续更新,以及无休止的通知。
这种“需求感”让人感到侵入性。许多应用程序在没有账户的情况下也能完美运行——像Syncthing这样的安全同步工具和Mullvad VPN这样的支付处理器就证明了这一点。同样,自动更新通常不是用户驱动的;我们很少*要求*它们,并且在没有持续提示的情况下也能很好地管理。特别是通知,代表程序在用户注意力之上断言其重要性。
作者提倡回归像经典命令行工具`ls`那样,仅仅*能用*的软件。这些工具安静、响应迅速,并尊重用户的自主权。相反,我们被公司想要*我们*使用的功能和公告轰炸,而不是*我们*需要的,将我们的电脑变成了程序争夺我们注意力的平台。 恳求很简单:把控制权还给用户,让软件成为工具,而不是一个要求苛刻的伙伴。