每日HackerNews RSS

最近出现的数据质量问题引发了对机构信任的担忧,以及由未经检查的数据训练大型语言模型可能导致的“混乱末日”。作者在两个英国数据集中发现了明显的错误:政府的燃料价格数据,包含位于海洋中的地点和严重不准确的价格比例;以及汽车协会(RAC)关于电动汽车的报告,显示车辆数量的图表严重失实。 尽管作者已于3月22日报告了燃料数据问题,但错误数据一周后仍公开可用。这些错误可能源于未经验证的用户提交和缺乏基本检查,凸显了一种令人担忧的趋势。作者强调需要严格的校对、代码测试和数据验证,以维护数据完整性并防止虚假信息的传播。最终,在日益数据驱动的世界中,对工作感到自豪并确保准确性至关重要。

## 坏数据与发布它的价值 最近在Hacker News上进行了一场讨论,围绕公开发布明显存在缺陷的数据(例如燃料价格数据和一位小数点位置错误的图表)。核心争论在于,机构是否应该优先保证数据准确性*再*发布,或者发布不完美的数据仍然有价值。 许多评论者认为,虽然干净的数据是理想的,但期望完美往往导致*没有*数据被发布。他们强调,即使数据不完整,提供方法论和注意事项也很重要,并强调允许用户自行清理和验证数据的益处。另一些人则强调,应该实施基本的合理性检查来捕捉明显的错误。 一个关键点是真正“干净”数据的成本——需要大量的人力劳动,并且可能通过过滤引入偏差。几位用户分享了花费大量时间清理数据,但项目最终被放弃的经历。最终,共识倾向于发布已知存在问题的数据,培养处理*不完美*信息的技术,并优先考虑透明度而非难以达到的完美。原始帖子的标题甚至从更严厉的立场(“停止发布垃圾数据”)被修改为更温和的标题。

## 微观物理学的认识论:摘要 爱德华·费瑟的讲座探讨了在微观物理学研究中获得的知识——以及遇到的局限(原子、粒子等)。尽管缺乏对这个领域的直接感知,物理学取得了显著的成功,但进展已放缓,引发了人们对当代研究过于依赖无法验证的、以美学为驱动的数学构建的担忧。 费瑟认为,成功和挫折都源于共同的认识论根源,这可以通过托马斯主义哲学来阐明。 就像自然神学一样,微观物理学超越了感官经验,但具有内在的界限。 两个领域都利用类比和推理来理解超越直接观察的现实——从可观察的现象出发,推断潜在的原因(如粒子)或上帝的属性。 然而,随着物理学深入微观世界(朝向“原始物质”),以及神学朝向神性本质,可理解性会降低。 这些概念变得越来越抽象和数学化,远离日常经验。 这种“现象边缘化”——观察与现实之间不断增加的理论层数——反映了*事后*推理关于上帝的局限性,需要依赖间接证据和类比。 费瑟告诫不要优先考虑理论中的审美“美”,因为这有脱离经验验证的风险,呼应了对现代理性主义的担忧。 最终,承认这些局限性对于健全的科学方法和对现实基本性质的现实评估至关重要。

对不起。

此请愿书敦促欧洲各国政府和欧盟停止并审查与美国数据分析公司 Palantir Technologies 的合同。 担忧集中在 Palantir 参与争议活动——包括据称支持加沙地区的行动、协助 ICE 分离家庭以及可能参与升级冲突——以及扩大欧洲大规模监控的风险。 请愿书强调,Palantir 正在悄然获取欧洲各地的敏感公共数据(医疗保健、警务等),而公众知之甚少。 它呼吁公开现有的合同和数据使用情况,并投资于欧洲替代方案。 核心论点是,将公共系统和数据安全委托给一家美国私营公司,特别是那些具有令人担忧的行为和侵略性言论的公司,对欧洲价值观和安全构成重大威胁。 目标是防止 Palantir 影响力的进一步扩张,并确保民主监督。

瑞士因美国资金重新分配,在主要军购项目(特别是F-35战斗机和爱国者导弹系统)方面面临重大预算问题。原定用于瑞士F-35的资金已被美国转移,以弥补爱国者导弹系统合同的成本超支,而该合同已经因优先援助乌克兰以及伊朗战争爆发后全球需求增加而面临压力。 这迫使瑞士提前转移额外资金以维持其F-35项目,瑞士官员认为这是一种“非常令人不满”的情况。爱国者导弹系统的交付现在将延误至少五年,没有明确的新时间表,总成本预计上涨50%,可能使原先30亿瑞士法郎的价格增加10亿瑞士法郎。这种情况凸显了依赖美国对外军事销售计划所固有的复杂性和财务风险。

对不起。

## 人工智能错误识别导致冤假错案 田纳西州的一位祖母安吉拉·利普斯,因人工智能面部识别技术错误匹配而被错误逮捕并拘留超过五个月。北达科他州法戈市警方在调查银行欺诈案时,使用了邻近机构西法戈市警察局的技术,该机构使用了Clearview AI——一个抓取数十亿张在线照片的系统。人工智能将利普斯识别为潜在嫌疑人,尽管她声称从未去过北达科他州。 一份逮捕令被签发,利普斯最终被引渡,经历了一次可怕的首次飞行。银行记录后来证明她犯罪期间一直在田纳西州,导致指控被撤销。 法戈警方承认案件中存在“错误”,源于他们对未经审查的西法戈人工智能系统的依赖,现在已经禁止使用该系统。他们正在实施对人脸识别技术的更严格监管和改进的沟通协议。警方正在审查调查,但尚未向利普斯直接道歉,理由是调查仍在进行中。利普斯的律师正在考虑民权索赔,强调冤假错案的毁灭性影响以及在依赖人工智能*之前*进行彻底调查的必要性。此案凸显了人们对人工智能在执法中准确性和负责任使用的日益关注。

## IPv6 专用家庭网络:实用实施 本文详细介绍了向 IPv6 专用家庭网络过渡的过程,承认 IPv4 仍然普遍存在。作者通过利用 NAT64、DNS64 和 464XLAT 等技术,成功地实现了 IPv6 专用设备访问 IPv4 服务。 为了获得静态 IPv6 前缀,从 Free Range Cloud 租用了一个 /48,并通过 WireGuard 隧道传输,以克服 ISP 的动态分配。OPNSense 防火墙管理此隧道的基于策略的路由 (PBR)。IPv6 寻址使用 SLAAC 与 DHCPv6 进行有状态分配,并为每个 Docker 主机提供一个专用的 /56,以及 /64 网络。 重要的是,NAT64/DNS64(使用 Jool 实现)将 IPv6 请求转换为 IPv4,使用 /96 前缀。464XLAT 结合 DHCPv4 选项 108 和 PREF64,允许缺乏原生 IPv6 支持的设备工作,同时优先使用 IPv6。Docker 网络已完全过渡到 IPv6,需要配置调整和 FRR 路由宣告。 虽然总体上是成功的,但一些设备(Eufy、HP 打印机、某些 Docker 容器)缺乏完整的 IPv6 支持仍然存在挑战。一个临时的基于 IPv4 的 VPN 解决方案(Zerotier)提供了从 IPv4 网络访问 IPv6 服务的途径。此设置展示了一条通往未来可证明的、以 IPv6 为中心的家庭网络的可行路径。

对不起。

地球 — 您的代码运行的地方 | MCPaaS实时边缘执行地图 2.7KB Zig WASM · 300+地点 使用鼠标缩放/旋转 · 键盘 ← → 空格 ◀ ⏸ ▶ Cloudflare Edge MCPaaS Live 𝕏 分享

对不起。

## 计算的热力学:重审 一篇质疑计算热力学的2010年论文,随着实验证据不断验证朗道尔极限(擦除一个比特信息时的最小能量耗散)而再次受到关注。自2012年以来,多项实验(Bérut等人,Jun等人,Hong等人,Guadenzi等人)已经证明了与该极限一致的热耗散,甚至将其扩展到量子系统。 该原始论文的论点并非*反对*朗道尔极限本身,而是擦除仅仅是计算中的*一个*极限。现实世界的计算机在计算过程中会积累熵,并且需要方法来管理它,而不仅仅是关注可逆计算的理想。 讨论的中心在于擦除(压缩逻辑相空间)与写入一个比特的不可逆性,以及实验结果的统计显著性(一些人质疑2个标准偏差的阈值)。虽然可逆计算仍然是一种理论理想,但其原理仍然可以应用于降低实际系统的能耗,例如Vaire公司。核心争论围绕着计算缩小的基本限制以及过程中熵产生的假设。

## TSA安检混乱与付费快速通道服务 近期报告显示,TSA安检通道排队时间过长,导致旅客寻求替代方案。虽然官方不鼓励代排队服务,但Perq Soleil等礼宾服务提供加速安检通道——以付费方式绕过普通排队,使用通常仅供工作人员和航空公司人员使用的路线。 这一现象引发了关于公平性的争论,评论员指出私人飞机旅行已是特权,并质疑为何这些乘客不接受同样的安检。许多人质疑TSA的有效性和目的,特别是关于私人飞行的安检问题,并建议采取替代安检方法。 一个关键点是TSA的资金问题,许多人注意到收取的费用与该机构实际预算之间的差异,以及国会拨款的作用。讨论还涉及私人机场安检的可能性,以及政治运作对基本服务的影响。最终,该讨论反映了对机场安检效率低下的不满,以及基于财富和权限的旅行体验差距日益扩大。

## Go-LSP:Go 语言的语言服务器协议实现 Go-LSP 是一个 Go 库,旨在简化构建语言服务器协议 (LSP) 服务器,支持 LSP 3.17。它处理 JSON-RPC 框架和消息分发的复杂性,允许开发者专注于语言特定的逻辑。 该库提供对 LSP 功能的广泛支持,包括代码补全、悬停提示、诊断、格式化、重命名、语义标记、工作区符号等。它会根据实现的接口自动通告服务器能力,但也可以进行显式配置。 构建服务器涉及定义一个实现必需的 `LifecycleHandler` 接口和可选功能处理程序(例如 `HoverHandler`)的处理器结构体。服务器可以通过标准 I/O、TCP 或 WebSockets 运行。 Go-LSP 提供了服务器到客户端通信的工具(发布诊断信息、显示消息),并支持自定义 JSON-RPC 方法。它还包含通过 `log/slog` 进行的结构化日志记录,以及用于单元测试的综合测试工具 (`servertest`)。内置调试 UI 提供实时 LSP 流量检查和性能指标。 该库分为四个包:`server`、`lsp`、`servertest` 和 `internal/jsonrpc`。可通过 `go get github.com/owenrumney/go-lsp` 获取。

## Hacker News 讨论:Go 语言服务器 GitHub 上一个新项目 ([github.com/owenrumney](https://github.com/owenrumney)) 引发了 Hacker News 上关于使用 Go 构建语言服务器 (LSP) 的讨论。作者创建了一个框架,以便轻松开发 LSP,最初用于解析 Terraform/Cloudformation 文件,以便在 Infracost LSP 中进行诊断。 用户称赞该项目易于理解的接口和调试服务器。 几位评论者分享了他们自己的 LSP 经验,强调了其超越传统代码编辑的通用性——包括 YAML 配置文件解析和 SSH 配置文件交互等用例。 一位用户受到启发,创建了一个 Makefile LSP。 对话还涉及现有的 LSP 框架,如 `glsp`,以及 Go 中良好 API 设计的重要性,利用其隐式接口。 关于文档字符串的价值出现了一点争论,一些人提倡*始终*包含它们,即使是最小的,而另一些人则认为样板文档可能有害。 作者指出目前存在一个问题,即处理程序 panic 会导致服务器崩溃,他们正在解决这个问题。

更多

联系我们 contact @ memedata.com