用零错误解决百万步LLM任务
Solving a million-step LLM task with zero errors

原始链接: https://arxiv.org/abs/2511.09030

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## 使用LLM解决复杂任务:摘要 一篇最新论文探讨了一种方法,使较小的LLM能够处理极其复杂的任务——具体来说,零错误地解决20个环的汉诺塔问题(一百万步)。核心思想是**递归分解**问题为尽可能简单的步骤,然后使用LLM作为代理来单独执行每个步骤。“投票机制”决定每个阶段的最佳行动方案。 评论员指出,成功与否取决于任务被分解为可靠可解、不易产生幻觉的提示——对于现实世界中结构较少的问题来说,这很难实现。一个关键发现是,投票的复杂性随着提示数量线性增长,但随着幻觉率呈指数增长。 讨论强调了与人类问题解决和项目管理(如NASA的方法)的相似之处,但也承认了“隧道视野”和在许多子任务中保持上下文的挑战。虽然很有前景,但该技术目前擅长纠正*随机*错误,而非*系统*错误,并且受益于汉诺塔问题等问题的固有结构。该研究表明,通过自分解,可以为更确定性和可靠的LLM应用开辟一条道路。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com