OpenRouter Fusion API
Openrouter Fusion API

原始链接: https://openrouter.ai/openrouter/fusion

Fusion 将您的提示词转化为多模型协作研讨。一个专家模型小组(见下文)会并行分析您的提示词,并同时启用网络搜索和网页抓取功能;随后,一个判决模型会将它们的回复综合为结构化分析——包括共识、矛盾点、覆盖差异、独特见解及盲点——并据此撰写最终答案。 默认情况下,专家小组采用“质量”预设;您可以切换到“预算”模式以使用成本更低的模型,或通过 Fusion 插件的 analysis_models 和 model 字段完全替换专家小组与判决模型。当单个模型无法满足需求时(例如需要深度研究、专家评判,或任何容错率极低的场景),请选择 Fusion。 由于 Fusion 会运行所有小组模型并进行一次判决调用,因此您的请求费用为这些底层模型调用费用的总和,而非单一模型的费用。如需查看运行过的模型,请访问“活动”页面。详情请参阅我们的文档。如需了解其他路由方式,请查看自动路由(Auto Router)。

OpenRouter 推出了一项“融合 API”(Fusion API),通过将单个请求同时发送至多个模型,并利用“裁判”模型合成最终输出,从而提升 AI 的性能。 主要内容包括: * **性能与成本:** 用户可在“预算”和“质量”预设之间进行选择。虽然“质量”预设的表现优于顶尖的单一模型,但其成本也显著更高。 * **推理时计算(Test-Time Compute):** 性能的提升主要归功于“推理时计算”的增加。有趣的是,运行同一模型的多个实例(例如两个 Claude 3 Opus)通常能达到与更高级的单模型配置相当的效果。 * **边际效用递减:** 并非所有模型组合都能产生更好的输出;添加某些模型实际上可能会降低性能,这表明某些模型可能更擅长“说服”裁判,而非提供更优的答案。 * **社区推测:** 这一发现引发了关于主流 AI 实验室内部是否已使用类似技术(如迭代处理)来提升模型基准测试表现的讨论。 核心结论是:并行执行和多模型合成提供了一种可行的策略,能够将性能提升至当前前沿模型的极限之上。
相关文章

原文

Fusion turns your prompt into a small multi-model deliberation. A panel of expert models (see below) analyzes your prompt in parallel with web search and web fetch enabled, then a judge model synthesizes their responses into a structured analysis — consensus, contradictions, partial coverage, unique insights, and blind spots — and writes the final answer from it.

By default the panel is the Quality preset; switch to Budget for cheaper members, or override the panel and judge entirely with the fusion plugin's analysis_models and model fields. Reach for Fusion when a single model isn't enough — research, expert critique, or anywhere the cost of being wrong outweighs a few extra completions.

Because Fusion runs every panel member plus a judge call, your request is priced as the sum of those underlying completions rather than a single model. To see which models ran, visit Activity.

Learn more in our docs. For another way to route, see the Auto Router.

联系我们 contact @ memedata.com