扩散模型与自回归语言模型:一种文本嵌入视角
Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

原始链接: https://arxiv.org/abs/2505.15045

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。与arXivLabs合作的个人和组织都已接受并认同我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。 有一个能为arXiv社区增值的项目想法吗?了解更多关于arXivLabs的信息。

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 扩散模型与自回归语言模型:基于文本嵌入的视角 (arxiv.org) doener 1天前 18 分 | 隐藏 | 往期 | 收藏 | 1 评论 Klathmon 1天前 [–] > 我们建议采用扩散语言模型进行文本嵌入,其动机在于其固有的双向架构以及最近在匹配或超越大型语言模型(尤其是在推理任务上)方面的成功。我没想到扩散语言模型已经发展到这个地步了。但是有什么问题呢?为什么扩散模型(或某种混合模型)没有占据主导地位呢? 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com