大多数领先的聊天机器人经常夸大科学发现。

大多数领先的聊天机器人经常夸大科学发现。
Most leading chatbots routinely exaggerate science findings

原始链接: https://www.uu.nl/en/news/most-leading-chatbots-routinely-exaggerate-science-findings

乌韦·彼得斯博士拥有英国伦敦国王学院的神经科学与心理健康心理学硕士学位和哲学博士学位。他目前是乌特勒支大学的助理教授，从事人工智能的社会风险和自然愚蠢的研究。本杰明·秦宜博士是加拿大西安大略大学血液学系的血液学家，也是英国剑桥大学历史与科学哲学专业的博士候选人和盖茨学者。彼得斯和秦宜在剑桥大学从事博士后研究期间，开始研究人类和大型语言模型科学传播中的夸大和概括性问题。

近期一项研究（uu.nl）表明，许多领先的聊天机器人倾向于夸大科学发现。这种倾向可能源于它们的训练数据，其中包含夸大的学术媒体报道和新闻报道。一些评论者指出，AI“幻觉”与人类过度自信之间存在相似之处，并指出这个问题并非新鲜事。一些用户分享了他们试图使用大型语言模型（LLM）来加速软件开发的挫败感，他们报告说，尽管有明确的指令，这些工具仍然经常生成不正确或不可靠的代码。其他人则争论大型语言模型能否“推理”，或者它们的输出仅仅是统计推导的结果。一些评论者指出，大型语言模型的错误与人类的错误不同，是过度训练的结果。这项研究表明，与人类专家摘要者相比，大型语言模型夸大科学论断的可能性几乎高出五倍。这凸显了科学报道不准确以及大型语言模型在用户操纵它们以获得所需结果时可能会强化确认偏差的更广泛问题。

大型聊天机器人辩论会——3月25日 2025-03-28

（评论） 2025-05-13

人工智能胜过病毒专家，引发生物危害担忧 2025-04-24

我们自动化废话 2023-11-18

原文

Dr Uwe Peters holds an MSc in Neuroscience and Psychology of Mental Health, and a PhD in Philosophy both from King’s College London, United Kingdom. He is currently assistant professor at Utrecht University, where he is working on research into the societal risks of artificial intelligence and natural stupidity.

Dr Benjamin Chin-Yee is a hematologist in the Division of Hematology at Western University, Canada and PhD candidate and Gates Scholar in History and Philosophy of Science at the University of Cambridge, United Kingdom.

Peters and Chin-Yee began working on exaggerations and overgeneralisations in human and LLM science communication while doing postdoctoral research at Cambridge University.

大多数领先的聊天机器人经常夸大科学发现。 Most leading chatbots routinely exaggerate science findings

大多数领先的聊天机器人经常夸大科学发现。
Most leading chatbots routinely exaggerate science findings