提高大语言模型可信度,新方法助生成式AI破除“幻觉”

科技日报
发布时间: 481次浏览

 DFV知多少教育网-记录每日最新科研教育资讯

人工智能(AI)在给出准确答案的同时,也会有一些“胡乱输出”令人难辨真假,这被称为“幻觉”(hallucination)。而新一期《自然》杂志发表的一项研究报道了一种新方法,能检测大语言模型(LLM)产生的“幻觉”,即该方法能测量生成回答的含义的不确定性,或能提升LLM输出答案的可靠性。
DFV知多少教育网-记录每日最新科研教育资讯

类似ChatGPT和Gemini等LLM,是能阅读和生成自然人类语言的AI系统。不过,这类系统很容易产生所谓“幻觉”,即生成不准确或没有意义的内容。检测LLM出现的这种错误非常难,因为这些回答的呈现方式看起来很可信。DFV知多少教育网-记录每日最新科研教育资讯

英国牛津大学研究团队此次尝试量化一个LLM产生此类错误的程度,从而判断生成的内容有多忠于提供的源内容。他们的方法能检测“编造”——这是幻觉的一个子类别,特指不准确和随意的内容,常出现在LLM缺乏某类知识的情况下。这种方法考虑了语言的微妙差别,以及回答如何能以不同的方式表达,从而拥有不同的含义。团队的研究表明,他们的方法能在LLM生成的个人简介,以及关于琐事、常识和生命科学这类话题的回答中识别出“编造”内容。DFV知多少教育网-记录每日最新科研教育资讯

在同时发表的新闻与观点文章中,澳大利亚皇家墨尔本理工大学科学家指出,该方法由一个LLM完成,并通过第三个LLM进行评价,等于在“以毒攻毒”。文章写道,“用一个LLM评估一种基于LLM的方法似乎是在循环论证,而且可能有偏差。”不过,团队指出他们的方法有望帮助用户理解在哪些情况下使用LLM的回答需要注意,也意味着可以提高LLM在更多应用场景中的置信度。DFV知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-3-430.html提高大语言模型可信度,新方法助生成式AI破除“幻觉”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

中戏复试成绩出炉,时代少年团三人参加,他们的成绩和排名情况如何?
今天小编为大家带来了中戏复试成绩出炉,时代少年团三人参加,他们的成绩和排名情况如何?,希望能帮助到大家,一起来看看吧! 马嘉祺表演专业排名第3。 宋亚轩表演专业排名第11。 贺峻霖选择的并非
湖南一本线理科多少分
今天小编整理了湖南一本线理科多少分相关信息,希望在这方面能够更好的大家。 2024年艺考美术文化分数线如下: 2024美术艺考分数线不同省份不同学校分数线不一样,一般情况下美术艺考文化课
山西高考艺考新政策解读 高考2024年的政策是怎样的
今天小编整理了山西高考艺考新政策解读 高考2024年的政策是怎样的相关信息,希望在这方面能够更好帮助到大家。 山西高考艺考新政策解读如下: 一、统考加强,校考减少:艺术类专业考试分为省
惠州卫生职业技术学院春季高考分数线?(春季高考录取分数线)
惠州卫生职业技术学院春季高考分数线?(春季高考录取分数线)很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 惠州卫生职业技术学院春季高考分数多少~~这个不好说明,每年的每所学校春季
我是计算机专业的,今年春季高考(山东省)考了462分,上什么大学好呢?
今天小编为大家带来了我是计算机专业的,今年春季高考(山东省)考了462分,上什么大学好呢?,希望能帮助到大家,一起来看看吧! 春季高考总分750分。 春季高考总分750分,其中专业技能考试满分230分,专
内蒙古有哪些大学
今天小编整理了内蒙古有哪些大学相关信息,希望在这方面能够更好帮助到大家。 你好,乌兰察布职业学院位于内蒙古自治区乌兰察布市,是一所集理工、农学、财经、牧医等为一体的综合类职业院校。

热点精选

最新推荐

您可能感兴趣