用魔法打败魔法,南开大学最新成果让AI“识破”AI

中国新闻网
149次浏览

 Fpk知多少教育网-记录每日最新科研教育资讯

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。Fpk知多少教育网-记录每日最新科研教育资讯

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?Fpk知多少教育网-记录每日最新科研教育资讯

近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。Fpk知多少教育网-记录每日最新科研教育资讯

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。Fpk知多少教育网-记录每日最新科研教育资讯

图为AI生成内容检测示意图。(南开大学 供图)

  ?Fpk知多少教育网-记录每日最新科研教育资讯

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。Fpk知多少教育网-记录每日最新科研教育资讯

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”Fpk知多少教育网-记录每日最新科研教育资讯

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。Fpk知多少教育网-记录每日最新科研教育资讯

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。Fpk知多少教育网-记录每日最新科研教育资讯

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。Fpk知多少教育网-记录每日最新科研教育资讯

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。Fpk知多少教育网-记录每日最新科研教育资讯

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。Fpk知多少教育网-记录每日最新科研教育资讯

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。Fpk知多少教育网-记录每日最新科研教育资讯

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。Fpk知多少教育网-记录每日最新科研教育资讯

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)Fpk知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-2-4221.html用魔法打败魔法,南开大学最新成果让AI“识破”AI

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

热点精选

最新推荐

您可能感兴趣

关于公布2023年国家技术创新示范企业名单和国家技术创新示范企业复核评价结果的通知(工信部科函〔2024〕7号)

关于印发《服务健康事业和健康产业人才培养引导性专业指南》的通知(教高厅函〔2023〕26号)

【解读】关于《进一步促进北京老字号创新发展的行动方案(2023-2025年)》的政策解读

【图解】北京市丰台区人民政府办公室关于印发《丰台区积极应对疫情影响助企纾困的若干措施》的通知

对十四届全国人大一次会议第2199号建议的答复

2023年度《中国国际科技合作网工作年度报表》

《北京国际科技创新中心建设条例》

北京培育建设国际消费中心城市2024年工作要点

《北京国际科技创新中心建设条例》

“创客北京2024”创新创业大赛 神州数码•高科数聚汽车行业大数据驱动决策专项赛项目征集通知

如登春台:青岛代还信用卡取现,真实商户积分,需要的请联系

持之以恒:羊小咩享花卡额度怎么套出来(五个最新操作步骤)

大吉大利:广州南沙区代还信用卡取现,放心的选择,实体店多种方式

2025年公开印度特罗凯多少钱一盒150mg30粒代购最新价格大约1300元左右一盒一瓶一个月!2025购买肺癌靶向药印度特罗凯价格折合人民币约1300元

心花怒放:宁波北仑代还信用卡怎么刷出来,5种常用方式

万事如意:惠州代还信用卡取现,可长期帮还,需要的请联系

大吉大利:佛山垫还信用卡,多年经营,便捷商家

组合:羊小咩享花卡商城额度怎么提现,享花卡额度变现的独家方法

自强不息:DY月付如何套出来现金,推荐十个操作步骤

谈吐:微信分付提现app(必须知道的三个步骤五种小技巧)