计算与创新智能学院杨卫东团队通过大小模型协同实现大模型在专用任务的低成本高性能应用

复旦大学
7次浏览

大语言模型(LLM,如ChatGPT等)在软件工程相关特定任务(LLM for Software Engineering)中展现出巨大前景。大语言模型知识丰富、能力强,但在专用领域成本高、响应延迟;传统的小型语言模型(SLM,如 BERT等)高效却能力有限,难以深入理解专业知识与语义上下文。b40知多少教育网-记录每日最新科研教育资讯

近日,复旦大学计算与创新智能学院杨卫东团队(大数据与知识工程实验室)在LLM for Software Engineering方向上取得突破,围绕“小模型缺知识、大模型落地难”这一核心问题,提出了适用于终端场景的多专家协同知识蒸馏框架(LUK),以及适用于云端协同推理的大小模型自适应分析框架(AdaptiveLog)。b40知多少教育网-记录每日最新科研教育资讯

研究成果分别发表于软件工程领域国际期刊IEEE Transactions on Software EngineeringTSE)与ACM Transactions on Software Engineering and MethodologyTOSEM)。b40知多少教育网-记录每日最新科研教育资讯

多专家协同知识蒸馏框架(LUK,发表于TSE,2025)b40知多少教育网-记录每日最新科研教育资讯

为将大模型的专家知识有效迁移至小模型,LUK框架创新性地引入多专家协同机制,借鉴软件工程中的瀑布模型,通过“总监——执行者——评估者”三类角色提示,以日志分析为专用任务,引导大模型协作构建精准、完整的日志领域知识体系。b40知多少教育网-记录每日最新科研教育资讯

在蒸馏出领域知识后,LUK提出了分层知识增强预训练策略,将词级别的细粒度知识感知与句子级别的宏观语义对齐任务相结合(如图2所示),既教会模型理解每个专业词汇的含义,又让其掌握由这些词汇构成的完整句子的意图,为下游分析任务奠定知识基础。实验结果表明,经LUK增强后的小模型(如110M参数的BERT)在多项日志理解任务中展现出接近专家的分析能力。仅需使用1%的标注数据,其性能便可逼近全量监督学习的水平,同时,其推理速度比直接调用GPT-4o快700倍以上,为在资源受限的边缘终端部署强大的日志分析能力提供了可能。b40知多少教育网-记录每日最新科研教育资讯

b40知多少教育网-记录每日最新科研教育资讯

图1 多专家协作框架b40知多少教育网-记录每日最新科研教育资讯

b40知多少教育网-记录每日最新科研教育资讯

图2 分层知识增强预训练框架b40知多少教育网-记录每日最新科研教育资讯

面向日志分析的自适应协同推理框架(AdaptiveLog,发表于TOSEM,2025)b40知多少教育网-记录每日最新科研教育资讯

尽管知识蒸馏可提升终端小模型的能力,但在应对复杂、低频异常模式时,小模型仍存在性能瓶颈。而若全部交由大模型处理,则面临高额成本与延迟问题。以日志分析为例,现代云系统每小时产生约2亿行日志,若全程使用GPT-4类模型分析,每小时成本可达上万美元。为了在自动化日志分析中兼顾性能和推理成本,研究团队进一步提出了一种名为AdaptiveLog的自适应日志分析框架(如图3所示),其设计哲学是“让合适的模型处理合适的任务”。该框架通过小模型和大模型的协作,由小模型作为一线处理单元,高效过滤并处理它能准确识别的“简单样本”;只有当小模型对其判断产生“不确定性”时,系统才会激活大模型,对复杂的“疑难杂症”进行深度会诊。b40知多少教育网-记录每日最新科研教育资讯

实现这一机制的关键在于两个创新。一是基于不确定性估计的自适应选择策略。该策略能敏锐地识别出小模型预测结果置信度低的样本,从而精准地触发大模型介入,避免资源浪费。二是基于错误案例检索的提示增强策略。系统会存储小模型曾犯过的错误,当大模型处理类似复杂日志时,会参考这些“前车之鉴”,从而做出更准确的推理。在不同的日志分析任务上进行的大量实验表明,AdaptiveLog在各种任务中都取得了最先进的结果,提高了日志分析的整体准确性,同时保持了成本效益。与使用LLM分析所有样本相比,AdaptiveLog将LLM的成本降低了73%,同时提供了更好的结果。此外,AdaptiveLog在低资源和迁移学习场景中也表现出了显著的优势。b40知多少教育网-记录每日最新科研教育资讯

b40知多少教育网-记录每日最新科研教育资讯

图3 AdaptiveLog框架图b40知多少教育网-记录每日最新科研教育资讯

计算与创新智能学院大数据与知识工程实验室博士生马立鹏为两项成果的第一作者,杨卫东教授为两项成果的通讯作者,肖仰华教授也参与了部分研究,研究工作获得复旦大学CFFF计算平台算力支持。b40知多少教育网-记录每日最新科研教育资讯

论文链接:b40知多少教育网-记录每日最新科研教育资讯

https://ieeexplore.ieee.org/abstract/document/11105541b40知多少教育网-记录每日最新科研教育资讯

https://dl.acm.org/doi/abs/10.1145/3749840b40知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-3-4523.html计算与创新智能学院杨卫东团队通过大小模型协同实现大模型在专用任务的低成本高性能应用

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

2024年艺考考试流程发布 2024年山西艺考时间
今天小编整理了2024年艺考考试流程发布 2024年山西艺考时间相关内容,希望能帮助到大家,一起来看下吧。 艺考政策变化2024如下: 1、本科艺术类专业点增加。 普通高等学校新增159个备
春季高考256分可以填哪些广东学校
小编今天整理了一些春季高考256分可以填哪些广东学校相关内容,希望能够帮到大家。 暨南大学分数线如下:1、海南:综合674分,浙江:综合642分,天津:综合621分,江苏:物理类598分、历史类594分,广东:物理类586分
南京邮电大学春季高考分数 江苏南邮2023分数线
今天小编整理了南京邮电大学春季高考分数 江苏南邮2023分数线相关内容,希望能帮助到大家,一起来看下吧。 2023年江苏南京邮电大学在江苏地区最低分数线如下: 1、2023年江苏南京邮电大学在
2024年艺考还有校考吗 2024年舞蹈艺考新政策
2024年艺考还有校考吗 2024年舞蹈艺考新政策相关内容,小编在这里做了整理,希望能对大家有所帮助,关于2024年艺考还有校考吗 2024年舞蹈艺考新政策信息,一起来了解一下吧! 2024年艺考改革政策如下
惠州卫生职业技术学院春季高考分数线?(春季高考录取分数线)
惠州卫生职业技术学院春季高考分数线?(春季高考录取分数线)很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 惠州卫生职业技术学院春季高考分数多少~~这个不好说明,每年的每所学校春季
艺考播音主持怎么考
今天小编整理了艺考播音主持怎么考相关信息,希望在这方面能够更好的大家。 播音主持艺考需要的条件如下: 1. 五官端正,落落大方,身高合规。 播音主持艺考对于外形的要求是需要考生仪态

热点精选

最新推荐

您可能感兴趣