北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜-知多少教育网-记录每日最新科研教育资讯

首页 > 资讯

北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜

发布时间: 2024-06-21 07:43:58 893次浏览

近日，由北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级，并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示，百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一。

FlagEval天秤大模型评测平台是智源研究院推出的大模型评测体系，自2023年发布以来，已从主要面向语言模型扩展到视频、语音、多模态模型，实现多领域全覆盖，目前已评测国内外300余个开源和商业闭源的语言及多模态大模型。资料显示，FlagEval大语言模型评测体系当前包含6大评测任务，近30个评测数据集，超10万道评测题目。

从榜单中可以看到，百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一，云雀2-Pro、豆包、GPT-4o分别位居二三四位，百川、零一万物、kimi等追随其后。

(北京智源研究院供图)

点击展开全文

本文链接：http://knowith.com/news-1-742.html北京智源研究院大模型评测：百度文心大模型4.0登顶闭源榜

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：2024南京软件大会将举行

下一篇：国际首次！氮气与烯烃直接合成烷基胺

相关阅读

专访可爱龙教授：名字不重要，希望大家关注我的学术

文｜江庆龄李晨阳 “感谢可爱老师的报告，不对，是龙老师，啊不对，爱龙老师您好……” 这是2023年12月29日下午，出现在清华大学

1万年前“口香糖”揭示古人糟糕的口腔健康

科学家研究发现，距今约1万年前中石器时代，斯堪的纳维亚地区西南部的采集狩猎人群成员可能受龋齿和牙龈病困扰。相关研究1

速度、准确性胜过专家，机器人能用AI加速发现化学分子

科技日报北京1月25日电（记者张梦然）荷兰阿姆斯特丹大学化学家开发了一种自主化学合成机器人。这款被称为“化学机器

人体试验开始了！脑机接口技术应审慎推进

1月30日，在社交媒体X上，马斯克宣布旗下公司Neuralink完成首例脑机接口（BCI）设备人体移植手术，又一次引发人们对脑机接口

《自然》最新评论：癌症命名法亟需由基于器官转变为基于分子分类

中新网北京2月1日电 (记者孙自法) 国际著名学术期刊《自然》最新发表一篇评论(Comment)文章中指出，目前的癌症命名

泰瑞沙联合化疗在美获批用于治疗晚期肺癌

阿斯利康泰瑞沙(奥希替尼)联合化疗在美国获批，用于治疗局部晚期或转移性表皮生长因子受体突变 (EGFRm) 非小细胞肺癌

热点精选

北京市发布国家科学技术奖专家提名项目补充公示

北京市发布国家科学技术奖专家提名项目补充公示

关于北京市2023年度国家科学技术奖专家提名项目的补充公示根据《国家科学技术奖励工作办公室关于2023年度国家科

北京市拟资助面上项目598项、青年科学基金项目500项

北京市拟资助面上项目598项、青年科学基金项目500项

关于发布2024年度面上及青年科学基金申请项目、第一批奖励项目资助决定的通知京科基金字〔2024〕4号北京市自

2024年博士后学术交流计划确定

2024年博士后学术交流计划确定

全国博士后管委会办公室关于印发2024年博士后学术交流计划的通知博管办〔2024〕31号各省、自治区、直辖市及

国家知识产权局发布2024年度课题研究项目申报通知

国家知识产权局发布2024年度课题研究项目申报通知

国家知识产权局办公室关于申报2024年度课题研究项目的通知国知办函办字〔2024〕115号各省、自治区、直辖市和

科技部发布1个重大专项视频答辩评审会通知

科技部发布1个重大专项视频答辩评审会通知

关于召开癌症、心脑血管、呼吸和代谢性疾病防治研究国家科技重大专项2023年度公开项目视频答辩评审会的通知有关

2023年度自然资源科学技术奖（中国太平洋学会评审组）申报项目公示

2023年度自然资源科学技术奖（中国太平洋学会评审组）申报项目公示

2023年度自然资源科学技术奖（中国太平洋学会评审组）申报工作已结束，共有25项申报成果通过形式审查。其中，科技进步奖12项