人工智能新模型可解码DNA隐藏“语言”

基于DNA序列训练的大型语言模型(艺术图)。
图片来源:物理学家组织网
DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。
大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。
在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。
研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。
GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。(记者 张佳欣)
本文链接:http://knowith.com/news-7-476.html人工智能新模型可解码DNA隐藏“语言”
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
《北京市加快商业航天创新发展行动方案(2024-2028年)》
关于修订支线航空补贴管理暂行办法的通知(财建〔2023〕413号)
【解读】《关于施行修改后的专利法及其实施细则相关审查业务处理的过渡办法》解读
“创客北京2023”创新创业大赛顺义区级赛暨第四届“创新顺义”创新创业大赛启动的通知
工业和信息化部关于健全中小企业公共服务体系的指导意见(工信部企业〔2023〕213号)
2023“北京·景贤杯”创新创业大赛延长报名的通知
【解读】金融监管总局有关负责人就《国务院关于推进普惠金融高质量发展的实施意见》答记者问
北京技术合同成交额破8000亿元 委员热议持续疏通科技转化“堵点”
北京培育建设国际消费中心城市2024年工作要点
【申报】关于印发《2024年北京市汽车以旧换新补贴实施细则》的通知