点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI蛋白质生成大模型亮相WAIC 未来大分子药、新生物材料等设计可实现“一键定制”
首页> 地方频道> 地方频道-上海> 要闻 > 正文

AI蛋白质生成大模型亮相WAIC 未来大分子药、新生物材料等设计可实现“一键定制”

来源:中国新闻网2023-07-10 19:24

AI蛋白质生成大模型亮相WAIC 未来大分子药、新生物材料等设计可实现“一键定制”

  AI蛋白质生成大模型“NewOrigin”(中文名为“达尔文”)正式亮相 受访人供图

  中新网上海7月7日电 (记者李佳佳)在上海举行的2023世界人工智能大会(WAIC)上,业界首个AI蛋白质生成大模型“NewOrigin”(中文名为“达尔文”)正式亮相。NewOrigin大模型的研发领军人,清华大学智能产业研究院卓越访问教授、分子之心创始人许锦波教授表示,AI蛋白质生成大模型瞄准创新药设计、合成生物学等真实产业应用需求,将用一个模型满足蛋白质生成全流程需求,未来大分子药、新生物材料等蛋白质设计可实现“一键定制”。

  据介绍,NewOrigin大模型通过学习千亿级多模态大数据,可实现多模态定向生成,单模型就能满足序列生成、结构预测、功能预测、从头设计等蛋白质生成全流程需求,解决产业应用所需的特定功能蛋白质生成难题,并在真实的产业环境中评估效果与价值。

  过去60多年中,蛋白质结构始终是困扰生物学家的终极难题之一,科学家们曾多次因解析血红蛋白等重要蛋白质的三维结构被授予诺贝尔奖。这一局面在AI方法应用之后得到了根本性的改变。2016年,许锦波教授首次借助AI大幅提升了蛋白质结构预测精度,自此开始,AI彻底颠覆了蛋白质预测,并逐步影响蛋白质生成。但由于极高的技术壁垒,蛋白质生成至今仍是全球科学家尚未完全攻克的技术难题。

  “大模型的出现将大大加速蛋白质生成技术的发展进程,并推动其在生物医药、合成生物学等领域应用,进而改变生物经济的格局。”许锦波在演讲中表示。当下ChatGPT等自然语言大模型的表现,让各界对大模型机制信心倍增。但在蛋白质生成等专业垂直领域,通用的自然语言大模型能力十分有限。究其原因,生物领域的复杂数据、专业知识与应用场景,都与自然语言交互的通用场景相差甚远,能力要求也更高。

  因此,研发蛋白质生成大模型,除了必备的算法、算力、数据等基础条件,还需要具备两大专业进阶能力:一是融合计算机、生物、物理等多学科,熟识AI、分子动力学、量子计算等多种方法,且能在实践中并行考虑序列与结构、主链与侧链、进化与组学的跨领域融合能力;二是走出实验室,下沉至真实的产业环境,在需求、验证、落地上贴近真实产业需求的能力。“具备这些能力和条件的团队非常稀缺”,许锦波认为。

  许锦波团队从2019年开始使用预训练机制研发蛋白质设计算法,通过整合结构预测、侧链预测、蛋白-蛋白对接等多种技术,结合多种场景需求,目前已在改造或从头设计蛋白质上取得了重要的突破。比如,设计功能类似但更小的蛋白质、能够结合某个小分子的蛋白质、能够结合某个底物的酶、基因编辑用的蛋白质等。

  在此基础上,分子之心开发了融合自然语言和蛋白语言的AI蛋白质生成大模型NewOrigin,它具备5重优势:可以根据特定需求定制化生成蛋白质,比如针对某个靶点生成抗体,或针对某个底物生成特异性的酶等,实现“按需定制”;基于数千亿多模态数据,NewOrigin可以进行多模态的输入、输出,比如生成具备某种特定功能的蛋白质序列,或生成某个蛋白质的三维结构信息等,满足不同层次的应用所需;同时,为了评估生成效果,NewOrigin融合AI、分子动力学、量子计算等多种方法,形成多维反馈机制,来实现快速验证和迭代。为了降低交互门槛,NewOrigin使用了融合自然语言交互的蛋白质生成模式,以满足广大不具备AI技术背景的生物学家的应用需求。更重要的是,NewOrigin大模型是真正面向产业需求的AI蛋白大模型,可基于工业级的应用反馈持续迭代,解决真实的产业需求。

  许锦波表示,AI和生物科技是当下全球科技竞争的重要战略领域,蛋白质技术作为生物科技的底层技术,与AI融合创新是必由之路。AI蛋白质生成大模型的开发只是起点,更具价值的是将其真正应用于产业中,实现可编程、可预测的创新药设计和生物制品开发,通过底层技术突破驱动生物经济变革。(完)

[ 责编:张悦鑫 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平同法国总统马克龙共同会见记者

  • “五一”小长假看多彩中国

独家策划

推荐阅读
为基于任意子的量子信息处理迈出了重要一步。
2024-05-06 18:11
近日,全球精度最高的月球地质图集由中国科学院在京正式发布,图集囊括月球地形地貌、地质构造、岩石类型和演化历史,是探月工程取得的重大阶段性成果。与阿波罗计划时期的月球地质图相比,
2024-05-06 07:45
前不久,南开大学中国式现代化乡村工作站首期站长培训班举办,来自全国各省份的132名乡村工作站站长参加培训,取得了良好效果。南开大学中国式现代化乡村工作站于去年启动建设,
2024-05-06 07:45
锻炼对身体有益似乎已是公认常识,但这其实是一个笼统的认知,人们对其分子层面的奥秘还不甚了解。
2024-05-06 09:30
农业主导品种主推技术已持续推介发布20年,是农业科技推广标志性工作之一。
2024-05-06 09:30
研究发现,血管舒张能力受损可能会增加患动脉粥样硬化的风险,进而增加心脏病发作和中风的风险。
2024-05-06 09:30
近年来,国产科幻影视剧《流浪地球2》和《三体》火热“出圈”,获得全球关注。
2024-04-30 03:05
酚醛树脂是人类历史上第一种人工合成塑料,自诞生以来已经历了一个世纪。
2024-04-30 03:05
近日,云南农业大学盛军、田洋教授课题组突破核桃油抗氧化难题,研发出替代植脂末的核桃植物基奶粉,并实现成果转化和应用,相关研究成果在国际期刊《食品工程学报》发表。
2024-04-30 03:05
有一个名字,总是让人心生自豪——广袤大地纵横驰骋,“流动的中国”以最直观的方式,将“中国速度”呈现给世界。
2024-04-30 03:05
在2024中关村论坛年会“人工智能主题日”活动现场,多项人工智能领域前沿技术、数据要素、生态培育、产教融合、场景应用、监管治理等多方面成果精彩亮相,百余位人工智能领域专家围绕大模型、具身智能、可信AI等国内外前沿热点话题展开讨论。
2024-04-30 03:05
光明日报教育周刊近期推出的《科学教育提质正当时》系列报道,从师资培养、课程设置、资源建设等多方面,对如何更好进行中小学科学教育展开了持续讨论,并提出了一系列推动科学教育发展的有效建议,在科学界、科学教育界引发热议。
2024-04-30 03:30
“中国共有独角兽企业369家。《中国独角兽企业发展报告(2024年)》由中关村独角兽企业发展联盟联合毕马威企业咨询(中国)有限公司、长城战略咨询、北京方迪经济发展研究院、清华大学中国科技政策研究中心共同发布。
2024-04-29 10:09
截至目前,神舟十七号航天员乘组已完成全部既定任务,将于4月30日乘坐神舟十七号载人飞船返回东风着陆场。
2024-04-29 10:07
2024年3月5日,习近平总书记在参加十四届全国人大二次会议江苏代表团审议时强调,要牢牢把握高质量发展这个首要任务,因地制宜发展新质生产力。 以创新为核心,通过技术创新、管理创新和模式创新,提升生产力整体水平,推动航空产业加快发展。
2024-04-29 10:06
以前,铸钛大炉坩埚容易损坏,需要每月更换一次,公司每年需要投入不少资金购买新坩埚。我和设备专家一起夜以继日地攻关,终于编制出了一套新的铸钛炉熔炼操作法,提高了坩埚使用率,每年可节约坩埚费用50万元左右。
2024-04-29 10:05
2024成都世园会开幕以来,邛崃分会场龙门山生物多样性博览园迎来游客参观热。 借着成都世园会的契机,成都梳理整合龙门山生物多样性资源,规划建设了占地1172亩的龙门山生物多样性博览园,无边界地呈现龙门山生物多样性。
2024-04-29 10:04
令张治国兴奋的是,武王墩一号墓椁室盖板上已发现和采集墨书文字100多句、近千字,是典型的楚系文字。“对于南方潮湿环境下考古出土的丝绸保护而言,从饱水到干燥的过程,可以说是生死攸关。
2024-04-28 10:23
对此,《指导意见》明确了依法合规管理数据资产、明晰数据资产权责关系、完善数据资产相关标准、加强数据资产使用管理、稳妥推动数据资产开发利用等12方面主要任务。该负责人表示,为加强数字资产管理,《指导意见》突出以下基本原则:  坚持确保安全与合规利用相结合。
2024-04-28 10:19
为落实碳达峰碳中和目标,我国将应对气候变化作为国家战略,纳入生态文明建设整体布局和经济社会发展全局,加强顶层设计。
2024-04-28 10:17
加载更多