【资料图】
“输入病人疾病相关的多组学数据,如胃癌病人,AIGP平台即能够分析其多组学数据,找到针对这个胃癌病人的靶点,根据这个靶点生成一个抗体甚至一系列有多样性的蛋白。最后,一键式生成的蛋白回到自动实验室里合成蛋白。”3月23日,在百图生科基于生命科学大模型驱动的AIGP平台发布会上,百图生科CTO 宋乐说。
宋乐在介绍AIGP平台。 主办方供图。
宋乐介绍,上面所说的只是AIGP平台其中一个功能,其还可以根据形状及理化性质(物理性质和化学性质)需求,生成一系列满足需求的蛋白。再就是根据一个蛋白质靶点生成对应和靶点结合的蛋白,比如针对新冠病毒生成一个蛋白,甚至针对石油相关的分子生成一个酶。
据了解,过去两年多,百图生科构建了生命科学领域千亿参数的跨模态大模型“xTrimo”。该大模型从跨物种、跨模态的生命信息中学习蛋白质如何构成和实现功能、如何相互作用、如何组合和调控细胞功能的关键规律,从而破解生命的自然语言 —— 蛋白质。基于大模型,AI在一系列任务算法上取得了明显进展,除了更好地完成结构预测等基础任务外,也开始可以根据不同的问题输入,以生成的方式,设计创新的蛋白质,来回答各种生命科学问题。
目前,平台设置了3类功能模块,分别是Function to Protein Design(F2P,根据结构、功能、可开发性等功能指标设计/优化蛋白质)、Protein to Protein Design(P2P,给定抗原等目标蛋白,设计与之以特定方式结合的抗体等蛋白质),以及Cell to Protein Design(C2P,给定细胞,发现调控细胞功能的靶点蛋白并设计相应的调控蛋白)。
宋乐表示,此次平台的发布,旨在将这一技术平台的能力与更多行业人士分享,利用AI设计创新蛋白质的能力,共同研发更多的前沿药物和其他生命科学项目,也通过一系列挑战性的新任务,驱动AIGP平台的技术进步。此前,AIGP平台已经进行了一段时间的内部测试,在创新免疫调控药物ImmuBot的研发中,贡献了多个高性能弹头、新功能传感器的研发案例。
中国科学院院士、著名免疫学家董晨教授认为:“AI能够解决的问题,就是对大数据的分析和进一步的演绎和应用。在当下的时间节点,AIGP确实是一个呼之欲出的平台。相信AIGP对于我们理解蛋白质,以及在生物系统中研究和发现它的功能和调控,乃至于将来研发新药,都会有非常大的作用。”
百图生科CEO刘维表示,虽然当前AI大模型和与之配套的大规模数据图谱、高通量验证体系都远不完美,但已经凝结了很多前沿技术的创新和探索,接下来,从开始展露一些能力到提高它的泛化能力和速度,需要更多专业人士的加入,以实现前沿项目的加速研发。
宋乐也表示,当前,根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。今年6月起,部分功能模块将进一步开放,让专业用户可以直接自主使用,在更多的研究场景调用AI的蛋白质生成能力,激发更多的生命科学探索。