6月27日,复旦上线中国高校最大云上科研智算平台CFFF,开创科研智算新模式。当天,复旦大学校长、中国科学院院士金力回应了科研智算平台及AI for Science等热点关切话题。
问题:AI等新技术为基础科研提供了新思路,您如何看待AI for Science?高校该怎么做?
金力:人工智能在科学研究中的地位,要从科研范式变革的角度去看。
【资料图】
传统科研范式已经历了四个阶段的演化发展历程,从通过实验描述自然现象的经验范式,到通过模型或归纳进行研究的理论范式,到应用计算机仿真模拟解决学科问题的计算范式,发展到通过大数据分析研究事物内在关系的数据范式。每当科研范式存在难以解释的科学发现或者难以解决的问题逐渐积累到引发质变时,新的科研范式就会呼之欲出。
在过去一段时间内,随着大数据资源的不断增长,随着需要求解的科学问题日益复杂,引发了对于科学研究“第五范式”的探索,即在数据范式的基础上,引入智能技术,强调人的决策机制与数据分析的融合,将数据科学和计算智能有效结合起来,也就是我们常说的“AI时代的来临”。高校要发挥的作用,主要在以下几点:
一是借助范式变革推进科研组织模式的迭代更新。“单打独斗”已不适应大科学时代的科技创新,我们现在常提“有组织科研”,其最大的优势就在于通过布局建设大平台。二是推动推动跨学科的交叉研究,激发创新突破。三是加速科技创新与产业变革的深度融合,推动产业转型升级。科研范式转换能够为产业改造升级乃至新兴产业崛起提供理论先导和知识储备。四是拓宽应用场景,持续推进“AI时代”的应用普及和覆盖群体。
从广泛的角度来说,就是有责任在“AI时代”为科学理念的普及、科学应用的拓展、科学伦理的探讨发挥高校的引领和导向作用,使得更多的群体、更多的领域共享“AI时代”的红利。
问题:有专家认为,复旦CFFF平台是一种新型“大科学装置”,您怎么看?作为一台“科研超级计算机”,和其他科研基础设施有何不同?
金力:CFFF智能计算平台和以往的大科学装置或其它典型的科研基础设施有一些相似之处,例如他们都是为了解决复杂的科学问题而建造的,是科学研究服务的必要基础设施;都需要高度的专业知识和技术以及跨领域研究能力;都需要大量的资金投入、专业技术支持、专门运营维护团队等,但是CFFF智能计算平台有其特殊性:
CFFF智能计算平台具有大规模、高能级的特点。它是全国高校第一的超算集群,同时也是算力第一的异构智算集群。CFFF平台可以实现超1000卡并行智能计算,支持超1000亿参数的大模型训练,在国内高校中尚属首例。
与其他大平台提供科学实验仪器设备不同,算力、算法、数据是人工智能领域发展的最基本保障,CFFF平台运行的速度将极大地影响科研效率、科研成本、平台的服务效能、以及未来算法的产业化落地的可能性。
“切问一号”AI for Science计算集群面向全校提供高性能科学与工程计算服务,利用人工智能推动基础学科及多学科交叉领域开展前沿研究,为重点领域提供大规模计算和存储资源,如AI+生物医药、AI+材料科学、AI+数学、AI+分子动力学、AI+气象、AI+社会科学等相关学科等领域。
“近思一号”专用高性能计算机群可满足学校多学科对于高性能计算的需求,提升各学科领域对于大规模数据处理的能力,如计算物理学、新能源新材料科学、大气海洋科学、地球科学、生物信息、医学健康、微电子、航空航天科学等学科等。
两者共同为全校AI for Science的高性能计算提供强大的计算资源,支持AI赋能科学研究的新范式发展,促进基础学科及交叉学科建设。
问题:智能计算成为新一波AI浪潮的引擎,在您看来,智能计算平台对科研发展而言价值何在?
金力:复旦大学以基础研究见长,要建设世界顶尖大学,首先我们的基础学科要成为世界顶尖的基础学科。没有基础研究,创新就是无源之水、无根之木。
面对ChatGPT引发的广泛讨论,如何在日新月异的科技创新环境中赢得主动,在关键领域取得创新突破,是时代给予高校的命题。人工智能大模型的训练需要大量的矩阵乘法和卷积操作,主要通过GPU进行加速,GPU+CPU结合的异构计算架构成为新兴的超算架构。而以大规模异构算力为基础的智能计算平台将成为今后科研的重要支撑力量,能够为高性能计算提供强大的计算资源,支持AI赋能科研的新范式发展,并通过AI for Science跨学科研究推动基础学科及交叉学科建设,实现科研成果的深度融合和转化。
不仅仅在高校,全社会的诸多行业和领域都需要算力的支撑,比如政府、医疗机构、金融机构、互联网公司、制造业企业等,全国多地也都把推动算力发展水平的提升和技术协同创新作为面向未来的战略选择,相信算力水平的提升将极大推动AI前沿技术发展及产业创新,成为激活数据要素潜能、驱动经济社会数字化转型的新引擎。
问题:复旦大学科研团队对CFFF平台有哪些期待?目前,CFFF平台是否取得了一些科研成果?
金力:一方面,CFFF作为国内高校第一的大规模异构智算平台,我们希望它能够为复旦的基础科学研究提供更强大更稳定、更加灵活高效低成本的算力支持,利用人工智能新技术解放科学生产力,加速发现新的科学原理和技术突破。另一方面,我们希望基于CFFF平台能够建成一批具有世界级影响力的科学大模型,例如生命科学大模型、大气科学大模型、材料科学大模型、集成电路大模型等。
CFFF团队除了要做好技术支撑外,还要为不熟悉AI算法的研究团队提供架构和代码优化服务,协同提升科研效率。
目前,CFFF即将投入大规模的试运行。前期测试中,经过半年时间的建设,已经有了一些成果。前期测试中,经过半年时间的建设,已经有了一些成果,例如李昊教授团队基于这个平台研发了中期天气预报大模型,模型参数规模达到45亿,在256块A100上并行训练完成,预测效果在公开数据集上首次超越长期在该领域领先的ECMWF,就是欧洲中期天气预报中心的结果,并且将预测速度从原来的小时级缩短到了3秒内。
科研数据具有多模态、高维度、多尺度、高通量的特点,将AI大模型应用到科研领域有助于发现更复杂的问题和规律,并且能大幅加速基础科学研究的探索与突破。