AI预测蛋白结构、AI赋能药物和材料设计……AI技术发展到今天,在带来新方法、新工具的同时,也在赋能产业应用的实际场景。
“AI for Science(科学智能)的空间非常大,将全方位改变从科学研究到产业落地,下一代的产业很可能就在AI for Science基础上建立起来。”在近日的U8青年创新论坛上,中国科学院院士、北京大数据研究院院长鄂维南对当下科研学科建设、AI大数据产业短板等相关议题坦率地分享其观点。在他看来,AI for Science就是一个革命性的机会。它可以激发一场新的科学变革,重塑很多传统产业和科研模式。
在主旨论坛演讲中,鄂维南表示,做科研主要有两条路径,一条是数据驱动,另一条是模型驱动。数据驱动主要的困境在于缺乏高质量的数据,也缺乏好的数据分析方法;而模型驱动的困境则在于虽然我们发现了基本原理,但用它来解决实际问题却非常困难,总是陷入“精度与速度”难以两全的困境。
从2014年走上了机器学习的研究道路的鄂维南,因其数学背景出身,在研究机器学习时具有得天独厚的优势。“机器学习实际上就是在解决高维函数问题,当我开始进入机器学习领域,惊讶地发现,曾经在科学计算里碰到的精度与效率的两难,完全可以通过机器学习来解决。在基础科研路径中,无论是数据驱动还是模型驱动遇到的困难,AI都能提供新工具和新范式。”鄂维南说。于是他从2016年开始推动的AI for Science,将机器学习引入科学建模。
以机器学习为代表的人工智能,为基础科研带来了全新高维函数的表达工具和数据的分析工具,大大提高了原理模型驱动的可靠性和效率。在鄂维南看来,数据驱动和原理模型驱动二者的结合,必将让基础科研成为AI的“主战场”。
在科学智能的未来,定义问题的方式或许会被重塑为:“此问题是否有原理和数据?”哪怕只满足一条,也有机会将最尖端的科研问题推进至前人无法企及的程度,科研的疆域将被重新开辟。
2018年,由鄂维南等人在北京大学策划组织的讨论会中,AI for Science这一概念首次被明确提出。
在主旨报告中,鄂维南表示,近年来,人工智能的发展主要有两大趋势,一是大规模预训练模型流行,它可以完成多任务学习,ChatGPT的出现证明这条路已经走通。二是AI for Science形成共识,它可以改变科研范式,打破学科与学科之间的界限以及研究与产业之间的界限,影响实体经济,催生新的应用场景,未来有助于生物制药、材料设计等领域的系统化发展,而不再是靠猜、经验或者试错。
他表示,任何学科都需要用到量子力学、牛顿力学、电磁场理论等基本原理,光谱、质谱、电子扫描仪等实验手段,以及以往积累起来的数据库、知识库。AI for Science的前提是扎实巩固这些基础,推动走向“平台科研”模式,才有可能提供一种新的科研能力,即解决不同科研领域共性问题的能力。
鄂维南直言,没有人才储备的AI科研产业是没有后劲的,从长远来说,人才是最大的瓶颈。在论坛现场接受记者采访时,他亦不忘呼吁青年科技工作者勇于投身AI时代大潮,勉力创新。
据介绍,北京是最早系统性支持AI for Science的城市之一,2021年由鄂维南牵头成立的北京科学智能研究院,更是国际上首个以AI赋能科研为主题的研究机构,并推出了面向基本原理研究的DeepModeling开源社区平台。该院集中力量推进原创性、引领性创新,推出了首个覆盖元素周期表70余种元素的深度势能原子间势函数预训练模型DPA-1。
AI for Science的进展当前已超出预期,各行业都希望AI算法创新赋能到产业,进而解决行业面临的实际问题。鄂维南在主旨报告中也谈到了AI算法引领未来工业制造的发展趋势,他特别强调了在分子、原子等微观层面工业设计的重要性。他给出一个掷地有声的观点,“AI在宏观层面有巨大发展空间,但更基本、更重要的落地应是微观层面的工业制造。”
在鄂维南看来,AI for Science以基础设施为支撑,也在赋能工业应用的实际场景,将在材料科学、能源化工、航空航天、药物研发等方向上带来巨大变革。数据驱动与原理模型驱动结合后的AI研究成果将促进宏微观计算模拟的发展,成为工业设计的新起点。
“现在AI很火,但是其实两年前我们都在问为什么国内AI企业不挣钱?那么原因很有可能就在它的落地层面。”鄂维南直言,制造业是实体经济的顶梁柱,AI转化为生产力最终必然还是要落地在制造业层面,而其中最重要的途径就是通过AI for science推动国内制造业的革新换代,从工业化进入到智能化,中国在这方面有很好的优势和布局。