一艘 Triton 3300 潜艇用科学家设计的软机械臂探索深海。来源:OceanX
人工智能(AI)已被证明是生物信息学的革命性工具;有了谷歌旗下Deep Mind公司建立的Alpha Fold数据库,科学家得以预测100万个物种中2亿种蛋白质的结构。与此同时,其他领域也从中受益。在本文中,我们将介绍专注于追求前沿AI和机器人技术的研究人员的工作,包括更好地预测不断变化的地球气候,揭开艺术品背后隐藏的历史,以及了解深海生态和开发新材料等。
——— 基于软性材料的海洋生物学 ———
只有坚韧的生物体才能承受深海生活的严酷考验。但是从像水母和海参这样柔软而粘糊糊的生物,到坚硬但易碎的深海鱼类和珊瑚,这些强韧的物种通常也非常纤细精巧。它们的脆弱性使研究这些生物体成为一项复杂的任务。
许多水下机器人身上坚固的金属机械手有可能伤害这些标本,从而无法完好无损地将之取回。但是,基于柔性聚合物的“软体机器人”,正在为纽约城市大学的David Gruber这样的海洋生物学家提供一种更柔和的替代方案,与这些神秘的深海居民互动。
有些方法是在传统自动航行器上用这些更柔软的要素来造样品处理臂,另一些方法则更密切模仿对象的形态,并完全由软的柔性材料组成。Gruber说,问题在于这是否能让科学家们在深海中采集活检样本,“并实现我们通常在受控实验室环境或者潜艇球体内做的事”。
答案似乎是肯定的。在过去的八年里,Gruber一直与哈佛大学的机器人专家Robert Wood合作,构建能够在潜水员不敢去的环境中有效运行的机器人。他在该领域的许多同事已经完成了类似的壮举。例如,在2021年,由浙江大学机器人专家李铁峰领导的中国研究团队设计了一种可以在马里亚纳海沟幽暗深处(西太平洋海面以下近11公里)航行的机器人。
这些软体机器人早期主要专注于安全捕获和处理活的海洋生物,但下一代应该能够在不返回陆地的情况下进行更广泛的分析。Gruber描述了在水下执行质谱分析或复杂成像方法的系统开发进展,他和Wood甚至开发了一种软体机器人,可以对新捕获的样本进行基因组分析。
成本仍然是一个很大的障碍。Gruber指出,即使较小的潜水系统也可能花费数十万美元。但软体机器人的设计带来很大的灵活性。例如,Gruber的同事已经证明,他们可以在海上工作时使用3D打印机创建专门的操纵和抓取组件,从而使他们能够为探险期间发现的水母、珊瑚或其他生物快速定制机器人。
尽管这项技术尚未被广泛接受,但Gruber对软体机器人改变海洋生物学的可能性充满热情,因为比起来自潜艇相机的短暂快照,它能够让研究人员快速获得对新物种的有用见解。“这些动物大多很新,我们对它们知之甚少,甚至一无所知。”他说。
——— 改善气候预测 ———
每三到七年,太平洋海水的表面温度会在相对温暖和凉爽之间波动。虽然只有几度,但这些变化对全球气候影响重大,它们会强烈影响亚洲、大洋洲和美洲的降雨和风暴活动。
这些变化被正式称为厄尔尼诺-南方涛动,或者简称为ENSO,对其时间的了解,可以帮助社区准备好面对干旱、严重飓风或其他极端天气事件。这样的预测很难有很大把握,但在2019 年,韩国全南国立大学的Yoo-Geun Ham团队开发了一种算法,该算法基于一种被称为深度学习的AI技术,可以成功提前两年预测这些海洋变暖和降温。实际上,他们的算法在过去三年中一直在预测ENSO模式。“目前一切顺利。”Ham说。
预示着台风等事件的ENSO模式,可以提前很长时间进行预测。来源:NASA Earth/ZUMA Press Wire Service/Shutterstock
AI虽然是气候科学工具箱的新成员,但它已被证明善于梳理观察数据,发现有意义的大气和海洋活动模式。有时AI可以生成很好的未来预测(例如Ham对ENSO开展的工作),但该技术也可以提供即时的相关见解。例如,谷歌姊妹公司Deep Mind的科学家在 2021 年进行的一项研究展示了一种“临近预报”算法,该算法将深度学习应用于实时雷达数据,以准确预测未来数小时内的降水模式(S. Ravuri et al. Nature.597, 672–677; 2021)
气候研究人员也在使用AI来克服传统基于统计或物理学的气候学方法的一些缺点。例如,深度学习算法可用于识别气候建模中根据当前知识或直接观察无法准确量化的基本参数,例如海水混合或云的区域运动。人们甚至可以应用AI来填补历史气候数据的空白。
迄今为止,大多数工作都集中在全球气候的特定组成部分或区域要素上,但目前更大的、全球范围的问题仍在很大程度上超出了AI能处理的范围。这种规模的预测通常来自地球系统模型——基于对海洋、大气和陆地生态系统中关键物理过程的理解所建立的数学框架。Ham表示,该领域“是应用深度学习进行气候预测和气候建模的未来”,尽管他同时也指出,该领域的大部分初步工作尚未在准确性方面得到有力的评估或验证。
部分问题在于,当前的AI系统通常是在研究数据的模式,而不是真正在理解物理现象。除此之外,算法得出结论的过程也难以追溯。Ham说,他的团队必须努力克服这方面的质疑。“我们应用了一种非常严格的验证方法来证明我们的深度学习模型确实超越了其他最先进的预测系统,”他说。Ham认为,AI最终将改变气候预测领域。“我认为未来非常光明。”他说。
——— 发现催化材料 ———
过渡金属元素,如铁、铜和铂,广泛用于各种行业的化学加工和合成——部分原因在于它们独特的、适合用于催化的电子结构。然而,材料科学家只是触及了众多可能配方的冰山一角,还有更多的化合物有待发现,它们可以提供卓越的催化性能、更低的成本或更简单的生产方法。
使用AI算法来加快材料发现和设计过程的研究社区正在不断壮大,麻省理工学院的计算化学家Heather Kulik就是其中的一员。在今年发表的一项研究(A. Nandy et al. JACS Au 2, 1200–1213; 2022)中,她的团队使用了一种称为“主动学习”的方法——其中AI算法使用自己的模型来识别数据,这些数据或可推动进一步提高表现——以发现能将甲烷有效转化为甲醇的过渡金属催化剂的结构和化学特征。
“我们搜索了大约1600万种候选催化剂,”Kulik说,“并且能在几天到几周内提出设计原理,这些本来可能花上几十年时间。”这类催化剂很重要,因为它们可以促进甲烷(化石燃料和温室气体的主要成分)有效转化为更多功能、更有用的基础化学品。
Kulik将该领域的增长部分归功于开源工具包的激增,这些工具包使研究人员更容易在广泛的物理化学特征上训练AI,以发现潜在材料。有许多可公开访问的理论和实验衍生化学数据存储库可被用于算法开发,尽管Kulik指出获取高质量数据仍是一个紧迫的问题。“我认为对于生成高质量数据集需要什么尚未形成共识。”她说,并指出她的团队通常完全依赖内部生成的数据来训练他们的算法。AI在这里也可能有用:机器学习算法可被应用于已发表的文献,通过文本挖掘直接获得有关不同化合物家族化学特征的见解。
目前,这些分析主要用于识别针对某一特定特性优化的材料,例如在特定环境条件下的稳定性。但在“多目标优化”领域,目前有一些很有前景的工作正在进行,其中机器学习算法被用于确定可同时在各种参数上产生出色性能的化合物和结构。
Kulik还热衷于计算化学的新兴领域,该领域使用算法来监督AI建模过程本身的关键方面。其想法的核心是,通过训练计算机识别低质量数据、不现实的材料或其他可能导致失败的条件,来消除基于机器学习的实验可能出现的典型错误开端和死胡同。
对 Kulik 来说,这并不意味着要把人类专家排除出这个过程,而是让他们将更多的时间和精力投入到分析高质量的计算结果上,“这样博士生就不用在重复乏味的工作上耗费大把时间”。
——— 表面之下 ———
即使是最伟大的艺术家也是从草稿开始的。对于像列奥纳多·达·芬奇这样的大师来说,许多早期工作都已消失在历史长河中,但结合复杂成像技术和AI算法,人们有可能发掘出隐藏在成品画作下的初步草图。
伦敦国家美术馆首席科学家Catherine Higgitt与伦敦帝国理工学院电气工程师Pier Luigi Dragotti合作,发现了隐藏在15世纪后期达·芬奇作品《岩间圣母》中的天使和其他人物的踪迹。他们首先使用X射线荧光来检测与整幅作品中与某些颜料相关的元素,然后使用AI重建由这些颜料形成的隐藏图案。
非侵入性成像正在成为艺术修复领域的标准工具,但生成的数据量很快就会让研究者不堪重负。“我们很少依赖单一技术,”Higgitt说,“我们倾向于将信息拼凑在一起,因此可能收集到一系列不同波长的成像数据。”这就是AI可以派上用场的地方:帮助整合和解释复杂的数据集。
德·戈雅的《波塞尔夫人》,其下发现了另一幅肖像。图源:© 2022 IEEE. Reprinted, with permission, from W. Pu et al., IEEE Transactions on Image Processing
这些类型的AI辅助图像分析现在在生物医学成像等学科中相当普遍,但博物馆科学家通常缺乏计算资源和使用这些技术的专业知识。Higgitt与英国一项名为ARTICT的研究计划联手,该计划汇集了艺术界的专家和不同学科的计算专家。
今天,AI是Higgitt在国家美术馆工作的常规组成部分,这使她的团队相对大多数其他博物馆处于前沿领域,虽然她承认“这还只是迈出了非常初级的几步”。
还有许多团队展示了将算法分析应用于艺术品所获的成果。例如,俄罗斯和比利时的研究人员使用神经网络进行“虚拟修复”,以数字方式修补裂缝,填补退化画作上缺失和褪色的颜料。另一个在凯斯西储大学的团队设计了一种算法来根据物理笔触识别作品所属的艺术家——甚至可能有助于识别赝品。
在Higgitt看来,在这个学科使用AI的早期阶段,她对过多信任AI持谨慎态度。她指出很难检查AI系统如何得出答案,同时目前尚不清楚在一件艺术品上训练的算法在其他艺术品上会表现如何。她将之视为数据的“初筛”,以帮助提取“趋势或信息,而专家(化学家、保护者或策展人)还会回头检查”。
随着这些进步,Higgitt看到AI将有一些激动人心的机会,有望改变策展人和公众与艺术互动的方式。Higgitt说,这甚至可能包括重建一个艺术品“生活故事”的各方面,让观众“不仅了解一件作品最初可能的样貌,还可以了解到它在历史上各个时间点的样子”。
Michael Eisenstein 是一位居住在宾夕法尼亚州费城的自由撰稿人。
原文以Getting a grip on denizens of the deep为标题发布在2022年10月13日出版的《自然》增刊“自然指数-人工智能与机器人技术”上
© nature
Nature | doi:10.1038/d41586-022-03209-2
自然指数 - 人工智能与机器人技术
《自然》增刊“自然指数-人工智能与机器人技术”编辑独立,《自然》对社论内容全权负责。我们在此衷心感谢以下机构的支持:
Nature Index 自然指数
自然指数是一个包括了作者单位信息和机构关系的数据库,它追踪发表在82种高质量自然科学期刊上的科研论文。这些期刊均由在职科学家所组成的独立小组选出。
自然指数提供机构和国家/地区所发表的论文的绝对计数和份额,由此可显示全球高质量科研产出及合作的情况。自然指数数据会定期更新,并依照知识共享协议,在指数网站natureindex.com上对外发布最近十二个月的数据。该数据库由施普林格•自然编制。
自然指数主要采用论文数和份额两种科研产出计算方法:
•论文数(Count)- 以前被称为“论文计数 (article count/AC)”,是指一篇文章不论有一个还是多个作者,每位作者所在的国家/地区或机构都获得1分。这就是说一篇论文能为多个国家/地区或机构带来一个分值。
•贡献份额(Share)- 为了统计一个国家、地区或机构对某篇论文的贡献,并确保不会重复计算,自然指数还使用Share(份额),以前被称为“分数式计量(fractional count/FC)”,它计算的是每篇论文作者的贡献份额。一篇文章总分值为1,每位作者被认为对论文有相同的贡献,分值在所有作者中平均分配。例如,一篇论文有10位作者,则每位作者的得分为0.1。对于隶属于多个机构的作者,其贡献份额则在各机构间平均分配。机构总的份额分值是将与之有关联的各个作者的份额相加得出的。国家/地区的份额计算过程与之相似,尽管由于某些机构拥有海外实验室而将其计入所在国家/地区,这令情况变得复杂。
•合作分值(collaboration score) - 由一个科研机构或国家所有双边合作方的贡献份额相加而得。