科学家和机构每年都投入更多资源来发现新材料,为世界提供燃料。随着自然资源的减少以及对更高价值和先进性能产品的需求增长,研究人员越来越关注纳米材料。
纳米粒子已经找到了进入从能量存储和转换到量子计算和治疗等应用的途径中国机械网okmao.com。但鉴于纳米化学能够实现巨大的组成和结构可调性,识别新材料的系列实验方法对发现施加了不可逾越的限制。
现在,西北大学和丰田研究所 (TRI) 的研究人员已成功应用机器学习来指导新纳米材料的合成,消除了与材料发现相关的障碍。训练有素的算法梳理了定义的数据集,以准确预测可为清洁能源、化学和汽车行业的流程提供燃料的新结构。
“我们要求模型告诉我们,多达七种元素的混合物会制造出以前从未制造过的东西,”西北纳米技术专家、该论文的通讯作者 Chad Mirkin 说。“这台机器预测了 19 种可能性,并且在对每种可能性进行了实验测试后,我们发现其中 18 种预测是正确的。”
这项名为“多元素异质结构的机器学习加速设计和合成”的研究将于 12 月 22 日发表在《科学进展》杂志上。
Mirkin 是温伯格文理学院的 George B. Rathmann 化学教授;麦考密克工程学院化学与生物工程、生物医学工程、材料科学与工程教授;和范伯格医学院的医学教授。他还是国际纳米技术研究所的创始主任。
绘制材料基因组图
根据 Mirkin 的说法,之所以如此重要,是因为可以访问前所未有的大型高质量数据集,因为机器学习模型和 AI 算法只能与用于训练它们的数据一样好。
名为“Megalibrary”的数据生成工具由 Mirkin 发明,极大地扩展了研究人员的视野。每个 Megalibrary 都包含数百万甚至数十亿的纳米结构,每一个都具有略微不同的形状、结构和组成,所有这些都按位置编码在一个 2×2 平方厘米的芯片上。迄今为止,每个芯片包含的新无机材料比科学家收集和分类的要多。
Mirkin 的团队通过使用一种称为聚合物笔光刻技术(也是 Mirkin 发明的)开发了 Megalibraries,这是一种大规模并行纳米光刻工具,可以每秒在特定位置沉积数十万个特征。
在绘制人类基因组图时,科学家的任务是识别四个碱基的组合。但松散同义的“材料基因组”包括元素周期表中任何可用的 118 种元素的纳米粒子组合,以及形状、尺寸、相形态、晶体结构等参数。以巨型图书馆的形式构建更小的纳米粒子子集将使研究人员更接近于完成材料基因组的完整图谱。
米尔金说,即使使用类似于材料“基因组”的东西,识别如何使用或标记它们也需要不同的工具。
“即使我们可以比地球上任何人更快地制造材料,这仍然是可能性海洋中的一滴水,”米尔金说。“我们想定义和挖掘材料基因组,我们这样做的方式是通过人工智能。”
机器学习应用程序非常适合解决定义和挖掘材料基因组的复杂性,但受制于创建数据集以在空间中训练算法的能力。Mirkin 说,Megalibraries 与机器学习的结合最终可能会根除该问题,从而了解哪些参数驱动某些材料特性。
“化学家无法预测的材料”
如果 Megalibraries 提供地图,机器学习提供图例。
根据 Mirkin 的说法,使用 Megalibraries 作为用于训练人工智能 (AI) 算法的高质量和大规模材料数据的来源,使研究人员能够摆脱通常伴随材料发现过程的“敏锐的化学直觉”和系列实验。
“西北大学拥有合成能力和最先进的表征能力来确定我们生成的材料的结构,”Mirkin 说。“我们与 TRI 的人工智能团队合作,为人工智能算法创建数据输入,最终对化学家无法预测的材料做出这些预测。”
在这项研究中,该团队编译了先前生成的 Megalibrary 结构数据,这些数据由具有复杂成分、结构、大小和形态的纳米粒子组成。他们使用这些数据来训练模型,并要求它预测四种、五种和六种元素的组成,这些元素会产生某种结构特征。在 19 次预测中,机器学习模型正确预测了 18 次新材料——准确率约为 95%。
由于对化学或物理学知之甚少,仅使用训练数据,该模型就能够准确预测地球上从未存在过的复杂结构。
“正如这些数据所表明的那样,机器学习的应用与 Megalibrary 技术相结合,可能是最终定义材料基因组的途径,”TRI 高级研究科学家 Joseph Montoya 说。
金属纳米颗粒有望催化工业上的关键反应,例如析氢、二氧化碳 (CO 2 ) 还原以及氧气还原和析出。该模型在西北大学建立的大型数据集上进行了训练,以寻找具有围绕相、尺寸、尺寸和其他结构特征设置参数的多金属纳米粒子,这些参数会改变纳米粒子的性质和功能。
Megalibrary 技术还可能推动对未来至关重要的许多领域的发现,包括塑料升级再造、太阳能电池、超导体和量子比特。
随着时间的推移效果更好的工具
在大型图书馆出现之前,机器学习工具是针对不同人在不同时间收集的不完整数据集进行训练的,这限制了它们的预测能力和普遍性。大型图书馆允许机器学习工具做他们最擅长的事情——随着时间的推移学习并变得更聪明。Mirkin 说,他们的模型只会更好地预测正确的材料,因为它会在受控条件下收集到更多高质量的数据。
“创建这种人工智能能力是为了能够预测任何应用程序所需的材料,”蒙托亚说。“我们拥有的数据越多,我们拥有的预测能力就越大。当你开始训练人工智能时,你首先要在一个数据集上对其进行本地化,然后随着它的学习,你会不断添加越来越多的数据——这就像带一个孩子从幼儿园到博士。经验和知识的结合最终决定了他们能走多远。”
该团队现在正在使用这种方法来寻找对清洁能源、汽车和化工行业的燃料流程至关重要的催化剂。识别新的绿色催化剂将使废品和丰富的原料转化为有用的物质、氢气的产生、二氧化碳的利用和燃料电池的发展。生产催化剂也可用于替代昂贵和稀有的材料,如铱,这种金属用于产生绿色氢和 CO 2还原产物。
该研究得到了 TRI 的支持。额外的支持来自 Sherman Fairchild Foundation, Inc. 和空军科学研究办公室(奖励编号 FA9550-16-1-0150 和 FA9550-18-1-0493)。西北大学的合著者是材料科学与工程博士生 Carolin B. Wahl 和化学博士生 Jordan H. Swisher,他们都是 Mirkin 实验室的成员。TRI 的作者包括 Muratahan Aykol 和 Montoya。