2.1 机器学习工作流程
2.1.1 数据收集及预处理 在机器学习工作流程中,数据收集和预处理是构建精确预测模型的关键步骤。训练数据集的大小和质量对于模型性能起着决定性作用[12]。研究人员通常致力于选择具有显著代表性的数据,这种选择过程不仅确保了数据的质量和可靠性,还为问题的有效解决提供了基础。当前,在材料领域大数据启发下,已经建立了多个与材料相关的开发数据库,为机器学习研究提供了丰富的数据资源。例如,晶体学开放数据库(http://www.crystallography.net/cod/),该数据库由剑桥大学开发,包含有机、无机、金属有机化合物和矿物晶体结构等数据[13];
AFLOW材料数据库(http://aflowlib.org/),该数据库由杜克大学开发,包含 3 528 653种材料化合物,具有超过733 959 824种计算属性[14];开放量子材料数据库(https://www.oqmd.org/),由美国西北大学开发,包含1 022 603种材料的DFT计算热力学和结构特性[15];计算二维材料数据库(https://cmr.fysik.dtu.dk/c2db/c2db.html),该数据库包含大约
4 000种二维(2D)材料的结构、热力学、弹性、电子、磁性和光学特性[16];材料云数据库(https://www.materialscloud.org/discover/menu),该数据库包含三维晶体、二维晶体、金属有机框架等多个子数据库,可用于碳捕获和甲烷储存等应用[17];JARVIS-DFT 数据库(https://www.nist.gov/programs-projects/jarvis-dft),专注于基于密度泛函理论(DFT)的材料性能预测,保存了大约40 000种块状材料和大约1 000种低维晶体材料的多种性能数据,如形成能、带隙、介电常数、磁矩、红外强度和电场梯度等[18];有机材料数据库(https://omdb.mathub.io/),是一个开放访问的三维有机晶体电子结构数据库,提供了基于数据挖掘和机器学习技术的搜索查询工具[19]。
数据预处理在机器学习中是一个至关重要的步骤,它包括数据采样、异常值处理、数据离散化和数据标准化4个主要步骤。数据采样旨在使用更少的数据构建高性能的预测模型,同时确保预测准确性不受影响[20-21]。异常值处理涉及检测并处理偏离数据正常范围的值,常用的方法包括基于正态分布和基于监督学习的异常值检测[22]。对于包含数值属性的数据,需要将所有数值转换为离散值,以满足许多机器学习模型的要求,这一过程称为离散化[23]。数据标准化是通过缩放数值将其转化到指定的范围,是涉及距离计算或神经网络分类框架的重要步骤[24]。常用的数据标准化技术包括十进制缩放、Z-score标准化和min-max标准化等[25]。数据标准化有助于提高神经网络的收敛速度,并显著提升基于距离计算算法的准确性。
数据收集和预处理在机器学习领域占用较多时间,对于一个研究课题,前提是需要收集足够数量和质量的数据,并对数据进行正确的预处理。
2.1.2 特征工程 是机器学习中数据准备的核心任务之一,它涉及从原始数据中提取特征以构建适合建模的特征集合,以提高模型的预测性
能[26]。特征工程包括应用变换函数,如算术和聚合运算符,在给定特征上生成新特征[27]。在深度学习领域,由于深度神经网络具备自动提取特征的能力,特征工程通常不需要手动构建,但这也导致模型可解释性降低[28]。然而,在大多数机器学习算法中,特征工程对于模型的性能至关重要,因此在实际应用中,特征工程的设计是耗时的关键步骤[29]。
特征工程常用的方法包括独立成分分析、类别编码器、聚类和主成分分析等[30]。独立成分分析用于将多个观测信号分解为独立的非高斯分布成分,以提取潜在的重要信息,改善模型性能。类别编码器用于处理分类变量,并将其转换为机器学习模型可以处理的数值形式。聚类方法有助于发现数据中的潜在模式和结构,为特征工程提供数据集信息。主成分分析用于降低数值型数据的维度,通过线性变换将原始数据投影到一组新的维度上,以保留尽可能多的信息并减少特征数量[31]。这些方法在特征工程中发挥着重要的作用,能够提取有用的特征,降低数据的维度,并帮助构建更优的机器学习模型。
2.1.3 模型选择及训练 在具备合适格式的充足数据之后,即可建立用于材料分析的模型。建模过程包括选择适当的算法、利用训练数据进行训练,最后进行预测。如图3所示,机器学习按数据类型可分为监督学习、无监督学习和半监督学习。
监督学习:在监督学习中,如图3(a)所示。数据集被视为一个训练集,包含输入变量及其相应的输出变量。监督学习算法的目标是从训练数据中学习输入(结构)和输出(属性)之间的映射函数。主要目标是在训练后构建一个能够对新数据进行可接受水平预测的模型。监督学习可以分为回归和分类两种主要类型,它们的目标都是建立能够从已知输入变量预测输出值的模型,不同之处在于输出变量的类型。在回归问题中,要预测的变量是连续且多样化的,例如熔点、带隙和弹性模量等。回归算法包括线性回归、高斯过程回归以及决策树回归等方法。
另一方面,在分类问题中,算法的目标是对输入数据进行标签预测,即对输入数据赋予特定的分类标签。这些标签是离散且单一的,用于表示不同类别,例如材料是否导电、是否多孔等。常见的分类算法包括线性判别分析、k最近邻、朴素贝叶斯、支持向量机和核岭分类等。例如,GHIRINGHELLI等[32]使用核岭分类算法以及从价轨道的能级和半径得出的描述符来预测闪锌矿和纤锌矿型晶体结构之间的晶体排列。在模型选择和训练过程中,理解监督学习中的这些基本概念和方法,并根据具体问题和数据特点选择合适的算法,对于建立高性能的预测模型至关重要。
无监督学习:该算法如图3(b)所示,其目标是在没有预先标记的数据上发现数据的内在模式和结构。与监督学习不同,无监督学习不依赖于对应输出变量的信息,而是通过对输入数据进行推断和聚类,从中发现数据的隐藏特征和关系。无监督学习在没有人工监督或指导的情况下,探索数据的潜在结构和规律,提供了对数据的深入理解和分析的有价值工具。
无监督学习算法可大致分为两种类型:聚类和降维。在聚类算法中,机器学习流程将数据划分为几个具有相似特征的记录组,而不预设这些组的性质(与监督学习分类任务不同)。降维算法可以辅助发现数据中隐藏模式和群组结构,为数据提供洞察信息。降维算法用于减少数据的维度,使其更易于可视化和处理,保留数据的关键特征,降低数据的复杂性。在处理高维数据集,特别是在图像处理任务中,降维算法具有重要作用[33]。
半监督学习:是一种介于监督学习和无监督学习之间的学习方法。如图3(c)所示工作流程,在半监督学习中,虽拥有大量的输入数据,但只有有限数量的相应输出数据。半监督学习旨在从数据集的标记部分学习,训练准确的模型。首先,利用无监督学习算法对数据进行聚类或相似性分析,将相似的数据点分组;然后,利用监督学习技术对这些已标记的数据进行训练和预测。目前,半监督算法广泛应用于文本和语音分析、互联网内容分类以及蛋白质序列分类应用等领域。例如,COURT等[34]
使用半监督学习方法创建了一个包含39 822个居里和内尔温度材料数据库,该数据库通过对68 078篇化学和物理文章的文本挖掘,应用自然语言处理和半监督关系提取算法从文本中获取材料属性值。
半监督学习的发展为利用大量未标记数据进行模型训练提供了有效的方法,对于数据集有限或成本较高的情况下仍能取得良好的预测效果,在实际应用中依旧具有重要意义和潜力。
2.1.4 模型评估 正如上文所述,机器学习的主要目标是训练和生成一个有效的计算模型,能够准确预测结果。为了确定模型的准确性,不能仅仅依靠对训练数据集的验证结果。最佳方法是评估经过训练的机器学习模型在未包含在训练集中的数据上的性能。从给定规格的数据集开始,采用交叉验证技术比简单地将数据分为训练集和验证集更加有效,其中最常用的交叉验证方法之一是 k 折叠交叉验证。在此方法中,数据集被分为多个子集,在机器学习训练过程中,使用所有子集作为训练集来训练模型,并将一个子集保留作为测试集。训练和评估过程会重复多次,每次使用不同的数据子集进行验证。
在评估机器学习模型时,其中一个要考虑的问题是模型的复杂度是否与数据的复杂度相匹配。如果数据不够详细或模型过于简单,生成的模型可能会出现偏差,这种称为欠拟合。相反,如果模型过于复杂,参数过多,就可能出现过度拟合。为了生成最佳模型,平衡欠拟合和过度拟合,通过调整超参数是非常重要的。
为了评估机器学习超参数优化的结果是否提高了算法的准确性,需要根据问题的类型选择合适的评估指标。对于回归问题,常用的评估指标包括相关系数(R-squared,R2)、平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)[35]。分类模型准确性的评估指标包括分类准确率、召回率、准确率、受试者工作特征曲线、铰链损失、逻辑回归损失、混淆矩阵、覆盖误差、汉明距离、标签排名平均准确率和排名损失[36]。常用的聚类问题的模型评估指标包括兰德指数、等高线系数和互信息[37]。
2.2 机器学习研究医用金属材料 由于传统实验以及计算模拟方法对医用金属材料的研究中存在一定的局限性,诸如材料跨尺度设计、本征性能与工艺设计关联以及研究效率低和成本昂贵等。随着大数据的发展完善,机器学习作为第四研究范式,在医用金属材料取得显著的发展。
根据输入特征参数的类型,机器学习在医用金属材料性能预测中可以分为两大类:宏观特征参数和微观特征参数。宏观特征参数主要涉及材料制造过程中的工艺参数、扫描速度、老化参数及制品的厚度等。微观特征参数则是包括晶格常数、晶粒存能密度和晶体微观结构的变化以及晶体元素组成等结构内部属性。在医学材料领域,评估材料是否适用于医学领域的关键因素是其材料的关键特性能否达到人体骨骼及组织承受范围。因此,根据文献报道,对于医用金属材料特性研究,最广泛的是对材料成分、结构或工艺与特性之间关系的建模和预测。
在这篇综述文章中,如表1所示,将医用金属材料分成了:不锈钢共基合金、钴铬合金、钛合金及镁合金共4类,由于各个金属材料都存在特性上的弊端,因此将分别展示机器学习在这些金属材料中采用宏观特征参数和微观特征参数对金属材料特性改善以及性能预测的应用[38-43]。
2.2.1 不锈钢共基合金 此合金是外科领域中首个成功应用的金属植入材料。由于材料易于制造,并且可以通过常规灭菌程序进行灭菌,因此广泛应用于骨科和植入设备,具有优异的耐腐蚀性[38-39]。机器学习在不锈钢合金特性预测领域的应用主要集中在力学性能方面,特征参数主要包括以下2个方面:①晶粒存能密度等晶体微观结构;②激光功率、马氏体基体、老化时间及老化温度等工艺参数。
针对微观特征参数的研究,WENYE等[44]从晶体微观结构角度出发,以等轴晶粒和柱状晶粒的晶粒存能密度和峰值应力作为特征输入,通过回归神经网络机器学习模型预测不锈钢的疲劳寿命。实验结果显示两种微观结构预测值与计算值之间具有良好的一致性。然而,在中低至中高周期疲劳过程中,随着数据量的增加,测试误差也相应增大,这是因为金属在中低至中高周期疲劳过程中的微观变形使得内部结构变得比较复杂,涉及多种力学和物理现象。文章使用的机器学习模型不能很好地捕捉这些复杂性,导致误差增大。由此看来,回归神经网络模型可准确预测晶体在低至中周期疲劳寿命。
针对宏观特征参数的研究,DUAN等[45]选取了先前实验中的139个L-PBF不锈钢316 L样品数据,以激光功率P、扫描速度v和材料层厚t为特征参数,利用自适应神经模糊推理系统(ANFIS)预测断裂机制和疲劳寿命。结果表明真实值与预测值具有较高一致性。然而,该模型的适用性仅限于训练实验范围。因此,选择具有代表性的输入变量并建立大型数据库进行训练对提高模型泛化能力至关重要。为此,SHEN等[46]开发了一种结合支持向量机和物理冶金原理指导的新型机器学习算法模型。通过仅使用102个UHS不锈钢样本,以马氏体基体、残余奥氏体及沉淀物的含量和形态、老化温度和老化时间作为特征参数,成功预测了不锈钢的硬度。如表2所示,测试集的平均预测结果与最佳预测结果基本一致,表明该模型具有优异的泛化能力和高预测精度,在小数据集上表现尤为突出。
因此,虽然各种机器学习模型在不锈钢力学性能研究中取得了一定的成果。然而,仍需关注提高模型泛化能力、扩大训练数据集以及选择更具代表性的输入变量等问题。此外,实际应用中,可以尝试结合多种模型以获得更精确的预测。
2.2.2 钴铬合金 相较于其他金属生物材料,钴铬基合金因其卓越的耐磨性而在人工膝关节、髋关节、骨科植入物和牙科修复体等应用领域中得到广泛使用[40-41]。然而,其较高的模量可引起股骨头与植入物之间的应力屏蔽,并且股骨头与植入物的直接接触可能会随时间推移导致磨损。因此,研究人员对钴铬合金的附加合金元素进行了研究,以改善力学性能来提高其力学性能,由于钴铬合金的力学性能的主要影响因素是合金的晶体结构,所以对于钴铬合金的研究,机器学习主要从微观特征参数入手,通过准确预测钴铬合金的力学性能,从而有效应对合金成分设计的挑战。
针对多组分钴铬合金,ZHAO等[47]使用人工神经网络模型将元素特征与长期排序相结合,以观察不同状态下微观结构中有序程度和方式的变化。通过选取价电子浓度、原子尺寸失配、配置熵、电负性差和混合熔点作为输入特征来预测晶格畸变和电负性,准确率达到了82%,有效捕获合金微观结构的变化。CHANG等[48]使用人工神经网络的方法预测Al-Co-Cr-Fe-Mn-Ni合金的硬度,并探究材料成分和性能之间的联系。通过将硬度、固体密度和原子质量作为特征输入,通过与实验硬度进行比较,显示出良好的一致性(R2=0.94;MAE=36 HV)。WEN等[49]将机器学习与传统实验相结合,探究Al-Co-Cr-Cu-Fe-Ni合金的硬度,将各个元素的原子占比范围内组成的合金对应的硬度作为数据集,将高熵合金的设计作为一个迭代循环,结合了机器学习建模、实验设计算法和实验反馈,实现了高熵合金的设计。研究发现,合金成分逐渐稳定,并且有35种合金的硬度值高于训练数据集中的最佳值。CHEN等[50]采用9种机器学习回归模型和分子动力学模拟,回归模型筛选结果如表3所示,支持向量机偏向函数核的均方根差最小,其预测结果最好。其次将价电子浓度VEC,空位形成能量Ev和内聚能的不匹配DEC作为输入特征,通过支持向量机偏向函数核预测高熵合金的屈服强度,准确率达到97%。结果发现,V5Cr16Fe9Co35Ni35 具有最高的屈服强度,并且随着迭代次数的增加,机器学习模型的鲁棒性得到了提高。
最后,针对非多组分钴铬合金,MILONE等[51]利用机器学习算法和有限元分析对植入体进行建模,并根据材料的磨损体积损失评估髋关节植入物假体手术的最佳材料。研究人员对人形模型进行建模,并对人体的坐、站、走进行动作捕捉,观察髋关节和脊柱以及膝盖和臀部的角度形态变化,同时选取了摩擦系数、磨损系数、压力指数和滑动速度指数作为线性回归模型的特征参数,预测钴铬合金、Ti6Al4V以及Si3N4-TiN的体积损失。结果如表4所示,钴铬合金对在磨损(与股骨头相关)引起的体积损失方面表现更好,并将所得结果与文献研究进行了比较,显示出良好的一致性。同时,该结果表明,相对于传统条件,例如髋关节模拟器,开发的人形模型并对其进行动作捕捉是一种有效的替代方案,用于估计作用在髋关节植入物上的负载和旋转条件,并取得了优异的结果。
综上所述,研究人员使用人工神经网络和支持向量机等机器学习算法来预测合金的性能和微观结构,通过将元素特征和其他属性作为输入特征,成功地实现了对合金硬度、屈服强度等性能的准确预测。此外,针对非多组分钴铬合金的研究,使用机器学习算法对植入体进行建模,评估髋关节植入物的最佳材料,并通过动作捕捉对人体模型进行了实验验证。由此可以看出,机器学习可以加速材料性能预测和合金设计过程,同时机器学习模型的高准确率和鲁棒性使其成为研究人员有效探索新材料和优化合金性能的有力工具。此外,结合机器学习和实验验证的方法,可以更好地理解材料的行为和性能,为医用金属材料的发展和应用提供有价值的信息。
2.2.3 钛合金 钛及其合金是应用最广泛的金属植入物材料,因为与其他金属材料相比,钛及其合金具有优异的生物相容性、低密度、高强度。对于钛合金而言,关键特性在于选择具有类似于人骨的低模量,以避免刚度不匹配和应力遮挡问题[42]。因此,对于钛合金的特性研究,机器学习主要从其模量入手,加速开发新型优异钛合金。
针对输入钛合金微观特征参数研究中,ZOU等[52]使用基于门捷列夫周期表形式的高通量计算生成的数据,包括电子功函数、费米能、成键电荷密度和晶格畸变能。然后采用基于径向基核函数的支持向量机算法,发现预测的含β单相的Ti-7443合金与F2066合金相比,具有48 GPa的低杨氏模量、良好的屈服强度和低Mo含量的伸长率,并且可以从高通量计算的电子特性中揭示Ti-7443合金力学性能优异的原因,因此,该方法提供了对组成-结构-属性关系的有效见解,而且还可以以更有效的方式设计高强度延展性钛合金。IZONIN等[53]使用了一种混合机器学习算法(概率神经网络支持向量机)对医学植入物钛基粉末(Ti-6Al-4V和Ti-Al-V-Zr)进行性能评估。
如图5(a)所示,即为概率神经网络向量机,是将概率神经网络用作预处理数据的工具,输出为概率神经网络的求和层的输出,以便支持向量机分类器进一步使用其工作结果。研究人员将颗粒表面生长物的含量,粉末颗粒的直径范围和粉末颗粒的形式作为特征输入,预测医学植入物钛合金粉末混合物的高质量或低质量性能的分类任务。结果表明,概率神经网络支持向量机的预测召回率在91%,可有效地分辨合金粉末的高低质量,用于解决钛粉合金烧结前通过增材技术估算钛粉合金的微观组织缺陷和性能问题。使用该模型将显著减少制造生物医学植入物的材料、时间和人力资源。WU等[54]使用人工神经网络发现了具有低模量的新型β钛合金。
如图5(b)所示,研究人员使用2个人工神经网络模型分别预测钛合金的马氏体转变温度和杨氏模量,2个人工神经网络输入的数据都为Ti,Nb,Zr,Sn,Mo和Ta的元素成分含量。预测结果发现,杨氏模量的预测RMSE为12.7 GPa,马氏体转变温度的预测RMSE为33.4 K,结果较好,并发现了一种类骨模量的合金:Ti-12Nb-12Zr-12Sn,该合金模量小于50 GPa,并且根据研究人员对合金成本的调查,发现该合金的成本最低,因此,该算法模型可以快速、低成本地找到低模量钛合金,展示了机器学习方法在加速钛合金空间探索方面的前景。RAJ等[55]运用多元线性回归分析、人工神经网络和模糊推理系统3种机器学习算法,以合金元素成分为特征输入,预测不同元素成分下的钛合金的弹性模量。研究发现,Al,Zr,Fe,Sn和Cr等合金元素在降低弹性模量方面起着最重要的作用,而对钛合金的强度没有太大影响。同时LIU等[56]也是将合金成分作为数据集特征输入,利用梯度增强决策树分类模型预测微观结构,利用随机森林回归模型预测杨氏模量,预测结果与实验一致,并成功研制出具有单β相组织和杨氏模量69.91 GPa的Ti-13Nb-12Ta-10Zr-4Sn
合金。
针对输入钛合金宏观特征参数研究中,ZHENG等[57]提出了一种将径向基函数神经网络、多层感知网络、最小均方算法以及K*模型集成的模型,如图5(c)所示。以牙齿修复体钛合金在人工唾液中的咬合力,滑动频率和周期作为特征输入,预测修复体的磨损损失。结果表明,集成学习模型的误差在3%-4%之间,在预测牙齿修复材料磨损损失方面具有良好的稳定性和高精度。当钛合金中含有多种元素且分布均匀时,就形成了一种被称为高熵合金的新材料。高熵合金能够将多个优异的特性结合起来,因此成为了近年来钛合金研究的热点。BHANDARI等[58]通过随机森林回归模型对MoNbTaTiW和HfMoNbTaTiZr高熵钛合金的硬度进行预测,硬度通过屈服强度的大小来表示,以体积模量、熔化温度为重要特征,预测结果为随机森林模型的准确率达到了95%。然而,该模型针对其他合金的预测时精度较低,缺乏泛化能力。为了提高模型的泛化能力,SUN等[59]将相图计算与极限梯度提升模型相结合,以Ta含量、熔点和混合熵为特征参数输入预测高熵合金的硬度,预测结果为准确率达到97.8%,并设计出具有理想硬度的Ti-Zr-Nb-Ta难熔高熵合金,最后用实验验证发现设计的高熵合金与实验结果高达98%的相关性,表明该方法显著提高了模型的泛化能力,能够以较高的准确度识别原始输入数据集之外的有用高熵合金。Zhou等[60]采用6种机器学习模型,根据增材制造工艺参数来预测高熵合金硬度,并通过增材制造实验制备4种高熵合金验证预测结果。结果如表5所示,纳入增材制造工艺参数作为特征参数后,各模型预测精度均有不同程度提升,表明将增材制造工艺参数融入机器学习模型能够有效提高高熵合金硬度的预测精度。
综上可见,在医用材料研究中,机器学习方法为钛合金等材料的性能预测和设计提供了新的途径。研究人员利用机器学习算法,如支持向量机、概率神经网络和人工神经网络等,结合特征参数的输入,成功预测了钛合金的硬度、弹性模量和疲劳损失等关键性能指标。这些预测结果在实验验证中表现出较好的稳定性和高精度,使得机器学习方法成为医用材料研究中的有效工具,加快筛选具备医用适用性的植入物。同时机器学习在高熵合金等新材料研究中的应用,为探索新型合金材料提供了前所未有的机会。研究人员结合机器学习模型和相图计算等方法,成功识别出高熵合金中有用的组分,取得了优异的预测结果。这种机器学习方法不仅提高了高熵合金的预测精度,而且显著降低了研发新材料的时间和成本,为医用材料的开发提供了新的思路。最后,研究人员通过结合实验验证和理论模拟将机器学习与传统方法相结合,有望更好地解决医用材料的复杂问题,推动医用材料领域的发展和应用。总体而言,机器学习在医用材料研究中展现出巨大的潜力,为未来医疗器械和植入物的开发提供了有力支持。
2.2.4 镁合金 作为一种新型医用材料,镁合金具有出色生物可降解性。当镁合金作为植入材料进入人体组织后,可以随着人体代谢逐渐降解,无需进行二次取出,并且没有毒性。然而,镁合金的低耐蚀性和力学性能在一定程度上限制了其在医疗领域的应用[43]。为了克服这些局限性,研究人员利用机器学习技术来优化镁合金性能,从而提升其在医疗领域的应用潜力。
针对输入镁合金微观特征参数研究中,JAAFREH等[61]从AFLOW数据库[62]中筛选出3 591种镁合金金属间化合物,选取了晶体的带隙、形成能量、稳定性及其松弛晶体参数等271个特征来预测化合物的剪切模量和体积模量,并采用自适应提升算法模型,也是一种集成算法模型,如图6a所示,该模型是将每个弱回归器进行学习迭代生成强回归器,从而预测材料的特性。预测结果表明,体积模量和剪切模量的平均误差分别为4.92%和16.9%,相关系数R2得分分别为0.94和0.92并通过该模型筛选出来的MgB13和MgPd2具有优异的剪切模量和体积模量,最后用第一性原理计算两种化合物的电荷密度分布和电子定位函数解释了两种化合物优异性的原因,从而得到验证。这一研究表明,该模型可用于加速晶体材料中剪切模量和体积模量的计算,并且结合第一性原理计算电荷密度分布和电子定位函数的分析还为确定镁基合金的性能-结构关系提供了一个额外的工具。WANG等[63]使用高通量筛选来抑制电偶腐蚀,图6b为高通量筛选流程图,通过筛选获得二元镁金属间化合物,该化合物对镁合金的电偶腐蚀具有较小的热力学驱动力和低氢吸附能,结果发现Y3Mg,Y2Mg和 La5Mg可抑制镁合金的电偶腐蚀。最后研究人员选取功函数和加权第一电离能为特征,用K近邻算法模型预测合金的腐蚀电位,结果发现大多数Mg-RE二元金属间化合物与Mg基体具有接近的平衡电位,并与DFT验证一致。机器学习模型可加速高通量筛选的过程,高通量与机器学习的结合不仅预测了一些有前途的二元Mg金属间化合物,可以阻碍电偶腐蚀,而且还为耐腐蚀金属合金设计提供了一种高通量筛选策略,这可能对未来的实验具有指导意义。
腹主动脉瘤是导致死亡的最普遍和最危险的疾病之一。最近,血管内动脉瘤修复优于开放主动脉手术,因为它是一种安全可靠的技术,将支架移植系统放置在主动脉瘤内,它旨在设计一种具有生物友好合金元素的Mg可生物降解合金,该合金可增强合金的耐腐蚀性和机械性能,设计用于腹主动脉瘤修复的支架。因此,SUH等[64]和LU等[65]都使用随机森林模型预测了镁合金的力学性能和腐蚀性能。两者使用的数据均包括元素和力学参数,不同之处在于JSUH等[64]利用随机森林将锌确定为极限抗压强度和体外腐蚀速率的关键决定因素,并提出了0.5%≤Zn质量分数≤1.5%,0.6%≤Mn质量分数≤1.2%,0.0≤Sr质量分数≤0.6%和0.0≤Ca质量分数≤0.15%最佳含量,通过该含量生成的镁合金的极限抗压强度为244-305 MPa,体外腐蚀速率为0.31-0.83 mm/年,可有效植入到血管中,并为承重镁植入物提供了最优元素含量,促进镁合金植入体的开发。而LU等[65]比较了4种机器学习算法:随机森林、多元线性回归、支持向量机回归和极端梯度提升预测镁合金的腐蚀电位如表6所示,结果表明随机森林算法提供了比其他3种机器学习算法最准确的预测,此外,研究人员利用随机森林模型发现Mg-Al合金比纯Mg合金具有更高的腐蚀电位,并使用了特征创建(将化学成分特征转换为原子和物理特性),因此输入特征不限于特定的化学成分,提高了机器学习模型的泛化性。由此可以看出,随机森林模型在预测镁合金性能呈现出优异的趋势,为承重镁植入物提供合金设计指导。
针对输入镁合金宏观特征参数研究中,Li等[66]采用自适应神经模糊推理系统和支持向量机预测镁合金植入物的屈服强度和极限抗拉强度,将严重塑性变形参数(包括金属成形过程的种类、通过次数和过程温度)作为特征输入,研究了严重塑性变形与镁植入物力学性能之间的关系。最后用基因表达编程和基因编程验证了机器学习的预测能力,预测结果表明模型的准确率均高于0.8。研究表明基于自适应神经模糊推理系统和支持向量机的模型在预测镁合金用于骨折固定和骨科植入物的力学行为方面具有较高的准确性。Mi等[67]使用粒子群优化算法优化人工神经网络模型预测镁合金的机械性能(屈服抗拉强度、极限抗拉强度和伸长率),并以合金成分、挤压工艺参数等11个参数作为特征输入。预测结果分别为R2:0.98、0.96和0.95,准确度较高。最后研究人员利用逆向设计模型反向搜索满足目标性能条件的成分和工艺参数的组合,该模型平均计算精度约为7%。经过筛选,设计了4种具有高性能和低成本属性的合金,并通过实际熔炼和挤压实验进行了验证,误差分别为7.8%、6.6%、8.6%和6.3%。结果表明,逆向设计模型可用于设计和开发更多新型高性能、多组分的镁合金,无需先验知识和深入研究机制。该模型的泛化能力较强,只需更改数据集即可用于其他类型的合金设计。XU等[68]基于人工神经网络和支持向量机算法,使用加工参数(均质温度和持续时间,轧制/挤出温度和速度,退火温度和持续时间)作为特征输入,包含112个数据的数据集构建了2个模型,2种模型在预测屈服强度、极限抗拉强度和拉伸伸长率方面都取得了良好的准确性。预测结果为人工神经网络和支持向量机模型的都取得了良好的准确性,并以此开发了一种新的挤压镁合金,并将该合金与预测值相比,准确度较高,说明该模型的泛化能力较强,加速镁合金力学性能的开发。Mi等[69]对90种机器学习模型进行了汇总比较,结果表明决策树和人工神经网络的准确率均在80%左右。此外,Mi等[69]还成功开发了4种新型Mg-Mn合金,具有超细晶粒和预期力学性能。LIU等[70]采用极限梯度提升模型,以老化参数为特征预测材料硬度,并成功合成了一种新型Mg-Al-Sn-Zn-Ca-Mn合金,该合金的维氏硬度值为110.5 Hv,超过了文献初始数据集中的最高值(102.5 Hv);最后探究该合金有超高硬度的原因,其原因是Mg17Al12和Mg2Sn老化过程中生成了沉淀物,提高该合金的硬度。该方法可有效生成超高硬度的镁合金,并加速高强度镁合金的开发。
综上所述,在镁合金微观特征参数研究方面,多个研究团队采用机器学习方法,如自适应提升算法、K近邻算法及随机森林等,结合大量特征参数来预测镁合金的性能,这些预测结果显示出较好的准确性和稳定性,为材料性能优化和设计提供了重要依据。其中,集成算法模型(如自适应提升算法)在预测镁合金的体积模量和剪切模量方面取得了较高的准确率。此外,机器学习方法结合第一性原理计算等分析手段,还为确定镁合金性能与结构关系提供了额外的工具。针对镁合金的强度以及腐蚀性能,研究人员使用多个机器学习模型进行对比,发现随机森林表现出较好的预测准确度,并利用该模型预测出镁合金最优元素含量比,该方法在设计用于腹主动脉瘤修复的支架时,提供了有益的元素含量指导,促进了镁合金植入体的开发。在宏观特征参数研究中,机器学习模型,如支持向量机、随机森林和人工神经网络等,用于预测镁合金的力学性能和腐蚀性能。这些模型在预测准确率方面表现出优异的趋势,并有助于加速镁合金材料的设计和优化。总体而言,机器学习在镁合金研究中的应用为材料性能预测、设计和优化提供了新的有效途径,有望推动镁合金材料的进一步发展和应用,尤其在医用植入物等领域具有重要的实际应用价值。