基于机器学习快速预测ABO.pdf



《基于机器学习快速预测ABO.pdf》由会员分享,可在线阅读,更多相关《基于机器学习快速预测ABO.pdf(10页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010821469.7 (22)申请日 2020.08.14 (71)申请人 上海大学 地址 200444 上海市宝山区上大路99号 (72)发明人 陶秋伶陆文聪 (74)专利代理机构 上海上大专利事务所(普通 合伙) 31205 代理人 何文欣 (51)Int.Cl. G06K 9/62(2006.01) G16C 20/70(2019.01) G16C 60/00(2019.01) (54)发明名称 基于机器学习快速预测ABO3钙钛矿带隙的 在线预报方法 (57)摘要 。
2、本发明公开了一种基于机器学习快速预测 ABO3钙钛矿带隙的在线预报程序, 步骤如下: 从 文献中收集ABO3钙钛矿材料的化学式和对应的 带隙数值以及这些材料的部分实验条件, 作为机 器学习的数据集样本; 再根据化学式生成对应的 描述符; 再划分训练集和测试集; 用嵌入法结合 梯度提升回归算法对特征变量进行筛选; 利用材 料数据挖掘在线计算平台上的梯度提升回归算 法建立ABO3钙钛矿材料带隙的快速预报模型, 预 报测试集样本的带隙; 将建立预报模型生成为在 线预报应用程序。 本发明建立了高效快捷的预报 模型, 生成了一个能公开使用的在线预报应用程 序, 帮助节约实验时间和成本, 提高材料开发效 。
3、率, 具有快速方便、 低成本、 绿色环保的优点。 权利要求书1页 说明书6页 附图2页 CN 112132177 A 2020.12.25 CN 112132177 A 1.一种基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法, 其特征在于: 包括如下 步骤: 1)从文献中收集ABO3钙钛矿材料的化学式和对应的带隙数值以及ABO3钙钛矿材料的部 分实验条件, 作为机器学习的数据集样本; 2)利用已收集到的数据, 根据化学式生成对应的原子参数描述符, 并在描述符生成过 程中, 对缺损数值的样本进行删除处理; 3)将在所述步骤1)中得到的数据集样本随机划分为训练集和测试集; 4)以在所述步骤1。
4、)中收集到的带隙为目标变量, 部分实验条件及在所述步骤2)中生成 的原子参数描述符为特征变量; 利用嵌入法结合梯度提升回归算法, 对在所述步骤3)中得 到的训练集进行特征筛选, 选出建模的最优特征, 作为建模的最优特征子集; 5)利用材料数据挖掘在线计算平台(OCPMDM)上的梯度提升回归算法和在步骤4)中筛 选好的特征变量, 建立ABO3钙钛矿材料带隙的快速预报模型; 6)根据在所述步骤5)中建立的ABO3钙钛矿材料带隙的预报模型, 预报在所述步骤3)中 得到的测试集样本的带隙; 7)将步骤5)中建立的ABO3钙钛矿材料带隙预报模型通过材料数据挖掘在线计算平台 (OCPMDM)的模型分享功能。
5、, 生成快速预报ABO3钙钛矿材料带隙的在线预报应用程序, 进行 ABO3钙钛矿带隙的在线快速预报。 2.根据权利要求1所述基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法, 其特征 在于, 在所述步骤4)中, 梯度提升回归算法如下: 梯度提升回归算法通过添加新的回归树以最小化每次迭代中的目标函数, 每棵新树都 是在上一棵树的残差上进行学习, 并且都沿着损失函数的负梯度方向进行训练, 通过多次 迭代, 训练多个弱学习器, 最终将这些弱学习器进行线性组合产生一个强学习器。 3.根据权利要求1所述基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法, 其特征 在于, 在所述步骤4)中, 删除噪。
6、声大且重复性较高的特征变量, 选出建模的最优特征, 作为 建模的最优特征子集, 减少了数据噪音, 提高了筛选精度。 权利要求书 1/1 页 2 CN 112132177 A 2 基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法 技术领域 0001 本发明涉及钙钛矿的电学性能领域, 是一种基于机器学习预测ABO3钙钛矿带隙的 在线预报应用程序, 应用于特定带隙的ABO3钙钛矿新材料设计和高通量筛选。 背景技术 0002 钙钛矿由于其稳定的晶体结构、 独特的理化性质而逐渐成为新材料开发研究的热 点。 ABO3钙钛矿价格低廉, 适应性和稳定性良好, 且电子结构可调, 是一种有前途的光催化 材料。。
7、 此外, 它们还具有扩大光吸收范围, 限制光诱导载流子重组和进一步改善可见光照射 下光催化性能的潜在优势。 在光催化分解水制氢及光催化降解有机污染物方面具有很好的 应用前景。 0003 带隙(Band Gap)是导带的最低点和价带的最高点的能量之差, 也称能隙, 符号为 Eg。 在光催化反应中, 作为光催化剂的半导体, 其带隙是光电转换效率的重要影响因素之 一。 因此, 选择具有合适带隙的半导体是重要步骤。 0004 嵌入式特征选择方法是特征筛选的一种较经典方法。 它的主要思想是将特征选择 过程与学习器训练过程相结合, 利用算法本身的特性在学习器训练过程中自动选择特征。 嵌入式特征选择方法对特。
8、征进行搜索时围绕学习算法展开, 能够考虑学习算法所属的任意 学习偏差。 原理简单且效果好速度快。 0005 材料数据挖掘在线计算平台(OCPMDM)是一个用于辅助材料设计的数据挖掘平台, 是一个用于机器学习建模的非常便利的工具。 其里面包含了多种机器学习算法, 还具备了 一个强大的模型分享功能, 每一个建立的模型都可以通过此功能生成一个独立的在线应用 程序。 本工作使用材料数据挖掘在线计算平台(OCPMDM)进行建模, 并生成在线预报应用程 序。 0006 梯度提升回归树(Gradient boosting regression tree, 简称GBRT)是由斯坦福 教授Friedman 提出。
9、的一种集成学习算法。 GBRT主要包括两种算法: 回归树算法和增强算 法。 回归树对异常值具有鲁棒性, 并被用作原始模型, 而增强算法则用于提高模型预测的准 确性。 GBRT的核心思想是添加新的回归树以最小化每次迭代中的目标函数, 每棵新树都是 在上一棵树的残差上进行学习, 并且都沿着损失函数的负梯度方向进行训练, 通过多次迭 代, 训练多个弱学习器, 最终将这些弱学习器进行线性组合产生一个强学习器。 它是一种功 能强大的机器学习技术, 具有很强的预测能力和良好的实际应用效果, 已经广泛应用于各 个领域。 本工作应用梯度提升回归方算法进行建模。 0007 ABO3钙钛矿带隙的获得通常基于实验 。
10、“试错法” , 该方法耗时长、 成本高且存在盲 目性。 不利于快速获得所需带隙值的特定钙钛矿材料。 而已有的ABO3钙钛矿带隙预测技术 准确性不高, 效果较差, 方法不够便捷, 且难以公开使用。 目前还没有能够快速、 精确预测 ABO3钙钛矿带隙的公开且便捷的在线预报方法。 说明书 1/6 页 3 CN 112132177 A 3 发明内容 0008 为了解决现有技术问题, 本发明的目的在于克服已有技术存在的不足, 提供一种 基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法, 尤其克服了实验 “试错法” 的盲目 性, 提供一种基于机器学习快速预测ABO3钙钛矿带隙的在线预报应用程序。 通过。
11、嵌入法结 合梯度提升回归算法, 建立ABO3钙钛矿材料带隙预报模型, 准确性高, 效果好。 开发的ABO3钙 钛矿材料带隙在线预报应用程序仅需数秒就可以得到预报结果, 操作简单快捷。 0009 为达到上述发明创造目的, 本发明采用如下技术方案: 0010 一种基于机器学习快速预测ABO3钙钛矿带隙的在线预报方法, 包括如下步骤: 0011 1)从文献中收集ABO3钙钛矿材料的化学式和对应的带隙数值以及ABO3钙钛矿材料 的部分实验条件, 作为机器学习的数据集样本; 0012 2)利用已收集到的数据, 根据化学式生成对应的原子参数描述符, 并在描述符生 成过程中, 对缺损数值的样本进行删除处理;。
12、 0013 3)将在所述步骤1)中得到的数据集样本随机划分为训练集和测试集; 0014 4)以在所述步骤1)中收集到的带隙为目标变量, 部分实验条件及在所述步骤2)中 生成的原子参数描述符为特征变量; 利用嵌入法结合梯度提升回归算法, 对在所述步骤3) 中得到的训练集进行特征筛选, 选出建模的最优特征, 作为建模的最优特征子集; 0015 5)利用材料数据挖掘在线计算平台(OCPMDM)上的梯度提升回归算法和在步骤4) 中筛选好的特征变量, 建立ABO3钙钛矿材料带隙的快速预报模型; 0016 6)根据在所述步骤5)中建立的ABO3钙钛矿材料带隙的预报模型, 预报在所述步骤 3) 中得到的测试。
13、集样本的带隙; 0017 7)将步骤5)中建立的ABO3钙钛矿材料带隙预报模型通过材料数据挖掘在线计算 平台 (OCPMDM)的模型分享功能, 生成快速预报ABO3钙钛矿材料带隙的在线预报应用程序, 进行ABO3钙钛矿带隙的在线快速预报。 0018 优选地, 在所述步骤4)中, 梯度提升回归算法如下: 0019 梯度提升回归算法通过添加新的回归树以最小化每次迭代中的目标函数, 每棵新 树都是在上一棵树的残差上进行学习, 并且都沿着损失函数的负梯度方向进行训练, 通过 多次迭代, 训练多个弱学习器, 最终将这些弱学习器进行线性组合产生一个强学习器。 0020 优选地, 在所述步骤4)中, 删除噪。
14、声大且重复性较高的特征变量, 选出建模的最优 特征, 作为建模的最优特征子集, 减少了数据噪音, 提高了筛选精度。 0021 优选地, 在步骤7)中, 通过材料数据挖掘在线计算平台(OCPMDM)的模型分享功能, 生成了可以快速、 精确预报ABO3钙钛矿材料带隙的公开、 便捷、 操作简单的在线预报应用程 序。 0022 本发明与现有技术相比较, 具有如下显而易见的突出实质性特点和显著优点: 0023 1.本发明的在线预报方法克服传统的实验 “试错法” 的不足, 节约资源和时间; 基 于机器学习建立ABO3钙钛矿材料带隙的快速预报模型, 将数据导入模型, 仅需数秒就能得 到计算结果; 开发的在线。
15、预报应用程序, 只要输入所需的ABO3钙钛矿的化学式, 点击 “Predict” 按钮, 就可快速预报出带隙, 效率高, 使用无障碍性好; 0024 2.本发明在线预报方法不仅可以通过网址进行访问使用, 还能通过手机微信扫描 摘要附图中的二维码进行使用, 操作简单, 快速便捷; 说明书 2/6 页 4 CN 112132177 A 4 0025 3.本发明在线预报方法在整个过程中不涉及实验和不使用化学用品, 不产生化学 污染, 符合绿色环保理念; 且易于实现, 适合推广应用; 0026 4.本发明的在线预报方法通过在线预报能提前预测ABO3钙钛矿材料的带隙, 帮助 实验研究人员挑选符合要求的样。
16、本进行实验验证, 节约实验时间和资源, 提高实验的效率, 起指导作用, 并避免盲目性; 本发明方法简单易行, 成本低, 适合推广使用。 附图说明 0027 图1为实施例一ABO3钙钛矿带隙的梯度提升回归模型建模结果图。 0028 图2为实施例二ABO3钙钛矿带隙的梯度提升回归模型留一法交叉验证结果图。 0029 图3为实施例三ABO3钙钛矿带隙的梯度提升回归模型独立测试集结果图。 0030 图4为实施例四ABO3钙钛矿带隙的在线预报应用程序页面图示。 具体实施方式 0031 以下结合具体的实施例子对上述方案做进一步说明, 本发明的优选实施例详述如 下: 0032 实施例一: 0033 在本实施。
17、例中, 参见图1, 一种基于机器学习快速预测ABO3钙钛矿带隙的在线预报 方法, 包括如下步骤: 0034 1)从文献中收集ABO3钙钛矿材料的化学式和对应的带隙数值以及ABO3钙钛矿材料 的部分实验条件, 作为机器学习的数据集样本; 0035 部分ABO3钙钛矿材料的带隙数值如表1所示: 0036 表1.部分ABO3钙钛矿化学式及带隙数值的数据样本集 0037 化学式 Eg(eV) 化学式 Eg(eV) BaTiO33 LaFeO32.1 BaTi0.99Mo0.01O32.4 LaFeO32.09 BaTi0.98Mo0.02O32.2 LaFeO32.08 BaTi0.97Mo0.03O。
18、32.6 LaFeO32.07 LaFe0.85Ti0.15O32.1 CaZrO34.00 La0.925Sr0.075Fe0.925Ti0.075O32.1 CaTiO33.52 Bi0.5Na0.5TiO32.92 Ca0.95La0.05Ti0.95Cr0.05O32.49 SrTiO33.25 Ca0.9La0.1Ti0.9Cr0.1O32.48 SrTiO33.25 Ca0.8La0.2Ti0.8Cr0.2O32.5 SrTiO33.25 NaTaO33.91 AgTaO33.4 NaTa0.98Bi0.02O33.14 AgTa0.8Nb0.2O33.1 NaTa0.96Bi0.。
19、04O33.02 AgTa0.7Nb0.3O32.9 NaTa0.94Bi0.06O32.96 AgTa0.6Nb0.4O32.9 NaTa0.92Bi0.08O32.88 AgNbO32.8 NaTa0.9Bi0.1O32.9 CaTiO33.6 GaFeO32.185 说明书 3/6 页 5 CN 112132177 A 5 0038 2)利用已收集到的数据, 根据化学式生成对应的原子参数描述符, 并在描述符生 成过程中, 对缺损数值的样本进行删除处理; 数据完整的样本数为124个; 0039 3)将在所述步骤2)中得到的124个数据集样本按4:1的比例随机划分为训练集和 测试集, 训练集。
20、与测试集样本量分别为99和25; 0040 表2.特征变量列表 0041 0042 0043 4)以在所述步骤1)中收集到的带隙为目标变量, 部分实验条件及在所述步骤2)中 生成的原子参数描述符为特征变量, 收集到的特征变量, 共计20个, 如表2所示; 利用嵌入法 结合梯度提升回归算法, 对在所述步骤3)中得到的训练集进行特征筛选, 选出建模的7个最 优特征, 作为建模的最优特征子集; 0044 梯度提升回归算法具体步骤如下: 0045 梯度提升回归算法的核心思想是添加新的回归树以最小化每次迭代中的目标函 数, 每棵新树都是在上一棵树的残差上进行学习, 并且都沿着损失函数的负梯度方向进行 训。
21、练, 通过多次迭代, 训练多个弱学习器, 最终将这些弱学习器进行线性组合产生一个强学 习器。 0046 选出的最优特征如表3所示: 0047 表3.嵌入法结合梯度提升回归所选择的的最优描述符列表 0048 0049 在本步骤中, 删除噪声大且重复性较高的特征变量, 选出建模的最优特征子集, 减 少了数据噪音, 提高了筛选精度; 0050 5)利用材料数据挖掘在线计算平台(OCPMDM)上的梯度提升回归算法和在步骤4) 中筛选好的特征变量, 建立ABO3钙钛矿材料带隙的快速预报模型; 0051 6)根据在所述步骤5)中建立的ABO3钙钛矿材料带隙的预报模型, 预报在所述步骤 3) 中得到的测试集。
22、样本的带隙; 0052 7)将步骤5)中建立的ABO3钙钛矿材料带隙预报模型通过材料数据挖掘在线计算 平台 (OCPMDM)的模型分享功能, 生成快速预报ABO3钙钛矿材料带隙的在线预报应用程序, 进行ABO3钙钛矿带隙的在线快速预报。 说明书 4/6 页 6 CN 112132177 A 6 0053 本实施例基于99个ABO3钙钛矿样本结合梯度提升回归建立的带隙定量预报模型 的建模结果, 如图1所示。 0054 本实施例利用梯度提升回归算法对99个钙钛矿样本数据进行回归建模, 建立ABO3 钙钛矿带隙的梯度提升回归定量模型。 ABO3钙钛矿带隙模型预报值和文献实验值的皮尔逊 相关系数(R)。
23、为0.9809, 均方根误差(RSME)为0.1445。 本实施例方法通过来源于文献中的实 验样本数据, 建立了高效快捷的预报模型, 具有简单快捷、 低成本、 绿色环保的优点。 本实施 例基于机器学习预测ABO3钙钛矿带隙的在线预报方法, 能应用于特定带隙的ABO3钙钛矿新 材料设计和高通量筛选。 0055 实施例二: 0056 本实施例与实施例一基本相同, 特别之处在于: 0057 在本实施例中, 将训练集中的99个样本进行编号A1, A2A99。 第一步以A1, A2 A98为训练集, 采用与实施例一相同的最优特征子集, 建立模型1并运用模型1预报A99的带 隙。 第二步以A1, A2A9。
24、7, A99为训练集, 采用与实施例一相同的最优特征子集, 建立模型2 并运用模型2预报A98的带隙。 以此类推, 建立99个模型后, 通过预报值与实验值的误差判断 数据建模方法的稳定性和可靠性。 0058 基于99个钙钛矿样本结合梯度提升回归建立的ABO3钙钛矿带隙定量预报模型的 留一法内部交叉验证结果, 如图2所示。 0059 本实施例方法采用留一法对99个样本数据建立的ABO3钙钛矿带隙的梯度提升回 归定量预报模型进行留一法内部交叉验证, 留一法中钙钛矿带隙的模型预报值和文献实验 值的皮尔逊相关系数(R)为0.9290, 均方根误差(RSME)为0.2749。 本实施例方法通过来源于 文。
25、献的本数据, 建立了训练集留一法交叉验证的预报模型, 可以对数据建模方法的稳定性 和可靠性做出评估。 0060 实施例三: 0061 本实施例与上述实施例基本相同, 特别之处在于: 0062 本实施例方法利用建立的ABO3钙钛矿带隙的梯度提升回归定量预报模型对独立 测试集中的25个样本进行预报, 得到了较好的结果。 钙钛矿带隙的模型预报值和文献实验 值的皮尔逊相关系数(R)为0.9207, 均方根误差(RSME)为0.2877。 独立测试集预报结果, 如 图3所示。 0063 实施例四: 0064 本实施例与上述实施例基本相同, 特别之处在于: 0065 在本实例中, 通过材料数据挖掘在线计算。
26、平台(OCPMDM)上的模型分享功能将建立 的 ABO3钙钛矿带隙模型预报模型生成为一个在线预报应用程序。 参见图4, 用户只需要打 开在线预报应用程序的网址或使用微信扫描二维码, 在应用程序页面的 “Material Formula” 后面方框内输入需要预报的ABO3钙钛矿的化学式, 然后点击下面的 “Predict” 按 钮, 就可以快速得到该钙钛矿的带隙预报值。 这种在线预报应用程序方便快捷, 对于实验研 究人员设计有针对性带隙的新的ABO3钙钛矿非常有帮助。 0066 综上实施例所述, 本发明上述实施例涉及一种基于机器学习快速预测ABO3钙钛矿 带隙的在线预报方法, 其步骤如下: 1)。
27、从文献中收集ABO3钙钛矿材料的化学式和对应的带 隙数值以及这些材料的部分实验条件, 作为机器学习的数据集样本; 2)根据化学式生成对 说明书 5/6 页 7 CN 112132177 A 7 应的描述符; 3)将数据集随机分为训练集和测试集; 4)用嵌入法结合梯度提升回归算法对 特征变量进行筛选; 5)以带隙为目标变量, 部分实验条件和生成的描述符为特征变量, 利用 材料数据挖掘在线计算平台(OCPMDM)上的梯度提升回归算法建立ABO3钙钛矿材料带隙的 快速预报模型; 6)利用建立的ABO3钙钛矿材料带隙的预报模型预报测试集样本的带隙。 7) 将建立的ABO3钙钛矿材料带隙预报模型通过材料。
28、数据挖掘在线计算平台(OCPMDM)的模型 分享功能生成一个可以快速预报ABO3钙钛矿材料带隙的在线预报应用程序。 本发明上述实 施例方法通过来源于文献中的实验样本数据, 建立了高效快捷的预报模型, 生成了一个可 以快速预报ABO3钙钛矿材料带隙的在线预报应用程序。 该应用程序不仅可以通过网址进行 访问使用, 还可以通过手机微信扫描二维码进行使用, 具有快速方便、 低成本、 绿色环保的 优点。 使用本发明中的应用程序在线预报ABO3钙钛矿的带隙, 可以帮助实验研究人员避免 实验 “试错法” 的盲目性, 节约实验时间和成本, 提高材料开发效率。 0067 上面对本发明实施例结合附图进行了说明, 但本发明不限于上述实施例, 还可以 根据本发明的发明创造的目的做出多种变化, 凡依据本发明技术方案的精神实质和原理下 做的改变、 修饰、 替代、 组合或简化, 均应为等效的置换方式, 只要符合本发明的发明目的, 只要不背离本发明的技术原理和发明构思, 都属于本发明的保护范围。 说明书 6/6 页 8 CN 112132177 A 8 图1 图2 说明书附图 1/2 页 9 CN 112132177 A 9 图3 图4 说明书附图 2/2 页 10 CN 112132177 A 10 。
- 内容关键字: 基于 机器 学习 快速 预测 ABO
茶叶加工用脱水除湿装置.pdf
防脱插座.pdf
轨道交通的线缆分线箱.pdf
钢结构加工用激光切割装置.pdf
粉末烧结滤芯.pdf
茶叶加工用的风选除尘装置.pdf
动物饲料搅拌机.pdf
注塑机配料结构.pdf
大气环境污染监测用的空气采样装置.pdf
无人机自动归中装置.pdf
筛分机新型缓冲器.pdf
蜂窝沸石高效低耗再生装置.pdf
陶瓷茶具生产用胚体上釉设备.pdf
干蛋糕的切片装置.pdf
煤矿地质堵水用注浆装置.pdf
混凝土抗压检测装置.pdf
建筑围护结构.pdf
具有加快流速功能的薄膜冷却水槽.pdf
3D打印线材生产用废料回收装置.pdf
老年患者围术期无线血氧监测方法.pdf
厨卫设施的灯板及淋浴龙头.pdf
电网电压监测装置.pdf
跟网型与构网型变流器有功协调优化控制方法及系统.pdf
褐煤粉煤高效气化系统.pdf
煤矸石脱碳烧结用温控布料系统.pdf
erp管理系统及方法.pdf
自动化有限元预紧力数据批量传递与仿真计算控制方法.pdf
列车运行控制系统的数据通信系统及方法.pdf
基于链表的雷达信号分选方法.pdf
基于数字孪生的运动控制实训方法及系统.pdf
针对低速无人机的区域拒止方法和系统.pdf
基于智慧杆的路侧停车监测方法、装置、设备及介质.pdf
低噪音油烟净化风机.pdf
大拉连续退火机用减震装置.pdf
铝焊丝线盘固定安装机构.pdf
冲锁孔复合模结构.pdf
汽车制动蹄的圆度检测装置.pdf
用于花生联合收获机的果实筛分装置.pdf
用于电力设备的除湿装置.pdf
高粘性绝缘胶带.pdf
建筑工程用现场桩孔内清土设备.pdf
套接式地铁车站与暗挖结构洞门连接节点.pdf
用于沙堆景观制作的加固装置.pdf
自动排水式下水道井盖.pdf
三节式万向节.pdf
具有喷雾系统的飞行器模型.pdf
煤矿主通风机故障诊断装置.pdf
电机压装装置.pdf
纸箱生产用便于更换打孔头的打孔装置.pdf
新型汽车零配件固定夹具.pdf
提高烧结矿制粒均匀度的混料机.pdf
相关文档
更多


















