基于集成学习的光电转化效率预测模型研究
发布时间:2020-09-16 19:38
太阳能光电转化效率(Power Conversion Efficiency,PCE)是评价染料敏化太阳能电池(Dye Sensitized Solar Cell,DSSC)性能的一项至关重要的参数,因此,光电转化效率预测的精度直接影响到太阳能电池的性能。但是由于电池器件结构复杂,很难利用量子化学计算方法直接从分子结构性质准确计算出光电转化效率的计算值。而机器学习方法能有效地绕过复杂的实验过程,直接构造出染料分子结构性质与太阳能电池光电转化效率定量关系。本文结合量子化学方法(Quantum Mechanics,QM)与机器学习方法(Machine Learning,ML)建立量子化学与机器学习校正模型QM/ML模型,结合两者的优势来预测染料敏化太阳能电池光电转化效率。首先,利用量子化学B3LYP方法在STO-3G和6-31G*基组上分别计算出染料分子的物理化学性质;其次,采用3种机器学习方法:支持向量机(Support Vector Machine,SVM)、广义回归神经网络(General Regression Neural Network,GRNN)、分类与回归树(Classification and Regression Tree,CART)构建了集成学习器SVM-GRNN-CART(SGC);最后SGC结合三种特征选择方法增L去R选择算法(Plus-L Minus-R Selection algorithm,+L-R),随机Lasso算法(Randomized Lasso algorithm),遗传算法(Genetic algorithm)建立了集成学习级联回归模型。级联回归模型第一级输出为短路电流(Jsc)、开路电压(Voc)和填充因子(FF),它们作为第二级回归模型的输入来预测光电转化效率PCE。实验结果表明,与单一学习器SVM、GRNN、CART和同质集成学习器随机森林(Random Forest,RF)对比,集成学习器(SGC)级联回归模型在预测能力、拟合优度和模型的稳定性方面有明显优势。尤其在STO-3G基组上,SGC结合+L-R方法来预测PCE得到了最好的预测结果,其中平均绝对误差为0.37(%),均方根误差为0.50(%),决定系数为0.89。研究表明SGC可以更有效地预测有机染料敏化太阳能电池的光电转换效率,尤其在耗时较低的小基组STO-3G下获得较好的预测结果,为预测与设计合成新的染料分子提供了一个有效的工具,从而为实验合成节约了成本。
【学位单位】:东北师范大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TM914.4;TP181
【部分图文】:
*);(2)在染料 TiO2 表面分离激子并将电子注入到 TiO料中留下空穴(D+);(3)通过接收来自氧化还原对(RE)的还中产生氧化还原对(OX)的氧化态来进行染料再生;(4)电电极的电子再生并产生 RE;(5)通过向 D+提供电子注入 提供电子注入电子重组。通过以上过程,当太阳光照射转化成可利用的电能。本文选取的敏化材料全部由无金成,且染料分子全部为有机芳香胺染料分子,无论从环境方面考虑,未来都具有的广阔的发展前景。
图 3.2 QM/ML 模型总体研究路线图基于机器学习方法与量子化学方法结合的思想,建立 QM/ML 模型,总体研线如下图 3.2 所示首先建立有机分子数据库,然后对特征描述符进行筛选,进行机器学习建模。QM/ML 模型具体研究内容主要包括以下几个部分:(1)建立分子数据库:数据库的建立是本项目奠定基础最关键的一步,数据确性是获得准确模型的关键,因此在选择分子过程中,要计算不同类型基组,使数据模型具有更好的代表性,本文选取了 STO-3G 和 6-31G*两个基组。(2)数据集的划分:如何挑选具有代表性的数据集,即数据集的优选问题也模的关键。目前常用的数据集划分方法有 Random Sampling(RS),nard-Stone(KS),sample set partitioning based on joint x-y distance(SPXY)。RS即随机选取一定数量的数据组成训练集,方法简单,但是每次选取的数据集差异很大,不能保证数据的代表性和模型的外推能力。KS 算法从所有的数挑选训练集。该方法能够保证训练集中数据分布均匀,但是需要迭代计算空离。SPXY 算法是采用基于 x-y 距离结合的数据集划分方法,对训练集中的进行选择和优化,能够更有效的覆盖多维向量空间,是目前普遍认为最合理
i 的模型预测输出,trainmeany 代表训练集的响应实验值均值。3.2 集成学习级联回归模型小节分别介绍了级联模型和集成学习模型,对如何构建级联模型和作了详细描述。.2.1 级联模型联模型(Cascaded Model)的构想启发于有机染料敏化太阳能电池光化效率(PCE)和其他三大参数 Jsc、Voc、FF 之间的内部联系。太阳转化为电能需要经历一系列的复杂反应,很难定性的分析具体哪些对光电转化效率的值发挥着重要作用,正是由于这种难题,本文提级联模型,虽然并不能直接找到光电转化效率与性质之间的关系,找到 PCE 与 Jsc、Voc、FF 之间的关系,将 Jsc、Voc、FF 作为中间建立 PCE 与染料分子物理化学性质之间的校正模型,克服了直接问题,不但可以提高光电转化效率的最终预测精度,而且更加便于性质,因为分 2 级进行预测,使建模过程更加清晰明了。
本文编号:2820287
【学位单位】:东北师范大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TM914.4;TP181
【部分图文】:
*);(2)在染料 TiO2 表面分离激子并将电子注入到 TiO料中留下空穴(D+);(3)通过接收来自氧化还原对(RE)的还中产生氧化还原对(OX)的氧化态来进行染料再生;(4)电电极的电子再生并产生 RE;(5)通过向 D+提供电子注入 提供电子注入电子重组。通过以上过程,当太阳光照射转化成可利用的电能。本文选取的敏化材料全部由无金成,且染料分子全部为有机芳香胺染料分子,无论从环境方面考虑,未来都具有的广阔的发展前景。
图 3.2 QM/ML 模型总体研究路线图基于机器学习方法与量子化学方法结合的思想,建立 QM/ML 模型,总体研线如下图 3.2 所示首先建立有机分子数据库,然后对特征描述符进行筛选,进行机器学习建模。QM/ML 模型具体研究内容主要包括以下几个部分:(1)建立分子数据库:数据库的建立是本项目奠定基础最关键的一步,数据确性是获得准确模型的关键,因此在选择分子过程中,要计算不同类型基组,使数据模型具有更好的代表性,本文选取了 STO-3G 和 6-31G*两个基组。(2)数据集的划分:如何挑选具有代表性的数据集,即数据集的优选问题也模的关键。目前常用的数据集划分方法有 Random Sampling(RS),nard-Stone(KS),sample set partitioning based on joint x-y distance(SPXY)。RS即随机选取一定数量的数据组成训练集,方法简单,但是每次选取的数据集差异很大,不能保证数据的代表性和模型的外推能力。KS 算法从所有的数挑选训练集。该方法能够保证训练集中数据分布均匀,但是需要迭代计算空离。SPXY 算法是采用基于 x-y 距离结合的数据集划分方法,对训练集中的进行选择和优化,能够更有效的覆盖多维向量空间,是目前普遍认为最合理
i 的模型预测输出,trainmeany 代表训练集的响应实验值均值。3.2 集成学习级联回归模型小节分别介绍了级联模型和集成学习模型,对如何构建级联模型和作了详细描述。.2.1 级联模型联模型(Cascaded Model)的构想启发于有机染料敏化太阳能电池光化效率(PCE)和其他三大参数 Jsc、Voc、FF 之间的内部联系。太阳转化为电能需要经历一系列的复杂反应,很难定性的分析具体哪些对光电转化效率的值发挥着重要作用,正是由于这种难题,本文提级联模型,虽然并不能直接找到光电转化效率与性质之间的关系,找到 PCE 与 Jsc、Voc、FF 之间的关系,将 Jsc、Voc、FF 作为中间建立 PCE 与染料分子物理化学性质之间的校正模型,克服了直接问题,不但可以提高光电转化效率的最终预测精度,而且更加便于性质,因为分 2 级进行预测,使建模过程更加清晰明了。
【参考文献】
相关期刊论文 前2条
1 王娟,慈林林,姚康泽;特征选择方法综述[J];计算机工程与科学;2005年12期
2 彭佳红,沈岳,张林峰;数据挖掘中的特征选择及其算法研究[J];计算机工程与设计;2005年05期
相关硕士学位论文 前1条
1 仲籽彦;预测有机染料敏化太阳能电池光电转化效率的级联模型[D];东北师范大学;2015年
本文编号:2820287
本文链接:https://www.wllwen.com/kejilunwen/dianlilw/2820287.html
教材专著