近日,我院刘万强教授课题组在基于机器学习预测有机太阳能受体材料分子的能量转换效率方面取得进展,相关研究成果以“Predicting power conversion efficiency of binary organic solar cells based on Y6 acceptor by machine learning”为题,发表在国际顶级期刊《Journal of Energy Chemistry》(TOP,中科院一区,IF: 13.1)。该文是继“Theoretical exploration of molecular packing and the charge transfer mechanism of organic solar cells based on PM6:Y6”一文在顶级期刊《Journal of Materials Chemistry A》(TOP,IF:14.51,中科院二区)发表以来的进一步研究成果。
Y6受体因其强吸收、窄带隙和优异的电子迁移率,已成为里程碑式的高性能有机太阳能电池(OSCs)受体材料之一。设计和合成与Y6匹配的供体分子来制备高性能OSCs器件是一种很有前景的策略。然而,基于传统实验-试错方法的供体分子的设计和合成往往是复杂的,且实验消耗十分昂贵。快速和低成本的机器学习(ML)可以有效地从数据学习并建立预测的模型。与耗时的实验-试错方法相比,机器学习在光伏材料设计中的应用有望极大促进高性能材料的发现。
课题组收集了近4年来基于Y6受体的PCE数据(图1所示),优化每种材料分子的结构,并计算了每个分子4000多个分子特征描述符。
|
图1基于Y6受体的二元OSCs分布直方图。(a)小分子供体,(b)聚合物供体。 |
如图2所示,对于4000多个特征,经过预处理并用于构建机器学习预测模型。
|
图2根据特征重要性筛选特征的工作流程。 |
根据以上策略筛选的特征用于构建以下6种ML模型:GBRT、随机森林(RF)、极限梯度增强(XGBoost)、自适应增强(AdaBoost)、支持向量回归(SVR)和多元性性回归(MLR)。
模型的训练和预测结果如图3和4所示。其中,GBRT模型体现了较低的RMSE和较高的r值,表明GBRT模型在预测器件性能方面具有较高的准确性和可靠性。
|
图4 基于小分子供体的机器学习预测值与实验值进行比较。(a) GBRT,(b) RF,(c) XGBoost,(d) AdaBoost,(e) SVR和(f) MLR。对角线表示完全正相关(r = 1)。 |
|
图4基于聚合物供体的机器学习预测结果值与实验值进行比较。(a) GBRT,(b) RF,(c) XGBoost,(d) AdaBoost,(e) SVR和(f) MLR。对角线表示完全正相关(r = 1)。 |
为了解释特征对预测PCE的影响,课题组对GBRT模型进行了SHAP分析,如图5所示。 |
图5GBRT模型的SHAP分析。(a) (b) 基于小分子供体;(c) (d) 基于聚合物供体。 |
为了验证模型的预测能力,在模型构建后又收集了10多个供体的新数据,并进行了预测。如表1所示。结果表明,这些模型的预测PCE与实验PCE具有较好的一致性,特别是GBRT模型的MAE值最小,且表现非常一致。这证明了这些模型具有良好的预测能力和鲁棒性。
这项工作提供了一个使用ML预测OSCs能量转换效率的策略,即使用ML算法挖掘了基于Y6的OSCs的PCE和供体分子结构描述符之间的复杂关系。这些模型可以为发现基于Y6受体的OSCs供体材料提供合理的预测。该工作为供体分子的快速预测和筛选提供了一种新策略,有望设计和筛选出高性能的供体材料分子。
文章信息:
Predicting power conversion efficiency of binary organic solar cells based on Y6 acceptor by machine learning
Journal of Energy Chemistry
DOI: 10.1016/j.jechem.2023.03.030
联系方式:wanqiangliu@hnust.edu.cn