3月6日,中国农业科学院作物科学研究所作物智能设计算法模型课题组研发出一套自动化机器学习框架,通过将气象环境大数据与基因组信息深度融合,实现了作物精准遗传分析与基因组预测,为作物智能设计育种提供有效工具。相关研究成果发表在《先进科学(Advanced Science)》上。
作物的田间表型是由基因型、环境以及基因型与环境互作共同决定的。然而,传统的基因组预测方法往往忽略了环境因素对表型的影响,导致在多环境试验中表型预测精度有限。因此,将环境数据纳入基因组预测模型,考虑基因型与环境的相互作用,成为提升预测精度的关键。
科研团队利用大规模多环境玉米杂交种数据集,开发了一套自动化机器学习框架,该框架集成了遗传和环境特征处理功能,并将降维后的环境参数和全基因组关联分析位点作为输入进行基因组预测。在此基础上科研人员利用自动化调参、模型集成等多种先进技术进行模型训练,从而提升最终预测模型的精度。研究结果表明,该框架较传统统计模型计算时间缩短可达290倍,且能保持较高的预测精度。同时,该框架利用解释机器学习模型的输出技术量化了遗传和环境特征对表型变异及模型性能的贡献。该研究可为解析基因型与环境互作的生物学机制提供重要参考,同时为作物育种提供了新的工具。
该研究得到国家自然科学基金、中国农业科学院科技创新工程等项目的支持。(通讯员 田浩园)
原文链接:https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202412423
