3月7日,中国农业科学院国家南繁研究院、作物科学研究所与阿里巴巴达摩院联合发布了面向育种数据处理全流程的智慧育种平台,该平台实现了包括育种数据管理和分析、大模型大算力优化加速、人工智能算法预测亲本及优良品种的育种全流程整合,其数据容量、运行速度以及数据安全措施均达到世界先进水平,将成为革新生物育种的重要工具。该工具是三亚崖州湾科技城作为南繁硅谷新质生产力主阵地培育的又一重要成果。截至目前,已有来自全球23家单位的育种家使用该平台。
据了解,育种流程中涉及的高通量数据分析需要庞大的计算能力、建模技术、复杂的命令行操作技能、种类繁多的工具包,这阻碍了育种家和科研人员的使用。研发具有丰富功能性、操作界面友好、依托云服务和人工智能的高通量计算平台是当前精准育种决策所急需的。好的计算平台类似一个厨房,将数据(食材)、算力(厨具)、算法(菜谱)三者相互配合做出美味的菜肴。
为了克服这些限制,研究团队开发了智慧育种平台,它整合了种质资源信息管理、育种试验设计与模拟、海量育种组学数据存储、高通量数据分析以及智能育种决策等功能模块,支持大规模组学信息、表型信息数据的整合利用与深度挖掘。平台通过自主研发的育种决策算法,实现了对作物性状的精准预测和优异基因型筛选,可提高品种选育的精准度和效率。
此外,平台使用人工智能算法对育种大数据进行高效管理、调度和分析,引入多种大数据计算、人工智能模型、自动化处理模块,运算速度大幅提高。如针对基因测序数据的变异位点计算加速达到110倍,基因型过滤加速25倍以上,群体遗传学分析加速1000倍以上;全基因组选择算法准确率平均提升15%以上,预测稳定性提升5%。大田试验提供7种试验模式并且自动在田间规划试验用地和种植品种。育种平台支持1PB的数据存储,计算能力可支持上百个用户同时使用。
智慧育种平台的建设依托三亚崖州湾科技城国家南繁作物表型研究设施和大数据中心,实现了将作物海量育种数据与先进的大数据算法结合,开辟了智慧育种“新赛道”。
作者:李慧慧 农民日报·中国农网记者 邓卫哲