精准育种迭代突围
来源: 瞭望 2024年第22期
➤传统育种方式成本高、工作量大,培育一个新品种往往需要耗时十年甚至更久。未来利用智能设计育种能够加速迭代育种周期,有望3~5年培育出新品种
➤我国基因编辑生物育种技术的基础研究水平处于世界前列,但基因编辑的产业化尚处于起步阶段
➤相比统计模型,AI模型预测作物表型的准确率平均提升15%以上,预测稳定性提升5%
文 |《瞭望》新闻周刊记者 扈永顺
基因组学和系统生物学、合成生物学、基因编辑等生命科学技术的进步,以及AI、大数据等技术的突破,带动了农作物育种向分子设计、基因编辑为代表的4.0时代迈进,最终将在AI、生物技术与信息技术“AI+BT+IT”融合下实现品种智能精准设计。
基因是决定农作物性状的核心要素。农作物的株高、果实大小、颜色、产量、抗病性和抗逆境能力等,都是由其遗传物质中的特定基因或者基因组合所控制的,因此了解清楚作物基因是进行分子设计、基因编辑育种的前提。近年来我国在优异种质资源挖掘、水稻基因组研究、主要农作物基因图谱绘制、基因编辑工具研制等方面取得了系列成就,支撑了育种4.0时代的到来。
伴随AI技术的广泛应用,智能设计育种曙光已现。近日,全球植物科学顶尖期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、中国农业科学院国家南繁研究院李慧慧研究组与达摩院(湖畔实验室)联合研发出智慧育种平台,实现了育种数据管理和分析、计算加速、AI预测亲本及优良品种的育种全流程整合。这表明,在AI、大数据等技术加持下,智能精准设计育种迈出由理论到现实的关键一步。
受访专家表示,传统育种方式成本高、工作量大,培育一个新品种往往需要耗时十年甚至更久。未来利用智能精准设计育种能够加速迭代育种周期,有望3~5年培育出新品种,为种业强国建设提供技术支撑。
挖出特异基因
在精准育种时代,借助现代生物科学技术发掘能够满足现代育种需求的关键基因,对种质资源进行精准鉴定评价,已经成为种业创新重要发展方向,一个基因成就一个产业正成为现实。
在目前精准育种的技术手段中,分子标记辅助选择技术被广泛应用。这项技术结合了分子遗传学、生物技术和传统育种策略,通过检测与目标性状紧密关联的DNA分子标记,实现了对目标基因或数量性状位点的直接选择。相较传统育种具有效率高、准确率高的特点。
“通过分子标记可以检测到水稻种子中耐盐基因的存在,进而聚合利用这些基因改良或选育出海水稻品种,实现在盐碱滩涂上种水稻,保障我国粮食安全。”青岛海水稻研究发展中心技术研发事业部部长万吉丽介绍,他们还采用分子标记辅助育种,实现了对糯性、生育期、香味、育性等多种性状的鉴定。
中国水稻研究所研究员张光恒则带领团队培育富含伽马氨基丁酸(GABA)的巨大胚功能型水稻。“通过分子标记前期介入,在两个或多个亲本杂交后代的分离群体中,提取苗期植株DNA,利用调控水稻富含GABA基因的分子标记,筛选鉴定带有该功能基因的水稻幼苗,与后期综合性状鉴定相结合,可以在较小的遗传后代群体中快速筛选获得一批不同遗传背景的功能稻新品系(品种)。”
从育种技术发展趋势来看,分子标记只能对个别位点开展辅助育种,要满足未来精准育种的需要,还需深入挖掘优异基因、解析关键基因功能,在此基础上进行基因克隆实现基因聚合定向改良或选育新品种。
我国科学家在水稻基因组测序、注释和功能基因挖掘方面走在世界前列,完成了高质量的水稻基因组参考序列构建,并分离克隆了一系列具有代表性的水稻关键功能基因,为解析水稻复杂农艺性状提供了重要基础,这些成果对于提高水稻产量、抗逆性和品质至关重要。
例如,水稻株型是决定水稻产量的主要因素之一,利用基因塑造水稻理想株型是提高水稻产量的重要途径。此前李家洋院士团队分离鉴定出了水稻理想株型的主效基因IPA1,研究发现IPA1发生突变后,会使水稻分蘖数减少,穗粒数和千粒重增加,同时茎秆变得粗壮,增加了抗倒伏能力。实验显示,将突变后的基因导入常规水稻品种,可以使其产量增加10%以上。
李家洋介绍,IPA1能使水稻向理想株型发展,在高产育种中具有重要应用前景,已应用于培育嘉优中科系列水稻新品种。例如嘉优中科6号于2017年通过国家品种审定委员会审定,具有超高产、早熟、抗倒和低直链淀粉含量等优点。生产试验平均亩产783.0千克,比对照增产16.3%。
再如,干旱是制约农业生产的主要不良因素之一,发掘旱稻的优异抗旱基因,对于稻作抗旱分子育种具有重要意义。此前由于缺乏对旱稻分化遗传基础的深入理解,利用旱稻这一抗旱生态资源发掘的抗旱基因还很少,限制了稻作抗旱分子育种进程。直到2021年,中国农业大学农学院李自超教授团队克隆了一个新的抗旱基因DROT1,鉴定出DROT1的抗旱优异基因型并揭示了其起源与演化规律。
李自超告诉记者,该抗旱基因已经获得国家发明专利,并经第三方评估机构评估价值超100亿元,被农业农村部认定为是具有重大育种价值的基因。
通过系统的收集和分析,我国科学家已经挖掘出了一批优异的农作物种质资源及其特有的基因,为实现抗病虫、耐除草剂、优质、高产、资源高效利用等分子设计育种提供了重要基因资源。
解析基因遗传网络
作物性状通常由多个基因决定,如作物的高度、产量、抗病性或耐逆性可能受到多个基因的共同调控。科学家将控制性状的主效基因或由多个基因构成并可进行遗传操作的功能单元定义为遗传网络。但由于多个基因组成的网络变量过多,寻找、确认这些基因并厘清其相互作用在很长一段时间里都是科学难题。
近年来我国科研人员做了大量基础研究,在作物高通量基因挖掘、网络解析支撑分子设计育种方面不断深入,水稻、小麦、玉米、大豆等主要作物复杂基因组学研究取得突破,复杂农艺性状调控网络持续深入,为分子设计育种提供理论支撑。
2013年,国家自然科学基金委启动了“主要农作物产量性状的遗传调控网络解析”重大研究计划,全面解析主要农作物生长发育重要生物学过程的分子遗传及生理生化调控网络。在持续10年的资助下,科研人员解析了主要农作物株型发育和籽粒形成的遗传调控网络,建立了主要农作物产量性状分子设计育种理论,为我国主要农作物高产品种培育提供理论和技术支撑。
该重大研究计划指导专家组秘书、中国农业大学教授赖锦盛向记者介绍,以挖掘玉米高产基因为例,为找到调控玉米穗行数关键基因,研究人员首先锁定候选基因KRN2,发现其对穗行数具有负调控作用,通过多年多点的田间试验、表型分析发现,与野生型相比,KRN2敲除突变体的穗行数、穗粒数、穗粒重等产量相关性状均有所提高,产量比野生型提高10%左右。随后,研究人员通过多种实验方法最终确定是由于KRN2上游非编码区在玉米驯化和改良过程中受到选择导致其表达量降低,从而提高了玉米的穗行数。研究人员还针对这些基因成功解析穗行数形成的遗传调控网络,为基因间区参与数量性状的精细调控提供了新的证据。
再如,研究人员基于多基因聚合策略,设计出一个高产、优质水稻新组合。中国科学院院士钱前带领课题组将水稻品种“日本晴”和“9311”作为优良目标基因供体,主动对28个优良目标基因进行设计,涉及产量、稻米外观品质、蒸煮食味品质和生态适应性等,研究结果将推动作物传统育种向高效、精准、定向的分子设计育种转变。
据介绍,通过实施该重大研究计划,研究人员对理想株型和籽粒发育调控机理有了较为明确的认识,完成了228个调控株型和籽粒发育相关的关键新基因的克隆与功能解析,发现了株型和籽粒发育等产量性状形成的新机制,并在此基础上开展原创分子设计育种,培育出了25个国审和省审新品种。如今,我国水稻、玉米等主要农作物株型和籽粒发育等方面研究的国际影响力显著提升,并实现了“部分领跑”。
清华大学生命科学学院副教授刘俊杰(中)指导学生进行实验操作(2024 年 1 月 15 日摄) 清华大学供图
开发自己的“基因剪刀”
不同于分子设计育种注重通过优化基因组合来培育新品种,基因编辑则是从基因“源头”出发,侧重于直接对目标基因进行编辑,高效率实现个性化和定向性状改良。长期以来,基因编辑技术的核心专利被少数国家掌控,为打破垄断,我国也较早布局了基因编辑技术研究,大量企业和科研单位纷纷加入这一赛道,相关成果实现了与国际先进水平“并跑”。
“农业领域的基因编辑技术,我国相关研究成果不断打破垄断,与国际先进水平处于并驾齐驱的状态。”中国农业科学院作物科学研究所副研究员和玉兵介绍。和玉兵的观点得到了多位受访专家的认同,随着我国实验室育种技术迅速发展,技术更新换代速度加快,与国外先进基因编辑技术水平相比已不分伯仲。
例如,“基因剪刀”CRISPR-Cas9是国外研究团队掌握的重要基因编辑工具。它是一种能够精准剪切生物体DNA的基因编辑核酸酶Cas蛋白,研究人员利用“基因剪刀”可以对种子基因进行修改、删除、替换或插入等操作,能够去除或减弱不利于农艺性状的基因,同时还可以增强对农作物有益的基因,它能够大幅缩短改良作物品种所需的时间,在农作物育种领域具有广阔的应用前景。
近年来,我国众多高校院所和企业科研人员奋起直追投入“基因剪刀”研发工作。2021年中国农业大学农学院作物基因组与生物信息学系教授赖锦盛等科研人员成功研发出基因编辑新型底盘核酸酶Cas12i和Cas12j两把“基因剪刀”,填补了中国在基因编辑底盘工具领域的技术空白,打破了国外技术垄断。目前,Cas12i和Cas12j已获得中国内地、中国香港地区专利授权及日本专利授权。
为满足基因编辑多样性和个性化需求,国内科研人员正在开发新型非CRISPR基因编辑工具。例如,中国科学院遗传与发育生物学研究所研究员高彩霞团队开发了突破CRISPR限制的模块化结构的碱基编辑新系统——CyDENT,该系统是不依赖CRISPR的全新碱基编辑工具,对农作物精准分子育种具有重要潜在应用价值;2024年2月,清华大学生命学院刘俊杰课题组在《科学》(Science)报道了一种催化性RNA(核酶)—HYER(水解型内切核酶),有望成为继CRISPR之后新一代的基因编辑底盘工具。
总体上看,我国基因编辑生物育种技术的基础研究水平处于世界前列,但应认识到我国基因编辑的产业化尚处于起步阶段。当前全球已有680多种基因编辑产品,包括耐除草剂水稻、无融合生殖水稻、抗白粉病小麦、糯性玉米、抗旱玉米、高油酸大豆等,我国尚未进行基因编辑品种商业化种植。
为打破基因编辑技术“研究领先、管理滞后、应用空白”的局面,2022年,农业农村部发布了《农业用基因编辑植物安全评价指南(试行)》,对农业基因编辑植物的安全评价管理进行了规范。为增强该指南的可操作性,2023年农业农村部公布了《农业用基因编辑植物评审细则(试行)》,进一步明确基因编辑植物的分类标准和评审内容,指导基因编辑植物的安全管理工作。
基因编辑产业发展之路已经鸣响发令枪,以山东舜丰生物科技有限公司为代表的产业界形成了“基因剪刀”家族。2022年,舜丰生物首次开放基因编辑核心技术授权通道,实现了我国基因编辑核心技术的出口。2023年农业农村部发布《2023年农业用基因编辑生物安全证书(生产应用)批准清单》,舜丰生物摘得全国首个植物基因编辑安全证书,标志着我国基因编辑正式驶入产业化快车道。
AI打败“开盲盒”
作为加入AI元素的育种4.0进阶版,智能精准设计育种正为种业创新带来无限想象空间。
连日来,中国农业科学院作物科学研究所研究员李慧慧带领团队在南繁科研育种基地内收集和分析1000份水稻材料生长的表型信息。这1000份水稻材料并非随机挑选种植的,而是智慧育种平台给出的最优答案。
李慧慧向记者介绍,如果用341份水稻亲本培育新品种,由于亲本的高产、抗病能力各不相同,两两结合后能够培育出5.6万份性状各异的后代,如果用这5.6万份水稻材料培育新品种,例如找出其中的高产、抗病等优异性状,需要把这5.6万份材料全都种在地里等生长出水稻后观测表型进行筛选,这一理论方法如果落地实施,要耗费巨大人力物力,传统做法通常是随机挑选部分材料种植,但这样就降低了培育出理想型品种的几率。
李慧慧通过与达摩院(湖畔实验室)联合研发出智慧育种平台,将341份水稻亲本的全基因组测序数据输入平台后,通过AI算法预测亲本的功能筛选出了性状表现最好的前1000份材料,这1000份材料就成为培育新品种的最优亲本材料。此外,智慧育种平台还有挖掘基因的功能,如果再将这1000份材料进行田间种植,收集提取株高、叶绿素、穗数等表型数据,与基因测序数据对照,就能够找出优异表型的对应基因。
通过基因分析预测表型、通过AI模型挖掘优异基因,这就是智慧育种平台加速育种进程、为育种带来无限想象空间的AI智慧育种。该智慧育种平台引入多种大数据计算、AI模型、自动化处理模块。
达摩院智慧育种科学家顾斐介绍,基因组是由ATCG四种碱基组成的螺旋结构,一粒水稻种子全基因组长度超过4亿个碱基。如果要找出导致两粒水稻呈现不同表型的基因变异位点,就要将这两粒水稻的全基因组进行对比,计算每个位置的碱基是否相同,如果相同就要剔除,计算量巨大。而智慧育种平台将变异位点计算速度提高了110倍。
智慧育种平台还通过全基因组数据、全基因组选择算法训练了预测作物表型的AI模型。传统预测模型是统计学家用统计的算法构建的统计模型,用统计模型预测作物表型,预测稳定性和精准性都不高。利用深度学习的代表算法之一——卷积神经网络,将基因数据与表型适配后输入进行训练,可以得出模型,利用该模型只需要输入一粒种子的基因数据就能够得到更准确的表型预测结果。相比统计模型,AI模型预测作物表型的准确率平均提升15%以上,预测稳定性提升5%。
该智慧育种平台能够缩短世代间隔加快育种进程,预计未来3~5年内就能够培育出新品种。目前该平台已被全球23家科研机构用于育种研究,包括中国水稻研究所、中国科学院遗传与发育生物学研究所、国际畜牧研究所、荷兰瓦格宁根大学等。□