本網訊 近日,安徽農業大學農學院水稻分子育種創新團隊聯合華中農業大學、中國農業科學院作物科學研究所在國際權威期刊《Plant Biotechnology Journal》(中科院1區TOP,五年影響因子12.1)在線發表了題為“MFMGP: an integrated machine learning fusion model for genomic prediction”的研究論文(https://doi.org/10.1111/pbi.14532)。
2024年10月,農業農村部印發《關于大力發展智慧農業的指導意見》,進一步著重強調了開發智能設計育種工具,推進育種智能化進程的迫切性。基因組選擇(geomic selection,GS)作為分子育種的關鍵技術之一,其相關基礎研究是提高我國動植物設計育種水平的重大亟需。因此,開發一款具有普適性且預測精度高的GS工具對分子育種應用具有重要的理論與實踐意義。
本研究基于多種機器學習(ML)訓練方法,開發出一款融合模型“MFMGP”,能夠用于預測動植物育種群體的復雜農藝性狀表型。MFMGP利用指數衰減權重的歸一化融合方法,通過為每個ML模型的預測結果分配權重,并對這些權重應用指數衰減,再通過歸一化這些權重計算模型預測結果的加權平均值,從而獲得最終的融合預測結果。為了測試MFMGP的預測效果,將其與7種常用的GS模型進行比較(傳統模型GBLUP、4種機器學習LightGBM、SVR、XGBoost和HGBoost以及2種深度學習DNNGP和DeepCCR),結合植物中數據集(水稻、棉花、小麥與玉米)和動物測試數據集(豬),證明MFMGP具有更高的預測精度和更好的穩定性。同時發現,基因型-環境相互作用影響預測結果的準確度,高遺傳力農藝性狀往往具有較高的預測精度。特別在亞洲栽培稻中,無論是利用秈稻作為訓練群體預測粳稻亞群,或粳稻作為訓練群體預測秈稻亞群,其預測精度均較低,提示育種家應根據測試群體選擇合適的亞群構建訓練群體。綜上,MFMGP可以顯著提高預測精度,縮短育種周期,降低育種成本,有望在動植物育種中具有更廣泛的應用。
該研究聯合了國內多家科研單位,實現了動植物學科交叉攻關農業“卡脖子難題”。未來,成果有望吸引更多科研單位和育種公司進一步進行實踐和應用,打造智能快速育種技術體系,助力我國分子育種技術邁向智能化、高效化發展的新階段。
安徽農業大學農學院青年教師張超普、華中農業大學植物科學技術學院已畢業碩士梁齊齊、喻宇燁為本文的共同第一作者。安徽農業大學農學院黎珉副教授、華中農業大學金雙俠教授、安徽農業大學農學院黎志康講席教授為本文的共同通訊作者。該研究得到了國家自然科學基金、安徽省自然科學基金、中國農業科學院科技創新工程、南繁專項的共同資助。
日期:2025-02-05
2024年10月,農業農村部印發《關于大力發展智慧農業的指導意見》,進一步著重強調了開發智能設計育種工具,推進育種智能化進程的迫切性。基因組選擇(geomic selection,GS)作為分子育種的關鍵技術之一,其相關基礎研究是提高我國動植物設計育種水平的重大亟需。因此,開發一款具有普適性且預測精度高的GS工具對分子育種應用具有重要的理論與實踐意義。
本研究基于多種機器學習(ML)訓練方法,開發出一款融合模型“MFMGP”,能夠用于預測動植物育種群體的復雜農藝性狀表型。MFMGP利用指數衰減權重的歸一化融合方法,通過為每個ML模型的預測結果分配權重,并對這些權重應用指數衰減,再通過歸一化這些權重計算模型預測結果的加權平均值,從而獲得最終的融合預測結果。為了測試MFMGP的預測效果,將其與7種常用的GS模型進行比較(傳統模型GBLUP、4種機器學習LightGBM、SVR、XGBoost和HGBoost以及2種深度學習DNNGP和DeepCCR),結合植物中數據集(水稻、棉花、小麥與玉米)和動物測試數據集(豬),證明MFMGP具有更高的預測精度和更好的穩定性。同時發現,基因型-環境相互作用影響預測結果的準確度,高遺傳力農藝性狀往往具有較高的預測精度。特別在亞洲栽培稻中,無論是利用秈稻作為訓練群體預測粳稻亞群,或粳稻作為訓練群體預測秈稻亞群,其預測精度均較低,提示育種家應根據測試群體選擇合適的亞群構建訓練群體。綜上,MFMGP可以顯著提高預測精度,縮短育種周期,降低育種成本,有望在動植物育種中具有更廣泛的應用。
該研究聯合了國內多家科研單位,實現了動植物學科交叉攻關農業“卡脖子難題”。未來,成果有望吸引更多科研單位和育種公司進一步進行實踐和應用,打造智能快速育種技術體系,助力我國分子育種技術邁向智能化、高效化發展的新階段。
安徽農業大學農學院青年教師張超普、華中農業大學植物科學技術學院已畢業碩士梁齊齊、喻宇燁為本文的共同第一作者。安徽農業大學農學院黎珉副教授、華中農業大學金雙俠教授、安徽農業大學農學院黎志康講席教授為本文的共同通訊作者。該研究得到了國家自然科學基金、安徽省自然科學基金、中國農業科學院科技創新工程、南繁專項的共同資助。
日期:2025-02-05