世界食品網

中國農業科學院作科所提出基于深度學習的全基因組選擇新方法

   2022-11-28 中國農業科學院作物科學研究所李慧慧436
核心提示:近日,中國農業科學院作物科學研究所/三亞南繁研究院大數據智能設計育種創新團隊聯合多家單位提出利用植物海量多組學數據進行全基因組預測的深度學習方法(Deep Neural Network for Genomic Prediction, 簡稱DNNGP),可以實現育種大數據的高效整合與利用,將助力深度學習在全基因組選擇中的應用,為智能設計育種及平臺構建提供有效工具。……(世界食品網-www.cctv1204.com)
近日,中國農業科學院作物科學研究所/三亞南繁研究院大數據智能設計育種創新團隊聯合多家單位提出利用植物海量多組學數據進行全基因組預測的深度學習方法(Deep Neural Network for Genomic Prediction, 簡稱DNNGP),可以實現育種大數據的高效整合與利用,將助力深度學習在全基因組選擇中的應用,為智能設計育種及平臺構建提供有效工具。相關研究成果在《分子植物(Molecular Plant)》上在線發表。
 
  全基因組選擇作為新一代育種技術,通過構建預測模型,根據基因組估計育種值進行早期個體的預測和選擇,從而縮短育種世代間隔,加快育種進程,節約成本,推動現代育種向精準化和高效化方向發展。統計模型作為全基因組選擇的核心,極大地影響了全基因組預測的準確度和效率。傳統預測方法基于線性回歸模型,難以捕捉基因型和表型間的復雜關系。相較于傳統模型,非線性模型(如深度網絡神經)具備分析復雜非加性效應的能力,人工智能和深度學習算法為解決大數據分析和高性能并行運算等難題提供了新的契機,深度學習算法的優化將會提高全基因組選擇的預測能力。
 
  研究團隊以玉米、小麥和番茄四種不同維度的群體數據為測試材料,通過創新深度學習算法框架開發了全基因組選擇新方法DNNGP。與其他五種主流預測方法(即:基于線性模型的GBLUP;基于機器學習的LightGBM和SVR;基于深度學習的DeepGS和DLGWAS)相比,DNNGP有以下優點:可以利用多組學數據開展全基因組預測;算法設計中包含批歸一化層、回調函數和校正線性激活函數等結構,可以有效降低模型錯誤率,提高運行速度;預測精度穩健,在小型數據集上的表現與目前主流預測模型相當,在大規模數據集上預測優勢更加明顯;計算時間與傳統方法相近,比已有深度學習方法提速近10倍;超參數調整對用戶更加友好。DNNGP針對具有復雜結構的海量數據進行高效數學建模,實現了育種大數據的高效整合與利用,將助力深度學習在全基因組選擇中的應用,為智能設計育種及平臺構建提供有效工具。
 
  作科所已畢業碩士研究生王軻麟為本文第一作者,團隊首席李慧慧研究員為通訊作者。研究得到了國家重點研發計劃、國家自然科學基金、海南崖州灣種子實驗室和中國農業科學院科技創新工程等項目資助。
 
  論文鏈接:
 
  https://doi.org/10.1016/j.molp.2022.11.004



日期:2022-11-28
 
地區: 海南 三亞市
標簽: 基因
反對 0舉報 0 收藏 0 打賞 0評論 0
 
更多>同類資訊
 
鹽池灘羊