數(shù)千種基因型的產(chǎn)量關(guān)鍵性狀進(jìn)行快速田間測(cè)量的需求是作物育種的主要障礙,最近,葉片的高光譜反射數(shù)據(jù)已被用于訓(xùn)練機(jī)器學(xué)習(xí)模型,使用偏最小二乘回歸 (PLSR) 來快速預(yù)測(cè)小麥和其他物種的光合和葉子性狀的遺傳變異,然而,已發(fā)布的 PLSR 光譜模型的應(yīng)用受到輸入的固定光譜波段的限制,并且需要為每個(gè)特征和波段單獨(dú)定制模型,此外,短波紅外區(qū)域的反射光譜的使用需要昂貴的多探測(cè)器光譜儀。訓(xùn)練一個(gè)能夠適應(yīng)來自不同光譜波段的模型,可能會(huì)將這種模型擴(kuò)展到更便宜的傳感器。在這里,作者比較了使用各種深度學(xué)習(xí)方法和集成模型的PLSR的預(yù)測(cè)準(zhǔn)確性,每個(gè)模型都使用先前發(fā)布的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試。
整個(gè)數(shù)據(jù)集的平均值、標(biāo)準(zhǔn)偏差、最小和最大反射率測(cè)量值,用于構(gòu)建以圖形表示的模型。
作者證明了PLSR預(yù)測(cè)的小麥葉片光合作用相關(guān)性狀的準(zhǔn)確性可以通過基于深度學(xué)習(xí)的模型和集成模型來提高,而不會(huì)過度擬合。此外,這些模型可以在不顯著影響準(zhǔn)確性的情況下靈活地應(yīng)用于整個(gè)光譜范圍。
這里使用的一維擴(kuò)張CNN模型參數(shù),即濾波器大小為5,第一層的擴(kuò)張因子為1,第二層的擴(kuò)張因子為2。圖中顯示了單個(gè)輸出神經(jīng)元(紅色圓圈)的擴(kuò)展感受野(所有綠色圓圈)。 所以,這個(gè)例子中的每個(gè)輸出神經(jīng)元都依賴于13個(gè)輸入元素
提供了一個(gè)改進(jìn)的方法,可以從葉片高光譜反射率預(yù)測(cè)小麥葉片和光合性狀,而且不需要全波段和高成本的葉片光譜儀。作者提供了一個(gè)網(wǎng)絡(luò)服務(wù)用于部署這些算法,從各種光譜數(shù)據(jù)集預(yù)測(cè)小麥的生理性狀,對(duì)小麥產(chǎn)量預(yù)測(cè)和作物育種具有重要意義。
來源:Plant Methods.Wheat physiology predictor: predicting physiological traits in wheat from hyperspectral reflectance measurements using deep learning.Robert T. Furbank, Viridiana Silva-Perez, John R. Evans, Anthony G. Condon, Gonzalo M. Estavillo, Wennan He, Saul Newman, Richard Poiré, Ashley Hall & Zhen He
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-021-00806-6