正在開發(fā)和采用光學(xué)傳感解決方案來對包括農(nóng)作物種子在內(nèi)的各種生物對象進(jìn)行分類。光學(xué)分類模型的性能評估仍然是一個重點(diǎn)和挑戰(zhàn)。作為訓(xùn)練數(shù)據(jù),作者從兩個番茄品種的 3646 顆番茄種子(發(fā)芽是/否)中獲取了高光譜成像數(shù)據(jù)。作者進(jìn)行了三個實(shí)驗(yàn)數(shù)據(jù)操作:(1)對象分配錯誤:訓(xùn)練數(shù)據(jù)中的單個對象被分配到錯誤的類的影響。(2) 光譜重復(fù)性:引入已知范圍(0-10%)的隨機(jī)噪聲對單個反射率值的影響。(3) 訓(xùn)練數(shù)據(jù)集的大?。簻p少訓(xùn)練數(shù)據(jù)中觀察值的影響。基于兩個函數(shù)[線性判別分析 (LDA) 和支持向量機(jī) (SVM)] 的分類器都可以表征和量化這些實(shí)驗(yàn)數(shù)據(jù)每一個操作的影響。
本研究中包括的番茄種子的圖像和平均反射率分布。來自兩個品種 A 和 B 的番茄種子照片,以及每個品種的五個子樣本 (a)。本研究中番茄種子品種1 (B)和2 (c)的五個子樣本的平均反射率分布。
兩種分類函數(shù)精度均隨著目標(biāo)分配誤差的引入和光譜可重復(fù)性的實(shí)驗(yàn)降低而線性下降。 作者還證明了將訓(xùn)練數(shù)據(jù)減少 20% 的實(shí)驗(yàn)對分類準(zhǔn)確性的影響可以忽略不計(jì)。LDA 和 SVM 分類算法被用于獨(dú)立驗(yàn)證種子樣本。 基于 LDA 的分類預(yù)測種子萌發(fā)的 RMSE?=?10.56(品種 1)和 26.15(品種 2),基于 SVM 的分類預(yù)測種子萌發(fā)的 RMSE?=?10.44(品種 1)和 12.58(品種 2)。
發(fā)芽和非發(fā)芽種子的平均反射率分布。品種 1 和 2 (a) 中未發(fā)芽和發(fā)芽的番茄種子的平均分布,以及品種 1 和 2 (b) 的發(fā)芽(發(fā)芽/未發(fā)芽)的相對影響
作者認(rèn)為,這項(xiàng)研究是第一次在光學(xué)種子分類中既包含基于實(shí)驗(yàn)數(shù)據(jù)操作的兩個單獨(dú)分類函數(shù)的全面性能評估,又將分類模型應(yīng)用于驗(yàn)證未包含在訓(xùn)練數(shù)據(jù)中的種子樣本。提出的實(shí)驗(yàn)數(shù)據(jù)操作在更廣泛的背景和一般相關(guān)性中進(jìn)行了討論,并建議將它們作為光學(xué)分類模型的深度性能評估的方法。
來源:Plant Methods.Experimental data manipulations to assess performance of hyperspectral classification models of crop seeds and other objectsChristian Nansen, Mohammad S. Imtiaz, Mohsen B. Mesgaran & Hyoseok Lee
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-022-00912-z