注釋數(shù)據(jù)集的產(chǎn)生和可用性對于自動化表型分析方法的訓練和評估是必不可少的。由于基于3D視覺的表型分析技術的進步以及難以完全注釋復雜的3D植物結(jié)構,對具有器官級標記的真實植物的完整3D模型的需求更加明顯。
本文介紹了用X射線斷層成像技術獲得的11個帶注釋的真實薔薇屬植物3D模型的ROSE-X數(shù)據(jù)集。手動執(zhí)行注釋,以便以器官標簽的形式為與植物莖相對應的體素提供地面真實數(shù)據(jù)。此數(shù)據(jù)集既可作為執(zhí)行器官級分割的監(jiān)督學習方法的訓練數(shù)據(jù),也可作為評估其性能的基準。數(shù)據(jù)集中的rosebush模型具有高質(zhì)量和復雜的結(jié)構,器官之間經(jīng)?;ハ嘀丿B交叉對現(xiàn)有的植物器官分割方法提出了挑戰(zhàn)。作者報告了使用四種基線方法獲得的葉/莖分割結(jié)果。通過使用隨機森林分類器訓練局部特征的體積方法可獲得最佳性能,葉子和莖類的聯(lián)合相交(IoU)值分別為97.93%和86.23%。
數(shù)據(jù)集中的rosebush模型示例。對原始的X射線體積進行閾值處理和掩碼處理,得到如圖a所示的實體部分。體積中的每個體素被注釋為葉、莖、花、盆或標簽,以獲得如b所示的地面真實分割。c中,只顯示了植物地上部分,不包括花盆和標簽。d中顯示了只與莖類對應的體素。
通過基線方法預測的玫瑰花灌木樣本的葉和莖標簽。
通過基線方法預測的玫瑰花灌木樣本的莖標簽。
紅色橢圓突出顯示的基線方法的錯誤預測示例。
作者提供了11種薔薇屬植物的帶注釋3D數(shù)據(jù)集,用于器官分割方法的訓練和評估。還報告了基線方法的葉/莖分割結(jié)果,這些結(jié)果有待改進。該數(shù)據(jù)集與基線結(jié)果一起,有可能成為未來植物自動表型研究的重要資源。
來源:Plant Methods.ROSE-X: an annotated data set for evaluation of 3D plant organ segmentation methods.Helin Dutagaci, Pejman Rasti, Gilles Galopin & David Rousseau.https://plantmethods.biomedcentral.com/articles/10.1186/s13007-020-00573-w