国产在线无码视频一区_免费看片A级毛片免费看_国产午夜福利精品一区二区三区_99久久人妻精品免费一区

您好, 歡迎來到化工儀器網

| 注冊| 產品展廳| 收藏該商鋪

13810146393

technology

首頁   >>   技術文章   >>   基于集成學習方法的煙草葉片氮含量無人機高光譜估測

江蘇雙利合譜科技有限公司

立即詢價

您提交后,專屬客服將第一時間為您服務

基于集成學習方法的煙草葉片氮含量無人機高光譜估測

閱讀:648      發布時間:2023-8-10
分享:

題目

基于集成學習方法的煙草葉片氮含量無人機高光譜估測

 

應用關鍵詞

高光譜遙感葉片含氮量、集成學習、煙草

 

背景

煙草生產是中國西南地區農業和農村經濟發展的關鍵支柱。為了給煙葉質量優化提供信息支持,減輕煙農的勞動負擔,對快速、準確、實時的葉片氮含量(Leaf nitrogen content, LNC檢測方法有很大需求。無人機機載高光譜遙感Hyperspectral remote sensing, HRS能夠以非破壞性的方式獲取成像光譜數據,實現煙葉LNC的快速獲取。

一般來說,可以使用經驗方法或物理方法建立模型,或者兩者相結合,以實現目標性狀的反演。為了解決單個反演方法的異質性,一些學者提出了作物表型性狀估計的集成學習框架。與試圖從訓練數據中學習一個假設的普通機器學習方法不同,集成方法試圖構建一組假設并將它們組合起來使用。集成學習的思想是結合幾種不同的方法來增強輸入的多樣性,以挖掘更多的數據特征,從而提高模型的整體性能。

本研究旨在建立一種準確有效的模型,利用無人機機載高光譜圖像估計煙草LNC研究中測試了幾種基于三種集成學習策略的典型算法,包括隨機森林(RF回歸、自適應增強Adaboost回歸和堆疊回歸。此外,我們選擇了常用的偏最小二乘回歸(PLSR作為基準模型。主要創新點有:(1研究了無人機機載HRS在煙草LNC估算中的潛力;(2評估不同集成學習策略baggingboostingstacking下模型的性能;(3探索基于堆疊策略提高模型預測精度的可行方法

 

試驗設計

江蘇大學趙春江教授團隊利用Gaiasky-Mini2-VN高光譜相機(江蘇雙利合譜公司)獲取了研究區內不同氮處理下煙草冠層的高光譜影像,其波段范圍為400 ~ 1000 nm,波段數為256。各類地物的光譜曲線如圖1所示。在整個田間試驗過程中,每約20天采集一次冠層圖像,從移栽后35天開始,一直持續到收獲。

影像獲取后,第一步,利用ExG去除背景,并提取平均反射率。第二步,利用連續投影算法(SPA)進行數據降維。第三步,建立LNC估計模型,研究中選擇了常用的PLSR作為基準模型(圖1)。此外,采用集成學習方法來完成上述相同的回歸任務。集成學習框架下有三種建模策略,即baggingboostingstacking本研究以決定系數(R2、均方根誤差RMSE和平均絕對百分比誤差MAPE作為評價指標。

1 本研究主要步驟流程圖

 

結論

本研究對全波段高光譜反射率數據進行主成分分析(PCA),提取對LNC變化更敏感的主成分(PC如圖2所示,選取前80PC進行顯示,當主成分數為467時,累積方差貢獻率(AVCR分別超過99.5%99.8%99.9%我們選擇SPA作為二次降維算法。PCA不同,SPA可以通過選擇LNC變化更敏感的變量來降低數據維度,最終保留了15個波段(圖3)。

2 7PC貢獻了超過99.9%的信息

3 選擇的15個波段

從圖4可以看出,PLSRR2相對較低,但訓練集與測試集之間的差距較小。由于PLSR結合了PCAMLR。在這里,我們也給出了MLR的預測結果,訓練集和測試集之間的差距也很小(圖4c4d)。結果表明,訓練良好的MLR模型具有良好的穩定性,樣本分布均勻同時也證明了我們的數據集劃分是合理的。

4g – 4p顯示了集成學習方法的結果,包括RFAdaboost和堆疊模型。RFAdaboost都是基于決策樹回歸(DTR),為了避免過擬合,我們將??????_????????的值設置為5DTR的預測結果如圖4e和圖4f所示。對于堆疊模型,我們采用雙層結構,MLRDTR模型stacking – 1作為第一層的基估計器,MLR作為第二層的元估計器。結果表明,stacking - 3模型預測效果好。與DTR模型在測試集上的預測結果相比,stacking - 1模型得到了顯著增強,但相較于SPA-MLR改進幅度較小。結果表明,疊加策略可以傳遞基估計器的優點。通過組合多個模型來挖掘更有價值的數據特征。在圖4m - 4p中也可以看到類似的現象。通過將已經訓練好的模型添加到堆疊框架的第一層,可以發現在最終表現上也有逐漸的改善。當添加RF模型時stacking – 2),測試集上的R2不僅從0.710提高到0.743,而且超過了RF本身的R2RMSE值也有小幅下降。當Adaboost模型被添加時stacking – 3),與stacking – 2相比,準確度只有輕微的提高

綜上所述,stacking - 3模型的R2RMSE最高0.745, 4.824 mg/g),Adaboost模型的MAPE最小17.56%)。原因可能是堆疊方法可以從不同的模型中提取更多可用的數據特征。由于數據噪聲的存在,模型在數據特征上往往表現不同。堆疊法可以提取各模型中表現較好的特征,丟棄較差的特征,有效地優化預測結果,提高最終的預測精度。Adaboost模型可以根據每個基估計器的預測誤差調整其權重。錯誤率小的基估計器在最終結果中占有較大的權重。因此,Adaboost模型得到最小的MAPE。對于RF,基估計量相互獨立,最終結果是所有基估計量的簡單平均值,因此RF模型更容易受到異常值的干擾。

4 訓練集和測試集下不同模型性能比較

進一步分析每個基估計器對最終結果的貢獻。我們首先選擇已經訓練好的RFAdaboost模型作為基估計器(圖5ab)。stacking - 4的綜合性能優于RF。將DTRMLR分別加入到stacking - 4模型中,得到stacking - 5stacking - 6模型。結果如圖5cf所示。stacking - 5stacking - 6模型之間存在非常小的差異。同時,stacking - 4模型R2 = 0.876stacking - 6模型R2 = 0.779在訓練集上存在顯著差異

從某種意義上說,DTRRFAdaboost模型基于樹的模型是同質的,因為DTR本身是RFbagging & DTR|Adaboostboosting & DTR模型的基估計器。因此,添加DTR不能使模型挖掘更多可用的數據特征。這可能就是stacking - 5模型的性能變化不大的原因。對于線性模型MLR,它與基于樹的模型原理是不同的,可以學習到一些新特征。雖然在測試集上的表現略有下降,但在訓練集上取得了進步。模型的整體穩定性得到了提高。綜上所述,RFAdaboost幾乎貢獻了所有的堆疊精度,然后MLR有助于提高模型的穩定性

最后,對如何正確配置堆疊模型提出了一些建議。理想情況下,堆疊策略的第一層中的基估計器應該是“準確和異構的”。通過這種方式,可以學習更多有價值的數據特征。此外,為了避免過擬合,第二層的元估計器通常選擇一個簡單的模型(線性或回歸,該模型使用第一層的輸出作為訓練的輸入。

 

5 進一步分析堆疊策略

 

作者信息

趙春江,博士,江蘇大學農業工程學院教授,博士生導師。

主要研究方向:農業智能系統與精準農業技術裝備

參考文獻:

Zhang, M.Z., Chen, T.E., Gu, X.H., Kuai, Y., Wang, C., Chen, D., & Zhao, C.J. (2023). UAV-borne hyperspectral estimation of nitrogen content in tobacco leaves based on ensemble learning methods. Computers and Electronics in Agriculture, 211.

https://doi.org/10.1016/j.compag.2023.108008

會員登錄

請輸入賬號

請輸入密碼

=

請輸驗證碼

收藏該商鋪

標簽:
保存成功

(空格分隔,最多3個,單個標簽最多10個字符)

常用:

提示

您的留言已提交成功!我們將在第一時間回復您~
在線留言
主站蜘蛛池模板: 鹿邑县| 广元市| 凌云县| 日喀则市| 巴彦县| 荥阳市| 汉源县| 乐都县| 苍山县| 大荔县| 丰都县| 广宗县| 安阳市| 阳泉市| 五常市| 贡觉县| 鄂伦春自治旗| 北安市| 繁昌县| 靖江市| 库车县| 肇州县| 北海市| 神农架林区| 丰台区| 永州市| 鄢陵县| 汶上县| 罗甸县| 永德县| 运城市| 黎城县| 周口市| 新乡市| 成武县| 深水埗区| 大邑县| 江北区| 柳州市| 安顺市| 宁明县|