將人工智能與農(nóng)業(yè)集合起來的自然保護
在本周在網(wǎng)上舉行的2020年國際學(xué)習(xí)代表大會(ICLR)主辦的研討會上,小組成員討論了AI和機器學(xué)習(xí)如何(而且已經(jīng))應(yīng)用于農(nóng)業(yè)挑戰(zhàn)。正如幾位專家指出的那樣,世界各國面臨糧食供應(yīng)短缺的問題,估計有9%的人口(6.97億)嚴(yán)重“糧食不安全”,這意味著他們無法可靠地獲得負(fù)擔(dān)得起的營養(yǎng)食品。
勞動力短缺,有害生物和病原體的傳播以及氣候變化等因素有可能使危機升級,但是人工智能可以提供幫助。IBM科學(xué)家通過農(nóng)業(yè)“數(shù)字孿生”或用于預(yù)測特定農(nóng)作物產(chǎn)量的農(nóng)作物數(shù)字模型談到了他們在非洲的工作。阿卡迪亞大學(xué)的研究人員提出了一種算法,該算法旨在比人類工人更準(zhǔn)確地測量葡萄產(chǎn)量。加州大學(xué)戴維斯分校的一個小組詳細(xì)介紹了使用衛(wèi)星圖像預(yù)測肯尼亞牲畜覓食條件的工作。
軟件質(zhì)量保證負(fù)責(zé)人Akram Mohammed詳細(xì)介紹了IBM去年對尼日利亞農(nóng)場進行數(shù)字“克隆”的工作,這需要收集多光譜圖像和元數(shù)據(jù)(如傳感器讀數(shù),天氣和土壤條件)的歷史記錄,以在IBM的云平臺上構(gòu)建農(nóng)場的模擬。部分工作是IBM與Hello Tractor之間的合作關(guān)系的產(chǎn)物,Hello Tractor是一項訂閱服務(wù),該服務(wù)將小規(guī)模農(nóng)民與設(shè)備和數(shù)據(jù)分析聯(lián)系起來,以提高作物產(chǎn)量。
穆罕默德(Mohammed)斷言,數(shù)字化作物增值不僅對農(nóng)民本身有價值,而且對可以利用它們來跟蹤市場動態(tài),規(guī)劃和制定政策并最大程度降低其投資風(fēng)險的分銷商,政府和銀行也具有價值。他指出,預(yù)計五年內(nèi)世界人口將超過80億,但到本世紀(jì)末,可耕地將減少20%。
Mohammed和他的團隊利用了IBM的PAIRS Geoscope服務(wù),該服務(wù)旨在托管和管理PB級的地理時空數(shù)據(jù),例如地圖和無人機圖像,以存儲有關(guān)每個農(nóng)場的衛(wèi)星,天氣和地面?zhèn)鞲衅鲾?shù)據(jù)。IBM的另一項服務(wù)-Watson農(nóng)業(yè)決策平臺,將IBM擁有的The Weather Company的算法與物聯(lián)網(wǎng)數(shù)據(jù)攝取工具相結(jié)合-使工程師在輸入了多個深度的水分讀數(shù),土壤養(yǎng)分含量和肥力后,可以獲得產(chǎn)量預(yù)測,農(nóng)場操作和工作流程信息以及高清可視衛(wèi)星圖像。
挑戰(zhàn)之一是規(guī)模較小的農(nóng)場數(shù)據(jù)相對匱乏。衛(wèi)星圖像僅提供像素值的信息,并非所有農(nóng)場都能買得起監(jiān)視設(shè)備。團隊的解決方案是將目標(biāo)區(qū)域中超過40,000個集群的農(nóng)場組建模。這使工程師能夠訓(xùn)練一個推薦系統(tǒng)來回答兩個關(guān)鍵問題:(1)農(nóng)民何時應(yīng)進行特定的種植活動;(2)什么是最佳耕作日,從而使小規(guī)模農(nóng)民的農(nóng)作物產(chǎn)量最大化?
該系統(tǒng)包括一個集成的學(xué)習(xí)模型,該模型會建議栽培日期,利用歷史狀態(tài)(來自數(shù)字“雙胞胎”)和將來的元數(shù)據(jù)預(yù)測,例如最近的天氣歷史(濕度,能見度,溫度,降水和風(fēng)速),天氣預(yù)報(在四個不同深度的土壤濕度),多光譜衛(wèi)星圖像和地面真實事件信息(位置和日期)。在實驗中,缺少元數(shù)據(jù)(如農(nóng)作物類型和土壤條件)阻礙了模型的預(yù)測。但是研究人員聲稱,他們的解決方案在很大程度上優(yōu)于基于啟發(fā)式的系統(tǒng)。
阿卡迪亞大學(xué)數(shù)據(jù)分析研究所的研究人員Daniel L. Silver和Jabun Nasa介紹了他們開發(fā)的計算機視覺系統(tǒng)的工作,該系統(tǒng)可以根據(jù)葡萄圖像測量葡萄產(chǎn)量。準(zhǔn)確的葡萄產(chǎn)量估算對于計劃收成和做出葡萄酒生產(chǎn)選擇至關(guān)重要,但是正如Silver和Nasa指出的那樣,進行測量在歷史上是一個昂貴的過程-更不用說一個不精確的過程了(準(zhǔn)確度為75%至90%)。
為了為他們的估計產(chǎn)量的機器學(xué)習(xí)模型建立訓(xùn)練集,研究人員招募了志愿者,并要求他們給葡萄拍攝葡萄在葡萄樹上的照片,并使用數(shù)字秤測量葡萄的重量。收集后,Silver和Nasa將測量數(shù)據(jù)數(shù)字化,并對照片進行裁剪,歸一化和調(diào)整大小,然后再將兩個數(shù)據(jù)集組合在一起,并將它們輸入到卷積神經(jīng)網(wǎng)絡(luò)(一種非常適合于分析視覺圖像的AI模型)中。
他們報告說,他們表現(xiàn)最好的模型在收獲前六天的平均產(chǎn)量預(yù)測上平均準(zhǔn)確率為85.15%,在預(yù)測收獲前16天的平均產(chǎn)量上準(zhǔn)確率為82%。在未來的工作中,他們計劃通過合并自動圖像裁剪器和長期天氣預(yù)報數(shù)據(jù)來完善它。來自加州大學(xué)戴維斯分校和AI咨詢公司W(wǎng)eights and Biases的研究人員就預(yù)測肯尼亞牲畜飼草狀況的努力發(fā)表了講話。他們的工作是由肯尼亞北部牧民的奮斗推動的,他們依靠牲畜獲得食物和收入,但往往無法預(yù)見干旱。
理想的預(yù)測模型將通過分析公共數(shù)據(jù)來防止牲畜損失和饑餓。當(dāng)干旱來襲時,可以將其鏈接到一個平臺,該平臺可以迅速將資源轉(zhuǎn)移給牧民,使他們能夠負(fù)擔(dān)家庭支出或牲畜需求。研究人員通過編譯一個訓(xùn)練語料庫來實現(xiàn)這一想法,該訓(xùn)練語料庫由帶有人類標(biāo)簽的地面圖像組成,這些數(shù)據(jù)點帶有時間戳,草料質(zhì)量(0-3尺度,零表示嚴(yán)重干旱),動植物類型和距離澆水。他們將其與在相同地點和相同時間拍攝的100,000幅衛(wèi)星圖像相關(guān)聯(lián),目的是僅使用上述衛(wèi)星圖像來預(yù)測質(zhì)量。
該小組將數(shù)據(jù)集發(fā)布在了Weights and Biases的基準(zhǔn)測試網(wǎng)站上,該網(wǎng)站允許貢獻(xiàn)者將經(jīng)過訓(xùn)練的模型提交給公共排行榜。在撰寫本文時,性能最佳的算法可以以77.8%的精度預(yù)測干旱,次之的模型可以達(dá)到77.5%的精度。展望未來,研究人員希望將工作范圍擴大到其他地區(qū),部分方法是收集地面和牧草數(shù)據(jù),以及諸如玉米,木薯,水稻等主要農(nóng)作物的地理位置。