生態(tài)農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)應用
時間:2022-04-01 10:01:02
導語:生態(tài)農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)應用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1數(shù)據(jù)挖掘的定義和方法
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取出隱含在其中的、新穎的、未知的、但又有潛在有用的高質(zhì)量的信息。數(shù)據(jù)挖掘是面向應用的。它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且要對這些數(shù)據(jù)進行微觀和宏觀的統(tǒng)計、分析、綜合和推理,發(fā)現(xiàn)事件間的相互關(guān)聯(lián)關(guān)系,利用已有的數(shù)據(jù)對未來的活動進行預測[4]。數(shù)據(jù)挖掘常用的技術(shù)有:統(tǒng)計分析技術(shù),包括線性分析和非線性分析、回歸分析、邏輯回歸分析、單變量分析、多變量分析、時間序列分析、最近鄰算法和聚類分析等技術(shù)[5];知識發(fā)現(xiàn)類技術(shù),包括人工神經(jīng)網(wǎng)絡、決策樹、遺傳算法、粗糙集、規(guī)則發(fā)現(xiàn)和關(guān)聯(lián)順序等。應用這些技術(shù)可完成對數(shù)據(jù)特征化區(qū)分,關(guān)聯(lián)分析,分類和預測,聚類分析、演變分析等挖掘功能。在實際應用中,應結(jié)合具體應用領(lǐng)域?qū)⒍喾N技術(shù)相結(jié)合,以期獲得最佳的挖掘質(zhì)量和效果。
2數(shù)據(jù)挖掘?qū)嵤┻^程
數(shù)據(jù)挖掘?qū)嵤┻^程分為以下4個步驟[6]。
2.1數(shù)據(jù)定義和數(shù)據(jù)清洗
創(chuàng)建元數(shù)據(jù),定義相關(guān)領(lǐng)域,填寫空缺值、平滑數(shù)據(jù)噪聲、識別刪除孤立點以及處理不一致數(shù)據(jù)。
2.2數(shù)據(jù)聚集和數(shù)據(jù)挖掘模型開發(fā)
集成多個數(shù)據(jù)庫、立方體和文件的數(shù)據(jù)。對數(shù)據(jù)進行概化(用高層次的概念代替低層次的原始數(shù)據(jù))、規(guī)范化(將屬性數(shù)據(jù)按一定的比例縮放到特定區(qū)間)、屬性構(gòu)造、數(shù)據(jù)歸約(刪除弱相關(guān)的屬性、數(shù)據(jù)濃縮)。選擇知識發(fā)現(xiàn)的方法,確定模型。
2.3數(shù)據(jù)挖掘
運用確定的數(shù)據(jù)挖掘模型,從數(shù)據(jù)中提取出用戶需要的知識,用某種特定的方式表示或使用常用的表示方式,以滿足用戶的需求,使數(shù)據(jù)挖掘工作效用最大化。
2.4知識評估
知識評估包括解釋、推演及模型調(diào)整??蓪l(fā)現(xiàn)的知識以用戶需求的方式進行表現(xiàn),根據(jù)用戶需求對過程中的某些處理階段進行優(yōu)化,直至最大限度地滿足用戶的需求。
“生態(tài)農(nóng)業(yè)”(EcologicalAgriculture)一詞最初是由美國土壤學家W.Albreche于1970年提出的。1981年英國農(nóng)學家MWorhtington將生態(tài)農(nóng)業(yè)明確定義為“生態(tài)上能自我維持、低投入,經(jīng)濟上有活力,在環(huán)境、倫理和審美方面可接受的小型農(nóng)業(yè)”[7]。中國生態(tài)農(nóng)業(yè)(ChineseEcologicalAgriculture)具有深厚、古老的農(nóng)業(yè)傳統(tǒng)背景和基礎(chǔ),有其本身一定的發(fā)生發(fā)展過程,具有獨特的個性,即不否定化肥、農(nóng)藥、激素等的適當投入,追求技術(shù)和能量的高效,并具有勞力密集和技術(shù)密集相結(jié)合的特征。中國生態(tài)農(nóng)業(yè)是在傳統(tǒng)農(nóng)業(yè)的基礎(chǔ)上發(fā)展起來的,精耕細作、培肥地力、間套輪作、林糧間作、基塘種養(yǎng)、農(nóng)牧結(jié)合等傳統(tǒng)農(nóng)業(yè)精華與現(xiàn)代化技術(shù)相結(jié)合,逐步發(fā)展成為具有中國特色的農(nóng)業(yè)綜合生產(chǎn)體系[8]。我國生態(tài)農(nóng)業(yè)是綜合運用了人與自然的關(guān)系原理,以生態(tài)學、生態(tài)經(jīng)濟學、生物學、社會學等理論為基礎(chǔ),采用系統(tǒng)工程方法和先進科學技術(shù)成就,以研究生態(tài)經(jīng)濟協(xié)調(diào)發(fā)展,合理利用自然資源、保護生態(tài)環(huán)境為主題,以實現(xiàn)農(nóng)業(yè)和農(nóng)村經(jīng)濟持續(xù)協(xié)調(diào)發(fā)展為目的,強調(diào)生態(tài)效益,兼顧經(jīng)濟效益和社會效益的新型農(nóng)業(yè)發(fā)展模式[9]?,F(xiàn)代高新技術(shù)會更加廣泛地滲透于生態(tài)農(nóng)業(yè)中由于生態(tài)農(nóng)業(yè)所追求的目標是高效益和無污染,而要實現(xiàn)這個目標就必須更多地依靠現(xiàn)代高新技術(shù)[10]。
4數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)上的應用
農(nóng)業(yè)是一巨型復雜系統(tǒng)。我國土地遼闊,土壤類型眾多,作物品種復雜,病蟲害發(fā)生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關(guān)系和影響,許多還未被人們?nèi)フJ識,然而所積累的數(shù)據(jù)之多是任何一個領(lǐng)域所沒有的,它具有大量、多維、動態(tài)、不完整、不確定等特性。由于農(nóng)業(yè)自身的一些特點,如:土壤類型眾多,作物品種復雜,病蟲害發(fā)生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關(guān)系和影響,就使得關(guān)于它們的數(shù)據(jù)庫與知識庫具有大型、多維、動態(tài)、不完全(缺值)、不確定(數(shù)據(jù)中的系統(tǒng)或隨機噪聲)、稀疏性(很少甚至沒有有用的記錄)等特征[11]。因此,數(shù)據(jù)挖掘工具應能處理農(nóng)業(yè)數(shù)據(jù)的這些特征。另外,農(nóng)業(yè)數(shù)據(jù)還有另外一個特征,它的測量與時間有關(guān),在數(shù)據(jù)分析過程中要求考慮時間因素,以便進行預測。目前及今后數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)中的應用主要集中在以下幾個方面。
4.1生態(tài)農(nóng)業(yè)類型研究的應用
通過長期生態(tài)定點觀測站,包括農(nóng)田生態(tài)系統(tǒng)、草地與荒漠生態(tài)系統(tǒng)、森林生態(tài)系統(tǒng)以及湖泊濕地海灣生態(tài)系統(tǒng)各野外觀測站的長期監(jiān)測數(shù)據(jù)(包括生物、土壤、水分和氣象四個部分)信息、觀測樣地信息與水分、土壤、大氣和生物監(jiān)測信息以及相關(guān)研究成果的數(shù)據(jù)。構(gòu)建相關(guān)數(shù)據(jù)庫,利用數(shù)據(jù)倉庫技術(shù)和數(shù)據(jù)挖掘技術(shù)對大量積累的數(shù)據(jù)進行挖掘,運用序列分析、聚類分析和關(guān)聯(lián)分析對生態(tài)農(nóng)業(yè)類型相關(guān)因子進行綜合分析,開展不同生態(tài)農(nóng)業(yè)類型結(jié)構(gòu)與功能的研究。
4.2生態(tài)農(nóng)業(yè)分類體系研究的應用
生態(tài)農(nóng)業(yè)的分類體現(xiàn)出區(qū)域特點,生態(tài)農(nóng)業(yè)建設(shè)區(qū)域類型是結(jié)合本地自然條件建設(shè)的具有地區(qū)特色、符合生態(tài)規(guī)律和經(jīng)濟規(guī)律的區(qū)域生態(tài)經(jīng)濟系統(tǒng)。具體可分為以下九類:水田生態(tài)農(nóng)業(yè)、旱地生態(tài)農(nóng)業(yè)、山地生態(tài)農(nóng)業(yè)、水域生態(tài)農(nóng)業(yè)、低地生態(tài)農(nóng)業(yè)、草地生態(tài)農(nóng)業(yè)、園地生態(tài)農(nóng)業(yè)、庭院生態(tài)農(nóng)業(yè)、村鎮(zhèn)生態(tài)農(nóng)業(yè)。在每一生態(tài)農(nóng)業(yè)建設(shè)區(qū)域類型中、根據(jù)生態(tài)農(nóng)業(yè)系統(tǒng)的結(jié)構(gòu)和功能分為4個生態(tài)農(nóng)業(yè)系統(tǒng)結(jié)構(gòu)類型、即平面結(jié)構(gòu)型、立體結(jié)構(gòu)型、時序結(jié)構(gòu)型、鏈式結(jié)構(gòu)型。開展對現(xiàn)有生態(tài)農(nóng)業(yè)類型進行全面調(diào)查,采集各類生態(tài)農(nóng)業(yè)類型的地貌、土壤、水文、氣候等環(huán)境因子數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則和粗糙集技術(shù),可以確定生態(tài)農(nóng)業(yè)類型的關(guān)鍵因子,排除干擾因子。通過相關(guān)統(tǒng)計模型,可以確定各區(qū)域生態(tài)農(nóng)業(yè)類型的相似拐點,從而得到適應不同地區(qū)特點的生態(tài)農(nóng)業(yè)類型優(yōu)化方案。
4.3生態(tài)農(nóng)業(yè)布局研究的應用
地理信息系統(tǒng)(GIS)技術(shù)用于國家和地區(qū)范圍內(nèi)農(nóng)業(yè)相關(guān)的評估已有多年[12]。很多特定的農(nóng)場系統(tǒng)利用GIS和一些相關(guān)技術(shù)來收集空間參考數(shù)據(jù),進行空間分析和制定決策,作物狀況和收成、土地能力、土壤侵蝕、土壤密度、地表和地下水污染、蟲害襲擊、雜草清除和氣候變化影響的評估,空間數(shù)據(jù)挖掘技術(shù)是DM技術(shù)的分支,是數(shù)據(jù)挖掘的主要研究方向之一,是KDD(KnowledgeDiscoveryinDatabase)技術(shù)在空間數(shù)據(jù)庫方面應用的延伸??臻g數(shù)據(jù)挖掘技術(shù)的應用一般可使GIS查詢和分析技術(shù)提高到發(fā)現(xiàn)知識的新階段,另一方面,從中發(fā)現(xiàn)的知識可構(gòu)成知識庫用于建立智能化的GIS系統(tǒng),地理信息系統(tǒng)技術(shù)與空間數(shù)據(jù)挖掘技術(shù)的集成能夠更好開展生態(tài)農(nóng)業(yè)布局研究,挖掘影響生態(tài)農(nóng)業(yè)合理布局的關(guān)鍵因子,逐步實現(xiàn)生態(tài)農(nóng)業(yè)的合理布局。
4.4生態(tài)農(nóng)業(yè)評價方法的應用
參照現(xiàn)階段我國生態(tài)農(nóng)業(yè)建設(shè)的規(guī)模和發(fā)展方向,運用層次分析法(簡稱AHP)和模糊數(shù)學等系統(tǒng)分析方法進行研究,給出了一套以定量為主、定性與定量相結(jié)合的簡便易行的生態(tài)農(nóng)業(yè)綜合效益評價指標體系與評價方法,將生態(tài)農(nóng)業(yè)的綜合效益分為生態(tài)效益、經(jīng)濟效益和社會效益三個方面(也即三個準則),并將諸方面分解為若干具體指標[13]。形成具有一個總目標、三項準則(子目標)和18個具體指標的三層次生態(tài)農(nóng)業(yè)綜合效益評價指標體系。通過對指標體系的數(shù)據(jù)進行量化,構(gòu)建數(shù)據(jù)庫,利用數(shù)據(jù)挖掘工具和統(tǒng)計模型以及神經(jīng)網(wǎng)絡技術(shù),對數(shù)據(jù)庫的數(shù)據(jù)仔細研究,可以挖掘出評價指標之間的相關(guān)性,設(shè)置合理的指標權(quán)重,根據(jù)評價年效益指數(shù)和相對指數(shù)的高低作出對生態(tài)農(nóng)業(yè)系統(tǒng)綜合效益的分析判斷。進一步探討生態(tài)農(nóng)業(yè)評價方法
5結(jié)束語
從農(nóng)業(yè)現(xiàn)代化走向農(nóng)業(yè)信息化是農(nóng)業(yè)發(fā)展的必然規(guī)律。數(shù)據(jù)挖掘是一個新興的、潛力巨大的研究領(lǐng)域。生態(tài)農(nóng)業(yè)領(lǐng)域的數(shù)據(jù)挖掘是計算機技術(shù)人工智能和統(tǒng)計學等與現(xiàn)代農(nóng)業(yè)相結(jié)合的產(chǎn)物。數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)領(lǐng)域的應用還處于起步階段,對它的理解和認識還需要一個過程,具體應用方案和技術(shù)還需要不斷探索和研究。數(shù)據(jù)挖掘只是根據(jù)純數(shù)據(jù)之間的關(guān)系挖掘出一定的決策模型,但它無法完成實現(xiàn)對結(jié)果的解析,只是給研究和應用人員提供一個強大的工具,因此必須將它和現(xiàn)有的工具結(jié)合起來,才能夠使模型更完備和成熟。數(shù)據(jù)挖掘技術(shù)作為具有潛力巨大的研究領(lǐng)域,通過與現(xiàn)代農(nóng)業(yè)相結(jié)合,將在農(nóng)業(yè)科研、生產(chǎn)、管理等方面發(fā)揮巨大的作用,這對推動我國農(nóng)業(yè)現(xiàn)代化的發(fā)展具有重要的作用。
作者:劉暉林永輝林怡工作單位:福建省農(nóng)業(yè)科學院農(nóng)業(yè)生態(tài)研究所福建省山地草業(yè)工程技術(shù)研究中心