物聯網無線感測器網路故障診斷研究方法
無線感測網路(Wireless Sensor Networks,WSNs)故障診斷一般分為四步:檢測、孤立、鑑別和恢復,這四步也適用於太陽能殺蟲燈物聯網(Solar Insecticidal Lamps Internet of Things,SIL-IoTs)故障診斷。首先檢測SIL-IoTs是否存在故障。當存在故障時,需要使用診斷方法定位故障位置並鑑別故障型別。隨後將故障節點或故障鏈路孤立以保證無故障部分正常執行。最後依據故障型別進行針對性故障恢復,保證SIL-IoTs正常執行。此外,在發生故障時,一般會採取故障容錯機制,快速隔離故障保證WSNs的正常執行。基於故障診斷的觸發方式可將其分為主動與被動兩類。主動觸發是一種節點或基站會定期檢測網路狀態的故障診斷方式,而被動觸發則是一種當節點或網路狀態不符合預設情況時再觸發故障診斷方法的診斷方式。基於這兩種觸發方式和不同的應用背景及約束條件,如網路密度、時效性要求、能耗要求、節點計算能力等,目前已研究出多種型別的WSNs故障診斷方法。根據這些方法的特性,將其分為以下6類方法:統計方法、機率方法、層次路由方法、機器學習方法、拓撲控制方法和移動基站方法。表1為近年經典故障診斷研究方法的分類情況。
表1 WSNs故障診斷演算法
Table 1 Fault diagnosis algorithms on WSNs
統計方法透過建立模型,運用統計指標對資料進行檢驗,當結果不符合檢驗時,標記為故障樣本,並進一步根據故障樣本的離群程度、方差和標準差指標等對其進行故障分類。Panda和Khilar提出了一種基於改進三西格瑪(3sigma)故障自診斷方法,每個節點收集一跳鄰居節點的資料並透過3sigma檢驗觀察自身是否存在硬故障或永久性故障。此方法透過節點自身進行故障診斷,因此要求節點有一定的儲存與計算能力。當節點數量較少時,此種方法不適用。Jiang提出了一種改進的分散式故障診斷方法。當超過一半的鄰居節點與目標節點資料的差值超過閾值時,將節點標記為可能故障,用同樣的方法標記網路中所有節點。然後判斷目標節點中初始檢測狀態為正常的鄰居節點是否有一半超過閾值,如果是則確定目標節點故障。當目標節點附近沒有鄰居節點或所有鄰居節點均標記為可能故障時,如果目標節點初始檢測狀態為可能故障,則目標節點標記為故障。此方法降低了統計方法對鄰居節點的依賴性,可用於節點稀疏的WSNs中。但是此類方法為主動診斷方法,會造成較高的能量損耗。因此,Jin等提出了一種基於自迴歸模型與Kuiper檢驗的被動故障診斷方法。基於當某條路徑中的節點故障時,其他節點會選擇新的路徑並且通訊時間會增加的特點,透過Kuiper檢驗來檢測異常,從而判斷是否存在故障。
統計方法大多依據目標節點與鄰居節點值的差異進行診斷,是一種基於節點的分散式故障診斷方案。當節點處於邊緣地區,沒有足夠的鄰居節點參與計算,或是鄰居節點也存在故障時,此類故障診斷方法的正確性無法得到保證。此外,此類方法大多基於節點進行故障診斷,權衡節點能量消耗與故障診斷率是另一大挑戰。由於SIL-IoTs電池可充電、有一定計算和儲存能力,因此部署於節點處的統計方法十分適用,特別是節點暫時性與間歇性等依靠資料長期波動趨勢進行分析的故障。
2 機率方法
機率方法將故障診斷問題當作一個分類機率模型。Lau等提出了一種基於樸素貝葉斯框架的集中式硬體故障檢測方法。在基站分析收集到的端到端傳輸時間資料,判斷故障機率是否大於正常機率。如果是,則判定原路徑有節點故障,再選取近期多次資料傳輸時間資料進行評估。此方法在無擁塞網路中可以有效監測網路故障,並給出可疑故障節點,但無法檢測邊緣地區的節點。Peng和Chow提出了一種鄰域隱藏條件隨機域法來確定感測器間的隱藏狀態。這種方法利用訊號強度與訊號延遲來估計不同故障後驗機率,以此確定WSNs的健康狀況。此方法可用於不同通訊條件與節點數量場景中。Liu等將工業WSNs中的故障節點識別問題轉化為軌跡提取問題。透過機率模型的線上學習,將感知節點分佈變成機率值分佈模式。根據生成的機率值分佈軌跡,進行模式匹配與時空約束檢查,以識別故障節點。
機率方法大多不能鑑別故障的類別。此外,因為主要使用訊號強度、訊號延遲等引數進行故障診斷,因此難以獲取故障節點的數量,只能判斷存在故障的路徑及估計路徑丟失節點的情況。與統計方法類似,部署於節點的機率方法也適用於SIL-IoTs故障診斷,特別是前期的故障檢測與孤立。
3 層次路由方法
層次路由是一種將節點分為多個簇,每個簇的簇頭節點(Cluster Head node,CH)收集簇內節點的資訊,透過CH直接上傳資料到基站或多跳CH上傳資料到基站的資料傳輸方式。層次路由故障診斷方法也是透過CH對簇內成員進行診斷。Jassbi和Moridi採用混合節能分散式層次路由方法(Hybrid Energy-Efficient Distributed clustering,HEED)進行分簇,採用加權中值法對簇內節點進行檢測。當CH出現故障時,使用提前選取的簇內備份CH進行資料傳輸與故障檢測工作。Moridi等提出一種基於簇的多路徑故障容錯演算法,對WSNs中的節點分簇後,選擇一個備份節點提高CH節點容錯性。當簇內資料傳輸時,透過假設檢驗和簇內投票的方式檢測節點的故障。最後根據剩餘能量、跳數、傳播速度和可靠性引數選擇最優傳輸路徑。該方法可以有效降低丟包率,提升資料準確性。
層次路由方法比其他透過普通節點進行自診斷的方法更加簡單有效,在診斷故障後還可透過改變網路路由保障WSNs的可靠性。但是,由於多輪的CH選取,層次路由方法增加了WSNs的通訊與能量開銷。此外,由於CH依然透過鄰居節點資料判斷目標節點故障狀態,當簇內大多數節點出現故障導致資料異常時,正常節點反而可能被誤診為故障節點。層次路由方法適用於較大規模的SIL-IoTs部署情況,其分簇進行故障診斷的方式能快速檢測節點軟故障與硬故障。此外,層次路由方法亦適用於SIL-IoTs故障容錯方案設計,保障其在發生故障時不受影響。
4 機器學習方法
監督學習方法是機器學習方法在WSNs故障診斷領域中主要的應用。監督學習方法透過大量有標籤的歷史資料訓練故障診斷模型,利用目標函式不斷地調整模型引數,直到模型能有效地檢測並分類故障。Zhao等採用半監督學習方法對故障感測器節點進行分類,還引入了一種基於區域性核密度估計的標籤傳播機制。此方法考慮到基站收集的資料會出現丟包現象,用半監督核密度估計方法估計丟包資料的類標籤,以此分類故障並構造訓練集。Javaid等根據資料特徵將故障分為偏移故障(感測器校準不佳)、增益故障(在特定時間段內資料變化率不符合規律)、卡死故障(資料長期為0)和超過範圍(有正常讀數但超出正常範圍),提出了一種基於信任函式的決策融合演算法,透過增強支援向量機、增強K近鄰、增強極限學習機和增強遞迴極限學習機進行組合運算,以此分類故障。
機器學習方法需要裝置具有較高的計算效能,因此大多在基站或後臺執行,是一種集中式處理方案。儘管此類方法在故障診斷上有良好的檢測率,但其在後臺執行的特點導致不能快速的發現故障並進行恢復。此外,該方法依賴於大量資料建立模型,獲得較精確的分類結果,因此多用於間歇性與暫時性節點故障中。對於SIL-IoTs而言,機器學習方法可部署於基站或部署輕量級演算法於節點處,結合統計方法檢測節點間歇性與暫時性故障,利用新資料不斷更新模型,對SIL-IoTs的野外環境變化有較大的容忍度。
5 拓撲控制方法
WSNs中的故障有可能改變網路的拓撲結構。如節點剩餘能量較低無法承擔資料轉發任務時,在平面路由中其他節點將尋找別的傳播路徑,在層次路由中簇內會喚醒備份節點替代此節點繼續執行任務。Oßner等提出了一種基於拓撲結構的故障定位方法。透過基站將網路拓撲以圖形表示,包含WSNs內的故障資訊。基於此給每個節點分配一個可疑度得分,得分越高,故障機率越大。Sulieman和Gitlin提出了一種基於分集技術與三角網編碼組合的WSNs網路故障診斷策略。該方法透過構建冗餘路徑,快速替代發生鏈路故障的路徑,可以有效地節省能量消耗並快速的調整拓撲結構。但k個目標節點中發生n個鏈路故障時,至少需要kn+n個冗餘鏈路。
拓撲控制方法的目的是降低故障發生時WSNs的能量消耗與頻寬損失。拓撲控制方法在網路故障與故障定位方面有較好的效能表現,對於其他故障暫未有相關性研究。在SIL-IoTs中,拓撲控制方法可以有效診斷網路故障並重構路由,是SIL-IoTs不可缺少的故障診斷策略。
6 移動基站方法
資料從節點傳輸到基站有一定的時延性,因此WSNs節點數量較大時故障診斷與故障恢復效率降低。此外,由網路故障導致的拓撲結構變化也為網路故障診斷增加了難度。Chanak等提出了一種基於移動基站的分散式故障診斷方法。移動基站是一種配備無線收發器的移動機器人或車輛,其移動到網路中的不同區域透過單跳通訊的方式來診斷附近感測器的軟硬體狀態,有效提高了網路的故障檢測精度。Fissaoui等提出了一種基於故障容錯與能量有效性的分散式WSNs資料融合演算法。該方法利用移動代理在感測器節點間的遷移進行資料收集,規劃移動代理的路徑與節點失效時的備用路徑,降低了節點能耗與資料傳輸時延。
移動基站方法能夠有效地提高網路的故障檢測精度,提高故障檢測與恢復的實時性,降低節點的能量消耗。目前移動基站的主要研究問題在於檢測區域劃分與檢測路徑最佳化。此外,由於移動基站方法需要自主移動的機器人或車輛,並且提前規劃好路徑,因此對應用場景的要求較高。在SIL-IoTs中,可作為移動基站的有無人收割機、植保無人機等具有移動作業特性的農機裝備。儘管移動基站方法在故障檢測率、時延性方面均有較好效果,但SIL-IoTs故障診斷受無人收割機、植保無人機等作業路徑、工作時長、作業區域等影響較大,能否有效結合是一個未知數。
如圖1所示,SIL-IoTs應用於大田農業、禽畜養殖、茶園種植等場景中(以藍色字體表示),在不同場景中可能存在多種無線感測裝置與SIL-IoTs相連(以紅色字體表示),透過無線通訊裝置進行資料傳輸(以橙色虛線表示)。在此種複雜的SIL-IoTs場景中,使用單種故障診斷方法難以取得良好效果。對於部署在後臺的故障診斷方法(如機率方法、機器學習方法、拓撲控制方法,通過後臺分析接收到的全域性資訊進行故障診斷),由於後臺強大的計算與儲存能力,以及從SIL-IoTs節點將資料經過多跳鏈路傳輸到後臺存在時延的特點,因此更適用於處理時效性要求不高、較難診斷的故障。對於部署在SIL-IoTs節點的故障診斷方法(如統計方法、層次路由方法,透過節點自身時間相關性與鄰居節點空間相關性進行故障診斷),由於節點有限的計算與儲存能力,以及不需要多跳傳輸資料的特點,因此更適用於時效性要求較高、較易診斷的故障。其中故障診斷的時效性指故障出現到故障解決的時間。
Fig. 1 Application scenarios of SIL-IoTs fault diagnosis methods
移動基站方法可以綜合部署於後臺及部署於節點的故障診斷方法的優點,但對作為基站的載體要求較高。此外,衛星遙感資料、無人機資料等可用於故障診斷輔助決策或驗證故障診斷正確性。如某殺蟲燈殺蟲計數值持續較低,透過無人機航拍資料可觀測實際蟲情,藉此輔助判斷是燈管故障或是節點軟故障。
溫馨提示:本文節選自《智慧農業(中英文)》2020年第2卷第2期。
如果您無法在知網下載,可以點選文末“閱讀原文”可直達期刊官網免費閱讀、下載。
本文節選自
楊星, 舒磊, 黃凱, 李凱亮, 霍志強, 王彥飛, 王心怡, 盧巧玲, 張亞成. 太陽能殺蟲燈物聯網故障診斷特徵分析及潛在挑戰[J]. 智慧農業(中英文), 2020, 2(2): 11-27.
YANG Xing, SHU Lei, HUANG Kai, LI Kailiang, HUO Zhiqiang, WANG Yanfei, WANG Xinyi, LU Qiaoling, ZHANG Yacheng. Characteristics Analysis and Challenges for Fault Diagnosis in Solar Insecticidal Lamps Internet of Things[J]. Smart Agriculture, 2020, 2(2): 11-27.
為方便農業科學領域讀者、作者和審稿專家學術交流,促進智慧農業發展,為更好地服務廣大讀者、作者和審稿人,編輯部建立了微信交流服務群,有關專業領域內的問題討論、投稿相關的問題均可在群裡諮詢。
入群方法:加小編微信331760296,備註:姓名、單位、研究方向,小編拉您進群,機構營銷廣告人員勿擾。
資訊釋出
科研團隊介紹及招聘資訊、學術會議及相關活動的宣傳推廣