建設泛在電力物聯(lián)網(wǎng),是國家電網(wǎng)有限公司推進“三型兩網(wǎng)”建設的重要內容和關鍵環(huán)節(jié)。而其中,如何構建一個強大的數(shù)據(jù)平臺,是加快推進泛在電力物聯(lián)網(wǎng)建設的前提和基礎。
泛在電力物聯(lián)網(wǎng)的數(shù)據(jù)量將大幅增加
電力行業(yè)歷來重視數(shù)據(jù)和信息技術,從上世紀80年代起,就采用實時數(shù)據(jù)庫處理發(fā)電以及電網(wǎng)采集的各種數(shù)據(jù)。但隨著電網(wǎng)規(guī)模的擴大,數(shù)據(jù)采集量的大幅增加,傳統(tǒng)的實時數(shù)據(jù)庫和IT架構已經(jīng)無法滿足海量數(shù)據(jù)的處理需求。最近幾年,電力行業(yè)開始采用互聯(lián)網(wǎng)行業(yè)的大數(shù)據(jù)平臺技術,最典型的就是將Kafka、Hadoop、HBase、Spark、Redis等技術集成在一起處理海量數(shù)據(jù)。比如智能電表的用電信息采集系統(tǒng)、電費的計算等,都采用這類方案。
推進泛在電力物聯(lián)網(wǎng)建設,需要全方位對電網(wǎng)運行狀態(tài)、客戶用電等進行實時監(jiān)測、預警、分析,數(shù)據(jù)采集點和采集頻次會大幅增加,數(shù)據(jù)量將在原來的基礎上增加上百倍。
以智能電表為例,現(xiàn)在客戶的智能電表是一天發(fā)送一條記錄。如果改為與商業(yè)智能電表一樣,15分鐘發(fā)送一條記錄到云端,數(shù)據(jù)量將至少增加96倍,數(shù)據(jù)插入請求數(shù)也相應增加96倍以上。以全網(wǎng)智能電表5億臺來統(tǒng)計,一天產生的數(shù)據(jù)條數(shù)多達480億條,現(xiàn)有的大數(shù)據(jù)解決方案和架構將面臨巨大的挑戰(zhàn),即使通過水平擴展增加服務器數(shù)量來處理,其運營成本也將數(shù)量級地增加。
從配網(wǎng)的情況來看,即使采集點和采集頻率不顯著增加,但以D5000、CC2000為代表的主流產品,受限于歷史數(shù)據(jù)處理能力,依然只能圍繞實時采集數(shù)據(jù)、歷史斷面數(shù)據(jù)構建應用,拓撲分析技術無法在時間維度縱向擴展。
電網(wǎng)數(shù)據(jù)采集及監(jiān)控系統(tǒng)(SCADA)作為物聯(lián)網(wǎng)的一部分,不但要看實時數(shù)據(jù),還需要看歷史數(shù)據(jù),不單需要實時監(jiān)控,更需要故障預警、趨勢分析、運營指標分析、效率分析等。通過快速存取、分析高頻采集數(shù)據(jù),將為電網(wǎng)的安全高效運行提供更精準的數(shù)據(jù)決策支撐。
另一方面,泛在電力物聯(lián)網(wǎng)與通用的物聯(lián)網(wǎng)一樣,不僅會存在云端的數(shù)據(jù)中心,也會存在邊緣節(jié)點。這些邊緣節(jié)點具備一定的計算和存儲能力,能進行數(shù)據(jù)的預處理和緩存,大幅緩解數(shù)據(jù)中心平臺的壓力,而且能更好地保證邊緣節(jié)點覆蓋的區(qū)域有更好的數(shù)據(jù)實時響應能力,更好地支撐本地業(yè)務實時智能化決策與執(zhí)行。但是邊緣計算與云計算需要通過緊密協(xié)同才能更好地滿足各種需求場景的匹配,從而最大化邊緣計算和云計算的應用價值。
采集點的增加和采集頻次提高,能帶來什么樣的效益呢?以智能電表為例,如果將所有電表的數(shù)據(jù)采集頻次提高到1次/15分鐘,電網(wǎng)將實現(xiàn)對每個臺區(qū)線損的實時監(jiān)測,而不是現(xiàn)在的T-1模式,從而對異常線損實時處理。同時,對輸電線路故障實時監(jiān)測,再也無需客戶上報,大大提升運維效率和服務質量。
以Hadoop體系為代表的互聯(lián)網(wǎng)大數(shù)據(jù)解決方案,主要處理的是互聯(lián)網(wǎng)領域的非結構化數(shù)據(jù),比如爬蟲數(shù)據(jù)、微博與微信數(shù)據(jù)等。但是,泛在電力物聯(lián)網(wǎng)的數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)有顯著不同的特點,表現(xiàn)在幾個方面:數(shù)據(jù)都是時序的,由傳感器和設備不斷產生,形成一個數(shù)據(jù)流;除視頻、圖像外,都是結構化的數(shù)據(jù);數(shù)據(jù)是機器日志類型的,不會有刪除或更新的動作;數(shù)據(jù)是有保留時長的,到期刪除;數(shù)據(jù)流量是平穩(wěn)可預測,知道測點數(shù)、采集頻率,能較為準確估算流量大??;數(shù)據(jù)需要進行實時計算、分析;數(shù)據(jù)的分析、計算一般都是基于某一個時間段和地域進行;數(shù)據(jù)量巨大,一天產生幾百億條記錄。
除數(shù)據(jù)特征不一樣之外,在數(shù)據(jù)處理上,泛在電力物聯(lián)網(wǎng)與典型的互聯(lián)網(wǎng)相比,還有不一樣的需求。比如插值計算、數(shù)學函數(shù)計算以及某個具體時間點的斷面數(shù)據(jù)等。而且這些數(shù)據(jù)的處理往往與采集設備的管理直接掛鉤,需要依據(jù)采集設備的歸屬、地域以及其他屬性進行各種分類統(tǒng)計。
構建相適應的大數(shù)據(jù)平臺
隨著泛在電力物聯(lián)網(wǎng)的加快建設,現(xiàn)有的互聯(lián)網(wǎng)大數(shù)據(jù)技術平臺將遇到巨大的挑戰(zhàn),因為電力數(shù)據(jù)規(guī)模將增加幾個數(shù)量級,數(shù)據(jù)分析的量也更多,實時性要求也更高。因此,需要進一步加大信息技術的創(chuàng)新力度,構建和完善適應泛在電力物聯(lián)網(wǎng)建設需求的大數(shù)據(jù)平臺。
這個新一代的大數(shù)據(jù)平臺,要有以下幾個特點:充分利用泛在電力物聯(lián)網(wǎng)的數(shù)據(jù)特點,在技術上做各種優(yōu)化,大幅度提高數(shù)據(jù)插入、查詢的性能,降低電網(wǎng)運營成本;必須能實時處理各種數(shù)據(jù)插入、查詢請求,提升電網(wǎng)運行效率;必須是水平擴展的,隨著數(shù)據(jù)量的增加,只需要增加服務器擴容即可;支持邊緣計算與云計算的邊緣協(xié)同;必須是易于維護的,降低對運維人員的要求;必須是開放的,有業(yè)界流行的標準SQL接口,便于各種應用集成;必須通過Python、R或其他接口來方便集成各種機器學習、人工智能算法。
當前,國內外諸多互聯(lián)網(wǎng)企業(yè)已經(jīng)注意到物聯(lián)網(wǎng)興起后,傳統(tǒng)的大數(shù)據(jù)技術正面臨新的考驗和挑戰(zhàn),并開始著手研發(fā)新一代大數(shù)據(jù)平臺。相信隨著泛在電力物聯(lián)網(wǎng)建設不斷加快,必將構建新一代的能源電力大數(shù)據(jù)平臺,從而進一步挖掘和利用好電網(wǎng)的數(shù)據(jù)資源,提升電網(wǎng)運營的效率和效益,保障電網(wǎng)安全穩(wěn)定運行,為社會提供新的應用和服務。