本文摘要:摘要:概述了電力行業大數據的特點,介紹了數據的采集、存儲和處理、分析和挖掘、應用,分別從發電、輸電、配電、用電四大環節對電力相關的大數據應用研究進行歸納與總結,接著介紹電力大數據應用的成功案例,最后闡述了電力大數據應用面臨的挑戰。 關鍵詞:電
摘要:概述了電力行業大數據的特點,介紹了數據的采集、存儲和處理、分析和挖掘、應用,分別從發電、輸電、配電、用電四大環節對電力相關的大數據應用研究進行歸納與總結,接著介紹電力大數據應用的成功案例,最后闡述了電力大數據應用面臨的挑戰。
關鍵詞:電力;大數據;模型;算法;應用
1引言
隨著煤炭、石油、天然氣、太陽能、光伏等多類型能源的引入,以及設備控制、感知與維護等電力相關領域信息化程度的提升,電力行業的數據正以高復合增長率快速膨脹,這些多源異構的海量數據共同構成了電力行業大數據[1,2]。大數據貫穿未來電力工業生產及管理等各個環節,起到獨特而巨大的作用,是中國電力工業在打造下一代電力工業系統過程中有效應對資源有限、環境壓力等問題,實現厚積薄發、綠色可持續性發展的關鍵[3]。利用大數據技術,人們可以掌握更加豐富詳實的實時信息、歷史信息,進行時間跨度更大、涉及業務范圍更廣的綜合分析,以輔助電力行業內的更優決策[1,4-7]。
電力論文范例: 電力工程汽輪機常見問題和措施分析
例如,為克服新能源輸出功率不穩定的缺點,人們需要綜合分析各類氣象因素,如溫度、氣壓、濕度、降雨量、風向、風力等,以提高對新能源預測的準確度。但是,電力行業現有的數據管理方式和數據分析方法難以支撐如此大量、復雜且快速增長數據的存儲、管理與分析[1,7],因此,急需引入大數據處理機制,提高數據的采集、存儲、加工、處理和分析全鏈條的處理能力,滿足能源及電力行業各階段不同的應用需求,為管理提升和服務轉型提供技術支撐[5,6]。本文先介紹電力行業大數據的特點和研究范疇,闡述了典型電力大數據分析算法,接著總結了近期電力大數據領域在發、輸、配、用四大環節的相關應用研究。
2電力行業大數據特點
對照容量、速率、多樣性、真實性和價值“5V”特征,電力行業的大數據有以下特點。
(1)數據體量大:隨著信息化的快速發展和智能電力系統的全面建成,電力設備產生了大量的運營數據。(2)數據類型多:傳統的電力系統數據源包括:電表計量與計費數據、不同電力環節的電流、電壓、諧波等測量數據、設備狀態監測數據。隨著傳感器、信息傳播技術、多媒體技術的發展以及各類電力信息化管理系統的普及,圖像、視頻等非結構化數據在電力數據中的占比不斷加大,此外,電力行業內還有大量的環境數據、經濟數據等需要進行關聯分析,這些都直接導致了數據類型的增多,極大地增加了大數據分析的復雜度。
(3)速率高:電力調度與保護類數據的采集、處理和分析對速率的要求高,數據本身有實時性的要求,對數分析結果往往也有實時性要求,如差動保護,使得系統要有快的響應速度和強大的數據處理分析能力。(4)真實性要求高:電力應用對數據的真實性要求高,然而,輸配電線路與環境的噪聲干擾、信息傳輸錯誤、非技術性失誤等都會降低數據的真實性。(5)價值高:電力大數據涉及電力的生產、配送、交易和消費的方方面面,利用大數據技術提取有效信息,用于電能的分析、預測、管理及規劃,潛在的經濟、社會和環境效益高[1]。
3電力大數據的研究范疇
電力大數據研究可分為采集、清洗與存儲、分析與挖掘、行業應用四大部分。
3.1數據采集
電力行業大數據不僅采集發電機組、儲能系統、輸電線路監測系統、調度自動化系統、配網自動化系統、用電信息采集管理系統、地理信息系統等行業內的信息,還采集如氣象、政策法規等行業外的數據[6,7]。
3.2數據處理與存儲
收集到的數據受到環境、傳輸等因素的影響,不可避免地存在噪聲、缺失和錯誤,需要對原始采集到的數據進行預處理,經過處理后的原始數據在正確性、完整性、一致性和可靠性各方面得到提高。常用的數據處理方法有濾波、內插、異常數據的識別和刪除等[8,9]。采用鍵值、列存儲、文檔和圖形四個分類的非關系型的數據庫(NoSQL),具有良好的可擴展性,解決了非結構化數據的存儲難題[10,11]。隨著云計算的普及,數據的存儲走向了云端,云存儲有著良好的架構設計與容錯設計,代表性的云存儲技術有谷歌公司的BigTable和亞馬遜公司的Dynamo數據存儲服務。
3.3數據分析與挖掘
大數據分析與挖掘按照處理的時間特性可以分為離線計算、批量計算、內存計算和流計算等方式[12,13];按照數據分析算法的原理可分為分類、聚類、關聯分析、神經網絡、降維和集成算法[4,6,14]。
(1)分類算法在數據分析中,經常需要對數據進行分類,常見的分類算法包括決策樹(DecisionTree,DT)、臨近算法、支持向量機(SupportVectorMachine,SVM)、Boost樹分類、貝葉斯分類等。單純的分類算法僅適用于小規模數據集的挖掘,結合模糊理論可以提高分類的性能[15,16]。DT是一種有監督的學習,在構建決策樹的過程中采用自頂向下的遞歸方式,每一次遞歸選取在當前狀態下最優的特征或者屬性來劃分數據集,常用的特征包括:信息增益、基尼指數等。SVM是基于統計學理論的前饋學習網絡,包括分類和回歸兩個步驟,以在特征空間找到最佳的超平面分離,模型構建的關鍵在于核函數及其參數的選擇。SVM用于小數據集的時間序列分析、定量構效關系等領域時,線性與非線性的分類效果好,但用于樣本數據集大的場合時,參數選擇往往很困難,推理實效性差[17]。
(2)聚類算法聚類將數據劃分為不同的簇,簇間差異較大,簇內的差異較小,借此將正常狀態和故障狀態區分出來,適用于設備故障和異常狀態的識別[14]。常用的簇間距離的度量包括:密度、曼哈頓距離、歐氏距離、漢明距離等。聚類是一種無監督的學習分類算法。經典聚類算法有K均值[18]、K中心點等。(3)關聯分析關聯分析基于支持度和置信度挖掘對象之間的關聯關系,有效地應用于推薦系統、商業分析、公共管理等領域[14,19]。經典算法包括:Apriori和FPGrowth。FP-Growth基于Apriori構建,將數據集存儲在一個特定的、稱作FP樹的結構來發現頻繁項集,算法的執行速度快于Apriori。
(4)神經網絡神經網絡已進行了數十年的研究,受限于計算機處理能力和訓練數據量的不足,早期應用的性能并不理想。隨著計算、存儲能力的提升和云計算架構的普及,神經網絡模型獲得了足夠多的訓練數據,構造的網絡規模越來越大,精確性也得到提高。常見的神經網絡包括:反向傳遞神經網絡(BackPropagationNeuralNetwork,BPNN)、自組織映射、循環神經網絡、長短期記憶神經網絡(LongShort-TermMemory,LSTM)等。
(5)數據降維維度算法是以非監督學習的方式利用較少的信息來歸納或者解釋數據,與聚類算法一樣,常用于高維數據的可視化或者簡化輸入數據,以便于監督式學習算法的應用。常見的算法包括:主成分分析(PrincipalComponentAnalysis,PCA)、香農映射、偏最小二乘回歸、多維尺度分析、投影追蹤等。(6)集成算法集成算法用一些相對較弱的學習模型獨立地就同樣的樣本進行訓練,然后把結果整合起來進行整體預測。集成算法的難點在于如何針對具體應用來選擇集成哪些較弱的學習模型以及如何整合最終的學習結果。常見的算法包括:Boosting、BootstrappedAggregation(Bagging)、AdaBoost、堆疊泛化、梯度推進機、隨機森林[20]。
3.4數據分析的應用
電力企業可通過電力大數據分析用戶對電能的需求量、用電特征等信息,依據客戶實際情況科學制定供電方案,以提高服務質量[21]。電力企業可利用歷史數據,繪制用電設備監測表格,若電力設備發生故障可及時明確故障原因,主動向維修人員推送故障信息,這對提升電網搶修速度、縮小故障范圍、縮短停電時間十分重要。例如,基于用能數據、地理信息以及氣象數據可以分析區域內的能源結構與耗能特性,為實現能源的可持續開發與利用提供指導方向。
4電力行業的大數據研究
電力行業的大數據產生于發電、輸電、配電、用電四個環節。在能源與電力改革的大背景下,大數據在電力系統的發輸配用環節得到利用,有力提升了電力系統的運行水平和管理水平。
4.1發電領域的大數據研究
包括風能、太陽能、潮汐等各種可再生新能源具有分布廣泛、可再生的環境友好特性,但具有斷續性和不穩定性,對其的利用是電力工業面臨的重大挑戰。
4.1.1新能源功率預測
為了提高新能源的調度、維修和管理水平,采用基于大數據集的建模系統來建立可再生能源的精確預測模型成為全球研究的熱點[22-31],主要的數據分析方法包括:SVM[24,26]、神經網絡[24,26,28]。文獻[24]提出了一種反向傳播和牛頓插值數學函數法相結合的神經網絡算法,對風速數據進行處理,從而達到預測發電量的目的。文獻[29]先采用數據分割剔除異常數據,根據紊流強度將數據分為若干個子集和等分部分,計算每個最小部分中數據的質心,以質心作為SVM算法的訓練數據,實現對風力發電機組功率曲線的建模。
文獻[26]提出了一種基于K均值和神經網絡的數據挖掘方法,利用歷史記錄中的氣象信息進行聚類分析,將歷史記錄中的氣象信息分為不同的類別,然后對基于bagging算法的神經網絡進行訓練,從而得到風能的預測結果。文獻[27]運用SVM回歸方法,通過將經驗模式分解得到若干固有模式函數和參數,依據歷史風速時間序列來預測風速。太陽輻射、溫度和其他氣象因素的變化導致光伏發電的輸出功率非常不穩定的。
文獻[28]采用兩個LSTM神經網絡的注意機制分別對溫度和功率輸出進行自適應預測,以時間序列的方式對短期光伏發電量進行預測。文獻[29]從宏觀和微觀兩個方面研究了分布式光伏系統的擴散趨勢和預測方法,宏觀方面對光伏系統的容量和位置做了聚類分 析,微觀方面對光伏的功率進行預測。文獻[30]利用高分辨率天氣預報數據,用不同時空關聯性的深度卷積神經網絡來捕捉云層運動模式及其對太陽能發電預測的影響。文獻[31]對光伏發電時間序列的內在和隨機特性進行多尺度分析,包括:大時間尺度數據的多重聚類分析、小時間尺度數據的標準化變換和概率分布建模,并將聚類結果與氣象領域的理論模型進行了交叉驗證,實現對光伏發電量的預測。
4.1.2發電控制和調度
隨著各類新能源、分布式電源、電動汽車等的不斷接入,提高電力調控智能化水平勢在必行,而大數據技術在數據整合集成能力上表現優越,為其在電力調控中的應用提供了廣闊空間。文獻[32]依據風電功率預測的精度隨時間尺度減小而提高的特點,采用基于核密度估計的穩健優化方法來處理風電的不確定性,實現風電、水電和火電系統的多時間尺度魯棒調度模型,以最小的輸出總功率調整來滿足功率平衡。文獻[33]采用K均值聚類和PCA的混合型降維方法,利用少量代表性站點的實測值來估算太陽能發電站點的總發電功率,以便于發電側的調度。
4.2輸電領域的大數據研究
隨著電網廣域測量系統的發展,電網形成了具有時空特性的高維海量運行數據,使得數據驅動的電網狀態分析成為可能。
4.2.1暫態穩定性分析
暫態穩定性分析是保證電網穩定運行的重要手段。文獻[34]考慮電網運行數據特點建立數據模型,結合隨機矩陣理論和時間序列分析建立量化評價指標,在整體分析電網運行狀態的基礎上,分析不同擾動對電網穩定的影響程度和影響范圍;文獻[35]綜合隨機矩陣理論中M-P定律、圓環率、線性特征值及熵理論來評估電網受擾后的脆弱性,得出了電網的薄弱點評判指標。
4.3配電領域的大數據研究
隨著配電自動化設備的普及,越來越多的運行數據可從監控和數據采集系統中收集得到,通過大數據分析可以獲知配電網的薄弱環節及設備故障隱患,提高故障定位和搶修的反應速度,縮短停電時間,提高配電網的供電可靠性。
4.3.1配電網故障定位
傳統的配電網故障定位采用行波測距方法[43],需要沿線路加裝數量眾多的測量裝置,而基于大數據分析的故障定位方法利用形式化分類器模型[44,45]或神經網絡技術[45,46]可以在任何給定的時間分析網格信息,從而確定網格的健康狀況。文獻[44]僅利用在一級變電站測量到的電壓暫降數據,用SVM對未測量到的數據進行估計,采用匹配法確定可能的故障區段,采用歐氏距離法分析確定故障距離,實現了利用有限模擬數據來檢測單端母線故障區段和故障距離的綜合故障定位。
文獻[45]結合SVM數據描述和核密度非參數估計,提出了一種基于多層次系統分區和子區域概率故障檢測的定位策略,不采用0或1的硬判決方式,而采用概率密度函數來獲得各子區域故障檢測的置信度來定位故障區域。文獻[46]采用直覺模糊集來表示報警信息的不確定性,利用拓撲分析和電氣設備、保護動作、斷路器跳閘之間的邏輯關系,建立了基于直覺模糊Petri網的電力系統診斷模型。文獻[47]利用配電網歷史告警信息和通用電網保護配置模型構造假設告警序列,并和真實告警序列做時序置信度的相似性計算,再利用直覺模糊Petri網絡進行故障診斷。該模型具有很好的處理直覺模糊集不確定信息的能力,并用時間置信度對模型的初始位置值進行修正。
4.4用電領域的大數據研究
隨著高級量測體系(AdvancedMeteringInfrastructure,AMI)的逐步完善和智能電表的普及,用戶側用電數據的規模日益增長,為用電領域的大數據分析提供基礎。
4.4.1用電負荷預測
動態電力市場交易需要準確的短期負荷預測,用循環神經網絡[54-56]分析收集到的歷史用能數據,可有效提高負荷預測的準確度,為能源管理、運行和市場分析提供重要依據。不同于輸變電領域的負荷預測,單戶住宅的能耗通常是難以預測的,為了克服負荷曲線的波動性和不確定性,文獻[55]用循環神經網絡構建了基于相似性的鏈式傳遞學習方法,提高了運算效率,而文獻[56]采用簡單池化的循環神經網絡來避免過度擬合問題。
LSTM[57,58]可解決一般循環神經網絡存在的長期依賴問題,文獻[57]采用該模型構建了以季度和月份為檢測窗口的電能消耗預測模型和異常用電檢測方法。鑒于傳統SVM存在輸入變量不易確定以及模型參數難最優化的問題,文獻[58]提出了一種基于最小絕對值收縮與選擇算子的LSVM短期負荷預測方法,提高了預測結果的準確性和穩定性。
5電力行業大數據應用的案例
5.1大數據在新能源電力調度中的應用
建設具有較高精度的風電和光伏功率預測系統,是解決這兩種新能源并網運行的關鍵措施。風光功率預測系統以風電場和光伏電站的歷史功率數據、地理地形、氣候規律數據等為基礎建立預測模型,利用氣象部門發布的天氣預報數據,采用神經網絡類的大數據分析方法[24,26,28,77],來預測風電和光伏的短期和超短期功率輸出數值,生成功率預測曲線,為電力調度決策提供依據。貴州電網利用境內眾多的小水電站資源,建立了風光功率預測系統,實現了調管范圍內的風電、光伏、小水電的合理調度控制,基本保證了全額消納間歇式的風光新能源,實現了功率預測技術和調度運行的有效結合,取得了顯著的環境效益和經濟效益。
5.2大數據的反竊電應用
竊電現象在我國部分地區仍然嚴重,特別是工業用電大戶的竊電行為給電力系統帶來了大的經濟損失和潛在的安全隱患,然而,現場檢查耗時耗力、風險高、不確定因素多,傳統反竊電工作的難度很大。國家電網公司研制的大數據反竊電分析平臺通過分析電流、電壓、線損、波形等數據變化情況,綜合運用相關性分析、模式識別、決策數判決等多個大數據分析模型進行用電檔案信息、歷史數據、同行業數據等數據指標的比對,繪制竊電用戶畫像,提高了識別潛在竊電用戶的精準度[78]。
6電力行業大數據研究面臨的挑戰
盡管發電、輸配電網、供電公司都對大數據分析及其在各自業務中的應用表現出了極大的興趣,但是,多重因素導致實際部署的大數據應用甚少。電力行業是個龐大復雜、高度耦合的有機運行體,相對封閉的管理體制形成了條塊分離的垂直業務系統,相關數據隔離存儲在多個系統之中,而戰略級別的應用頂層設計缺位導致應用軟件和數據庫互通缺乏標準的數據格式,不同歷史階段部署的各類信息和通信系統普遍存在互操作性問題,使得實際應用過程中的數據獲取困難[1,79,80]。
此外,作為關乎國計民生的命脈,電力行業各環節產生的數據都有保密要求,有的被劃分為機密類別,有的涉及用戶個人隱私[81],因此,對于研究人員來說,進行高度相關的研究是十分困難的,導致大部分的研究還是停留在用理想數據進行算法的測試與驗證上,實踐價值有待提高。
7總結
本文先描述了電力行業大數據的五個特點,即:體量大、類型多、速率高、真實性要求高、價值高;接著簡要介紹了電力大數據研究范疇的四個方面,包括:數據的采集、數據的存儲和預處理、概括得出的六大類數據分析和挖掘算法以及大數據分析結果的應用;重點按發電、輸電、配電、用電四大環節對當前電力大數據研究的現狀進行歸納與總結,接著介紹了電力大數據分析在新能源電力調度和反竊電兩個應用方向的成功案例,最后指出電力大數據應用面臨的各種挑戰。
電力行業中的大數據分析是一個全面而復雜的研究領域,要實現在設備運行和行業建設中發揮出作用,不僅取決于大數據的分析算法,還需要綜合系統運行、用戶行為模式、信息通信技術、管理制度等多領域的專業知識,需要多領域專業技術與智能算法間的協同配合,技術挑戰和應用前景都非常巨大。
參考文獻(References):
[1]IEEESmartGridBigDataAnalyticsMachineLearningandArtificialIntelligenceintheSmartGridWorkingGroup.Bigdataanalyticsinthesmartgrid:introduction,benefits,challengesandissues[R].2018.
[2]DarkH,HannaniE,AqqalA,etal.Bigdatamanagementinsmartgrid:concepts,requirementsandimplementation[J].JournalofBigData,2017,13(4):1-19.
[3]中國電機工程學會電力信息化專業委員會(PowerInformationProfessionalCommitteeofChineseSocietyforElectricalEngineering).中國電力大數據發展白皮書(WhitepaperonthedevelopmentofChinaelectricpowerbigdata)[R].2013.
[4]曹軍威,袁仲達,明陽陽,等(CaoJunwei,YuanZhongda,MingYangyang,etal.).能源互聯網大數據分析技術綜述(Surveyofbigdataanalysistechnologyforenergyinternet)[J].南方電網技術(SouthernPowerSystemTechnology),2015,9(11):1-12.
[5]MaZ,XieJ,LiH,etal.Theroleofdataanalysisinthedevelopmentofintelligentenergynetworks&application[J].IEEENetwork,2017,31(5):88-95.
作者:趙海波
轉載請注明來自發表學術論文網:http://www.cnzjbx.cn/jjlw/28355.html