超碰人人精品,中文字幕观看,天天躁日日躁狠狠躁喷水,日本不卡一区在线,一级片在线观看网站,午夜两性做爰免费视频,国产视频二区在线观看

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

2018-05-18 19:39:33 大云網(wǎng)  點擊量: 評論 (0)
大數(shù)據(jù)技術在電網(wǎng)中的應用,突破了傳統(tǒng)技術的瓶頸,帶來了巨大的技術變革。大數(shù)據(jù)依靠集群的力量對數(shù)據(jù)進行分析處理,根據(jù)數(shù)據(jù)量的不同,可以適時調整集群的規(guī)模。

3 引發(fā)技術變革的電力大數(shù)據(jù)

3.1 數(shù)據(jù)規(guī)模大,數(shù)據(jù)處理時效性要求高——傳統(tǒng)技術手段不能經(jīng)濟地滿足業(yè)務性能需求

3.1.4實際案例:基于大數(shù)據(jù)的短期負荷預測

4.具體案例

為了體現(xiàn)該方案在負荷預測過程中呈現(xiàn)的良好效果,將該部分結合一個實際算例來做出分析。目標電網(wǎng)為國內配備用戶用電信息采集系統(tǒng)的某市級電網(wǎng),該市級電網(wǎng)的用戶數(shù)為120萬,用電信息采集頻率為每15分鐘一次。在具體案例的介紹中,主要分為兩大部分:第一部分主要介紹該方案中數(shù)據(jù)挖掘算法在用戶用電行為分析及預測模型上的應用;第二部分則主要介紹該方案如何移植到大數(shù)據(jù)平臺上完成數(shù)據(jù)的存儲和計算。

第一部分:基于數(shù)據(jù)挖掘算法在用戶用電行為分析及預測模型;

在形成與預測日曲線類型、負荷水平以及影響因素相近的相似日時,需要對大量的歷史數(shù)據(jù)集進行有效的歸類和分析。由于原始數(shù)據(jù)集的簇結構以及與影響因素的耦合關系均未知,因此需要結合數(shù)據(jù)挖掘算法予以解決。

☆凝聚層次聚類算法對歷史樣本分類

對于每一個用戶來說,其歷史負荷曲線因為天氣、節(jié)假日等影響會產(chǎn)生走勢各異的不同曲線類型對其進行有效的聚類,可以幫助縮小待預測日的相似日數(shù)據(jù)樣本集規(guī)。凝聚層次聚類算法在這里被采用來獲取良好的預測結果,層次聚類算法是一種自下而上的歸并算法,通過計算每個樣本之問的歐式距離.來實現(xiàn)最終歸類的效果。

計算任意兩個歷史負荷樣本的歐式距離;

設n維樣本空間s中任意兩個數(shù)據(jù)序列X、Y分別為:X={x1、x2、x3…xn},Y={y1、y2、y3、yn},其歐式距離為:

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

設定閾值合并相近的類。

設定曲線間的距離閾值為d,在S中有N條負荷曲線序列{L1、L2、L3…Ln},任意取出曲線Ln并計算與其他曲線間的歐式距離,合并最近的兩個簇,直到達到預定的分類目標即可停止。我們在第一部分數(shù)據(jù)挖掘算法的描述中都采用目標電網(wǎng)中的一個用戶做出分析,該用戶記為用戶1.對用戶1的2012年365天的數(shù)據(jù)聚類結果如圖—3所示。

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-3 2012年1月1日到2012年12月31日期間的用戶1日負荷曲線

 

在經(jīng)過凝聚層次聚類算法的處理分析后,圖3-3中用戶I全年的負荷數(shù)據(jù)可以歸類為圖3-4中的六類負荷曲線。可以看出六類負荷曲線在幅值大小及曲線走勢上均存在較大的差異、同時在表3-2中,可以看出類3和類4主要為工作日負荷,類2主要為周末負荷,進一步分析其節(jié)假屬性,發(fā)現(xiàn)第六類中含有大量的節(jié)假日如國慶節(jié)等的負荷,而第一類中則主要為節(jié)假日前一天的負荷、分析表明,該算法成功完成了分類的任務。

 

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

表3-2每一類中各類型日的數(shù)量

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-4用戶1的六類負荷曲線圖

 

 

☆灰色關聯(lián)分析選取關鍵影響因素

通過對用戶1的歷史負荷數(shù)據(jù)及歷史天氣數(shù)據(jù)進行灰色關聯(lián)分析,可以得出影響用戶1負荷變化規(guī)律的關鍵影響因素,有利于縮減樣本集的數(shù)據(jù)維度,進一步提高準確度。對用戶I的灰色關聯(lián)度,計算結果見表3-3

表3-3

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

 

其中,可以看出最高氣溫、平均氣溫、日類型、平均濕度對負荷變化趨勢的影響較大.為關鍵影響因素,在后續(xù)的分析中主要關注這幾項影響囡素值。

 

☆CART決策樹建立分類規(guī)則

這一步的計算結果需要在前兩步的計算結果上完成。CART決策樹算法根據(jù)信息增益度將樣本按其若干影響屬性値不斷劃分,最后歸入指定的類。而用CART決策樹來建立分類規(guī)則的思想如圖3-5所示。

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-5分類規(guī)則建立圖

中間為決策樹的箅法模型、左側輸入為日屬性向量集,即2012年每一天對應的負荷影響因素數(shù)據(jù)集合。右側輸入為在層次聚類分析后得到的若干個類別。通過CART算法對用戶1的數(shù)據(jù)進行若干次分裂,即可得到如圖3-6所示的分類規(guī)則。

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-6用戶1決策樹分類規(guī)則圖

根據(jù)決策樹算法對用戶1的負荷曲線進行分析,得到圖3-6所示的決策圖。該樹也是久特變負荷曲線分類規(guī)則.同時也表征了負荷聚類結果與關鍵。影響因素值的定量關系。舉例如下:

2UI3年4月29日影響負荷的關鍵因素值如下表。

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

表3-4某日影響負荷的關鍵因素

由圖3-6中黑色實線所示,該日被最終歸入了第二類。而由聚類分析得出的第二類負荷在曲線特征上極其相似,這樣就給出了負荷的分類規(guī)則。

☆找到待預測的同類型日數(shù)據(jù)集

我們已知了待預測日的相關因素數(shù)據(jù),在圖3-6所示的分類規(guī)則中可以將待預測日分到與之對應的類中,結果見表3-5

表3-5

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

 

☆針對每一類訓練対應的支持向量機模型

支持向量機因其對非線性數(shù)據(jù)集較好的數(shù)據(jù)擬合能力而受到眾多研究學者的青睞,本書采用支持向量機算法完成最終的負荷預測工作。支持向量機有幾個關鍵參數(shù)會對最終的預測結果產(chǎn)生較大的影響,通過遺傳算法對六類歷史數(shù)據(jù)集分別進行尋優(yōu)和計算,可以得到最為匹配的參數(shù)組合,詳見表3-6

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

表3-6六類歷史數(shù)據(jù)集的最優(yōu)支持向量機參數(shù)組合

 

☆對用戶1的預測結果如圖3-7所示。

《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-7用戶1的2013年4月29日的負荷預測結果對比圏

第二部分:在Hadoop大數(shù)據(jù)平臺上完成系統(tǒng)負荷預測

由于上述案例僅針對120萬用戶中的用戶1做了預測,而為了得到系統(tǒng)總負荷,則需要對每個用戶執(zhí)行上述操作,這個過程我們在Hadoop平臺上給以實現(xiàn)。整個技術框架分為數(shù)據(jù)存儲、數(shù)據(jù)管理,數(shù)據(jù)計算三個部分。

☆數(shù)據(jù)存儲

在Hadoop的底層數(shù)據(jù)層中,分布式文件系統(tǒng)HDFS負責用戶負荷及影響因素的分布式存儲。

☆數(shù)據(jù)管理

HBase在分布式文件系統(tǒng)基礎上,對底層的數(shù)據(jù)進行數(shù)據(jù)管理。HBase是采用KeyValue的列存儲,Rowkey是KeyValue的Key,表示唯一一行。Rowkey是一段二進制碼流,最大值為64KB,內容由用戶自定義。數(shù)據(jù)的加載根據(jù)Rowkey的二進制序由小到大進行排序。HBase根據(jù)數(shù)據(jù)的規(guī)模將數(shù)據(jù)自動分切到多個Region的多個HFile中。

HBase的基本存儲單元為列簇(columnfamily)。HBase數(shù)據(jù)選輯由行和列組成二維矩陣存儲。其中由HBase列簇、列組成了一維矩陣中的一維,由Rowkey組成了另一維,每-個非空的行列節(jié)點稱為一個Cell,Cell是HBase最小的邏輯存儲單元。

圖3-8為負荷數(shù)據(jù)的存儲結構圖,鍵值(key)代表的是對應時間點,從0點到23點45分,一天共96個點。圖3-9中Value值為對應時間點的負荷值。UserId為用戶的編號,而data則表示是該用戶對應的某一天數(shù)據(jù)。

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-8HBase邏輯存儲架構

圖3-9負荷數(shù)據(jù)存儲結構圖

☆數(shù)據(jù)計算

MapReduce具有分布式計算框架,以及頂層的應用集成和相關的協(xié)調功能。對于大數(shù)據(jù)方案來說,該負荷預測方案具體的分布式實現(xiàn)是我們關注的重點。因此,這里主要介紹該大數(shù)據(jù)預測方案的MapReduce分布式實現(xiàn)思想。圖3-10是MapReduce的邏輯圖。

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

圖3-10MapReduce邏輯處理圖

其中,每一個Split代表的是一個數(shù)據(jù)段,讀數(shù)據(jù)段為存儲一個用戶的全年歷史負荷數(shù)據(jù)及相關因素數(shù)據(jù);每一個MaP進程負責對每個用戶進行步驟1~4的計算和分析;在Reduce環(huán)節(jié),則完成對120萬用戶的數(shù)據(jù)整合,得出整個系統(tǒng)的總體負荷預測結果。

通過以上兩部分的計算,得出的最終預測結果如圖3-1所示

 《電力大數(shù)據(jù)》引發(fā)技術變革的電力大數(shù)據(jù)

 

圖3-11系統(tǒng)負荷預測結果

對上述120萬個用戶的負荷預測結果進行累加,即可得到最終的系統(tǒng)負荷,結果如圖3-11所示。傳統(tǒng)方法的最大相對誤差為3.36%,最小相對誤差為0,51%,平均相對誤差為1.68%;而采用大數(shù)據(jù)方案得到的預測結果為:最大相対誤差為1.35%,最小相對誤差為O.O7%,平均相對現(xiàn)差為1.68%。因此,可以得出本方案取得了較傳統(tǒng)方案好的預測結果。

 

書名:電力大數(shù)據(jù):能源互聯(lián)網(wǎng)時代的電力企業(yè)轉型與價值創(chuàng)造

ISBN:978-7-111-51693-4

作者:賴征田

出版日期:2016-01

出版社:機械工業(yè)出版社

 

大云網(wǎng)官方微信售電那點事兒

責任編輯:繼電保護

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?