基于多分辨率分析的配網(wǎng)臺區(qū)戶變關(guān)系辨識法研究與應(yīng)用
引言
配電網(wǎng)精益化管理是實現(xiàn)供電企業(yè)提質(zhì)增效的有效措施,其中,正確的戶變關(guān)系是開展配電網(wǎng)精益化管理的前提。當(dāng)前低壓配電網(wǎng)拓?fù)湫畔⒅饕蕾嚾斯や浫?由于歷史記錄丟失、配變擴容與線路遷改時信息更新不及時等原因,低壓臺區(qū)檔案混亂,臺賬中戶變關(guān)系存在不少錯誤的情況,嚴(yán)重阻礙了臺區(qū)故障定位、竊電核查、線損及三相不平衡治理等臺區(qū)精益化管理工作的開展。因此,研究低壓臺區(qū)戶變關(guān)系辨識方法具有理論價值與現(xiàn)實意義。
傳統(tǒng)的戶變關(guān)系辨識方法主要包括人工巡線法、瞬時停電法、特征信號法和臺區(qū)識別儀法。但上述方法與配電網(wǎng)規(guī)模日趨變大、供電可靠性要求日益提高的發(fā)展趨勢相矛盾,難以大規(guī)模常態(tài)化開展,弊端日益凸顯。隨著用電采集系統(tǒng)與智能電能表的普及應(yīng)用,海量用戶用電數(shù)據(jù)被廣泛采集,使得利用數(shù)據(jù)挖掘方法實現(xiàn)低壓臺區(qū)戶變關(guān)系辨識成為可能。
文獻(xiàn)指出,具有電氣連接的臺區(qū)變壓器與低壓用戶的電壓波動情況具有相似規(guī)律,提出基于Pearson相關(guān)系數(shù)的戶變關(guān)系辨識方法。
文獻(xiàn)利用核模糊聚類算法將數(shù)據(jù)映射至高維特征空間完成用戶聚類,并基于進化算法完成聚類參數(shù)優(yōu)化,以提高戶變關(guān)系辨識效果。為進一步提高戶變關(guān)系辨識有效性,部分學(xué)者嘗試在辨識分析前對量測數(shù)據(jù)進行預(yù)處理。
文獻(xiàn)基于獨立成分分析提取電壓時序數(shù)據(jù)特征,并結(jié)合聚類算法完成戶變關(guān)系辨識。
文獻(xiàn)利用自適應(yīng)分段聚合近似法提取電壓變化特征,并基于改進DBsCAN聚類法識別戶變關(guān)系異常用戶。
綜上所述,現(xiàn)有戶變關(guān)系辨識方法多從整體角度衡量電壓時序數(shù)據(jù)間的特征空間距離與形態(tài)相似度,對時序數(shù)據(jù)的局部特征細(xì)化不足,未實現(xiàn)多分辨率特征相似度分析。
針對上述問題,本文提出了一種基于多分辨率分析的配網(wǎng)臺區(qū)戶變關(guān)系辨識法。首先,利用EMD將電壓量測數(shù)據(jù)分解為一系列特征互異的模態(tài)函數(shù),并基于SE度量各子序列的復(fù)雜度,完成相關(guān)序列合并重組:然后,綜合考慮各重組分量的多尺度特征,提出多分辨率距離和相似性測度全面度量電壓時序數(shù)據(jù)的相似程度,并結(jié)合改進K-means算法完成戶變關(guān)系辨識。算例分析結(jié)果表明,所提多分辨率辨識法綜合考慮不同分量的細(xì)節(jié)特征,可實現(xiàn)戶變關(guān)系有效辨識。
1基于EMD和SE的時序信號多分辨率分析
EMD是一種基于多分辨率思想的信號分解法,可自適應(yīng)分解時間序列,解耦各特征尺度信息并降低原始時序數(shù)據(jù)的復(fù)雜度,以實現(xiàn)對原始數(shù)據(jù)內(nèi)在規(guī)律、局部特征和變化趨勢的細(xì)致刻畫。考慮到EMD分解得到的各模態(tài)函數(shù)間存在相關(guān)性,采用SE度量各子序列的復(fù)雜度并完成相似序列合并重組,以強化同類序列的典型特征,并簡化后續(xù)信號分析的計算規(guī)模。
1.1基于EMD的時序信號多分辨率分解
EMD是由學(xué)者Huang提出的一種基于多分辨率思想的信號分解法,可將原始信號自適應(yīng)分解為一系列本征模態(tài)函數(shù)(IntrinsicModeFunction,IMF),細(xì)化表征原始信號在不同時間尺度的特性。
EMD具體步驟如下:
(1)尋找原始時序信號x(n)的所有極大值和極小值點。
(2)用曲線連接所有極大值點,經(jīng)擬合構(gòu)成信號的上包絡(luò)u(n):用曲線連接所有極小值點,經(jīng)擬合構(gòu)成信號的下包絡(luò)l(n),計算上下包絡(luò)線的平均值為y(n):
(3)令原始時序信號x(n)與平均值y(n)的差值為h(n):
(4)若h(n)不滿足本征模態(tài)函數(shù)的要求,則視h(n)為新的信號x(n),轉(zhuǎn)至步驟(1):若滿足,則令h(n)為IMF分量。其中,第i個IMF分量ci(n)表示為:
(5)將原始時序信號x(n)與ci(n)差值的剩余分量視為新的信號x(n),并轉(zhuǎn)至步驟(1),直至得到所有的分量。
由此,原始時序信號x(n)經(jīng)EMD分解為K個IMF分量ci(n)和1個剩余分量r(n),則x(n)可表示為:
式中:K為IMF分量個數(shù)。
1.2基于SE的時序信號分量重構(gòu)
EMD分解得到的模態(tài)函數(shù)數(shù)目較多且存在一定相關(guān)性,因此,為強化同類序列的典型特征并簡化后續(xù)信號分析的計算規(guī)模,本文采用SE度量各子序列的復(fù)雜度,并將各子序列合并重構(gòu)為趨勢分量、細(xì)節(jié)分量和隨機分量。
SE是由學(xué)者Richman提出的一種時序數(shù)據(jù)復(fù)雜度量化指標(biāo),其中,時序數(shù)據(jù)的樣本嫡越小,表明時序數(shù)據(jù)的復(fù)雜度越小:時序數(shù)據(jù)的樣本嫡越大,表明時序數(shù)據(jù)的復(fù)雜度越大。
SE具體步驟如下:
(1)將經(jīng)EMD分解得到的分量序列:(n)構(gòu)成一組m維的向量序列Zm(1),Zm(2),…,Zm(i),…,Zm(N-m+1)。其中,Zm(i)={:(i),:(i+1),…,:(i+m-1)},1≤i≤N-m+1,N為分量序列的數(shù)據(jù)點數(shù)。
(2)定義向量Zm(i)和Zm(j)間的距離為:
式中:1≤j≤N-m+1且j≠i:0≤a≤m-1。
(3)設(shè)定相似容限1,統(tǒng)計向量Zm(i)和Zm(j)間距離小于1的個數(shù)與距離總數(shù)N-m的比值:
(4)求上述比值的平均值:
(5)將序列維度由m維改為m+1維,重復(fù)步驟(1)~(4),計算得到Bm+1(1)。
(6)當(dāng)N為有限值時,樣本嫡為:
其中,m和1常取值2和0.2std,std為時序標(biāo)準(zhǔn)差。
若分量的樣本嫡數(shù)值接近,則表示分量相關(guān)性高、融合性好,其產(chǎn)生信號新模式的概率基本一致,由此,依據(jù)嫡值數(shù)量級將各分量合并重構(gòu)。其中,樣本嫡為0.01數(shù)量級的分量合并為趨勢分量,樣本嫡為0.1數(shù)量級的分量合并為細(xì)節(jié)分量,樣本嫡為1數(shù)量級的分量合并為隨機分量。
式中:7為趨勢分量:D為細(xì)節(jié)分量:R為隨機分量。
子序列合并重構(gòu)后,可強化同類序列的典型特征。其中,趨勢分量7波動平緩,反映時間序列的整體趨勢特征,具有較小的復(fù)雜度:細(xì)節(jié)分量D波動規(guī)律,反映時間序列的局部細(xì)節(jié)特征:隨機分量R波動隨機,反映時間序列的隨機波動特征,具有較大的復(fù)雜度。
由此,基于多分辨率分析將原始時序信號分解為趨勢、細(xì)節(jié)和隨機三類分量,實現(xiàn)從不同層次細(xì)化信號多尺度特征。
2基于多分辨率分析的改進K-means聚類
2.1K-means聚類
K-means聚類算法利用距離測度度量樣本間相似性,并將樣本分為k個簇。其中,簇內(nèi)樣本間呈現(xiàn)較高的相似性,而不同簇樣本間呈現(xiàn)較低的相似性。K-means算法流程如下:
(1)在樣本集中隨機選取k個初始聚類中心。
(2)計算所有樣本與k個聚類中心的距離,將各樣本歸于距離最小的聚類中心所在簇。
(3)所有樣本完成分簇后,令各簇內(nèi)樣本均值為新聚類中心,完成各聚類中心的更新:
式中:μi為簇Ci的聚類中心:x為樣本。
(4)重復(fù)步驟(2)(3),直至誤差函數(shù)收斂,則算法流程結(jié)束:
式中:E為聚類平方誤差。
2.2基于多分辨率分析的改進K-means聚類
K-means聚類算法效果受初始聚類中心的影響大,隨機設(shè)置初始聚類中心難以保證聚類結(jié)果的有效性與穩(wěn)定性。此外,傳統(tǒng)相似性測度僅從整體上度量樣本間相似度,不具備多分辨率分析和多尺度特征刻畫能力,難以體現(xiàn)樣本局部細(xì)節(jié)特征的影響。針對上述問題,本文提出一種基于多分辨率分析的改進K-means聚類算法。
2.2.1初始聚類中心設(shè)置
本文研究低壓用戶與臺變連接關(guān)系辨識,因此,可將聚類類別數(shù)設(shè)為待分析臺變數(shù),初始聚類中心設(shè)為各臺變電壓。
2.2.2多分辨率距離和相似性測度
令電壓序列樣本x的趨勢分量、細(xì)節(jié)分量和隨機分量分別為7x、Dx和Rx,則重構(gòu)分量矩陣Mx可表示為:
式中:7jx、Djx和Rjx分別為7x、Dx和Rx的第j個元素。
綜合考慮趨勢分量、細(xì)節(jié)分量和隨機分量的多尺度特征,提出多分辨率距離和多分辨率相似性測度以全面度量電壓時間序列間的相似性。
2.2.2.1多分辨率距離測度
在計算樣本x和N的距離時,綜合考慮多分量特征計算樣本間距離,得到樣本x和N的多分辨率距離計算公式為:
式中:7jN、DjN和RjN分別為電壓序列樣本N的趨勢分量、細(xì)節(jié)分量和隨機分量的第j個元素。
2.2.2.2多分辨率相似性測度
基于矩陣相似度原理,綜合考慮多分量特征計算樣本間的相似度,得到樣本x和N的多分辨率相似度計算公式為:
式中:yxN為樣本x和N的多分辨率相似度:rx(i,j)和rN(i,j)分別為矩陣Mx和MN中i行j列的元素:rEQ \* jc3 \* hps11 \o\al(\s\up 3(和rEQ \* jc3 \* hps11 \o\al(\s\up 3(分別為矩陣Mx和MN中i行的平均值。
3算法流程
本文所提基于多分辨率分析的配網(wǎng)臺區(qū)戶變關(guān)系辨識法的算法流程如下:
步驟1:提取低壓用戶電能表電壓數(shù)據(jù)和臺變低壓側(cè)電壓數(shù)據(jù),將各電壓序列樣本值減去樣本平均值,完成數(shù)據(jù)中心化處理。
步驟2:利用EMD提取電壓序列數(shù)據(jù)的IMF分量和剩余分量,并基于SE重組得到趨勢分量、細(xì)節(jié)分量和隨機分量。
步驟3:初始化改進K-means聚類算法參數(shù),聚類類別數(shù)k取待分析臺變數(shù),以各臺變低壓側(cè)三相電壓平均值為初始聚類中心。
步驟4:由式(l5)計算出各用戶與k個聚類中心的電壓時序數(shù)據(jù)多分辨率距離,將用戶歸類于距離最小的聚類中心所在簇。
步驟5:各用戶完成類別劃分后,令各簇樣本的均值為新聚類中心,并利用EMD和SE分解重組得到新聚類中心的趨勢分量、細(xì)節(jié)分量和隨機分量。
步驟6:重復(fù)步驟4、5,直至誤差函數(shù)收斂,則算法流程結(jié)束,完成戶變關(guān)系辨識。
若采用多分辨率相似性測度,則將步驟4改為:由式(16)計算出各用戶與k個聚類中心的電壓時序數(shù)據(jù)多分辨率相似度,將用戶歸類于相似度最大的聚類中心所在簇。
4算例分析
本文選取廣東某地2個臺區(qū)的電壓時序數(shù)據(jù)開展算例分析。臺區(qū)A、B共有187個用戶,用戶電壓數(shù)據(jù)采樣頻率為1h/點,選取某4周共28天數(shù)據(jù)進行臺區(qū)戶變關(guān)系辨識。
4.1臺區(qū)戶變關(guān)系辨識
經(jīng)核查,臺區(qū)A、B的戶變關(guān)系信息正確。為了驗證所提戶變關(guān)系辨識法的計算效果,隨機抽取2個臺區(qū)共10個用戶,將其臺賬檔案調(diào)整至另一臺區(qū),并選擇8種方法分別進行配網(wǎng)臺區(qū)戶變關(guān)系辨識,對比不同方法的辨識效果。其中,方法1和方法2為基于K-means算法的戶變關(guān)系辨識法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法3和方法4為基于自動編碼器和K-means算法的戶變關(guān)系辨識法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法5和方法6為基于t分布隨機近鄰嵌入和K-means算法的戶變關(guān)系辨識法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法7和方法8為基于多分辨率分析和K-means算法的戶變關(guān)系辨識法,分別采用多分辨率距離和多分辨率相似度度量樣本相似性。8種方法辨識結(jié)果如表1所示。
觀察表1可知,方法3的辨識效果略優(yōu)于方法1、2,方法4、6的辨識效果優(yōu)于方法1、2,而方法7、8分別在基于距離和相似性測度的方法中辨識效果最優(yōu)。結(jié)果表明,在分析前對電壓時序數(shù)據(jù)進行特征預(yù)處理有助于提升戶變關(guān)系辨識效果,且基于多分辨率分析的辨識法綜合考慮不同分量的細(xì)節(jié)特征,可實現(xiàn)戶變關(guān)系有效辨識。此外,由于歐氏距離關(guān)注時序數(shù)據(jù)在特征空間的絕對距離,未能有效反映時序數(shù)據(jù)曲線的形態(tài)與波動情況,因此,基于歐氏距離的戶變關(guān)系辨識法計算效果整體劣于基于相似性測度的辨識法。
4.2數(shù)據(jù)長度對辨識效果的影響
為分析數(shù)據(jù)長度對戶變關(guān)系辨識效果的影響,分別抽取計算長度為1天、3天、7天、14天和21天的時序數(shù)據(jù),基于方法7和方法8開展配網(wǎng)臺區(qū)戶變關(guān)系辨識。不同時段的負(fù)荷特征不同,電壓時序數(shù)據(jù)特征存在差異,因此,采用滑動窗形式重復(fù)進行戶變關(guān)系辨識,統(tǒng)計分析數(shù)據(jù)長度對辨識效果的影響。
以數(shù)據(jù)長度7天為例說明計算方式,設(shè)定時間窗窗寬為7×24個數(shù)據(jù)點,以固定窗寬的滑動窗隨機抽取時序數(shù)據(jù)進行戶變關(guān)系辨識,重復(fù)50次統(tǒng)計辨識結(jié)果的平均值,結(jié)果如表2所示。
觀察表2可知,方法7的辨識準(zhǔn)確率隨數(shù)據(jù)長度的增加呈現(xiàn)先增大、后減小的特點,而方法8的辨識準(zhǔn)確率隨數(shù)據(jù)長度的增加而提高。上述結(jié)果與高維空間距離度量失效有關(guān),即多分辨率距離測度在高維空間無法準(zhǔn)確度量樣本距離。
由表1、表2可知,基于多分辨率相似度的戶變關(guān)系辨識法計算效果優(yōu)于基于多分辨率距離的戶變關(guān)系辨識法。
5結(jié)論
(1)在戶變關(guān)系分析前對電壓時序數(shù)據(jù)進行特征預(yù)處理有助于提升辨識效果,且多分辨率辨識法綜合考慮不同分量的細(xì)節(jié)特征,可實現(xiàn)戶變關(guān)系有效辨識。
(2)基于多分辨率相似度的戶變關(guān)系辨識法準(zhǔn)確率隨數(shù)據(jù)長度的增加而提高,而基于多分辨率距離的戶變關(guān)系辨識法在高維空間的準(zhǔn)確率降低。
(3)基于多分辨率相似度的戶變關(guān)系辨識法計算效果優(yōu)于基于多分辨率距離的戶變關(guān)系辨識法。