-
EEMD算法与EMD算法大致相同:给定原始信号x(t),通过将x(t)引入白噪声,采用EMD算法对引入白噪声的原始信号进行多次分解,将分解后的IMF向量和剩余分量求其平均。EEMD算法基本步骤[25]如下:
1)确定好已初始化的EMD算法迭代次数M和第m次实验和加入白噪声n(t)后的信号y(t):
$$ y(t)=x(t)+n(t) $$ (1) 2)对y(t)信号进行EMD分解,得出各阶IMF分量和一个剩余分量:
$$ y\left(t\right)=\displaystyle \sum\limits _{i=1}^{m}{c}_{i}+{r}_{n} $$ (2) 3)若m<M时,m=m+1。重复式(1)、式(2),对原始信号x(t)加入不同白噪声ni(t)后得到各个IMF分量和各个剩余分量。不满足则执行式(4)。加不同白噪声后的信号:
$$ {y}_{i}\left(t\right)=\sum _{j=1}^{m}{c}_{{i},{j}}+{r}_{n} $$ (3) IMF分量ci, m(t)以及剩余分量rn, m(t)分别为:
$$ c_{{i}, {m}({t})}=h_{{j}, {m}({t})}, r_{{n}, {m}({t})}=r_{{n}-1, {~m}({t})}-{c}_{{n}, {m}({t})} $$ 4)经过M次EMD分解,对各阶IMF分量和剩余分量求整体平均值得:
$$ \overline{{{c}}_{{i}}}\left({t}\right)=\displaystyle \sum\limits _{{m}=1}^{{M}}{{c}}_{{i},{m}}\left({t}\right)/{M},\overline{{{r}}_{{n}}}\left({t}\right)=\displaystyle \sum\limits _{{m}=1}^{{M}}{{r}}_{{n},{m}}\left({t}\right)/{M} $$ (4) 输出的$\overline{{{c}}_{{i}}}\left({t}\right)$和$\overline{{{r}}_{{n}}}\left({t}\right)$分别为各阶IMF分量和剩余分量。
BP方法(Back-Propagation)也叫误差反向传播算法,是一种具有3层或3层以上的前馈神经网络,BP神经网络有1个输入层,1个或多个隐含层和1个输出层,上下层之间的各神经元实现全连接,具体算法参考文献[11]的研究。
基于气象因子的EEMD-BP用电量预测模型的研究思路:首先将用电量序列采用EEMD方法进行分解,获得多个本征模函数(IMF)和残差;将本征模函数按高频分量、周期分量及低频分量采用BP神经网络分别构建不同的IMF和残差的预测模型,其中低频分量中叠加气象因子;最后,将BP模型预测的结果进行累加即可得到最终的预测用电量。
本文所用的电力数据为国家电网华中分部调度控制中心提供的华中某市2017年逐日用电量数据。气象数据时段同为2017年,要素包括逐日的平均温度、最高温度、最低温度、降水量、相对湿度、气压、风速等,国家气象观测站包括华中某市下辖的各县(市),数据来源于湖北省气象信息与技术保障中心。最终以各县(市)国家气象观测站不同要素的算术平均表征该市的气象要素值。用电量和气象数据均经过严格的质量控制。
-
以华中某市2017年逐日电网用电量为初始序列,加入该序列标准偏差0.01倍振幅的白噪声进行EMD分解,得到8个IMF,每次都增加同样振幅但数值不同的白噪声序列重复上述过程100次,最后将100次结果相应的IMF各自集合平均得到8个IMF及余项,结果如图1所示。可以看出,频率依次减小,周期逐渐增大,平稳性得到改善。IMF1~IMF2叠加代表随机分量,表现出较强的非平稳性;IMF3~IMF5叠加代表周期分量;IMF6~IMF8及剩余项叠加为趋势分量,平稳性和规律性增强。
随机分量是分解后高频部分的总和,体现了用电量变化的随机性,该部分很难建立模型进行预测,属于不可预测分量。周期分量反映了用电量周、月、季节为周期变化的分量,在预测中可直接外推,属于稳定分量成分。趋势分量是低频分量的总和,反映了气象因素等慢变相关因素对用电量的影响,该部分属于可预测分量,可以通过建立合适的模型进行预测。
为分析用电量不同频域分量与气象因子的关系,表1给出了气象因子同用电量分解后各IMF及余项的相关系数统计。可以看出,用电量实况值与逐日平均气温、最高气温和最低气温存在显著的正相关,相关系数分别为0.47、0.47和0.45,均通过信度为0.01的显著性检验,与气压存在显著的负相关、相关系数为−0.4;而与降水等级、相对湿度和风速的相关并不明显。
分量类型 序列 平均气温/℃ 最高气温/℃ 最低气温/℃ 降水等级 气压/hPa 相对湿度/% 风速/(m·s−1) — 原始序列 0.47** 0.47** 0.45** −0.10 −0.40** 0 −0.10 高频分量 IMF1 0.06 0.05 0.03 0.00 0.00 0.00 −0.18** IMF2 0.01 0.01 0.00 0.00 0.05 0.00 −0.10 — IMF3 0.22** 0.21** 0.20** −0.10 −0.20** 0.10 0.01 周期分量 IMF4 0.14* 0.15* 0.14* −0.10 −0.20** −0.10 −0.10 IMF5 −0.20** −0.20** −0.30** −0.20** 0.19** −0.40** 0.00 — IMF6 0.33** 0.29** 0.39** 0.07 −0.30** 0.36** 0.04 低频分量 IMF7 0.32** 0.26** 0.37** 0.06 −0.10 0.14* 0.03 IMF8 0.88** 0.86** 0.89** 0.17* −0.80** 0.47** −0.10 — 余项 0.40** 0.42** 0.39** 0.11 −0.60** 0.37** 0.00 注:*表示通过信度为0.01的显著性检验;**表示通过信度为0.001的显著性检验。降水等级分级:无雨为0;0.1~9.9 mm为1;10.0~24.9 mm为2;25.0~49.9 mm为3;50 mm以上为4。 Table 1. Correlation coefficients of meteorological factors with IMF and residuals
高频分量中,IMF1和IMF2分量与各气象因子没有相关关系,仅与风速要素存在明显的负相关。周期分量中IMF3~IMF4与用电量实况序列的特征比较一致,与平均气温、最高气温、最低气温存在正相关,与气压存在负相关,相关系数明显减小,但均通过了显著性检验;与降水等级、相对湿度和风速的关系并不密切。IMF5分量与温度、降水等级、相对湿度呈显著负相关,而与气压呈显著正相关。低频分量IMF6~IMF8和余项除与平均气温、最高气温、最低气温存在显著的正相关、与气压存在显著的负相关之外,与相对湿度也存在明显的正相关,IMF8分量与气象因子的相关关系较其他序列明显提高,相关系数分别为0.88、0.86、0.89、−0.80、0.47,均通过了信度为0.01的显著性检验。因此,在利用EEMD-BP建立预测模型时,选用相关性通过显著性检验的平均气温、最高气温、最低气温、气压和相对湿度这5个气象因子。
-
为检验预测模型的效果,首先对模型的回归效果进行分析。本文所构建的双隐含层BP神经网络模型,输入层为前1天用电量,输出层为当日用电量。BP-QX为叠加气象因子的神经网络模型,输入层除前1天的用电量,还包含了当日的平均气温、最高气温、最低气温、气压和相对湿度,输出层同为当日用电量。
图2给出了利用BP、BP-QX(叠加气象因子)和EEMD-BP、EEMD-BP-QX模型回归用电量序列。可以看出,利用BP、EEMD-BP模型回归得出的用电量序列可较好地拟合原始用电量序列,相关系数为0.94、0.98,但依然存在一定的误差;引进气象因子后,BP-QX、EEMD-BP-QX回归用电量序列与原始序列的相关性有所提高,分别为0.98、0.99,同时误差进一步缩小。
为了进一步分析不同预测方法及其叠加气象因子后回归效果,图3给出了模型回归不同误差区间的占比。利用BP模型回归得出的用电量与原始用电量之间误差在4%以内天数占全年的72.0%,其中误差在2%以内的占比为45.2%;误差在10%以上的占比为3.6%(图3(a))。全年回归用电量的平均绝对误差为3.2%,均方根误差为4.83;其中最大相对误差为27.3%,出现在8月8日。在BP回归模型的基础上,叠加气象因子之后的回归效果得到了改善,误差在4%以内的天数占全年的87.0%,较直接利用BP模型得出的相同误差占比提高了15.0%,其中误差在2%以内的占比提高了17.2%;而误差在10%以上的天数占比减小为0.6%。全年回归用电量的平均绝对误差在2.1%,均方根误差为2.82;其中最大误差为16.3%,出现在1月28日,而8月8日的相对误差减小为0.87%。通过对比发现,引进气象因子后,BP方法模拟得到的用电量有了较为明显的改进,但误差依然较大,很难满足用电量精细化预测的需求。
对比发现,利用EEMD-BP方法得出的回归序列与原电量序列的相对误差得到了明显的改进(图3(b))。绝对误差在0.4%之内的天数占全年的88.0%,其中误差在0.2%之内的天数占比为62.2%。绝对误差在1%以上的天数占比为2.4%,绝对偏差为0.22%,均方根误差为0.34,最大相对误差为2.25%。可见,EEMD-BP方法对用电量模拟的精度有了大幅提高,尤其是BP方法中误差较大的6月4日、8月8日、8月12日、8月29日,相对误差由原来的17.8%、27.3%、17.4%、26.2%减小至0.7%、−0.38%、−0.09%、0.12%。
在EEMD-BP方法的基础上,进一步分析了气象因子对用电量预测模型的影响。引进气象因子以后,相对误差有了明显的降低,尤其是在夏季和冬季,因为冬夏两个季节的气象条件对用电量的影响尤为明显。1月28日,EEMD-BP方法预测的用电量相对误差为2.25%,EEMD-BP-QX预测的用电量相对误差减小至1.81%,气象条件对用电量预报模型的影响一直持续到1月30日。绝对偏差、均方根误差和最大相对误差也有一定的减小。可见,气象条件对EEMD-BP用电量预测模型至关重要。
-
通过以上的分析,叠加了气象因子的EEMD-BP方法构建用电量预测模型可以有效地提高预测精度。为进一步分析EEMD-BP以及气象条件对用电量的预测效果,从BP和BP-QX的回归序列中,选取模拟相对误差>10%的日期为预测对象,共计14 d,具体日期选择如表2所示,剩余日期的用电量和气象因子为建模对象。具体方法选取模拟相对误差≤10%的日期构建双隐含层BP神经网络模型,输入层为前1天用电量和当日的平均气温、最高气温、最低气温、气压和相对湿度,输出层为当日用电量;在此神经网络模型的基础上,根据模拟相对误差>10%日期的前1天用电量和当日气象因子作为预报因子,预测当日的用电量。
日期 实际电量/
GWhBP预测电量/
GWh相对误差/
%BP-QX预测电量/
GWh相对误差/
%EEMD-BP预测电量/
GWh相对误差/
%EEMD-BP-QX预测电量/
GWh相对误差/
%0125 17.959 20.757 15.6 20.250 12.80+ 18.056 0.50 17.997 0.21+ 0128 15.224 18.406 20.9 18.934 24.30 15.499 1.82 15.361 0.91+ 0501 18.211 19.224 5.6 17.429 −4.30+ 18.258 0.22 18.203 −0.04+ 0530 19.577 18.594 −5.0 19.801 1.10+ 19.603 0.13 19.618 0.21 0604 18.638 19.492 4.6 19.505 4.60 18.682 0.23 18.673 0.18+ 0703 25.584 18.857 −26.3 21.902 −14.30+ 25.528 −0.21 25.597 0.05+ 0709 20.798 25.535 22.8 21.612 3.90+ 20.753 −0.22 20.835 0.17+ 0803 29.987 20.917 −30.2 25.051 −16.50+ 30.916 3.10 30.042 0.18+ 0808 23.425 29.566 26.2 22.209 −5.20+ 23.419 −0.02 23.446 0.09 0812 22.596 23.372 3.4 22.498 −0.43+ 22.632 0.16 22.589 −0.03+ 0829 21.084 22.539 6.9 20.607 −2.30+ 21.037 −0.22 21.104 0.09+ 0910 19.551 21.176 8.3 20.151 3.10+ 19.609 0.30 19.603 0.26+ 1001 16.809 19.468 15.8 19.606 16.60 16.961 0.91 16.884 0.44+ 注:+表明叠加气象因子后相对误差减小。 Table 2. Statistics of power forecast (unit: 10 MWh) and relative error (%) by different models
从表2可以看出,利用BP回归模型预测的用电量与实况误差较大,8月3日预测用电量较实际用电量偏少了9071 MWh,8月8日预测电量则偏高了6142 MWh,相对误差范围在−30.2%~26.2%。引进气象因子后,除了1月28日(偏高528 MWh)、10月1日(偏高138 MWh)外,其他日期预测的用电量与实况的误差均有所减小,尤其是7月3日、7月9日、8月3日和8月8日,误差分别减小了3046 MWh、3923 MWh、4134 MWh和4926 MWh,相对误差分别减小了11.9%、18.9%、13.8%和21.0%。
利用EEMD-BP得出了预测误差有了明显的减小,除了1月28日(偏高275 MWh)、8月3日(偏高928 MWh)和10月1日(偏高153 MWh)偏差相对较大外,其他日期预测误差均在100 MWh内,相对误差控制在0.5%以内。引进气象因子后,使得预测电量与实况的误差有了进一步的减小,尤其是8月3日、1月28日,误差分别减小了873 MWh和138 MWh,预测相对误差分别由3.1%减小至0.41%、1.8%减小至0.9%。
为进一步比较不同模型对用电量预测准确率的影响,分析了不同方法之间对预测准确率的影响差异。相对BP模型,BP-QX模型提高幅度在1.34%~5.72%(除1月28日和10月1日);而7月3日、7月9日、8月3日和8月8日这4日预测准确率提升幅度尤为明显,分别达到16.15%、24.42%、19.76%和28.5%。EEMD-BP较BP和BP-QX而言,用电量的预测准确率均有所提高,1月25日、1月28日、7月3日、7月9日、8月3日、8月8日和10月1日这7天用电量的预测准确率均在10%以上,其中7月3日、7月9日、8月3日和8月8日这4日达到或超过30%。EEMD-BP-QX与EEMD-BP的结果比较类似,用电量的预测均高于BP和BP-QX;除了5月30日和8月8日预测准确率有微弱的减小,其他日期的用电量预测均高于EEMD-BP,其中8月3日和1月28日尤为明显,分别提高了3.01%和0.92%。
Application of EEMD-BP Method Based on Meteorological Factors in Grid Electricity Consumption Forecast
doi: 10.16516/j.ceec.2024.1.13
- Received Date: 2023-05-15
- Rev Recd Date: 2023-06-16
- Available Online: 2023-09-15
- Publish Date: 2024-01-10
-
Key words:
- ensemble empirical mode decomposition /
- electricity consumption /
- meteorological factors /
- refined forecast /
- regression model
Abstract:
Citation: | ZHANG Zhen, XIAO Ying, REN Yongjian, et al. Application of EEMD-BP method based on meteorological factors in grid electricity consumption forecast [J]. Southern energy construction, 2024, 11(1): 122-132 doi: 10.16516/j.ceec.2024.1.13 |