-
1)多层感知机原理
多层感知器(Multi-Layer Perceptron,MLP)为层级结构,包括输入层、隐含层和输出层。在MLP中,各层神经元节点之间通过一定的权重连接,每个节点的输入由连接到它的前面各个节点的输出加权确定(输入层除外)。引入激活函数,对隐藏层中各节点输入进行非线性变换。通过多层叠加,MLP可逼近任意连续函数,解决非线性回归问题。
MLP神经网络训练过程的目标是通过调整激活函数、训练函数、隐含层数、隐含层神经元数量等超参数,找到使损失函数最优的权值和阈值集。
2)预测评价指标
为定量检验MLP模型预测准确性,采用3种预测评价指标:平均绝对误差、平均绝对百分比误差与均方根误差。
(1)平均绝对误差(Mean Absolute Error,MAE)是用来比较预测值和真实值之间绝对偏离程度的指标,表示为式(1):
$$ {\mathrm{MAE}}=\dfrac{1}{N}\displaystyle \sum\limits _{i=1}^{N}\left|{P}_{{\mathrm{f}},t}-{P}_{{\mathrm{m}},t}\right| $$ (1) 式中:
$ {P}_{{\mathrm{f}},t} $ ——t时刻的用电负荷预测值;
$ {P}_{{\mathrm{m}},t} $ ——t时刻的用电负荷真实值;
N ——数据集样本数目。
(2)平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)是表征预测值与真实值之间相对偏离程度的指标,表示为式(2):
$$ {\mathrm{MAPE}}=\dfrac{1}{N}\displaystyle\sum\limits _{i=1}^{N}\left|\dfrac{{P}_{{\mathrm{f}},t}-{P}_{{\mathrm{m}},t}}{{P}_{{\mathrm{m}},t}}\right|\times 100\text{%} $$ (2) (3)均方根误差(Root Mean Squared Error,RMSE)是衡量预测值与真实值之间偏差离散程度的指标,表示为式(3):
$$ {\mathrm{RMSE}}=\sqrt{{\mathrm{MSE}}}=\sqrt{\frac{1}{N}\sum _{i=1}^{N}{\left({P}_{{\mathrm{f}},t}-{P}_{{\mathrm{m}},t}\right)}^{2}} $$ (3) -
经验模态分解(EMD)是一种针对非线性非平稳信号的时频分析方法,由黄锷等人提出。EMD理论认为任一复杂的时间信号是由若干个相互不同的本征模态函数(Intrinsic Mode Function,IMF)组成的,可采用一定的方法将复杂的时间信号分离成具有物理意义的从高频到低频的有限个独立分量,即基本时间信号。用电负荷时间序列可以看作是一种非平稳的信号,使用EMD将负荷分解成多个基本信号,并分别采用多个模型建模可获得更准确的负荷预测结果。
EMD过程中各个IMF需要具备以下2个要素:
1)在整个数据段内,极值个数与穿过时间轴的点个数相同或相差最多不超过1个。
2)在数据段任何一处,由局部极大、极小值点形成的包络线均值为0。
用电负荷时间序列采用EMD方法的分解过程如下:
首先,根据原始时间信号$ X\left(t\right) $的局部上、下极值点,得到$ X\left(t\right) $的上、下包络线。求上、下包络线的均值,得到均值线$ {m}_{1}\left(t\right) $。$ X\left(t\right) $与$ {m}_{1}\left(t\right) $相减,则得到:
$$ {h}_{1}\left(t\right)=X\left(t\right)-{m}_{1}\left(t\right) $$ (4) 判断$ {h}_{1}\left(t\right) $能否满足IMF所需满足的2项要求。若满足,则$ {h}_{1}\left(t\right) $就是第1阶IMF,若不满足,则以$ {h}_{1}\left(t\right) $为基础,重复上述操作,得到$ {h}_{1}\left(t\right) $的上、下包络线的均值线$ {m}_{1}^{1}\left(t\right) $。$ {h}_{1}\left(t\right) $减去$ {m}_{1}^{1}\left(t\right) $,得到式(5):
$$ {h}_{1}^{1}\left(t\right)={h}_{1}\left(t\right)-{m}_{1}^{1}\left(t\right) $$ (5) 此时,检验$ {h}_{1}^{1}\left(t\right) $可否满足IMF所需条件,若满足,则$ {h}_{1}^{1}\left(t\right) $成为第1阶IMF,若不满足,以$ {h}_{1}^{1}\left(t\right) $为基础,按上述方法重复k次,直到$ {h}_{1}^{k}\left(t\right) $满足IMF的条件为止。$ {h}_{1}^{k}\left(t\right) $由$ {h}_{1}^{k-1}\left(t\right) $与$ {h}_{1}^{k-1}\left(t\right) $上、下包络线的均值线$ {m}_{1}^{k}\left(t\right) $相减得到,表示为式(6):
$$ {h}_{1}^{k}\left(t\right)={h}_{1}^{k-1}\left(t\right)-{m}_{1}^{k}\left(t\right) $$ (6) 式中:
$ {h}_{1}^{k}\left(t\right) $ ——第1阶IMF,记作$ {c}_{1}\left(t\right) $,它包含着$ X\left(t\right) $中频率最高的成分。
从$ X\left(t\right) $中减去$ {c}_{1}\left(t\right) $,得到频率较低的残差为$ {r}_{1}\left(t\right) $,表示为式(7):
$$ {r}_{1}\left(t\right)=X\left(t\right)-{c}_{1}\left(t\right) $$ (7) 将$ {r}_{1}\left(t\right) $看成新的信号,按照上述操作,经过多次运算能够得到所有的$ {r}_{j}\left(t\right) $,表示为式(8):
$$ {r}_{j}\left(t\right)={r}_{j-1}\left(t\right)-{c}_{j}\left(t\right)(j=\mathrm{2,3},\cdots n) $$ (8) 当满足条件“$ {c}_{n}\left(t\right) $或$ {r}_{n}\left(t\right) $小于给定的误差”,或“残差$ {r}_{n}\left(t\right) $为单调函数,不能再从中提取IMF”时,EMD对时间序列的分解过程停止。$ X\left(t\right) $最终分解成式(9)形式:
$$ X\left(t\right)=\displaystyle\sum\limits _{j=1}^{n}{c}_{{{j}}}\left(t\right)+{r}_{n}\left(t\right) $$ (9) -
本文提出的基于多分量重构的EMD-MLP组合预测模型示意图如图1所示,包含数据分解、分量重构、特征选择、模型训练与测试步骤。
首先,采用EMD方法对原始用电负荷数据进行分解,形成多个本征模态分量($ {{\mathrm{IMF}}}_{1} $,$ {{\mathrm{IMF}}}_{2} $······$ {{\mathrm{IMF}}}_{N} $,残差)。传统采用EMD分解方法的预测模型对每一个分量分别预测,再将其结果叠加作为最终预测值。然而此方法存在一些问题,首先,对每个分量分别进行预测会导致建模计算量的增加;其次,对分量分别预测后进行叠加可能会引入预测误差的累积,从而限制了预测精度。
为解决这些问题,本文提出多分量重构手段,也即将经过EMD分解后的分量根据其平稳程度进行划分,并进行重构。具体而言,对各模态分量采用极值点划分法进行划分,对划分后的分量进行叠加重构,形成高频成分(High Frequency Component,HFC)与低频成分(Low Frequency Component,LFC)。
使用MLP模型对用电负荷数据中的高频与低频成分分别进行预测,建立的模型分别记为M-HFC,M-LFC。为了筛选出最优输入特征,采用皮尔逊相关系数法对候选特征进行分析。使用训练集对M-HFC,M-LFC分别进行训练调参,优化模型结构。最后,使用训练好的模型在测试集上对用电负荷数据的高频成分和低频成分分别预测。将M-HFC,M-LFC的预测结果$ {O}_{{\mathrm{H}}} $,$ {O}_{{\mathrm{L}}} $等权值求和,得到用电负荷预测值。
-
本研究使用的负荷数据集从南澳电力市场获取[41],时间范围为2018年1月1日至2018年12月31日,以及2019年1月1日至2019年12月31日,每步15 min(如图2、图3所示)。
图 2 2018年南澳用电负荷时间序列图
Figure 2. Time series of electrical load in South Australia in 2018 (step length: 15 min)
图 3 2019年南澳用电负荷时间序列图
Figure 3. Time series of electricity load in South Australia in 2019 (step length: 15 min)
基于2018年、2019年南澳原始负荷数据的EMD分解结果分别如图4、图5所示。
图 4 原始负荷序列的EMD分解结果(2018年南澳用电负荷数据集)
Figure 4. EMD decomposition results of original load series from South Australia in 2018
图 5 原始负荷序列的EMD分解结果(2019年南澳负荷数据集)
Figure 5. EMD decomposition results of original load series from South Australia in 2019
采用极值点划分法[42]对经EMD分解后的各个分解分量进行重构。该方法首先求出各IMF分量的极大、极小值个数,然后根据极值的个数对各IMF分量划分并重构。极值个数反映出分量的波动程度。基于极值点划分法将各分量重构为高、低频2个成分。表1给出了基于2018年、2019年南澳用电负荷数据得到的各分量极值点个数。选择一个合适的$ \rho $作为区分高、低频成分的阈值,本文选择$ \rho $=100。因此,基于2018年、2019年数据,得到各分量中的IMF1-IMF9重构后形成HFC,此成分波动频率较高,代表短期波动,IMF10-IMF15叠加重构为LFC,此成分波动频率较低,变化平缓,代表长期趋势。各分解分量的重构结果如图6、图7所示。
表 1 各分解分量极值点个数
Table 1. The number of extreme points of each component
2018年数据集 分量 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 极值个数 20609 12863 8176 5341 3023 1540 749 448 分量 IMF9 IMF10 IMF11 IMF12 IMF13 IMF14 残差 — 极值个数 202 94 49 20 11 3 1 — 2019年数据集 分量 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 极值个数 21609 13581 8397 4900 2446 1197 653 357 分量 IMF9 IMF10 IMF11 IMF12 IMF13 IMF14 残差 — 极值个数 162 84 38 21 8 3 1 — -
为了对d日t时刻用电负荷的高频、低频成分进行预测,首先分别选取他们的历史值作为候选输入特征[43-44],包含前1日(d−1)至前7日(d−7)同一时刻t的历史值(记为$ {x}_{t}^{d-1} $,$ {x}_{t}^{d-2} $,···,$ {x}_{t}^{d-7} $)。
此外,一些天气因素,例如空气温度,也能影响到用电负荷的大小。本文采用预测日d的日最高温度、日平均温度、日最低温度预测值(记为$ {T_{{\mathrm{max}}}}^{{{d}}} $,$ {T_{{\mathrm{ave}}}}^{{{d}}} $…,$ {T_{{\mathrm{min}}}}^{{{d}}} $)作为另一组候选输入特征。使用的气温数据与负荷时间范围相同,为2018年1月1日至2018年12月31日及2019年1月1日至2019年12月31日。日最高、日平均、日最低温度数据为每天记录一次。2018年与2019年的南澳州阿德莱德市温度时间序列如图8、图9所示。
对于候选特征,采用皮尔逊相关系数法进行最优输入特征的选取[45]。皮尔逊相关系数用于度量输入变量x和输出变量y之间的线性相关性,其值介于−1与1之间。两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商,表示为式(10)。当相关系数为1时,x和y完全正相关,当相关系数为−1时,x和y完全负相关。相关系数的绝对值越大,相关性越强;相关系数越接近于0,相关度越弱。相关系数位于0.7~1.0属于强相关,0.4~0.7为中等程度相关,0.2~0.4为弱相关,0.0~0.2为极弱相关或无相关。
$$ {r}_{x,y}=\dfrac{\mathrm{c}\mathrm{o}\mathrm{v}({x},{y})}{{\sigma }_{x}{\sigma }_{y}}=\dfrac{\dfrac{1}{n}\displaystyle\sum\limits _{i=1}^{n}({x}_{i}-\bar{x})({y}_{i}-\bar{y})}{\sqrt{\dfrac{1}{n}\displaystyle\sum\limits _{i=1}^{n}{({x}_{i}-\bar{x})}^{2}}\sqrt{\dfrac{1}{n}\displaystyle\sum\limits _{i=1}^{n}{({y}_{i}-\bar{y})}^{2}}} $$ (10) 式中:
$ {r}_{x,y} $ ——皮尔逊相关系数;
$ \mathrm{c}\mathrm{o}\mathrm{v}({x},{y}) $ ——x和y的协方差;
$ {\sigma }_{x} $ ——变量x的标准差;
$ {\sigma }_{y} $ ——变量y的标准差;
$ {x}_{i} $ ——第i个样本的输入变量;
$ \bar{x} $ ——输入变量x在全样本上的平均值;
$ {y}_{i} $ ——第i个样本的输出;
$ \bar{y} $ ——输出变量y在全样本上的平均值。
各候选特征与高频、低频成分间的相关性检验如表2所示。选取相关系数绝对值大于0.4的特征向量集合(加下划线标注),分别作为M-HFC与M-LFC的最优输入特征。
表 2 各候选特征与负荷高频、低频成分之间的相关系数(基于2018年、2019年南澳用电负荷数据训练集)
Table 2. Correlation coefficients between the candidate features and HFC, LFC (Based on the training data of South Australia electrical load in 2018 and 2019)
数据集 模型 $ {x}_{t}^{d-1} $ $ {x}_{t}^{d-2} $ $ {x}_{t}^{d-3} $ $ {x}_{t}^{d-4} $ $ {x}_{t}^{d-5} $ $ {x}_{t}^{d-6} $ $ {x}_{t}^{d-7} $ $ {T_{{\mathrm{max}}}}^{d} $ $ {T_{{\mathrm{ave}}}}^{d} $ $ {T_{{\mathrm{min}}}}^{d} $ 2018年 M-HFC 0.70 0.54 0.51 0.50 0.48 0.53 0.58 0.04 0.03 0.02 M-LFC 0.89 0.64 0.40 0.25 0.21 0.22 0.23 0.17 0.19 0.18 2019年 M-HFC 0.68 0.48 0.43 0.44 0.48 0.53 0.60 0.09 0.07 0.05 M-LFC 0.93 0.77 0.57 0.41 0.32 0.29 0.29 0.23 0.26 0.25 -
试验中采用了2份初始数据集,分别为2018年1月1日至2018年12月31日及2019年1月1日至2019年12月31日的南澳用电负荷及气温数据集。每份初始数据集划分为两个子数据集:前2/3初始数据集作为初始训练集,后1/3初始数据集作为测试集。初始训练集又进一步划分为训练集(前1/2初始训练集)与验证集(后1/2初始训练集),以确定预测模型超参数。测试集用来检测模型的泛化性能,不允许参与预测模型训练。
M-HFC与M-LFC的输入层、输出层神经元数目与相应训练集的输入、输出维数相等,根据表2,基于2018年数据训练集的模型M-HFC与M-LFC的输入层神经元个数为7和3,输出层神经元数目为1和1。基于2019年数据训练集的模型M-HFC与M-LFC的输入层神经元个数为7和4,输出层神经元数目为1和1。
M-HFC与M-LFC的最优超参数是通过在对应的训练集上训练得到的。需要调整的超参数有激活函数、训练函数、隐含层层数、隐含层神经元数目、学习速率、迭代次数、迭代目标。超参数的选取方法为,设定一个超参数调整范围/可选项,通过误差反馈迭代一定次数找到最优。MLP神经网络的可选激活函数包括对数S型函数,双曲正切函数,线性整流函数。可选用的训练函数包括小批量梯度下降法(Mini-Batch Gradient Descent,MBGD)、批量梯度下降法(Batch Gradient Descent,BGD,也叫最速梯度下降法)、随机梯度下降法(Stochastic Gradient Descent,SGD)、动态自适应学习率的梯度下降算法(Adaptive Gradient Descent,Adagad)等。隐含层数、隐含层神经元数目的调节范围分别为1~2与2~100,学习率调节范围为0.01~0.1,迭代次数调节范围是100~2 000,迭代目标调节范围为0.000 01~0.01。基于2018年、2019年数据集的M-HFC与M-LFC模型在相应训练集上的最优超参数如表3所示。
表 3 M-HFC与M-LFC在相应训练集上的最优超参数(基于2018年、2019年南澳用电负荷数据训练集)
Table 3. Optimal hyper-parameters of M-HFC and M-LFC (Based on the corresponding training data from South Australia electrical load in 2018 and 2019)
模型数据集 2018 2019 模型 M-HFC M-LFC M-HFC M-LFC 激活函数 Logistic Logistic Logistic Logistic 训练函数 Adagrad Adagrad Adagrad Adagrad 隐含层数 1 1 1 1 隐含层神经元数目 30 8 25 50 学习速率 0.1 0.1 0.4 0.1 迭代次数 600 1 000 800 500 迭代目标 0.004 0.004 0.01 0.004 为了验证本文提出的EMD-MLP组合模型预测性能,在数据集上建立另外3种模型,分别是持续性模型(PERSISTENCE)、单一MLP模型(MLP)与传统EMD组合模型(EMD-N)进行对比分析。持续性模型是最简单的预测模型,同时具有不错的预测性能,因而常常用作基准模型。持续性模型假设预测时刻的用电负荷$ {y}_{t} $与预测窗口L之前的用电负荷$ {\widehat{y}}_{t-{\mathrm{L}}} $相同,将$ {\widehat{y}}_{t-{\mathrm{L}}} $直接作为预测值,描述为式(11)。单一MLP模型不经过EMD分解,直接对用电负荷预测。传统EMD组合模型首先将用电负荷经EMD分解为多个分量,然后对各个分量分别预测,最后将所有分量的预测结果叠加作为用电负荷预测值。
$$ {\widehat{y}}_{t-{\mathrm{L}}}={y}_{t} $$ (11) 基于2018年、2019年南澳电力负荷数据测试集,本文提出的EMD-MLP组合模型与持续性模型、单一MLP模型、传统EMD组合模型的泛化误差箱型图如图10、图11所示。结果显示,在4种模型中,EMD-MLP模型的预测误差不仅平均值更低,分布也更集中,表明本文提出的EMD-MLP组合模型不仅可提高预测准确度,也具有更好的稳定性。图12、图13为基于4种预测模型的用电负荷预测值与真实值在局部测试集上的对比图,该图也显示EMD-MLP组合模型预测值与真实值更贴近。
图 10 绝对百分比误差(APE),绝对误差(AE)与平方误差(SE)的箱型图(2018年)
Figure 10. Boxplots of APE, AE and SE based on the test dataset in 2018
图 11 绝对百分比误差(APE),绝对误差(AE)与平方误差(SE)的箱型图(2019年)
Figure 11. Boxplots of APE, AE and SE based on the test dataset in 2019
图 12 4种模型负荷预测值与真实值对比(2018年部分测试集:2018年11月1~10日)
Figure 12. Comparison of forecasted and actual values of load regarding the four models (part of the test dataset in 2018: Nov, 1, 2018 ~ Nov, 10, 2018)
图 13 4种模型负荷预测值与真实值对比(2019年部分测试集:2019年11月11~20日)
Figure 13. Comparison of forecasted and actual values of load regarding the four models (part of the test dataset in 2019: Nov, 11, 2019 ~ Nov, 20, 2019)
对误差箱型图10和图11中的绝对百分比误差、绝对误差在全测试样本上取平均值,对平方误差在全测试样本上取平均值再开方,得到4种模型(EMD-MLP组合模型、持续性模型、单一MLP模型、传统EMD组合模型)的MAPE、MAE、RMSE3个误差指标的结果。基于2018年、2019年数据测试集,这些误差指标结果如图14所示。对于持续性模型,在2018年、2019年的数据集上,MAPE分别为12.98%与15.68%,MAE分别为148.5 MW与173.7 MW,RMSE分别为207.1 MW与271.2 MW。而单一MLP模型在这两个数据集上的MAPE、MAE和RMSE分别降至12.52%、137.6 MW、187.8 MW以及14.68%、151.0 MW、206.7 MW。这证明采用多影响因素作为输入的MLP相比简单的持续性模型可以提高预测精度,表明了采用MLP建模的必要性。
图 14 4种模型在南澳电力负荷不同数据测试集上的预测误差(2018年和2019年)
Figure 14. Forecast errors of the four models based on the test data of South Australia electrical load in 2018 and 2019
相比单一MLP模型,EMD-N和EMD-MLP模型进一步提高了预测效果,表明将EMD分解与MLP结合进行预测的性能更具优越性。而与传统的EMD组合模型相比,本文提出的EMD-MLP组合模型预测精度更高。在2018年和2019年的数据集上,MAPE、MAE和RMSE分别进一步降低至10.60%、119.8 MW、157.3 MW和12.37%、132.1 MW、179.5 MW。因此,本文提出的将EMD与MLP结合的新方法通过将EMD分量重构后进行预测,避免了传统EMD组合预测方法中误差累加的问题,有效提高了预测精度。同时,本章提出的方法相比传统EMD组合预测方法,能够实现数据压缩,极大地降低了计算量,提高了预测效率。
为了验证所提出模型的鲁棒性,选取另一场景下,即塔斯马尼亚电力市场2018年、2019年的用电负荷数据进行模拟。相应的用电负荷数据展示于附图S1、附图S2,空气温度数据展示于附图S3、附图S4。基于相应训练数据集选取出的模型最优输入特征见附表S1。经过训练后模型的最优超参数见附表S2。各模型在相应测试数据集上的泛化误差列于表4。结果显示,基于多分量重构的EMD-MLP组合模型相比其他基线模型在MAPE、MAE和RMSE上都表现出更好的泛化性能。
表 4 各模型在塔斯马尼亚电力市场2018年和2019年用电负荷数据测试集上的泛化误差
Table 4. Forecast errors of different models on the test dataset of electrical load in Tasmania electricity market in 2018 and 2019
数据集 模型 MAPE/% MAE/MW RMSE/MW 2018年 PERSISTENCE 7.50 82.95 104.87 MLP 6.65 72.73 91.84 EMD-N 5.89 64.54 82.76 EMD-MLP 4.61 50.19 62.60 2019年 PERSISTENCE 8.18 84.58 108.15 MLP 7.42 75.62 96.44 EMD-N 6.50 66.99 86.25 EMD-MLP 5.13 52.41 67.79 图 S1 2018年塔斯马尼亚用电负荷时间序列图
Figure S1. Time series of electrical load in Tasmania in 2018 (step length: 15 min)
图 S2 2019年塔斯马尼亚用电负荷时间序列图
Figure S2. Time series of electrical load in Tasmania in 2019 (step length: 15 min)
表 S1 各候选特征与负荷高频、低频成分之间的相关系数(基于2018年、2019年塔斯马尼亚负荷数据训练集)
Table S1. Correlation coefficients between the candidate features and HFC, LFC (based on the training data of Tasmania electrical load in 2018 and 2019)
数据集 模型 $ {x}_{t}^{d-1} $ $ {x}_{t}^{d-2} $ $ {x}_{t}^{d-3} $ $ {x}_{t}^{d-4} $ $ {x}_{t}^{d-5} $ $ {x}_{t}^{d-6} $ $ {x}_{t}^{d-7} $ $ {T_{\mathrm{max}}}_{t}^{d} $ $ {T_{\mathrm{ave}}}_{t}^{d} $ $ {T_{\mathrm{min}}}_{t}^{d} $ 2018 M-HFC 0.78 0.70 0.68 0.67 0.64 0.68 0.71 0.12 0.09 0.10 M-LFC 0.90 0.90 0.90 0.89 0.89 0.89 0.88 0.49 0.48 0.43 2019 M-HFC 0.75 0.64 0.64 0.64 0.61 0.64 0.67 0.36 0.31 0.30 M-LFC 0.90 0.89 0.88 0.87 0.85 0.83 0.81 0.64 0.77 0.68 表 S2 基于2018年、2019年塔斯马尼亚负荷数据训练集的模型M-HFC与M-LFC的最优超参数
Table S2. Optimal hyper-parameters of M-HFC and M-LFC based on the training dataset of Tasmania electrical load in 2018 and 2019
模型数据集 2018年 2019年 模型 M-HFC M-LFC M-HFC M-LFC 激活函数 Logistic Logistic Logistic Logistic 训练函数 MBGD MBGD MBGD MBGD 隐含层数 1 1 1 1 隐含层神经元数目 8 6 9 5 学习速率 0.01 0.1 0.001 0.1 迭代次数 400 1 200 700 900 迭代目标 0.004 0.004 0.01 0.004 综上所述,本文提出的将EMD与MLP结合的新方法有效提高了预测精度,并且在不同数据集上具有鲁棒性,在用电负荷预测领域具有一定的使用价值与应用潜力。
Day-Ahead Forecast of Electrical Load Based on EMD-MLP Combination Model
-
摘要:
目的 用电负荷的精准预测是电力系统运行优化的基础,是电力系统能量管理中不可或缺的组成部分。针对传统数据分解技术与机器学习模型结合预测存在的精准度低、计算量大等问题,提出一种将经验模态分解与多层感知机结合(EMD-MLP)的新方法对用电负荷进行日前预测。 方法 首先基于EMD将原始负荷时间序列信号分解为多个本征模函数(Intrinsic Mode Function,IMF)分量,然后采用极值点划分法将多IMF分量进行重构形成高频和低频两个成分以精简预测对象,最后对重构的新分量分别建模预测,并将它们的预测结果叠加作为用电负荷预测值。 结果 采用澳大利亚电力市场2018年、2019年的实测用电负荷数据进行试验。 结论 将建立的EMD-MLP组合模型与持续性模型、单一MLP模型以及传统EMD组合模型进行外推预测效果的对比,验证了所建模型在提高预测精度上的有效性。此外,所提出的EMD-MLP组合新方法在保证精度的同时简化了模型复杂度,提高了预测效率,可以方便地应用于实际中的用电负荷日前与实时预测。 Abstract:Introduction Accurate load forecasting underpins the operation optimization of the electricity systems and is an indispensable aspect of energy management within such systems. Given the low accuracy and high computational complexity inherent in traditional methodologies that combine data decomposition and machine learning models, this study proposes a novel Empirical Mode Decomposition and Multi-Layer Perceptron (EMD-MLP) model for predicting day-ahead electrical load. Method Initially, the EMD method decomposed the original load time series into multiple Intrinsic Mode Function (IMF). These IMFs were then reconstructed into high-frequency and low-frequency components using extreme point partitioning, simplifying the prediction target. Subsequently, each reconstructed components was modeled separately for prediction, and the results were cumulatively used to provide the forecasted electrical load value. Result The proposed model is tested using real-world electrical load data of 2018 and 2019 from the Australian electricity market. Conclusion Comparing the extrapolative capabilities of our EMD-MLP model with persistence model, standalone MLP model and traditional EMD ensemble model confirms the effectiveness of our model in enhancing prediction accuracy. Moreover, while ensuring accuracy, the proposed EMD-MLP model simplifies the complexity and improves the efficiency of the forecasting process, thereby providing a practical solution for both day-ahead and real-time electrical load forecasting. -
表 1 各分解分量极值点个数
Tab. 1. The number of extreme points of each component
2018年数据集 分量 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 极值个数 20609 12863 8176 5341 3023 1540 749 448 分量 IMF9 IMF10 IMF11 IMF12 IMF13 IMF14 残差 — 极值个数 202 94 49 20 11 3 1 — 2019年数据集 分量 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 极值个数 21609 13581 8397 4900 2446 1197 653 357 分量 IMF9 IMF10 IMF11 IMF12 IMF13 IMF14 残差 — 极值个数 162 84 38 21 8 3 1 — 表 2 各候选特征与负荷高频、低频成分之间的相关系数(基于2018年、2019年南澳用电负荷数据训练集)
Tab. 2. Correlation coefficients between the candidate features and HFC, LFC (Based on the training data of South Australia electrical load in 2018 and 2019)
数据集 模型 $ {x}_{t}^{d-1} $ $ {x}_{t}^{d-2} $ $ {x}_{t}^{d-3} $ $ {x}_{t}^{d-4} $ $ {x}_{t}^{d-5} $ $ {x}_{t}^{d-6} $ $ {x}_{t}^{d-7} $ $ {T_{{\mathrm{max}}}}^{d} $ $ {T_{{\mathrm{ave}}}}^{d} $ $ {T_{{\mathrm{min}}}}^{d} $ 2018年 M-HFC 0.70 0.54 0.51 0.50 0.48 0.53 0.58 0.04 0.03 0.02 M-LFC 0.89 0.64 0.40 0.25 0.21 0.22 0.23 0.17 0.19 0.18 2019年 M-HFC 0.68 0.48 0.43 0.44 0.48 0.53 0.60 0.09 0.07 0.05 M-LFC 0.93 0.77 0.57 0.41 0.32 0.29 0.29 0.23 0.26 0.25 表 3 M-HFC与M-LFC在相应训练集上的最优超参数(基于2018年、2019年南澳用电负荷数据训练集)
Tab. 3. Optimal hyper-parameters of M-HFC and M-LFC (Based on the corresponding training data from South Australia electrical load in 2018 and 2019)
模型数据集 2018 2019 模型 M-HFC M-LFC M-HFC M-LFC 激活函数 Logistic Logistic Logistic Logistic 训练函数 Adagrad Adagrad Adagrad Adagrad 隐含层数 1 1 1 1 隐含层神经元数目 30 8 25 50 学习速率 0.1 0.1 0.4 0.1 迭代次数 600 1 000 800 500 迭代目标 0.004 0.004 0.01 0.004 表 4 各模型在塔斯马尼亚电力市场2018年和2019年用电负荷数据测试集上的泛化误差
Tab. 4. Forecast errors of different models on the test dataset of electrical load in Tasmania electricity market in 2018 and 2019
数据集 模型 MAPE/% MAE/MW RMSE/MW 2018年 PERSISTENCE 7.50 82.95 104.87 MLP 6.65 72.73 91.84 EMD-N 5.89 64.54 82.76 EMD-MLP 4.61 50.19 62.60 2019年 PERSISTENCE 8.18 84.58 108.15 MLP 7.42 75.62 96.44 EMD-N 6.50 66.99 86.25 EMD-MLP 5.13 52.41 67.79 S1 各候选特征与负荷高频、低频成分之间的相关系数(基于2018年、2019年塔斯马尼亚负荷数据训练集)
S1. Correlation coefficients between the candidate features and HFC, LFC (based on the training data of Tasmania electrical load in 2018 and 2019)
数据集 模型 $ {x}_{t}^{d-1} $ $ {x}_{t}^{d-2} $ $ {x}_{t}^{d-3} $ $ {x}_{t}^{d-4} $ $ {x}_{t}^{d-5} $ $ {x}_{t}^{d-6} $ $ {x}_{t}^{d-7} $ $ {T_{\mathrm{max}}}_{t}^{d} $ $ {T_{\mathrm{ave}}}_{t}^{d} $ $ {T_{\mathrm{min}}}_{t}^{d} $ 2018 M-HFC 0.78 0.70 0.68 0.67 0.64 0.68 0.71 0.12 0.09 0.10 M-LFC 0.90 0.90 0.90 0.89 0.89 0.89 0.88 0.49 0.48 0.43 2019 M-HFC 0.75 0.64 0.64 0.64 0.61 0.64 0.67 0.36 0.31 0.30 M-LFC 0.90 0.89 0.88 0.87 0.85 0.83 0.81 0.64 0.77 0.68 S2 基于2018年、2019年塔斯马尼亚负荷数据训练集的模型M-HFC与M-LFC的最优超参数
S2. Optimal hyper-parameters of M-HFC and M-LFC based on the training dataset of Tasmania electrical load in 2018 and 2019
模型数据集 2018年 2019年 模型 M-HFC M-LFC M-HFC M-LFC 激活函数 Logistic Logistic Logistic Logistic 训练函数 MBGD MBGD MBGD MBGD 隐含层数 1 1 1 1 隐含层神经元数目 8 6 9 5 学习速率 0.01 0.1 0.001 0.1 迭代次数 400 1 200 700 900 迭代目标 0.004 0.004 0.01 0.004 -
[1] 吴亚雄, 谢敏. 基于BP神经网络灰色回归组合模型的年最大负荷预测 [J]. 南方能源建设, 2017, 4(2): 46-50, 57. DOI: 10.16516/j.gedi.issn2095-8676.2017.02.007. WU Y X, XIE M. Annual peak load forecasting based on combination model of back propagation neural network and grey regression [J]. Southern energy construction, 2017, 4(2): 46-50, 57. DOI: 10.16516/j.gedi.issn2095-8676.2017.02.007. [2] 李彬, 白雪峰, 王京菊, 等. 新型电力负荷管理系统发展的关键支撑技术研究 [J]. 内蒙古电力技术, 2023, 41(2): 1-6. DOI: 10.19929/j.cnki.nmgdljs.2023.0018. LI B, BAI X F, WANG J J, et al. Research on key supporting technology for development of new power load management system [J]. Inner Mongolia electric power, 2023, 41(2): 1-6. DOI: 10.19929/j.cnki.nmgdljs.2023.0018. [3] 孙玉芹, 王亚文, 朱威, 等. 基于考虑气温影响的门限自回归移动平均模型居民日用电负荷预测 [J]. 电力建设, 2022, 43(9): 117-124. DOI: 10.12204/j.issn.1000-7229.2022.09.012. SUN Y Q, WANG Y W, ZHU W, et al. Residential daily power load forecasting based on threshold ARMA model considering the influence of temperature [J]. Electric power construction, 2022, 43(9): 117-124. DOI: 10.12204/j.issn.1000-7229.2022.09.012. [4] 赵爽, 阮俊枭, 支刚, 等. 考虑尖峰负荷特性指标的用户用电行为分析 [J]. 内蒙古电力技术, 2022, 40(5): 39-45. DOI: 10.19929/j.cnki.nmgdljs.2022.0079. ZHAO S, RUAN J X, ZHI G, et al. Analysis of power consumption behavior of users considering peak load characteristic indicators [J]. Inner Mongolia electric power, 2022, 40(5): 39-45. DOI: 10.19929/j.cnki.nmgdljs.2022.0079. [5] DORDONNAT V, KOOPMAN S J, OOMS M, et al. An hourly periodic state space model for modelling French national electricity load [J]. International journal of forecasting, 2008, 24(4): 566-587. DOI: 10.1016/j.ijforecast.2008.08.010. [6] PAPALEXOPOULOS A D, HESTERBERG T C. A regression-based approach to short-term system load forecasting [J]. IEEE transactions on power systems, 1990, 5(4): 1535-1547. DOI: 10.1109/59.99410. [7] VÄHÄKYLA P, HAKONEN E, LÉMAN P. Short-term forecasting of grid load using Box-Jenkins techniques [J]. International journal of electrical power & energy systems, 1980, 2(1): 29-34. DOI: 10.1016/0142-0615(80)90004-6. [8] CHEN J F, WANG W M, HUANG C M. Analysis of an adaptive time-series autoregressive moving-average (ARMA) model for short-term load forecasting [J]. Electric power systems research, 1995, 34(3): 187-196. DOI: 10.1016/0378-7796(95)00977-1. [9] MBAMALU G A N, EL-HAWARY M E. Load forecasting via suboptimal seasonal autoregressive models and iteratively reweighted least squares estimation [J]. IEEE transactions on power systems, 1993, 8(1): 343-348. DOI: 10.1109/59.221222. [10] TARSITANO A, AMERISE I L. Short-term load forecasting using a two-stage sarimax model [J]. Energy, 2017, 133: 108-114. DOI: 10.1016/j.energy.2017.05.126. [11] HUANG S R. Short-term load forecasting using threshold autoregressive models [J]. IEE proceedings-generation, transmission and distribution, 1997, 144(5): 477-481. DOI: 10.1049/ip-gtd:19971144. [12] ROMAN-PORTABALES A, LOPEZ-NORES M, PAZOS-ARIAS J J. Systematic review of electricity demand forecast using ANN-based machine learning algorithms [J]. Sensors, 2021, 21(13): 4544. DOI: 10.3390/s21134544. [13] CHEN H, WAN Q L, ZHANG B, et al. Short-term load forecasting based on asymmetric ARCH models [C]//Anon. IEEE PES General Meeting, Minneapolis, July 25-29, 2010. Minneapolis: IEEE, 2010: 1-6. DOI: 10.1109/PES.2010.5590185. [14] HOR C L, WATSON S J, MAJITHIA S. Daily load forecasting and maximum demand estimation using ARIMA and GARCH [C]//Anon. 2006 International Conference on Probabilistic Methods Applied to Power Systems, Stockholm, June 11-15, 2006. Stockholm: IEEE, 2006: 1-6. DOI: 10.1109/PMAPS.2006.36023. [15] LIU H P, SHI J. Applying ARMA-GARCH approaches to forecasting short-term electricity prices [J]. Energy economics, 2013, 37: 152-166. DOI: 10.1016/j.eneco.2013.02.006. [16] CORBA B S, EGRIOGLU E, DALAR A Z. AR-ARCH type artificial neural network for forecasting [J]. Neural processing letters, 2020, 51(1): 819-836. DOI: 10.1007/s11063-019-10117-6. [17] 鲍海波, 吴阳晨, 张国应, 等. 基于特征加权Stacking集成学习的净负荷预测方法 [J]. 电力建设, 2022, 43(9): 104-116. DOI: 10.12204/j.issn.1000-7229.2022.09.011. BAO H B, WU Y C, ZHANG G Y, et al. Net load forecasting method based on feature-weighted stacking ensemble learning [J]. Electric power construction, 2022, 43(9): 104-116. DOI: 10.12204/j.issn.1000-7229.2022.09.011. [18] 郑侃, 魏煜锋, 文智胜, 等. 基于BP神经网络方法的风电场风速插补分析应用 [J]. 南方能源建设, 2021, 8(1): 51-55. DOI: 10.16516/j.gedi.issn2095-8676.2021.01.007. ZHENG K, WEI Y F, WEN Z S, et al. Analysis and application of wind speed interpolation in wind farm based on BP neural network method [J]. Southern energy construction, 2021, 8(1): 51-55. DOI: 10.16516/j.gedi.issn2095-8676.2021.01.007. [19] RAHMAN S, BHATNAGAR R. An expert system based algorithm for short term load forecast [J]. IEEE transactions on power systems, 1988, 3(2): 392-399. DOI: 10.1109/59.192889. [20] YINSHENG S, CHUNXIAO L, BAO L, et al. Principal component analysis of short-term electric load forecast data based on grey forecast [J]. Journal of physics: conference series, 2020, 1486(6): 062031. DOI: 10.1088/1742-6596/1486/6/062031. [21] PANDIAN S C, DURAISWAMY K, RAJAN C C A, et al. Fuzzy approach for short term load forecasting [J]. Electric power systems research, 2006, 76(6-7): 541-548. DOI: 10.1016/j.jpgr.2005.09.018. [22] 王克杰, 张瑞. 基于改进BP神经网络的短期电力负荷预测方法研究 [J]. 电测与仪表, 2019, 56(24): 115-121. DOI: 10.19753/j.issn1001-1390.2019.024.019. WANG K J, ZHANG R. Research on short-term power load forecasting method based on improved BP neural network [J]. Electrical measurement & instrumentation, 2019, 56(24): 115-121. DOI: 10.19753/j.issn1001-1390.2019.024.019. [23] 张静, 石鑫. 基于改进MOPSO-BP算法的短期电力负荷预测研究 [J]. 电力学报, 2019, 34(6): 556-563. DOI: 10.13357/j.cnki.jep.002844. ZHANG J, SHI X. Short-term power load forecasting based on improved MOPSO-BP algorithm [J]. Journal of electric power, 2019, 34(6): 556-563. DOI: 10.13357/j.cnki.jep.002844. [24] LIANG Y, NIU D X, HONG W C. Short term load forecasting based on feature extraction and improved general regression neural network model [J]. Energy, 2019, 166: 653-663. DOI: 10.1016/j.energy.2018.10.119. [25] 刘岩, 彭鑫霞, 郑思达. 基于改进LS-SVM的短期电力负荷预测方法研究 [J]. 电测与仪表, 2021, 58(5): 176-181. DOI: 10.19753/j.issn1001-1390.2021.05.026. LIU Y, PENG X X, ZHENG S D. Research on short-term power load forecasting method based on improved LS-SVM [J]. Electrical measurement & instrumentation, 2021, 58(5): 176-181. DOI: 10.19753/j.issn1001-1390.2021.05.026. [26] RYU S, NOH J, KIM H. Deep neural network based demand side short term load forecasting [J]. Energies, 2017, 10(1): 3. DOI: 10.3390/en10010003. [27] KONG W C, DONG Z Y, JIA Y W, et al. Short-term residential load forecasting based on LSTM recurrent neural network [J]. IEEE transactions on smart grid, 2019, 10(1): 841-851. DOI: 10.1109/TSG.2017.2753802. [28] SUN G P, JIANG C W, WANG X, et al. Short‐term building load forecast based on a data‐mining feature selection and LSTM‐RNN method [J]. IEEJ transactions on electrical and electronic engineering, 2020, 15(7): 1002-1010. DOI: 10.1002/tee.23144. [29] 彭文, 王金睿, 尹山青. 电力市场中基于Attention-LSTM的短期负荷预测模型 [J]. 电网技术, 2019, 43(5): 1745-1751. DOI: 10.13335/j.1000-3673.pst.2018.1554. PENG W, WANG J R, YIN S Q. Short-term load forecasting model based on attention-LSTM in electricity market [J]. Power system technology, 2019, 43(5): 1745-1751. DOI: 10.13335/j.1000-3673.pst.2018.1554. [30] 陆继翔, 张琪培, 杨志宏, 等. 基于CNN-LSTM混合神经网络模型的短期负荷预测方法 [J]. 电力系统自动化, 2019, 43(8): 131-137. DOI: 10.7500/AEPS20181012004. LU J X, ZHANG Q P, YANG Z H, et al. Short-term load forecasting method based on CNN-LSTM hybrid neural network model [J]. Automation of electric power systems, 2019, 43(8): 131-137. DOI: 10.7500/AEPS20181012004. [31] HE F F, ZHOU J Z, FENG Z K, et al. A hybrid short-term load forecasting model based on variational mode decomposition and long short-term memory networks considering relevant factors with Bayesian optimization algorithm [J]. Applied energy, 2019, 237: 103-116. DOI: 10.1016/j.apenergy.2019.01.055. [32] BAHRAMI S, HOOSHMAND R A, PARASTEGARI M. Short term electric load forecasting by wavelet transform and grey model improved by PSO (Particle Swarm Optimization) algorithm [J]. Energy, 2014, 72: 434-442. DOI: 10.1016/j.energy.2014.05.065. [33] GHASEMI A, SHAYEGHI H, MORADZADEH M, et al. A novel hybrid algorithm for electricity price and load forecasting in smart grids with demand-side management [J]. Applied energy, 2016, 177: 40-59. DOI: 10.1016/j.apenergy.2016.05.083. [34] LI S, GOEL L, WANG P. An ensemble approach for short-term load forecasting by extreme learning machine [J]. Applied energy, 2016, 170: 22-29. DOI: 10.1016/j.apenergy.2016.02.114. [35] FAN X Q, ZHU Y L. The application of empirical mode decomposition and gene expression programming to short-term load forecasting [C]//Anon. Sixth International Conference on Natural Computation, Yantai, August 10-12, 2010. Yantai: IEEE, 2010: 4331-4334. DOI: 10.1109/ICNC.2010.5583605. [36] 李秀昊, 刘怀西, 张智勇, 等. 基于VMD-LSTM的超短期风向多步预测 [J]. 南方能源建设, 2023, 10(1): 29-38. DOI: 10.16516/j.gedi.issn2095-8676.2023.01.004. LI X H, LIU H X, ZHANG Z Y, et al. Very short-term wind direction multistep forecast based on VMD-LSTM [J]. Southern energy construction, 2023, 10(1): 29-38. DOI: 10.16516/j.gedi.issn2095-8676.2023.01.004. [37] 孔祥玉, 李闯, 郑锋, 等. 基于经验模态分解与特征相关分析的短期负荷预测方法 [J]. 电力系统自动化, 2019, 43(5): 46-52. DOI: 10.7500/AEPS20180404008. KONG X Y, LI C, ZHENG F, et al. Short-term load forecasting method based on empirical mode decomposition and feature correlation analysis [J]. Automation of electric power systems, 2019, 43(5): 46-52. DOI: 10.7500/AEPS20180404008. [38] 邓带雨, 李坚, 张真源, 等. 基于EEMD-GRU-MLR的短期电力负荷预测 [J]. 电网技术, 2020, 44(2): 593-602. DOI: 10.13335/j.1000-3673.pst.2019.0113. DENG D Y, LI J, ZHANG Z Y, et al. Short-term electric load forecasting based on EEMD-GRU-MLR [J]. Power system technology, 2020, 44(2): 593-602. DOI: 10.13335/j.1000-3673.pst.2019.0113. [39] 梁智, 孙国强, 李虎成, 等. 基于VMD与PSO优化深度信念网络的短期负荷预测 [J]. 电网技术, 2018, 42(2): 598-606. DOI: 10.13335/j.1000-3673.pst.2017.0937. LIANG Z, SUN G Q, LI H C, et al. Short-term load forecasting based on VMD and PSO optimized deep belief network [J]. Power system technology, 2018, 42(2): 598-606. DOI: 10.13335/j.1000-3673.pst.2017.0937. [40] 刘雨薇. 基于VMD和改进LSTM的短期电力负荷预测研究 [D]. 武汉: 湖北工业大学, 2020. DOI: 10.27131/d.cnki.ghugc.2020.000099. LIU Y W. Research on short-term power load forecasting based on VMD and improved LSTM [D]. Wuhan: Hubei University of Technology, 2020. DOI: 10.27131/d.cnki.ghugc.2020.000099. [41] AEMO. Australian energy market operator electricity price & demand [EB/OL]. https://www.aemo.com.au/. [42] 杨茂, 陈郁林. 基于EMD分解和集对分析的风电功率实时预测 [J]. 电工技术学报, 2016, 31(21): 86-93. DOI: 10.3969/j.issn.1000-6753.2016.21.010. YANG M, CHEN Y L. Real-time prediction for wind power based on EMD and set pair analysis [J]. Transactions of China electrotechnical society, 2016, 31(21): 86-93. DOI: 10.3969/j.issn.1000-6753.2016.21.010. [43] RAZA M Q, KHOSRAVI A. A review on artificial intelligence based load demand forecasting techniques for smart grid and buildings [J]. Renewable and sustainable energy reviews, 2015, 50: 1352-1372. DOI: 10.1016/j.rser.2015.04.065. [44] KUSTER C, REZGUI Y, MOURSHED M. Electrical load forecasting models: a critical systematic review [J]. Sustainable cities and society, 2017, 35: 257-270. DOI: 10.1016/j.scs.2017.08.009. [45] 严雪颖, 秦川, 鞠平, 等. 负荷功率模型的最优特征选择研究 [J]. 电力工程技术, 2021, 40(3): 84-91. DOI: 10.12158/j.2096-3203.2021.03.013. YAN X Y, QIN C, JU P, et al. Optimal feature selection of load power models [J]. Electric power engineering technology, 2021, 40(3): 84-91. DOI: 10.12158/j.2096-3203.2021.03.013.