-
不同的序列输入长度对模型的预测结果有一定的影响。模型输入的序列长度过短,难以表征序列特征,降低模型预测的准确率;输入序列过长导致信息冗余,降低模型的建模效率。本文采用自相关函数计算前
$ k $ 个时刻($ k > 0 $ )的风向$ {x}_{t-k} $ 与当前时刻的风向$ {x}_{t} $ 之间的相关性,以选取最佳的风向序列输入长度。自相关函数(Autocorrelation Function, ACF)用于度量同一事件在不同时期之间的相关性程度。对于时间序列
$ \left\{ {{X_t}} \right\} $ ,ACF度量时间序列中每隔$ k $ 个时间单位($ {x}_{t} $ 和$ {x}_{t-k} $ )的观测值之间的相关性,计算公式如下:$$ {\rm{ACF}} = \dfrac{{\displaystyle \sum\limits_{t = k + 1}^n {\left( {{x_t} - \bar x } \right)\left( {{x_{t - k}} - \bar x } \right)} }}{{\displaystyle \sum\limits_{i = 1}^n {{{\left( {{x_t} - \bar x } \right)}^2}} }} $$ (1) 式中:
$ \bar{x} $ ——变量$ x $ 的平均值。如图2所示,横坐标表示时间滞后长度,纵坐标表示滞后为
$ k $ 个时刻的风向序列与当前序列的相关性。本文计算了72个样本点的相关性,随着$ k $ 的增大,历史风向与当前风向的相关性逐渐减弱,当$k > 35 \nwarrow $ 时其自相关系数小于0.6。为了兼顾模型的预测精度与效率,选择自相关系数大于0.6的序列。此外,输入序列长度应不少于预测序列长度,本文中预测未来4 h的风向,即输入序列长度应不少于24个样本点。因此,本文选取自相关系数大于0.6的前24个采样点的风向作为模型的输入序列。 -
变分模态分解(Variational Mode Decomposition, VMD)是一种完全内在、自适应、非递归的信号分解技术[13],通过求解约束变分问题,将信号转换到频域内分解为K个有限带宽的本征模函数(Intrinsic Mode Function, IMF),这种方法可以有效避免经验模态分解(Empirical Mode Decomposition, EMD)和局部均值分解(Local Mean Decomposition, LMD),在分解中由于递归分解模式所造成的包络线估计误差,具备强大的非线性和非平稳性信号处理能力,相比于EMD和集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)等信号分解方法,它在解决信号噪声和避免模态混叠的问题上有显著优势。但VMD分解的IMF子模态数K对分解结果有很大的影响:当K太小时,分解后的序列会丢失过多信息从而导致模态混叠;当K太大时,会出现过度分解的问题。
为了评估序列数据的复杂性,Richman和Moornan等[14]提出样本熵(Sample Entropy, SE),通过度量信号中产生新模式的概率大小来衡量时间序列的复杂性,时间序列越复杂,样本熵的值越大。
针对风向数据波动性、随机性的特点,本文采用VMD对风向序列进行分解,得到多个稳定的子信号,通过最小SE值对VMD进行优化[15],以获取合适的K值。
-
长短期记忆(Long Short-Term Memory, LSTM)是一种特殊的循环神经网络(Recurrent Neural Network, RNN),主要为了解决长序列训练过程中的梯度消失和梯度爆炸问题[16]。相比于RNN,LSTM能够在更长的序列中有更好的表现。LSTM由多个单元组成,每个LSTM单元包括3个门控系统和1个记忆单元,具体为:
遗忘门:
$$ {F_t} = {\rm{sigmoid}}({w_{{\rm{xf}}}}{x_t} + {w_{{\rm{hf}}}}{h_{t - 1}} + {b_{\rm{f}}}) $$ (2) 输入门:
$$ {I_t} = {\rm{sigmoid}}({w_{{\rm{xi}}}}{x_t} + {w_{{\rm{hi}}}}{h_{t - 1}} + {b_{\rm{i}}}) $$ (3) 输出门:
$$ {O_t} = {\rm{sigmoid}}({w_{{\rm{xo}}}}{x_t} + {w_{{\rm{ho}}}}{h_{t - 1}} + {b_{\rm{o}}}) $$ (4) 记忆单元状态值:
$$ {C_t} = {C_{t - 1}} \otimes {F_t} + {I_t} \otimes \tan h \left( {{w_{{\rm{xc}}}}{x_t} + {w_{{\rm{hc}}}}{h_{t - 1}} + {b_{\rm{c}}}} \right) $$ (5) LSTM记忆单元在
$t$ 时刻的输出:$$ {h_t} = {O_t} \otimes \tan h ({C_t}) $$ (6) 式(2)~式(6)中,
$w\left( {{F_t},{I_t},{O_t},{C_t}} \right)$ 和$b\left( {{F_t},{I_t},{O_t},{C_t}} \right)$ 为三个门控单元和记忆单元的权重和偏置值。本文采用两层的LSTM网络挖掘风向时序序列的深层特征,每层的神经元个数为100,学习率为0.001,优化器为Adam,迭代次数为10,激活函数为ReLU,如图3所示。
-
本文采用明阳智能某风电场数据采集与监视控制系统(SCADA)提供的2021年风向数据。风向数据来源于3个风力发电机(1#、2#、3#),时间粒度为10 min,按季度分为4组。为保证时间样本的顺序性,使用样本总量前70%的序列作为训练集,后30%的时间序列作为测试集,具体如表1所示。
数据集 数据来源 训练集数量 测试集数量 A 2021/03/01 00:00-2021/03/31 23:50 3 125 1 339 B 2021/06/01 00:00-2021/06/30 23:50 3 024 1 296 C 2021/09/01 00:00-2021/09/30 23:50 3 024 1 296 D 2021/12/01 00:00-2021/12/31 23:50 3 125 1 339 Table 1. Dataset information
根据GB/T 37523-2019[17]对风向数据进行合理范围筛选,剔除异常数据值,使用滑动平均法对缺失数据进行插补;采用最大-最小归一化方法对风向数据进行处理,将风向数据映射到[0,1]内,归一化计算如下:
$$ {y_t}' = \dfrac{{{y_t} - {y_{\min }}}}{{{y_{\max }} - {y_{\min }}}} $$ (7) 式中:
${y_t}'$ ——$t$ 时刻归一化后的风向数据;${y_t}$ ——$t$ 时刻的原始风向数据;${y_{\max }}$ ——风向序列的最大值;${y_{\min }}$ ——风向序列的最小值。 -
本文采用绝对平均误差(Mean Absolute Error, MAE)、均方根误差(Root Mean Square Error, RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)作为评价指标,衡量预测值与真实值的偏离程度、评价数据的变化程度、定量评价预测模型,其表达式分别为:
$$ {\rm{MAE}} = \dfrac{1}{n}\displaystyle \sum\limits_{i = 1}^n {\left| {{y_{{\rm{true}}}} - {y_{{\rm{pre}}}}} \right|} $$ (8) $$ {\rm{RMSE}} = \sqrt {\dfrac{1}{n}\displaystyle \sum\limits_{i = 1}^n {{{\left( {{y_{{\rm{true}}}} - {y_{{\rm{pre}}}}} \right)}^2}} } $$ (9) $$ {\rm{MAPE}} = \dfrac{1}{n}\displaystyle \sum\limits_{i = 1}^n {\left| {\dfrac{{{y_{{\rm{true}}}} - {y_{{\rm{pre}}}}}}{{{y_{{\rm{true}}}}}}} \right|} $$ (10) 式中:
${y_{{\rm{true}}}}$ ——真实值;${y_{{\rm{pre}}}}$ ——预测值;$n$ ——样本个数。 -
本文算法流程图如图4所示。
具体步骤如下:
1) 采集风向序列并对其进行预处理。
2) 绘制风向玫瑰图,分析风向特征。
3) 基于ACF计算风向不同时期之间的相关性,选取自相关系数大于0.6的前24个采样点的风向作为模型的输入序列。
4) 采用VMD将风向序列分解为相对稳定的模态信号,通过最小样本熵确定分解的子模态数K。
5) 对分解后的K个模态信号分别建立预测模型,进行超短期风向多步预测。
6) 重构风向序列,叠加各分量预测结果。
-
VMD分解的子模态数K直接决定了风向信号分解的好坏,对预测结果有一定的影响。本文利用VMD对风向数据进行分解得到K个IMF,计算每个IMF的SE值,以获得具有最小SE的序列作为趋势项,通过对比不同K值的最小SE值以确定子模态数。本文令K取值为2~10,如图5显示了在取不同K值时最小SE值和预测绝对平均误差的变化趋势。
由图5可知,随着VMD分解的子模态数
$K$ 的增加,最小样本熵的值减小,风向预测模型的绝对平均误差MAE减小,并且两者衰减的变化趋势基本保持一致,表明最小样本熵的值能够有效地表征信号分解能力。当子模态数$K$ 较小时,原始风向信号分解不足,序列趋势项中混入了其他干扰项,使得SE值较大。随着$K$ 值的增大,SE值逐渐变小,当取得适当的$K$ 值时,SE值骤减,此时再增大分解次数$K$ ,SE值变化较小,并且逐渐趋于稳定。因此,将SE骤减趋于稳定的转折点作为VMD分解的次数,以避免过度分解。在本文中,取K=9,即利用VMD将原始风向信号分解为9个子序列,如图6所示。 -
为验证VMD分解对预测结果的影响,进行VMD分解前后对比算法建模预测结果的比较。由表2、图7和图8可知,VMD-LSTM在4个季度的24步风向预测的平均MAE、RMSE、MAPE为8.430°、16.870°、9.155,比未分解的LSTM模型平均减少77.91%、69.30%、69.42%,因此,VMD将原始风向序列分解为相对稳定的模态信号,可以有效地降低风向的非线性、非平稳性和随机性,提高风向序列预测的准确性。
预测步长 第1季度 第2季度 第3季度 第4季度 MAE/(°) RMSE/(°) MAPE MAE/(°) RMSE/(°) MAPE MAE/(°) RMSE/(°) MAPE MAE/(°) RMSE/(°) MAPE 1 7.782 15.445 8.137 6.693 11.632 4.704 5.358 8.772 8.772 4.592 15.097 4.983 2 7.712 15.325 8.045 6.549 11.404 4.601 5.316 8.682 8.682 4.553 14.926 4.934 3 7.711 15.338 8.012 6.449 11.315 4.505 5.306 8.571 8.571 4.532 14.730 4.872 4 7.644 15.251 7.912 6.744 11.858 4.688 5.331 8.598 8.598 4.478 14.443 4.788 5 7.674 15.323 7.939 7.353 12.969 4.997 5.460 8.766 8.766 4.421 14.229 4.755 6 7.618 15.312 7.969 7.579 13.206 5.208 5.641 8.991 8.991 4.500 14.472 4.872 7 7.747 15.730 8.152 7.829 13.502 5.413 5.911 9.361 9.361 4.775 15.188 5.213 8 8.140 16.657 8.501 8.085 13.950 5.658 5.855 9.425 9.425 5.127 16.167 5.637 9 8.810 17.957 9.252 8.231 14.118 5.785 6.003 9.750 9.750 5.620 17.848 6.211 10 9.280 18.590 9.591 8.229 14.233 5.793 6.194 10.156 10.156 6.220 19.691 6.790 11 9.842 19.332 10.309 8.355 14.464 5.853 6.494 10.685 10.685 6.736 21.455 7.257 12 10.591 20.647 11.152 8.317 14.432 5.796 6.891 11.286 11.286 7.031 22.352 7.520 13 11.968 23.267 12.449 8.427 14.814 5.864 7.263 11.836 11.836 7.292 22.568 7.639 14 12.890 25.433 13.383 8.610 15.168 6.013 7.977 12.848 12.848 7.674 22.968 7.936 15 13.059 25.331 13.584 8.704 15.388 6.141 7.883 12.827 12.827 8.146 23.452 8.423 16 14.072 26.942 14.886 9.034 15.901 6.422 8.045 13.036 13.036 8.627 24.461 8.829 17 13.607 25.731 14.647 9.428 16.464 6.762 8.462 13.613 13.613 8.440 23.332 8.432 18 13.042 24.306 14.045 10.186 17.584 7.312 8.601 13.710 13.710 8.534 22.889 8.355 19 13.098 24.205 14.089 10.055 17.285 7.258 8.578 13.823 13.823 8.918 23.067 8.585 20 13.292 24.449 14.198 10.285 17.626 7.453 8.756 14.300 14.300 8.786 21.985 8.495 21 13.740 25.289 14.883 10.783 18.253 7.772 9.182 15.181 15.181 8.954 22.006 8.740 22 13.757 25.237 14.869 10.628 18.060 7.722 9.662 16.071 16.071 9.087 21.890 8.988 23 13.977 25.423 15.135 10.412 17.667 7.644 10.011 16.600 16.600 9.457 22.350 9.440 24 13.755 25.003 14.834 10.342 17.657 7.651 10.421 17.371 17.371 10.029 23.166 9.975 Table 2. Wind direction multistep forecast results based on VMD-LSTM
预测误差随着预测时间的增加而累加,进而导致误差逐步增大,LSTM模型平均每步误差增长约为1.26°,VMD-LSTM模型误差稳步增长,增长幅度较小,平均每步误差增长约为0.29°,说明VMD-LSEM模型可以有效地降低误差的增长速度,稳定误差增长幅度。
-
不同的预测方法对超短期风向多步预测有一定的影响。本文基于不同季度的风向分别构建ARMA、RF、VMD-RF、LSTM、VMD-LSTM模型。
由表3和图9可知,VMD-LSTM在每个季度的各个误差评价指标均优于其他算法。VMD-LSTM模型较表现次好的VMD-RF模型,其平均MAE、RMSE、MAPE分别减少37.19%、23.80%、26.85%。通过不同建模算法的试验,结果表明,VMD-LSTM在不同季度下的风向具有更高的准确性和较好的预测能力。此外,VMD-LSTM和VMD-RF比未分解的模型LSTM和RF的MSE分别降低了77.91%和57.86%,说明经过分解后的建模精度有较大幅度的提高,VMD在提取风向趋势信息方面具有较好的能力。
预测模型 季度 MAE/(°) RMSE/(°) MAPE ARMA 1 18.171 36.762 21.131 2 21.636 37.293 15.900 3 14.183 25.072 15.230 4 8.774 27.975 9.853 RF 1 33.897 52.224 30.148 2 28.189 45.544 19.395 3 18.734 28.462 19.032 4 46.554 56.749 56.749 VMD-RF 1 16.130 27.310 17.054 2 12.909 20.421 9.514 3 10.786 16.021 11.003 4 13.857 24.802 12.495 LSTM 1 41.677 61.162 34.512 2 38.968 59.598 28.449 3 23.140 33.851 22.536 4 48.877 65.171 34.266 VMD-LSTM 1 10.867 20.897 11.499 2 8.638 14.956 6.126 3 7.275 11.844 11.844 4 6.939 19.780 7.153 Table 3. Wind direction forecast results of different methods
-
为检验该方法对不同风机的风向预测效果,本文对比分析了同一风场1#、2#、3#号风机,绝对平均误差MAE见表4。
风机 第1季度 第2季度 第3季度 第4季度 合计 1# 14.595 8.349 8.492 9.865 10.325 2# 13.345 8.231 9.750 8.927 10.063 3# 12.390 8.954 10.808 8.934 10.271 Table 4. MAE of wind direction forecast for different wind turbines
(°) 虽然1#、2#、3#号风机同处一风场,但受风机排布位置及尾流的影响,导致不同风机在每个季度的预测结果也有所差异,但不同风机的预测总体误差差距较小,说明VMD-LSTM可适用于同一风场不同风机的预测,具有良好的泛化能力。
Very Short-Term Wind Direction Multistep Forecast Based on VMD-LSTM
doi: 10.16516/j.gedi.issn2095-8676.2023.01.004
- Received Date: 2022-06-23
- Rev Recd Date: 2022-08-02
- Available Online: 2022-12-01
- Publish Date: 2023-01-11
-
Key words:
- wind direction /
- multistep forecast /
- Variational Mode Decomposition(VMD) /
- Sample Entropy(SE) /
- Long Short-Term Memory(LSTM)
Abstract:
Citation: | LI Xiuhao, LIU Huaixi, ZHANG Zhiyong, ZHANG Min, WU Di, MIAO Desheng. Very Short-Term Wind Direction Multistep Forecast Based on VMD-LSTM[J]. SOUTHERN ENERGY CONSTRUCTION, 2023, 10(1): 29-38. doi: 10.16516/j.gedi.issn2095-8676.2023.01.004 |