-
MSPC通常分为4个步骤,其流程如图1所示。
第1步,利用历史数据构建PCA模型对数据进行主成分分析,根据特征值的累计贡献率选出前k个主成分,实现数据降维。记过程变量向量的符号为$ {\boldsymbol{X}}=[{X}_{1},{X}_{2},\cdots ,{X}_{n}] $,XM中每一行是X的一个样本。为避免过程变量不同量纲对结果的影响和便于数学上的处理,首先对样本数据进行归一化处理。设X的均值向量为$ {{\boldsymbol{\mu}} }_{M}=[{\mu }_{1},{\mu }_{2},\cdots ,{\mu }_{n}] $,标准差向量为$ {{\boldsymbol{\sigma }}}_{M}=[{\sigma }_{1},{\sigma }_{2},\cdots ,{\sigma }_{n}] $, 则归一化后的过程变量为:
$$ {x}_{i}=\frac{{X}_{i}-{\mu }_{i}}{{\sigma }_{i}},i=\mathrm{1,2},\cdots ,n $$ 记归一化后的过程变量为$ {\boldsymbol{x}}=[{x}_{1},{x}_{2},\cdots ,{x}_{n}] $。同时,计算出x的均值向量和协方差矩阵分别为:
$$ {\boldsymbol{\mu}} =\left[{\mu }_{1},{\mu }_{2},\cdots ,{\mu }_{n}\right] $$ $$ {\boldsymbol{\varSigma}} =\left[\begin{array}{cccc}{e}_{11}& {e}_{12}& \cdots & {e}_{1n}\\ {e}_{21}& {e}_{22}& \cdots & {e}_{2n}\\ \vdots & \vdots & \ddots &\vdots \\ {e}_{n1}& {e}_{n2}& \cdots & {e}_{nn}\end{array}\right] $$ 其中,易得到$ {\mu }_{i}=0,{e}_{ii}=1,i=\mathrm{1,2},\cdots ,n $。对协方差矩阵Σ的n个特征值$ {\lambda }_{i} $及其对应的单位正交特征向量pi,其中$ {\lambda }_{i-1}\geqslant {\lambda }_{i}\geqslant 0 $。根据特征值的定义有:
$$ \boldsymbol{\varSigma}=p\lambda p^T $$ x的n个主成分定义为$ {t}_{i}=x{p}_{i}(i=\mathrm{1,2},\cdots ,n) $。由于过程变量之间存在高度相关性,用x的前k个主成分就能表示x中的大部分信息(如85%以上)。确定主成分的个数如下所示:
$$ \displaystyle \sum _{i=1}^{k}{\lambda }_{i}/\displaystyle \sum_{j=1}^{n}{\lambda }_{j}\geqslant \eta $$ 其中,$ \eta $表示设定的累计贡献率。
第2步,计算统计量SPE。基于PCA模型可得到估计向量$ \hat{\boldsymbol{x}}=xp_{\mathrm{t}}{p_\mathrm{t}}^T $,其中$ \boldsymbol{p}_{{\mathrm{t}}}=[{p}_{1},{p}_{2},\cdots ,{p}_{n}] $。而$ \boldsymbol{x}_{{\mathrm{e}}}=\boldsymbol{x}-\hat{\boldsymbol{x}} $为PCA模型的预测误差向量,也称为残差向量。SPE描述了实时数据X与建模数据集XM的统计差异,SPE的定义为:
$$ \mathrm{SPE}=\boldsymbol{x}_{\mathrm{e}}\boldsymbol{x}_{\mathrm{e}}^T $$ (1) 第3步,计算统计量控制限。统计量SPE的控制限计算公式如下:
$$ {Q}_{\alpha }={\theta }_{1}\left[ {\frac{{c}_{\alpha }{h}_{0}\sqrt{2{\theta }_{2}}}{{\theta }_{1}}+1+\frac{{\theta }_{2}\left({h}_{0}^{2}-{h}_{0}\right)}{{\theta }_{1}^{2}}} \right]^{\tfrac{1}{{h}_{0}}} $$ (2) 其中$ {h}_{0}=1-6{\theta }_{1}{\theta }_{3}{\theta }_{2}^{2} $为常数,$ {\theta }_{r}={\sum }_{j=k+1}^{n}{\lambda }_{j}^{r}(r=1,\mathrm{ }2,\mathrm{ }3) $,k为主成分分析过程中确定下来的主成分个数。ca为标准正态分布的置信极限,满足如下公式:
$$ P\left\{N\right(\mathrm{0,1}) > {N}_{{c}_{\alpha }}(\mathrm{0,1}\left)\right\}={c}_{\alpha } $$ 第4步,异常判断。如系统正常运行,则样本的SPE值满足$ \text{SPE} < {Q}_{\alpha } $,反之,可认为出现异常。
-
基于极值理论的POT方法可以自动为时间序列选择合适的阈值。此外,它不做任何关于数据分布的假设。通过带参数的广义帕累托分布GPD拟合概率分布的尾部。这种极端规律称为极值分布EVD,其形式如下:
$$ {G}_{\gamma }:x\mapsto \text{exp}(-(1+\gamma x{)}^{-\frac{1}{\gamma }}) $$ 其中,$ \gamma \in \mathbb{R},1+\gamma x > 0 $。通过将拟合到未知输入分布尾部,可以评估潜在极端事件的概率。特别是,从给定的概率q可以计算zq,使得$ P(\boldsymbol{X} > {z}_{q}) < q $。要解决这个问题,自然的方法是估计γ。POT方法的基本思想是:记Ft为超过阈值t的x分布,则条件变量分布函数可表示为:
$$ {F}_{t}\left(x\right)=P(\boldsymbol{X}-t > x丨\boldsymbol{X} > t) $$ 其中,X是随机变量。对于x > t,即随机变量超过阈值t时,近似遵循参数γ ,σ的广义帕累托分布GPD。当t极大时,$ {F}_{t}\left(y\right)\approx {G}_{\gamma ,\sigma }\left(y\right) $。由于POT方法尝试将GPD拟合到X-t,GPD分布的位置t参数可以省去。在得到估计值$ \hat{\gamma } $和$ \hat{\sigma } $的情况下,阈值zq可以通过如下公式计算得到:
$$ {z}_{q}\simeq t+\frac{\hat{\sigma }}{\hat{\gamma }}\left(\right(\frac{qn}{{N}_{t}}{)}^{-\hat{\gamma }}-1) $$ (3) 其中n是总的样本数,Nt是超过阈值t的样本数。一些经典方法可以用来进行γ和σ的估计,如矩量法或概率加权矩,以及效率和鲁棒性更好的极大似然估计。极值理论提供了一种估计阈值zq的方法,使得$ P(\boldsymbol{X} > {z}_{q}) < q $,而对样本X的分布没有任何的假设,也没有任何关于其分布的先验知。
-
对于n个观测值$ \boldsymbol{X}_{1},\cdots ,\boldsymbol{X}_{n} $和确定的风险值q,需要计算阈值zq满足$ P(\boldsymbol{X} > {z}_{q}) < q $。POT算法通过是设置一个高阈值t,得到超过阈值t的样本数据并对其拟合广义帕累托分布,从而得到极值的分布,并计算阈值zq。文章提出的SPE-POT算法尝试将MSPC方法中基于置信度的误差限引入到POT算法中的阈值t,对超出误差限的统计量拟合GPD分布,确定最终的阈值zq,实现异常检测,算法的流程图如图2所示。
算法首先通过历史正常数据构建PCA模型,根据设定的置信度cα和累计贡献率η计算出SPE值及其误差限,对超过Qα的SPE值拟合其GPD分布,最后根据风险值q确定最终阈值zq。在实时数据异常检测阶段,利用建立的PCA模型计算出其SPE值,根据该值与最终阈值zq的大小关系,给出数据是否异常。文章提出的方法包含三个参数,详细信息如表1所示。
表 1 SPE-POT方法的参数设置
Table 1. Parameter setting for the SPE-POT method
编号 参数 设定值 描述 1 cα 0.05 标准正态分布的置信极限 2 η 0.95 特征值累计贡献率 3 q 0.000 1 广义帕累托分布的概率 -
对方法的检测精度的评价指标[20]召回率R、准确率P和综合指标F1如公式4-6所示:
$$ R=\frac{{\text{TP}}}{{\text{TP}}+{\text{FN}}} $$ (4) $$ P=\frac{{\text{TP}}}{{\text{TP}}+{\text{FP}}} $$ (5) $$ {F}_{1}=\frac{2*P*R}{P+R} $$ (6) 式中:
TP ——正确检测的异常点的个数;
FN ——将异常点检测为正常点的个数;
FP ——将正常点检测为异常的点个数。
-
仿真实验数据1由3个温度传感器的数据构成,分别为Data 1、2、3。如图3所示,其中前
5000 组数据作为训练数据,后2000 组数据作为测试数据。测试数据中包含了人为添加的异常片段数据。添加异常数据的方式如下:Data 1的[500, 750]段在原有值增加了5,[1500 ,1700 ]段在原有基础上减少5,Data 3的[1500 ,1700 ]增加3,人为添加异常片段的数据的局部放大图如图4所示。仿真实验数据2由3个温度传感器的数据构成,分别为Data 4、5、6。如图5所示,前
5500 组数据作为训练数据,后2500 组数据作为测试数据。测试数据中,在三个传感器数据的[1500 ,1650 ]段叠加平稳变化的“梯形”作为人为添加的异常,局部放大图如图6所示。利用训练数据进行建模,并将模型应用于仿真数据1的测试数据,检测结果如图7所示。蓝线表示对测试数据计算得到的统计量SPE值取对数的结果,橙色虚线表示MSPC方法的误差限Qα,红色虚线SPE-POT方法的阈值zq,红色点为方法检出的异常点。
将上述检测到的异常点在测试数据1的原始数据标记,结果如图8所示。其中,上子图为SPE-POT方法的检测结果,中间子图为MSPC方法的检测结果,下子图为POT方法的检测结果。从图中可以看出MSPC利用误差限检测的结果存在少量的误检,POT方法在原始数据上检测如图8所示的阶跃异常能够完全正确地检测出来。同时,SPE-POT方法在有效地把人为添加的异常检出的同时没有误检。实验的统计结果如表2所示,从表2中可以看出,SPE-POT方法能够准确、完整地检测出人为添加的异常点,而MSPC方法把人为添加的异常检出的同时存在一部分误检。POT方法在原始数据中进行检测,能够将添加的异常很好的检测出来。仿真数据2的测试数据上的检测结果如图9所示,将上述检测到的异常点在测试数据2的原始数据标记,SPE、MSPC和POT方法检测的结果分别如图10,图11和图12所示。
图 8 三种方法检测的结果还原到仿真数据1,上子图为SPE-POT方法的检测结果,中间子图为MSPC方法的检测结果,下子图展示的是POT方法的检测结果
Figure 8. Detection results of the three methods are restored to simulated data 1: the upper subplot shows the detection results using the SPE-POT method, and the middle subplot shows the detection results using the MSPC method, and the lower subplot shows the detection results using the POT method
表 2 SPE-POT和MSPC方法检测的统计结果
Table 2. Statistical results of detection by SPE-POT and MSPC methods
评价指标 R P F1 SPE-POT 100% 100% 100% POT 100% 100% 100% MSPC 100% 97.4% 98.7% 图 10 SPE-POT方法异常检测结果,上、中、下子图分别为将检测结果在Data 4、5、6数据上标记的结果,红点表示检出的异常点
Figure 10. Anomaly detection results of the SPE-POT method: the upper, middle, and lower subplots respectively display the results marked on data 4, data 5, and data 6. red dots represent the detected anomalous points
图 11 MSPC方法异常检测结果,上、中、下子图分别为将检测结果在Data4、5、6数据上标记的结果,红点表示检出的异常点
Figure 11. Anomaly detection results of the MSPC method: the upper, middle, and lower subplots respectively display the results marked on data 4, data 5, and data 6. red dots represent the detected anomalous points
图 12 POT方法检测结果还原到原始数据上的情况,上、中、下子图分别为将检测结果在Data 4、5、6的测试数据上标记的结果,红点表示检出的异常点
Figure 12. Detection results of the POT method restored to the original data: the upper, middle, and lower subplots respectively display the results marked on data 4, data 5, and data 6 test data. red dots represent the detected anomalous points
图10中的上、中、下子图展示的分别是SPE-POT方法检测的异常点在Data 4、5、6的测试数据上标记的结果。从图中可以看出,SPE-POT方法将人为设置的异常区域有效地检出。图11中的上、中、下子图展示的分别是MSPC方法检测的异常点在Data 4、5、6的测试数据上标记的结果。从图中可以看出,MSPC方法将人为设置的异常区域检出的同时误检了一些数据点,导致准确率和F1的指标降低。利用POT方法分别对Data 4、5、6的检测结果如图13所示,在人工添加的异常片段,POT方法没有将其检测到,同时在其他地方存在一些误检。
图 13 表4中数据的统计量SPE值及SPE-POT方法确定的阈值
Figure 13. Statistical SPE values of the data in table 4 and the threshold determined by the SPE-POT method
从表3中可以看出,由于POT方法未能将变化缓慢且几个数据间相关性发生变化的异常有效检出,导致该方法召回率、准确率和F1的指标很低,而MSPC方法在检测过程容易误检一些数据点导致了准确率和F1的降低。
表 3 SPE-POT和POT方法检测的统计结果
Table 3. Statistical results of detection by SPE-POT and POT methods
评价指标 R P F1 SPE-POT 92.67% 89.68% 91.15% POT 2.67% 2.86% 2.76% MSPC 98.67% 11.80% 21.08% -
两个真实数据的描述见表4和表5。实验数据1为某核电厂化学与容积控制系统RCV一回路中主泵及相关设备上10个的传感器数据,监测时间为2017年1月10日03:58:33—2017年2月14日18:11:13。实验数据2为汽轮机汽缸和转子的7个传感器数据,监测时间为2020年3月10日06:44:12—2020年3月22日13:45:09。利用SPE-POT方法检测异常点的结果如图13所示,蓝色的线表示利用方法对实验数据计算的统计量SPE值,橙色虚线表示MSPC方法计算的误差限,红色虚线为SPE-POT方法确定的阈值。
表 4 真实Data 1的传感器信息
Table 4. Sensor information from real data 1
序号 传感器 描述 1 RCV200MT 电机非驱动端轴承温度 2 RCV201MT 电机驱动端轴承温度 3 RCV202MT 电机定子绕组温度 4 RCV206MT 增速箱LS轴承温度 5 RCV210MT 泵推力轴承温度 6 RCV223MT 电机定子绕组温度 7 RCV231MV 推力轴承箱振动(X方向) 8 RCV232MV 推力轴承箱振动(Y方向) 9 RCV233MV 径向轴承箱振动(X方向) 10 RCV234MV 径向轴承箱振动(X方向) 表 5 真实Data 2的传感器信息
Table 5. Sensor information from real data 2
序号 传感器 描述 1 GRE014MM 汽轮机轴向位移 2 GRE015MM 汽轮机轴向位移 3 GRE016MM 汽轮机轴向位移 4 GRE018MM 汽轮机转子偏心度 5 GRE019MY 高中压转子绝对胀差 6 GRE020MV 高中压缸绝对胀差 7 GRE315MV 低压转子绝对胀差 从图13中可以看出,MSPC确定的误差限Qα能有效检出异常点,同时引入了大量的误检,SPE-POT方法确定的阈值zq则将误检率有效地降低。将异常检测结果还原到原始数据如图14所示,上、下子图分别展示的是SPE-POT方法和MSPC方法的检测结果。图14中去温度曲线中的两“下凹”的尖峰为操作人员定期实验得到的异常数据,MSPC方法在检测出异常数据时存在着大量误检,而SPE-POT方法能有效降低误检率。图15显示的是SPE-POT方法对表5列出的7个传感器数据的统计量SPE的检测结果。如图16所示,MSPC方法在检测出异常数据时存在着大量误检,而SPE-POT方法能准确检出异常且没有误检。
图 14 将检测结果分别还原到传感器RCV200MT的数据上,上、下子图分别展示的是SPE-POT和MSPC方法的检测结果
Figure 14. Detection results are restored to the data of sensor RCV200MT respectively: the upper and lower subplots display the detection results of the SPE-POT and MSPC methods, respectively
图 15 表5中数据的统计量SPE值及SPE-POT方法确定的阈值
Figure 15. Statistical SPE values of the data in table 5 and the threshold determined by the SPE-POT method
图 16 将两个方法的检测结果分别还原到传感器GRE014MM的数据上,上、下子图分别展示的是SPE-POT方法和MSPC方法的检测结果
Figure 16. Detection results of the two methods are respectively restored to the data of sensor GRE014MM: the upper and lower subplots display the detection results of the SPE-POT method and the MSPC method, respectively.
图17显示的是SPE-POT方法对除氧器的21个传感器数据的统计量SPE的检测结果,红色和橙色的虚线分别表示SPE-POT计算的阈值和MSPC方法计算的阈值。将两种方法检测结果还原到该设备出现异常的传感器数据上,同时利用POT方法对该传感器数据进行异常检测,结果如图18所示。从图18可以看出,SPE-POT方法能够将出现异常的区间准确检测出来,同时避免了如图18中间子图所示的MSPC方法存在的误检。从图18下子图可以看出,POT方法仅能检测出极少数的异常点。
图 17 除氧器设备监测数据的SPE值及其阈值和SPE-POT方法确定的阈值
Figure 17. SPE values of the deaerator equipment monitoring data and their thresholds, as well as the thresholds determined by the SPE-POT method.
图 18 将3个方法的检测结果分别还原到传感器的数据上的情况,上、中、下子图分别展示的是SPE-POT方法、MSPC方法和POT方法的检测结果
Figure 18. Detection results of the three methods are respectively restored to the situation of the sensor data: the upper, middle, and lower subplots display the detection results of the SPE-POT, MSPC, and POT method, respectively.
为了进一步验证文章提出的方法的稳定性,将该方法推广应用到某核电厂二回路除氧器设备的运行数据中。该设备中的运行数据经过核电工作人员确认,在其中一个传感器中出现了异常,异常跨越的区间如图18所示在
30000 到81200 的区间内,对除氧器设备监测的传感器一共有21个。此处,我们利用3种异常检测方法进行检测,仅对出现异常的传感器展示异常检测结果。
An Anomaly Detection Method for Multivariate Statistical Process Based on POT
-
摘要:
目的 核电设备的安全运行对核电厂至关重要,发生事故所带来的损失是不可估量的。因此,对核电设备进行有效的异常检测十分必要。针对固定阈值和人为检测方法的局限性,这些方法难以适应时序数据的动态变化,文章提出一种基于POT的多元统计过程的异常检测方法。 方法 文章采用主成分分析方法构建异常检测模型,将模型的SPE统计量作为POT算法的初始阈值,然后将超过初始阈值的部分进行广义帕累托分布拟合,从而确定最终的动态阈值。当异常分数超过最终阈值则发出异常警告。通过将多元统计过程控制和极值理论相结合,该方法利用多元统计过程控制快速发现核电厂运行数据中的异常情况,并结合极值理论对极端事件的建模与分析来提高异常检测的灵敏度和可靠性,能够快速发现核电厂高维运行数据中存在的异常情况。 结果 在仿真实验结果中,文章提出的方法相较于常规的多元统计方法和POT方法,具有更高的准确率、召回率。在核电厂不同设备上的实际运行数据的实验中,证明了该方法在异常检测上的有效性。 结论 将多元统计过程控制和极值理论结合,提出的异常检测方法不仅能检测到由数据相互关系改变引起的异常,而且能利用POT方法确定最终阈值避免传统多元统计过程控制中出现的误检。该方法能处理核电厂高维时序运行数据,提高异常发现的效率,确保了核电厂安全高效地运行从而提高核电厂的经济效益。 Abstract:Introduction The safe operation of nuclear power equipment is crucial for nuclear power plants (NPPs), and the losses caused by accidents are immeasurable. Therefore, effective anomaly detection for nuclear power equipment is necessary. Considering the limitations of fixed thresholds and manual detection methods, which are difficult to adapt to the dynamic changes in time series data, this paper proposes an anomaly detection method based on POT for multivariate statistical processes. Method This paper adopted PCA to construct an anomaly detection model, where the SPE statistic of the model served as the initial threshold for the POT algorithm. Subsequently, the portion exceeding the initial threshold was fitted with a generalized Pareto distribution to determine the final dynamic threshold. An anomaly warning was issued when the anomaly score exceeded the final threshold. By combining multivariate statistical process control (MSPC) with extreme value theory (EVT), this method used MSPC to discover anomalies in the operating data of NPPs quickly and improved the sensitivity and reliability of anomaly detection by modeling and analyzing extreme events, so that it can quickly detect anomalies in high-dimensional operating data of NPPs. Result In the simulation experiment results, the proposed method has a higher accuracy and recall rate than conventional multivariate statistical and POT methods. In experiments with actual operating data from different equipment in NPPs, the method's effectiveness in anomaly detection has been demonstrated. Conclusion By combining MPSC with EVT, the anomaly detection method proposed in this paper can not only detect anomalies caused by changes in data relationships but also avoid false detection in traditional MSPC by determining the final threshold using the POT method. This method can handle high-dimensional time series operating data of NPPs, improve the efficiency of anomaly detection, ensure the safe and efficient operation of NPPs, and improve their economic benefits. -
图 8 三种方法检测的结果还原到仿真数据1,上子图为SPE-POT方法的检测结果,中间子图为MSPC方法的检测结果,下子图展示的是POT方法的检测结果
Fig. 8 Detection results of the three methods are restored to simulated data 1: the upper subplot shows the detection results using the SPE-POT method, and the middle subplot shows the detection results using the MSPC method, and the lower subplot shows the detection results using the POT method
图 12 POT方法检测结果还原到原始数据上的情况,上、中、下子图分别为将检测结果在Data 4、5、6的测试数据上标记的结果,红点表示检出的异常点
Fig. 12 Detection results of the POT method restored to the original data: the upper, middle, and lower subplots respectively display the results marked on data 4, data 5, and data 6 test data. red dots represent the detected anomalous points
图 18 将3个方法的检测结果分别还原到传感器的数据上的情况,上、中、下子图分别展示的是SPE-POT方法、MSPC方法和POT方法的检测结果
Fig. 18 Detection results of the three methods are respectively restored to the situation of the sensor data: the upper, middle, and lower subplots display the detection results of the SPE-POT, MSPC, and POT method, respectively.
表 1 SPE-POT方法的参数设置
Tab. 1. Parameter setting for the SPE-POT method
编号 参数 设定值 描述 1 cα 0.05 标准正态分布的置信极限 2 η 0.95 特征值累计贡献率 3 q 0.000 1 广义帕累托分布的概率 表 2 SPE-POT和MSPC方法检测的统计结果
Tab. 2. Statistical results of detection by SPE-POT and MSPC methods
评价指标 R P F1 SPE-POT 100% 100% 100% POT 100% 100% 100% MSPC 100% 97.4% 98.7% 表 3 SPE-POT和POT方法检测的统计结果
Tab. 3. Statistical results of detection by SPE-POT and POT methods
评价指标 R P F1 SPE-POT 92.67% 89.68% 91.15% POT 2.67% 2.86% 2.76% MSPC 98.67% 11.80% 21.08% 表 4 真实Data 1的传感器信息
Tab. 4. Sensor information from real data 1
序号 传感器 描述 1 RCV200MT 电机非驱动端轴承温度 2 RCV201MT 电机驱动端轴承温度 3 RCV202MT 电机定子绕组温度 4 RCV206MT 增速箱LS轴承温度 5 RCV210MT 泵推力轴承温度 6 RCV223MT 电机定子绕组温度 7 RCV231MV 推力轴承箱振动(X方向) 8 RCV232MV 推力轴承箱振动(Y方向) 9 RCV233MV 径向轴承箱振动(X方向) 10 RCV234MV 径向轴承箱振动(X方向) 表 5 真实Data 2的传感器信息
Tab. 5. Sensor information from real data 2
序号 传感器 描述 1 GRE014MM 汽轮机轴向位移 2 GRE015MM 汽轮机轴向位移 3 GRE016MM 汽轮机轴向位移 4 GRE018MM 汽轮机转子偏心度 5 GRE019MY 高中压转子绝对胀差 6 GRE020MV 高中压缸绝对胀差 7 GRE315MV 低压转子绝对胀差 -
[1] 王浩然, 冯天天, 崔茗莉, 等. 碳交易政策下绿氢交易市场与电力市场耦合效应分析 [J]. 南方能源建设, 2023, 10(3): 32-46. DOI: 10.16516/j.gedi.issn2095-8676.2023.03.004. WANG H R, FENG T T, CUI M L, et al. Analysis of coupling effect between green hydrogen trading market and electricity market under carbon trading policy [J]. Southern energy construction, 2023, 10(3): 32-46. DOI: 10.16516/j.gedi.issn2095-8676.2023.03.004. [2] 王鑫, 吴继承, 朴磊. “双碳”目标下核能发展形势思考 [J]. 核科学与工程, 2022, 42(2): 241-245. DOI: 10.3969/j.issn.0258-0918.2022.02.001. WANG X, WU J C, PU L. Consideration of the development situation of nuclear power under the goal of carbon peaking and carbon neutraulity [J]. Nuclear science and engineering, 2022, 42(2): 241-245. DOI: 10.3969/j.issn.0258-0918.2022.02.001. [3] 蔡绍宽. 双碳目标的挑战与电力结构调整趋势展望 [J]. 南方能源建设, 2021, 8(3): 8-17. DOI: 10.16516/j.gedi.issn2095-8676.2021.03.002. CAI S K. Challenges and prospects for the trends of power structure adjustment under the goal of carbon peak and neutrality [J]. Southern energy construction, 2021, 8(3): 8-17. DOI: 10.16516/j.gedi.issn2095-8676.2021.03.002. [4] 吴铮, 张悦, 董泽. 基于改进高斯混合模型的热工过程异常值检测 [J]. 系统仿真学报, 2023, 35(5): 1020-1033. DOI: 10.16182/j.issn1004731x.joss.22-0047. WU Z, ZHANG Y, DONG Z. Outlier detection during thermal processes based on improved gaussian mixture model [J]. Journal of system simulation, 2023, 35(5): 1020-1033. DOI: 10.16182/j.issn1004731x.joss.22-0047. [5] 崔文浩, 郑胜, 秦雄杰, 等. 基于多尺度时间窗口的核电运行数据关联性分析方法研究 [J]. 南方能源建设, 2023, 10(2): 143-150. DOI: 10.16516/j.gedi.issn2095-8676.2023.02.019. CUI W H, ZHENG S, QIN X J, et al. Research on correlation analysis method for nuclear power operation data based on multi-scale time window [J]. Southern energy construction, 2023, 10(2): 143-150. DOI: 10.16516/j.gedi.issn2095-8676.2023.02.019. [6] YIN S, DING S X, XIE X C, et al. A review on basic data-driven approaches for industrial process monitoring [J]. IEEE Transactions on industrial electronics, 2014, 61(11): 6418-6428. DOI: 10.1109/TIE.2014.2301773. [7] JIN X H, FAN J C, CHOW T W S. Fault detection for rolling-element bearings using multivariate statistical process control methods [J]. IEEE transactions on instrumentation and measurement, 2019, 68(9): 3128-3136. DOI: 10.1109/TIM.2018.2872610. [8] ZHANG Y W, LI S, HU Z Y. Improved multi-scale kernel principal component analysis and its application for fault detection [J]. Chemical engineering research and design, 2012, 90(9): 1271-1280. DOI: 10.1016/j.cherd.2011.11.015. [9] JIANG Q C, YAN X F, HUANG B. Performance-driven distributed PCA process monitoring based on fault-relevant variable selection and bayesian inference [J]. IEEE transactions on industrial electronics, 2016, 63(1): 377-386. DOI: 10.1109/TIE.2015.2466557. [10] CHANDOLA V, BANERJEE A, KUMAR V. Anomaly detection: a survey [J]. ACM computing surveys (CSUR), 2009, 41(3): 15. DOI: 10.1145/1541880.1541882. [11] WANG H, PENG M J, WESLEY HINES J, et al. A hybrid fault diagnosis methodology with support vector machine and improved particle swarm optimization for nuclear power plants [J]. ISA transactions, 2019, 95: 358-371. DOI: 10.1016/j.isatra.2019.05.016. [12] NOMIKOS P. Detection and diagnosis of abnormal batch operations based on multi-way principal component analysis world batch forum, Toronto, May 1996 [J]. ISA transactions, 1996, 35(3): 259-266. DOI: 10.1016/S0019-0578(96)00035-3. [13] CHEN S Y, JIN G, MA X Y. Satellite on-orbit anomaly detection method based on a dynamic threshold and causality pruning [J]. IEEE access, 2021, 9: 86751-86758. DOI: 10.1109/ACCESS.2021.3088439. [14] 卢培, 李小宝, 郑晨旭, 等. 350 MW余热锅炉变工况运行特性分析 [J]. 南方能源建设, 2022, 9(3): 41-49. DOI: 10.16516/j.gedi.issn2095-8676.2022.03.005. LU P, LI X B, ZHENG C X, et al. Analysis on operation characteristics of 350 MW waste heat boiler under variable working conditions [J]. Southern energy construction, 2022, 9(3): 41-49. DOI: 10.16516/j.gedi.issn2095-8676.2022.03.005. [15] SIFFER A, FOUQUE P A, TERMIER A, et al. Anomaly detection in streams with extreme value theory [C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Halifax, Canada, August 13-17, 2017. Halifax: ACM, 2017: 1067-1075. DOI: 10.1145/3097983.3098144. [16] CHARRAS-GARRIDO M, DEVILLE Y, LEZAUD P. Corrective to the article: extreme value analysis - an introduction Journal de la SFdS Vol. 154 No2, 66-97 [J]. Journal de la société française de statistique, 2017, 158(3): 27-28. [17] YU X L, ZHAO Z B, ZHANG X W, et al. Deep-learning-based open set fault diagnosis by extreme value theory [J]. IEEE transactions on industrial informatics, 2022, 18(1): 185-196. DOI: 10.1109/TII.2021.3070324. [18] BEIRLANT J, GOEGEBEUR Y, TEUGELS J, et al. Statistics of extremes: theory and applications [M]. Hoboken: Wiley, 2004. DOI: 10.1002/0470012382. [19] HUNDMAN K, CONSTANTINOU V, LAPORTE C, et al. Detecting spacecraft anomalies using LSTMs and nonparametric dynamic thresholding [C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, London, UK, August 19-23, 2018. London: ACM, 2018: 387-395. DOI: 10.1145/3219819.3219845. [20] LUO X Y, ZHENG S, HUANG Y, et al. Molecular clump extraction algorithm based on local density clustering [J]. Research in astronomy and astrophysics, 2021, 22(1): 015003. DOI: 10.1088/1674-4527/ac321d. [21] WANG H, PENG M J, YU Y, et al. Fault identification and diagnosis based on KPCA and similarity clustering for nuclear power plants [J]. Annals of nuclear energy, 2021, 150: 107786. DOI: 10.1016/j.anucene.2020.107786.