基于约束并行LSTM分位数回归的短期电力负荷概率预测方法李丹

电网技术
Power System Technology

ISSN 1000-3673,CN 11-2410/TM
《电网技术》网络首发论文
题目：基于约束并行 LSTM 分位数回归的短期电力负荷概率预测方法

作者：李丹，张远航，杨保华，王奇
DOI： 10.13335/j.1000-3673.pst.2020.1124
收稿日期： 2020-07-15
网络首发日期： 2021-01-15
引用格式：李丹，张远航，杨保华，王奇．基于约束并行 LSTM 分位数回归的短期电力
负荷概率预测方法．电网技术.
https://doi.org/10.13335/j.1000-3673.pst.2020.1124
网络首发：在编辑部工作流程中，稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶
段。录用定稿指内容已经确定，且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期
刊特定版式（包括网络呈现版式）排版后的稿件，可暂不确定出版年、卷、期和页码。整期汇编定稿指出
版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合《出
版管理条例》和《期刊出版管理规定》的有关规定；学术研究成果具有创新性、科学性和先进性，符合编
辑部对刊文的录用要求，不存在学术不端行为及其他侵权行为；稿件内容应基本符合国家有关书刊编辑、
出版的技术标准，正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。
为确保录用定稿网络首发的严肃性，录用定稿一经发布，不得修改论文题目、作者、机构名称和学术内容，
只可基于编辑规范进行少量文字的修改。
出版确认：纸质期刊编辑部通过与《中国学术期刊（光盘版）》电子杂志社有限公司签约，在《中国
学术期刊（网络版）》出版传播平台上创办与纸质期刊内容一致的网络版，以单篇或整期出版形式，在印刷
出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为《中国学术期刊（网络版）》是国家新闻出
版广电总局批准的网络连续型出版物（ISSN 2096-4188，CN 11-6037/Z），所以签约期刊的网络版上网络首
发论文视为正式出版。
网络首发时间：2021-01-15 13:05:01
网络首发地址：https://kns.cnki.net/kcms/detail/11.2410.tm.20210114.1624.003.html
电网技术 1
基于约束并行 LSTM 分位数回归的

短期电力负荷概率预测方法
1 1 2 3
李丹，张远航，杨保华，王奇
（1. 三峡大学电气与新能源学院，湖北省，宜昌市 443000;
2. 新能源微电网湖北省协同创新中心，湖北省宜昌市 443002;
3.梯级水电站运行与控制湖北省重点实验室，湖北省宜昌市 443002）
Short Time Power Load Probabilistic Forecasting Based on Constrained Parallel-LSTM

Neural Network Quantile Regression Mode
LI Dan1, ZHANG Yuanhang1, YANG Baohua2, WANG Qi3
(1. College of Electrical Engineering & New Energy, China Three Gorges University, Yichang 443000, Hubei Province, China;
2. Hubei Provincial Collaborative Innovation Center for New Energy Microgrid, Yichang 443002, Hubei Province, China;
3. Hubei Provincial Key Laboratory for Operation and Control of Cascaded Hydropower Station,Yichang 443002, Hubei Province, China)
ABSTRACT: The probabilistic forecasting can accurately 考虑分位数预测值之间约束关系的组合层，以保证分位数预

quantify the uncertainty of the future power load and provide 测值的合理性。实际算例结果表明，与常见负荷概率预测方
comprehensive prediction information for the operation 法相比，所提方法不仅具有更高的预测效率，而且能获得更
decision of power system. Addressing the temporal 合理的分位数预测结果。
characteristics of power load and the overlap between the
关键词：负荷概率预测；长短期记忆神经网络；分位数回归；
adjacent quantile forecasts of the existing quantile regression
分位数交叉；深度学习技术
methods, this paper proposes a short time power load
DOI：10.13335/j.1000-3673.pst.2020.1124
probabilistic forecasting method based on the constrained
parallel long short-term memory (LSTM) neural network 0 引言
quantile regression model. This method integrates the LSTM
and the quantile regression to generate multiple load quantile 短期电力负荷预测是电力系统安全、经济运行
forecasts in parallel. Furthermore, it ensures the rationality of 的基础，为电力系统规划和运行、能源交易、经济
the quantile forecasts through adding a combination layer 调度等[1-2]提供重要信息。近年来学者们提出了多
considering the constraints between the adjacent quantile 种短期负荷预测方法，包括神经网络 [3-4]、支持向
forecasts. The results of an actual example show that the
量机[5-6]和模糊推理系统[7-8]等。但其中多为点预测
proposed method not only has higher prediction efficiency but
方法，难以度量负荷的不确定性，故负荷概率预测
also can obtain more reasonable quantile forecasts compared
with the existing load probabilistic forecasting methods. 成为当前负荷预测研究的热点。
目前，负荷概率预测方法主要包括区间估计
KEY WORDS: probabilistic load forecasting; LSTM neural [9-10]
、核密度估计[11]和分位数回归[12-16]等。分位数
network; quantile regression; quantile overlap; deep learning
technology 回归由于可直接解释不同分位点下响应变量和因
变量之间的关系，成为近年来研究的热点。文献[12]
摘要：负荷概率预测能准确量化负荷的不确定性，为电力系
在平均分位数回归中，将各姐妹模型点预测结果用
统运行决策提供全面的预测信息。针对负荷的时序性特点以
及现有分位数回归方法存在的分位数预测值交叉问题，提出作自变量，生成概率预测结果。文献[13]提出了径
了一种基于约束并行长短期记忆神经网络分位数回归的短期向基函数（radial basis function，RBF）神经网络分
电力负荷概率预测方法。该方法结合长短期记忆神经网络与位数回归模型，用于生成负荷的预测分位数。文献
分位数回归，并行生成预测负荷的多个分位数结果，并加入 [14]将实时电价作为输入特征之一，运用支持向量
分位数回归方法获得负荷的概率密度预测。文献
基金项目：国家自然科学基金项目(51807109)。
[15]则提出一种分位数回归森林方法，仅一次训练
Project Supported by National Natural Science Foundation of China
可并行生成多个分位数预测结果，提高了模型的训
(51807109).
电网技术 2
练效率。文献[16]引入深度学习中的流行技术（如 Ct  tanh(Wc [ xt , ht1 ]T  bc ) (4)

dropout 层、批处理训练等），对神经网络分位数 (5)
Ct  Ct -1 ft  it Ct
回归（quantile regression neural network，QRNN）
ht  ot tanh(Ct ) (6)
方法进行改进，避免了传统 QRNN 的过度拟合。
综上所述，目前负荷概率预测方法多是结合机其中：W 代表相应的权重矩阵；b 代表相应的偏置
向量；σ()和 tanh()分别为 Sigmoid 和正切 S 形曲线
器学习算法和分位数回归法，构建分位数模型。而
激活函数。
与传统的机器学习算法相比，深度学习网络被证明最终输出由隐含层状态 ht 计算：
在应对大数据集的短期负荷预测方面更加有效 yˆ t  WSht  bS (7)
[17-19]
。尤其是长短期记忆(long short-term memory，其中 WS 和 bS 分别为隐含层与输出层的连接权重矩
LSTM)神经网络对时间序列形式的数据具有强适阵和偏置向量。
应性，得到了广泛应用[20-22]。 1.2 分位数回归
基于以上讨论，本文提出了一种基于约束并行对于响应变量 Y，受到 k 个因素 X1, X2,…, Xk 的
LSTM 神经网络分位数回归(constrained parallel- 影响，Koenker 等提出分位数线性回归模型 QY(τ|X)=
LSTM quantile regression，CPQ-LSTM)的短期电力 X'β(τ)。其中参数向量 β(τ)的估计，可以转化为求解
负荷概率预测方法。该方法将 LSTM 的记忆特性与以下优化问题：
分位数回归的概率预测功能相结合，并加入考虑分
位数预测值之间约束关系的组合层，构建
min
 ( )

t Yt  X β ( )
 Yt  X β ( )  
t Yt  X β ( )
(1  ) Yt  X β( ) (8)
CPQ-LSTM 模型。此外，采用数据并行式训练方法
对 CPQ-LSTM 进行训练，提高预测效率。为验证
2 基于 LSTM 分位数回归的短期负荷概率预
本文方法，以某实际地区负荷预测为例，结果表明
测方法
CPQ-LSTM 模型具有更高的预测效率，不仅能获得 2.1 LSTM 单条件分位数回归模型
准确的点预测结果，而且可以有效避免分位数预测考虑到负荷预测的时序性和非线性，将 LSTM
值之间的交叉，生成更合理的预测负荷概率分布。用作短期负荷预测的条件分位数函数，分位点 τi 下
Q-LSTMi 模型的损失函数为：
1 LSTM 神经网络和分位数回归 N
1.1 LSTM 神经网络结构 L( i )  min

W ( i ),b ( i )
  (Y  f ( X ,W ( ), b( ))) 
t 1
i t t i i
LSTM 通过记忆单元和门控机制巧妙保留了
1 W 2 ( i )
长短期记忆，其单元基本架构如图 1 所示。LSTM
(9)
单元由遗忘门、输入门和输出门组成，遗忘门控制
其中：W(τi)={Wf(τi), Wi(τi), Wc(τi), Wo(τi), WS(τi)}和
历史信息被遗忘的程度，输入门控制接受新信息的
b(τi)={bf(τi), bi(τi), bc(τi), bo(τi), bS(τi)}分别为分位点 τi
程度，输出门则决定最终输出的信息。
下 LSTM 全部权重参数矩阵集合和偏置向量集合；
Ct-1 Ct Ct λ1 为正则项惩罚参数；ρτ(a)为检验函数。
 a ,a  0
 (a)  
tanh (10)
ft it
ot (  1)a, a  0
σ (Wf ) σ (Wi ) tanh(Wc ) σ (Wo ) 为获得 Q-LSTMi 模型的最优参数 {W(τi),
ht-1 ht b(τi)}opt，利用梯度下降法更新参数时，需要计算反
xt 向传播误差。
图1 LSTM 神经网络结构图先定义两个梯度函数  ht ( i ) 和  Ct ( i ) ：
Fig. 1 Architecture of LSTM unit
L( i ) yˆt ,i 
WS,i τi , yt  yˆt ,i
T
给定当前输入 xt，上一时刻隐含层状态 ht-1 和  h ( i )   T (11)
存储状态 Ct-1，详细的计算过程如下：
t
yˆt ,i ht ,i  WS,i (1  τi ), yt  yˆt ,i
it   (Wi [ xt , ht 1 ]T  bi ) (1)
ft   (Wf [ xt , ht 1 ]T  bf ) (2)
ot   (Wo [ xt , ht 1 ]  bo )
T
(3)
电网技术 3
L( i ) Ct 1,i L( i ) ht ,i 0<τ1<···<τi···<τr<1，尽可能完整估计预测负荷的概

 C ( i )   
t
Ct 1,i Ct ,i ht ,i Ct ,i 率分布。故本文将 r 个分位点下的 Q-LSTMi(i=1,...,r)
 C ( i ) ft 1,i   ht ( i ) ot ,i 单元组合，建立 CPQ-LSTM 模型如图 3 所示。
t 1
(1  tanh 2 (Ct .i )) (12) 输入层隐含层输出层回归层
Q-LSTMi 模型的训练过程如图 2 所示。
Q-LSTM1
步骤 1，输入初始权重和偏置 W0(τi)和 b0(τi)； QYt (1 Xt )
...
步骤 2，由式(1~7)，计算 LSTM 各输出 ft,i、it,i、
Ct ,i 、Ct,i、ot,i、ht,i、 yˆ t ,i 当前迭代值；
QYt (2 Xt )
步骤 3，计算梯度  ht ( i ) 和 Ct ( i ) ，并据此计
Q-LSTM2
Floss
Xt
...
算各权重和偏置的梯度。
...
...
1）隐含层至输出层参数的梯度为
...
...

 

WS ( i )     i   (1   i )  (ht ,i )T  21WS ( i ) (13)
Q-LSTMr

 yt  yˆt ,i yt  yˆt ,i 
 QYt (r Xt )
...

 

 bS ( i )     i   (1   i )  (14) W(i ), b(i )
 yt  yˆt ,i
 yt  yˆt ,i 

2）根据  ht ( i ) 、  Ct ( i ) 和式(1)—(4)分别计图3 CPQ-LSTM 模型
Fig. 3 CPQ-LSTM model
算遗忘门、输入门、候选存储单元和输出门参数的
梯度。基于式(9)，将 r 个分位点下的分位数损失函数
步骤 4：更新权重和偏置。求和，可构建 LSTM 多分位数的损失函数。然而，
W* ( i )  W* ( i ) W ( i ) (15)
*
由分位数的固有属性，Yt 的条件分位数应满足：
b* ( i )  b* ( i ) b* ( i ) (16)
QYt (1 Xt )  QYt ( 2 Xt )  ...  QYt ( r Xt ) ，故本文加
其中：η 为学习率；W 和 b 代表相应的权重矩阵和
偏置向量。入违反分位数预测值约束关系惩罚项的组合层，使
步骤 5，重复步骤 2—4，直至达到收敛条件，模型尽量避免相邻分位数之间的交叉。CPQ-LSTM
获得模型最优参数{W(τi), b(τi)}opt。模型损失函数可表示为
开始
 (Y  Q ( i X t ))  1W 2 ( i ) 
r N
Floss  min t Yt
初始化权重、偏置 W ( i ),b ( i ) i
i 1 t 1
r 1 N
计算LSTM各输出
2   (QY ( i X t )  QY ( i 1 X t ))
t t
(17)
i t 1
根据式(11)计算损失函数：L( i )
v , v  0
其中：  (v)   ； 2 为惩罚参数。
L(i ) 10-6？ 0, v  0
根据式(17)，对应的梯度  ht ( i ) 、 WS ( i ) 和
Y
N 获得模型最优参数
 b ( i ) 相应变为
达到最大训 Y
练次数？ S
N WST i (1  ui ), yt  yˆt
 (18)
计算输出层、隐含层各单元误差  h ( i )  
WS (1   i )(1  ui ), yt  yˆt

t T
计算各权重及偏置的梯度
Floss
W ( i )  
更新权重、偏置结束 S
WS ( i )
图2 Q-LSTM 模型训练过程
 
   i (1  ui )   (1   i )(1  ui )  (ht ,i ) 
Fig. 2 Training process of Q-LSTM model T
2.2 考虑分位数约束的 LSTM 分位数回归模型  yt  yˆt ,i yt  yˆt ,i 

Q-LSTMi 仅能获得分位点 τi 下预测日各时刻负 21 WS ( i ) (19)

 

荷的分位数 Yˆt ,i  QY ( i X t ) 为获得更全面的概率  b ( i )    (1  ui )   (1   i )(1  ui )  (20)
t ， S

 yt  yˆt ,i
i
yt  yˆt ,i 

分布信息，有必要通过一系列不同分位点其中向量 ui 中各元素分别为
电网技术 4
 
QYt ,m ( i X t ) QYt ,m ( i1 X t )
2 , i  1 LSTM 模型的参数初始值，进一步提高训练效率。
 CPQ-LSTM 模型的训练和预测流程如附录图
  2  1，具体步骤如下：
QYt ,m ( i X t ) QYt ,m ( i1 X t ) (21)
ui ,m   1）输入 N 个样本日的负荷功率和影响因素
  (2 ), 2  i  r
 QYt ,m ( i1 X t ) QYt ,m ( i Xt ) （如温度和降雨数据等），并对数据归一化，得到

Q ( X (2 ), i  r {Xt,Yt}N。
 Yt , m i 1 t ) QYt ,m ( i X t )
2）将数据集分为训练集、验证集和测试集，
m  1,..., o 设置模型超参数，如神经元数量 m、计算节点数 n、
遗忘门、输入门、存储单元、候选存储单元和
惩罚参数 λ1、λ2 等。
输出门参数的梯度与 2.1 节中计算方式相同。
3）将训练集均分为 n 个子集，利用对应的 n
2.3 神经网络的数据并行式训练
个计算节点对网络并行训练，每次迭代按式（22）
当分位点设置较多时，LSTM 对大型数据集训
生成全局参数集。各计算节点的训练过程如下。
练耗时较多，因此本文采用神经网络的数据并行式
①随机初始化 Q-LSTMi（i=1,...,r）模型参数，
训练方法提高训练效率。如图 4 所示，数据并行式
采用 2.1 节方法对 Q-LSTMi 分别训练。
训练通过 GPU（graphics processing unit）分布式计
② 将训练得到的 {W(τi),b(τi)}opt 设为 CPQ-
算实现，将训练集均等分为多个子集，分配到计算
LSTM 模型训练的初始参数。
系统的各个节点，每个计算节点负责处理该数据集
③如 2.2 节所述，整体训练 CPQ-LSTM 模型，
的一个不同子集，从而减少训练时间。
对{W(τi), b(τi)}r 进行微调，确定 CPQ-LSTM 模型的
最佳权重及偏置参数。
4）将验证集样本输入训练好的 CPQ-LSTM 模
型，根据验证误差优选模型的最佳超参数。
数
据 5）将测试样本输入具有最佳超参数的 CPQ-
... 并
行
化 LSTM 预测模型，对输出的预测结果进行反归一化，
节点1 节点2 节点n 得到预测日各时刻预测负荷的 r 个分位数。
6）比较负荷概率预测结果和真实负荷值，对
图 4 神经网络的数据并行式训练
Fig. 4 Data parallel training of Neural network 模型进行评价分析。
由于每个节点训练其数据子集均会得到一套 3 算例分析
模型参数，故在训练过程中，将各节点训练得到的
3.1 算例描述
参数在整个集群中共享，并通过式（22）的异步随
本文选取某实际地区 2016 年 1 月 1 日至 2017
机梯度下降公式计算新的全局权重集，分配给计算
年 6 月 30 日的 15 min 级负荷数据集进行日前负荷
系统的每一个节点。
n
概率预测。其中 80%用于训练，10%用于验证，后
Z 1  Z    Z , j (22) 10%用于测试。输入变量 Xd=[Td, Rd]，包括预测日
j 1
24 时刻气温 Td=[T1, T2,…, T24]d 和 M 个分区的降雨
其中：Zυ={W,b}(υ)为第 υ 次迭代训练得到的全局参
量 Rd=[R1, R2,…, RM]d，在本算例中 M=9。
数集；△Zυ，j 为由 2.2 节所示第 υ 次迭代训练得到
为验证 CPQ-LSTM 模型的预测性能，将它与
的第 j 个计算节点的参数梯度；n 为计算节点的总
线性分位数回归模型(linear quantile regression，
个数；  为缩放系数。
L-QR)，带参数整流线性激活函数的 bQRNN[16]，
2.4 CPQ-LSTM 模型的训练及预测流程
QRNN[16] 和 Q-LSTM 进行对比。模型均在
通过 CPQ-LSTM 模型和数据并行式训练方法，
matlab2019a 搭建，在 3.40 GHz Intel®Core(TM)/
可一次训练得到具有增量比例分位点下负荷的条
i5-7200CPU/GeForce940MX-GPU/ 8GB 内存的计算
件分位数，同时通过约束惩罚函数有效避免分位数
机上运行。经验证集优选后的模型超参数见表 1，
间的交叉。此外，本文在 CPQ-LSTM 模型整体训
预测分位点区间为 0.01~0.99，间隔为 0.01，
即 r=99。
练之前，增加 Q-LSTMi（i=1,...,r）的预训练环节，
将训练各 Q-LSTMi 得到的{W(τi),b(τi)}opt 作为 CPQ-
电网技术 5
表1 模型的超参数设置 3）可靠性指标。
Table 1 Hyperparameter settings of the models

模型 bQRNN QRNN Q-LSTM CPQ-LSTM X PICP  (27)
神经元数量 200
N
Epochs 100 其中 εα 为置信度 1-α 下实际值落入预测区间的数
时窗长度 — — 6 6 量。
η 0.01
PICP 与其标称值(PI nominal confidence，PINC)
λ1 1
λ2 — — — 20 的偏差指数 XDev[11]定义如下。
并行计算节点数 n — — — 4
 — — — 0.25
X Dev  X PICP  X PINC (28)
3.2 概率预测精度评价指标 4）锐度指标。

考虑到分位数约束条件，本文提出一种计及分
1 1 N
位数约束关系的评价指标(constraint score，CS)。另 X PINRW 
R
 (Ut  Lt )2
N t 1 (29)
外，quantile score[7](QS)，PI 覆盖率(PI coverage
probability，PICP)[23] 和 PI 标准均方根宽度 [23](PI 其中：XPINRWα 为置信度 1-α 下的 PI 归一化均方根
normalized root-mean-square width，PINRW)也是概宽度；Utα 和 Ltα 分别是置信度 1-α 下第 t 个测试样
率预测结果评价的常见指标。本预测区间的上、下限；R 是测试集中负荷最大值
1）quantile score(QS)。和最小值之差。
3.3 CPQ-LSTM 负荷概率预测模型的结果分析
Pt ,i ( , yˆt ( i ))  max(( i 1)( yt  yˆt ( i )), i ( yt  yˆt ( i )))
以测试样本集中 2017 年 5 月 25 日至 26 日为
(23) 例，CPQ-LSTM 预测得到不同置信度下的 PI 如图 5
所示。较低置信度的 PI 较好的嵌入在较高置信度
1 r N
X QS   Pt , ( i , yˆt ( i ))
r  N i 1 t 1 i
(24)
PI 中，且不同置信度下 PI 的上下限均与实际负荷
曲线具有相似的趋势，这表明基于 LSTM 构建的
其中：Pt , i 是  i 分位点下 pinball losses 值；yˆt ( i ) 是
CPQ-LSTM 很好地捕捉到了负荷变化的动态特征。
t 时刻  i 分位点下的预测值；N 为全部测试时刻数。 90% 80% 70% 60% 50%
2200
40% 30% 20% 10% 实际负荷中位数
2）constraint score (CS)。 2100
2000
由分位数固有属性可知，t 时刻的分位数预测
负荷/kW
1900
值应满足 yˆt ( =0)  yˆ t ( 1 )  yˆ t ( 2 )  ... ˆy t (r ) ˆy t ( =1)， 1800

1700
据此本文提出考虑分位数约束关系的指标如下： 1600
1500
 2 N r 1 2 1400
 vt ,i
20 40 60 80 100 120 140 160 180
 CS
X  采样点/15min
 N t 1 i 1 图5 2017 年 5 月 25-26 日 CPQ-LSTM 预测结果构建的 PI

 (25)
v  0, yˆt ( i )  yˆt ( i 1 ) Fig. 5 PIs constructed by CPQ-LSTM from May 25 to 26,
 t .i  yˆ ( )  yˆ ( ), yˆ ( )  yˆ ( ) 2017
  t i t i 1 t i t i 1
为探究负荷的不确定性与负荷水平之间的关
当相邻分位数满足约束关系时，vt,i 为 0，反之
系，本文将测试集中 r 个分位点下各预测日 96 点
vt,i 为相邻分位数的正差值，反映约束违反的程度。
pinball losses 平均值的箱线图与日平均负荷进行对
系数项 2θ/N 为分位数约束误差平方的归一化系数，
比分析，如图 6 所示。在负荷水平较低时，pinball
其中 θ=τi+1-τi 为分位点之间的步长。XCS 为 vt,i 在整
losses 平均值较小，说明负荷预测不确定性小；而
个测试集样本和全部相邻分位数上的归一化均方
在负荷水平较高时，pinball losses 平均值较大，即
根。
具有更高的预测不确定性。
当 XQS 和 XCS 同时较低时，表明预测得到的分
125 日平均负荷 2600
位数具有更好的性能，故本文将两者结合，组成综
pinball losses/kW
100 2400
负荷/kW
合评价指标 XQCS： 75 2200

50 2000
25 1800
X QCS =X QS +X CS (26) 0 1600
1 5 10 15 20 25 30 35 40 45 50 55
时间/天
电网技术 6
图6 测试集中各预测日 pinball losses 平均值箱线图 3.4 与其他负荷概率预测模型预测结果的对比

Fig. 6 Pinball losses average value box plot for each test 3.4.1 点预测结果对比分析
day
为比较不同模型的点预测结果，本文将各模型
根据 CPQ-LSTM 预测结果，采用非参数核密中位数预测结果的 XMAPE、XRMSE 进行对比，如图 8
度估计，可生成负荷的概率密度曲线[24,25]。以 5 月所示。由图可见，Q-LSTM 和 CPQ-LSTM 模型的
25 日 6:00、12:00 和 18:00 为例，本文采用与其他点预测效果明显优于其他模型。而 CPQ-LSTM 略
对比方法相同的高斯核函数得到概率密度曲线如逊于 Q-LSTM，这是因为 CPQ-LSTM 在损失函数
图 7 所示。可以看到，由 CPQ-LSTM 可预测未来中加入违背分位数预测值约束关系的惩罚函数后，
时刻负荷的完整概率分布，负荷实际值也均落在概优化目标不单考虑预测值与实际值之间误差最小，
率密度曲线中高概率密度处附近。同时兼顾了分位数预测值的合理性。
0.02 8 7.77 7.48 80
80
65.29 MAPE
0.01 实际值 64.24
58.01
RMSE
6 5.39 60
RMSE/kW
0
MAPE/%
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000 4.13
4 3.45 30.55 32.58 40
(a) 6点
核密度估计
0.015
2
0.01 实际值 20
0.005
0 0 0
L-QR bQRNN QRNN Q-LSTM CPQ-LSTM
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000
0.015
(b) 12点图 8 中位数预测结果的 XMAPE 和 XRMSE 对比
0.01 实际值
0.005 Fig. 8 XMAPE and XRMSE comparison of median forecasts
0
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000 3.4.2 概率预测结果对比分析
(c) 18点
各模型概率预测结果的评价指标统计对比如
负荷值/kW
表2、3所示。表2列出了训练时长Ttrain、XQS、XCS、
图7 2017 年 5 月 25 日部分时刻预测负荷概率密度曲线 XQCS及50%、90%置信度下的XPINRW和违背相邻分位
Fig. 7 Probability density curve of predicted load at some
数约束关系样本占比f；表3列出了不同置信度下
time points on May 25, 2017
XPICP和XDev的对比，其中XAD和XMD分别为各置信度
下XDev的均值和最大值。图9给出了整个测试集每个
样本日的XCS指标曲线；图10给出了各模型预测结
果的XPICP-XPINC曲线，越接近理想曲线表明预测效
果越好。
表2 各模型评价指标对比
Table 2 Comparison of evaluation indexes of the models
模型 XQS/kW XCS/kW f/% XQCS/kW XPINRW(50%) XPINRW(90%) Ttrain/s
L-QR 68.32 100.55 63.12 168.87 0.0322 0.1824 186
bQRNN 65.11 91.43 59.21 156.54 0.0516 0.3541 362
QRNN 61.7 69.07 46.83 130.77 0.0679 0.3659 486
Q-LSTM 32.70 39.81 32.63 72.51 0.0337 0.1607 557
CPQ-LSTM 33.65 10.86 16.33 44.51 0.0468 0.2244 184
表3 各模型XPICP和XDev对比
Table 3 Comparison of XPICPs and XDevs of the models
XPICP XDev 均值 XDev 最大值
模型
置信度 10% 置信度 20% 置信度 30% 置信度 40% 置信度 50% 置信度 60% 置信度 70% 置信度 80% 置信度 90% XAD XMD
L-QR 3.45 7.14 9.38 10.80 13.10 15.30 18.03 21.29 24.92 36.29 65.08
bQRNN 6.34 13.30 19.25 25.57 32.12 40.72 49.28 57.97 70.57 14.99 22.03
QRNN 13.63 22.30 32.05 54.37 64.22 69.57 76.56 86.50 96.21 7.27 14.37
Q-LSTM 6.30 27.83 36.97 44.21 52.51 60.54 63.56 80.43 85.63 4.11 7.83
CPQ-LSTM 12.05 19.53 30.76 41.14 50.38 60.53 69.72 79.13 89.51 0.77 2.05
7
电网技术
350 预测区间变宽的情况。
L-QR
300
bQRNN
250 QRNN
4）结合表3和图10可看到，Q-LSTM和CPQ-
XCS/kW
Q-LSTM
200
CPQ-LSTM LSTM生成的XPICP 曲线更接近理想曲线，同时XAD
150
100 和XMD也有明显的降低，可见基于LSTM的分位数回
50
0 归模型生成的PI可靠性更高。而CPQ-LSTM具有更
0 5 10 15 20 25 30 35 40 45 50 55
样本日/天
低的XAD （0.77%）和XMD （2.05%），其XMD 仅为
图 9 测试集各样本日的 XCS Q-LSTM XAD的50%，表明CPQ-LSTM模型明显降低
Fig. 9 XCSs of each sample day from the test set 了覆盖率偏差，提高了预测区间的可靠性。
1 综上所述，CPQ-LSTM和Q-LSTM的预测性能
理想曲线
0.9 L-QR 明显优于传统分位数回归模型。而与Q-LSTM相比，
bQRNN
0.8 QRNN CPQ-LSTM得到的分位数预测结果可有效避免相
0.7 Q-LSTM
CPQ-LSTM 邻分位数之间的交叉，使得预测区间的可靠性更
0.6
高，同时，其XMD仅为Q-LSTM的1/4，且训练时间
XPICP
0.5
0.4
仅为Q-LSTM的1/3。
0.3 3.4.3 不同计算节点预测结果对比分析
0.2 为分析选取不同计算节点 n 对预测效果的影
0.1
响，本文对 CPQ-LSTM 在 n 为 1~8 时的 XQCS 和 Ttrain
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 进行对比，如图 11 所示。当 n 增加时，模型训练
XPINC
时间成比例减少；而当 n 不大于 4 时，
预测模型 XQCS
图 10 各模型的 XPICP-XPINC 曲线并未有明显差异，但当 n 超过 4 时，XQCS 逐渐增加，
Fig. 10 XPICP-XPINC curves of the models
表明计算节点数过多时，可能导致单计算节点的训
对比不同负荷概率预测模型的预测结果：练样本太少，无法较好反映样本总体而降低模型的
1）由表 2 可以看出，相较于 Q-LSTM，L-QR、预测效果。故采用数据并行化训练技术时，需要合
bQRNN 和 QRNN 的训练参数较少，它们耗费的训理选择计算节点数，以在不影响预测效果的同时提
练时间少于 Q-LSTM。而采用了数据并行技术的高预测效率。
CPQ-LSTM，训练时间比 Q-LSTM 显著减少，基本 120
689
750
XQCS
101.76
与 L-QR 相当。 Ttrain
82.74
2）Q-LSTM和CPQ-LSTM的XQCS远低于其他几 80 500
XQCS/kW
种模型，表明基于LSTM建立的分位数回归模型， 361 57.99 Ttrain/s

44.59 43.23 44.79 44.51 50.24
其预测性能明显优于传统分位数回归模型。结合图 40 235 250
184
9和表2可知，CPQ-LSTM的XCS在大多数样本日中明 144 127 109 93
显低于其他几种方法，且CPQ-LSTM在整个测试集 0 0
n=1 n=2 n=3 n=4 n=5 n=6 n=7 n=8
的综合XCS指标仅为Q-LSTM的27.28%，违背约束的图 11 不同计算节点时 CPQ-LSTM 的 XQCS 和 Ttrain 对比
样本占比f相较Q-LSTM降低了16.3%，但反映预测 Fig. 11 Comparison of XQCSs and Ttrains of CPQ-LSTM at
精度的XQS指标却并未有明显变化。可见CPQ-LSTM different computing nodes
能在不降低预测精度的前提下，有效避免分位数交
叉，改善预测分位数的合理性。 4 结论
3）在预测区间锐度方面，尽管L-QR在50%置负荷概率预测能更好度量负荷的不确定性，为
信度下的XPINRW最低，预测结果更加紧致，但实质电力市场参与者提供更丰富和全面的决策参考信
上其训练得到的分位数预测结果的XQCS较高，预测息。本文提出了一种基于约束并行 LSTM 神经网络
误差较大。而Q-LSTM和CPQ-LSTM的XPINRW相较传分位数回归的短期电力负荷概率预测方法，结合实
统方法有了明显的降低，其中CPQ-LSTM的XPINRW 际算例进行验证，主要结论如下：
略高于Q-LSTM，表明加入分位数约束关系后，为 1）相较于传统分位数回归模型，基于 LSTM
满足预测分位数的合理性约束，不可避免地出现了构建的分位数回归预测模型能更好地捕捉到负荷
电网技术 8
变化的动态特征，获得更高的预测精度。 Short-term Load on the Basis of Clustering Algorithm and Chaos

Theory[J]. Power System Technology, 2010,34(11):65-69(in Chinese).
2）CPQ-LSTM 可同时预测得到多个分位数预
[10] C. Guan, P. B. Luh, and L. D et al. Hybrid Kalman Filters for Very
测结果，且在训练过程中采用合适计算节点数的数 Short-Term Load Forecasting and Prediction Interval Estimation[J].
据并行化训练技术，在保证预测效果的同时显著提 IEEE Transactions on Power Systems, 2013, 28(4):3806-3817.
[11] 周建中, 张亚超, 李清清,等. 基于动态自适应径向基函数网络的概
高了预测效率。
率性短期负荷预测[J]. 电网技术, 2010, 34(3):37-41.
3）相较于 Q-LSTM 模型，加入分位数约束关 Zhou Jianzhong, Zhang Yachao , Li Qingqing, et al. Probabilistic
系后的 CPQ-LSTM 模型虽然 PI 变宽，但有效避免 Short-term Load Forecasting Based on Dynamic Self-adaptive Radial
Basis Function Network[J]. Power System Technology, 2010,
了分位数预测值之间的交叉，使预测结果更加合
34(3):37-41(in Chinese).
理，显著改善了 PI 的可靠性。 [12] B. Liu, J. Nowotarski, and T. Hong et al. Probabilistic Load
综上所述，本文方法不仅具有较高的点预测精 Forecasting via Quantile Regression Averaging on Sister Forecasts[J].
IEEE Transactions on Smart Grid, 2017, 8(2):730-737.
度，且能够得到日前各时刻预测负荷更加精确的概
[13] 何耀耀, 许启发, 杨善林,等. 基于 RBF 神经网络分位数回归的电力
率分布，为电网运行人员科学决策提供更加准确和负荷概率密度预测方法[J]. 中国电机工程学报, 2013, 33(1):93-98.
丰富的信息。 He Yaoyao，Xu Qifa，Yang Shanlin，et al．A Power Load Probability
Density Forecasting Method Based on RBF Neural Network Quantile
参考文献 Regression[J]．Proceedings of the CSEE，2013，33(1)：93-98(in
Chinese)．
[1] 康重庆，夏清，刘梅．电力系统负荷预测[M]. 北京：中国电力出 [14] 何耀耀, 刘瑞, 撖奥洋. 基于实时电价与支持向量分位数回归的短
版社，2007：241-250．期电力负荷概率密度预测方法 [J]. 中国电机工程学报 , 2017,
[2] 牛东晓，曹树华，卢建昌，等．电力负荷预测技术及其应用[M]．2 37(3):768-775.
版．北京：中国电力出版社，2009：1-8． He Yaoyao ， Liu Rui ， Han Aoyang ． Short-term Power Load
[3] 肖白，刘庆永，牛强，等．基于元胞负荷特性分析的 RBF 神经网 Proba-bility Density Forecasting Method Based on Real Time Price
络空间负荷预测方法[J]．电网技术，2018，42(1)：301-307． and Support Vector Quantile Regression[J]．Proceedings of the CSEE，
Xiao Bai，Liu Qingyong，Niu Qiang，et al．A Spatial Load Forecasting 2017，37(3)：768-776 (in Chinese)．
Method Based on RBF Neural Network and Cellular Load [15] Wenjie Z, Hao Q, Dipti S. Parallel and Reliable Probabilistic Load
Characteristics Analysis[J]．Power System Technology，2018，42(1)： Forecasting Via Quantile Regression Forest and Quantile
301-307(in Chinese)． Determination[J]. Energy, 2018, 160(OCT.1):810-819.
[4] 吴云, 雷建文, 鲍丽山,等. 基于改进灰色关联分析与蝙蝠优化神经 [16] Wenjie Z, Hao Q, Dipti S. An Improved Quantile Regression Neural
网络的短期负荷预测[J]. 电力系统自动化, 2018, 42(20):73-78. Network for Probabilistic Load Forecasting[J]. IEEE Transactions on
Wu Yun , Lei Jianwen , Bao Lishan , et al. Short-term Load Smart Grid, 2019, 10(4): 4425-4434.
Forecasting Based on Improved Grey Relational Analysis and Neural [17] 于惠鸣, 张智晟, 龚文杰,等. 基于深度递归神经网络的电力系统短
Network Optimized by Bat Algorithm[J]. Automation of Electric 期负荷预测模型 [J]. 电力系统及其自动化学报 , 2019, 31(1):
Power Systems, 2018, 42(20):73-78(in Chinese). 112-116.
[5] 孔祥玉, 李闯, 郑锋,等. 基于经验模态分解与特征相关分析的短期 Yu Huiming, Zhang Zhisheng, Gong Wenjie, et al. Short-term Load
负荷预测方法[J]. 电力系统自动化, 2019, 43(5):75-85. Forecasting Model of Power System Based on Deep Recurrent Neural
Kong Xiangyu, Li Chuang , Zheng Feng, et al. Short-term Load Network[J]. Proceedings of the CSU-EPSA, 2019, 31(1): 112-116(in
Forecasting Method Based on Empirical Mode Decomposition and Chinese).
Feature Correlation Analysis[J]. Automation of Electric Power [18] 梁智,孙国强,李虎成,等.基于 VMD 与 PSO 优化深度信念网络的短
Systems, 2019, 43(5):75-85(in Chinese). 期负荷预测[J].电网技术,2018, 42(2):598-606.
[6] 赵佩，代业明．基于实时电价和加权灰色关联投影的 SVM 电力负 Liang Zhi, Sun Guoqiang, Li Hucheng, et al. Short-Term Load
荷预测[J]．电网技术，2020，44(4)：1325-1332． Forecasting Based on VMD and PSO Optimized Deep Belief
Zhao Pei，Dai Yeming．Power Load Forecasting of SVM Based on Network[J]. Power System Technology, 2018,42(2):598-606(in
Real-time Price and Weighted Grey Relational Projection Chinese).
Algorithm[J]．Power System Technology，2020，44(4)：1325-1332(in [19] 赵兵，王增平，纪维佳，等．基于注意力机制的 CNN-GRU 短期
Chinese)．电力负荷预测方法[J]．电网技术，2019，43(12)：4370-4376．
[7] Hong, Tao, Wang, Pu. Fuzzy interaction regression for short term load Zhao Bing，Wang Zengping，Ji Weijia，et al．A Short-term Power
forecasting[J]. Fuzzy Optimization & Decision Making, 2014, Load Forecasting Method Based on Attention Mechanism of
13(1):91-103. CNN-GRU[J] ． Power System Technology ， 2019 ， 43(12) ：
[8] 谷云东, 张素杰, 冯君淑. 大用户电力负荷的多模型模糊综合预测 4370-4376(in Chinese)．
[J]. 电工技术学报, 2015, 030(23):110-115. [20] 李鹏,何帅,韩鹏飞,等.基于长短期记忆的实时电价条件下智能电网
Gu Yundong, Zhang Sujie, Feng Junshu. Multi Model Fuzzy 短期负荷预测[J].电网技术,2018,42(12):4045-4052.
Comprehensive Prediction of Power Load for Large Li Peng，He Shuai，Han Pengfei，et al．Short-term Load Forecasting
Users[J].Transactions of China Electrotechnical Society, 2015, of Smart Grid Under Real-time Electricity Price Based on Long-term
030(23):110-115(in Chinese). and Short-term Memory[J]．Power System Technology，2018，
[9] 方仍存,周建中.应用聚类算法和混沌理论的短期负荷概率性区间预 42(12)： 4045-4052(in Chinese)．
测[J].电网技术,2010,34(11):65-69. [21] 彭文, 王金睿, 尹山青. 电力市场中基于 Attention-LSTM 的短期
Fang Rencun, Zhou Jianzhong. Probabilistic Interval Forecasting of 负荷预测模型[J]. 电网技术, 2019, 43(5):1745-1751.
电网技术 9
Peng Wen，Wang Jinrui，Yin Shanqing．Attention-LSTM Based Short

Term Load Forecasting Model in the Electricity Market [J]．Power
System Technology，2019，43(5)：1745-1751 (in Chinese)．
[22] 张宇帆，艾芊，林琳，等．基于深度长短时记忆网络的区域级超
短期负荷预测方法[J]．电网技术，2019，43(6)：1884-1891．
Zhang Yufan，Ai Qian，Lin Lin，et al．A Very Short-term Load
Forecasting Method Based on Deep LSTM RNN at Zone
Level[J]．Power System Technology，2019，43(6)：1884-1891(in
Chinese)．
[23] C. Li, G. Tang, X. Xue,et al. Short-Term Wind Speed Interval
Prediction Based on Ensemble GRU Model[J]. IEEE Transactions on
Sustainable Energy, 2020,11(3):1370-1380.
[24] 杨楠, 黄禹, 叶迪,等. 基于 NACEMD 和改进非参数核密度估计的
风功率波动性概率分布研究[J]. 电网技术, 2019, 43(3):173-180.
Yang Nan, Huang Yu, Ye Di, et al. Study on Probability Distribution
of Wind Power Fluctuation Based on NACEMD and Improved
Nonparametric Kernel Density Estimation[J]. Power System
Technology,2019, 43(3):173-180.
[25] 张斌，庄池杰，胡军，等．结合降维技术的电力负荷曲线集成聚
类算法[J]．中国电机工程学报，2015，35(15)：3741-3749．
Zhang Bin，Zhuang Chijie，Hu Jun，et al．Ensemble Clustering
Algorithm Combined with Dimension Reduction Techniques for
Power Load Profiles[J]．Proceedings of the CSEE，2015，35(15)：
3741-3749 (in Chinese)．
________________________
收稿日期：2020-07-15。
作者简介：
李丹(1980)，女，博士，讲师/工程师，硕士生
导师，研究方向为新能源发电、负荷预测及电力系
统优化调度，E-mail：lucy2140@163.com；
张远航(1994)，男，通信作者，硕士研究生，
研究方向为电力系统运行与控制， E-mail ：
1016513170@qq.com。
（责任编辑王金芝）
电网技术 10
附录
开始
输入数据并进行归一化处理
训练集验证集测试集
设置模型基本超参数
训练集子集1 训练集子集2 ... 训练集子集n
计算节点1 计算节点2 ... 计算节点n
初始化Q-LSTM i模型权重及偏置
在分位点 τ 1 下对在分位点τ 2 下对 ... 在分位点τ r 下对
Q-LSTM i 模型进 Q-LSTM i 模型进 Q-LSTM i 模型进
行训练行训练行训练
N 是否达到迭 N 是否达到迭是否达到迭 N

...
代终止条件? 代终止条件? 代终止条件?
预训练
Y W( 1 ),b( 1 ) Y W( 2 ),b( 2 ) W( r ),b( r ) Y
对CPQ-LSTM模型进行训练
网络并行训练，各
计算节点参数共享
N 是否达到迭整体训练，对权重
代终止条件? 及偏置进行微调
确定最佳权重及偏置参数
根据验证误差优选模型的最佳超参数
建立预测网络
反归一化得到各分位数预测结果
利用高斯核密度估计得出预测点的
概率密度曲线
对预测结果进行评价分析
结束
图 1 CPQ-LSTM 模型预测流程图
Fig.1 Prediction flow of CPQ-LSTM model
3200
3000 90% 80% 70% 60% 50% 40%
2800 30% 20% 10% 中位数实际负荷
2600
负荷/kW
2400
2200
2000
1800
1600
1400
1200
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
采样点/15min
图 2 测试集 CPQ-LSTM 预测结果构建的 PI

Fig.2 PIs constructed by CPQ-LSTM from the test set

基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹

Uploaded by

Copyright:

Available Formats

You might also like

基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹

Uploaded by

Copyright:

Available Formats

电网技术

Power System Technology

题目： 基于约束并行 LSTM 分位数回归的短期电力负荷概率预测方法