Professional Documents
Culture Documents
基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹
基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹
基于约束并行LSTM分位数回归的短期电力负荷概率预测方法 李丹
《电网技术》网络首发论文
网络首发:在编辑部工作流程中,稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶
段。录用定稿指内容已经确定,且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期
刊特定版式(包括网络呈现版式)排版后的稿件,可暂不确定出版年、卷、期和页码。整期汇编定稿指出
版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合《出
版管理条例》和《期刊出版管理规定》的有关规定;学术研究成果具有创新性、科学性和先进性,符合编
辑部对刊文的录用要求,不存在学术不端行为及其他侵权行为;稿件内容应基本符合国家有关书刊编辑、
出版的技术标准,正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。
为确保录用定稿网络首发的严肃性,录用定稿一经发布,不得修改论文题目、作者、机构名称和学术内容,
只可基于编辑规范进行少量文字的修改。
出版确认:纸质期刊编辑部通过与《中国学术期刊(光盘版)》电子杂志社有限公司签约,在《中国
学术期刊(网络版)》出版传播平台上创办与纸质期刊内容一致的网络版,以单篇或整期出版形式,在印刷
出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为《中国学术期刊(网络版)》是国家新闻出
版广电总局批准的网络连续型出版物(ISSN 2096-4188,CN 11-6037/Z),所以签约期刊的网络版上网络首
发论文视为正式出版。
网络首发时间:2021-01-15 13:05:01
网络首发地址:https://kns.cnki.net/kcms/detail/11.2410.tm.20210114.1624.003.html
电 网 技 术 1
CPQ-LSTM 模型。此外,采用数据并行式训练方法
对 CPQ-LSTM 进行训练,提高预测效率。为验证
2 基于 LSTM 分位数回归的短期负荷概率预
本文方法,以某实际地区负荷预测为例,结果表明
测方法
CPQ-LSTM 模型具有更高的预测效率,不仅能获得 2.1 LSTM 单条件分位数回归模型
准确的点预测结果,而且可以有效避免分位数预测 考虑到负荷预测的时序性和非线性,将 LSTM
值之间的交叉,生成更合理的预测负荷概率分布。 用作短期负荷预测的条件分位数函数,分位点 τi 下
Q-LSTMi 模型的损失函数为:
1 LSTM 神经网络和分位数回归 N
LSTM 通过记忆单元和门控机制巧妙保留了
1 W 2 ( i )
长短期记忆,其单元基本架构如图 1 所示。LSTM
(9)
单元由遗忘门、输入门和输出门组成,遗忘门控制
其中:W(τi)={Wf(τi), Wi(τi), Wc(τi), Wo(τi), WS(τi)}和
历史信息被遗忘的程度,输入门控制接受新信息的
b(τi)={bf(τi), bi(τi), bc(τi), bo(τi), bS(τi)}分别为分位点 τi
程度,输出门则决定最终输出的信息。
下 LSTM 全部权重参数矩阵集合和偏置向量集合;
Ct-1 Ct Ct λ1 为正则项惩罚参数;ρτ(a)为检验函数。
a ,a 0
(a)
tanh (10)
ft it
ot ( 1)a, a 0
σ (Wf ) σ (Wi ) tanh(Wc ) σ (Wo ) 为 获 得 Q-LSTMi 模 型 的 最 优 参 数 {W(τi),
ht-1 ht b(τi)}opt,利用梯度下降法更新参数时,需要计算反
xt 向传播误差。
图1 LSTM 神经网络结构图 先定义两个梯度函数 ht ( i ) 和 Ct ( i ) :
Fig. 1 Architecture of LSTM unit
L( i ) yˆt ,i
WS,i τi , yt yˆt ,i
T
给定当前输入 xt,上一时刻隐含层状态 ht-1 和 h ( i ) T (11)
存储状态 Ct-1,详细的计算过程如下:
t
yˆt ,i ht ,i WS,i (1 τi ), yt yˆt ,i
it (Wi [ xt , ht 1 ]T bi ) (1)
ft (Wf [ xt , ht 1 ]T bf ) (2)
ot (Wo [ xt , ht 1 ] bo )
T
(3)
电 网 技 术 3
Q-LSTM1
步骤 1,输入初始权重和偏置 W0(τi)和 b0(τi); QYt (1 Xt )
...
步骤 2,由式(1~7),计算 LSTM 各输出 ft,i、it,i、
Ct ,i 、Ct,i、ot,i、ht,i、 yˆ t ,i 当前迭代值;
QYt (2 Xt )
步骤 3,计算梯度 ht ( i ) 和 Ct ( i ) ,并据此计
Q-LSTM2
Floss
Xt
...
算各权重和偏置的梯度。
...
...
1)隐含层至输出层参数的梯度为
...
...
WS ( i ) i (1 i ) (ht ,i )T 21WS ( i ) (13)
Q-LSTMr
yt yˆt ,i yt yˆt ,i
QYt (r Xt )
...
bS ( i ) i (1 i ) (14) W(i ), b(i )
yt yˆt ,i
yt yˆt ,i
2)根据 ht ( i ) 、 Ct ( i ) 和式(1)—(4)分别计 图3 CPQ-LSTM 模型
Fig. 3 CPQ-LSTM model
算遗忘门、输入门、候选存储单元和输出门参数的
梯度。 基于式(9),将 r 个分位点下的分位数损失函数
步骤 4:更新权重和偏置。 求和,可构建 LSTM 多分位数的损失函数。然而,
W* ( i ) W* ( i ) W ( i ) (15)
*
由分位数的固有属性,Yt 的条件分位数应满足:
b* ( i ) b* ( i ) b* ( i ) (16)
QYt (1 Xt ) QYt ( 2 Xt ) ... QYt ( r Xt ) ,故本文加
其中:η 为学习率;W 和 b 代表相应的权重矩阵和
偏置向量。 入违反分位数预测值约束关系惩罚项的组合层,使
步骤 5,重复步骤 2—4,直至达到收敛条件, 模型尽量避免相邻分位数之间的交叉。CPQ-LSTM
获得模型最优参数{W(τi), b(τi)}opt。 模型损失函数可表示为
开始
(Y Q ( i X t )) 1W 2 ( i )
r N
Floss min t Yt
初始化权重、偏置 W ( i ),b ( i ) i
i 1 t 1
r 1 N
计算LSTM各输出
2 (QY ( i X t ) QY ( i 1 X t ))
t t
(17)
i t 1
根据式(11)计算损失函数:L( i )
v , v 0
其中: (v) ; 2 为惩罚参数。
L(i ) 10-6? 0, v 0
根据式(17),对应的梯度 ht ( i ) 、 WS ( i ) 和
Y
N 获得模型最优参数
b ( i ) 相应变为
达到最大训 Y
练次数? S
N WST i (1 ui ), yt yˆt
(18)
计算输出层、隐含层各单元误差 h ( i )
WS (1 i )(1 ui ), yt yˆt
t T
计算各权重及偏置的梯度
Floss
W ( i )
更新权重、偏置 结束 S
WS ( i )
图2 Q-LSTM 模型训练过程
i (1 ui ) (1 i )(1 ui ) (ht ,i )
Fig. 2 Training process of Q-LSTM model T
QYt ,m ( i X t ) QYt ,m ( i1 X t )
2 , i 1 LSTM 模型的参数初始值,进一步提高训练效率。
CPQ-LSTM 模型的训练和预测流程如附录图
2 1,具体步骤如下:
QYt ,m ( i X t ) QYt ,m ( i1 X t ) (21)
ui ,m 1)输入 N 个样本日的负荷功率和影响因素
(2 ), 2 i r
QYt ,m ( i1 X t ) QYt ,m ( i Xt ) (如温度和降雨数据等),并对数据归一化,得到
Q ( X (2 ), i r {Xt,Yt}N。
Yt , m i 1 t ) QYt ,m ( i X t )
2)将数据集分为训练集、验证集和测试集,
m 1,..., o 设置模型超参数,如神经元数量 m、计算节点数 n、
遗忘门、输入门、存储单元、候选存储单元和
惩罚参数 λ1、λ2 等。
输出门参数的梯度与 2.1 节中计算方式相同。
3)将训练集均分为 n 个子集,利用对应的 n
2.3 神经网络的数据并行式训练
个计算节点对网络并行训练,每次迭代按式(22)
当分位点设置较多时,LSTM 对大型数据集训
生成全局参数集。各计算节点的训练过程如下。
练耗时较多,因此本文采用神经网络的数据并行式
①随机初始化 Q-LSTMi(i=1,...,r)模型参数,
训练方法提高训练效率。如图 4 所示,数据并行式
采用 2.1 节方法对 Q-LSTMi 分别训练。
训练通过 GPU(graphics processing unit)分布式计
② 将 训 练 得 到 的 {W(τi),b(τi)}opt 设 为 CPQ-
算实现,将训练集均等分为多个子集,分配到计算
LSTM 模型训练的初始参数。
系统的各个节点,每个计算节点负责处理该数据集
③如 2.2 节所述,整体训练 CPQ-LSTM 模型,
的一个不同子集,从而减少训练时间。
对{W(τi), b(τi)}r 进行微调,确定 CPQ-LSTM 模型的
最佳权重及偏置参数。
4)将验证集样本输入训练好的 CPQ-LSTM 模
型,根据验证误差优选模型的最佳超参数。
数
据 5)将测试样本输入具有最佳超参数的 CPQ-
... 并
行
化 LSTM 预测模型,对输出的预测结果进行反归一化,
节点1 节点2 节点n 得到预测日各时刻预测负荷的 r 个分位数。
6)比较负荷概率预测结果和真实负荷值,对
图 4 神经网络的数据并行式训练
Fig. 4 Data parallel training of Neural network 模型进行评价分析。
由于每个节点训练其数据子集均会得到一套 3 算例分析
模型参数,故在训练过程中,将各节点训练得到的
3.1 算例描述
参数在整个集群中共享,并通过式(22)的异步随
本文选取某实际地区 2016 年 1 月 1 日至 2017
机梯度下降公式计算新的全局权重集,分配给计算
年 6 月 30 日的 15 min 级负荷数据集进行日前负荷
系统的每一个节点。
n
概率预测。其中 80%用于训练,10%用于验证,后
Z 1 Z Z , j (22) 10%用于测试。输入变量 Xd=[Td, Rd],包括预测日
j 1
24 时刻气温 Td=[T1, T2,…, T24]d 和 M 个分区的降雨
其中:Zυ={W,b}(υ)为第 υ 次迭代训练得到的全局参
量 Rd=[R1, R2,…, RM]d,在本算例中 M=9。
数集;△Zυ,j 为由 2.2 节所示第 υ 次迭代训练得到
为验证 CPQ-LSTM 模型的预测性能,将它与
的第 j 个计算节点的参数梯度;n 为计算节点的总
线性分位数回归模型(linear quantile regression,
个数; 为缩放系数。
L-QR),带参数整流线性激活函数的 bQRNN[16],
2.4 CPQ-LSTM 模型的训练及预测流程
QRNN[16] 和 Q-LSTM 进 行 对 比 。 模 型 均 在
通过 CPQ-LSTM 模型和数据并行式训练方法,
matlab2019a 搭建,在 3.40 GHz Intel®Core(TM)/
可一次训练得到具有增量比例分位点下负荷的条
i5-7200CPU/GeForce940MX-GPU/ 8GB 内存的计算
件分位数,同时通过约束惩罚函数有效避免分位数
机上运行。经验证集优选后的模型超参数见表 1,
间的交叉。此外,本文在 CPQ-LSTM 模型整体训
预测分位点区间为 0.01~0.99,间隔为 0.01,
即 r=99。
练之前,增加 Q-LSTMi(i=1,...,r)的预训练环节,
将训练各 Q-LSTMi 得到的{W(τi),b(τi)}opt 作为 CPQ-
电 网 技 术 5
表1 模型的超参数设置 3)可靠性指标。
Table 1 Hyperparameter settings of the models
模型 bQRNN QRNN Q-LSTM CPQ-LSTM X PICP (27)
神经元数量 200
N
Epochs 100 其中 εα 为置信度 1-α 下实际值落入预测区间的数
时窗长度 — — 6 6 量。
η 0.01
PICP 与其标称值(PI nominal confidence,PINC)
λ1 1
λ2 — — — 20 的偏差指数 XDev[11]定义如下。
并行计算节点数 n — — — 4
— — — 0.25
X Dev X PICP X PINC (28)
1900
2 N r 1 2 1400
vt ,i
20 40 60 80 100 120 140 160 180
CS
X 采样点/15min
100 2400
负荷/kW
RMSE/kW
0
MAPE/%
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000 4.13
4 3.45 30.55 32.58 40
(a) 6点
核密度估计
0.015
2
0.01 实际值 20
0.005
0 0 0
L-QR bQRNN QRNN Q-LSTM CPQ-LSTM
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000
0.015
(b) 12点 图 8 中位数预测结果的 XMAPE 和 XRMSE 对比
0.01 实际值
0.005 Fig. 8 XMAPE and XRMSE comparison of median forecasts
0
1550 1600 1650 1700 1750 1800 1850 1900 1950 2000 3.4.2 概率预测结果对比分析
(c) 18点
各模型概率预测结果的评价指标统计对比如
负荷值/kW
表2、3所示。表2列出了训练时长Ttrain、XQS、XCS、
图7 2017 年 5 月 25 日部分时刻预测负荷概率密度曲线 XQCS及50%、90%置信度下的XPINRW和违背相邻分位
Fig. 7 Probability density curve of predicted load at some
数约束关系样本占比f;表3列出了不同置信度下
time points on May 25, 2017
XPICP和XDev的对比,其中XAD和XMD分别为各置信度
下XDev的均值和最大值。图9给出了整个测试集每个
样本日的XCS指标曲线;图10给出了各模型预测结
果的XPICP-XPINC曲线,越接近理想曲线表明预测效
果越好。
表2 各模型评价指标对比
Table 2 Comparison of evaluation indexes of the models
模型 XQS/kW XCS/kW f/% XQCS/kW XPINRW(50%) XPINRW(90%) Ttrain/s
表3 各模型XPICP和XDev对比
Table 3 Comparison of XPICPs and XDevs of the models
XPICP XDev 均值 XDev 最大值
模型
置信度 10% 置信度 20% 置信度 30% 置信度 40% 置信度 50% 置信度 60% 置信度 70% 置信度 80% 置信度 90% XAD XMD
L-QR 3.45 7.14 9.38 10.80 13.10 15.30 18.03 21.29 24.92 36.29 65.08
bQRNN 6.34 13.30 19.25 25.57 32.12 40.72 49.28 57.97 70.57 14.99 22.03
QRNN 13.63 22.30 32.05 54.37 64.22 69.57 76.56 86.50 96.21 7.27 14.37
Q-LSTM 6.30 27.83 36.97 44.21 52.51 60.54 63.56 80.43 85.63 4.11 7.83
CPQ-LSTM 12.05 19.53 30.76 41.14 50.38 60.53 69.72 79.13 89.51 0.77 2.05
7
电 网 技 术
350 预测区间变宽的情况。
L-QR
300
bQRNN
250 QRNN
4)结合表3和图10可看到,Q-LSTM和CPQ-
XCS/kW
Q-LSTM
200
CPQ-LSTM LSTM生成的XPICP 曲线更接近理想曲线,同时XAD
150
100 和XMD也有明显的降低,可见基于LSTM的分位数回
50
0 归模型生成的PI可靠性更高。而CPQ-LSTM具有更
0 5 10 15 20 25 30 35 40 45 50 55
样本日/天
低的XAD (0.77%)和XMD (2.05%),其XMD 仅为
图 9 测试集各样本日的 XCS Q-LSTM XAD的50%,表明CPQ-LSTM模型明显降低
Fig. 9 XCSs of each sample day from the test set 了覆盖率偏差,提高了预测区间的可靠性。
1 综上所述,CPQ-LSTM和Q-LSTM的预测性能
理想曲线
0.9 L-QR 明显优于传统分位数回归模型。而与Q-LSTM相比,
bQRNN
0.8 QRNN CPQ-LSTM得到的分位数预测结果可有效避免相
0.7 Q-LSTM
CPQ-LSTM 邻分位数之间的交叉,使得预测区间的可靠性更
0.6
高,同时,其XMD仅为Q-LSTM的1/4,且训练时间
XPICP
0.5
0.4
仅为Q-LSTM的1/3。
0.3 3.4.3 不同计算节点预测结果对比分析
0.2 为分析选取不同计算节点 n 对预测效果的影
0.1
响,本文对 CPQ-LSTM 在 n 为 1~8 时的 XQCS 和 Ttrain
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 进行对比,如图 11 所示。当 n 增加时,模型训练
XPINC
时间成比例减少;而当 n 不大于 4 时,
预测模型 XQCS
图 10 各模型的 XPICP-XPINC 曲线 并未有明显差异,但当 n 超过 4 时,XQCS 逐渐增加,
Fig. 10 XPICP-XPINC curves of the models
表明计算节点数过多时,可能导致单计算节点的训
对比不同负荷概率预测模型的预测结果: 练样本太少,无法较好反映样本总体而降低模型的
1)由表 2 可以看出,相较于 Q-LSTM,L-QR、 预测效果。故采用数据并行化训练技术时,需要合
bQRNN 和 QRNN 的训练参数较少,它们耗费的训 理选择计算节点数,以在不影响预测效果的同时提
练时间少于 Q-LSTM。而采用了数据并行技术的 高预测效率。
CPQ-LSTM,训练时间比 Q-LSTM 显著减少,基本 120
689
750
XQCS
101.76
与 L-QR 相当。 Ttrain
82.74
2)Q-LSTM和CPQ-LSTM的XQCS远低于其他几 80 500
XQCS/kW
显低于其他几种方法,且CPQ-LSTM在整个测试集 0 0
n=1 n=2 n=3 n=4 n=5 n=6 n=7 n=8
的综合XCS指标仅为Q-LSTM的27.28%,违背约束的 图 11 不同计算节点时 CPQ-LSTM 的 XQCS 和 Ttrain 对比
样本占比f相较Q-LSTM降低了16.3%,但反映预测 Fig. 11 Comparison of XQCSs and Ttrains of CPQ-LSTM at
精度的XQS指标却并未有明显变化。可见CPQ-LSTM different computing nodes
能在不降低预测精度的前提下,有效避免分位数交
叉,改善预测分位数的合理性。 4 结论
3)在预测区间锐度方面,尽管L-QR在50%置 负荷概率预测能更好度量负荷的不确定性,为
信度下的XPINRW最低,预测结果更加紧致,但实质 电力市场参与者提供更丰富和全面的决策参考信
上其训练得到的分位数预测结果的XQCS较高,预测 息。本文提出了一种基于约束并行 LSTM 神经网络
误差较大。而Q-LSTM和CPQ-LSTM的XPINRW相较传 分位数回归的短期电力负荷概率预测方法,结合实
统方法有了明显的降低,其中CPQ-LSTM的XPINRW 际算例进行验证,主要结论如下:
略高于Q-LSTM,表明加入分位数约束关系后,为 1)相较于传统分位数回归模型,基于 LSTM
满足预测分位数的合理性约束,不可避免地出现了 构建的分位数回归预测模型能更好地捕捉到负荷
电 网 技 术 8
收稿日期:2020-07-15。
作者简介:
李丹(1980),女,博士,讲师/工程师,硕士生
导师,研究方向为新能源发电、负荷预测及电力系
统优化调度,E-mail:lucy2140@163.com;
张远航(1994),男,通信作者,硕士研究生,
研 究 方 向 为 电 力 系 统 运 行 与 控 制 , E-mail :
1016513170@qq.com。
(责任编辑 王金芝)
电 网 技 术 10
附录
开始
输入数据并进行归一化处理
设置模型基本超参数
初始化Q-LSTM i模型权重及偏置
在 分 位点 τ 1 下 对 在 分位 点τ 2 下 对 ... 在 分位 点τ r 下 对
Q-LSTM i 模型 进 Q-LSTM i 模型进 Q-LSTM i 模型进
行训练 行训练 行训练
对CPQ-LSTM模型进行训练
网络并行训练,各
计算节点参数共享
N 是否达到迭 整体训练,对权重
代终止条件? 及偏置进行微调
确定最佳权重及偏置参数
根据验证误差优选模型的最佳超参数
建立预测网络
反归一化得到各分位数预测结果
利用高斯核密度估计得出预测点的
概率密度曲线
对预测结果进行评价分析
结束
图 1 CPQ-LSTM 模型预测流程图
Fig.1 Prediction flow of CPQ-LSTM model
3200
3000 90% 80% 70% 60% 50% 40%
2800 30% 20% 10% 中位数 实际负荷
2600
负荷/kW
2400
2200
2000
1800
1600
1400
1200
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
采样点/15min