基于 L S T M 和多任务学习的综合能源系统多元负荷预测: DOI:10. 7500/AEPS20200306002

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

第 45 卷 第5期 2021 年 3 月 10 日 Vol. 45 No. 5 Mar.

10,2021
DOI:10. 7500/AEPS20200306002

基于 LSTM 和多任务学习的综合能源系统多元负荷预测
孙庆凯 1 ,王小君 1 ,张义志 1 ,张 放 1 ,张 沛 1 ,高文忠 1,2
(1. 北京交通大学电气工程学院,北京市 100044;2. 丹佛大学电气与计算机工程学院,丹佛 80208,美国)

摘要:随着综合能源利用技术的不断发展与用户用能需求的多元化,现有单一负荷预测方法难以
反映多元负荷间的耦合特性,精确的多元负荷预测将成为综合能源系统优化调度和经济运行的首
要前提。基于此,提出一种以长短时记忆神经网络作为共享层的多任务学习负荷预测方法,经由共
享层模拟多元负荷间的耦合特性,进而达到提升预测精度的目的。首先,以“硬共享机制+长短时
记忆共享层”方式构建多任务学习负荷预测模型,利用共享机制学习不同子任务提供的耦合信息。
其次,通过神经网络可解释性技术对离线训练结果进行可视化解释,证实了所构建模型能够利用子
任务提供的耦合信息来提高预测精度。最后,与传统模型进行对比分析,结果表明所构建模型在预
测精度和时间上具有更好的应用效果。
关键词:综合能源系统;多元负荷预测;多任务学习;长短时记忆神经网络

0 引言 林进行短期负荷预测。文献[10]采用模糊信息粒化
法 处 理 历 史 数 据 ,并 在 此 基 础 上 建 立 支 持 向 量 机 进
传 统 能 源 系 统 单 独 规 划 、设 计 和 独 立 运 行 的 模
行 短 期 负 荷 预 测 。 但 随 着 可 再 生 能 源 接 入 、需 求 侧
式 人 为 割 裂 了 不 同 类 型 能 源 间 的 耦 合 关 系 ,限 制 了
响 应 等 新 因 素 的 加 入 ,传 统 机 器 学 习 方 法 也 遭 遇 了
系 统 运 行 可 靠 性 和 灵 活 性 ,不 再 适 合 社 会 发 展 。 必
瓶颈。
然 需 要 打 破 行 业 壁 垒 ,由 过 去 电 、热 、冷 分 产 分 供 发
近 些 年 来 ,以 深 度 学 习 为 代 表 的 前 沿 机 器 学 习
展 模 式 转 变 为 多 能 联 合 规 划 运 行 模 式[1-2]。 在 转 型
方法在问题分析过程中无须建立精确的数学模型,
过 程 中 综 合 能 源 系 统(integrated energy system,
可通过多层非线性映射逐层学习海量数据中隐藏的
IES)逐渐发展成为一种重要的能源利用方式[3]。其
抽 象 特 征 ,能 较 好 地 拟 合 输 入 与 输 出 之 间 的 非 线 性
内部耦合多种形式的供能、转化和储能设备,外部由
关系[11]。其中长短时记忆(long short-term memory,
能源服务商统一管理,在规划、运行上与传统单一能
LSTM)神 经 网 络 在 电 力 负 荷 预 测 领 域 已 有 相 关 研
源 系 统 有 较 大 区 别[4-5]。 负 荷 预 测 作 为 IES 用 能 管
究[12-14],但 相 比 于 单 一 电 力 负 荷 预 测 ,IES 多 元 负 荷
理和优化调度的首要前提,已不再局限于单一负荷,
预 测 相 关 工 作 仍 处 于 初 级 阶 段 ,文 献[15]通 过 改 进
必 须 统 筹 兼 顾 多 个 能 源 系 统 ,这 对 IES 多 元 负 荷 预
粒 子 群 算 法 ,依 据 不 同 粒 子 惯 性 权 重 选 择 小 波 神 经
测准确性、实时性及可靠性提出了更高要求[6]。
网 络 寻 优 策 略 进 行 多 元 负 荷 预 测 。 文 献[16]结 合
短期负荷预测分为传统方法和机器学习方法。
Kpca 降 维 技 术 与 径 向 基 神 经 网 络 进 行 多 元 负 荷 预
传 统 方 法 以 时 间 序 列 法 、回 归 分 析 法 为 代 表 ,文 献
测 。 该 方 法 普 遍 是 对 模 型 参 数 与 结 构 进 行 优 化 ,在
[7]利 用 混 沌 时 间 序 列 方 法 进 行 短 期 电 力 负 荷 预
处理不同形式用能耦合问题上仍存在一定的局限。
测 。 文 献[8]通 过 稀 疏 惩 罚 分 位 数 回 归 分 析 预 测 短
IES 中 各 用 户 自 身 不 同 形 式 用 能 存 在 耦 合 ,可
期 电 力 负 荷 。 传 统 方 法 虽 有 一 定 成 效 ,但 随 着 能 源
依据内部终端消耗以及外部因素采用不同策略进行
系 统 的 不 断 发 展 ,用 能 需 求 同 时 受 到 多 种 因 素 的 共
多 能 综 合 优 化 ,因 此 针 对 用 户 个 体 的 多 元 负 荷 预 测
同影响,致使无法建立精确的数学模型,难以获得令
困难较大。本文构建的多元负荷预测模型主要是面
人 满 意 的 结 果 。 机 器 学 习 方 法 以 随 机 森 林 、支 持 向
向 IES 能 源 服 务 商 ,利 用 多 任 务 学 习(multi-task
量机为代表,文献[9]在数据聚类基础上构造随机森
learning,MTL)通 过 共 享 层 对 用 户 总 体 多 元 负 荷 间
收稿日期:2020-03-06;修回日期:2020-05-28 。 的 复 杂 耦 合 信 息 进 行 学 习 ,以 确 保 IES 能 源 服 务 商
上网日期:2020-07-17。 能够向用户提供精确的多元负荷需求。该方法也适
国家自然科学基金资助项目(51977005)。 用于区域型 IES 电、热、气联合预测。

http ://www.aeps -info.com 63


2021,45(5) · 学术研究 ·

本 文 在 现 有 研 究 基 础 上 提 出 了 一 种 LSTM- 能 需 求 呈 现 出 随 机 性 、不 确 定 性 。 同 时 不 同 的 系 统
MTL 多 元 负 荷 预 测 方 法 ,旨 在 利 用 LSTM 时 序 记 功 能 定 位 也 是 影 响 用 能 特 性 的 重 要 原 因 ,工 业 区 往
忆 功 能 与 MTL 耦 合 信 息 共 享 学 习 特 性 来 提 升 IES 往电力负荷占主导地位,冷热负荷辅助,共同服从生
能源服务商多元负荷预测精度。 产 进 度 安 排 ;生 活 区 电 热 负 荷 则 往 往 与 人 的 活 动 密
切相关,不同类型负荷间表现出一定的耦合特性。
1 IES 用能特性分析与 MTL
IES 用能特性决定了某一用能需求变化时必将
1. 1 IES 用能特性分析 引起能源服务商对其余类型用能需求的调整。负荷
IES 作 为 新 一 代 能 源 系 统 的 重 要 组 成 ,是 满 足 预 测 作 为 IES 用 能 需 求 管 理 与 优 化 调 度 的 首 要 前
不同用户多类型用能需求的坚实保障。其能源服务 提 ,倘 若 仍 采 用 传 统 单 一 负 荷 预 测 方 法 则 难 以 兼 顾
商 可 在 汇 总 、分 析 不 同 用 户 各 类 用 能 需 求 的 基 础 上 不同用能需求间的差异性、随机性及耦合性,无法确
准 确 预 测 多 元 负 荷 需 求 ,并 协 调 IES 内 部 转 化 、存 保负荷预测精度。同时鉴于 IES 在长时间运行过程
储 、分 配 、消 费 等 环 节 以 满 足 不 同 用 户 对 能 源 的 需 中大量能量转换耦合信息被保存于 IES 能源服务商
求[17],其交互结构可简化为图 1。 数 据 库 中 ,但 这 些 隐 藏 在 数 据 中 的 能 量 转 换 特 性 很
IES

IES 难通过建立详细的数学模型进行特征提取与总
结[18]。 因 此 本 文 考 虑 借 助 MTL 对 复 杂 耦 合 信 息 进
B8M" 3N
行 学 习 ,经 由 共 享 机 制 并 行 训 练 多 个 负 荷 预 测 子 任
 *
务,共同完成 IES 多元负荷预测任务。
*4 *B8
1. 2 MTL
4 
MTL 在 处 理 一 个 问 题 的 过 程 中 可 以 通 过 使 用
*&"  B8
共享层来学习并获得其他相关子任务所提供的辅助
&!D &0 &B8
耦 合 信 息 ,进 而 达 到 提 高 模 型 输 出 精 度 与 增 强 泛 化
&
!4 A0 !B8 能力的目的[19]。
IES MTL 包 含 一 组 任 务 y t ( t ∈ T ) 和 数 据 集 合
{ x i,y i1,y i2,⋯,y it,⋯,y iT } ( i = 1,2,⋯,N ),其 中 T 为
*6!N 6#DF
任 务 个 数 ,N 为 数 据 样 本 个 数 ,y it 为 第 i 个 数 据 点 的
30*
第 t 个 任 务 的 标 签 。 定 义 预 测 函 数 为 f t ( x;θ sh,θ t ):
*
x → y t ,其 中 θ sh 为 不 同 任 务 共 享 的 参 数 ,θ t 为 任 务 相
**L!
*1 关 的 参 数 ,则 MTL 的 整 体 优 化 损 失 函 数 可 定 义
*& *
6 如下:


30 T

min ∑ α t L̑ t ( θ sh,θ t )
*&L!  *L!
*n (1)
t=1
& 
**6L!D 式 中 :α t 为 任 务 的 权 重 系 数 ;L̑ t ( θ sh,θ t ) 为 损 失 函 数 ,
N
K N *6 &6 6 &!6 定义为 ( 1/N ) ∑L( f t
( x i;θ sh,θ t ),y it )。
i= 1
图 1 交互结构简化模型
Fig. 1 Simplified model of interactive structure 使 用 MTL 构 建 IES 多 元 负 荷 预 测 模 型 的 关 键
在于选择模型结构和构建共享学习层。
目前实际工业园区、商业中心、居民楼宇等典型 1)MTL 按 特 征 共 享 表 示 方 式 可 分 为 硬 共 享 机
IES 的能源服务商普遍需要向其用户提供电、热、冷 制和软共享机制。其中硬共享机制多个子任务共同
等多种用能需求,明显受到气象条件、人类活动以及 使用同一特征共享层,特征参数完全相同;软共享机
建 筑 特 性 等 因 素 影 响 。 在 气 象 条 件 方 面 ,由 于 气 温 制 每 一 个 子 任 务 都 有 自 己 的 特 征 参 数 ,不 同 子 任 务
变 化 ,南 北 方 在 冷 热 负 荷 需 求 上 表 现 出 明 显 的 季 节 间需要进行必要的正则化处理才能达到信息共享的
性、地域性差异。在人类活动方面,不同的社会行为 目的。相比之下,硬共享机制在特征参数、模型结构
会 对 IES 用 能 特 性 产 生 影 响 ,例 如 居 民 楼 宇 IES,工 上 更 加 简 单 ,针 对 所 要 构 建 的 IES 多 元 负 荷 预 测 模
作日时居民普遍外出,系统负荷多为刚性负荷;而非 型 这 种 参 数 繁 多 、结 构 复 杂 的 情 况 更 不 易 产 生 过 拟
工作日时居民活动频繁,致使用能设备灵活多样,用 合 问 题 ,模 型 泛 化 能 力 也 更 强 。 同 时 考 虑 到 软 共 享

64
孙庆凯,等 基于 LSTM 和多任务学习的综合能源系统多元负荷预测

机 制 相 较 于 硬 共 享 机 制 的 约 束 条 件 更 加 宽 松 ,比 较 确 定 各 类 负 荷 的 组 成 以 及 必 要 的 相 关 信 息 ,如 环 境
适 用 于 不 具 有 紧 密 关 系 的 任 务 ,而 并 不 适 用 于 IES 因 子 、节 假 日 信 息 等 。 同 时 考 虑 到 IES 中 多 元 负 荷
多元负荷预测这种具有复杂耦合性的问题[19-20]。因 预 测 具 有 一 定 的 周 特 性 和 日 特 性 ,即 待 预 测 时 刻 负
此本文采用硬共享机制进行 IES 多元负荷预测模型 荷 数 据 与 前 一 周 、前 一 天 负 荷 具 有 很 大 的 相 关 性 。
网络结构设计,硬共享机制网络结构如附录 A 图 A1 因此本文选择环境因子、日类型信息、多元负荷数据
所示。 等 共 同 作 为 输 入 特 征 x。 而 输 出 特 征 y 则 为 待 测 时
2)在 共 享 学 习 层 构 建 过 程 中 ,考 虑 到 研 究 对 象 刻实际多元负荷数据。输入特征 x 与输出特征 y 共
IES 多 元 负 荷 预 测 具 有 很 强 的 时 间 序 列 特 性 ,前 一 同构成多元负荷预测问题的样本 { x,y }。具体的输
时刻负荷需求对下一时刻负荷预测具有较大影响, 入/输出特征集如附录 A 表 A1 所示。
因 此 采 用 具 有 记 忆 特 性 的 LSTM 神 经 网 络 来 搭 建 2. 2 数据预处理
共 享 学 习 层 。 LSTM 在 每 个 神 经 元 内 部 添 加 了 遗 首先鉴于所选数据集是某实际 IES 全年运行数
忘门、输入门和输出门,并且增加了一条代表长期记 据,其在测量、传输、存储过程中易出现异常情况,倘
忆的信息流 ,其 LSTM 神经元内部结构如附录 A 图 若 直 接 舍 弃 该 部 分 样 本 ,会 大 大 削 减 建 立 预 测 模 型
A2 所示,具体计算过程如式(2)至式(7)所示。 的 可 用 信 息 ,降 低 模 型 预 测 性 能 。 因 此 采 用 文 献
遗忘门:
[23]方 法 对 其 进 行 缺 失 值 填 充 和 异 常 值 辨 识 ,以 保
f t = σ (W f ⋅[ h t - 1,x t ]+ b f ) (2)
证数据集的完整性和优质性。
输入门: 其次在确定输入/输出数据集后,需要对其进行
~
C t = ft ⋅ C t - 1 + it ⋅ C t (3) 归 一 化 处 理 ,以 防 止 变 量 间 数 量 级 差 异 较 大 影 响 模
~
C t = tanh (W C ⋅[ h t - 1,x t ]+ b C ) (4) 型 预 测 精 度 。 区 别 于 传 统 方 法 ,本 文 采 用 ( x -
i t = σ (W i ⋅[ h t - 1,x t ]+ b i ) (5) x min ) / ( x max - x min )+ 1 的方式将数据归一化至(1,2)
输出门: 之 间 ,其 中 xmin 为 该 输 入 特 征 的 最 小 值 ,xmax 为 该 输
o t = σ (W o ⋅[ h t - 1,x t ]+ b o ) (6) 入 特 征 的 最 大 值 ,主 要 是 为 了 避 免 后 续 计 算 平 均 绝
h t = o t ⋅ tanh ( C t ) (7) 对 百 分 比 误 差(mean absolute percentage error,
MAPE)指标 L MAPE 时出现无穷大的问题。日类型数
式(2)至 式(7)中 相 关 变 量 的 含 义 详 见 文
献[21]。 据 则 以 二 进 制 变 量 对 其 进 行 标 注 ,其 中 0 表 示 工 作

当 输 入 量 x t 进 入 后 首 先 通 过 遗 忘 门 ft 经 由 日,1 表示非工作日。
2. 3 多元负荷预测模型的构建
sigmoid 激 活 函 数 映 射 到[0,1]区 间 内 ,之 后 进 入 输
鉴于深度学习模型构建与训练需要大量的计算
入 门 与 长 期 记 忆 信 息 C t - 1 相 乘 ,对 长 期 记 忆 中 的 数
据 进 行 选 择 性 保 留 ,同 时 添 加 进 入 长 期 记 忆 中 的 新 资 源 ,宜 采 用 高 性 能 服 务 器 ,故 本 文 采 用“ 离 线 训
~ 练 + 在 线 应 用 ”的 方 式 构 建 IES 电 、热 、冷 多 元 负 荷
增 量 i t ⋅ C t ,最 后 由 输 出 门 得 到 输 出 值 o t ,LSTM 通
预 测 神 经 网 络 模 型 ,详 细 流 程 如 附 录 A 图 A4 所 示 。
过其独特门结构可以有效地对负荷预测时间信息进
首先通过高性能服务器对模型进行离线构建和训
行记忆[22]。在所构建的 LSTM-MTL 模型中多个子
练 ,然 后 将 训 练 好 的 模 型 复 制 到 对 应 的 用 户 侧 计 算
任 务 输 入 首 先 经 由 融 合 层 进 行 数 据 融 合 ,然 后 将 融
机 或 终 端 设 备 中 进 行 在 线 应 用 。 其 中 ,离 线 训 练 阶
合 后 的 数 据 输 送 至 共 享 层 ,在 共 享 层 中 多 个 LSTM
段主要是通过 LSTM-MTL 网络学习多个输入特征
神经元间经由循环结构进行组合共同构成一个
和 多 元 负 荷 间 的 映 射 关 系 ;在 线 应 用 主 要 是 将 当 前
LSTM 网络层,多个相同结构的 LSTM 网络层线性
时刻的特征输入训练好的 LSTM-MTL 模型中快速
连 接 便 可 构 成 MTL 中 的 多 层 共 享 网 络 ,由 单 一
LSTM 网 络 构 建 多 层 共 享 网 络 的 过 程 如 附 录 A 图 得到下一时刻的多元负荷预测结果。
A3 所示。 离线建模的具体步骤如下。
1)网络结构超参数选择
2 LSTM-MTL 多元负荷预测模型的构建 网络结构超参数选择直接决定了所建立模型的
2. 1 输入/输出特征集设置 预测效果。首先依据所建立模型特征确定部分超参
输入/输出特征集是决定模型表现能力的关键。 数 ,然 后 对 剩 余 超 参 数 采 用 随 机 追 踪 法[24],利 用 不
其 中 输 入 特 征 往 往 是 影 响 负 荷 预 测 的 各 种 属 性 ,针 同 超 参 数 子 空 间 对 网 络 收 敛 速 度 影 响 程 度 不 同 ,选
对 IES 多元负荷预测问题设置输入特征时首先需要 择不同的搜索范围,以加快参数选择效率。

http ://www.aeps -info.com 65


2021,45(5) · 学术研究 ·

2)网络模型训练 择,本文模型涉及的超参数主要包括:网络结构超参
将 多 维 特 征 向 量 作 为 输 入 ,负 荷 预 测 数 值 作 为 数和优化算法超参数。首先鉴于模型特点以及上文
输 出 ,自 底 向 上 训 练 网 络 ,直 至 迭 代 到 预 设 次 数 为 对 输 入 输 出 特 征 集 的 设 定 ,确 定 每 个 子 输 入 序 列 长
止。通过多个隐含层逐层将原始数据集中的低维特 度 为 27,每 个 子 输 出 序 列 长 度 为 1。 其 次 经 由 大 量
征转化为高维特征,使模型学习到隐含映射关系。 文 献 证 实 所 采 用 的 Adam 算 法 可 以 确 定 学 习 率 α 初
3)网络参数调优 始 值 、平 滑 参 数 、子 训 练 样 本 集 个 数 、最 大 训 练 次 数
采用 Adam 优化算法将验证集特征量输入训练 等 参 数 ,剩 余 参 数 则 采 用 随 机 追 踪 法 进 行 寻 优 。 这
后 的 LSTM-MTL 网 络 中 ,将 输 出 的 多 元 负 荷 预 测 样 做 可 减 少 神 经 网 络 参 数 的 寻 优 过 程 ,明 显 提 高 模
结 果 与 真 实 值 进 行 对 比 并 计 算 损 失 函 数 ,依 据 损 失 型构建和训练效率。多次试验记录的模型最优超参
函数逐代调整网络参数。 数如附录 A 表 A2 所示。
4)性能评估 在模型结构上首先依据电、热、冷 3 类负荷设置
鉴于所构建多元负荷预测模型在同一时间需要 MTL 中 的 3 类 子 任 务 ,分 别 定 义 3 个 子 输 入 与 3 个
对 多 个 子 任 务 进 行 预 测 分 析 ,因 此 本 文 选 用 L MAPE 、 子输出。其次针对负荷预测数据的强时间序列特
平均精度(mean accuracy,MA)指标 L MA 和权重平均 性 ,利用 LSTM 神经网络构建模型共享层。最后依
精 度(weighted mean accuracy,WMA)指 标 L WMA 为 据所确定的最优超参数实现 LSTM-MTL 模型的整
评 价 指 标 。 MAPE 可 体 现 预 测 模 型 对 每 种 负 荷 的 体 构 建 并 对 其 进 行 训 练 ,具 体 的 模 型 结 构 如 附 录 A
预 测 性 能 ,WMA 可 从 整 体 上 体 现 模 型 对 多 元 负 荷 图 A6 所示。
预测的性能,其具体评价指标表达式如下: 3. 3 离线训练结果分析

| |
1)模型离线训练结果分析
1 n
y ( i )- y̑ ( i )
L MAPE =
n
∑ y(i)
× 100% (8) 模 型 构 建 完 毕 后 需 对 其 进 行 离 线 训 练 ,在 该 过
i= 1
程中为了避免后期学习率过大导致模型在最优解附
L MA = 1 - L MAPE (9)
近 来 回 振 荡 而 无 法 收 敛 的 问 题 ,采 用 学 习 率 倍 数 衰
L WMA = α ele L ele
MA + α heat L heat
MA + α cool L cool
MA (10)
减 方 法 ,即 在 网 络 训 练 过 程 中 学 习 率 能 够 随 训 练 次
式中:y ( i ) 和 y̑ ( i ) 分别为第 i 时刻的负荷真实值和预 数的增加而逐渐减少。学习率随训练次数的变化情
测值;n 为样本数量;α ele 、α heat、α cool 分别为电、热、冷负 况 如 附 录 A 图 A7 所 示 ,由 图 A7 可 知 学 习 率 初 始 值
荷 的 权 重 ;L ele
MA 、L heat
MA 、 L cool
MA 分 别 为 电 、热 、冷 负 荷 的 设 定 为 0.01,衰 减 系 数 为 0.5,在 训 练 次 数 达 到 210
MA 值。考虑到所研究 IES 中电力的主导性和重要 次 左 右 时 学 习 率 达 到 了 预 设 的 最 小 值 0.000 1 并 稳
性 ,同 时 结 合 文 献[25]层 次 分 析 法 确 定 式(10)中 定于此值。
电 、热 、冷 各 子 目 标 权 重 系 数 取 值 分 别 为 0.4、 训练集和验证集预测精度随训练次数变化的情
0.3、0.3。 况 如 附 录 A 图 A8 所 示 。 结 合 图 A7 和 图 A8 分 析 可
知,当训练次数小于 210 次时,由于学习率从初始值
3 算例分析
0.01 开 始 逐 渐 减 少 ,因 此 训 练 集 和 测 试 集 上 的 预 测
3. 1 算例描述 精 度 也 会 随 之 产 生 波 动 ,但 总 体 随 训 练 次 数 的 增 加
本 文 LSTM-MTL 模 型 构 建 及 训 练 在 而 提 高 。 当 训 练 次 数 达 到 210 次 后 ,训 练 集 和 测 试
TensorFlow 深 度 学 习 框 架 下 进 行 ,硬 件 平 台 采 用 集 的 精 度 基 本 趋 于 稳 定 ,因 为 此 时 学 习 率 稳 定 于
Intel Core i7 CPU 和 一 块 NVDIA RTX 2070 GPU。 0.000 1,已 能 够 准 确 找 到 最 优 解 ,使 模 型 预 测 精 度
算例数据来源于美国国家可再生能源实验室官网中 趋于稳定。同时还可知模型在训练集和验证集上的
的某实际楼宇 IES[26],该系统由电、热、冷系统组成, 预 测 精 度 十 分 接 近 ,验 证 集 预 测 精 度 仅 比 训 练 集 小
其中热电联产机组、电锅炉、燃气锅炉及电制冷机等 约 0.4%,说明模型在训练过程中并没有出现过拟合
设备作为能量转换设备满足不同能源需求。采用 现 象 ,模 型 的 训 练 结 果 较 为 合 理 ,具 有 较 强 的 泛 化
1 年 的 实 际 运 行 数 据 进 行 算 例 分 析 ,具 体 数 据 如 附 能力。
录 A 图 A5 所 示 。 训 练 集 、验 证 集 、测 试 集 按 照 电、热、冷负荷各自平均预测精度随训练次数变
70%、15%、15% 的 比 例 进 行 划 分 ,以 1 h 为 步 长 对 化 的 情 况 如 附 录 A 图 A9 所 示 。 以 L MA 作 为 评 价 指
未来电、热、冷负荷进行预测。 标 ,可 知 热 负 荷 与 冷 负 荷 平 均 预 测 精 度 随 训 练 次 数
3. 2 超参数选择与模型构建 变 化 情 况 大 致 相 同 且 基 本 维 持 在 96% 附 近 。 而 电
模型预测准确度很大程度上取决于超参数选 负荷平均预测精度较热、冷负荷有一定的差距,主要

66
孙庆凯,等 基于 LSTM 和多任务学习的综合能源系统多元负荷预测

是因为电负荷较热、冷负荷来说实时性较强,不具有 有改进粒子群-小波神经网络法(IPSO-WNN)[15]和
热 、冷 负 荷 较 强 的 惯 性 ,同 时 影 响 因 素 更 多 ,因 此 预 核 主 成 分 分 析 - 广 义 回 归 神 经 网 络 法(KPCA-
测难度更大。训练结果反映模型在处理多元负荷预 GRNN)[16] 等 。 上 述 2 种 模 型 均 在 Sklearn 与
测 时 与 IES 实 际 运 行 数 据 较 为 相 近 ,模 型 离 线 训 练 TensorFlow 环境下进行复现,预测数据选取测试集
结果具有可信性。 中 某 4 天 ,其 中 1~48 时 段 为 工 作 日 ,49~96 时 段 为
2)模型耦合信息学习可视化解释 非工作日。多次试验后记录每种模型在测试数据上
为证实离线训练中 LSTM-MTL 模型可利用子 的 预 测 结 果 如 图 2 和 附 录 A 表 A3 所 示 ,LSTM-
任 务 提 供 的 耦 合 信 息 来 提 升 预 测 精 度 ,本 节 采 用 附 MTL 模 型 针 对 电、热、冷 负 荷 的 小 时 级 MAPE 值 如
录 A 中 的 沙 普 利 加 和 解 释 技 术(Shapley additive 图 3 所示。
explanation technology,SAET)对 神 经 网 络 输 出 结
2 750
果 进 行 可 视 化 解 释[27]。 限 于 篇 幅 ,仅 以 冬 、夏 季 典
2 500
型 日 电 负 荷 预 测 为 例 进 行 说 明 ,各 输 入 特 征 对 预 测
2 250
结 果 的 贡 献 度 如 附 录 A 图 A10 所 示 ,其 中 红 色 和 蓝 2 000


*B8/kW
色部分分别表示特征对预测值具有正向促进和反向 1 750
作用;长度表示该特征对预测值的贡献度大小。 1 500
由 附 录 A 图 A10(a)可 知 冬 季 典 型 日 模 型 预 测 1 250
平均基准值为 1 385.41 kW,从基准值到预测值主要 1 000
受 太 阳 辐 射 、温 度 、t 时 刻 热 负 荷 预 测 值 、t 时 刻 冷 负 750

荷预测值以及前一日 t 时刻电负荷值等特征量影 500


0 24 48 72 96
响。若不考虑热、冷负荷对电负荷预测的影响,则模 
(a) *B8M"3
型 预 测 值 为 1 423.62 kW,相 较 于 真 实 值 2 250
1 814.89 kW 的 误 差 为 21.56%。 相 比 之 下 ,采 用 2 000

LSTM-MTL 模 型 后 预 测 值 为 1 773.62 kW,误 差 为 1 750

2.32%,预 测 精 度 明 显 提 高 。 主 要 是 因 为 所 研 究 1 500
&B8/kW

IES 在 冬 季 时 热 需 求 较 大 ,而 系 统 内 部 热 量 很 大 一 1 250

部 分 来 源 于 电 制 热 设 备 ,致 使 电 需 求 伴 随 热 需 求 的 1 000

提 升 而 提 升 ,在 同 一 时 刻 热 负 荷 预 测 对 电 负 荷 预 测 750

起到很大程度的正向影响。相反冬季所需冷负荷量 500

小,可直接通过吸收式制冷机满足供应需求,不需要 250
0 24 48 72 96
电 制 冷 设 备 进 行 额 外 供 应 ,对 电 负 荷 预 测 具 有 一 定 
(b) &B8M"3
的反向作用。 70
由附录 A 图 A10(b)可知,夏季大量的冷负荷需 60

求 致 使 电 负 荷 需 求 在 一 定 程 度 上 增 大 ;同 时 降 雨 量 50
起到反向作用,因为夏季降雨时刻明显降低了气温, 40
B8/kW

不再需要将大量电制冷设备投入使用。 30
通 过 上 述 分 析 可 知 ,所 构 建 的 LSTM-MTL 模 20
型在进行负荷预测时确实能通过共享层利用其余子 10
任务提供的耦合信息,隐式增加原任务数据量,进而 0
对 原 任 务 产 生 不 同 程 度 的 影 响 ,达 到 提 高 模 型 总 体 -10
0 24 48 72 96
预测精度和泛化能力的目的。 
(c) B8M"3
3. 4 不同预测模型在线应用结果对比分析 K LSTM-MTL IPSO-WNN KPCA-GRNN
1)LSTM-MTL 模 型 与 传 统 多 元 负 荷 预 测 模 型
图 2 多元负荷预测模型的预测结果
对比 Fig. 2 Forecast results of multiple load prediction model
为突出本文所构建模型在 IES 多元负荷预测上
的 优 势 ,本 节 将 LSTM-MTL 模 型 与 现 有 预 测 模 型 在 预 测 精 度 方 面 ,由 图 3 和 附 录 A 表 A3 可 知
进 行 对 比 分 析 。 目 前 ,IES 多 元 负 荷 预 测 方 法 主 要 LSTM-MTL 模型对电、热、冷负荷的 MAPE 预测误

http ://www.aeps -info.com 67


2021,45(5) · 学术研究 ·

间,并不适用于离线训练模型。
② KPCA-GRNN 通 过 降 维 人 为 简 化 了 输 入 特
0.4 征 集 ,提 高 了 模 型 运 算 效 率 ,因 此 离 线 训 练 时 间 最
0.3 短,但却存在受数据量限制预测精度降低的问题。
③3 类模型在线预测均是在离线训练完毕基础
LMAPE

0.2
上 进 行 ,虽 然 LSTM-MTL 相 较 于 其 余 2 种 模 型 ,网
0.1
B8
络 结 构 更 加 复 杂 ,但 三 者 均 不 属 于 大 型 神 经 网 络 结
0
20
&B8
1
构 模 型 ,因 此 在 现 有 硬 件 条 件 支 撑 下 在 线 预 测 时 间
40 8
60
 80
100
*B8 B 差距并不明显。
图 3 小时级 MAPE 值分布
2)LSTM-MTL 模 型 与 单 一 负 荷 预 测 模 型
Fig. 3 Distribution of hourly MAPE values 对比
为验证所构建 LSTM-MTL 模型能有效学习多
差 仅 在 个 别 时 间 超 过 3%,总 体 预 测 精 度 较 高 。 对
元负荷间的耦合信息,提高负荷预测精度,本节将其
于 WMA 值 ,LSTM-MTL 较 IPSO-WNN 提 升
与 单 一 负 荷 预 测 模 型(以 LSTM 网 络 模 型 为 例)进
4.22%,较 KPCA-GRNN 提 升 7.78%。 同 时 经 图 2 行 对 比 分 析 ,结 果 如 附 录 A 表 A4 所 示 。 可 知
分 析 可 知 ,3 类 模 型 的 预 测 差 距 主 要 体 现 在 峰 时 刻 LSTM-MTL 模型进行预测时能够获得更高的预测
和谷时刻负荷附近,因为 IES 实际运行过程中峰、谷 精 度 ,其 中 电 、热 、冷 负 荷 提 高 的 预 测 精 度 分 别 为
时 刻 负 荷 波 动 较 大 ,波 动 较 为 强 烈 的 时 刻 预 测 难 度 2.5%、2.1%、3.4%。因为模型经由共享层学习了不
要 明 显 高 于 其 他 时 间 段 。 相 比 之 下 ,LSTM-MTL 同 输 入 间 的 复 杂 耦 合 关 系 ,在 预 测 某 一 种 负 荷 时 能
预测效果较好的原因主要表现在以下几个方面。 够充分利用其余 2 种负荷提供的辅助信息。
① LSTM-MTL 模 型 首 先 通 过 子 任 务 学 习 单 一 除 预 测 精 度 外 ,本 节 还 在 同 样 的 计 算 资 源 前 提
负 荷 的 特 征 ,然 后 利 用 共 享 层 学 习 其 余 子 任 务 提 供 下 对 比 两 者 的 计 算 量 ,并 以 累 加 时 间 长 短 来 表 征
的 辅 助 耦 合 信 息 ,在 单 一 负 荷 波 动 较 大 时 能 够 有 效 2 类模型计算量的多少。2 类模型负荷预测的耗用
利 用 学 习 到 的 辅 助 耦 合 特 征 来 减 少 预 测 误 差 ,更 好 时 间 如 附 录 A 表 A5 所 示 ,可 以 看 出 多 元 负 荷 预 测
地拟合出负荷变化趋势。而其余 2 种模型在输入层 在 模 型 训 练 、预 测 上 的 时 间 明 显 小 于 单 一 负 荷 预 测
不做区分,所有特征集数据采用统一学习方式,致使 的累加。这表明多元负荷预测模型在实际预测过程
模型需要更多次迭代,学习效率和预测精度较低。 中 的 计 算 量 相 对 较 少 ,可 有 效 缩 小 训 练 、预 测 时 间 ,
② IPSO-WNN 采 用 小 波 神 经 网 络 ,KPCA- 具有更强的工程应用价值。
GRNN 采 用 径 向 基 神 经 网 络 ,虽 然 有 助 于 提 高 收 敛
速度与精度,但网络结构不具有记忆功能,在处理具 4 结语
有 时 序 特 性 的 负 荷 数 据 时 相 较 于 LSTM 网 络 仍 有 本 文 将 LSTM 神 经 网 络 与 MTL 方 法 应 用 于
一定的劣势。 IES 电、热、冷多元负荷预测中,通过“硬共享机制+
③ KPCA-GRNN 对 原 始 数 据 进 行 降 维 处 理 ,虽 LSTM 共 享 层 ”方 式 构 建 了 多 元 负 荷 预 测 模 型 框
然在一定程度上减少了数据冗余,提高了模型效率, 架 ,通 过“ 离 线 训 练 + 在 线 应 用 ”方 式 建 立 了 多 元 负
但 却 致 使 隐 藏 的 部 分 耦 合 信 息 被 抹 去 ,模 型 学 习 不 荷预测模型,最后经由算例分析得出如下结论。
充 分 。 同 时 鉴 于 目 前 IES 实 际 运 行 数 据 较 难 获 得 、 1)基于 LSTM-MTL 的多元负荷预测模型可以
数 据 降 维 后 易 出 现 训 练 数 据 匮 乏 等 问 题 ,受 数 据 量 通 过 共 享 层 模 拟 多 元 负 荷 间 的 耦 合 特 性 ,学 习 不 同
限制,本节中的 KPCA-GRNN 预测精度最低。 子 任 务 提 供 的 耦 合 信 息 ,进 而 达 到 提 升 负 荷 预 测 精
在 预 测 时 间 方 面 ,由 附 录 A 表 A3 可 知 离 线 训 度的目的。
练 上 3 类 模 型 差 异 较 大 ,其 中 IPSO-WNN 时 间 最 2)与 传 统 预 测 模 型 相 比 ,所 构 建 的 LSTM-
长,KPCA-GRNN 时间最短,而在线预测上 3 类模型 MTL 模型可兼顾 IES 多类型能源用能特性关系,在
时间较为接近,主要原因如下。 负荷预测精度和时间上具有更好的应用效果。
① IPSO-WNN 为 避 免 传 统 反 向 传 播(BP)算 法 随着能源系统的日益交融和人工智能技术的不
易 陷 入 局 部 最 优 的 问 题 ,采 用 IPSO 进 行 权 值 和 偏 断 发 展 ,使 用 人 工 智 能 进 行 IES 多 元 负 荷 预 测 必 将
置 的 更 新 ,但 IPSO 需 要 对 粒 子 位 置 和 速 度 反 复 迭 得到越来越多的重视。鉴于目前国内外 IES 的发展
代 更 新 才 能 获 得 最 优 值 ,这 明 显 加 大 了 模 型 训 练 时 仍 处 于 初 期 ,其 在 能 源 利 用 和 需 求 方 面 仍 采 用 较 为

68
孙庆凯,等 基于 LSTM 和多任务学习的综合能源系统多元负荷预测

粗 犷 的 经 营 模 式 ,并 未 完 全 考 虑 价 格 因 素 对 其 优 化 quantile regression[J]. Journal of Modern Power Systems and


Clean Energy,2019,7(5):1200-1209.
调 度 和 经 济 运 行 的 影 响 ,在 数 据 获 取 上 想 要 获 得 与
[9]黄 青 平 ,李 玉 娇 ,刘 松 ,等 . 基 于 模 糊 聚 类 与 随 机 森 林 的 短 期 负
价 格 相 关 的 运 行 数 据 具 有 一 定 的 难 度 ,因 此 本 文 并
荷预测[J]. 电测与仪表,2017,54(23):41-46.
未 将 价 格 因 素 考 虑 到 负 荷 预 测 中 ,未 来 可 在 本 文 所 HUANG Qingping,LI Yujiao,LIU Song,et al. Short-time load
提方法的基础上进一步研究价格因素对 IES 多元负 forecasting based on fuzzy clustering and random forest[J].
荷预测的影响。 Electrical Measurement & Instrumentation, 2017, 54(23) :
41-46.
附录见本刊网络版(http://www.aeps-info.com/ [10]肖 白 ,赵 晓 宁 ,姜 卓 ,等 . 利 用 模 糊 信 息 粒 化 与 支 持 向 量 机 的 空
aeps/ch/index.aspx),扫英文摘要后二维码可以阅读 间 负 荷 预 测 方 法[J/OL]. 电 网 技 术[2019-12-20]. http://kns.

网络全文。 cnki.net/kcms/detail/11.2410.TM.20191220.1450.001.html.
XIAO Bai,ZHAO Xiaoning,JIANG Zhuo,et al. Spatial load
forecasting method using fuzzy information granulation support
参考文献
vector machine[J/OL]. Power System Technology[2019-12-
[1]程浩忠,胡枭,王莉,等 . 区域综合能源系统规划研究综述[J]. 电 20]. http://kns. cnki. net/kcms/detail/11.2410. TM. 20191220.
力系统自动化,2019,43(7):2-13. 1450.001.html.
CHENG Haozhong,HU Xiao,WANG Li,et al. Review on [11]ZHAO Zhongqiu,ZHENG Peng,XU Shoutao,et al. Object
research of regional energy system planning[J]. Automation of detection with deep learning:a review[J]. IEEE Transactions
Electric Power Systems,2019,43(7):2-13. on Neural Networks and Learning Systems,2019,30(11):
[2]丁 涛 ,牟 晨 璐 ,别 朝 红 ,等 . 能 源 互 联 网 及 其 优 化 运 行 研 究 现 状 3212-3232.
综述[J]. 中国电机工程学报,2018,38(15):4318-4328. [12]SHI Heng,XU Minghao,LI Ran. Deep learning for household
DING Tao, MU Chenlu, BIE Zhaohong, et al. Review of load forecasting—a novel pooling deep RNN [J]. IEEE
energy internet and its operation[J]. Proceedings of the CSEE, Transactions on Smart Grid,2018,9(5):5271-5280.
2018,38(15):4318-4328. [13]李 鹏 ,何 帅 ,韩 鹏 飞 ,等 . 基 于 长 短 期 记 忆 的 实 时 电 价 条 件 下 智
[3]曾 鸣 ,刘 英 新 ,周 鹏 程 ,等 . 综 合 能 源 系 统 建 模 及 效 益 评 价 体 系 能电网短期负荷预测[J]. 电网技术,2018,42(12):4045-4052.
综述与展望[J]. 电网技术,2018,42(6):1697-1708. LI Peng, HE Shuai, HAN Pengfei, et al. Short-term load
ZENG Ming,LIU Yingxin,ZHOU Pengcheng,et al. Review forecasting of smart grid based on long short-term memory
and prospects of integrated energy system modeling and benefit recurrent neural networks in condition of real-time electricity
evaluation[J]. Power System Technology,2018,42(6):1697- price[J]. Power System Technology,2018,42(12):4045-
1708. 4052.
[4]艾 芊 ,郝 然 . 多 能 互 补 、集 成 优 化 能 源 系 统 关 键 技 术 及 挑 战[J]. [14]杨 龙 ,吴 红 斌 ,丁 明 ,等 . 新 能 源 电 网 中 考 虑 特 征 选 择 的 Bi-
电力系统自动化,2018,42(4):2-10. LSTM 网 络 短 期 负 荷 预 测[J/OL]. 电 力 系 统 自 动 化[2020-05-
AI Qian,HAO Ran. Key technologies and challenges for multi- 27]. http://kns. cnki. net/kcms/detail/32.1180. TP. 20200526.
energy complementarity and optimization of integrated energy 1338.022.html.
system [J]. Automation of Electric Power Systems, 2018, YANG Long,WU Hongbin,DING Ming,et al. Short-term
42(4):2-10. load forecasting in renewable energy grid based on bi-directional
[5]别 朝 红 ,王 旭 ,胡 源 . 能 源 互 联 网 规 划 研 究 综 述 及 展 望[J]. 中 国 long-short-term memory network considering feature selection
电机工程学报,2017,37(22):6445-6462. [J/OL]. Automation of Electric Power Systems[2020-05-27].
BIE Zhaohong,WANG Xu,HU Yuan. Review and prospect of http://kns. cnki. net/kcms/detail/32.1180. TP. 20200526.1338.
planning of energy internet[J]. Proceedings of the CSEE,2017, 022.html.
37(22):6445-6462. [15]李守茂,戚嘉兴,白星振,等 . 基于 IPSO-WNN 的综合能源系统
[6]史 佳 琪 ,谭 涛 ,郭 经 ,等 . 基 于 深 度 结 构 多 任 务 学 习 的 园 区 型 综 短 期 负 荷 预 测[J/OL]. 电 测 与 仪 表[2020-03-02]. https://kns.
合能源系统多元负荷预测[J]. 电网技术,2018,42(3):698-706. cnki.net/KCMS/detail/23.1202.TH.20191114.1811.002.html.
SHI Jiaqi, TAN Tao, GUO Jing, et al. Multi-task learning LI Shoumao,QI Jiaxing,BAI Xingzhen,et al. A short-term
based on deep architecture for various types of load forecasting in load prediction of integrated energy system based on IPSO-
regional energy system integration [J]. Power System WNN [J/OL]. Electrical Measurement & Instrumentation
Technology,2018,42(3):698-706. [2020-03-02]. https://kns. cnki. net/KCMS/detail/23.1202.
[7]刘雨竹,徐楠 . 基于混沌时间序列的 IGA-WLSSVR 短期负荷预 TH.20191114.1811.002.html.
测 模 型[J/OL]. 控 制 工 程[2019-12-20]. https://doi. org/10. [16]马 建 鹏 ,龚 文 杰 ,张 智 晟 . 基 于 Copula 理 论 与 KPCA-GRNN 结
14107/j.cnki.kzgc.20190495. 合 的 区 域 综 合 能 源 系 统 多 元 负 荷 预 测 模 型[J]. 电 工 电 能 新 技
LIU Yuzhu,XU Nan. Short-term load forecasting model using 术,2020,39(3):24-31.
IGA-WLSSVR based on chaotic time series [J/OL]. Control MA Jianpeng,GONG Wenjie,ZHANG Zhisheng. Short-term
Engineering of China[2019-12-20]. https://doi. org/10.14107/j. multiple load prediction model for regional integrated energy
cnki.kzgc.20190495. system based on Copula theory and KPCA-GRNN [J].
[8]WANG Yi, GAN Dahua, ZHANG Ning, et al. Feature Advanced Technology of Electrical Engineering and Energy,
selection for probabilistic load forecasting via sparse penalized 2020,39(3):24-31.

http ://www.aeps -info.com 69


2021,45(5) · 学术研究 ·

[17]孙 宏 斌 ,郭 庆 来 ,吴 文 传 ,等 . 面 向 能 源 互 联 网 的 多 能 流 综 合 能 Characteristics of outliers in wind speed-power operation data of


量 管 理 系 统 :设 计 与 应 用[J]. 电 力 系 统 自 动 化 ,2019,43(12): wind turbines and its cleaning method[J]. Transactions of China
122-128. Electrotechnical Society,2018,33(14):3353-3361.
SUN Hongbin, GUO Qinglai, WU Wenchuan, et al. [24]MANTOVANI R G,ROSSI A L D,VANSCHOREN J,et
Integrated energy management system with multi-energy flow al. Effectiveness of random search in SVM hyper-parameter
for Energy Internet:design and application[J]. Automation of tuning[C]// 2015 International Joint Conference on Neural
Electric Power Systems,2019,43(12):122-128. Networks,July 12-17,2015,Killarney,Ireland:1-8.
[18]杨 挺 ,赵 黎 媛 ,王 成 山 . 人 工 智 能 在 电 力 系 统 及 综 合 能 源 系 统 [25]修 晓 青 ,唐 巍 ,李 建 林 ,等 . 基 于 层 次 分 析 法 的 储 能 配 置 综 合 评
中的应用[J]. 电力系统自动化,2019,43(1):2-14. 价技术[J]. 电力系统自动化,2018,42(11):72-78.
YANG Ting,ZHAO Liyuan,WANG Chengshan. Review on XIU Xiaoqing,TANG Wei,LI Jianlin,et al. Comprehensive
application of artificial intelligence in power system and evaluation technology of energy storage configuration based on
integrated energy system[J]. Automation of Electric Power analytic hierarchy process[J]. Automation of Electric Power
Systems,2019,43(1):2-14. Systems,2018,42(11):72-78.
[19]ZHANG Yu,YANG Qiang. An overview of multi-task learning [26]OpenEI DOE open data [DB/OL]. America[2016-08-09].
[J]. National Science Review,2018,5(1):30-43. https://openei.org/doe-opendata/dataset.
[20]李亚 . 多任务学习的研究[D]. 合肥:中国科学技术大学,2018. [27]Lundberg, Lee. A unified approach to interpreting model
LI Ya. Research on multi-task learning[D]. Hefei:University predictions[EB/OL]. America[2020-03-02]. https://arxiv.
of Science and Technology of China,2018. org/pdf/1705.07874.pdf.
[21]张 宇 帆 ,艾 芊 ,林 琳 ,等 . 基 于 深 度 长 短 时 记 忆 网 络 的 区 域 级 超
短期负荷预测方法[J]. 电网技术,2019,43(6):1884-1891. 孙庆凯(1992—),男,博士研究生,主要研究方向:人工智
ZHANG Yufan,AI Qian,LIN Lin,et al. A very short-term 能 在 综 合 能 源 系 统 优 化 运 行 中 的 应 用 。 E-mail:sunqingkai_
load forecasting method based on deep LSTM RNN at zone
123@163.com
level[J]. Power System Technology,2019,43(6):1884-1891.
王 小 君 (1978—),男 ,通 信 作 者 ,博 士 ,副 教 授 ,主 要 研 究
[22]GREFF K, SRIVASTAVA R K, KOUTNIK J, et al.
方 向 :电 力 系 统 分 析 与 控 制 、综 合 能 源 系 统 优 化 运 行 。
LSTM: a search space odyssey[J]. IEEE Transactions on
E-mail:xjwang1@bjtu.edu.cn
Neural Networks & Learning Systems,2016,28(10):2222-
2232.
张义志(1994—),男,博士研究生,主要研究方向:综合能
[23]沈小军,付雪姣,周冲成,等 . 风电机组风速-功率异常运行数据 源系统优化控制技术。E-mail:18117031@bjtu.edu.com
特征及清洗方法[J]. 电工技术学报,2018,33(14):3353-3361. (编辑 孔丽蓓)
SHEN Xiaojun, FU Xuejiao, ZHOU Chongcheng, et al.

Multiple Load Prediction of Integrated Energy System Based on Long Short-term Memory
and Multi-task Learning
SUN Qingkai1 ,WANG Xiaojun1 ,ZHANG Yizhi1 ,ZHANG Fang1 ,ZHANG Pei1 ,GAO Wenzhong1,2
(1. School of Electrical Engineering, Beijing Jiaotong University, Beijing 100044, China;
2. Department of Electrical & Computer Engineering, University of Denver, Denver 80208, USA)

Abstract: With the continuous development of integrated energy utilization technologies and the diversification of users ’ energy
consumption needs, the existing method for single type load prediction is difficult to reflect the coupling characteristics of multiple
loads. Accurate multiple load prediction will become the primary prerequisite for optimal dispatch and economic operation of
integrated energy systems. Based on this, a multi-task learning load prediction method is proposed by using a long short-term
memory (LSTM) neural network as a shared layer. In this method, the coupling characteristics of multiple loads are simulated
through the shared layer to improve the prediction accuracy. Firstly, a multi-task learning load prediction model is developed by
means of “hard sharing mechanism + LSTM sharing layer”, and the sharing mechanism is used to learn the coupling information
provided by different subtasks. Secondly, the neural network interpretability technology is used to visually explain the offline
training results, which demonstrates that the proposed model can use the coupling information provided by the subtasks to improve
the prediction accuracy. Finally, compared with the traditional model, the results show that the proposed model has better effect on
prediction accuracy and time.
This work is supported by National Natural Science Foundation of China (No. 51977005).
Key words: integrated energy system; multiple load prediction; multi-task learning; long short-term memory neural network

70

You might also like