Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

第3

4卷 第5期 计  算  机  学  报 V
ol
.3
4No.


01年5月
1 C
HI
NES
EJO
URNA
LOFCOM
PUT
ERS Ma
y2
01

 

动态不确定环境下多目标路径规划方法
魏 

唯  欧阳丹彤 吕 帅 
吉林大学计算机科学与技术学院 长春 
冯)宇轩
13
00
12
吉林大学符号计算与知识工程教育部重点实验室 长春 
( 13
00
1)

摘 要 提出一种在动态不确定环境下求解多目标问题时快速调整移动路径的方法.首先提出采用逆向多目标启
发式搜索进行全局规划,求解问题的最优路径集合;
然后提出动态多目标路径规划方法,先根据当前观测进行全局
规划,
在移动过程中探测到不一致的环境信息时,通过对先前搜索中部分信息的重用,在全局规划的基础上进行增
调整当前状态与目标状态之间的移动路径.
量重规划, 研究结果表明:采用增量重规划的求解方法通过搜索信息的
重用提高求解效率,能够有效地处理动态不确定环境下的多目标路径规划问题.
关键词 多目标路径规划;
动态不确定环境;启发式搜索;
全局规划;增量重规划
中图法分类号TP1
8   犇
犗犐号:
10.

72
4/S
P.
J.
10
16
.2
01
1.
00
83


狌犾

犻狅

犼犲
犮狋

狏犲犘

狋犺犘

犪狀
狀犻

犵狌狀
犱犲
狉犇
狔狀
犪犿
犻犮
犝狀犮

狉狋
犪犻
狀犈
狀狏

狉狅
狀犿
犲狀


EIW
ei
 OU
YAN
GDa

To
n 
gLUS
hu
ai
 FE
NGY
u
Xu
an
(犆
狅犾

犲犲
犵狅
犳犆狅犿
狆狌
狋犲
狉犛
犮犻

狀犮
犲犪狀
犱犜犲

犺狀
狅犾
狅犵
狔,犑

犾犻
狀犝
狀犻
狏犲

狊犻
狋,
狔犆犺
犪狀
犵犮
犺狌
狀 1
30
01
2)

犓犲
狔犔
犪犫

狉犪
狋狅

狔狅犛
犳狔犿
犫狅

犻犮
犆狅犿
狆狌
狋犪

犻狅
狀犪
狀犱犓狀
狅狑
犾犲
犱犲
犵犈
狀犻
犵狀
犲犲

犻狀
犵狅
犳犕犻
狀犻

狋狉
狔狅
犳犈犱
狌犮
犪狋

狅 ,
狀犑犻

犻狀犝
狀犻

犲狉
狊犻

狔,犆
犺犪
狀犮
犵犺
狌狀
 13

01
2)
犃犫

狋狉
犪犮
狋 Int
hi
sa
pe
pr,
am e

hodf
or
ad
ju
st

ngt
hee
xe

ut
in
gpa

hofm
ul
ti

be
jc
ti
ve
pat
hl
pa
n

in
gpr
ob
le
msun
de
rdyn
ami
cu
nc
ert

ine
nv

ro
nme
nt
si
spr
oo
ps

d.Th
eba
ck
wa
rdmu

ti
ob
je
ct

ve
he

ri
st

cse
ar
cha
lor

thm
g ppi
s r
oose
df

rs
tl
ywh

chs
ta
rt
st
he
se
ar
chr
po
ce

sfr
omt
heg e


lst



oth
es
ta
rt
sta

eto
so
lve
the
gi
ve
n m
ul

io
be

jt
iv
er
po
bl
em.
Th
ent
hed
yn
am
icm
ul
ti

be
jc
ti
ve
pa
th

pa
nn
in
gal
go
ri
th
mis
pro
pos
ed
.The
al
go
ri

hmpe

fo
rms
gl
ob
al
pl
an
ni
nga

co
rd
in
gtoi
ni

ia
lo
b

er
va

io
nst
o t
hes
ta

e s
pac
e.
In
cre
me
nt
al
rel
an
ni

p gp ro
ce

sise
pr

or
medi
mme
di

tel
ywh
en

ha
nge
so
fenv

ro
nme
nta
red
et
ec

eddu

in
gth
emo
vi
ngr

pc
es
s.T
her
el

pn
ni
ngr
po
ce
ssc
an
ex
e

ut
ei
nc
rem
ent

ll
yba

edonth
el
gob
al
pl
an
ni
ngr

pc
es
sto
re
vi
se
th
epa
thb
et
we
ena
nycu

re
nt

ta
te
an
d t
heg
oa
lst
at
eef
fi
ci

nt
lybr
ye
us
in
gpa
rt
so
fth
esa
ve
di
nf
or
mat

ono
fth
epre

io
us

ea
rc
h.Th
eex
pe
ri
me
ntre
su
lt
ss
howth

tth
edn
ya
mi
cmul

io
be

jt

vea
pt
hpl
an
ni
nga
lo
gr

thm

do
pt
in
gani
nc
re
me
nt
alr
el
pa
nn
in
gca
nso

vem
ul
ti

be
jc
ti

epa
th
pl
an
ni
ng
pr
ob
lem
su
nde
rdn
ya
m

cun
ce

ta
ine
nv
ir
on
men
tse
ff

ci
en
tl
ybr
ye
us
in
gt
hei
nf

rma

io
nof
pr
ev
io
us
se
ar
ch.
犓犲
狔狑
狅狉
犱狊 mul

io
be
jc
ti
vepa

hpla
nn
in
g;d
yn
am
icun

er
ta

nenv

ro
nme
n;
the
ur
is

ics
ea
rc
h;

go
ba
ll
pa
nni
ng;

nc
reme

tal
re
pl
ann

ng
智能研究领域的重要分支.求解路径规划问题时,如
 引 言
1 果假定环境信息是静态完全可知的, 可利用一次性
的全局规划来获得一条初始状态到达目标状态的最
路径规划是智能交通、 通信网络、机器人等人工 优路径, 但很多现实情况下,对于环境信息,特别是
收稿日期:
20
09
0
6

8;最终修改稿收到日期:2
01
0
08

24本课题得到国家自然科学基金(
. 6
07
73
09
7,
60
87
30
44,

087
31
4,
86
09
73
08
9)
、符
号计算与知识工程教育部重点实验室开放基金项目(93
K
17

20
09
K
02,

3K
17

20
09
K
06和吉林大学研究生创新基金(
) 2
01
11
06
0资助.

女,
魏 唯, 1
94年生,
8 博士研究生,主要研究方向为智能规划与自动推理.
E
ma:

lwe
iw

i.
ne
nu@
ya
ho
o.
co
m.c
n欧阳丹彤,
. 女,
19
68年
教授,
生, 博士生导师,主要研究领域为基于模型的诊断与自动推理.E
m
ai
l:
oua
nda

yg gt
on@1
63
.c
om吕
. 帅,男,
19
81年生博
,士,讲
师,
主要研究方向为智能规划与自动推理. 男,
冯宇轩, 1
90年生,
8 博士研究生,主要研究方向为智能规划与自动推理.
5期 魏 唯等:
动态不确定环境下多目标路径规划方法 8
37
动态障碍物的信息很难具有先验知识, 实际移动过 最优性的方法, 首先根据当前观测信息采用逆向启
程中可能探测到真实情况与最初观测不同, 这时只 发式搜索方法进行全局规划, 并选择一条实际移动
能根据实时探测到的环境信息, 经过多次重规划来 路径, 移动过程中探测到不一致的环境信息时执行
获得从当前状态到达目标状态的移动路径. 很多研 局部重规划, 重规划过程对先前搜索过程中的各项
究者已提出了不确定环境以及动态障碍物环境下求 记录实时地更新, 更新后在全局规划的基础上进行
解路径规划问题的方法和策略 , [1

4]其中增量搜索是 增量式搜索, 求解当前状态与目标状态之间的最优
一种非常有效的处理方法, 对于不确定环境下的路 路径集合. 实验结果表明: 采用增量重规划的动态多
径规划问题, 能够对搜索现场所保留的信息进行有 目标路径规划方法通过搜索信息的重用与启发信息
效地重用, 从而减少工作量. 的引导提高了求解效率, 能够有效地求解一系列动
传统的路径规划只考虑单个衡量准则的优化. 态不确定环境下的多目标路径规划问题.
然而, 单个目标函数往往很难准确描述很多现实问
题中多个相互冲突的衡量准则. 路径规划问题中需 2   相关定义
要优化的目标函数超过一个并需要同时处理时, 称
为多目标路径规划. 启发式搜索方法在人工智能的 本节给出多目标路径规划问题的相关定义, 下
众多领域都有广泛应用, 其用于解决多目标路径规 述定义中, 向量表示路径的权重, 向量的维数表示需
划问题得到了相关研究者的关注. 多目标启发式搜 要优化的目标函数的个数, 每一维元素刻画一个单
索模型最早由S te
wa
rt与Whi

e 提出,将A算法扩 独的目标上的优化准则.
 支配关系是向量之间的一
展到多个目标函数的情况, 利用启发式搜索方法很 种偏序关系.
好地处理了多目标路径规划问题[5]; D
asu
gpta等人 多目标路径规划问题可以形式化地表示为三元
在搜索过程中使用非单调的启发信息, 将多目标启 组〈 犌 ,
犛 s

ar,
t犛go

l〉其中犌
, =( 犖,犃,犮)表示状态空间
发式搜索方法应用于V L
SI设计问题 ;

6]
Mand
ow 图,犖为状态节点集合, 犃为弧的集合, 犮(
犿 ,
狀 )为转
等人提出了路径扩展的方法, 弥补了多目标启发式 移代价函数, 表示由状态节点犛 犿转 移 到 状 态 节 点
搜索中采用节点扩展方法的不足, 提高了求解的准 犛 狀的 狇维代价向量, 犌为无向图时, 犮 (犿 ,
狀 ) =
确性78;
[ ]
Da
su
gpt与
aH ar
ik
uma
r 等人提 出 了几 种 (,
犮狀犿 犛); st
ar
t∈ 犖为初 始 状 态 节点 ;犛 o

gl∈ 犖目 为
深度优先搜索方法用于解决多目标路径规划问 标状态节点.
] 设
题[6,9].目前,很多状态空间搜索规划器在求解智能 定义1 [
6. 向量犳 1和 犳2为 两个犓维向量, 称
规划问题时也考虑了多个衡量尺度的折中 . 犳 1弱 支配犳 2当 且仅当犻 ,
1 犻犓满足犳  犳 ,记

10
1
2]

1 犻

多目标的引入使得问题的求解与单目标条件下 作犳 1犳 2,其中犳 犻
1和犳 犻
2表示向量 犳1和 犳 2的 第 犻个
不同, 由于各个目标之间通常都存在着冲突, 一个解 元素.
] 设
对于某个目标来说是较好的, 对于其它目标来说可 定义2 [
6 .  向量犳 1和 犳2为 两个犓维向量,
能是较差的, 这样就造成多目标路径规划问题一般 称犳 1强 支配犳 2当且仅当 犻,1犻 犓满足犳 犻
1 犳2犻
不存在唯一确定的最优路径, 而是一组无法进行相 且 犳1≠犳 2,记作犳 1犳2,其中犳 犻和
1 犳2犻表 示向量 犳1
互比较的最优路径的集合. 当移动过程中检测到变 和犳 2的 第 犻个元素.
] 对
化的环境信息时, 需要实时地重新规划出新的移动 定义3 [
6 . 于向量集合 犡 称向量狓
, ∈ 犡为非
路径, 这就要求以最快的速度计算出当前状态与目 支 配的 当 且 仅 当 /

∈ 使
犡 狔得  ,
狓狀 称 狅狀犱狅犿 (犡 )=
标状态之间的最优路径集合, 因此,在动态不确定环 狓 { ∈犡 |/
 狔∈ 使
犡 狔得  }
狓 犡为 集 合 中 所 有 非 支 配
境中进行有效的多目标路径规划增加了问题求解的 向量的集合.
] 设 是
难度. 定义4 . 犘 狀 状 态节点犛 犿与 状态节点

7 犿
文献[ 1
3]提出了一种多目标增量搜索算法, 在 犛狀之 间的所有路径的集合, 路径狆 1,
狆2∈ 犘 犿狀,称狆 1
求解过程中状态格局之间发生微小改变时, 通过对 支配狆 2,当 且 仅 当犵
1 犵2,记 作 狆1狆 2,其 中 犵 1与
先前搜索信息的重用, 能够快速地得到新问题的最 犵 2分别 是 路 径 狆 与
1 狆2的 代 价向 量 .
] 设 是
优解集, 适用于求解一系列相似度较高的多目标问 定义5 . 犘 狀 状 态节点犛 犿与 状态节点

7 犿
题. 本文进一步提出在移动过程中检测到环境信息 犛 狀之 间的所有路径的集合, 路径 狆1∈ 犘犿狀,称 狆 1为 非
的改变时, 如何快速调整移动路线以保证全局工作 支配路径当且仅当 /狆2∈ 犘犿狀使 得狆 2 狆1, 即不存

38 计  算  机  学  报 2
01年

在其它路径在所有目标上都优于路径狆 1. 态 7的
狊 代价估值,犺7为 状态狊7到初始状态 狊0的最优
指定初始状态犛s
ta

t与目标状态犛 o
ga
l,多目标路 代价估计, 此时犳(狆)
3= (
犵狆
3 )
+狊7为路径狆 3的代价
径规划问题的最优解集即为犛 s

ar
t与犛
go

l之间的所有 估值. 可见, 路径扩展方法对于到达同一个状态的各
非支配路径的集合, 它们的特点是无法在改进任何 个路径进行区分, 搜索过程用集合犌 o
p(犿记录到达

目标函数的同时不削弱至少一个其它目标函数, 均 状态犛 犿的 未扩展的路径, 集合犌 c
l(犿)记录到达状态
视为一条最优路径. 犛犿的已扩展的路径, 因此,逆向搜索的扩展过程中
上述定义了两种支配关系, 原因如下: ()
1搜索 犌o
p(犿)∪犌c
l( 记录的是当前已找出的目标状态
犿)
过程中各个目标函数上权重都相等的两条路径具有 与犛 犿之间 的 所有非支配路径, 表犗犘犈 犖记录当前
同等的资格做进一步考虑, 此时利用强支配关系比 各个状态节点的所有未扩展路径, 每一个记录项为
较所有待扩展候选路径; (
2搜索过程中的一条路
) 三元组( 犛犿,犵(
狆)
,犳(
狆 )
)表示的一条路径狆 .
径的代价估值与已求出的一条解路径的权重相等
时,该路径扩展出的任何路径必然是被这条解路径
强支配的, 已没有进一步扩展的必要,此时利用弱支
配关系比较候选路径与解路径即可.
 逆向多目标启发式搜索

当问题指定唯一确定的初始状态与目标状态,
状态空间图为无向图时, 可以采用逆向搜索方法, 从
目标状态开始执行搜索过程, 求解初始状态与目标
状态之间的最优路径集合.
采用路径扩展方法的多目标启发式搜索方法每
次扩展的基本单位是一条路径, 利用路径的启发信
息引导搜索过程以提高搜索效率.
] 设为
定义6 [
7   狆 搜索过程中到达状态节点

犛犿的一条路径, 称犳 (狆)=犵 (
狆 )+犺犿为 路径狆的代
价估值, 其中犵 (
狆 为路径狆的代价向量,
) 犺 犿为 犛犿上
的启发信息, 估计每一个目标函数上从状态节点犛 犿
到达目标状态的最小代价.
正向搜索时, 路径狆为从初始状态 犛 s

ar
t到达状
态节点犛 犿的 一条路径, 犵(狆 为状态节点犛
) 犿的 起始
距离,犺犿为 从犛犿到 达目标节点的代价估值. 逆向搜
索时,狆为从目标节点犛 o
ga
l到达状态节点犛 犿的 一条 图1 正向搜索与逆向搜索
路径,犵(狆)为犛犿的 目标距离, 犺 犿为 从犛犿到 达初始状 定义7 设狆
. 1为表犗 犘犈犖中一条未扩展路
态的代价估值. 如图1所示, 其中( a)为正向搜索过 径, 犳(
狆1为路径狆
) 1的代价估值, 称狆1为一条非支
程,当前状态为 狊5,
狆 1=狊
0→ 狊2→狊6→狊5为 从初始状 配犗 犘
犈犖路径当且仅当 / (狀,
犛犵(2)
狆 ,
犳(2)
狆)∈
态 狊到
0狊 5的一 条路 径 ,(
犵狆 )为
1 狆 1的 代价 向 量 ,
狆2= 犗犘犈犖使得犳(
狆2)犳(
狆)
1.

0→狊3→狊5为 初始 状 态与 狊5之 间 的 另一 条 路 径, 多目标启发式搜索利用向量之间的支配关系从

犵狆 )为
2 狆 2的 代价向 量,
犺 为
5 狊 5与 目标 状 态 γ 之间 犗
犘犈犖表中选择将要扩展的路径并识别最优解路
最优代价的估计, 因此 犳(
狆 1)
= 犵(
狆 1)
+ 犺5为 路径狆1 径 从非空的犗
, 犘
犈 犖表中选择一条非支配犗 犘
犈犖
的代价估值, 而犳狆( )
2= (
犵狆 )
2+ 犺5为路 径 狆2的 代价 路径进行扩展,并将 扩展出的 路径插入 犗
犘犈犖作

估值; (
b)为逆向搜索过程, 从目标状态 γ开始执行, 为下一次扩展的候选路径, 在此过程中,用犆犗犛犜

当前状态为 狊 ,
7狆 =
3γ 狊 狊
→9→7 为目 标状 态 与 狊7之间 记录当前已求得的 非支配解 路径 集合.
的一条路径, 犵(
狆3)为从目标状态沿该路径到达状 下面给出逆向多目标启发式搜索算法B MH

5期 魏 唯等:
动态不确定环境下多目标路径规划方法 8
39


ack
wa
rdM
uo
be

jt

veH
eu
ri

ti
cS
ea

ch的基本 支配解路径,
) 而单目标搜索过程,
如经典的
A算法,
流程. 只需要求出初始状态与目标状态之间一条最优路
算法1 .B
MHS(〈
犌,
犛st

r,
t犛o

gl〉,
犗犘犈犖,犆
犗犛
犜犛. 径,
) 并且一旦得出最优路径, 搜索过程立即结束.

输入:多目标路径规划问题〈 ,
犌犛 s

a ,
t犛
r go

l〉初
,始犗犘
犈犖 果目标函数的个数退化为单个目标, 支配关系变成
表与犆犗
犛犜犛集合 单纯的小于关系, 那么算法1将变成求出所有最优
输出:最优路径集合 路径的逆向A算法,
 即若存在多条代价相等的最
1反复执行步1
. .
1~1
.,
3直到犗 犘犈 犖表为空
1.
1路径选择.
. 从犗犘犈犖表中根据路径代价估值选择 优 路径,搜索过程将在逐个求出这些路径之后结束.
一条非支配犗 犘犈 犖路径狆 狓进行扩展, 令犵 (
狆狓)为路径狆 狓的
代价向量,

犘 犈
将狆
犖表中删除,
狓 所 对
并将狆
应 的
狓从



o(





犛 ,
犿犵
移到犌c




),
狓 犳
犿);

狆 狓 从

)  动态多目标路径规划

1 .
2.若犛 =犛
犿 s t
a ,则
t 狆
r 狓为一 条 解路径 ,
犵狆( 为解路径
狓)
本节提出动态多目标路径规划算法D MPP

狓的 代 价,将 (
犵狆 狓)加 入犆 犗犛犜 并
犛 犗从 犘
犈 犖 删除所有
( 表中 ) 执
, 行过 程
被犵 (
狆狓)支配的未扩展路径; Dy namicMul
ti
obje
cti
vePathPlanning
1 .
3.若犛 犿≠犛 s

ar
t,则对犛 犿的 分为全局规划与局部重规划.
所有前驱状态犛 狀,生成到 全局规划获得初始状
达犛 狀的路径 狆 ,
狔 犵令 (狆 )
狔= (
犵狆狓+) (, 态与目标状态之间的最优路径集合,
),
犮犿狀 犵狆若 ( 狔)不被 移动过程中探
犌o
p(
狀 )犌
∪ c
l(
狀) 中任意路径代价支配, 则 测到环境信息改变时, 局部重规划过程重新计算出
1 .
3.
1.将狆 狔插入 犌 o
p(狀)
,并 删 除犌p(
o 狀)∪犌 (
狀 )中所
变化点与目标状态之间的移动路径,

l 直到成功移动
有被狆 狔支配的路径; 到目标状态.
1 .
3.
2.计算路径狆 狔的 代价估值犳 (
狆狔),若犳(狆狔)不被

犗 犛犜犛中任何解路径支配, 则将( 犛 ,
狀犵(狆4.


狔犳, 动态多目标路径规划算法

狆狔))插入

犘 犈犖表并记录相关的前驱信息; 当探测到实际情况与最初观测不符时, 为避免
2 输出所求得的犛
. st
ar
t与犛go
al 停留时间过长,
之间的最优路径集合. 需要立即重新计算出当前状态与目
算法1从输入接收犗 犘犈犖表初始值, 对于给定 标状态之间的最优路径. 本节提出的动态多目标路
的多目标路径规划问题, 初始假设只有一条代价向 径规划算法进行局部重规划时, 对受影响的记录进
量为零向量的路径到达目标节点, 令犗 犘
犈犖= 行更新, 更新后在发生变化的状态与目标状态之间

(犛
go ,
l犵
a g ,
l犳

a g )}

l 犆

a 犗
犛犜 为
犛 .空 每次 循环首先判 进行重规划, 求得剩余的最优移动路径.
断犗犘犈 犖 是否为 空当
, 犗犘犈犖 为空时,搜索过程终 下面给出动态多目标路径规划算法D MPP的
止,
输出所求得的最优路径集合; 犗犘犈
犖 表 非空时, 基本流程.
从中选择一条非支配的犗 犘犈犖 路径进行扩 展. 算法2 .
  DMPP (
犌,犛s

ar
t,犛go
al).
对选出的一条路径狆 犿进行 扩展时,生成到达状 输入 :多目标路 径 规划问题 〈 ,
犌犛 s
t ,
t犛

r o
ga
l〉
态犛犿的 所有前驱状态的路径, 当生成的路径在所有 输出: 到达目标状态的最优移动路径
到达该前驱状态的路径中非支配时, 计算路径的代 1.初始化. 犗犘犈犖={ (
犛go

l,犵go

l,犳gl)

a } ,
犆犗犛犛为

价估值, 若生成的路径代价估值不受当前任何最优 空集 ;
解路径支配, 则将该路径插入犗 犘犈犖表;否则,该路 2.全局规划. 执行逆向多目标搜索过程B MHS(〈
犌 ,
径已没有继续扩展的必要, 直接舍弃.扩展到达初始 犛 st

rt,
犛go
a〉
l,犗犘
犈犖,犆犗犛犜犛)求得初始状态与目标状态之

状态时, 则求得了初始状态与目标状态之间的一条 间的 最 优路 径集合 从
, 中 选择一条实际移动路径;
解路径. 由于多目标路径规划问题需要求解一个最 则输出 3.沿移动路径向目标状态移动, 若成功到达目标状态,
优解集, 在求得一条解路径之后, 搜索过程并不终 所移动的路径, 算法结束;
4 若
. 犛移动到 e时探测到由犛 e到 达相邻状态犛
止,而是反复扩展犗 犘犈犖表中其余路径, 直到求出 的情况 发生改变,

ha
ng
则执行局部重规划过程:

ha
ng 狏

所有非支配解路径. 将新生成的路径狆 狔插入犗犘


犈犖 4 .1.执行更新过程U P
DATE (
犛ch
an
ge)

表之前进行过滤, 若狆 被
狔 犆犗犛犜犛中的 一条解路径 4.2.执 行逆向 多 目标启 发 式 搜 索 过 程B MHS(〈
犌 ,
支配, 则狆狔不被 插入犗犘犈犖 表;每当求 出一条非支 犛
ch
an
ge,
犛go

l〉,
犗犘犈犖
′ ,
犆犗 犛
犜犛
′),重新计算犛 ch
an
ge与目标状态
配解路径时, 过滤掉犗 犘犈犖 表中所有被 其支配的路 犛
go
a之间的最优路径集合;

径.两次过滤过程保证了每次循环从犗 犘犖表中选 5
犈 .转步3 .
出将要扩展的路径是不被任意解路径支配的. 算法3 .
  UPDA T(
E犛ch
an
ge).
上述多目标搜索过程反复执行直到求出所有非 1.更新犌 op(
犛c
ha
ne)
g ∪犌l(
c 犛c
ha
ne)
g 中所有包括( 犛c
ha
ne
g,
840 计  算  机  学  报 20
11年
狏)
犛 的路径; 定理1 .动态多目标路径规划算法是犖可采
2 令
.犆 犗犛犜犛′
= 犌o (
p犛c
ha
n )
e∪
g 犌c(
l犛 c
ha
ng)
e犌, (
l犛
c c
ha
ne= 纳
g) 的.
犌o
p(犛
ch
an
g)
e 犌
∪cl(
犛c
ha
ne
g),并将犌 o(
p犛c
ha
ne
g)置为空集; 证明.  根据引理1 全局规划过程时可采纳的.

3.对犛 o
gl扩
a 展到犛 c
ha
ne过
g 程中所有中间状态犛 狌的 局部重规划过程首先对变化点 犛c

ane
g的犌 o
p(犛c

ane
g)∪
犌o
p(狌)
犛 集合中所有路径代价 犵狌,计算其到达犛 c
ha
ne
g的代价估 犌 c
l(
犛c
ha
ne
g)中所有受影响的路径进行更新, 更新后的
值犳狌,若犳 狌不受犆 犗
犛犜犛′ 中任意解路径支配, 则向犗 犘犈 犖
′ 插 犌 为变化后犛

p(犛
ch

ng)
e∪犌c
l(
犛c

ane
g) ch

nge与 犛o
ga
l之间
入记录( 犛狌,狌,
犵犳 狌)
. 当前已求出的所有非支配路径, 作为重规划搜索过
算法2首先进行全局规划, 求得犛 s

ar
t与犛 go

l之 程的初始犆 犗犛犜犛集合, 由此可以直接得到犛 c
ha
ne与
间的最优路径集合, 从中选择实际的移动路径. 对于 犛go
al之间部分解路径. 更新后对各个状态在全局规

每个状态节点犛 犿,犌p(犿 )∪犌 (犿)记录了犛 犿与 目 划
向目标状态移动的 构中 没有被扩展的路径计算到达犛 的代价估值,
o c


ha
ne

标状态之间的所有非支配路径.
过程中实时探测环境信息是否发生改变, 直到移动 位成 置
接下来搜索过程的初始犗
的 变 化对 犛c
ha
n 与
e 犛
g o
ga
l之




犖表.
其余 状
由于犛
态的犌








到目标状态, 算法成功终止. 步4为探测到环境信息 犌 c


l没有 任 何 影响 ,重规 划 的搜 索过 程 能 够直 接重 用
发生改变时的局部重规划过程. 当探测出犛 移动 这
执行算法3的更新过 以些 信息, 从更新后的犗 犘犈犖表与犆 犗 犛犛开始,

ch
an
ge
到犛 狏的 实际移动代价变化时, 犛 o
ga
l为初始状态, 犛c
ha
ne为
g 目标, 执行逆向启发式
程,对犌 o
p(犛c
ha
ne
g)∪ 犌c
l(犛ch
an
ge)中所有经过( 犛c
ha
ne
g,搜索过程, 继续求解犛 c
ha
ne
g与犛 o
ga
l之间的最优路径集
狏)
犛 的路径代价进行修改; 当犛 c
ha
ne
g与犛 狏之 间出现障 合. 由此可见, 重规划过程能够对先前全局规划所保
碍物阻塞时, 更新过程删除犌 o
p(犛ch
an
g)
e∪ 犌c(
l犛c
ha
ne
g)留的部分信息进行正确地重用, 因此, 动态多目标路
中所有经过( 犛c
ha
ne
g,犛狏) 的路径代价. 更新后的 径规划算法是犖可采纳的, 启发信息犺 狀犺时
狀 ,算
犌o
p(
犛 ch

ng)
e∪犌 c
l(犛c

ane
g)既为重规划过程所要求解 法始终能够求得移动过程中变化的状态与目标状态
的部分最优路径, 遍历由犛 o
ga
l扩展到犛 c
ha
ne
g过程中所 之间的最优路径集合. 证毕.
有中间状态犛 狌的 未扩展路径集合 犌 o
p(狌),生成重规 动态多目标启发式搜索算法的主要空间开销为
划搜索过程的初始犗 犘犈 犖表. 从更新后的犗 犘犈犖 全局规划对整个状态空间进行搜索的过程中存储到
表开始, 仍以犛 o
ga
l为初始状态, 以犛 c

ane为
g 新的目标 达各个状态节点的路径.
状态执行逆向启发式搜索, 重新计算犛 c
ha
ne
g与犛 go

l之 引理2 . 对于包含犔个元素的 狇维向 量集合,
间的最优路径集合. 其中非支配向量个数平均为犗 ((
ln犔 )
狇 )]

1 [

4 .
全局规划的搜索方向是从目标状态向初始状 定理2 .  动态 多目 标 路 径规 划 算法 最 坏空间
态,而重规划的搜索方向是从目标状态向变化状态, 复杂度为犗 ((
ln犕 犖))

狇1 ,其中犖为状态空间中状
两次搜索可以看作是初始点相同但目标点不同的相 态节点数, 犕为到达各个状态节点的非支配路径个
似搜索过程, 因此重规划能够重用全局规划所保留 数的最大值.
的各个状态的犌 p与
o 犌 c
l,使得每一次重规划过程在 证明.  引理2证明了对于元素个数为犔的 狇
先前搜索的基础上以增量的方式执行, 先前的两部 维向量集合, 其中非支配的向量的平均个数为
分信息能够被重用: ( )
1 犗初 始 犘 犈犖 表 直 接 获得 各 犗((
ln犔))
狇-
1 .在逆向多目标启发式搜索中, 由于采
个状态节点的未扩展路径, 而不是从空的犗 犘犈 表
犖 用路径扩展方法, 存储空间需要记录到达各个状态
经过一步步扩展逐个求出到达每个状态节点的路 节点的所有路径, 令犕为到达一个状态节点的所有
径;(2犌)由 o(
p犛 c
ha
n )
e∪
g 犌 (
l犛
c c
ha
ne
g)可 以 直 接 获得 重 路径中非支配路径个数的上界, 当状态空间中状态
规划过程的部分解路径, 而不需要逐个求解. 节点个数为犖时, 需要存储的路径个数最多为
4.
2 算法可采纳性与复杂度分析 犕犖, 因此,狇个目标函数的动态多目标启发式搜索
如果一个搜索算法对于任何存在解路径的图都 的最坏空间复杂度为犗 ((
ln犕 犖)狇-
1). 证毕.
能找到一条最优解路径, 则该算法为1可采纳的; 如 搜索过程利用启发信息对路径到达目标状态的
果一个搜索算法对于任何存在解路径的图都能找到 代价进行估计, 能够更快地判断路径是否为一条非
有限的最优解集, 或者对无限的最优解集永不终止, 支配路径, 当一条路径的代价估值犳被一条解路径
则该算法是犖可采纳的 . [
7] 支配时, 即 犮∈犆犗犛犜 犛使得 犮 犳,若启发信息
引理1 .多 目 标启 发 式 搜索 的 是犖可采纳的. 犺 []
8 狀 犺狀,
 则犳 犳,从而犮  犳 犳,
 该路径到达目
5期 魏 唯等:
动态不确定环境下多目标路径规划方法 8
41
标状态的实际代价一定是被支配的, 因此该路径不
需要继续扩展. 利用启发信息引导搜索过程能够提 5   实验测试与结果分析
早判断被支配的路径, 减少路径扩展数, 提高求解的
时间效率, 重规划过程通过信息的重用, 缩短了求解 本节采用二维g ri
d wod标准测试问题进行实


时间. 另外, 算法的时间复杂度启发信息的定义与计 验测试, 用来做实验的机器配置如下: 操作系统
算密切相关. f
ed
ora8.0,CPUI
nte
l Pe
nt
ium42.80
GHz内存

4.
3 增量重规划与普通重规划的比较 5
12MBD DR.
全局规划过程中, 采用正向搜索时, 犌o ( )
p犿∪ 5 .
1 测试问题描述
犌 (
l犿
c )记 录了 犛 s

a 与
t犛
r 犿之 间 的 所 有 非 支配 路 径,搜 4个方向的g r

d word问题作为多目标路径规

索过程中记录了每个状态节点与犛 st
ar
t之间 的 非 支配 划问题的状态空间, 初始位置为左上角的格子, 目标
路径. 若采用逆向搜索进行全局规划, 犌o ( )
p犿∪ 位 置为右下角的格子, 用各个格子在g r

dwo
rd中

犌c(
l犿 )记 录的 是 犛go
a 与
l犛 犿之 间 的 所 有 非支 配 路 径, 的坐标来标识状态节点, 每个状态节点的4个相邻
搜索过程记录的是犛 go

l与 每 个 状 态 节 点之 间 的 非支 格子作为其后继状态节点; 向量的每一维元素值在
配路径. 当指定唯一确定的初始状态与目标状态时, [ ,
110 ]之间 的整 数中随 机 生成;对生成的多目标路
全局规划过程采用正向搜索与逆向搜索的计算量是 径规划问题进行求解, 选择经典的M an
ha
tt
an
基本相同的. D
is
tanc
e 作为 每一个目 标 函数上 的启发 信息.
局部重规划重新计算犛 c
ha
nge与 犛o
ga
l之间的最优 图2为动态不确定环境下多目标路径规划的问
路径集合. 全局规划采用正向搜索时, 重规划过程要 题描述, 全局规划求得初始位置犛 st

rt与目标位置
以犛 c

ane为
g 新的初始状态, 犛go
al为 目标状态执行搜 犛 go

l之间的最优路径集合, 实际移动时从最优路径
索,完全重新求解犛 ch
an
g与犛
e o
ga
l之间的多目标路径规 集合中选择满意程度最高的一条路径移动, 图2(
a)
划问题, 搜索过程中求出的是各个状态节点与犛 c
ha
ne 为
g 犛st

rt与犛go

l之间的最优路径集合. 图2(b由犛
) s
ta


之间的路径. 由于全局规划与局部重规划的搜索过 开始 的实线标记为实际移动路径, 移动过程中探测
程具有不同的初始状态, 搜索过程中记录的路径代 环境信息, 假设在犛 c

ane
g位置(灰色标记的格子) 探测
价不同, 先前搜索对各个状态节点记录的路径信息
无法被重规划过程重用, 只能够重新执行一次搜索
过程来对剩余的路径进行求解. 然而, 若全局规划采
用了逆向搜索方法, 在重规划过程中将仍然以犛 go


为初始状态, 以犛 c
ha
ne
g为 新 的 目 标状 态 执 行搜 索 过
程,由于前后两次搜索过程具有相同的初始状态

go
al不受变化影响的各个状态节点与犛
, go
a之间的

路径代价不变, 因此全局规划与重规划过程中大部
分状态节点的犌 op∪ 犌l集
c 合中包含相同的路径信
息.重规划过程开始时, 遍历各个状态节点当前的未
扩展路径记录能够直接获得初始犗 犘 犈犖表, 而不是
从空犗 犘 犈犖表开始搜索过程, 这将省略很大一部分
扩展工作; 另外, 重规划的目的在于重新计算犛 c
ha
ne

与犛 o

gl之 间的 最 优 路径 集 合,而 全 局 规 划的 搜 索 方向
是由犛 go
al向犛 c
ha
ne
g进行的, 犌o(
p犛 c
ha
ne
g)∪犌c(
l犛ch
an
g)
e所
记录的恰好是犛 c
ha
ne
g与犛 o
ga
l之间已存在的路径, 这部
分信息重用进一步减少了重规划搜索过程的计
算量.
由此可见, 增量重规划能够充分利用先前全局
规划时每个状态节点所记录的信息, 而不是彻底地
重新求解, 从而提高求解的效率. 图2 动态不确定环境下的路径规划问题

42 计  算  机  学  报 2
01年

到环境改变, 先前移动路径被阻塞, 犛

ha
ne与
g 犛o

gl之 无启发信息两种情况的结果进行比较, 第4部分对
间的加粗实线标记为对剩余路径执行局部重规划需 目标函数的个数多于两个的问题进行测试, 分析
要求得的最优路径集合. DM
PP算法对不同目标函数的动态路径规划问题
5.
2 实验结果分析 的求解能力.
测试分为4部分, 由于实际问题中同时考虑两 第1部分实验中, 格子可能被动态障碍物阻塞,
个衡量准则的情况最为常见, 因此前3部分实验对 当一个格子之间被阻塞时, 4个方向上相邻的格子
两个目标函数的路径规划问题进行测试. 首先对生 无法通过它.障碍物阻塞情况的动态变化将导致问
成的问题进行全局规划, 由目标状态犛o
gl 初
a向 始状 题最优路径集合的改变. 当移动过程中探测到犛c

ane

态犛s
ta
r执行搜索,
t 并从求得的最优路径集合中选择 周围格子的障碍物发生改变时, 对探测到变化的位
一条从犛 s

ar
t到达犛go

l的移动路径.第1部分实验测 置犛c

ane与
g 犛
go

l之间的最优路径执行局部重规划.
试移动过程中探测到动态障碍物的阻塞情况发生变 选取移动路径上的不同位置进行测试, 随机更改
化时增量重规划的求解效率, 第2部分实验测试移 各个方向上障碍物的阻塞情况, 表1为不同测试
动过程中探测到实际的移动代价发生变化时增量重 问题下采用增量重规划与普通重规划的测试结果
规划的求解效率, 第3部分对增量重规划过程中有 比较.
表1
 动态障碍物环境下增量重规划与普通重规划的结果比较
增量重规划结果 普通重规划结果


ids

ze
=I / /
50×
50 n

ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed Ti
mes M
axO
PEN
si
zePat
hs
ex
pa
nd
edTime

pr
ob
01 2
18 35
0 1
84
3 0
.6
71
8 47
8 2
 0
93  0 .8
14

pr
ob
02 1
72 87
0 2
29
9 1
.9
40
6 1
19
8 24
37 2
.4
76

pr
ob
03 98 97
9 2
78
3 2
.2
38
5 1
38
6 36
40 3
.8
14

pr
ob
04 1
25 104
3 3
47
7 4
.1
12
7 2
46
7 54
18 7
.1
21

pr
ob
05 73 275
7 4
64
2 6
.1
61
8 4
21
9 74
13 1 0
.4
07



ids

ze
=In

ti

lOP
ENs

ze M
axOP
ENs
iz
ePat
hs
ex
pa
nd
ed Ti
m/
es M
axO
PEN
si
zePat
hs
ex
pa
nd
ed T
im/



00×
10

pr
ob
01 3
29 76
1 3
09
2 2
.5
70
6 98
5 39
86 3
.9
58

pr
ob
02 4
36 107
4 4
87
9 5
.4
67
3 1
21
1 59
22 7
.0
23

pr
ob
03 2
08 132
5 8
59
4 1 6
.8
37
2 1
98
2 1
66
57 2 9
.4
73

pr
ob
04 1
99 223
1 29
89
4 4 4
.2
63
7 3
35
9 4
41
47 7 3
.6
75

pr
ob
05 78 275
7 37
72
3 7 0
.2
38
5 4
21
9 7
14
13 1 02
.8
96



ids

ze
=I / /

50×
10 n
5 i
ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed Ti
mes M
axO
PEN
si
zePat
hs
ex
pa
nd
edTime

pr
ob
01 9
43 129
5 40
29
3   77
.5
71
3 2
23
8 5
46
72 8 9
.6
57

pr
ob
02 10
76 208
8 88
46
9 1 54
.3
21
9 3
34
2 10
98
34 1 91
.2
30

pr
ob
03 7
72 386
4 1
10
65
8 2 31
.4
53
9 4
98
1 19
87
36 3 06
.5
49

pr
ob
04 3
63 487
3 1
89
36
5 3 69
.8
34
0 6
73
5 30
54
39 5 87
.9
38

pr
ob
05 4
68 765
9 2
46
86
4 4 43
.7
48
2 8
72
0 42
77
63 7 39
.5
87



ids

ze
=I / /

00×
20 n
0 i
ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed Ti
mes M
axO
PEN
si
zePat
hs
ex
pa
nd
edTime

pr
ob
01 18
43 788
6 2
56
84
4 5 39
.5
38
2 8
00
3 29
83
39 9 38
.6
54

pr
ob
02 8
93 796
5 3
00
92
8 7 95
.3
94
5 8
32
0 40
98
34 1 5
43
.9
84

pr
ob
03 10
09 899
3 4
49
38
4 1 2
89
.4
90
5 8
78
3 53
98
45 2 0
34
.5
39

pr
ob
04 9
83 988
2 5
09
43
8 1 6
49
.3
93
7 9
99
8 59
84
73 2 9
37
.3
82

pr
ob
05 6
94 1
250
3 5
90
33
4 2 3
54
.4
22
0 11
23
2 66
94
84 4 2
34
.9
83



ids

ze
=In

ti

lOP
ENs

ze M
axOP
ENs
iz
ePat
hs
ex
pa
nd
ed Ti
m/
es M
axO
PEN
si
zePat
hs
ex
pa
nd
edTim/



50×
25

pr
ob
01 17
63 679
5 3
32
10
5 8 43
.4
32
4 6
98
4 40
87
97 1 4
53
.3
72

pr
ob
02 23
19 788
6 3
98
75
3 1 1
24
.3
87
4 7
97
8 43
54
38 1 9
93
.2
32

pr
ob
03 20
08 806
5 4
87
96
8 1 9
83
.4
52
4 9
65
8 54
30
02 3 0
53
.5
39

pr
ob
04 15
68 897
6 5
27
59
3 2 8
47
.3
43
8 10
92
8 60
94
83 4 0
48
.3
48

pr
ob
05 10
98 1
346
2 6
32
06
5 3 8
27
.2
43
8 14
94
3 71
32
04 5 8
73
.5
43

表1中In
it

al
OPENS
iz
e为增量重规划由更新 空间开销,P
at
hs
Exa
pn
dd为搜索过程的路径扩展

过程得到的初始犗犘犈犖表的大小,为重用全局规划 数,表明搜索过程的计算量,T
im
es为局部重规划

的信息,M
axOPE
NSi
ze为搜索过程中犗犘犈犖表 过程的执行时间.对比两项实验结果,不难看出:

的最大值,体现了搜索过程用来存储未扩展路径的 量重规划初始时能够直接获得部分犗犘犈犖路径,

5期 魏 唯等:
动态不确定环境下多目标路径规划方法 8
43
比于普通重规划,其犗犘犖表的最大值、
犈 路径扩展 局规划没有到达的区域时, 将遇到一些全新的节点,
数与搜索时间均有改进,增量搜索过程存储犗犘犈
犖 节点信息的记录为零, 这时增量重规划的整体求解
表所需的空间更小,这是由于全局规划的搜索方向 时间有一些减慢, 但大部分问题采用增量重规划时
是从目标状态向初始状态执行,而重规划的搜索方 求解效率有所提高, 一些问题的时间效率提高近
向是从目标状态向变化的状态进行,这两个过程可 倍
1.
以看作是初始节点相同但目标节点不同的两次相似 第2部分实验测试中, 格子之间移动的代价随
的搜索过程,全局规划所记录的部分搜索信息对于 机发生改变. 初始时随机生成移动代价,
移动过程中
重规划过程具有利用价值, 因此增量重规划过程 对路径上向前移动的代价进行随机更改, 移动代价
犗犘
犈犖表中一些路径能够直接从全局规划过程继 的改变不会阻塞先前的移动路径, 但可能导致沿先
承,搜索过程所经历的路径数远远小于重新搜索的 前移动路径到达目标状态的代价不是最优的, 此时
过程,另外,重规划过程开始之前已得到部分解路 执行局部重规划过程, 重新求解变化后犛c

ane
g与目标
径,求出解路径的迭代次数更少,相比之下,
普通的 状态犛go

l之间的最优路径集合,再从中确定将要移
重规划过程不保留任何全局规划的信息, 从空的 动的路径. 随机选取移动路径上的不同位置进行测
犗犘
犈犖 表彻底重新求解所有 解路径求
,解效率较 试,对比不同的测试问题下采用增量重规划与普通
差.当障碍物的动态改变使得重规划过程涉及到全 重规划的实验结果, 如表2所示.
表2
 移动代价可变环境下增量重规划与普通重规划的结果比较
增量重规划结果 普通重规划结果


ids

ze
=I / /
50×
50 n

ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed  T
im
es M
axO
PEN
si
zePat
hs
ex
pa
nd
edT i
mes
pr
ob
01 65 5
64 1
76
5 0
.7
63
8 88
3 18
92 0
.7
76

pr
ob
02 1
37 78
5 1
98
0 1
.3
40
2 93
6 22
19 1
.8
76

pr
ob
03 81 88
6 2
28
1 1
.9
86
3 1
09
9 23
92 2
.7
82

pr
ob
04 89 77
1 2
16
3 2
.0
88
5 1
03
0 30
19 4
.0
08

pr
ob
05 73 275
7 4
64
2 7
.8
29
1 4
21
9 74
13 1 2
.9
20



ids

ze
=I / /

00×
10 n
0 i
ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed  T
im
es M
axO
PEN
si
zePat
hs
ex
pa
nd
edT i
mes
pr
ob
01 1
32 83
7 2
20
4 1
.6
49
2 75
9 29
75 3
.0
39

pr
ob
02 3
92 93
0 3
89
2 6
.3
97
5 87
6 44
03 8
.0
38

pr
ob
03 1
90 109
5 5
04
3 1 1
.0
34
5 1
09
2 1
43
20 2 1
.7
85

pr
ob
04 3
09 267
8 21
74
3 3 4
.5
43
5 3
92
1 3
54
36 6 0
.5
43

pr
ob
05 1
28 443
2 45
39
6 8 9
.5
43
6 5
09
4 7
98
42 1 24
.7
68



ids

ze
=I / /

50×
10 n
5 i
ti

lOP
ENs

zeMaxOP
ENs
iz
ePat
hs
ex
pa
nd
ed  T
im
es M
axO
PEN
si
zePat
hs
ex
pa
nd
edT i
mes
pr
ob
01 5
83 90
2 30
98
8 55
.4
93
0 1
84
3 4
30
25 7 9
.8
90

pr
ob
02 7
89 189
3 75
32
4 1 32
.5
43
9 2
78
9 9
94
32 2 00
.8
92

pr
ob
03 8
92 249
0 94
59
3 1 99
.4
36
7 3
90
2 15
43
69 3 25
.4
32

pr
ob
04 2
01 543
6 2
04
32
7 4 06
.9
87
9 8
79
3 38
95
43 6 90
.8
90

pr
ob
05 3
50 678
2 2
78
94
2 4 89
.6
78
2 7
94
5 45
63
67 8 23
.6
78



ids

ze
=In

ti

lOP
ENs

ze M
axOP
ENs
iz
ePat
hs
ex
pa
nd
ed  T
im
e/
s M
axO
PEN
si
zePat
hs
ex
pa
nd
edT i
m/
es

00×
20

pr
ob
01 2
84 378
2 1
09
43
2 2 50
.5
43
9 5
78
2 13
90
15 4 78
.6
78

pr
ob
02 7
26 678
2 2
78
94
3 6 21
.7
89
2 9
76
5 43
89
02 1 2
90
.7
89

pr
ob
03 11
28 902
3 3
99
87
5 1 0
94
.7
57
4 10
94
3 58
90
26 1 9
28
.8
72

pr
ob
04 14
63 1
678
4 5
87
80
9 2 1
78
.4
58
3 19
89
0 70
43
29 3 6
78
.4
79

pr
ob
05 9
74 1
467
8 4
94
32
0 1 9
78
.3
56
7 20
94
3 65
43
20 3 0
89
.8
65



ids

ze
=In

ti

lOP
ENs

ze M
axOP
ENs
iz
ePat
hs
ex
p   s

nd
ed T
im
e/ M
axO
PEN
si
zePat
hs
ex
pa
nd
ed Ti
m/
es

50×
25

pr
ob
01 6
78 489
0 2
78
95
3 6 38
.4
82
9 5
69
3 39
74
20 8 90
.4
39

pr
ob
02 9
02 678
1 3
48
30
2 9 02
.4
32
9 8
02
1 48
90
23 2 0
90
.8
36

pr
ob
03 19
03 730
2 4
49
82
4 1 7
73
.9
26
4 10
04
9 50
43
20 3 3
89
.9
26

pr
ob
04 13
48 679
2 4
08
90
4 1 5
32
.8
82
0 9
90
2 58
90
25 3 8
90
.3
35

pr
ob
05 17
96 879
2 6
92
38
9 4 0
94
.3
39
2 17
99
3 90
32
14 6 9
03
.7
99

由表2可见,
大部分测试问题的增量重规划过 犌
o(
p犛c

ane
g)犌
∪c
l(
犛c

ane
g)中部分路径代价进行更新,
程的犗犘
犈犖表最大值路
,径扩展数,搜索时间都远 利用 更新 后的路径代 价 与其余路径进行支配关系的
远小于普通重规划过程,更新过程中对只需对 比较, 移动代价变小时, 搜索能够利用变化后的路径

44 计  算  机  学  报 2
01年

代价快速地过滤掉其余所有被支配的路径, 避免了 也有一定的影响, 无法单独凭借启发函数大幅度提
不必要的扩展, 移动代价变大时,先前的移动路径可 高效率, 但启发式搜索相对于无启发信息搜索的求
能被其它路径支配, 更新后生成重规划问题的初始 解效率仍有明显的提高. 可见,使用启发信息引导搜
犗犘
犈犖表, 由此开始执行新的搜索过程, 减少了搜 索过程能够避免大量的扩展与计算过程, 大大减少
索过程中的大量计算与扩展工作. 更新过程生成 路径扩展数, 在一定程度上缩短求解时间, 特别是利
犗犘
犈犖表时需要对整个问题中未扩展的路径进行 用搜索方法求解多目标路径规划问题时, 计算量较
支配关系的比较, 将所有不被当前任意解路径支配 大, 启发信息使得求解效率有显著的提高.
的路径插入犗 犘犈犖表,占用了一些执 行时间,并且
当重规划的搜索过程扩展到全局规划没有到达的区 表 3 增量重规划过程中有无启发信息的搜索结果比较
子 增量重规划搜索结果 无启发信息搜索结果
域时,影响了重规划整体的时间效率, 除个别问题时 格 大小 P a
th
se
xa
pn
de
dTim
e/
sP a
th
se
xa
pn
dedT
im/


间效率提高不明显外, 大部分问题时间效率有显著 1 5



×
×

0  

00 2





9  5

8 4









8  








6  7
4 6











提高. 15
0×1
50 153
48
1 3 0
0.
48
82 1 8
48
74 476
.7

41
由上述实验结果可知, 搜索信息的重用是提高 220



×
×




0 4









8 1

















9 4
6 5








81
7 4
















增量重规划效率的关键, 普通重规划无法重用全局
规划中的任何信息, 开始执行搜索过程时犗 犘犈犖表 最后, 进一步对目标函数的个数多于两个的路
为空,需要对重规划问题完全重新求解, 效率较低. 径规划问题进行测试. 对不同目标函数的情况分别
当移动到接近目标状态的位置发生变化时, 计算剩 选取150×10规模下多个的测试问题,
5 表4所示为
余移动路径的计算量较小, 增量重规划与普通重规 不同目 标函数下增量重规划与普通重规划的平均路
划的求解效率差别不大; 若移动过程初期发生变化, 径扩展数与平均搜索时间. 实验结果表明对于各种
即变化位置比较接近初始状态时, 增量重规划的效 不同目标函数情况下的动态路径规划问题, 使用
率明显优于普通重规划, 这是由于大部分移动路径 D MPP算法均能够很好地解决, 求解效率也有不同
需要重新确定, 增量重规划能够直接获得部分解路 程 度的提高.
径与犗 犘
犈犖表中的路径,避免了大量的重复扩展过
程,节省了求解时间. 表4 目标函数个数不同情况下的结果比较
第3部分测试启发信息对求解过程的影响. 对 增量重规划结果 普通重规划结果

at
hs
ex
pa
nd
edTim
e/
sP a
th
se
xa
pn
de
dT i
m/
es
各个规模的问题进行多次测试, 表3记录的是 3 
oj 1
b 0
89
41 2 1
7.
18
87 1693
29 3 2
5.
72
91
DM
P P算法求 解过程采用启 发式搜索与无启 发信 4

































































息搜索的平均路径扩展数与平均求解时间. 不使用 6
ob
j 2 0
83
92 5 9
0.
48
76 3537
24 8 0
2.
78
18
启发信息的搜索过程对所有的路径都进行扩展与存 7 8





j 2

j 3








1 7
1 9












3 4










1 1


















储,而启发式搜索过程利用启发信息引导搜索过程, 9 
oj 4
b 5
76
39 115
7.
56
98 6559
45 157
3.
72
93
只对更有希望的路径进行扩展, 对扩展出的路径利
用支配关系进行过滤, 只存储所有不被任何解路径 上述实验结果表明动态多目标路径规划算法的
支配的路径. 由表中实验结果可见,启发式搜索过程 优点:
的路径扩展数与搜索时间都远远小于无启发信息的 (1)局部重规划过程能够以增量的方式对先前
搜索过程,启发信息压缩了搜索空间, 提高了求解的 搜索保留的信息进行有效重用, 有两类信息能够被
时间效率, 部分问题的搜索时间提高约1 .5倍.从 重用: ①全局规划过程的部分未扩展路径直接作为
表3上看,问题规模越大, 使用启发式信息相对于没 局部重规划过程的未扩展路径, 记录在犗 犘犈犖表
有使用启发式信息的效率提升越不明显, 这是由于 中; ②全局规划过程的部分已扩展路径直接作为局
多目标问题要求最终求解出所有的非支配解, 并非 部重规划过程的解路径, 这两类信息的有效重用使
只求解一个最优解, 因此求解过程的计算量远远超 得重规划节省了大量的计算时间.
出单目标问题, 特别是随着问题规模的增大, 所需计 (2)利用启发式能够提前识别出非最优解, 避
算量迅速增加. 启发信息用于提前识别非最优路径, 免不必要的扩展, 进一步上压缩搜索空间. 实验部分
加速求解,然而由于多目标问题本身的特点需要反 测试了利用搜索方法求解多目标问题时启发信息对
复执行搜索过程, 直到求出所有最优解,对求解效率 求解效率的影响. 算法中的启发信息用于选择将要
5期 魏 唯等:
动态不确定环境下多目标路径规划方法 8
45
扩展的路径以及对新生成的路径进行过滤. 路径选 Na
ti
on
alConf
er
enc
e o
nA r
ti

ic

alI
nte
ll

ge
nc
e a
nd1
4thCo
n
择步骤时,犗犘
犈犖表中的非支配犗 犘犈犖路径被认 f














ar

In




va






eA
,20





















ofAr

if

ci
alI

te
ll
ige
nc
e.
为更有希望成为非支配解路径, 将优先选择,
每发现 [
4]X
i Y
uGeng,Zh
angChun
Ga
n.
g Rol


ngpa
thp
la
nnin
gof
一条新的非支配解路径时, 对犗犘
犈犖表中所有被支 mob

lerobo
tinakindofd
yn
ami
cu n
ce
rt

inen
vi

on m
en
t.
配的路径进行过滤. 扩展路径时,对于新生成的路 Ac
taAut
o ma

ic
a S
in
ica,
200
2,2
8(2):
16
1
17(
5i
nChi
ne
se)
径,首先对路径代价进行过滤,再对路径的代价估值 (席裕庚, 张纯刚. 一类动态不确定环境下机器人的滚动路
进行过滤.可见,搜索过程中利用启发信息能够时刻 径规划. 自动化学报, 20
02,
28(
2):16
1
17
5)
检查路径之间的支配关系, 对于没有希望的路径提 [
5]S
tew
ar
t SB r
ad
le
y,W hi

eC .
Che
ls
ea.Mu
lt
io
be
jc

iveA.

our
na
loftheACM,199
1,3(
84)
:775
8
14
早做出判断,减少搜索过程的计算量,启发信息越接 [
6]D
asu
gpt
a P,Cha
kra
bar
tiPP,D
eSaka
rSC.Mu
lt

obje

ti
ve
近实际情况时,对路径实际代价的估计越准确,搜索 h
eur

st
icsear
ch.Wi
eba
de
n :
Fr
ie
dr
.Vie
we
g&SohnVe
rl
as
g
空间的压缩比例越高. e
gse

ls
chaf
t m
bH ,1
999

7]Man
dowL ,Per
ezdelaCr
uzJL .Mu
lt

cr
it
er

aheur
is

ic
 总 结
5 s











):














nJour
na
l o
fOpe
rat
io
na
lRes
ea

ch,200
3,

8]Man
dowL ,P
ere
zdelaCr
uzJL.Anewap
pr
oa
chtomu
l
本文提出了一种动态不确定环境下求解多目标 t

obe
jc
ti
ve Ase
arc
h//P
ro
ce
ed
in
gsoft
he1
9th
In
te
rnat

on
al
路径规划问题的方法. 首先提出了采用逆向多目标 J
oi
ntCon
fere
nc
eonArti

ic
ia
lI
nt
el

igen

e.De
nv
er,
Co :
Pr
o
启发式搜索进行全局规划, 求解给定问题的最优路 f

ssi
on
alBookCen
te
r,200
5:2
18
223
径集合; 在此基础上,
提出了动态多目标路径规划方 [
9]Har

kumarS,KumarS.It

ra
ti
vedee
pe
ni
ngmu
lt

obje

ti
ve
法,该方法将多目标路径规划问题的求解过程分为 A.I
nfo
r ma

ionPr
oce
ss
in
gLet

er
s ,1
99
6,5
8()
1:11
1



0]R
efa
ni
di
s I,Vl
ah
ava
s I.Mu

ti
ob
je
ct
iveh
eu
ri
st

cst
at
es
pa
ce
全局规划与局部重规划, 重规划以增量的方式对全 l
pan

ing.A r

if
ic

alIn
tel

ie
gn
ce,
2003,
14(
51
2)
:1
32
局规划所保留的部分信息有效地重用, 能够更快地 [

1]D
oMB , Ka
mbhama
pt
iS .
Sa
pa:Am u
lt

o
be
jc
ti
vemet

ic
调整变化位置与目标位置之间新的移动路径. 实验 t
emor
al
p p la
nne
r.Jour
na
l o
fAri
ti
fi

ia
lInt

ll

g 

nce R

测试验证了动态多目标路径规划方法的求解效率, [


]B
a ,
h2

c 0

0 ,
32 :
0155


194

结果表明基于增量重规划的方法能够很好地处理一 1
2 ryc
eD Cus
hi
ngW Ka
mbh
ama
pt
i S.M
od
el
L
it
el
pann
in


iv
er
sem u
lti

opt
io
n l
pan
san
ddn
yamic
ob
je
ct
iv
efu
nc
tio
n/
s/
系列动态不确定环境下的多目标路径规划问题. P
roc
ee
dins
g o
fth
e3rdWork
sh
opo
n Pl
an
ni
nga
ndP
lanEx
e

ut
io
nforR e
al
Wor
ldSs
yte
ms(
ICAPS’
07)
.Men
loPar
k:
参考文献 AAA,
I2007:93
10



3]Wei
Wei,O u
ya
ngDanT
on,
gLUShua
i,Y
INMi
n
gHao.A

1]Z
huQ

n
gB
ao
.An

spr

di
ct

ve
al
go

it
hmf

rpa

hpl

nn
in
go
f mu
lt
io
be
jcti
vei
nc
remen
ta
lheu

is
ti
csea
rc
hal
go
ri
th
m .J
ou
r

obo
ti
nac
oml

pxd
yn
ami
cen

iro
nm
en
t.C
hin
es
eJ
ou
rn
al
of n
alo
fJi
li
nU ni
ve
rs
it
y (S

ien
ceE
di
ti
on),
20
09,4
7(4):
75
2

o m
pu
te

s,2
00
5,2
8(
11)
:18
98
1
90
6(
inC
hin

se) 7
58(
inChi
nes
e)
(朱庆保.动态复杂环境下的机器人路径规划蚂蚁预测算法. 魏唯,
( 欧阳丹彤, 吕帅, 殷明浩. 一种多目标增量启发式搜
计算机学报,20
05,
28(

1):1
89
8
19
06) 索算法. 吉林大学学报( 理学版),200,
94(
74)
:7
52
758)

2]Ko
en
ig,
SLi
kh
ac
he
vM,Fur

yD .
Li
fe

on l
gpa
nn
in
gA. [

4]B
ent

eyJ L ,
KungHT ,Sc
hk
ol
ni
ckM ,
Thom
so
nCD .On

rti

ic

al
In
te

li

gn
c ,
e20
0 ,
415 (
51
 )

293
146 t
hea
ver
age n
umbe
rofmax
im
ain
aseto
fve

tor
sa
ndapl

pc
a

3]Ko
en
ig,
SLi
kh

ch
evM.DL
it
e/
/P
ro
ce
ed
inso
gfth
e18
th t

ons.
Journa
lo
ftheACM,19
78,
25 (
4)
:5
36
54

犠犈
犐犠犲
犻,bo
rn
in1
98,
4Ph
.D. 犗 犝犢犃犖犌犇犪
狀
犜狅
狀,
犵bo
rn
in1
96
8,r
po
fe

so
r,P
h.D


an

id
at
e.H
erma

nre
se

rch
in
te

es
ts s
ue
pr

is
or.
Herma

nre

ea
rc
hi
nt
er

st
si
nc
lu
dem
od
el

ba
se



cl
ud
ei
nt

ll

gen

epl
an
ni
nga
nda
ut
o d

an
go
si
san
dau
tom
at

dre
as
on

ng.

at
ed
re
as
on

ng. 犔
犝犛犺狌
犪犻,
bo
rn
in1
98
1,P
h.
D.,

ec
tu
re
r.
Hi
sma
in
re



ar
chi

ter

sts
in
cl
ud
ei
nt
el


ge
nc
epl
an
ni

gan
dau
to
ma
te



as
on
in
g.

犈犖犌犢狌
犡狌
犪,
狀bo
rn
in1
98
0,P
h.D.
ca
nd

da
te
.Hi


ai
nr
es
ea
rc
h i

te
re
st
si
nc

ud
ei
nt
el

ie
gn
ce
pl
an
ni
na
gn
dau


om
at
ed
re
as
oni
n.


46 计  算  机  学  报 2
01年


犪犮
犽狉
犵狅
狌狀


hewo
rkf
ocu
se
s ont

e t

pi
c o
fso

vi
ngm u

ti
ob
je

ti
veen
tfr
omt
heor
igi

alo
bs
er
va
ti

n.

pt
hpl

nni
ngpr
ob
lemsun
de
rdynam

cunc
ert
ai
nen
vi
ro
n O n
lyo
necr
it

ri
on
isc
on
si
de
re
di
n t

ad
it

on
ala
pt
h l

pn


e ,
tw
n h
ic
hiss
upo
prt
edbyt
heNat

on
alNat
ur
alS
ci
en
ceni
ng.
Buton
esi
nl
ge
ob
jec

iv
ef
unc

io
nca
n’
tde
sc

ib
esev
er



ou
nd
at

onofC
hi
naunde
rr
gan
tNos
.60
77
309,
760
873
04
4,co
nf
li

tcr
it
er
iaex
ac

l.
yIft

enum
be
r o
fob

jc

iv
efu
nct

on


08
73
14
8,6
097
30
89,theO
pe
nRese
ar
chF
ound
at

onofK
eyinaa
pt
hpl
ann
ing
pr
ob
lemi
smo
re
th
anon
e,i

isamu
lt

ob


ab
or
at
or
yofS
ymbo
li
cCompu

at
iona
ndKnowl

deE
g ni
gje
ct

vepa
thpl
ann

n r
gpob
le
m.Mul

io
be
jc
ti

epr
ob
lemsa



ee

in
gofM i

is
tr
yo fEd
uca

ionofCh
in
au n
de
rgra
ntdi
ff
er
en
tf
romsi
nl
geo
be
jc

iv
epr
ob
le
msbe
ca
us
eof
thec
on


os
.9
3K
17
20
09
K29
0 ,3K
17

2009
K0
6andGr
ad
ua
teI
nfl

cto
ft
heob
je
cti

efu
nct

on
s.As
ol
ut
io
nwhi

his
goodf



ov
at

onFu
ndo
fJ
il
inUni
ve
rs
it
yund
err

gntNo
.20
11
10
60.oneo
be

jt
ive
func

io
nmayb
eb
adf
ora
no
th
era
nd
th
isca

se


at
hpl
ann

ngi
s a
n i
mpo
rt
an
tbra
nc
hofman
yf
ie
ld
softh
att
he
rei
sus
ual

yas
eto
fso

ut
io
nsc
omo
ps
edo
fa

lthe
o



ti

ic

al
int

ll
ie
gn
cer
ese
ar
ch.T
het
asko
fo
pti
mal
pa
thl
pa
nti
ma
lpa
th
s .D
uetot

e c
oml

pxi

yofmu
lt

ob
je
ct

vesi

ua



ngi
st
ofi
nda
be
stpa
thin
the
st
at
espa

ebetw
ee
nt
hes
ta
rtti
o ,
ni
tismuchmo
red
if

ic
ul
tt
oso
lv
em u

ti

be
jc

ivep
at



at
epr
ob
le
mandt
hegoa
ls
tat
ea
cco
rd
in
gtosom
ecr
it

ri
a.pl
ann

ngpr
ob
lemsu
nd
erd
yn
am
icu
nc
er
ta
ine
nv

ro
nmen
t.

heo
pt
ima
lpa
thcanbecom
pu
tedi
nag l
oba
lpl
an
ni
ng I nth

s a
ppe
r,am
eth
od
ca
ll
edD
M P
Pis
pr
oo
ps
edwh
ic


po
ce

s wh
ent
hesi
tua
ti
onoft
heenv

ro
nmen
tisst

ti
c. e

pf
orm
sone l
ob
all
an
g p gpn
in ro

es
s a
nds
ev
er

llo
calr


Ho
we
ve
r,s
ome
ti
mesi
tisi
mpo
ss
ib
let
okn
owt h
ec
oml
pe
tepl
ann

ngpro
ce
sse
s.T
heex
pe

ime
ntr
es
ul
tss
ho
wthat
th



fo
rma

io
noft
hee
nvi
ron
me
n ,
tese
pc
ia
ll
yt
heex
ac
ts
it
ua
ti
onmet
ho
dadot

pngani

cre
me
nt
alr
el

pnn
in
gca
nso
lv
em u



fdn
ya
mi
cobs
ta
cl
es,ort
hepr
obl
em
scha
nget
he
irs
ta
teti
ob
je

ti
vepa
thpl
an
ni
n r
gpo
bl
emsu
nde
rdn
ya
mi
cun
cer
ta



pa
ce
fo
rth
edi

fe
re
nts
itu
at

on,
st
hust
hemo
vin
gpa

h t
ot
heen
vi
ro
nmen
tef
fi
ci
en

lyb
yre
us

ngt
he
inf

rma
ti
on
ofr
pev

ou


ga
ls
ta
temus
tbere
comu
pt
edbyman
yloca
lre
pl
an
ni
ngse
ar
chan
du s
in
gheu

ist

cin

orm
at
io
ntol
ea
dth
es e

rc


po
ce

se
s w
hen
th
e e
nvi
ro
nme
nts
it
uat

oni
sdet
ec
te
ddi

fe
rpr
oce

s.

You might also like