Download as pdf or txt
Download as pdf or txt
You are on page 1of 263

《别毙了那只狗》

第一章 比奖励更有效的 “增强原则” 5


「正增强物」是什么?............. 5
哪些是「负增强」?..................9
抓准增强物出现的时间点/强化的时机 14
增强物的大小 ..........................17
意外的[大奖]............................19
制约增强物................................ 21
响片训练.................................... 25
「继续加油!」..........................27
习得厌恶刺激............................30
无法预料的奖励更具吸引力/变化的强化 33
不适用变化性增强的情况....... 38
如何打破「起头最难的障碍」.38
迷信行为:意外的增强效果... 42
利用正增强可以做什么?....... 46
团体中的增强............................49
别忘了增强自己........................51
第二章 塑形法 不打, 不骂, 不施压的训练法 52
什么是塑形法?........................52
方法重要,原则更重要........... 55
塑形法的十大原则....................56
从训练游戏开始........................76
塑形快捷方式:目标法、模仿和模拟 85
特殊训练对象............................91
善用记录作自我增强................93
不发一语的塑形法....................95
第三章 刺激控制·无胁迫性质的合作关系 99
刺激的种类................................ 99
让对方听令行事......................101
建立讯号.................................. 102
刺激控制的规则......................107
哪种讯号?..............................109
讯号强度和淡出......................112
有效又好用的目标物............. 115
以习得厌恶刺激作为讯号..... 118
限定反应时间..........................121
预期心理.................................. 123
利用刺激作为增强物:连锁行为 125
教狗儿玩飞盘:一个连锁行为的例子 130
类化刺激控制的概念............. 133
习成前低潮及发怒..................135
刺激控制的用途......................138
第四章. 反训练·用增强去除不想要的行为 143
第一招:毙了他(牠)!....... 145
第二招:处罚..........................150
第三招:负增强 ...................159
第四招:消弱..........................170
第五招:训练不兼容的行为 .178
第六招:训练这个行为只依讯号出现 184
第七招:塑形出行为的消失.191
第八招:改变动机..................195
有害无益的剥夺方法 .......... 201
解决复杂的问题 ...................204
咬指甲...................................... 205
经常性迟到..............................207
上瘾现象 ...............................209
第五章. 生活中的增强现象......... 212
增强之于运动..........................212
增强之于经营..........................216
动物世界的增强现象............. 218
增强之于社会.........................225
第六章.响片训练·一种新的训练技巧 235
日益普遍的响片训练 .......... 235
响片训练的长期附加效应.... 239
突飞猛进的学习成效............. 241
去除响片.................................. 243
训练对象有如参与游戏......... 245
免于恐惧的自由......................247
学习与乐趣..............................249
将响片训练融入日常生活..... 251
更多应用在人类身上的作法. 255
世界各地的响片训练............. 260
第一章 比奖励更有效的 “增强原则”

 「正增强物」是什么?

所谓「增强物」即任何与某项行为共同出现、通常
会增加该行为发生频率的事物。请你牢记,它是优良训
练的秘诀.
增强物可以分为两种:
「正增强物」和「负增强物」。
「正增强物」指训练对象希望获得的事物,如食物、抚
摸或称读;而「负增强物」则指训练对象希望走避的事
物,如被猛击、皱眉的表情或不悦耳的声音,如上车后
没系上安全带时一直哔哔作响的警告声即是负增强物。
只要是原本就会出现的行为,无论它多么罕见,都
可以利用「正增强」加强这个行为。例如你召唤一只幼
犬过来,当牠过来时便拍拍牠,即使日后没有对牠多作
其它训练,牠被召回身边的可能性也会越来越高。假设
你希望某人(子女、父母或情人)打电话给你,但他从
来不打电话给你,那你是无计可施的,因为增强式训练
的重点是:你无法增强 一个从不发生的行为。反过来
说,如果他每次打电话给你时都相谈共欢,使这个「打
电话给你」的行为获得正增强,他将来再打电话给你的
可能性或许便会提高。(当然,假如你每次接到电话都予
以「负增强」尽说些令人反感的话:「你为什么现在才打
电话来?非得我打给你吗?你都不打来。」他会为了回避
这种烦扰而不想打电话给你了;事实上,你的所作所为
正是训练他别再打电话来。)
增强式训练最根本的原则便是针对行为给予正增
强。在科学文献里,心理学家可能会这么说:「『行为方
法』用来......」或者「这个问题利用『行为方法』而
获得解决」。这通常意谓心理学家以正增强取代了原有方
法,不过这并不暗示他们采取本书提及的所有正增强技
巧,他们甚至司能并不知道这些技巧。
然而,改用正增强作法通常足以解决问题,至今它
仍是协助解决尿床问题最有效的方法;早上起来时发现
床单没湿,即立即给予称赞及拥抱。
在自己身上运用正增强原则也很有效。我以前是莎
士比亚读书会的会员,在那里认识一位年近五十、热爱
打回力球的华尔街律师。他无意间听到我与他人聊天时
谈到了训练,他便聊起他在打回力球时会试试使用正增
强,他原本习惯在出错时骂脏话,但现在会试着在打出
好球时称赞自己。两个星期后我碰巧周见他,我问他:
「回
力球打得如何」?他的脸上浮现华尔街律师身上少见的
惊奇欢愉的表情。
他告诉找:「起初我觉得自己真是个大傻瓜,因为每
次打了好球就对自己说:『干得好!彼特,真有你的!』
如果只有我一个人练习,我甚至还会拍拍自己的背。后
来我开始打得越来越好,在回力球俱乐部的排名比以前
升高了四级,把过去一些很难抢分的对手打得七零八落,
而且我也获得了吏多乐趣,找不再大骂自己,赛后不会
感到生气失望。打了一个坏球,那没什么好在意的,之
后就能打出好球。我发现自己最爱看到对手犯错、生气、
扔球拍,我知道这鹧举动对球赛毫无帮助,所以我只要
微笑就好了……」
真是可长的对手啊!而他只不过改用了正增强而已。
增强物的性质是相对而不是绝对的。雨对鸭子来说
是正增强物,但对猫来说却是负增强物,而对牛来说(至
少在天候暖和的情况下)则无关紧要。吃饱后,食物不
再是正增强物,而如果对方打定主意要惹你生气,那么
再多的微笑和赞美(增强物)也无用武之地。因此为了
达到增强的效果,增强物必须是对方想要的东西。
无论任何训练状况,有多种增强物可供选择将会很
有帮助。在海洋世界的海生馆里,杀人鲸便有许多不同
的增强物,包括鱼只(食物)、在不同身韵部位抚摸搔痒、
社交关注及玩具等。在整个表演秀里,牠们永远不知道
接下来哪一个行为将被增强,或者增强物将是什么,这
些「意外惊喜」会让牠们觉得兴味盎然,有时候甚至可
以进行整场表演仍用不到一般常用的鱼只增强物,在表
演结束后才获得喂食。对训练者来说,不断变化增强物
的种类也是一件极具挑战又有趣的半。
正增强也是送礼艺术的依据,当选中对收礼者具有
增强作用的礼物时,对送礼者也是种增强作用且有助于
人际关系。在美国的文化中,送礼这件事常由女性负责,
我甚至还知道有个家庭由妈妈负责为全家人采买送给彼
此的圣诞礼物:到了圣诞节清晨拆总物时,可笑的对话
出现了:「喔!这个礼物是安送给比利的。」然而每个人
都知道这份礼物和安一点关系也没有。坦白说,这种作
法无法磨练孩子增强他人的技巧。
对正增强观察敏锐的男性会比其它男性占有更大优
势。身为母亲的我就要求儿子们一定要懂得如何送礼,
举例来说,在他们七岁和五岁时,有一次我带他们到一
家昂贵的名店为妹妹挑选洋装。他们很喜欢躺在豪华舒
适的椅子上,对妹妹试穿的每件衣服品头论足,他们的
小妹也很喜欢这样,当然她握有锻后的决定权。多亏那
次经验和其它类似练习机会;他们三人都学会了如何真
心关切他人,为亲爱的人寻找有效正增强物也成了一种
乐趣。
 哪些是「负增强」?

增强物的作用是增加行为发生频率,但它不一定都
是学习者想要的东西,避免不喜欢的东西也可能是种增
强。实验室研究显示,如果改变行为可以让厌恶刺激
(aversive stimuli)消失,这个厌您刺激即可增加该
行为发生频率,这类刺激就称为「负增强物」 (negative
reinforcers),一种人类或动物会设法避免的刺激。
负增强物可能是极其轻微的厌恶刺激,例如讲冷笑
话时朋友不屑地瞥你一眼,或冷气吹送过来的一阵凉风
让你起来换个位置.而极剧烈的厌恶剌激,例如公开侮辱
或电击,除了可以当作处罚之外,也可拿来作为负增强
物;我们被老板责骂的经验或许极具处罚性质,但楚我
们很快便学会,当爱骂人的老板站在前门时就从后门溜
进公司上斑。
负增强物是指经由行为改变即能停止或避免的厌恶
刺激,只要新行为一出现,厌恶刺激立即停止出现,因
而强化了新行为。假设我坐在姑妈家的客厅里,像在自
己家里一样把脚跨放在桌上,姑妈挑高一边眉毛表示不
满,我便把脚放回地上,她的表情放松了,我也松了一
口气。以这个例子来说,挑高的眉毛是一种厌恶刺激,
具有负增强物的作用,我以新行为停止了这厌恶刺激,
所以脚留在地上的行为将来可能再度发生,在我姑妈家
里是如此,到了别人家里可能也会一样。
负增强物几乎能完成所有的训练,传统的训练方法
多半就是这么做--当左边缰绳拉紧时,马儿只要向左转,
拉扯嘴巴的讨厌压力即会减少,因此马儿学会了向左转;
狮子退回台子上并待着不动,因为这么做才能避免被鞭
子挥到,或有椅凳挡在面前。
然而,负增强并不同于处罚,两者的差别在哪儿呢?
处罚是指在意图改变的行为发生后才产生的厌恶刺激,
对该行为可能毫无影响,我在本书初版中写道:[没人知
道成绩不佳而被修理的男孩将来的成绩会不会变好,但
是他绝对不可能改变这张已带回家的成绩单。] 的确,
当我们怀着意图进行处罚时,我们经常已错过时机太久,
不过这还不是处罚和负增强真正不同的地方。
现代行为分析学者把任何停止行为的事件都视为处
罚。幼儿把发夹插入插座时,妈妈用力一抓,把他的手
拍开---这个行为停止了,但其它事情可能开始发生---
幼儿关始哭、妈妈感到愧疚等等,不过把发夹插入插座
的行为确实消失了,至少当时是如此,这就是处罚的作
用。
心理学家史金纳(B.K. Skinner)更明确定义[处罚]
可以是[某项行为导致喜欢事物消失的过程],或者也可
以是[某项行为导致不喜欢事物发生的过程]。不论是哪
种定义,处罚也许让当下发生的行为停止了,但是没有
人可以预料以后会出现什么后果。我们已知增强物可以
增强未来的行为,但无法预测处罚楚否能够导致行为改
变。
妈妈抓住幼儿或用力打他的手(即使时间点抓得很
准),这个作法是否保证他将来不会再度把东西插入插座
呢?去问问任何一位家长,你就会明白现实情况往往是:
家长把小东西收好,盖件墙上的插座或者用家具文件住
插座。等幼儿长大,他们特别想这么做的冲动就会消失。
行为分析学者认为,增强或处罚都始一个由后果定
义的[过程]。负增强物可以拿来进行有效训练,尽管使
用厌恶刺激,训练过程仍可能相当无害。以下是个利用
负增强训练骆马的好例子(感谢骆马专家吉姆·洛根[Jim
Logan]提供此法)。骆马是种半驯化的动物,美国人把牠
们当成宠物饲养,其它地区的人则饲养骆马群作为毛料
来源.
骆马和马儿一样非常瞻怯害羞,除非自幼时常接触
人类,否则人们很难靠近牠们,虽然利用食物增强的训
练法对骆马效果极佳,但常牠们对人类过于惊惧而不敢
接近取食时,这个方法也派不上用场,所以现今的骆马
训练师作法是,利用响片作为讯号,告知骆马牠们的行
为将获增强,但这时使用的初级增强物(或真正的增强物)
是[移除负增强物(即厌恶刺激)]。
实际上,你等同对骆马说: “如果我走近到离你三
十呎处,你可以保持站着不动吗?可以?很好,我按下
响片就会转身离去。 ”、 “现在,如果我走到离你二十五
呎处,你可以站着不动吗?可以? 很好,我按下响片就
走。” 利用响片标定骆马站着不动的行为,并且利用[可
怕人类的离开]作为增强物,有时在五平十分钟内即能靠
近到能够触摸到牠的距离·骆马控制着整个局势,只要
牠站着不动,牠就可以让人类走开! 所以牠继续站着不
动。当人能摸了骆马几次之后才离开,这时便打破僵局
了,这个人不再令牠感到害怕。现在饲料桶即可出场,
沟通的对话转变为: “你站着不动时我可以摸模你吗?
可以?按响片就赏你好吃的东西。” 这时骆马便进入获
取[正增强物]的阶段,这些正增强物包括食物、搔痒和
拍抚,而且牠正把站着不动的新行为做得很棒,而不是
朝着别处逃命去。
利用离开(或好行为出现即不再施压)的作法就是所
谓[通马语者](horse whisper)常利用的训练技巧,训马
者在围起来的区域内与自由奔跑的马匹互动,在相当短
的时问内使马匹脱胎换骨:野生的马儿从惊怕逃窜变得
能够冷静接纳人类,甚至容许马鞍及人类骑乘,这种整
体性的转变可说非常神奇。使用这些技巧的训练者虽然
都习惯以某个声音或动作作为标定讯号(或制约增强
物),但很少人真正意识到自己这么做,反而常用迷信说
法解释这种现象。其实这种现象一点都不神奇,全是运
用[操作制约]的结果。
虽然负增强很有效,但请牢记:每次使用负增强时,
同时也使用了处罚。当拉紧左边缰绳,在马儿转向左以
前,向前直走的行为即不断受到处罚。而且滥用负增强
和厌恶刺激也可能导致莫瑞·西德门(Murray Sidman)博
士所谓的[附带作用],也就是因处罚引起的不良副作用
(请见第四章)。
 抓准增强物出现的时间点/强化的时机

前述已提过,增强物必须和想改变的行为一起出现。
增强物出现的时问点本身就是讯息,它告知学习者你喜
欢的行为究竟是什么,当动物试图学习的当下,增强物
想传达的讯息会比增强物本身更重要。运动员或舞者受
训时,教练喊出[对!]或[很好!]可立即标定当下的正
确动作,给予对方确实需要的讯息,若等到回到史衣室
才进行事后检讨,则无法产生作用。
增强时机过晚是训练生手最大的问题。例如当狗儿
坐下来,在主人说出[好乖!]时,牠正好又回到站姿,
这么一来,到底哪个行为被[好乖!]增强呢?是站着的
行为! 每当你发现训练出现问题时,第一个该问自己的
问题便是增强时机是否太晚,如果你在训练某人或动物
时忙得无法分心留意,这时请人帮忙观察,看看自己增
强的时机是否太迟,将会大有帮助。
我们增强他人的时机往往太晚,“亲爱的,你昨晚看
起来美极了!” 这句话的效果与当下实时赞美的差别很
大,迟来的增强甚至可能有适得其反的效果 ([怎么,我
现在难道不美吗?]);然而对于为时已晚的补偿话,我
们却常常寄以厚望。
过早给予增强也可能很没效率。美国布隆克斯动物
园(Bronx Zoo)的管理员曾对大猩猩十分头疼,他们必须
让牠进入户外栏舍才能打扫室内栏舍,但是牠考绌喜欢
坐在进出口,力大无穷的牠可以挡住滑门,阻止门关上,
当管理员把食物摆在户外或以香蕉诱引牠时,大猩猩不
是不加理会就是抢了食物再赶在门关上前回去挡门。他
们请了动物园里的一位训练师处理这个问题,这位训练
师解释,[挥舞香蕉]及[丢入食物]是企图以[贿赂]来增
强一个尚未发生的行为,但真正有效的解决办法是当大
猩猩坐着挡门时不予理会,但是只要牠自己到户外时便
给予食物奖励。问题就这么解决了!
家长有时也会误以为自己是鼓励小孩,事实上却太
早给予增强([好孩子,就是这样,你“几乎”做对了!) ,
因而可能增强了努力的行为,[努力]去做某事和[实际]
做到某平是不同的,有时候小孩哭喊着「我做不到!」或
许是事实,但是它也可能是努力行为受到过度增强的症
状。一般而言,在行为出现前给予礼物、承诺、赞美或
任何东西,完全无法增强这们行为,因为受到增强的是
增强物出现当下的行为,也最可能是要求增强物的行为。
进行负增强训练的时机点也很重要。马儿学习到当
左边缰绳拉紧时向左转,但是在牠左转后必须不再拉繁
缰绳,这个停止拉扯的动作即为增强物。在上马后踢踢
马腹,马匹往前走了,便不该再继续踢(除非你要牠跑快
一点)。新手骑士常会不断踢马,彷佛得不断踩油门马儿
才会跑,但对于马儿而言这个动作并不具讯息,因此马
术学校里产生了“铁腹马”,无论骑马的人踢得多急,牠
们仍以牛步行进。
同样反应也出现在常遭父母、老板或老师唠叨责骂
的人,负增强物在期望结果达成时如果没有立刻消失,
它将不会有增强作用,也不会传递任何讯息,唠叨责骂
不但只成为名符其实的噪音,也是信息论(information
theory)中谈到的[噪音]。
我观赏足球和棒球的电视转播赛时发现,球员被增
强的时机点总是准确无误,这让我印象深刻。在球员跨
过本垒达阵的同时,观众立即爆出欢呼声,而且一旦得
分或确定输赢,仔细看看那些球员之问彼此热烈增强的
动作。这对演员来说却相当不同,尤其是电影演员。即
使是在舞台上演出,仍然得等到谢幕才能获得掌声,而
电影演员除了偶尔从导演、摄影师或工作人员得到响应
外,他们获得的增弦全都错过了时机,影迷信件和好的
影评在数周或甚至好几个月后才会出现,这与洋基球场
爆出轰天欢呼的情形比起来显得逊色无趣,他们工作起
来可能特别缺乏成就感,即使有很不错的增强物,但获
得的时机却总是「太迟」,也难怪常有一些明星近乎病态
地喜欢谄媚奉承和追求刺激了。
 增强物的大小

刚关始利用食物来增强的训练新手常搞不清楚食物
增强物应该多大,答案是尽可能越小越好,增强物越小,
动物能越快吃掉它,不但可以减少训练者等待的时问,
而且每次练习时还可以增加增强物的使用次数,不会让
动物一下子就吃饱吃腻了。一九七九年,我担任华盛顿
特 区 的 国 立 动 物 园 (National Zoological Park In
Washington, D.C.)的顾问,教导动物园员工使用正增
强技巧。在训练课程上有位管理员抱怨自己的猫熊训练
进展得太慢,我认为这不寻常,像猫熊这种贪心又活跃
的大型动物以食物作为增强应该很容易训练,在我观察
过一回训练后发现,这位管理员虽然已缓俊塑造出猫熊
的动作,但是问题出在她每次给予大熊猫的增强物竟是
一整根胡萝卜,猫熊好整以暇地享受每根胡箩卜,在管
理员宝贵的十五分钟训练时间里牠只得到了三次增强物
(而且牠也难免吃腻胡萝卜了),如果改成每次只给一片
胡萝卜的话,情况将好得多。
一般来说,一小口增强物就足以让动物保持兴趣,
对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,
对大象则是半颗苹果,如果是特别喜爱的食物,份量共
至可以更少,例如喂给马儿-茶匙的谷子,美国国立动物
园的管理员甚至只用葡萄干便训练北极熊做出许多有用
的行为(例如依指令移动至另一个栏舍)。
训练的基本法则是,如果每天只训练一次,在满足
每日给食份量的四分之一前,动物的训练反应都会很好,
等训练结束后再给牠其余的份量。如果每天训练达到三
至四次,你可以把平常份量分为约八十等份,每次训练
用二十至三十份。八十份增强物似乎是任何动物维持学
习兴趣的每日最高量(这或许是幻灯片匣是多只能放入
八十张幻灯片的原因,因为每常讲师要求换第二个幻灯
片匣时我总是会抱怨一下)。
行为的难易程度也与增强物的大小有关,我们在海
洋生物世界的经验发现,要求鲸鱼表演笔直冲出水面二
十二呎的高难度跳跃动作时,必须给予一条大青花鱼作
为奖赏,如果只给平常增强用的两条小梭鱼,牠们会拒
绝表演这个动作。
至于人类,增强物的大小虽然没有一定的定律,但
是有时候工作越艰难,报酬将会越大,如果我们完成了
艰难工作却未获得相对报酬时,我们肯定痛很不已。
 意外的[大奖]

「大奖」(jackpots)是一个对动物或人类都极为有
效的技巧。大奖是指非常大的增强物,万至可能比平常
大上十倍,而且训练对象没料到它会出现。我曾在一家
广告公司任职,公司除了有一般的圣诞派对,大案子结
案或签下新客户时也会有非正式的庆祝活动,不过董事
长还有个习惯,他每年总会举行-两次突如其来的惊喜派
对,可能是在某天下午三、四点时,他会阔步行经每个
办公室,大喊着要大家停下工作、关上电话总机,接踵
而至的是外烩服务人员、乐师、调酒员、香槟、熏鲑鱼
和所有派对应有的东西。这些全为我们而来,而且没有
特殊理由,这对五十名员工来说完全是出乎意外的大奖,
我认为这对提升高昂的工作情绪有极大影响。
大奖也可以用来标定「突破性的意外进步」,以我认
识的一名训马师为例,当年轻马儿首度完成一项困难动
作时,他随即从马背跃下,除去马鞍和马勒,然后放牠
在场地里任意奔跑 --给予完全的自由便是一个大奖,而
这么做似乎把新行为保留下来。
然而,遇到动物不听话、害怕或抗拒而完全不出现
好行为时,偶尔给一次大奖也可能有效改善动物的反应。
我们曾在海洋生物世界进行一些由美国海军资助的研
究,作法是增强海豚的新反应,但不增强过去训练过的
旧有行为,研究对象是一只极少出现新反应、名为[胡]
的温驯海豚,如果牠出现反应却未获增强,牠就会变得
不动。后来有次训练时,牠持续二十分钟没有出现反应,
训练师在这时候丢给牠两条鱼奖励牠这个「没有反应的
行为」,[胡]似乎被这个慷慨大礼吓了一跳,再度变得活
跃起来,很快出现一个可被增强的动作,后来的几次训
练因而出现了真正进展。
我也曾亲身体会过这只海豚的经验。在我十五岁时,
骑马课是我最大的人生乐事,每张骑马券可上十次课,
但我每个月零用钱只够买一张。当时我与父亲菲利普·威
利(Philip Wylie)及继母瑞琪(Ricky)同住,虽然他们对
我很好,但正处于青少年叛逆期的我,总是一副刻薄残
忍、暴躁易怒的态度。有天晚上这两位慈爱又总明的家
长告诉我,他们对我的行为感到忍无可忍,所以他们决
定要嘉奖我: 他们送给我一张全新的骑马券,这是他们
其中一人不辞辛劳地到马场购买的。 哇! 我完全没资
格收下这样的人奖! 我记得我当下洗心革面,多年后在
我撰写本书时,继母瑞琪确认这段记忆的确属实。
我并不完全了解这种不劳而获的大奖为什么具有如
此突然又效果深远的作用,我只知道那张额外的骑马券
实时解放我心中的压抑和憎恨,我猜这便是那只海豚的
感受。或许将来有人会拿它作为博士研究论文,向我们
解释原由。
 制约增强物

当动物出现你希望鼓励的行为时,你司能根本无法
即刻给予增强物,尤其使用食物增强时更是如此。以训
练海豚跳跃为例,当牠跃入空中时我不可能马上拿鱼喂
牠,这么一来每次奖励牠跳跃而赏牠鱼儿吃的时问势必
延误。但事实上,久而久之海豚终究还是会把跳跃动作
和吃鱼联想在一块儿,于是跳跃动作还是会增加,只是
关键在于牠无法得知我到底是喜欢牠跳跃的哪一点,是
高度?弧度?还是水花四溅的入水动作?于是牠必须跳
跃许多次,才能找到我心中期望的跳跃动作是什么。遇
到这种状况时,我们便可以利用「制约增强物」
(conditioned reinforcers)。
「制约增强物」是指一个原本不具意义的讯号(可
能是声音、光线或动作),刻意让它在增强物出现之前或
出现期间出现。现代海豚训练师都利用警用哨笛作为制
约增强物,海豚即使在水底也可听到哨音,而且训练师
还可以空出双手比手势及喂鱼。我时常使用一种发出响
声的便宜派对玩具训练其它动物,这些玩具只要一压就
会发出喀达喀达声,或者我也会特别选用某个称赞用语,
当成制约增强物之用,例如使用「乖狗狗!」或「乖马儿!」
学校老师常使用「那很不错唷!」和「非常好!」等具有
形式意义且谨慎运用的赞美也出于此理,学童总是会迫
不及待把事情做完,等着听到这启赞美。
日常生活中的制约增强物不胜枚举,诸如我们总是
喜欢听到电话铃响或看到被信塞得满满的信箱,即便接
到的电话大都很无趣或者信箱里多半是垃圾信,因为我
们从过去多次经验学习到,电话铃响或信件与好的事情
具有关连性。我们喜欢圣诞节音乐,讨厌牙医诊所的气
味,我们在周遭摆设一些东西(照片、盘子或奖杯),不
是因为它们美观或实用,而是因为它们能让我们回忆起
快乐时光或亲爱的人,这些东西都是制约增强物。
讲求实效的正增强动物训练几乎都应该先从建立制
约增强物开始,在正式展开训练前,趁动物尚未刻意出
现行为,先教导牠制约增强物的重要性,作法是让这个
「制约增强物」与食物、拍抚或其它真正的增强物产生
联结,随后你可以在动物身上看出牠们是否已经理解这
是你示意「很好!」的讯号,通常牠们接收到制约增强物
时会表现出停格一下的反应,然后开始寻找真正的增强
物。有了制约增强物,你将拥有一个能够真正与动物沟
通的方式,告知牠你到底喜欢牠的哪一点行为,所以不
必当怪医杜立德也能与动物「交谈」,利用这种「习得」
的增强物你将会惊讶自己可以对动物「说」出许多讯息。
制约增强物的威力极大,我曾见过饱足的海洋哺乳
动物为了获取制约增强物仍持续工作,马儿和狗儿持续
工作一小时以上只为了得到少许的初级增强物,人类当
然也会为了钱不停工作,说穿了「钱」就是一种制约增
强物,是用来买东西的代换品,而钱赚得根本花不完的
人甚至特别爱赚钱,他们对这个制约增强物已沉迷得无
法自拔。
可以联结到多种初级增强物的制约增强物将更具威
力。举例来说,动物在训练时可能不想要食物,但如果
同一个声音增强物曾被刻意联结到喝水或其它乐趣,这
个增强物将仍具效用,而且会更有效。我家猫咪听见「好
乖!」时就会看见晚餐出现、被人拍抚、得以进出门口或
领取表演把戏的奖赏,于是我现在便可以轻易利用「好
乖!」增强牠们跳下餐桌的行为,而不必给予真正的增强
物。然而,金钱之所以具有极大增强作用,或许正是因
为它几乎可以与所有东西作联结,是一种联结甚广的制
约增强物。
制约增强物一旦建立起来了,便必须谨慎的使用它,
以免减低了它的效用。帮我骑乘我家韦尔斯小型马的孩
子很快便学会,只有在他们想增强马儿行为时才可以说
「乖马儿!」,若只是单纯想表达对马儿的喜爱,只要不
使用这三个字,他们对着马儿说得天花乱坠都没有关系。
某天他们看见一名新来的孩子抚摸马儿脸颊时边说:「你
是乖马儿!」其中三个孩子立即包围质问她:「妳为什么
对牠这么说?牠又没做什么!」同理,我们应该给予子女
(配偶、父母、情人或朋友)很多的爱与关注,不需要
在他们出现特定行为才给予,但我们确实应该慎用赞美,
把赞美当成制约增强物,实际出现好行为时才赞美,即
便是幼童,人们对于虚情假意或无意义的赞美都会很快
感到厌恶,因而不再具有任何增强作用。
 响片训练

海洋哺乳动物训练师通常以哨音作为制约增强物,
用来训练鲸豚、海豹和北极熊。凯勒·布瑞兰(Keller
Breland)首度在六○年代将这个训练概念引进海洋哺乳
动物园和美国军用海豚训练,他曾是制约心理学家史金
纳博士的研究生,他把哨音称作「中介刺激」 (Bridging
stimulus),因为它除了告知海豚即将获得一条鱼之外,
也成了海豚「在池中央跳跃」 (被增强的行为)和「游到
池旁领赏」两个动作之间的中介联结。
行为分析的文献承认制约增强物具有这两个作用,
不过它还有更多作用等候发现。到了 90 年代,越来越多
动物训练师开始使用操作制约、塑形法、正增强和制约
增强物,也有越来越多的民众开始这么做,由狗儿饲主
引领风潮(请见第六章),由于狗儿饲主使用的制约增强
物是种内含金属簧片的塑料响片,他们便称这种训练为
「响片训练」,而称自己为「响片训练者」。
响片训练者使用的响片除了是制约增强物,以及介
于「赚取」和「实际获得」食物之闲的刺激外,它还具
有多种未获研究的功能。首先最重要的功能是奥登·林
兹(Ogden Lindsley)博士所称的「事件标定器」
(event
marker)作用,响片让训练对象明确知道被增强的行为
是什么,它甚至把主控权交到训练对象的身上,过了一
阵子之后训练对象不再只是重复行为,而是显露出意愿:
「嘿!我使你按下响片了!你看看,我再做一次!」响片
训练者把这种转变称为「灯泡亮了」比喻浑然开窍、豁
然开朗的时刻,不管对训练者或训练对象都具有极大的
增强效果。
爱伦·瑞丝(Ellen Reese)博士向我指出,响片训
练者使用的制约增强物也是一个代表「完毕了!」的终结
讯号,诚如训练师盖瑞·威尔克斯(Gary Bateson)所
言:「响片终结了行为」吃块热狗奖赏。
哲学家葛雷格里·贝特森(Gregory Bateson)在海
洋生物世界任职数年,他主张操作制约只不过是一个用
来与外星生物沟通的系统,它的确可以拿来这么用。标
定讯号的另一个主要功能是用来沟通特定讯息,训练师
史帝夫·怀特(Steve Wilkes)警官告诉我,他曾叫他
的巡逻德国牧羊大搜寻某个被丢在六呎高树丛顶端的对
象,那只狗在地面搜寻很久但徒劳无功,然后当牠碰巧
把头抬高时,史帝夫按下了响片,那只狗立刻转而嗅闻
头部高度的空气,警觉到目标对象的气味,然候开始往
区域内较高的地方搜寻气味,甚至以后脚站立起来嗅闻,
于是在史帝夫没有再度出手协助下,牠找到了对象位置,
猛跳到树丛顶取得了这项对象。
 「继续加油!」

以刚刚史帝夫在和他的狗沟通时的例子来看,他们
之间的沟通有另一个特点,史帝夫的响片声并不是作为
一个终结讯号,而是一个「继续加油!」的讯号,由于狗
儿尚未发现目标对象,响片的适时出现不但是增强了往
上方嗅闻的行为,也让狗儿继续出现搜寻的行为。我在
本书初版中曾写道,我们可以多次使用制约增强物但不
给予真正的增强物,直到最后再给予即可。我之所以这
么说是因为,有时候在训练海洋生物世界的海豚出现长
时性行为或连锁行为时会这么做,但是我当初写书时并
没有意识到,我们事实上使用了(至少)两种的制约增
强物(或标定讯号)一种是正常音量的哨音,代表「这
就对了!食物随后就到,过去那边取食,完毕了!」另一
种则是较轻的哨音,代表「这就对了,但是还没达到目
标!」
我在九○年代曾与许多响片训练新手共事,训犬书
籍作家摩根.史贝克特(Morgan Spector)称这些人为「跨
域训练者」(crossover trainers),指精通处罚式训练,
但正试图改用塑形法和正增强的人。当时我发现他们都
很愿意按响片,但却极不愿意给食,甚至到了已经让响
片意义不复存在的地步。对此我必须强调,唯有遵循「按
一次响片,给一次零食」的通则才能教会人们如何有效
塑造行为。
不过,在许多现实状况中,有些「过渡性的增强刺
激」可能非常好用,如同上述史帝夫与巡逻犬的例子所
示,另择一个增强刺激,并藉由这个刺激告知训练对象
「那就对了,继续加油!
」是个解决方法。「继续加油!

的讯号并不需要直接联结初级增强物,只要在响片终结
声出现之前插入这个讯号即可,学习者很快就可以理解
到,它只是一个引领至最终增强物的讯号。
接下来你便可以好好运用这个「过渡性的增强刺
激」,在连锁行为当中利用它作为蕴含讯息的标定讯号,
不必让进行中的行为停下来;举例来说,敏捷赛中狗儿
进行障碍竞速,主人必须在狗儿迅速移动之下指示牠下
一个障碍是什么,我曾见过狗儿在达成某项障碍后,表
现出不知所措的样子,彷佛没听清楚指示,不知该穿入
隧道还是跨栏,牠的头在两项障碍之问来回摆动着,当
狗儿朝跨栏望过去,主人大喊「没错!」时,狗儿才立刻
跑向正确的障碍项目。
如同最终才出现的响片声一样,这种过渡性的讯号
可以是任何刺激(响片、哨音、大喊一声或挥一下手) ,
但要注意的是,这个刺激并不能只是怀抱希望的鼓励或
加油打气(这么做可能使动物分心或不小心增强其它行
为),它也必须是一种意义明确、精确使用的制约增强物。
 习得厌恶刺激

及时发出的「习得正面讯号」是告知接收者「你现
在的行为很好,将为你带来好处,所以多出现这个行为
吧!」,而你也可以建立「习得厌恶刺激」(conditioned
aversive signals,或称为「惩罚物」【punisher】),
它告诉接收者的讯息是「你现在的行为不好,你要是不
停止这个行为的话,不好的事就会验生。」
习得厌恶刺激比起威胁史为有效,有些动物 -- 我
想到的是猫咪 -- 对于大喊大叫和责骂没有反应,不过
我有一位朋友有次却意外治好了她家猫咪爱抓沙发的毛
病,事实是因为她大喊出的「不!」变成了习得厌恶刺激。
有天她在厨房里失手掉落一个铸铜大托盘,正好就掉在
猫咪身旁,而当托盘掉下时,她大喊「不!」,下一秒托
盘即落地发出巨响,猫味被吓得跳起来,全身毛都竖了
起来。之后当猫味抓沙发时,主人一喊「不!」,猫咪便
看来一副惊惧样,立即停止动作,在重复两次之后这个
行为便永远消失了。
训斥是生活中必要存在的一部分,以正增强作为教
导的主要工具,这并不代表必要时不能说「不!」(例如
幼儿拿东西戳入插座时),然而,一些训练者拿这种现实
状况为例认为无论什么状况,教导时经常作「纠正」是
很合理的,事实上他们犯了两个错:第一、他们似乎认
为纠正的好处和正增强一样多,却没考虑到它对学习者
产生的其它影响(请见第四章「处罚」)。第二、他们使
用训斥和处罚,但并未建立警告讯号(即习得厌恶刺激)。
要让「不!」产生效果的诀窍在于必须让它成为制约
负增强物(conditioned negative reinforcer),举例
来说,如果你觉得有必要使用 P 字链(收缩链),你便应
该在狗儿犯错的同时说出「不!」,然后在拉扯链子之前
稍等一会儿,给牠机会修正行为以避免处罚。如果你只
是直接拉扯 P 字链但没给牠警告,这个拉扯的动作就只
是纯粹沦为处罚,将无可预期它对未来行为的影响,而
且这个处罚的累积效应可能会影响狗儿的工作饮望。另
一个常犯错误是,当狗儿回到位置上时依然继续猛扯链
子,这使牠的两个行为都受到处罚。
如果纠正式训练方法缺乏了制约负增强物,实际用
到厌恶刺激的机会将会增加,也将使学习速度变慢。有
时候传统训练师为了获得可靠稳定的行为,必须比应用
增强训练的训练师多花费许多时间进行训练,也许花上
数个月或甚至数年以上,这不只是因为他们所依赖的处
罚方式会让行为消失,也因为他们使用处罚时缺少了制
约负增强物,必须重复训练之后,动物才能归纳出牠们
应该出现的行为。
近来有一类特殊的制约负增强物颇受训犬人士欢
迎,这种「无奖励标定(确定)讯号」通常是以平淡语气
说出「错!」这个字,概念是当狗儿表现不同行为试图猜
测你想要什么时,你可以利用一个表示「那个行为不会
得到增强」的讯号告诉牠哪些行为没用。
根据史金纳博士对「处罚」的定义 - 把动物想要的
事物取走,这表示当「错!」这个字代表动物将无法获得
增强物时,它无可避免地成为一个习得厌恶刺激,而它
是否也因提供讯息而变得具有增强作用呢?我在训犬界
里看过一些「错!」可派上用场的特殊情况,如果你的狗
已经知道很多塑型完成的行为和指示讯号--也就是说,
牠对训练极富经验--你便可以利用「错!」这个口令作为
要牠改变行为的讯号,意思是:「省省力气,那么做没用,
试试别的。」
要让这个作法奏效必须符合以下条件: 训练对象过
去为了获得响片声而变化行为或主动尝试新行为时常获
得增强的经验。使用这种必须巧妙运用的讯号时之所以
出现问题,通常是因为人们把它用在没有经验、不明白
人们想要什么的狗儿身上,这时人们很容易把这个讯号
比照 P 字链使用:叫狗儿坐下,牠没坐下,立刻喊:
「错!」
如果这个讯号确实带有「不会获得增强物」的意义,那
么「没有坐下」的行为即遭到处罚。但是这并不代表坐
下的行为现在即将发生,事实上它的后果很可能与其它
处罚一样无可预料,狗儿可能完全不再反应并低头怯怯
地偷偷溜走,或者牠会放弃你,开始自己寻求增强物,
因而出现不当行为,例如吠叫、暴冲、嗅闻地面或抓痒,
把注意力移到他处。
 无法预料的奖励更具吸引力/变化的强化

有个广为流传的错误观念是,当开始以正增强训练
某个行为时,便必须在训练对象的余生里一直使用正增
强物,如果不这么做,这个行为将会消失。这个说法并
不正确,事实上只有在学习的阶段才需要持续使用增强
物。你可能会经常称赞幼儿使用马桶的行为,但是一旦
这个行为完成学习,它将自行获得增强。我们应该常常
给予初学者增强物,例如教小孩骑自行车时可能需要不
断告诉他:「那就对了,现在骑稳,你做到了,很好!」
如果当他学会骑车而你却仍不断称赞他,这时你就很蠢
了(小孩也会以为你发神经了)。
为了使学成的行为维持一定的可靠程度,非但没有
必要每次都增强这个行为,而且极为重要的是,不可以
经常增强这个行为,而要改为偶尔增强,而且是随机性
(无法预测)的增强。
心理学家称这种增强方式为「变化性增强时制」
(variable schedule of reinforcement),它维持行为
的效果比起持续性、可预测的增强方式更好。一位心理
学家曾跟我这么解释:假设你的新车总是很容易岭动,
某天当你坐上车后把车钥匙一转,它却没发动,你可能
会再试着发动几次,但是你很快就会判断这辆车出了问
题而打电话给修车厂,由于转动车钥匙的行为没有立即
带来期待的增强结果,这个转动钥匙岭动车子的行为很
快便会消失。相反地,如果这是台老旧的破车,几乎很
少在第一次就发动,而且通常还得花很久时间发动,这
时候你便可能花上半个小时不断试图启动,因为这个转
动车钥匙的行为长期以来一直受到变化性增强,因而能
稳定维持着这个行为。
如果海豚每次跳跃都一定有鱼吃,牠跳跃的动作将
很快变得马虎敷衍,过得去就好,然后要是不给鱼了,
海豚跳跃的动作很快就会消失。不过,如果在牠学会跳
跃就有鱼吃的概念后,我现在开始只增强第一次跳跃、
第三次跳跃,接着便随机增强牠的跳跃动作,这个行为
就会稳定维持下来,当动物没获得奖励时,牠们反而会
更常跳跃,期盼下次中奖的机会,而且跳跃时甚至可能
变得更有活力。如此一来,我便能够选择增强较具活力
的跳跃动作。
利用变化性增强时制可以塑造出较佳的表现。不过
即使是专业动物训练师,有些人仍法善用变化时制的正
增强方法,它对许多人似乎都是个特别难以理解与接受
的概念,我们都知道当错误行为停止时,我们就不必再
继续处罚,可是我们往往无法理解为何没有必要继续奖
励好的行为或甚至不应该这么做。这其实是因为我们想
以正增强训练出进退有礼的良好行为时,我们自己也不
太确定应该怎么做。
变化性增强时制的威力正是赌博的本质,要是每次
投一块硬币到吃角子老虎里就会有十块硬币掉出来,你
很快就会丧失兴趣,虽然你的钱会越来越多,但是这种
方式实在很无趣。人们之所以爱玩吃角子老虎正是因为
他们无法预料将出现什么:可能空空如也、可能掉下一
些钱、也可能掉下很多钱。我们不在这里讨论为什么有
些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对
于那些好赌成瘾的人来说,变化性增强的作用就是让他
们上瘾的原因。
变化性增强出现的时间间隔越长,它所维持行为的
效果就越强,不过如果你想设法消除某项行为,把时间
间隔拉长的变化性增强就对你很不利。所有未获增强的
行为都有自行消失的倾向,但是如果它不时获得增挂,
尽管只是偶发事件 -- 抽根烟、喝杯酒或者对不断唠叨
或哀求的人梢事让步 -- 这个行为不仅不会消失,事实
上它可能反而被这种间隔拉长的变化性增强时制维持得
更好,这就是为什么已经戒烟的人若偶尔偷偷抽根烟,
在一天内即可能又变回大烟枪。
我们都看过一些遭配偶或情人施虐的人,难以理解
他们为何依然留在这些人身边,这种爱上恶劣、毫不体
贴、自私甚至很残忍的人却执迷不侮的情况,传统以为
只发生于女性,但实际上这也发生于男性。大家都认识
这类人,如果他们以离婚或其它方式离开恶劣的另一半,
他们旋及又会找到同类型的对象重蹈覆辙。
这些长期成为受害者的人是否具有严重的心理问题
呢?有这个可能,不过他们也可能是长间隔变化性增强
时制的受害者。常你刚开始与对方交往时,认为对方迷
人、性感、风趣你的钱会越来越多,但是这种方式实在
很无趣又无微不至,即使这个人日后逐渐变得难以相处,
甚至施暴,但偶尔还是会对你展现好的一面,即使获得
这些美好增强物的时光变得越来越罕见,它却成了你的
人生寄托。从常理来看,这似乎是十分反常的现象,但
是从训练观点的角度看来却显而易见:这些美好时光出
现得越少、越无可预测,它的增强作用越强大,而且你
的基本行为也将越为持久。此外,也不难理解为什么曾
经有过这类关系的人会再度寻求同类对象,因为他们与
和善正派的正常人交往时可能就是少了那种增强物极少
出现、令人渴盼、因而增强效果加倍所带来的快感。
从操纵者的角度来看,想任意使唤某个人、并且让
他随时言听计从,只要偶尔给他他想要的东西就可以达
到目的了,这便是皮条客管理手下妓女的手法之一。它
的确是个极为有效的方法,但是一旦受害者理解到操纵
者的强烈「魅力」至少有部分来自这种变化性增强时制,
他们通常便能冷静离开这种关系,找寻不同的对象。
 不适用变化性增强的情况

在行为学成后不应该采用变化性增强的情况只有一
种,那就是当这个行为牵涉到解答问题的时候。高级服
从训练要求狗儿从一堆杂七杂八的东西里找出主人摸过
且带有气味的对象,每当狗儿选对对象时都必须让牠知
道,这样牠才知道下次该怎么做。进行分辨测验(例如
找出两个声音之频率较高者)时,动物每次答对都必须
获得增强,这样牠才能一直获知要求牠回答的问题是什
么(当然,这时可以使用制约增强物)。我们在玩填字游
戏或拼图时,每次猜对就会被增强,因为只有正确的字
或拼图片才能放入对应的空格或位置里,如果每个空洞
都可放入多片拼图,你便得不到因正确选择带来的正增
强,这种回锁对于多数选择性测验的情境都是必要的。
 如何打破「起头最难的障碍」.

除了变化性增强时制之外,我们也可以采用「固定
增强时制」(fixed schedules of reinforcements),这
意谓动物必须在预定时间内持续某项行为,或者必须完
成预定次数的行为之后才会获得增强。举例来说,我可
以安排海豚连续跳跃,每跳完六次就增强一次,于是连
跳六次的行为很快就会经常出现。但固定增强时制的问
题是,连续行为当中较早出现的行为永远得不到增强,
于是常会变得越来越马虎,过得去就好。以海豚跳跃为
例,除了最后一次实际获得增强的跳跃动作以外,其它
跳跃动作将逐渐变得越来越小。固定增强时制的缩减效
应或许是影响人类许多任务的一项因素,以工厂装配线
为例,人们通常必须工作一段固定时间才能获得增强,
与工作表现优劣无关,人们当然只想尽量少花力气,只
要足以让他们待下来就好,而且每次刚开始工作时的表
现可能会特别糟。以海豚来说,偶尔随机增强第一次或
第二次跳跃对于维持行为的效果与增强第六次跳跃一样
有帮助。对人类来说,如果各式奖励津贴或其它形式增
强物(例如颁奖)与工作量或工作表现有直接关系,并
且不与平常的增强物同时出现,它的增强效果将会很好。
无论采取固定或变化性增强时制,都可以训练出一
长串的连续行为,小鸡可以为了一粒玉米猛啄钮扣一百
次以上,人类也有许多久候增强的例子,有位心理学家
开玩笑地说,自人类存在以来,等待时问最久、一直未
获增强的行为就是念研究所。
间隔极长的增强时制有时会因为超过极限而失效,
小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能
量高于一粒玉米提供的能量时,啄东西的行为通常会消
失,因为做这件事所获得的好处太少,变得不值得做。
这种情形当然也常岭生在人类身上。
间隔极长的增强时制也可能产生另一个现象,小鸡
一旦开始啄东西以后即会毫不间断地持续啄,因为每啄
一次将更接近获得增强的机会,不过研究人员注意到,
增强间隔拖得越长,小鸡开始啄东西的行为就会越晚出
现,这种情形称为「长时间行为的延迟启始现象」
(delayed start of long-duration behavior),这是
每个人在日常生活中都非常熟悉的现象。
遇到任何耗时很长的工作时,无论是报所得税或整
理车库,每个人都想得出许多无法立即开始进行的理由。
写作(有时甚至只是写封信)是个花时问的行为,虽然
一旦开始写了之后通常会进行顺利,但是要叫人坐下来
开始写真的很难! 作家詹姆斯·索伯 (James Thurber)
发现,要他开始着手写稿真的非常困难,他有时会装装
样子骗他老婆(可理解地,她当然急着要他写稿,因为
这样才能付房租),他会整个早上躺在书房沙发上用一只
手看书,同时用另一只手随便敲着打字机键盘,将来可
以获得金钱正增强物的愿景不敌这个延迟启始的现象,
而假装打字的动作至少阻止了被老婆斥责的负增强物。
要克服这种延迟启始的现象有一个方法:在行为刚
开始时即给予一些增强物。我有时会在海豚连续跳跃六
次的动作中增强第一次或第二次的跳跃动作,我也会用
同样的技巧训练自己。多年来,我曾经每星期有一两个
晚上要上研究所的课,三小时的课再加上地铁各一小时
的来回,每次都花上很久的时问,每当接近下午五点钟
我总是出现不想去上课的强烈欲望。不过后来我发现,
假如我把这趟路程分段,再把第一段分成五个小步骤 --
走路到地下铁、赶上列车、转车、搭公交车去大学和最
后爬上楼梯去教室,而且每当在我完成一个小步骤就犒
赏自己一小块我很喜欢但平常不吃的巧克力,这个增强
每个初期小步骤的作汰至少让我能够走出家门,而且几
星期之后我已经能够一路前去上课,不再需要巧克力,
心中也没有挣扎。
 迷信行为:意外的增强效果

现实生活中无时无刻都会出现增强,而通常都是碰
巧发生的。一位研究者鹰的生物学家注意到,如果老鹰
在某处树丛下抓到老鼠,随后约有一星期的时间牠每天
都会到该处侦察,牠飞经那个特定地点的机率已经被强
烈增强。如果你在垃圾桶里找到一张二十美元的大钞,
我相信你隔天再次经过这个垃圾桶时,肯定会仔细往里
头瞧瞧。
那个意外的增强对老鹰有利,事实上,动物行为可
说是为了使每个物种从增强上获利而演化出来,然而关
连性也会意外产生,而且它仍可能对行为有深切影响。
如果某项行为与后果其实毫不相干,但动物仍出现该行
为,彷佛牠必须这么做才能获得增强,科学家称此行为
为「迷信行为」。就举咬铅笔的例子好了,如果考试时把
铅笔放到嘴里,正好在此时想到了正确答案或好灵感,
于是咬铅笔的行为即受到了增强。我上大学时每枝铅笔
都盖满了齿痕! 遇到特别难的考试时,我有时还会把铅
笔咬断。咬铅笔有助于思考吗?当然没有,这只是个被
意外制约的行为罢了。
人们出任要务时会穿上特定衣物或进行某套仪式也
是出于同理。我看过一名棒球投手每次准备投球前都会
进行一套九个步骤的连锁动作:轻碰棒球帽、把球轻触
手套、把棒球帽往前推、擦擦耳朵、把棒球帽往后推、
单脚来回磨地等等,局势紧张时他可能还会把整套动作
重复两遍,而且从来不会变动动作顺序。这套动作发生
的时间相当短(球赛播报员从不曾提及这些动作),然而
它却是一套极为繁复的迷信行为。
动物接受训练时也常会蹦出迷信行为,牠可能会出
现一些你并未特意要求的反应,但这些反应常被意外增
强而受到制约,例如,动物可能出现牠似乎必须待在某
处、面朝特定方向或出现特定坐姿时才能获得增强的样
子,当你要牠换地方训练或面朝另一个方向时,牠的行
为却难以理解地突然做不好了,想找出原因可能得花些
功夫,因此聪明的作法是,在行为至少完成了部分训练
之后,随即在进行训练时变化所有你不认为重要的情境
变量,以免发展出一些日后可能成为阻碍的意外制约行
为。
最重要的是,要注意不经意时形成的增强间隔模式。
动物和人类对时间的间隔都很敏锐。有一次,我十分确
信自己已训练两只鼠海豚依讯号跳跃(看我的手势),直
到一位来访的科学家拿着秒表告诉我,只要每隔二十九
秒牠们就会跳跃一次;果真没错,无论我是否给讯号,
牠们都会每二十九秒跳一次,我给讯号的行为意外被制
约得极为规律,而鼠海豚是因为发觉了这个规律性而跳
跃,并非依照我所给予的讯息而动作。
许多传统动物训练师的想拭及行为也都充斥着迷
信,他们有些人告诉我,海豚较喜欢穿白色衣服的人、
骡子一定非揍不可、熊不喜欢女性等等。而「训练」人
类的人可能也一样糟糕,例如他们可能相信小学五年级
的孩子一定得大声责骂不可。这类训练师受到传统的摆
布,训练时每次都必须按照完全相同的步骤,因为他们
无法区分哪些方法有效、哪些只是迷信。这种无能(或
混淆)常见于多种专业领域 -- 教育界、工程界、军中,
特别是医界,令人瞻寒的是,极多施予病人身上的处理
程序并不具疗效,它们纯粹只是沿习或时兴的作法而已,
任何住院过的病患随便想都能想到六项不必要的程序,
这些程序都是迷信行为罢了。
有趣的是,单单向人指出迷信行为无效并不一定能
使它消失,由于它受到强烈制约,人们可能因而为它强
烈辩护,如果攻击某位医生惯用的疗法无用或甚至有害,
你一定会遭到猛然反击。我相信如果有人命令那位有九
个暖身迷信步骤的投手脱掉那顶他得碰四次的棒球帽,
他一定会奋力抗拒。
不过,你仍然可以去除自己的迷信行为,方法是一
议自己明白它与获得增强物无关。我儿子泰德是银行家,
他的嗜好是参加剑击比赛,他每个星期会找出两三段时
间练习,而且常在周末四处旅行参加比赛。有天他碰上
一名很强的对手,他却因为把最爱用的一把剑忘在家中
而提不起劲,当然,他输了那场比赛。后来他发现提不
起劲比起那把剑更影响他的剑击表现,而且使用「最爱
用」的剑其实全是迷信行为。
泰德于是开始着手去除所有他找得出来的剑击相关
迷信行为,他发现自己有很多迷信行为:一定要穿戴特
定衣物,心中深信一夜睡不好、吵架或甚至比赛时把果
汁喝光了等等都可能影响比赛表现,他系统性地一一检
视这些状况,每找到一个迷信行为就消除对它的依赖。
现在,每次参加比赛他都能轻松自信以对,即使赛前一
小时他恶运连连似地错过火车、弄丢球衣球具、与出租
车司机争吵,或者穿着练习用服装和配错对的袜子、使
用借来的剑也都无所谓了
 利用正增强可以做什么?

以下是我认识的人应用正增强的一些例子:
设计师茱蒂为了温故知新,每周到附近大学上一次
夜间绘画课,班上同学多半也是设计师或商业艺术家。
考师每周指定回家作业,但这些专业人士有许多人根本
不做作业,老师总是习惯至少花上十分钟向全班唠叨作
业欠缴的情形,茱蒂被骂烦了,于是建议老师不要再批
评不缴交作业的人,而改赞美那些缴交作业的人。老师
接受了建议,日后在课堂上公开称赞每件完成的作业。
到了第三个星期,老师不但有一班快乐学习的学生,缴
交作业的人数也增加了。
.
大学生仙娜到朋友家中拜访,却遇见朋友为了帮家
中的德国牧羊犬的耳朵上药,四个成年 人企图协力抓住
牠,不要让牠挣扎乱动,却徒劳无功而且还有些危险。
仙娜并不特别爱狗,不过她学过正增强,她从冰箱拿出
一些起司,五分钟之内狗儿被她训练得安静不动,她一
个人轻松完成耳朵上药。
.
有位年轻女子嫁了一名男子,结果她的先生爱指使
人又很苛刻,更糟的是,她同住的公公也是一个样儿,
这名女子的母亲告诉我这则故事,她第一次造访时看到
自己女儿的遭遇甚为惊恐,但她女儿说:「别担心,妈,
等着瞧吧!」她的作法是遇到命令和苛刻言词时尽可能不
予反应,但两人之中任何一人出现和颜悦色或体贴倾向
时即马上作增强,给予认可及热情。一年之内她已使两
人改头换面,成为亲切和气的好男人。现在他们都会带
着微笑欢迎她回家,而且都会马上起身帮忙拿杂货。
.
有个国二女生住在都市里,她喜欢周末带狗到乡间
散步,可是她的狗经常跑走,召牠回来时牠又常拒绝回
到身边,尤其到了回家的时间更是如此。某个周末她关
始这么做:每当狗儿东跑跑西跑跑,然后自动跑来找她
时,她便对牠施出浑身解数,称赞牠、拍拍牠、像对婴
儿般对牠矶叽呱呱讲话、抱抱牠等,等到回家的时闲到
了,她叫狗儿过来,牠便很高兴地回来了,女孩以盛大
的仪式欢迎狗儿,这个增强物显然胜过狗儿平常拖延时
间所获得的自由,从此牠去乡间散步不再出现问题。
.
一名初级行政人员有个恐怖暴躁的上司,他从自己
工作内容当中找出了一些可能增强上司的地方(例如拿
文件请他签名),并且尽可能挑选上司不在气头上的时间
找他,渐渐地,这位上司变得和气,后来还开始讲起笑
话。
.
有些人发展出的增强物极为特殊,使得他人一心设
法获得这种增强。安娜特是一名住在郊区的家庭主妇,
孩子都长大离家了,如果她没有一群朋友经常打电话来
分享消息,她几乎与世隔绝。这些朋友不一定是邻居或
亲戚,许多人是住在远地的忙碌职业妇女,我就是其中
之一。我们为什么都打电话给安娜特呢?当我们有坏消
息(例如感冒、遇到国税局查税或者保母要搬走了),安
娜特会安慰我们,给我们忠告,不过这些都是朋友应该
做的事,但她的过人之处在于,当我们有好消息,她会
特别增强,如果你告诉她银行批准了你的贷款,她不会
只说:「太棒了!」,她会特别指出你做了哪些努力,为什
么你受之无愧,她的响应可能是: 「妳看吧,记得妳以前
为了维持良好信用有多努力吧!还记得妳千辛万苦解决
了电话公司的问题,还申请了一张航空卡吗?现在一切
都值得了,妳被评为好的生意人,不过那时妳得先做出
正确的行动,妳也确实这么做了,我真是为妳感到自豪。」
哇!这不仅仅是认可而已,这是「增强」唷 -- 而且她
增强的是过去所作的努力,即使当时只觉得那真是场磨
难。安娜特不会把好消息归类于「好运」,她使它转变成
增强他人的机会,当然也增强了大家想打电话给她的意
愿。
 团体中的增强

业务代表大会、家长会、卡内基课程或减肥巾心,
这类闲授自我成长集体课程的机构其实大多非常仰赖集
体对个人的增强效果,掌声、奖牌及颁奖仪式等集体嘉
奖形式是很有效的增强物,有些作法还相当异想天开。
以前有一位 IBM 业务主管希望增强手下业务团队的年度
表现,于是他雇用了挤满一整个足球场的人,为员工、
高阶主管和所有员工家属盛大举行一场派对,他让所有
业务代表从球员出场的地方跑进球场,分数板上闪动着
他们的大名,由全场群众高声欢呼迎接。
我上过沃纳.欧哈德(Werner Erhard)的「欧哈德
研讨会训练课程」(EST)
,它有些吹擂自我的推销意味,
但是从训练的角度来看,我发现这个课程设计得很巧妙,
经常高明运用塑形及增强原则。我认为它的名字「训练
课程」取得很适切,带领课程的人称为「训练官」,塑形
的目标是认识自孜,主要增强物不是训练官的反应,而
是所有人表现出的非语言集体行为。
为了发展出集体增强行为,他们要求二百五十名学
员在每位讲者讲完之后都必须鼓掌,无论他们是否想这
么做,因此从一开始,害羞的人得到鼓励,胆子大的人
也得到了奖励,而且任何人的见解(无论见解深入或愚
蠢)都被大家接受。
起初大家的鼓掌只是义务性质,但它很快变得具有
真正沟通意义 -- 它不同于戏院里的掌声,并不是用来
表达欣赏程度,而是表达不同程度的感受和意义。举例
来说,我那次上课的学员里有名好辩的男子,我想每次
的 EST 课程都会有这样的人,他经常从训练官的话里挑
语病,到了第三或第四次时,训练官闲始回嘴,其实大
家都看得很清楚,从逻辑来看这名男子说得一点也没错,
但是随着他们吵得越来越久,早已没人在乎谁对谁错,
其余的二百四十九位学员都只希望他闭嘴坐下。
这里的规则 -- 其实是塑形法的原则 -- 并不允许
我们提出抗议或叫他住嘴,但是他逐渐意识到周遭一片
寂静,我们看着他渐渐领悟到没人在乎他是对的,当「对」
或许并不重要时,他变得结结巴巴,慢慢地闭上金口坐
了下来,所有人立刻爆发出轰堂掌声,表达大家赞同、
谅解及全然放松之意 -- 这对他刚刚的体悟是极为有效
的正增强。
在这种训练过程中,真正重要的是行为,因此不需
要言语,但要向局外人解释这种训练常常极为困难。欧
哈德像是禅学导师,常以格言开示,以上例来看,欧哈
德的课程格言是: 「当你是对的,你就是只是『对的』而
已。」意思是,你不一定有人爱,也不一定人很好,你只
是「对」而已。如果派对上有人高谈阔论、举止夸张,
而我引用这句格言,上过欧哈德课程的人可能都会大笑
-- 事实上,任何一位好的现代训练者司能都会大笑,不
过多数听到这句话的人可能会以为我是白痴或喝醉了。
好的训练概念并不一定可用言语解释清楚。
 别忘了增强自己

增强式训练还可以应用在自己身上,我们常忽略这
个作法。我们往往很容易对自己过于严苛,一位我认识
的牧师说:「我们很少人为自己设下容易达成的低标。」
于是我们经常连续多日忙碌无休,事情一件接着一件做,
从不留意或感激自己。事实上,除了改变习性或学习新
技能时可以增强自己之外,每日生活的努力也应该获得
一些增强,我认为缺乏增强物是导致焦虑和沮丧的因素。
你可以利用健康的方式增强自己:给自己一小时的
假散步去、和朋友聊天或读一本好书,或者也可以利用
不健康的方式:抽烟、喝一杯威士忌、大吃一顿、通宵
玩乐等等。
我很喜欢已故美国女演员罗丝·高登(Ruth Gordon)
的建议:
「演员极需要赞美,如果我撑过一段没有赞美的
日子,我就会自我赞美,它的效果一样很好,因为至少
我知道这个赞美是真心诚意的。」
第二章 塑形法 不打, 不骂, 不施压的训练法
 什么是塑形法?

增强动物已经出现的行为,让这些行为更常发生是
很好,但是训练者要怎么做才能使动物出现那些牠们可
能永远都不会碰巧出现的行为呢?怎么做才能让狗儿后
空翻,或让海豚跃人圈圈内呢?
狗儿后空翻、海豚跳圈圈或人类投篮都是经过塑形
的行为。塑形法(shaping)是指把一个倾向于正确方向
的小行为慢慢进行调整,每次只改变一点儿,朝最终行
为目标推进。这个过程有个专有名词 - 「连续渐进法」
(successive approximation)。
生物行为并非一成不变,因此才有可能进行塑形法,
不管动物的行为是什么,有时这个行为在某些方面的表
现可能较强烈有力,因此无论你希望塑造出的终极行为
多么复杂或困难,你都可以利用牠目前已出现的行为作
为第一步,再一步步建立过渡行为。举例来说,假设我
想训练鸡「跳舞」,起初我可能会先观察鸡的动作,等到
牠每次刚好往左栘动时便作增强,很快地我的第一个目
标即能达成 -- 鸡变得常往左方移动,而且牠的动作不
一定每次相同,有时只移动一点,有时做很大的移动动
作。接着,我会选择性地增强较大的往左动作,例如增
强牠转了四分之一圈,当它成为最常出现的反应时,我
可以把增强标准拉高,设定新目标,开始选择增强鸡转
了半圈或半圈以上的行为。等到鸡被塑形到为了一个增
强物可以快速转完很多圈时,我可能才会认定自己达成
终极目标 -- 成功训练一只会跳舞的鸡。
我们都相当习惯塑形也很习惯被塑形,大致说来养
儿育女多半就是塑形的过程,无论是打网球或打字,训
练任何肢礼技巧主要都得运用塑形法。当我们试图改变
自己的行为,例如戒烟、克服害羞或增进理财能力时,
我们也常常运用塑形法。
是否能够成功塑造自己或他人行为的关键,不在于
我们多么精通塑形法,而是我们有多坚持。已故《纽约
时报》乐评家海洛,荀贝格(Harold Schonberg)提到
一位不算杰出的欧洲指挥家,这位指挥家会为了音乐会
要求乐团排演一整年,因而演出极为美妙的音乐。因此,
几乎是任何事情,只要投入足够的时问,我们多数人都
能略微精通。
但这么做实在很无聊,无论滑雪、弹钢琴或其他事
情,我们不都想要尽快学会吗?我们当然都想这么做,
这时候便需要好的塑形技巧了。此外,我们不都也较喜
欢避免或尽量减少重复练习吗?没错,有些肢体技巧当
然需要重复练习,因为肌肉的「学习」速度很慢,必须
不断重复动作,这些动作才变得容易。虽然如此,设计
完美的塑形计划确实可以让练习次数减到最少,让每次
的练习都有实际成效,大幅加速训练进展。对于运动、
音乐演奏或其他发挥创造力的工作,你可能期盼能有水
平一致的演出,也可能希望自己或自己训练的人尽可能
展现最精彩的表演,正确运用塑形法是不可或缺的关键。
 方法重要,原则更重要

塑形法分为两个层面:「方法」-- 各阶段发展出来
的行为和发展出这些行为的步骤,及「原则」-- 行为被
增强的理由、增强方式及时间点的依循原则。
多数训练者、训练书籍和训练人的老师都只重视塑
形「方法」-- 「照图示把双手放在高尔夫球杆上」、
「瞄
准目标之前先把眼睛对准来复枪上的瞄准孔」、「以顺时
钟方向用打蛋器打蛋」,这么做确实很不错,通常这类方
法都经由许多人多年的尝试错误而发展出来,所以它们
一定管用。骑马时把脚踝放低,就可以坐得更稳;打高
尔夫球时,若能塑形出不错的送杆动作,你的球也许就
能飞远一点儿。若你有兴趣学习某项技能(或技巧),我
极力鼓励你尽可能找出训练这项技能(或技巧)的所有
方法 -- 你可以透过书籍、老师和教练,或者去观察研
究他人。
不过,千万不要忽略塑形法的「原则」层面,有效
训练不只要用好方法,更要用好的塑形技巧才是。依照
原则控制何时提高要求、何时放松要求、如何以最有效
的方式提高增强标准、遇到困难时如何解决,最重要的
一点或许是何时应该停止训练,这些问题一般都由训练
者或教练凭直觉和经验判断、随机去做或完全靠运气。
然而能否成功运用这些原则,便成了「教学胜任」与「教
学优越」的差异,也是塑形过程令人愉快、迅速且成功
或令人沮丧、缓慢且无聊生厌的差异。
 塑形法的十大原则

塑形法有十大原则,有些原则源自实验证实的心理
学法则,有些原则据我所知甚至从未被正式研究过,但
任何塑形经验丰富的人都会自然而然认为它们很合理:
当你违反其中一项原则时,你通常都会知道(虽然往往
晚了一步)。
1) 逐渐提高增强标准的幅度不可过大,这样训练对
象才有不断被增强的机会。
实际应用这个原则时,它意谓当你提高行为标准时,
你应该把要求定在动物已经可以达到的行为范围内。如
果你的马匹能够跳过两呎高的障碍,有时还高出一呎,
你便可以试着把一些障碍调高到两呎半,但是把所有障
碍都调高到三呎就是自找麻烦,虽然动物有能力做到,
但是牠还无法经常出现这个行为,如果把障碍调高到三
呎半,当然肯定是彻底失败。
无论现在或未来,调高增强标准的快慢与动物的实
际能耐无关,不管牠是否是只可能跳高八呎的长腿大马,
也不管牠是否惯常跳过四呎高的牧场围栏,调高增强标
准的快慢与你透过塑形过程达到的沟通效果有关,如果
动物清楚你的增强原则,就可以早点调高标准。.
....每次调高增强标准时,你便改变了规则,所以
你必须让训练对象有机会发现:虽然规则改变了,只要
牠多费点儿劲表现,仍然可以轻易获得增强物,而且继
续维持旧标准的行为有时已经不管用了。然而牠只有在
达到新的增强标准时获得增强,才能够学会这一点。.
....如果你把增强标准调得过高,要求牠出现超乎
过往能力的行为.‐‐.不管牠自己平常是否出现这个行
为.‐‐.你都是在冒险,因为牠的行为可能因此完全瓦
解,牠在跳跃过程中也很可能学会不良习慎,例如临阵
拒跳或撞掉跳杆,你必须耗时费力才能根除这些不良习
惯。所以塑造行为最快的方法.‐‐.有时也是唯一的方
法.‐‐.就是调整增强标准时,调高幅度必须很容易让
动物持续进步,即使每次进步只有一点点,持续的进步
仍然比强求快速进步、可能失去所有良好表现的冒险作
法更能快速达到你的终极目标。.
....我曾经见过一位父亲犯下这种严重错误。他青
春期的儿子功课很差,于是他没收了儿子最爱的机车,
等到功课变好时才会还他。他儿子真的因此努力念书,
功课日渐进步,从不及格进步到丁等,又从丁等达到丙
等。但是,这位父亲不但没有增强他的进步,反而认为
进步不够,继续禁止他骑车。这个突然提高标准的要求
太困难了,最后他儿子完全放弃念书,而且变得非常不
信任人。
2) 每次只针对行为的某项特性进行训练,不要企图
同时塑形两项特性。
我的意思并不是指在同一段练习时间内不能训练多
种不同行为,这当然可以。在任何一种课程里,我们可
能先练习动作,然后再练习速度;以网球练习为例,我
们可能先练习反手拍,然后再练正手拍,之后再练习步
法及其他,这么做可以减少单调无聊的情形。好的指导
老师会一直变化练习项目,当一项有些进步之后就换到
下一项。
不过,训练每项行为时,你应该每次只针对一项增
强标准作练习。假如我想训练海豚溅水,这次因为水溅
得不够高而不给增强物,下次又因为牠溅错方向而不给,
海豚将因此无法领悟出我到底希望牠做什么。一份增强
物无法传达两种讯息,我应该先对溅水的高度进行塑形
直到满意为止,然后再针对溅水的方向(不管溅水的高
度)进行塑形!直到牠学会了溅水的方向。等到两项增
强标准都能个别达成之后,我才能要求牠同时达到这两
项标准。
第二条原则有很多可以实际运用的地方,如果一件
事可以分解成个别的小单元,然后再针对每个小单元各
自塑形,学习的速度将会加快许多。以高尔夫球的推杆
进洞为例,这个动作取决于球推出后的适当距离,不可
太短、不可从洞口经过或跳过,而且推杆的方向必须很
正确,没有偏向洞口的某一边。如果想教自己推杆,你
或许可以在草地上拉起一条几呎长的胶带,先练习从两
呎处推杆,让球压过胶带就停下来,再从四呎、六呎、
十呎处推杆,依此类推;你也可以把胶带贴成一圈,从
一定距离练习瞄准圈圈推杆,再逐渐把圈圈缩小,直到
能够稳定打中非常小的标的物为止。等到自己对推杆距
离和方向控制技巧都很满意时,再合并两项同时练习,
先使用大目标物并变化距离,然后缩小目标物并改变距
离,直到能够从不同距离打中小目标物为止。最后才加
入新项目的增强标准(例如往上坡推杆),但是每次只加
入一个。
如果你投入的心力够多,以及个人的眼手协调够好,
这样一来,你的推杆技巧会变得很棒或甚至技艺超群。
任何打高尔夫球的人只要按照这种单一目标的塑形计划
练习几个周末就会有很大的进步,这好过整个夏天漫无
目标地练习,只期待每一球刚好打出适当距离和方向。
我们学习技能时经常遇到无论练习再多似乎都无法
进步的情形,其实原因在于我们老想一次同时修正很多
地方,这样的练习并没有塑形作用,而且一直重复动作
或许能够进步,但也可能轻易增强错误的地方。你必须
思考,这个行为的特性是否不只一项?能否把这个行为
分解成更小的动作,再依各项特性个别训练?当你注意
到这两件事,许多训练的问题自然会迎刃而解。
3) 进行塑形时,先「变化性增强」目前符合增强标
准的行为,然后再提高增强标准
许多人至始至终就反对在训练时使用正增强物的概
念,他们认为这么一来,他们可能一辈子都得给零食才
能获得好行为。但事实正好相反,利用增强物的训练方
法其实可以使你解脱,不再需要时时留意这个行为是否
发生,这是(变化性增强)发挥的作用。
变化性增强的意思是指一个行为有时会被增强,但
有时不会,当我们教导行为时,我们通常采取无变化增
强时制,意思是我们增强所有符合要求的行为,但是如
果我们只是想要维持行为的出现,我们偶尔才会给予增
强,例如一旦建立起分担家务模式后,你的室友或配偶
回家时可能会顺便去拿干洗衣物,不需要你每次都给他
增强物,但是遇到你生病或天候不佳让他特别多跑一趟
时,你便可能需要表达一下谢意。
然而,当我们利用厌恶刺激作训练时(多数人刚开
始训练时都会这么做),我们通常会学习到一个原则:每
当动物出错或行为不佳时务必进行纠正,如果不这么做
的话行为就会越变越糟。许多狗儿被牵绳牵着时,因为
可能会被猛抽处罚而表现得很乖,但是只要一放开牵绳,
牠们的行为就变得极不稳定。许多青少年和朋友出去时
会做一些不敢在父母面前做的事,这是因为他们完全明
白在什么环境下处罚不会出现,这就是「阎王不在,小
鬼作怪」的道理,可是这也是以厌恶刺激作训练时的副
作用之一,既然处罚意谓「不可以这么做!」 缺乏厌恶
刺激的意思就是「现在可以做了!」
相反地,正增强的训练方法不仅不必一辈子增强每
个正确反应,而且在学习过程中还必须偶尔忽略反应不
作增强。为何会如此呢?
塑形法的重点在于选择性增强某些反应,如此一来
动物的反应才会一点一滴地改善,直到达到新目标。所
有行为都非一成不变,常预期出现的增强物被跳过省略
时,接下来出现的行为将会有些不同,因此偶尔省去增
强物的作法可以让你挑选出表现较强烈或较佳的反应,
这 种 作 法 称 为 「 区 别 性 增 强 时 制 」( differential
schedule of reinforcement),只选择某类反应作增强,
例如增强符合较快、较长或面朝左等等要求的反应。
但是对经验不多的学习者而言,牠原本一直能够获
得预期的增强物,现在却突然得不到了,这个情况可能
让牠大感吃惊;例如你的幼犬坐下来,你按下响片就给
零食,牠坐下的动作越来越迅速,也出现越开心的样子
-- 「你看!我坐下了!按响片吧!」突然间,有时候坐
下却不管用了!如果你的幼犬尚未学习接受偶尔不会出
现增强物的状况,牠很可能会失望地放弃,或者退步回
到原来表现较差或较为迟疑的反应。
虽然讨论行为学习的教科书并未提及这个作法,但
如果你正训练一个毫无经验的学习生手,在你开始挑选
更强烈或更佳的反应之前,事先刻意教导牠学习容忍增
强时制的小小变化将会很实用。你的训练对象必须能够
容忍你偶尔出现的「失误」才不会完全不反应,或者以
专业术语来解释,这代表你必须先建立起变化性增强时
制,然后名能藉由区别性增强时制增强较佳的表现。
90 年代时,我在训犬讲座里把变化性增强时制(短
期使用的间歇性增强时制)称为「买一送一」 (twofers,
百老汇行话),作法是让狗儿做两次动作,例如让牠以鼻
子碰标的物两次,才按响片给赏,这样可以让动物学习
容忍间歇性增强时制,让当前行为及日后的其他行为更
不容易消失。
在学习阶段短期使用这种间歇性增强时制有另外一
个好处,如果你的训练对象能够容忍偶尔不给增强物的
情形,当你不增强某个原本足以增强的行为时,学习者
不但会重复这个行为,而且第二次的行为很可能会更为
剧烈。 「嘿!我做到了,你没看到吗?你看,我又做了一
次 !」 这 个 加 剧 后 的 行 为 称 为 「 消 弱 突 破 现 象 」
(extinction burst),可以让你更快达到目标行为。精
通塑形法的人为了激发更不同或更强烈的反应,甚至可
能刻意不给增强物,犬类行为学家盖瑞·威尔克斯(Gary
Wilkes)称此技巧为「借机利用消弱突破」。
当训练对象学习到增强物跳过一次没给并不代表行
为做错了,只是代表牠可能需要再试一次时,塑形过程
便由连续增强时制(continuous reinforcement,新行
为刚出现时使用)转为区别性增强时制(挑选更好的动
作、更长的时间、越快达成行为的反应等等),然后再转
回连续增强时制(当「完美」行为出现时,专有名词称
此为「符合增强标准」的行为),这时已没必要故意采取
间歇性增强时制,因为训练对象已经能够忍受变化性增
强时制了。
最后,当行为的各项特性都达到满意程度时,它通
常已经变成动物能够自然出现的行为之一。你可以要求
这个行为成为其他更复杂行为的一部分,把标准动作、
速度和距离等等都融合成一个大行为,好比参加赛跑、
执行任务或进行每口活动,这个大行为即成为受到增强
的行为,这时你可以将它转为间歇性(或维护性)增强
时制,只要偶尔单击响片或说声「谢谢!」即可维持行为
的流畅表现。高频率正增强方式(训练初时可能经常按
响片给食的频繁动作)这时就可保留起来,等到训练新
行为时再行运用。
4) 针对某项行为特性采用新的增强标准时,暂时放
宽其他特性的旧有增强标准。
假设你正学习打回力球,每次都能成功地把球打向
目标方向,接着你想练练球速,但是当你用力挥拍时球
就乱飞,这时候,你先别理会球的方向,只要用力挥拍
就好,在你拥有一些控制球速的能力之后,球很快就会
恢复正确方向。
学过的东西不会被忘记,但是处于吸收新技能的压
力下,原来已学习很好的行为有时会暂时瓦解。有一次
我在某歌剧的首次着装预演时,看见指挥家因为合唱歌
手连连唱错而大发雷霆,他们好像全然不记得自己辛勤
练习之后的歌唱成果,这是因为他们第一次穿着厚重戏
服、站在梯子上,而且必须边动边唱的缘故;适应新要
求的过程暂时干扰先前学成的行为,等到预演快结束时,
他们的音乐学习能力又重现了,并不需要有人从旁指导。
海豚训练师称这种现象为「新水池症候群」(new tank
syndrome),当海豚移入新水池时,你可以预期牠会「忘
记」所有牠知道的行为,直到牠「吸收」了这个新刺激
为止。在新情境下,如果你因为训练完成的行为出错而
苛责自己或其他人(或其他动物)时,这便是很糟的训
练方式。这是非常重要的概念,通常此类错误可以很快
自我更正,但是斥责容易导致情绪不安,而且有时容易
被聚焦在错误上头,使得错误更难改掉。
5) 永远抢得先机。
进行行为塑形时,必须事先完善计划整个行为塑形
过程,这是为了确保当动物突然大幅进步时,你仍知道
下个要增强的动作是什么。我曾经花两天时间塑形一只
刚捕捉到的海豚跳过一根高出水面几吋的横杆,当这个
行为训练得很好之后,我把横杆调高了几吋,牠不但立
刻跳了过去而且轻而易举,很快地我把横杆越调越高,
这只刚学习跳跃的动物在十五分钟内已经能跳高到八
呎。
这类「突破性」的塑形表现随时可能发生,在人类
身上当然也看得到这种现象,许多高智商的动物身上也
不例外,我相信这是一个内在觉醒的例子,人或动物突
然对自己被要求出现的行为恍然大悟(以上例来说,是
跳得更高一点儿),于是便照做了。虎鲸以能够达到塑形
目标的能力而著名,虎鲸训练师开玩笑地说:「只要把行
为写在黑板上,再把黑板放在水里,虎鲸就会按表操课,
完全不需要训练牠们。」
当训练动物突然出现大幅进步时,训练者可能因此
措手不及。原本打算要从 A 行为训练成 B 行为,可是动
物只经过两次增强就突然表现出完美的 B 行为,这时训
练者心中最好已经先有个底,知道接下来要做 C 行为和 D
行为,否则你将会不知道接下来要增强哪个行为。
对训练对象而言,行为的突破常是件令人兴奋的事。
动物似乎也很喜欢「啊!我知道了!」的感受,而且牠们
常会冲来冲去,表现出兴高采烈的样子。因此行为出现
突破时便成为能够迅速大幅进步的黄金契机,如果自己
未作好准备,不知道接下来该做什么,使得动物一直维
持在低水平的表现,除了浪费时间之外,最严重的伤害
可能是使动物打消动机或感到厌烦,于是牠将来工作的
意愿便会降低。
除了一些极佳的环境外,学校系统的规划目的似乎
是用来阻碍儿童的个别学习,它不仅不利没有足够时间
学习的迟缓儿,也不利快速学习的聪颖孩子,当这些孩
子的灵活思考加速学习时,他们并不会获得额外增强。
他们只要一眨眼即了解数学老师所讲的东西,但他们获
得的奖励却可能是为时数小时或甚至数周难捱的无聊时
光,等待其他人一点一滴慢慢完成学习,难怪这些聪明
或迟缓的孩子觉得到街头混日子有趣多了。
6) 塑形中途不可更换训练者。
塑形过程当中撒换训练者将冒着让进度变慢的风
险,不管移交时多么仔细讨论过增强标准,但每个人的
要求标准、反应时间以及期望进步的程度一定都有些许
差异,训练对象在适应这些个别差异之前,最终影响就
是使动物丧失被增强的机会,在某种程度上这也是一种
「新水池症候群」。
每个训练对象当然可以有多位不同的老师,由不同
老师教授法文、算术或足球并不会有什么问题,但是学
习单一行为时,在塑形期间(或半知半解的期间),逐步
提高的增强标准最好能维持一致性,每次必须由同一位
老师负责塑形某一个行为。举例来说,家中若有两个孩
子和一只狗,两个孩子都想教狗儿把戏,你可以让他们
去教,但是他们得教不一样的把戏,免得可怜的狗儿困
惑不已。
有心向学的人即便在最糟的环境下也能学习。美国
哥伦比亚人学曾进行一项广为人知的「猿类语言」实验,
它教导猿类使用美国手语的字汇及其他暗码讯号,学习
对象是一只名为「尼姆.青布斯基」(Nim Chimpsky)的
幼猿。由于预算拮据及其他种种因素,这只可怜的动物
在三年期问经历了上百位手语老师,实验人员和学生都
失望不已,他们并没有找到尼姆真正使用语言的确切证
据,也就是说牠显然不曾造句,不过牠的确学会辨认并
理解三百个以上的手语讯号(名词和动词等等)。我认为
尼姆处于这种状况仍有此表现已经令人惊叹,而且同样
让人惊讶的是够学习,可是这并不是很好的作法。
塑形中途换人训练应该只有一种必要的情况,当然
就是在训练持续停滞不前的时候,若原本几乎没有形成
任何学习,换人也就不会有什么损失。
7) 当某个塑形方法没有进展时,改采用别的方法。
无论什么行为,只要训练者动动脑筋,塑形出这个
行为的方法不胜枚举。拿教小孩游泳为例,如果目标是
希望他们沉入水里的时候不会害怕、很自在,有些老师
进行这个塑形任务的第一步时,可能会让他们在水中吐
泡泡,有些老师则让他们很快把脸浸入水中便马上起来,
而有些老师可能会让他们在水中跳上跳下,直到他们敢
跳起来再沉入水中。好的老师在训练时如果看见有个孩
子对某个方式感到无聊或害怕时,他会改换方式,同一
个塑形方法不一定对每个个体都管用。
马戏团训练师之类的传统训练师常忽略这一点,他
们的塑形方法大都经过多代琢磨、世代家传 -- 教熊骑
脚踏车就是得这样,教狮子吼就是得那样。这些传统「秘
技」已被视为最好的方法,虽然有时这确实没错,但是
也因它们常被视为唯一王道,马戏团表演因而老是看来
差不多。
美国广播电视名人阿瑟·戈弗雷(Arthur Godfrey)
曾到海洋生物世界录过一集节目,他邀请我到他与妻子
在维吉尼亚州的牧场作客,参观那里的马术训练。戈弗
雷的骑术和训马技术精湛,并且拥有多只表演用马匹。
我们观看一只马儿以传统方法训练「敬礼」 (弯折一只前
脚,前半部身秾往下趴)的过程,动用了两名男子以及
多次套索和鞭打的动作,马儿在这种训练之下不断被迫
弯折前脚,直到牠学会自行弯起前脚往下趴为止。
我告诉他们没有必要这么做,声称自己不必碰到马
儿也能训练牠敬礼(一种可能的方法是,在墙上放个红
点,利用食物和标定讯号塑形,训练马儿以膝盖碰红点,
然后再逐渐把红点移近地面!如此一来为了准确碰到红
点,马儿即必须折起前脚趴下才能获得增强)。这个无礼
的建议引起戈弗雷盛怒 -- 怎么可能有这种说法!如果
有其他训练敬礼的方法,他怎么可能不知道!他气恼至
极,我们得把他带到谷仓外头来回走个两三趟他才慢慢
冷静下来。
令人惊讶的是,人们对于不管用或成效不彰的方法
极为顽强坚持,他们一心相信,同样的方法只要多做几
次就会生效。行为分析研究先驱莫里·西德曼博士主张
「训练时最重要的是理解训练原理,而非只是学习方
法」,主要理由在于,每个人都自有「方法」,但是真正
管用的方法都得遵循训练原理。
8) 不可无故中止训练,这么做将形成一种处罚。
这项原则不包括平常在家里临时起意(但仍具意义
和成效)的塑形行为 -- 称赞学校作业、欢迎返家的人、
鼓励孩子等等,这种非正式的塑形行为有时增强这里、
有时增强那里并没有关系。然而在较正式的情况下,例
如授课或塑形出动物的某个行为时,在训练时间结束之
前,训练者应该专注在训练对象或课程上,这不只是礼
貌或良好的自律行为,它也是一种绝佳的训练技巧。当
训练对象试着获取增强物时,牠与训练者已有了一个协
议,如果这时候训练者开始与路人闲嗑牙、接电话或做
白日梦,这个建立起来的协议便被破坏了,增强物停止
出现并非由于训练对象犯了错,这种作桔造成的伤害可
能远比训练者单纯错失增强好时机更加严重,它可能处
罚了一些当时出现的良好行为。
当然,如果你想向训练对象表达责备之意, 「移除注
意力」会是个好方法。海豚训练师称此为「暂停时间」
(timeout),用来纠正错误行为,把装鱼水桶拿起来离
开一分钟是少数几个用来对海豚表达「不行!」或「错了!」
的方法之一,而它通常非常有效,你可能不认为海豚会
有懊恼或悔悟的样子,但是牠们真的有。移除注意力是
很有效的工具,所以不要草率滥用或不当使用。
9) 如果行为越表现越差,请回顾所有塑形的步骤。
我们都知道在多年荒废之后再度尝试说某种语言、
背诵某首诗或骑脚踏车时那种非常不安的感觉。有时外
在因素会暂时使熟练的行为消失,例如上台紧张而无法
好好讲出背得很熟的演讲词,或是跌倒而严重影响攀岩
能力。有时候后续学习的东西遮蔽掉原来的学习或者与
其抵触,因而出现混合出现的情况,例如你努力想说出
某个西班牙文单字,但却说出德文。
有时处罚或其他不好事件的副作用会干扰不相干的
行为。身为律师的爱犬人士摩根·史贝克特提及有次服
从竞赛时,每只上场比赛的狗儿都避开某个特定赛场角
落,哪里藏有什么不好的事吗?只有那些狗儿才知道答
案。
有时显然已经训练良好的行为仍会变得很差,而且
永远找不到原因。你的狗儿在服从竞赛中一向表现杰出,
但这次牠竟然在三分钟坐下等待的比赛项目中起身,游
荡到赛场外头。谁知道原因?有人在乎原因是什么吗?
这种时候,你需要的不是合理的理由,而是有效的解决
方法。修正这类退步最快的方法不是硬碰硬,不应坚持
训练对象的行为一定得完全回复到令你满意为止,也不
应坚持牠得在完全回复后名予以增强。正确的作法应是
回想所有塑形的过程,并且很快地重新经历所有塑形步
骤,到新情境(二十年后、在公共场所、在雨中等等)
中进行增强,每个步骤只要增强一两次就好。我们在海
洋生物世界把这个技巧称为「回到幼儿园程度」,它常能
在十或十五分钟内把表现不佳的行为拉回原来的水平。
考前复习功课或上台前翻翻剧本临阵磨枪正是这么
做,这种方法多少重复了原本的塑形过程,一让身心都
获得复习,应用在动物或人身上都一样好用。
10) 在训练进展很好时停下训练。
每次塑形训练应该多久?答案取决于训练对象的专
注力。猫咪似乎在十多个增强物之后就会变得烦躁,所
以训练五分钟可能已经算是相当久,训练狗儿和马匹可
以久一点,许多人类课程大都在一小时左右,足球练习、
研究生研讨会和其他不同训练则可能全天进行。
结束训练的「时机」比停止训练的「时间点」来得
重要,你永远都应该在训练进展很好时结束训练,不但
每回训练都应该这么做,而且每回训练到不同阶段(将
改换训练下个行为时)也应该这么做。你应该在训练进
展不错时就告一段落 -- 也就是说,只要达成了一些进
步就停手。
最后达成的行为会记得最清楚,所以你必须确定最
后一个行为是值得增强的好表现。但通常我们见到三、
四个好反应时,例如狗儿完美拾回指定对象、跳水员第
一次完成转体一圈半动作、歌者唱好了一段难唱的歌曲,
我们常会兴奋过头而想一看再看或一做再做,所以一次
又一次地重来,设法重现佳绩。但这只会很快一让训练
对象疲累、行为变差、不断出现错误,接着就是纠正和
破口大骂,最后搞砸了训练。业余骑师最常这么做,我
很讨厌观看马术跳高练习,因为当马匹表现优异时他们
常常不会结束练习、见好就收,常常继续练习到马匹开
始越跳越糟为止。
身为训练者,你得强迫自己见好就收,这需要有些
胆识才做得到。你可能因而在下次练习时发现,拾回、
翻滚跳水或独奏的表现不仅和上次结束练习时一样好,
而且表现显然更佳,事实上你可能一开始进行练习,训
练对象的表现即比上回结束练习时更好,于是可以立即
针对一些进步作增强。
当然,行为的塑形与不断重复操练的作法完全相反,
它不但可以产生稳定的进步,而且也是一种绝对不会犯
错的训练方式。它的训练进展可能极快,我曾经训练一
只一岁迷你马配戴马勒,从开始到结束只花了十五分钟,
而且牠从此不需重新训练配戴,我的作法只是轮番塑形
五个动作(往前、停步、往左、往右和往后),并且增强
每个动作的进步。要达成如此迅速训练成效的方法似乎
有违常理,它取决于你是否肯放下时间压力、特定设定
目标和要求迅速进步的训练目标,完全看你肯不肯见好
就收,这种过程很类似禅修。
有时候,你无法在每次训练时都挑高点结束,或许
学生付了一小时的学费,所以要求必须上一小时的课,
较好的结束时机可能已经过去。或者这回训练并不顺利,
没有较好的表现,而且即将出现倦怠的问题,此时聪明
的作法是在结束训练之前给训练对象一些一定可获增强
的简单练习,让他们记得这次练习整体使他们获得了增
强;海豚训练师常在结束困难且漫长的训练后,作一些
简单的玩球练习,骑马课老师有时会玩「老师说…」或
「捉鬼」游戏,但最不推荐的作法是在训练快告一段落
时才开始介绍新的任务或新的信息,使结束之前出现一
连串表现不佳、未获增强的行为。小时候我的钢琴课总
是这么结束,非常令人丧志,我现在仍然不会弹钢琴。
 从训练游戏开始

即使你知道塑形的原则也对它有所了解,除非自己
进行塑形练习,不然还是无法应用它。塑形不是一个用
口头描述的过程,而是非口语的技巧,是一连串必须花
时间进行的互动行为,有如舞蹈、作爱或冲浪,无法藉
由阅读、想象或讨论而习得,你必须实际行动。
「训练游戏」是发展塑形技巧时既简单又很棒的方
法。我透过训练游戏教授训练技巧,许多训练师把它当
成娱乐,它也可以成为很有趣的派对游戏。
训练游戏至少需要两个人一起玩:一个当训练对象,
另一个当训练者,六个人是最佳人数,因为每个人在大
家玩累之前都至少有一次机会训练人或被训练,不过人
数更多的团体(例如一班学生或一群演讲听众)也可以
玩,因为在旁观察的乐趣几乎不逊于参与。
首先,先让训练对象出去,由其他人选出一位训练
者及要塑形的目标行为,例如在黑板上写下某人名字、
上下跳动或站在椅子上,然后把训练对象请回来,告诉
他要四处走动,活跃一点,训练者则以吹哨子的方式增
强任何梢微接近目标行为的动作;我喜欢加上一条规则,
要求训练对象至少在开头前几次被增强之后必须回到门
口重新来过,这样可避免训练对象一动也不动,杵在最
后一次获得增强的地点。游戏中不能说话,但可以出现
笑声、抱怨的哼声或其他情绪表现,达成行为之前不得
出现任何指示或讨论。
训练游戏通常进行得相当快,以下是一个范例:我
们有六个人在朋友家客厅玩这个游戏,罗丝自愿当被训
练的动物,轮到安妮当训练者,罗丝走出客厅,我们大
家决定要她打开放在沙发旁边的一盏桌灯。
罗丝被叫回客厅,开始四处乱晃,当她朝着桌灯的
方向走时,安妮便吹响哨子。罗丝回到「起点」(门口),
然后又故意回到她刚才被增强的地点停下来,哨子没响,
她随意挥动双手,哨子没响,她试探性地离开,走向恰
与那盏灯的方向相反,仍然没听到哨子响,罗丝开始四
处乱走,等到她又朝着灯的方向走时,安妮吹了哨子。
罗丝回到门口,然后返回她刚刚听到哨子的地点,
但这次她继续往前走,宾果!哨子响了,她没有回到门
口,继续再走几步之后,当她刚好走近桌子时哨子响了,
她停下来,身体碰一下桌子,哨子没响,她把手挥来挥
去,哨子没响,她用一只手掠过灯罩,安妮吹了哨子,
罗丝开始在灯罩上摸来摸去 -- 把它动来动去、转一转、
前后摇一摇,都没有哨声,罗丝把手伸到灯罩下方,哨
声响了,罗丝再次把手伸到灯罩下方,这是个非常熟悉
的动作,而且也是个目的性的动作,她打开桌灯,安妮
吹了哨子,我们其他人立刻鼓掌。
不过即使是简单熟悉的行为,有时也不一定会这么
顺利。在罗丝离开第一次被增强的地点而朝反方向走掉
时,安妮没有给予增强是个很好的训练判断,然而假如
罗丝接下来回到同一地点,却只是站着不动,安妮可能
就会遇上问题了。
以下是训练游戏出现较多问题的一个例子:我到一
个高中班上玩训练游戏,由李奥当动物,贝丝当训练者,
目标行为是打开墙上的天花板灯光开关。
李奥进来教室后开始四处移动,贝丝很快利用塑形
使他来到开关所在的那面墙,然而李奥开始把双手放进
口袋,贝丝加强李奥双手在口袋动来动去的动作多次之
后,他就一直把手放在口袋里不拿出来了,他以身体轻
撞墙壁,转身倚在墙上,甚至倚在开关上头,但是他似
乎看不见开关的存在,而且两手一直没拿出口袋。
我在观看时心想,只要可以引导李奥伸出一只手去
摸墙,他就会注意到开关,并把灯打开,但是怎样才能
让他把手拿出来呢?贝丝另有打算。当李奥背对墙面时,
她利用哨声「捕捉」到他弯膝的动作,很快塑形出他用
背部上下摩擦靠近开关的墙壁范围,其他学生发出咯咯
笑声,他们明白贝丝只要让李奥转为左右摩擦就能以背
部打开开关,于是这个虽非刻意的动作即可意外地达到
要求,但是它花了很久的时间,我们看得出来李奥变得
挫折又气恼。
玛莉亚问道:「可以让我试试吗?」贝丝以眼神询问
我的意见,我耸耸肩,同学似乎也默许。玛莉亚拿出自
己的哨子(自备哨子是这堂课唯一的要求),她向李奥挥
手,示意要他回到门口的「起点」,然后把一张椅子放在
约离墙一呎远、靠近开关的地方,她坐在椅子上,点头
示意李奥开始。李奥很快走向他刚才被增强多次的墙壁,
他从玛莉亚身旁经过时,显然故意无视她的新位置,而
玛莉在他行经时把脚伸出来绊倒他。李奥为了避免跌倒,
把手从口袋里迅速抽出来撑在墙上,在他手碰上墙壁的
同时哨声响了,李奥当场愣住,他看着玛莉亚,她则凝
视着他和墙面之间的空问,以免给他任何暗示。他开始
试探性地拍拍墙面,她予以增强,他又拍一下墙面,这
次他看着自己正在做什么,她增强了这个行为,然后我
们看见李奥突如其来地专注看着那个开关,所有人屏息
静待,他把腰杆子挺直了-点儿,突然完全意识到似地,
把灯打开了,全班予以哄堂掌声。
玩训练游戏时的每位在场人士,无论是参与者或观
看者,几乎都可从每次的增强学到东西。首先,训练者
学习到抓准时间点的重要性,假设动物朝着开关靠近了,
可是当训练者吹哨子时他已转身走开,由于训练者太慢
反应,只好等下次再加油。但是现在「动物」回到起点,
急急地朝着开关靠近,然后又突然转向离开,哎呀!训
练者塑形出来的行为竟然是突然转向,不单是训练者,
所有的人都看得到 -- 早点吹哨子、并在行为实际发生
当下吹有多么必要。
训练对象会发现,以这种形式学习时多想无益,脑
子想什么并不重要,只要不断动来动去,多让哨声出现,
你的身体不需要「你」的协助也能发现应该做什么,这
对聪明的人绝对是很难忍受的经验。通常他们听见哨声
时会定住不动,设法分析刚才做了什么, 「不知道该做什
么」和「不知道也没关系」的概念令他们大感惊惧。我
和一位同侪雪瑞.吉须(Sheri Gish)曾经连手训练心理
学家雷诺.休士坦门(Ronald Schusterman),让他把双
手握拳放在背后、在房里走动长达一分钟,在这么久时
间里都没获得增强确实很难捱,不过他非常努力 -- 直
到所有人都同意我们已经把这个行为完全训练完成,全
场爆出掌声(这恰是训练者的增强物,而且几乎都会自
发出现);雷诺进行研究时曾训练过许多动物,他也曾轻
率大发厥词,说自己「无法被人训练」,但他没有意识到
自己现在已被塑形出现双手握拳放在背后的行为,它已
不再只是表达意见的潜意识行为。
这个例子说明的并不是加强式训练具有某种玩弄设
计的特质,它显示我们惯常出现的错误假设有何危险之
处 - 我们误以为口语沟通最为重要,而且以为如果没有
语言或至少意识到一些口语即无法学习。非口语的学习
经验对于经常以口语指导他人的专业人士(如老师、治
疗师或主管等)尤其有用,一旦亲身当过「动物」之后,
对于那些出现塑形行为、但尚未理解该做什么而容易出
错的训练对象,你将能够心生体谅,甚至心有戚戚焉。
当动物(小孩或病患)很有自信做对却猜错时,牠可能
爆发挫折及怒气,人类甚至可能因这种意外的失落落泪,
此时你也将能够以耐心面对。此外,在你与成年人进行
过这种非口语的塑形练习之后,现实里遇到教学或训练
情境时你将不再轻易脱口而出指称你的训练对象(无论
是动物或学生) 「讨厌我!」、
「故意惹我生气!」、
「很笨!」
或「今天一定生病了!」因为在这个练习当中双方显然都
同意参与,也有意愿参与,所以不管出了什么问题,它
所指向的是训练,而不是训练对象。
训练游戏对专业人士的启发是它的部分乐趣(在场
其他人能同时理解到你的内心想法 -- 你藏不住的,但
是从另一方面来看,所有人虽被逗得很乐却也对你大表
同情)。这个游戏迷人的娱乐之处在于它不需经验也能
玩,有些人天生就是个中好手,依我的经验,最能直觉
反应、创造力高且情感强烈的人是塑形好手,而冷静且
观察力强的人则是最棒的「动物」,可能与你的预期恰恰
相反。最后,整个屋里的人一心想继续看着塑形进行,
除了训练对象以外,所有人动也不动地,训练者也全身
全神专注在塑形上,只要看看他们就可以知道塑形有如
画画或写作,是一种发挥创造力的过程,除了戏剧演出
之外,创造力极少是种集然分享的经验,单是这一点便
足以使「训练游戏」弥足珍贵。
我们在海洋生物世界玩过一些难忘的训练游戏,尤
其有一次哲学家葛雷格里·贝特森担任动物,由海豚训
练师训练他,结果证实训练他实在不可能,原因不是他
站着不动或想得太多,而是因为他出现太多不同的反应,
令训练者无法招架。另一次让我觉得非常有趣的经验发
生在六名职业妇女的小型午餐会后,我们多半互不相识,
而且来自极不相干的领域,玩过两个小时的训练游戏之
后,我们证实其中一位心理治疗师是很棒的动物,一位
迪斯科舞者则是天生的塑形好手,我们离闲时都更了解
彼此,而且也非常喜欢彼此。
1980 年 , 我 在 纽 约 市 布 利 尔 利 高 中 ( Brearley
School)教过一个实验课程,训练一群高中生。我们上
课时玩了训练游戏,六名想象力天马行空的年轻女生死
党开始在家里一块儿玩,她们通常两两成对玩,塑形出
诸如后退着爬上楼梯的怪异行为。我认为这些高中女孩
已经成功学会如何分析思考,她们每次塑形前后都认真
作过周延思考,而且塑形时全心投入十六岁孩子正常出
现的热情。没多久,她们开始塑形父母的行为、给予老
师正增强,并且使讨厌的兄弟姊妹转变为有趣的同伴(作
法是选择她们喜见行为予以增强),我从没见过任何一群
人(在她们之前或自她们之后)这么快即学得了塑形技
巧及应用的可能性。
 塑形快捷方式:目标法、模仿和模拟

专业训练师使用许多技巧以加快塑形速度,其中三
个 对 你 可 能 会 很 有 用 : 目 标 法 ( Targeting )、 模 仿
(mimicry)和模拟(modeling)。
目标法
目标法广泛用于海狮和其他表演动物的训练,作法
是塑形动物以鼻子去碰触「目标物」- 可能是棒子的圆
端,或者也常用训练者的拳头,然后再移动目标物,让
动物跟随它、碰触它。你可以引发各式各样的其他行为,
例如爬楼梯、跳起来、以后脚站立、跟随训练者、进出
运输笼等等,当我们拍拍大腿引狗儿靠近时,我们基本
上就是利用目标法,这个动作似乎对狗儿有吸引作用,
当牠们靠近时,我们以拍抚增强这个行为。
拍拍沙发邀请别人坐在身边是一种目标法,日本旅
客在高大人群问保持不脱队的方法 是跟随一支高过人
群头顶的领队小旗子,这也是一种目标法,战场旗帜和
横布条传统上即为同一用途。目标法已经成为增强训练
新领域 - 「响片训练」的重要技巧,并应用在狗儿、马
匹和动物园动物训练上。
模仿
有些动物和鸟类天生就会模仿,人类也一样,各类
年幼动物学习必备知识的方式就是观察年长者的行为,
并且起而效之。虽然心理学家常将「观察学习」视为动
物具有高度智力的表征 --灵长类擅长此类学习,但其他
一些动物则很差。我认为一个物种的模仿能力反映出牠
的生态(即牠在自然界扮演的角色),而非智力本身的高
低,有些鸟类模仿行为的能力出奇地好,例如英国山雀
(Titmice)学会打开放在门口台阶上的牛奶瓶,再把上
层的奶油喝掉,这个技巧透过模仿快速传遍了山雀族群,
以致于牛奶瓶盖必须重新设计才行。
许多狗儿都没有很好的观察学习能力,当牠们出现
其他狗儿的行为时,这通常是因为牠们对同一个刺激出
现反应,而非模仿的结果。相反地,被心理学家评为智
商低于狗儿的猫咪大都具有很棒的模仿能力,英文通俗
用字“copycat”。
(模仿者)可不是个意外,如果你教会
家中一只猫把戏,例如摇铃叫人开门,你不必训练新来
的猫咪或其他猫咪,牠们也可能学会这么做。猫咪甚至
会模仿猫以外的动物,有天晚上我女儿花了一小时使用
火腿块作为增强物,训练她的贵宾犬坐在一个儿童摇椅
里摇,其中一只猫一直看着,当训练结束时,那只猫自
动自发地跳上椅子,作出最正确的摇动动作,一边抬起
头等待牠的火腿块,牠当然是受之无愧啰!
我认为这种强烈的模仿倾向,解释了猫咪为什么老
爱爬上树却下不来的状况。往上爬的行为多少有些自发
性,生物学家称之为「天生」行为,爪子伸出脚掌,猫
就飞快爬上树去了,不过爬下树时牠必须以倒退方式下
来。这样牠下弯的脚爪名能派上用场,而这个动作似乎
是种习得技巧。我可以为此作证,因为我曾经有过亲身
经验(时间是半夜,地点是梯子的最高处),塑形一只猫
咪倒退下树的行为,因为我不想将来得听猫咪下不了树
时的凄惨叫声。猫咪果真维持了这个塑形行为,牠从此
不再有无法爬下树的时候(虽然牠仍继续爬树)。我认为
大自然里的猫咪与母亲一起爬树时,会透过观察母亲学
会转过身倒退下树,但由于牠们自母亲身边被带走的年
纪往往都极小(六至八星期大),以致丧失了模仿的机会。
海豚具有模仿彼此的强烈倾向,这使得训练变得容
易些,若要让多只海豚出现相同行为,先把一只海豚的
行为塑形出来,然后待其他海豚试图模仿时再予以增强
即可。圈养的幼海豚常在能够进食鱼儿奖励以前即学会
成年海豚所会的把戏,许多海生馆的经验是让「替身」
海豚在一旁观察其他海豚的表演,牠们已被证实能够藉
此学会表演的动作,甚至不需增强或实际练习,对野生
海豚而言,这种能够模仿其他海豚的能力显然具有攸关
存活的重要性。
教导人类肢体技巧时不但可以运用模仿,而且也应
该尽可能地利用,无论跳舞、滑雪、网球或其他,让示
范者站在模仿者的身旁或让示范者背对模仿者通常是明
智的作法,这样模仿者才能以自己的身体跟随动作,不
必花脑筋去想哪边对应哪边,越少花脑筋去想而且口头
传达越少,模仿的效果将越好,顺带一提的是,如果你
想教左撇子某项使用右手的技能(例如钩针编织),你应
该和他(她)面对面坐着,再一让这人模仿你,如此可
以出现镜面影像的动作而非同侧动作。
当然,儿童行为的塑形过程主要即透过模仿,他们
看见大人做什么,无论是好是坏,他们也会照着做。有
天早上在我家附近邮局里,三个小朋友大声吵吵嚷嚷,
几乎无法听到其他声音,他们的母亲正排队等候服务,
她对他们吼骂了多次,终于成功吓阻使他们安静下来,
她询问女性邮局局长:「妳都用什么方法让孩子安静
呢?」她给了个相当正确的答案:「妳可以先试试自己轻
声细语。」专栏作家茱迪丝·马丁(Judith Martin,绰
号「礼仪小姐」)建议,教导孩子良好礼仪时,在训练期
问(也就是从出生至结婚)家中其他人进食和言谈时都
必须谦恭有礼,而且至少要装出关心他人作为及谈话内
容的样子。
模拟
第三个塑形快捷方式是行为模拟,意谓动手摆弄训
练对象的肢体,希望对方藉此学习。打高尔夫球的人利
用行为模拟教新手打球,站在新手背后,以双臂围住对
方,抓住此人的球杆,然后挥杆时一并移动球杆和对方
的身体。有些教导猿类手语的人常利用行为模拟,训练
者抓着幼黑猩猩的手,把它摆在应该出现的位置或做出
应该做出的动作,最后幼黑猩猩应该会有所领悟而自己
出现这些动作。行为模拟便是「活雕像」演出的秘密,
这项马戏团表演在十九世纪末、二十世纪初极为盛行,
由活人和活马摆出名画或名雕像的姿态,观众最爱看的
表演效果是他们宛如石像的静止演出,当灯光一亮,他
们全出现了,无论楚滑铁卢战役的拿破仑部队或其他,
动作全如瞬问冻结般停在空中 - 不只人是如此,马匹也
一样,脖子弯拱着,前脚在空中,好似化为石头。有人
告诉我它的作法是在按摩马匹数小时后,待牠们完全放
松时,像捏陶般要牠们摆出所要的模拟姿势,再增强牠
们维持不动的行为。
虽然行为模拟是广为使用的训练方法,但是我对它
的成效总是有点半信半疑。在训练对象在没有人抓着、
推压或被迫摆出行为之下仍能出现该行为或至少试图出
现该行为以前,我无法肯定他(牠)学到了多少东西,
通常训练对象只学会随人摆布完成动作,被教导拾回的
狗儿学会在被抓着时嘴巴合起来咬住哑铃,但是当训练
者松手时,牠便放掉哑铃。一至三岁的小孩被放在高脚
餐椅上时,如果有人抓着即乖乖坐定,但是只要手一拿
开就立刻站起来乱动,结果反而让利用行为模拟的人受
到训练 -- 把抓住对方或以手导引对方的时问变得越来
越长。
人们似乎觉得若能摆布训练对象的身体,让它一直
进行同一动作,只要练习的时间够久或练习的频率够高,
牠终究将学会这个动作。这有时属实,但是「终究」可
能要等很久,而且从有人推压完成动作到自行完成动作
必须要有内在觉醒:「啊哈!他们要我自己这么做。」这
对动物来说要求甚高,而且即使你的训练对象有如爱因
斯坦般总明,你仍必须不断重复动作以期牠茅塞顿开,
如此运用宝贵训练时间的作法十分缺乏效率。
若想让行为模拟法生效,你得并用塑形法,当你让
训练对象摆出姿势或做出动作时,仔细留意牠是否出现
了一点点主动启始适当行为的表现,这个些微表现便是
你应该增强的行为。狗儿稍微自己咬哑铃皎得紧一些、
高尔夫球员开始顺利挥出一杆、幼猩猩的手自己动了,
你立即当下给予赞美,然后便能一边「略去」协助模拟
的动作,一边塑形新的技巧。并用行为模拟和塑形法通
常可以有效训练行为,但是两者结合才能有效,不能单
单利用模拟。
 特殊训练对象

你可以塑形任何动物的行为,可以塑形鸟儿、也可
以塑形鱼儿,心理学家曾经塑形小婴儿以挥手开关房里
的灯,而我也曾塑形过一只寄居蟹用螫拉扯晚餐铃铛的
拉绳(秘诀是在寄居蟹漫无目标挥动螫时,只要牠的螫
一碰到拉绳即立刻把食物递给牠 --- 我用一支解剖用
长镊子夹取虾子碎肉放入牠的口器)。哈佛教授理查德.
亨斯坦(Richard Herrnstein)博士告诉我,他曾经塑
形一只扇贝拍动双壳以获取食物奖励(但他没告诉我他
喂食扇贝的方法)。海洋哺乳动物训练师喜欢吹嘘自己能
够训练任何动物做出任何牠们肢体能力及脑力所及的行
为,而且据我所知,他们的确能够这么做。
塑形练习的成效之一(尤其当训练对象有过收获良
多的经验时)是它会增加训练对象的专注力,你事实上
正塑形越来越长的期待时间。不过有些动物的专注力天
生就不长,年幼动物(幼犬、幼猫和婴孩)在练习行为
时永远不该要求牠们重复三次以上,过大的压力可能使
牠们灰心或害怕,这并不代表年幼动物无法学习,牠们
无时无刻都在学习,但是每次学习的时间只能很短。我
认识的一位渔船船长教会他四个月大的孙女与他击掌,
小婴儿把手掌张开热情拍击他的手心 - 犹如爵士乐手
击掌互打招呼的迷你版 -- 总是赢得旁观者的热烈好
评,不过他只是利用几次几近瞬间的「训练时间」即达
成训练。
年幼并不是影响塑形的唯一生物性限制因素,某些
行为对一些物种来说十分自然,但对其他物种却很困难;
举例来说,以嘴衔物似乎对猪很困难,但是要牠们学习
以鼻吻推东西就很容易。多数犬种不但发展出特定长相,
也发展出特定行为倾向;牧羊犬几乎不需要塑形也会牧
羊,因为牠已经存在所需的猎物追踪行为,甚至因为犬
种特性而强烈表现,不过假如你决定塑形一双巴吉度犬
去牧羊,你便是给了自己一个超难的任务。有些技能在
特定发展阶段比较容易学习,幼猫鼬在六星期大之前有
可能变得温顺,但是过了时间就不可能,人类一般都以
为儿童学习语言比成人容易,然而语言学家最近却发现,
有意愿的成人学起新语言时可能比多数儿童和青少年
快。我认为教会成人游泳是件极度困难的事,人类是天
生不游泳的极少数物种之一,虽然你可以教会成人漂浮
及正确踢水动作,但我从没见过任何儿时没学会游泳的
成人到了水深处仍能自在嬉戏。
 善用记录作自我增强

那么塑形自己的行为呢?美国市面上有各类改变自
我行为的计划,诸如「烟瘾终结者计划」 (smoke Enders)
和「体重观测员计划」(Weight Watchers)等等,这类
计划大多数主要依据塑形法而来,通称为「行为调整计
划」,它们不一定都会成功,我认为困难之处在于这些计
划需要由自己增强自己的行为,但是当你给予自己增强
时,它永远不会是个意外 -- 因为「训练对象」总是知
道「训练者」的意图,于是变得相当容易说出: 「我才不
在乎我的评量表上是否多放颗星星,我宁愿抽根烟。」
自我塑形行为的方法对有些人可能管用,但有些人
可能必须历经三、四次难捱的计划或者多次重复某方法
之后才能成功,这类人其实能够成功改变习惯或戒瘾,
但是他们几乎都不可能第一次就成功。类似催眠或自我
催眠的方法可能对某些人大有帮助,某大出版社的资深
编辑告诉我,他向一位催眠师学习了戒除严重烟瘾的方
法,他利用自我催眠让自己放松,进入轻度催眠状态,
每当他感到强烈冲动想抽烟时就重复诵吟「我不想抽
烟。」之类的祈文或咒语,对他而言这个技巧似乎在他与
烟之问「隔起了幕帘」(他自己这么描述),冲动消失后
出现的轻松快感和自我恭贺行为具有增强的作用,不过
实际情形是否如此或者是否存在其他增强物的影响当然
不得而知。
我撰写本书时出于好奇,尝试了一些正式的塑形计
划,两个计划在课堂上教授,另外两个计划由学生进行
自我监测,塑形目标分别为戒烟、学习打坐、学习控制
体重和学习理财,所有计划都获得了相当成效,但是计
划初始的成效不大,有些人花了超过一年的时间才达成
目标。我发现进行自我增强最有用的作法就是作记录,
这四个计划都利用了这一点。我需要的是可以让我一眼
看出进步的记录形式,所以使用了图表,这样我对自己
犯下小错的罪恶感才能略为减轻,因为我看了图表后发
现,即使我出了小错,我现在仍比半年前表现得好多了,
虽然要达到完美标准仍然长路漫漫,但是图表上的「曲
线」仍朝着正确的方向移动,这个「看得到」的进步实
证本身虽然没什么增强作用,效果也慢,但它倒是提供
了足够动机,让我多数时候都能坚持下去。
监测自我塑形行为时有个成效非凡的方法:利用计
算机作训练,在计算机程序里设计有趣好玩的增强方式,
它可使学习突飞猛进而且使整个塑形过程很好玩,这种
应用正增强原则的方式已经成为极具发展潜力的领域。
 不发一语的塑形法

在网球课之类的正式训练情境中,训练对象已经知
道塑形目标是什么,而且通常愿意配合参与,因此你不
必花时问等候反应出现再予以增强,你可以利用言语激
励行为发生也不会有问题:
「这么做!很好,现在再做一
次,很好!」
然而若在平日生活的非正式情境之下,进行塑形时
或许最好别给任何口头指示或讨,假设你有个生活习惯
脏乱的室友,老把脏衣服丢得到处都是,而且口头告知
(骂他、求他或以其他言词)都宣告失败时,还有办法
塑形出一个人的整洁行为吗?有可能。
你当然需要拟定一个塑形计划,列出达成目标行为
之前的初期及过渡性步骤。举例来说,若要让他每次都
把脏衣服丢到洗衣篮里,你可以从丢袜子开始,仅此一
次,在他的臭袜子即将落地之前把洗衣篮递出去接住它,
你增强这个行为的方式可以利用口头赞美或碰触,或利
用任何你认为这位室友可能有所回应或接受的方式。人
们都不笨,只需几次增强他们就会改变行为,即使乱丢
肮脏衣物的行为事实上含有冲着你而来的微妙攻击意味
(「你这佣人,把我的衣服检起来!」),你仍能够利用正
增强塑形出持续可见的进步,直到对方达到你认为可以
的整洁标准。
不过这种塑形用法有两个易犯错误:首先,错误比
进步容易获得注意,加上我们又喜欢用口语表达,所以
当对方没有达到增强标准时我们极易出口指责,可是该
增强的时候却极少这么做,这样只会前功尽弃。第二、
常你「算计」着塑形某人行为时,你很难把它憋在心里,
但说出来可能很糟糕,如果你说:「当你______时,我会
奖励你……」(空格里可能是把脏衣服放入洗衣篮、不抽
大麻、少花点钱或其他),这成了贿略或允诺,不是真正
的增强,而对方得知你的计划之后,他可能立即出现反
弹,反而加剧不当行为。为了收到成效,你必须力行塑
形,而不是动嘴皮子。
如果你果真成功塑形了某人的行为,日后最好也别
四处吹嘘。有些塑形者永远学不会这一点,坚持夸跃「自
己」的杰作,这么做至多只会表现叫人领情的样子,而
且极可能使对方成为一辈子的死对头。此外,虽然为了
协助对方改善技巧或戒除不良习性,你可能因此改变了
自己的行为以给予适当增强,事实上谁最辛苦呢?是这
个人。聪明的父母绝不会到处去说自己把孩子养得多好,
一个理由是我们都知道养育重责没有终了的一天,另一
个理由则是,孩子才理应得到荣耀 - 光是他们忍受我们
诸多训练上的错误即值得赞扬。
由于对人塑形时不需要说话,甚至必须缄默,有些
人觉得这有点操纵别人的邪恶意味。我认为这是种误解,
塑形时之所以不可说话是因为我们所训练的是行为,并
不是想法,而且我们不但训练对方的行为,也训练自己
的行为。
不过,既然你可以在人们不知情之下塑形他们的行
为,而且除了像网球课里获得塑形对方的正式许可之外,
塑形人类行为几乎都不可使用语言,那么岂不可能塑形
人们做出可怕的事情吗?是的,的确如此,尤其如果你
运用负增强,以令人不快的刺激引发全然恐惧,甚至惊
骇。
心理学家在实验室里发现一种「习得无助」 (learned
helplessness)的现象,动物经由学习学会只要压下控
制杆或移动到笼子另一边,即可避开电击之类的不快刺
激。 然后牠被移到另一个笼子,可是现在牠无论做什么
都无法避免被电击,牠将逐渐放弃尝试,变得完全任人
摆布且全然消极,甚至在通往自由的入口重新开启之后
牠可能只是躺着接受处罚。人类的「洗脑」现象可能和
这种现象有关,如果一个人被严重剥夺,无法逃离恐惧
或痛苦,当随后有人把不快刺激作为负增强物 -- 也就
是说,当训练对象改变行为时可以避开或导致不快剌激
消失 -- 那么会发生什么事呢?动物通常会崩溃,但是
人类较为坚强,有些人会竭尽所能避开负增强物。派
蒂·赫斯特(Patty Hearst)以人质身份持机关枪抢劫
银行的照片即为实证*,虽然胁持她的人没有自书中学习
这么做,但如果我们每个人都能理解塑形的运作原理,
这类事件可能较不会发生,不是吗?
____________________________________________
______________________________
*:1994 年美国报业巨子千金派蒂·赫斯特遭绑架,
她受尽凌虐但数周后转而认同绑匪,协助犯罪。
第三章 刺激控制·无胁迫性质的合作关系
 刺激的种类

「刺激」是任何导致某种行为产生反应的东西,有
些刺激可以引发反应,但并不会产生学习或训练效果,
当我们听见大声响时会缩一下,光很亮时会眨眼,闻到
厨房传出诱人香味时通常会走进去,动物也会有同样的
反应,这些声响、亮光和气味就是所谓的「非制约刺激」
(unconditioned stimulus) 或 「 初 级 刺 激 」( primary
stimulus)。
另一种刺激是经由学习而得的,它们本身可能毫无
意义,但在与受到增强的行为产生关连之后,便成为动
物能够识别的行为讯号。每天我们都对许多习得讯号有
所响应,看到交通号志会停下或前进,电话响了会赶快
去接,在吵嚷街头听到自己名字会转头等等,这些都被
称为「讯号」(cues 或 signals)。
我们之所以习得这些讯号是因为与它们相关的行为
不断受到增强,例如接起电话铃声就会停止(铃声是负
增强物),然后传来对方说话的声音(说话声是正增强物,
或许该说这是大家所期望的),这些讯号(或称「区辨刺
激」(discriminative stimuli))具有预告或通知的作
用,让我们知道这时候可以出现过去曾获增强的行为。
反之,当这些刺激没有出现时,表现出这些特定行为将
不会获得增强,例如电话没响时,拿起话筒只会听到嘟
嘟声。
多数正式训练都把大部份的心力及时间投资于建立
区辨刺激,无论是操练新兵的军官或上训犬课的饲主都
是如此,让训练对象听令行事的指令,其实就是区辨刺
激。
 让对方听令行事

要狗坐下或要人停步并不足为奇,但如果在下令后
训练对象即刻动作而且动作迅速标准,那名叫人印象深
刻!这便是「服从」- 不只让对方表现行为,而且是在
讯号下达时即刻执行行为;心理学家称这种现象为「行
为受到刺激控制」,训练起来并不容易,需要遵循训练规
则,值得我们好好研究。
即使你压根不想使唤狗儿做这做那,这辈子也没计
划操兵,但了解刺激控制仍然会对你有所帮助。当小孩
到处乱跑,怎么叫也叫不过来,这代表你的刺激控制很
糟糕,而如果你是位上司,必须下达两三次指示下属才
开始动作,那么你的刺激控制便出了问题。你听过从自
己嘴里说出的话?「我已经告诉你千万遍了,不要再
________!」(空格里可能是:用力摔门、把湿泳衣放在
沙岭上或其它行为)如果讲了一次、甚至一百次都没有
用,这个行为则并未受到刺激控制。
我们可能以为自己做到了刺激控制,但其实不然。
当我们预期看到服从讯号或指令的行为却又不见反应
时,一个常见的反应就是加强讯号;侍者听不懂你说的
法文?那就再讲大声一点!这么做通常不管用,因为讯
号接收的对象必须能够认得这个讯号才行,否则不管是
大声喊叫或透过摇滚乐团的扩音喇叭喊,对方仍然只会
不解地望着你。
动怒是另一个面对指令失效时的反应,这种反应可
能管用的情况只有两个:当对方出现你不喜见的行为时,
或熟知讯号却没有出现熟练反应时。这时暂时置之不理
或表现动怒的样子,有时或许可能引发好的行为。
有时训练对象虽然出现正确反应,但反应却慢半拍
或动作慢吞吞。对指令反应迟钝通常是因为没人教导训
练对象必须迅速反应,当训练对象出现正确或迅速的反
应却未获正增强,没有机会学习迅速服从讯号对牠(他)
有利,这个行为便未受到真正的刺激控制。
生活中到处都是刺激控制不良的例子,当有人想伸
张权威时,很可能会有人因为「不服从」而惹上麻烦,
但真正的问题出于对方不明白或无法执行指令 – 沟通
不良或刺激控制的训练技巧不佳。
 建立讯号

传统训练师在训练之前便开始使用讯号,他们先说:
「坐下!」然后再压下狗儿屁股,让牠做出坐下的动作,
重复多次之后,狗儿为免继续被压而学会坐下,而且牠
在这过程里学会的是「坐下」二字代表一个牠可以避免
被链子抽的机会,只要出现坐下的动作就好,所以传统
训练使用的讯号或口令其实就是制约负增强物。
相较于传统的训练法,我们在进行操作制约时会先
塑形行为,毕竟,要狗儿去做一件牠不可能听懂的事情
毫无道理。等到行为出现的频率稳定后,我们才会在某
种特定刺激出现期间或之后塑形这个行为的出现,例如
我们会利用响片和增强物塑形坐下的行为 - 使狗儿迅
速坐下、动作不拖泥带水、坐得久而且经常坐下,有时
在草地上坐,有时在地毽上坐,符合多项增强要求 - 直
到牠为了获取增强物,极有自信的坐下。此时我们再加
入一个具有绿灯意味的讯号,表示一个出现特定行为获
取增强物的机会,这类讯号便成为制约正增强物:在它
出现之后绝对有好无坏。
加入讯号有多种方式:第一个方法是,你可以在行
为启始时加入讯号,当完成行为时予以增强,然后在不
同的时间和不同地点重复这么做,渐渐越来越早下达讯
号,直到讯号出现在行为启始之前,不久之后训练对象
就会把该讯唬视为出现特定行为即会被增强的机会,当
你说:「坐下!」必狗儿将会坐下。
第二个方法(也是我们用在海豚身上的方法),交替
运用「给讯号」和「不给讯号」。当狗儿经常出现坐下行
为时,对牠说:「坐下!」待牠坐下时即按响片。接着,
让牠坐下一两次但不按响片也不给赏,然后再说一次:
「坐下!」出现坐下动作时即予以增强;在同一段训练时
间里,你同时增强了听讯号的坐下行为,也使缺乏讯号
下的坐下行为消失。
一旦你的训练对象了解这例规则,新讯号几乎可以
马上与新行为联结。然而,当毫无经验的动物第一次学
习讯号时很可能会遇上困难,困难来自所谓「消弱」
(extinction)的过程。消弱是指过去一直受到增强的
行为不再获得增强,这是个不快的经验(请见第四章详
述),而且可能引发情绪反应。我曾经被海豚溅水溅得全
身湿透,因为牠很生气原本一直可以换取鱼吃的行为现
在竟然不管用了。
第三个加入讯号的方法是塑形对讯号的反应。如同
塑形行为本身一样,如果坐下是幼犬接受响片训练的第
一个行为,你可能会发现牠的动作比你还快,不断坐下
的动作几乎让你目不暇给,「这只狗一直」「对着『你』
胡乱坐下」响片训练者通常会这么描述这种现象,这时
便是加入讯号的最佳时机,牠已经准备好学习讯号,你
必须告诉牠何时坐下才管用,避免牠在你双手拿着大包
小包东西时自己跑到你脚边坐了下来。
拿出你的响片和零食,说:「坐下!」,只要牠的屁股
稍梢往地面沉下一点儿就按下响片,不要等到完成坐下
的动作才按。接着丢出零食让牠起身去捡食,再说一次
「坐下!」然后在牠完全坐下之前就按下响片;这个「坐
下」的讯号还可以加上手势或清楚的肢体动作,但按响
片当下即必须停止所有辅助讯号。
以这种方式训练,通常只要经过几次按响片给赏的
过程,即可出现依讯号出现的积极坐下行为。下一步,
说出:「坐下!」但等牠屁股完全贴地坐着才按响片(牠
才不会养成半蹲一下就起来的习惯),接着把其它一些熟
知的行为(或许是唤牠过来摸摸牠等行为)穿插在加强
坐下新讯号的练习之间。
最后一步则是塑形等候讯号出现的行为 -- 初时半
秒,然后一秒、三秒,直到狗儿显然把注意力放在你的
身上,但是未下达讯号前不会坐下。达到这个程度之后,
你便可以慢慢不用那些辅助讯号,只使用口头讯号,这
时讯号之下的反应已经受到操作制约,狗儿因为期望获
得增强而表现行为。
据我观察,这是建立个别讯号最快的方法,也最快
能够建立「讯号指示特定行为发生」的一般概念。在一
次训犬讲座上,有名女子带来一只刚从收容所领养来的
四个月拉不拉多幼犬,我利用星期六午餐时间协助她训
练幼犬的第一个响片行为 -- 趴下,如果我说这只幼犬
一无所知,完全没接受过任何训练,应该不会有人异议,
单单只是让牠注意到自己的行为可以影响零食的到来就
花了很长时间。
当天下午我们练习如何塑形出对讯号的反应,隔天
午餐时间这位女子和幼犬来到我身边,猜猜看这个幼犬
在二十四小时内学会了什么?坐下、趴下、翻滚、招来、
超级厉害的「击掌」
(牠把重心完全移到左半部身侬,直
直地把右前脚举到最高处),以及拾回的初级版动作,所
有动作完全按讯号行事,迅速确实而且正确无误,变换
讯号出现顺序亦然。除此之外,这只幼大变得神采奕奕、
专注、兴高采烈、全力以赴 -- 准备好不枉这一生。
 刺激控制的规则

刺激控制有四个层面。当狗儿学会听口令坐下(不
管使用哪种方法)之后,训练就结束了?不对,这个任
务只完成了一半,动物必须另外接受训练,而且这是一
项不同的训练任务 -- 学习在没有口令时不要坐下。在
制约刺激没出现时,动物不会出现该行为,否则该行为
的刺激控制仍未完成训练。
当然,这并不表示除非对狗儿下令坐下,否则牠必
须整天站着。训练对象在自己的其它时间里当然可以任
意行为,但是在训练或工作的情境中将会用到区辨刺激
(或讯号),这时若想要稳定的行为表现,就必须建立讯
号的两个层面:「何时进行行为」以及「何时不进行行为」。
达到理想的刺激控制有四项要件,训练时必须把每
一项当成个别目标,成为塑形过程中的独立部份:
1. 制约刺激一出现,行为永远立刻发生(叫狗儿坐
下,牠即坐下)。
2. 没有制约刺激时不会发生行为(在训练或工作情
况下狗儿从未自行坐下)。
3. 其它刺激出现时从来不会姿生这个行为(如果你
说:「趴下!」,狗儿不会坐下)。
4. 这个刺激出现时不会引起其它行为反应(当你
说:「坐下!」,狗儿不会出现趴下或跳起来舔你脸的反
应)。
只有在四要件都达成之后,狗儿才算真正、完全地
懂得「坐下!」的口令,现在你有了真正的刺激控制。
日常生活中,我们会在哪些地方使用或需要如此完
全的刺激控制呢?以音乐为例,管弦乐团指挥家常使用
极其复杂的刺激控制,因此在排演时他可能遇上各种错
误的反应,例如他可能示意要求「Forte」 (强音),加大
音量 - 但却无响应,或许原因是他还没有明确建立起讯
号的意义,或者他可能已经避免作出加大音量的讯号,
但是音量依旧过大,古典管弦乐团的铜管乐器部以此称
着,指挥家理查·史特劳斯(Richard Strauss)列出一
些挖苦年轻指挥家的规则,他说过: 「绝对不可用鼓励眼
神看着铜管乐手。」而业余合唱团常出现这种情形,指挥
家可能示意出现「Presto」
(急板),但音乐速度没加快,
音量却变大了,尤其是独唱男高音常出现这种状况。讯
号引发的每一个错误反应都必须经由训练更正,直到指
挥家对自己的刺激控制感到满意为止。
刺激控制在军队里也极为重要。新兵训练时以连珠
炮口令不断要求动作,重复操练不但非常耗费体力也很
耗时,在新兵看来这个做法似乎既困难又毫无意义,可
是它有个重要功能,它不但能使新兵对口令迅速反应,
让指挥官能够有效动员大批军人,同时也训练出「听令
行事」的技能,毕竟它不只是一种心态,也是一种习得
的能力,这对士兵而言极为重要,常有保命的作用。自
从军队存在以来,连珠炮口令操练一直是用来训练这种
能力的方法。
 哪种讯号?

区辨刺激可以是训练对象有能力察觉的任何事物:
旗帜、光线、话语、抚摸、振动或开香槟时的啵声,只
要训练对象能够察觉这个讯号,它即可拿来引发习得行
为。
海豚通常以手势训练,但是我知道有只眼盲的海豚
学会以许多行为响应不同的碰触方式;牧羊大通常以手
势和口令训练,不过纽西兰的乡间广阔,人们常用尖锐
的哨音当作讯号,它传递的距离比口令远。而当纽西兰
牧羊人把狗儿卖给别人时,新主人可能住在数哩之外,
由于哨音无法以书写方式描述,旧主人会以电话教授新
主人指令,或者给他哨音的录音带。
鱼类能够学会对声音或光线出现反应,我们都知道,
敲打水族箱玻璃或开灯时水里的鱼会很快地游近水面。
而人类几乎对任何束西都可以作为习得讯号。
在工作情境下,让所有训练对象学习相同的讯号是
很有用的,这么做其它人才能引发相同的行为。动物训
练师对于所使用的刺激通常相当传统,世界各地的马匹
被人踢马肚时都会往前走,缰绳一拉紧就会停步,美国
纽约布隆克斯动物园的骆驼听见「couche」
(法文「趴下」
的意思,音似「酷虚!」)口令时即会趴下,即使周遭的
人包括训练师在内都不会讲北非腔法文也无妨,大家都
知道这样才能让骆驼趴下,虽然那些纽约骆驼也能够学
会以趴下响应「宝贝,装酷吧!」这句话,但这没人在乎。
传统训练师往往没领悟到自己的讯号只是种习惯
(conventions)。有次我在一家寄宿马厩训练一匹年轻马
儿,用一条缰绳牵着牠教导「走!」的口令,马厩训马师
带着嫌恶的神情观看,最后他终于开口: 「妳不能这么教
--马儿不懂『走!』,妳必须说:『帖 - 提克!』」他一边
从我手中拿走缰绳,一边说: 「帖 - 提克!」并且以缰绳
另一端抽了一下小公马屁股。这个动作当然使牠开始往
前走,他说:「看吧!」但是他的行为正是习惯的实证。
从那时起我无论把我的马儿放在哪个马厩寄宿,我
都训练牠们不只对我的口令有反应,也对马厩训马师所
使用的「几地亚普!」 (giddyaps)、
「据!」
(gees)、
「喝!」
(haws)和「喔欧!」
(whoas)等口令有反应,这样可以
避免麻烦,而且也让他们认为以业余训马师来说我算是
相当有潜力,至少我没搞错这些讯号!
训练马儿遵从两套口令不仅有可能而且很容易,虽
然你希望一个刺激只引起一个行为,不过由数个习得讯
号引纵同一个行为绝对可行:例如,在挤满人的房间里,
讲者要求大家安静时可以大喊「安静!」、站起来单手比
出代表「嘘!」的姿态,或者当大家很吵时,拿汤匙敲敲
水杯也管用,我们都已被制约成对至少三种以上的刺激
响应出安静下来的同一个行为。
为习得行为建立的第二个讯号称为「转移刺激控
制」:先呈出新刺激(或许是新口令),然后呈出旧刺激
(例如手势),再对出现的反应予以增强,接着渐渐使旧
刺激越来越不明显,而同时将新刺激表现得极其显眼,
直到新刺激引起的反应和之前一样好,甚至可以完全不
再给旧刺激。这种转栘通常比训练第一个讯号来得快,
因为「出现这个行为」和「讯号出现时才出现这个行为」
的概念已经先行建立了,于是学习「另一个讯号出现时
才出现这个行为」的概念就会比较容易。
 讯号强度和淡出

初级刺激(未制约刺激)视刺激强度而定,能引发
不同强烈程度的反应;被针用力猛刺一下的反应会比被
轻扎的反应剧烈;声响越大声,惊吓的效果越好。不过,
一旦能辨认出习得讯号,便可以出现全然的反应,例如
看到红灯时停车,并不会因为红灯的大小而快一点或慢
点儿停。只要认出讯号,就知道该怎么做,因此当已习
得一个刺激讯号之后,不但可以转移它,也可以让它变
得越来越小、几乎无法察觉,却仍能引发相同表现的反
应,最后你将能够以极微妙的讯号引发反应,让旁观者
看不出端倪,这就是「淡出」刺激的技巧。
日常生活中我们常常用到淡出技巧,原本必须非常
大的刺激,例如:「迪弟,不可以把沙子放进别的小朋友
头发里。」一边把迪弟拖出游戏沙堆。随着时间过去,它
可能转变为一个小讯号,只要挑起一边眉毛或摇摇食指
便可以阻止迪弟这么做。
动物训练师有时能够利用淡出的刺激引发看来神乎
其技的反应,我曾在美国圣地亚哥野生动物乐园(San
Diego Wild Animal Park)看过一个很有趣的表演,一
只鹦鹉只要看见训练师手部的微妙动作即会爆棱歇斯底
里的大笑,你应该可以想象这有多么好运用:「帕特罗,
你认为这名男士的帽子如何?」 「哈哈哈…」由于观众没
看到讯号,这只鹦鹉唯一的习得行为看来就像聪明地给
了一个嘲讽苛刻的答案,牠其实只是对一个完全淡出的
刺激出现及时反应。任何聪明嘲讽的成分,应该归功于
训练者,或者设计对白的人。
我所看过最佳表现制约、淡出和转移刺激的例子并
不是在动物训练的领域,而是在交响乐团的排练上。我
以业余歌者的身份参与过多个歌剧和交响乐合唱团,它
们常由客座指挥家领团,虽然指挥家给予乐手的许多讯
号多多少少具有一致性,每位指挥家也有独特的个人讯
号,而这些讯号的意义必须在极短期问建立,因为排练
时问几乎不比演出时问长。有次排练古典音乐家马勒第
二号交响曲【复活】时,我看见指挥家建立一个代表「轻
声演奏」的无制约刺激,他作出听到警铃四起的神情,
躲避爆炸似地蹲伏着以单手蔽脸,大家都意会到动作的
意义,接下来几分钟内他已能够淡出刺激,只要他瞥一
眼提示并稍弯下身子,或者很快用手势比一下即可降低
任何一部合音的音量,最后只须稍微缩一下肩膀即可。
指挥家也常转移刺激,将已知姿势或大动作(例如
手心向上栘动代表「大声一点!」)与未学过的姿势(例
如偏头的个人特色或转身动作)作结合,我有次坐在位
于指挥家左侧的女低音部,看见这位客座指挥家只花了
一些时间即把控制女低音部音量的所有讯号全转移到他
的左手肘。
建立起刺激控制的一个结果是,如果训练对象想以
正确反应获得增强,尤其在刺激已淡出之下,它必须变
得很专注,事实上它到后来或许将能察觉极细微的讯号,
甚至连训练者也没意识到自己给了这些讯号。「聪明汉
斯」就是一个典型例子,这匹二十世纪初的德国马儿被
视为天才,牠能够以蹄抓地数数字、算术、拼字,甚至
能开平方根,答对时当然都会获得一点食物奖赏。牠的
饲主是位退休教师,他真心以为自己教会这匹马阅读、
思考、做数学及沟通,但事实是即使饲主不在场这匹马
仍会「回答」问题。
许多前往柏林研究聪明汉斯的学术人士皆确信牠是
天才,不过后来终于有一位心理学家证实牠是受到某个
讯号的提示,因为当全场无人知晓答案时,牠抓地的动
作会一直持续下去。更进一步的研究证实(虽然坚信牠
确为天才的人不断抗议),让马停止抓地的讯号是饲主或
其它出题者在看见抓地次数到达正确答案时,会稍把头
抬起一点儿,这个轻微的动作原本因为教师戴着宽帽而
格外明显,而如今它已成为非常细微的动作,不但几乎
看不出来(除了聪明汉斯以外),而且几乎无法以意志抑
制,所以这匹马即便是看到非饲主的人仍能分辨何时该
停止抓地。
(聪明汉斯『Clever Hans』现象)已经成为一个代
名词,指某些行为(有关动物智商或通灵现象)看似不
可思议,但其实是非意识讯号引岭的结果,因为测试者
一些微不足道的动作或已淡出的行为已成为行为对象的
区辨刺激。
 有效又好用的目标物

目标法是许多海洋哺乳动物训练师的最爱,几乎每
个海洋世界都可以看到目标物的使用,训练师伸出拳头
让海狮来碰,然后借着移动拳头让海狮跟随移动到表演
台的不同位置;海豚学会从水中垂直跳起来去碰一颗吊
在高处的球,有时两三名训练师会在池边各自站定,每
个人拿着球或伸出棒状软垫标的物,让虎鲸进行目标碰
触,于是连续从一处游到另一处。
对于刚开始学习增强训练的人而言,教导动物以鼻
头碰触棒子末端是绝佳的入门练习,这个行为不但看得
到也感觉得到,动物很容易即可获得增强,而且很容易
让人明白如何一点一点地提高增强要求标准:棒子离鼻
头两吋,离四吋,在左边,在右边,在上面,在下面,
再往前,直到这只动物(或鸟儿,或鱼儿)能跟随这根
标的棒移动。有家荷兰训犬学校的老板告诉我,某天早
上她以响片训练家猫去碰咖啡匙,然后便能够让牠跟着
绕了餐桌一圈,这个经验让她非常信服,马上把整个训
犬学校的方汰改为响片训练。
动物园利用目标法(加上响片和食物)让老虎和北
极熊移动到另一个栏舍,使懒猴和狐猴等小型动物停着
不动让医护人员进行治疗或检查,也利用目标法来分散
动物。圣地亚哥动物园行为馆馆长盖瑞·普莱斯特(Gary
Priest)拍了一段录像带,三只长颈鹿在学会碰触三个
不同的目标物后,训练者于是能够塑形牠们安静进入围
栏并容许人员进行修蹄的动作。
狗儿饲主更是活用目标棒,你可以使用目标棒教会
一只横冲直冲、无可控制的狗儿乖乖在脚侧随行,不必
抽扯牠的牵绳,也不必费心劳力地训练,只要慢慢拉长
「鼻子大约维持在此处即会得到响片给赏」的时间长度
就好。你可以把目标棒插在地上,利用它教导狗儿一出
现讯号便离开你身边,这是服从竞赛选手常觉得困难的
项目。你可以利用目标棒带着狗儿穿越障碍或进入新的
地方,警犬和搜救犬训练师常会利用雷射笔指示狗儿前
往特定区城,猫咪也根容易学会追逐雷射笔投射出的小
小红点,这是与足不出户猫咪玩耍或让牠运动的好方法。
当你的猫在你一下达讯号时即刻跳到冰箱上头(利用雷
射笔训练),你的客人们绝对会叹为观止。
对于有口语沟通障碍的人类,以标定讯号和零食达
成的标的训练一样非常有效!一位特殊教育的老师告诉
过我,她在看过海洋哺乳动物训练师使用目标物之后,
立即把目标法应用在自己工作上;有天她被分派指导一
名具有发展缺陷又极度活跃的小男生,他必须坐在桌前
完成作业,但是他们平常使用的教室正有人使用,所以
他们来到周围全是大球、摇椅和攀爬设施的体育室,小
男孩当然为上跑去玩,她不能抓着他,强迫他坐在桌前,
她也不想这么做,所以她伸出手心说:「碰碰!」男孩照
做了,她立即回答:「很好!」接着利用「碰碰!」和「很
好!」把他引导到椅子上坐好完成作业,中间不时穿插很
短的嬉戏时问(当你明白自己能够利用目标物等讯号让
训练对象回到身边时,你将会比较愿意利用自由作为增
强物!)。
我也曾经目睹利用目标物(包括教师的手和雷射光
点)协助严重低功能人士学习行走到教室、桌子或其它
目的地,完全出于自愿且无需肢体引导 - 这对学习者或
教师而言都是个获得解放的技巧。
 以习得厌恶刺激作为讯号

区辨讯号强度可能影响反应的唯一情况只发生于传
统动物训练,传统动物训练中使用的讯号(轻拉马缰或
牵绳、轻顶马腹)只是过去一些无制约刺激的减轻版(用
力猛扯绳子或踢马腹,为的是激棱尚未训练过的反应),
所以如果轻度刺激无效,加剧刺激似乎应该得到较大的
反应。不过实际这么做却会遇上问题。
习得讯号和初级刺激是两类不同的个别事件,训练
新手通常不明白这一点,例如当他们轻轻拉没有反应时,
他们就会多用点儿力,然后再继续用力,这一切只是徒
劳,因为马匹和狗儿同时也会增加往反方向拉的力道。
传统训练师常把讯号和暴力使用视为两码子事。他
们先给讯号,当没有获得服从反应时,他们不会慢慢加
重刺激,而是直接使用令动物极度不快的强烈刺激来引
发行为 - 强烈到足以(让牠恢复记忆)(一位训马师如
是说)。P 字链(收缩链)的训犬方法就是如此,在人们
学习正确用法之后,即使个头不大的人也可以利用快速
抽紧放松的动作把高大的大丹犬吓得魂飞魄散。有了这
个初级刺激在手上备用,很快便能发展出轻拉链子即出
现良好反应的结果。英国著名训犬师芭芭拉·伍德豪斯
(Barbara Woodhouse)指出,以长期来看,这个方法比
一直使用中度力道、无效轻扯拖拉着可怜动物的脖子来
得人道;不过,利用正增强塑形行为的方法当然更为人
道,而且无论就长期或短期来看都较有效率,现代训练
师都利用正增强和标定讯号(某些字句或响片)训练所
有过去以暴力达成的传统训大行为。
当某个区辨刺激可用来当作避免不快事件的讯号
时,它不但可以减少肢体控制或介入的必要性,而且即
使训练者不在场也可以抑制行为。我的边境梗犬在幼犬
时期很爱乱翻废纸篓,并且把纸篓里的垃圾散得四处都
是,我并不想处罚牠,但是我也不想得时常倒废纸篓。
于是,我在喷水瓶里装了水,加入几滴气味浓郁却
很怡人的香草精油,然后咬着牙勉为其难地朝牠的脸喷,
牠很不高兴地跑走。之后我在废纸篓喷了香草精,牠便
从此再没接近过废纸篓。牠并不讨厌这个气味,这个气
味刺激完全是中性,牠真正讨厌的是这个气味引发的联
想。为了维持牠不再接近废纸篓的行为,大约每三个月
就必须补充刺激浓度,在废纸篓上喷几滴香草精,但我
再也没有必要直接往狗儿脸上喷了。
让 狗 儿 待 在 隐 形 围 栏 系 统 ( Invisible Fence
systems)内,就是应用相同的原则。你在希望围住狗儿
的地域四周安置一条无线电线圈,让狗兄配戴装有接收
器的项圈,当狗儿太接近线圈即遭项圈电击,不过在这
之前,必须设定一个警告声,当牠接近距离电线几呎处
时项圈即发出警告声,这个区辨刺激即代表「别再继续
往前走!」。如果系统装设正确,它将可以有效围住受过
训练的狗儿,狗儿永远不会真的遭受电击。
我和我的梗犬住在森林里时曾使用过这个系统,当
时若使用真正的围篱,等同随时邀请牠设法在围篱下挖
洞或趁门没关时逃脱,这种使用制约警告讯号和隐形围
栏的方法安全稳当太多了。
 限定反应时间

想训练动物对区辨刺激出现迅速反应, 「限定反应时
间」(limited holds)是个非常有用的技巧。假设你的
训练对象已学会依讯号出现行为,但总是需要一段反应
时间,譬如喊大家吃晚饭,他们总是慢吞吞才来,或是
你示意停下来,但是你的大象只慢慢减速,最后才完全
停下来。如果你希望的话,其实可以利用「限定反应时
间」的方法塑形出较短的反应时间,直到对方在能力可
及范围内达到最短反应时间。
首先,算出一个过去反应时间的平均值,然后只增
强在这个反应时间内出现的行为;由于动物行为具有变
异度,有些行为会超过反应时间,这些行为将不再获得
增强。举例来说,叫大家吃饭之后,等一段固定时间就
上菜,晚到的人可能就必须吃冷菜或无从选择菜色。
当你设限反应时间,只增强时限内出现的行为时,
你会发现所有反应将慢慢集中在时限内发生,不再有拖
延的情形。全家人到齐来到餐桌的时间得花十五分钟?
现在,你可以再缩减时限,在叫大家吃饭后十二分钟就
上菜,共或十分钟。逐步减缩时限的步调完全依靠判断,
如同塑形原则一样,你希望行为发生于设定的时限范围
内。
动物和人类对时间都极为敏感,在反应时间受限时
都将出现极其准确的反应。但是训练者若希望有效利用
限定反应时间的技巧,则不应该依赖胡乱猜测,应该使
用时钟或甚至秒表。假如行为反应时间比钟表可测的时
间单位更短,你可以利用默数,例如使反应时问从一、
二、三、四、五缩短至一、二。当然,训练对象若是人
类,只要着手去做,静待它发挥成效就好。
60 年代海洋生物世界最让人惊艳的表演秀高潮之
一,是由六双小飞旋海豚(spinner dolphins)同步演
出多种腾空花式动作,依照水底声音讯号的变化而做出
各式跳跃旋转。训练初期,无论要牠们跳跃、翻转或做
其它动作的讯号出现时,牠们各自在十五至二十秒之间
此起彼落,动作很不整齐。于是我们利用秒表和限定反
应时间的技巧把反应时间压缩到两秒半,让每只海豚都
知道如果想吃鱼,牠必须在讯号出现之后两秒半内跃出
水面,做出正确的跳跃或翻转动作。后来,每只海豚全
都专心一意地待在水底喇叭附近,当讯号一出现,海豚
立即从水中爆冲而出,跃入空中扭转翻滚,场面相当壮
观。有一次,我在观众席上无意间听到一段很好笑的对
话,一位看来像教授的人斩钉截铁地告诉同伴,要获得
这种准确无误的反应,唯一的作法就是利用电击。
限定反应时间的日常应用,即在要求或指示下达后
你愿意花多少时间等待响应,如果家长、上司或教师在
限定反应时间之后从一而终,他们通常被认为很公平,
而且说话算话,即使限定的反应时间(行为必须在时间
内出现否则不予增强的机会窗口)相当短也无妨。
 预期心理

「预期心理」是一个刺激控制常见的问题,训练对
象学会了讯号的意义之后,将会迫切想提供行为,因而
在讯号尚未实际出现前即出现行为,这种现象称为「鸣
枪前偷跑」,源自人类赛跑比赛时因预期心理而出现的行
为。那些在他人给予讯号或要求之前即行动的人通常被
视成过度急切、奉承讨好或阿谀奉承,这种习性令人生
厌,并不是种美德。
参加服从竞赛的杜宾犬有时会遇上这类困难,虽然
牠们是极易训练的狗,但是牠们极其警觉,只要预期的
指令出现一点点端倪即能察觉,于是常在指令实际出现
之前出现动作,因而惨遭扣分。参加小牛套索马术竞赛
的马匹也常见这种预期心理的问题,牛仔和马匹原本应
待在隔栏后方,等待小牛先跑出去,但马匹常会在过于
兴奋的状态中没有等到讯号下达即冲出去。牛仔有时会
认为这真是匹好马,但是实则是这匹马儿尚未达成刺激
控制的训练。另一个常见预期心理出现的例子是美式足
球的「越位」犯规动作,在开始踢球的讯号下达之前,
某名球员由于心急而跑入对手防守区域之内,导致所属
球队必须受罚。
利用「暂停」的处置可以改善预期心理的问题。若
你不想再见到训练对象因为预期讯号而出现动作,你可
以停止所有活动,整整一分钟内什么都不做,不给任何
讯号,每次训练对象太早出现行为时就停下来,然后再
重新开始,让过度急切的行为导致下次表现的机会延后
出现,因而惩罚了过度急切的行为。这种方法可以有效
消除预期心理,然而如果处以责骂、惩罚或多次重复动
作却可能毫无效用。
 利用刺激作为增强物:连锁行为

在制约刺激建立之后,有件有趣的事会发生 –这个
制约刺激变成了一个增强物。以学校下课的钟声为例,
钟声代表「下课了,你可以出去玩啰!」的讯号,不过它
也会被视为增强物 – 孩子们听到钟声会很高兴,如果
可以让钟声早点响,他们绝对会这么做。现在想象一下,
要是下课钟声必须等到教室安静下来才会响,状况会是
如何?每次接近下课时间,你将发现教室变得异常安静。
区辨刺激代表获得增强的机会出现了,所以它成为
训练对象乐于见到的事件,而这个事件本身即具有增强
作用,意谓你其实可以把「引发某个行为的刺激」作为
另一个行为的增强物。举例来说,如果我对猫咪说「过
来!」,然后给牠一点零食奖励牠过来的行为,牠将学会
这个口令而且也会照做,日后我每次碰巧看见牠坐在壁
炉台上时便叫牠过来并奖励牠,很快地,猫咪将因为想
吃零食而跑到壁炉台上待着(请记住:从猫咪的观点来
看,是牠在训练我,牠发现了一个让我说「过来」的方
法)。假设找接着想教牠在我手比着壁炉台时牠就跳上
去,并利用食物或「过来!」口令增强这个行为,以后我
遇到以下情况即可指着壁炉台:(1)我知道牠肚子饿的
时候。(2)牠刚好躺在地上四脚朝天的时候,或者任何
其它情况。我所训练出来的是一个连锁行为。
我们在日常生活中常出现一长串的连锁行为,例如
木工和家务,都是由许多熟知步骤所构成的一连串行为。
而我们对动物也有一样的期待:要求牠们「过来!」、「坐
下!」、
「趴下!」、
「跟好!」等长串连续动作,这种长串连
续的行为是「连锁行为」,不同于「长时间维持的单一行
为」(维持一小时或做一百次)。连锁行为可以很容易维
持,表现不会变差或延迟反应时间,因为每一个行为其
实都被下一个行为的讯号或出现机会所增强,直到所有
行为完成,最后才获得奖励。
连锁行为可分为数种:由重复发生的同一行为所构
成的「同构型连锁行为」(Homogeneous chains),例如
马匹连续跳过一连串同型跳跃障碍物;以及由不同行为
构成的「异质性连锁行为」(Heterogeneous chains),
待最后一个行为完成之后方获增强。
正式的狗儿服从竞赛多半属于异质性连锁行为,例
如中级竞赛项目:(1)主人把哑铃丢到跳跃障碍的另一
边时,狗儿必须坐在主人脚侧。(2)一听到讯号即跳越
障碍。(3)找到哑铃,把它咬起来。(4)衔着哑铃回头
并跳过障碍。(5)坐在主人面前,等主人拿走哑铃。(6)
听讯号回到主人脚侧,竞赛时这些连续行为的顺序通常
一成不变,不过你可以先个别训练单一步骤,或在训练
其他连锁行为时顺便练习同样的步骤。
连锁行为的行为顺序并不重要,但它有三点要素:
(1)构成连锁行为的个别行为紧凑发生,没有耽搁。
(2)
这些行为由来自训练者或环境的讯号主导。(3)等到整
个连锁行为完成才出现初级加强物。
无论狗儿参加打猎竞赛或赶羊竞赛,每次参赛的习
得行为出现顺序或许会因环境不同而大肆更动,然而在
牠拾回雉鸡或把羊只全赶入栏内时,整套的连锁行为最
后才会获得增强。
连锁行为之所以能够出现是因为个别行为都曾被增
强,而且都受到刺激控制(即完全依讯号行事),于是这
些保证增强物一定会出现的习得讯号可用来维持连锁行
为的个别行为。讯号可由操作手给予,牧羊人以哨音告
知牧羊犬转弯的方向、行进速度、何时停下和何时回头;
讯号也可由环境提供,参加服从竞赛的狗儿在跳越障碍
之前,眼前出现的哑铃便是要牠拾起来的讯号,而拾起
来的动作是回到操作手身边的讯号,看到障碍物则又是
跳越的讯号,主人不必为这些连锁行为中的个别行为提
供口头讯号,可是讯号早已存在。
有时,前一个行为就是下一个行为的讯号。我最近
刚搬到一个新城市,找了一处新家也设置了新公司,我
把新地址、新电话号码、新传真号码和新的电子邮件账
号全背了下来,但是有好几个月,我没办法从这一连串
的数据中抽出片段数据告诉他人,直接问我邮递区号是
多少,我肯定当场被考倒,除非让我先背出镇名和州名,
接着我才能顺利背出邮递区号。电话号码也是如此,我
必须先说出区域号码才能背出其余的号码 -- 这就是一
种内建讯号的连锁行为。
我们每天所做的许多事(如冲澡后穿上衣服)都是
这类连锁行为。行为分析学者发现教导具有发展缺陷的
人们时,仔细建立依讯号行事并获增强的连锁行为对于
这些人的独立或半独立生活技巧有极大帮助。
我们都看得到连锁行为的用处及效用,但是我们常
看不出来的是,我们眼中所见的错误行为常只是连锁行
为瓦解后的结果。我帮训犬师上操作制约课程时曾听过
许多他们在狗儿没做对时的解释: 「这只狗很顽固。」、
「牠
只是企图报复我。」、「牠很紧张/发情了/刚发情结束。」
或其它说法。其实牠的犯错,只是训练者建立或维持连
锁行为不力的结果。
当构成连锁行为的行为当中,有一些未学成的行为
或尚未受到刺激控制的行为时,这个连锁行为便会瓦解
崩离。当训练对象不懂得讯号或无法达成讯号所要求的
行为时,你便无法利用这个讯号增强,这代表每个连锁
行为都应该倒过来训练,从最后一个行为开始训练。先
确定训练对象已经学会这个行为,而且也能辨识出引发
这个行为的讯号,然后再训练倒数第二个行为,如法炮
制直到完成所有行为。当你想背一首诗、一段音乐、讲
稿或台词时,把它分成五个段落,把次序反过来,从最
后一段开始背起,从自己最弱的部份背到最熟练的部份;
相反的,若依照记忆内容原先撰写及呈现的顺序开始背
诵,你便必须不断从熟悉的段落背到较为困难且未知的
段落,这种经验让人极无成就感。以看待连锁行为的方
式处理背诵一事,不仅可以缩短所需的记忆时合,也能
让整个背诵过程变得较为愉快。
连锁行为是个独特奇怪的概念,我自己也曾经因它
大感挫折,觉得自己已经无计可施了,却还是没办法让
某只动物、某个小孩或自己去进行一些显然并不难的连
锁行为,直到我领悟到原来我一向把连锁行为的训练顺
序弄反了。
加上糖霜装饰是做蛋糕时的最后一个步骤,如果你
想让孩子喜欢做蛋糕这件事,你的第一步应该是在装饰
糖霜时请他们来「帮忙」

 教狗儿玩飞盘:一个连锁行为的例子

我有一位住在纽约市的朋友,每个周末都带他的黄
金猎犬到中央公园玩飞盘,他告诉我,生活中似乎到处
是束手无策、不知如何教狗儿玩飞盘游戏的人。这真是
一件可惜的事,因为对居住在都市里的大型犬而言,玩
飞盘是绝佳的运动方式。飞盘虽的速度比球慢得多,移
动的方向也较飘忽不定,或许更接近真正的猎物。激励
狗儿跃入空中做出花式飞接让饲主感到很有趣,而且玩
飞盘时饲主可以站在原地,却仍能让狗儿来回奔跑。
饲主常见的抱怨是,当狗儿受到鼓励,也就是看到
飞盘挥动时,牠会跳起来试图咬飞盘,但是当他们把飞
盘丢出去时,狗儿只站在原地看飞盘飞走,牠或许会去
追它、咬住它,但是从来不把飞盘拿回来。
飞盘游戏有两个训练关键:第一、狗儿追逐飞盘的
距离必须慢慢以塑形拉长。第二、这个游戏是种连锁行
为:狗儿去追飞盘,然后咬住飞盘,最后衔着飞盘回来,
等待下次丢出的机会。所以每一项行为都必须分别训练,
而且这个连锁行为的最后一步 -- 衔回飞盘的行为 --
必须第一个训练。
你可以先从极短的距离(甚至从室内开始)训练衔
回,利用很容易衔住的东西(例如)(旧袜子)作训练,
猎犬犬种几乎都会自动自发地衔回,但是其它大种(如
斗牛犬和拳师犬)
则必须小心塑形出放下飞盘或交还给人的行为,因
为牠们通常喜欢玩拔河游戏。
在狗儿能够依讯号衔回东西并且还给你之后,你再
塑形牠接飞盘的动作。首先在狗儿面前晃动飞盘,让狗
儿兴奋不已,重复给牠飞盘再拿回来,当然,当牠把飞
盘还回来时一定得疯狂赞美。然后把飞盘拿在半空中,
当牠跳起来咬时就给牠,再让牠还回来。接着把飞盘短
暂地丢入空中一秒,如果牠接到了飞盘就大肆称赞牠。
当牠有了接飞条的概念之后,你可以开始塑形这个连锁
行为的第一步 --- 追飞盘;把飞盘往上丢,丢到离你一
两公尺处,让狗儿必须跑去追它才接得到。
现在你的狗正朝着可能成为超级飞盘狗之路迈进。
在距离渐渐拉远之后,狗儿必须学习观察飞盘走向并且
找出接飞盘的最佳位置。这需要多多练习,所以要训练
牠去接二十五呎远的飞盘可能得花上一两个周末。学习
迅速的狗儿最后将能够精通接飞盘的技巧,丢得再远也
接得到 --- 美国飞盘狗明星「艾诗礼·惠比特」(Ashley
Whippet)接得到飞越一个足球场的飞盘。狗儿似乎对自
己的特长感到沾沾自喜,当牠们表现出色或做出漂亮的
越肩飞接动作时,观众发出的欢声喝釆也让狗儿神釆飞
扬。然而,狗儿接到飞盘后之所以会返回,是因为这个
行为是这一连串连锁行为中最早开始训练的,而且这个
最后步骤将带给牠增强(你可能会称赞牠或再度掷出飞
盘)。
当然你也会发现,若是牠好几次带回飞盘而你却没
称赞或掷出飞盘时,这个衔回的行为将会每况愈下。此
外,当狗儿累得不想再玩时,牠衔回的动作将闲始蹒跚,
不是衔回的速度变慢就是在途中丢下飞盘,这代表你必
须赶快停止游戏 --- 你和牠都已经玩够了。
 类化刺激控制的概念

对于多数动物而言,起初建立刺激控制时都必须花
些时间,但是通常到了建立第三个或第四个行为的刺激
控制时,你将会发现动物似乎已能开始类化,或者已经
了解它的概念。等到牠们学会第三个或第四个讯号控制
的行为之后,多数训练对象似乎已体认到特定事件的出
现是种讯号,每个讯号代表一个不同的行为,能否获得
增强视牠能否辨识出讯号并出现正确反应。自此之后,
要建立习得刺激将易如反掌,动物已经有了概念,牠只
需要学习辨认新的讯号并且联结它们到正确的行为上即
可。身为训练者的你必须尽可能让过程清楚明白,这么
一来,日后训练起来将比当初刚闭始训练时的费力步骤
快得多。
人们的类化速度更快,甚至只要奖励他们对一个指
令产生反应,他们为了获得增强将很快对其他指令也产
生反应。我的朋友「李」在纽约市较差的地区教小学六
年级数学,每当新学年开始他总是先训练学生听从他的
请求不吃口香糖。他不利用胁迫,只说:
「好,大家注意,
我们第一件要做的事是从嘴里取出口香糖,做得好!噢!
等一下,朵琳嘴里还有一些口香糖…… 太棒了!她取出
口香糖了,大家为朵琳鼓掌欢呼!」他也教学生课后再吃
口香糖(以「下课!」二字作为增强物),这么做或许看
来无关紧要,甚至很无聊(不过这倒省得李看着一群嘴
巴嚼来嚼去,他最讨厌上课时这样),可是他发现这样的
训练使学生意识到,响应老师的请求之后即可能获得增
强。
当然,如同一位好的虎鲸训练师,李也利用各式不
同的增强物,除了好成绩和他给予的认可之外,也使用
游戏、同僚认可、提早下课的特权,甚至给他们免费的
口香糖。当然,他起初花了不少时间在口香糖上,他把
它分成小段,一小段一小段地拿来用,他的学生都认为
他对口香糖有种奇特的偏执,不过这些孩子也学习到,
这个人言出必行,达到他的要求代价也不错,所以大致
来说他们都变得反应颇佳且很专注。
其它老师认为李有种让学生安静下来的天生本领,
校长认为他是个「纪律分明的人」,则认为这些孩子很聪
明,举一反三不成问题,他乐见其成,而且他也乐见不
吃口香糖的学生。
 习成前低潮及发怒

让行为受到刺激控制的过程中,常出现一个有趣的
现象,我称之为「习成前低潮」(prelearning dip)。当
你塑形出某个行为,正进行刺激控制的训练时,突然间
训练对象不但对该刺激毫无反应,而且完全不反应了,
牠的样子就像从未听闻过这个你之前已塑形出来的行
为。
这可能使训练者极度挫折,本来你已经厉害地教会
鸡跳舞,现在你想训练牠只有当你举起右手时才跳舞,
但牠却只是看看你的右手却不跳舞,或者当你给讯号时
牠可能站着不动,没给讯号时反倒热情乱舞。
如果把这个过程缯成图表,随着正确反应率(即讯
号出现才产生反应的比例)逐渐增加,你将看见一条缓
慢爬升的曲线,接着,当正确反应率掉到零时,这条线
便会突然跌至谷底(遇到多次毫无反应或错误反应)。但
只要你持之以恒就可以等到训练对象开窍,突然间,牠
会从完全失败的情形一下跳升到极佳的反应 --- 你一
举起右手,鸡立即起舞,这个行为已经受到了刺激控制。
依我看来,这个现象是因为起初训练对象学习某个
讯唬时并未真正意识到自己的行为,训练者只看到正确
的反应缓慢增加,出现令人振奋的行为倾向。然后训练
对象注意到那个讯号。理解到该讯号与获得增强有某种
关系,这时牠全神贯注在这个讯号上,而不是想着出现
行为,当然就不会出现反应,也不会获得增强。如果训
练者持之以恒,一试再试,刚巧讯号出现时它再度出现
行为而获得增强,训练对象就会「有了概念」,自此以后
它便「知道」讯号代表的意思,并且会自信满满地出现
正确反应。
我知道我丢出了一些诸如「意识」和「知道」的字
眼,用以描述训练对象脑袋里的状况,然而多数心理学
家并不乐见这些字眼用在动物身上。训练动物时,如果
见到正确反应逐步增加,但未发生任何重大事件,有时
的确很难判断这只动物何时(或甚至是否)已经意识到
自己的行为。不过,当出现习成前低潮时,我认为它是
意识转变的讯号,无论是哪个物种都一样。我曾看过夏
威夷大学研究学者麦克.沃柯(Michael Walker)研究鲔
鱼感官区辨的实验数据,它明白显示习成前低潮(因而
出现了某种程度的意识转变);鲔鱼虽然是智商较高的鱼
类之一,不过毕竟牠不过是条鱼。
习成前低潮期间对训练对象可能极为挫折,我们都
知道勉强挣扎做着一知半解的事情(常见例子是数学概
念),却心知肚明自己根本不太懂时,那有多令人不安。
训练对象因此常感到甚为挫折而出现愤怒及攻击行为,
小孩嚎啕大哭并用铅笔猛戳数学课本,海豚跳出水面再
用力以身体侧击水面,不断溅出水波,马匹把尾巴左右
摆动并作势想踢,狗儿则发出低吼。沃柯发现训练刺激
控制时,如果他让鲔鱼出错,每次只要超过四十五秒没
获得增强,牠们就会生气地跳出鱼缸。 我称此为「习成
前低潮发怒行为」(prelearning tempertantrum),就我
看来训练对象之所以发怒似乎是因为它一直以为对的事
突然变成不对了,而且此时并未出现清楚明白的理由。
人类习成前发怒行为似乎常发生于长期信念受到挑
战、而且心里明白新信息陈述部分事实的时候,当人们
理解到自己过去所学并非全然为真时似乎会猛烈反击,
出现反应过度的情形,逾越当下合宜出现的异议、讨论
或质询行为。我在科学学术会议上谈论增强主题时,有
时候会引起诸多出乎意料的敌意,包括认知心理学家、
神经学专家和一位英国主教,我常怀疑这些愤怒的字眼
其实就是习成前症状。
我看见习成前发怒行为出现时总是感到难过,即便
对象是鲔鱼也一样,因为运用得当的训练技巧应该能够
带领训练对象适应学习上的转换,不致引起极度挫折。
不过,找把习成前发怒行为视为一种强力指标,它代表
真正的学习行为终于即将发生,如果你能袖手旁观,让
它如暴风雨般来了又去,天空的另一端或许便会出现彩
虹。
.
 刺激控制的用途

没有人需要整天利用讯号控制他人或被人控制,生
物并不是机器,我们也没有必要指使全世界,如果孩子
们东摸西玩而你也不赶时间的话,那就慢慢来吧。已经
辛勤工作的员工并不需要命令或指导,以没有必要存在
的规定包围自己或他人毫无意义可言,这么做只会滋生
反抗心理。事实上执行习得讯号的反应必须花费气力,
如果不断要求对方持续执行,这样不但不应该,对方也
做不到。
刺激控制显然能够教出愿意合作的孩子、听话服从
的宠物及可信赖的工作人员等,极度特定的刺激控制对
许多团体活动(如行进乐队、舞团表演及团体运动)也
不可或缺,对于复杂习得讯号出现反应时可产生一些成
就感,甚至连动物似乎也乐在其中。我认为这是因为如
同在连锁行为中一样,这些讯号都变成了增强物,所以
当人或动物精通所有行为和讯号之后,反应的执行带来
很大的增强效果,简而言之,它成为很有趣的一件事,
因此参与讯号控制下的团体活动(如跳方块舞、打足球、
团体唱歌或演奏乐器等)成为很有乐趣的一件事。
当我们看到行为受到绝佳刺激控制时,例如对于美
国海军蓝天使中队喷射机特技飞行表演或教室里秩序良
好的儿童,我们的称赞常着重于服从纪律的行为:「他们
真的纪律严谨。」或「那位老师很懂得如何维持纪律。」
然而,
「纪律」二字隐含着处罚之意,如前述所见,建立
刺激控制时处罚相当没有必要。
一般流传的观念是,
「纪律执行者」指的是一心只求
完美、未达完美即施以处罚的教练、家长或训练师,而
非指那些朝着完美目标逐渐出现进步即施以奖励的人,
因此一心想建立「纪律」的人常易试图以「照我的话做
否则……」的方式获得刺激控制,由于训练对象必须犯
下错误或不服从后才能知道那个「否则……」是什么,
而且这个行为早已覆水难收,这个广为使用的方法并没
有什么成效。
真正高超的刺激控制是利用塑形法及增强而建立,
它出现的成效可能被我们视为纪律的表现,不过真正应
该严守纪律的人却是训练者。
没错,那么从何开始着手呢?如果你的周围全是一
些一再忽视讯号、不予理会的人该怎么办?以下是我遇
上一个棘手例子时,有效致使改变所使用的方法:
(我看见一位来家中作客的年轻人把湿泳衣和湿毛
巾放在客厅沙发上)
我: 「请把湿东西从沙发上拿走,放到干衣机里。」
年轻人: 「好啦,马上会去做。」
(我走到年轻人身旁站着,不出一语)
年轻人: 「妳怎么了?」
我: 「请把湿东西从沙发上拿走,放到干衣机
里。」(注意:我没有加上「现在」、「马上」或「我不是
开玩笑的」等字句,我要训练这个人一听到请求就去做,
而不是等到这个讯号被进一步时讯息或威胁加强之后才
这么做。)
年轻人: 「哎哨,妳这么急的话,为什么不自己去
做?」
(我和善地微笑不语,等着加强那个我希望看见的
行为,顶嘴不是我想看到的行为,所以我不予理会。)
年轻人: 「好啦,好啦!」 (他站起来,走向沙发,
把东西拿起来,丢到洗衣间里。)
我: 「放到干衣机里。」
(年轻人一边咕哝、一边把东西放入干衣机。)
我: 「谢谢你!」(诚恳地、不带讽刺地对着他
笑)
下次当我想请这位年轻人做事时或许只需要看着
他,他便会去做了。不用多久他将成为家中另一位迅速
响应我的请求的人,而我也会公平地做我该做的事 ---
响应他合理的请求,也会留意不对他过份要求。
若能了解不须大吼大叫或逼迫也能获得刺激控制的
方法,大家(无论是训练者或训练对象)都乐得轻松。
我女儿盖儿高三时担任班上戏剧表演的导演,每年都会
指派一名学生担任这项工作,她有约男女各二十名的庞
大卡司,过程进行很顺利,演出也极为成功。演出最后
一天他们的戏剧指导老师告诉我,她很惊讶排练过程中
盖儿从没骂过人,通常学生导演都会骂人,但盖儿从不
曾这么做。我不加思索地脱口而出:「那当然,她是动物
训练师。」找从老师的表情领悟到自己说错话了 - 她的
学生并不是「动物」!不过,我的意思当然只是表示,盖
儿应该知道建立起刺激控制并不需要多余的夸张作法。
明白如何作刺激控制的人,会自制避免给予任何无
用的指示、无理的要求、无法理解的指令或无法达成的
命令,如果他们无法贯彻指令的执行,他们便不会给予
指令,他们总是清楚明白地告知期望,也不会因为反应
很差而大发雷霆,他们不会以唠叨、骂人、嘀咕、强迫、
乞求或威胁的方式达到目的,因为他们没有必要这么做,
而当你要求他们时,一旦他们答应了,他们一定会去做。
当你让全家人、同住一屋的人或整个公司的人受到真正
的刺激控制时--- 所有人都遵守约定,只说必要的话而
且言出必行,它的高工作效率、下令的低必要性及迅速
建立互信的情形将极令人赞叹。好的刺激控制不过就是
一种真正的沟通,它是一种诚实又公平的沟通,也是正
增强训练当中最复杂、最困难也最高超的一环。
.
第四章. 反训练·用增强去除不想要的行为
.
现在你已经知道如何建立新的行为,那么如何去除
现在存在的不良行为呢?.
....人类和动物总是会做一些我们不希望他们做的
事,孩子在车子里鬼叫又吵架,狗儿整晚吠个不停,猫
咪抓坏家具,室友到处乱丢脏衣服,亲戚老是打电话找
喳指使,这些都是我们不喜欢的行为。.
....去除行为的方法有八招,只有八招而已!无论
是室友生活习惯不佳的长期行为问题或是小孩在车内吵
闹的暂时性行为问题,任何用来对付问题的方法都脱不
了其中一招的变化运用(这里不针对诸如精神病患或危
险狗儿无可预测的复杂多重行为问题,我指的是单一不
良行为)。以下列出这八招:.
第一招:毙了他(牠)。(这招绝对有效,你将永远
看不到到这个人或这只动物。).
第二招:处罚。 (大家最爱用这一招,虽然它几乎很
少有实际成效。).
第三招:负增弦。
(当喜见行为出现时,即移除令动
物不快的事物。).
第四招:消弱,让行为自行消失。.
第五招:训练一个不兼容的行为。
(这招对运动员和
宠物饲主特别好用。).
第六招:训练这个行为只依讯号出现。
(然后永远不
给这个讯号,这是海豚训练师用来去除不良行为最高段
招数。).
第七招:.塑形出行为的消失,增弦任何不是该行为
的行为(这个友善招数可以让讨厌的亲戚转变为相处愉
快的亲戚。).
第八招:.改变动机。
(这招最为根本,也最为友善。).
.
....你可以看到以上有四个「坏心眼」招数(即负
向作法)和四个「好心眼」招数(即利用正增强的方法),
每招都有它的作用,以下我将一一介绍每一招的优缺点,
并提到该招数奏效的情境故事,我也会列出一些常见的
行为问题(例如爱吠叫的狗、老爱生气的另一半等等) ,
并且举出如何以每一招应对的实例。.
....我并不推荐所有招数,例如,我认为为了解决
狗儿整夜吠叫的问题而让默医割掉狗儿声带(第一招)
的方法很差劲,虽然当我舅舅的邻居抱怨他养的海狮吠
声太吵时,我勉为其难地让他这么做,但我的看法仍然
不变;当然,很少人会把海狮养在自家游泳池里,以当
时情境来看或许这是最好的方法。.
....我没办法告诉你想要去除讨厌行为时到底该用
哪一招,你是训练的人,你必须自己决定。.
.
 第一招:毙了他(牠)!

这一招永远不会失效,你绝对不会再度看到对方或
那只动物出现行为问题。事实上对于狗儿咬死羊只的问
题,它是全世界唯一认可有效的方法。.
死刑便是第一招的应用,无论死刑带有什么道德或
其他涵义,当凶手被处决之后,他当然不可能再度犯案,
第一招以除去行为者的方式暂时性咸永久性地去除行
为。.
开除员工、离婚、受不了肮脏室友而换室友都是应
用第一招的方法,虽然换人之后或许会产生新的问题,
但是做出特定行为而令你受不了的人已经消失,而那个
行为也随之消失。.
第一招相当严厉,当行为造成极大反感,叫人无法
忍受而且似乎不太可能轻易改变时,这一招有时便很适
用:举例来说,若父母(配偶或子女)施予家暴,人们
有时会真的动手除掉对方,在危及性命的自卫情况下,
这个作法可能无可厚非,而离家是另一解决办法,也较
为人道。.
我养过一只习惯特殊的猫咪,牠会在半夜偷溜进厨
房,跑到炉口上尿尿,第二天当我们不知情而点燃炉子
时,那尿味可真够熏死人。这只猫咪可以自由进出屋子
内外,我从没当场逮到牠这么做,当我们把炉口盖起来,
牠就直接尿在盖子上。我没办法分析出牠的动机,最后
我带牠去收容所安乐死了,这是第一招的作法。.
第一招有许多简单常见的应用方法:大人要求打扰
谈话的小孩回自己房间、把爱追车的狗拴起来、让犯罪
的人坐牢一阵子……等,我们常把这些方法误认为处罚
(第二招),事实上这些却全属于第一招,这些去除行为
的方法主要是限制了这些人的行动,或让这些人消失,
让他们无法出现该行为。.
在第一招的方法中,有一个必须知道的要点:这种
方法并没有教会对方任何事情,无论是限制行动、关起
来、离婚或坐电椅,这些都没办法教会对方到底该做什
么事。小偷坐过牢以后应该会三思而后行似乎很合理,
但事实通常很少如此,只有当他被关起来时我们才能确
定他无法偷走你的电视。.
如果某个行为能获得某种增强,而且引发这个行为
出现的动机和情境都存在的话,这个行为便很可能会出
现。.
当人或动物的行动受限时,他或牠并没有重新学习
行为,一旦解开狗儿的拴绳,牠马上又会去迫车子。你
无法修正并未发生的行为,被关在自己房里的小孩可能
学会了憎恨或害怕你,但是并未学会参与社交谈话的礼
貌。.
不过第一招也有其用处,这个通常最为实际的解决
方法并不一定都很残忍无情。我们没时间训练或监督对
方时,常会暂时使用限制活动范围的方式,把婴儿放在
摇篮或婴儿车上让他们自己玩,多数婴儿在短时间内并
不会抗议。而现在大部分人都让宠物犬整天待在屋里,
于是让幼犬待在运输笼里已经成为辅助训练大小便的标
准作法,狗儿喜欢睡在舒适的独享空间里,牠们多半很
快把笼子当成家,白天会自动进笼休息。.
即使是年纪很小的幼犬也不喜欢把睡处弄脏,所以
无法看着幼犬时把牠关起来可以减少乱大小便的情
况·而且这通常代表当你把牠从笼内带出来时,牠刚好
需要来趟教育之旅,学习到院子里上厕所会获得增强。
如果关的时间较长,常见作法是把幼犬放在围栏里,地
上铺好报纸,把门半开的运输笼放在一角,让牠有空间
跑跳,玩一玩,需要上厕所时可以出笼,清理起来也不
难,至少没人在家时牠无法跑到地毯上留下尿渍。.
.
第一招:毙了他(牠)!
第一招确实能将问题解决,但它并不一定是每个情
况的最佳解决办法。.
行为 解决方法
室友 换室友。.
到处乱丢
脏衣服
狗在 毙了牠:把牠卖掉;谓兽医割掉声带。.
院子里整
夜狂吠
孩子 让他们走路;让他们坐公交车;请别人
在 车 里 太 开车。

老公 离婚。
或老婆回
家时情绪
总是很差
网球 不再打网球。.
挥拍动作
有问题
员工 开除他们。
回避工作
责任或濑

讨厌 不要写谢卡,这样大家以后可能就不会
写谢函 再送礼物给你,也没必要再写谢卡了。.
猫味 把猫咪关在屋外或把牠送走。
跳上餐桌
公交 下车,改搭另一辆公交车。
车司机粗
鲁无礼,
让你很生

你认 坚持拒绝。
为应该自
立的成年
子女想搬
回家住
 第二招:处罚

这是人类最爱用的一招,当行为出现偏差时,我们
往往直觉想到处罚:骂小孩、打狗、扣薪、给公司罚单、
凌虐异议份子、入侵某个国家,但是利用处罚来改变行
为是很逊的作法,事实上,处罚多半完全不管用。
在我们谈及处罚的作用和无用之处前,先来看看尝
试处罚之后,发现毫无效果时我们会怎么做。如果因为
小孩、狗儿或员工出现某个行为而处罚他们,但该行为
又再度出现,这时我们通常不会说:「唔,处罚不管用,
试试别的方法好了。」我们会加重处罚,用骂的没用就改
用打的,孩子成绩满江红时没收他的自行车,下次又满
江红时就没收滑板;员工打混?威胁他们。没用?那就
扣薪水!还是没用?把他们停职或解雇,或干脆请军队
来管理;毒打改不了异议份子的行为?也许上了夹指板
或用其他酷刑就会有用了。
加重处罚是很可怕的作法,它永远没完没了,人们
为求处罚奏效甚至到了无所不试、无所不用其极的地步,
猩猩或大象并不在乎这种事,可是有史以来,甚或更早
以前,人类的脑子都被它所占据。
处罚是在行为发生以后才发生,这是它往往不管用
的一个原因,如同打官司的情形一样,在行为过后很久
才发生,因此对方不一定会把处罚和自己过去的行为联
想在一块儿;动物永远都不会这么做,而人类也不常这
么做。如果每偷一次东西马上就会有一根手指自动脱落,
或者每当违规停车时车子就会突然起火燃烧,我想赃物
和停车罚单应该几乎都不会存在。
第二招如同第一招,对方不会因此学习到任何事,
虽然实时的处罚可能会停止当下的行为,但它不会导致
任何行为的改进。处罚并不能教孩子如何让成绩变好,
最多只能期望孩子的动机出现改变,为了避免处罚而将
设法改变行为。
对于多数动物而言,为了回避未来后果而学习改变
未来行为的概念是难以理解的,如果有人因为自己的猎
鸟犬跑去追兔子而把牠毒打得半死,这只狗完全不会明
白牠之所以被处罚是因为刚才所做的事,但牠可能会因
此变得惧怕主人,以后当牠追兔子时主人一叫就会走开,
或者主人叫牠回来牠会拼命赶紧钱奔而来,然而毒打这
件事对追兔子的行为并不会产生影响。
顺带一提的是,猫咪联结自己行为及处罚的能力似
乎特别差,牠们和鸟类一样,受到威胁时只会变得惊怕,
什么都没学到,因此人们才会认为猫咪很难训练。牠们
真的无法以处罚的方式训练,但是利用正增强则轻而易
举。
处罚或威胁无法临助训练对象学习修正行为,但却
会让他们所学习到的设法别被逮到的行为 --- 当行为
动机极为强烈而无法不持续行为时(例如饥饿时偷食物、
青少年加人帮派)尤其会如此;在处罚体制之下用计规
避的行为将急剧增加。此外,持续处罚或严厉处罚有一
些极为棘手的副作用:被处罚者会出现恐惧、愤怒、厌
恶、反抗,甚至怨恨,有时施行处罚的人也一样,这些
情绪对学习全无益(除非你希望对方学习到恐惧、愤怒
及怨恨; 恐怖份子的训练有时便会故意这么做)。
有时候行为受到处罚后便停止出现,这是我们一直
以为处罚有效的理由之一,但它的前提是:
(1) 训练对象了解哪个行为带来处罚
(2) 产生行为的动机不大
(3) 非常畏惧处罚
(4) 训练对象有能力控制该行为发生与否(例如尿
床问题便无法以处罚解决)。第一次拿蜡笔在墙上乱涂即
被骂得臭头的小孩很可能不会再在家里墙壁上乱涂,不
老实申报所得税而被罚钱的国民可能就不会再犯。
以处罚停止行为最可能奏效的时机,是在行为刚出
现不久、并在它形成习惯之前,而且处罚本身对训练对
象而言必须是全新的体验,具有惊吓的作用,不能等到
对方习以为常。
在我的成长过程中,我的父母只处罚过我两次(而
且只不过是责骂而已),一次是因为我六岁时偷东西,另
一次是因为我十五岁时逃学,大家误以为我被绑架了,
但这两次处罚发挥了极大效果,我立即停止了这些行为。
若要使用处罚,你可能还需要设计一下,让训练对
象认为是他(牠)的行为导致这个厌恶刺激,与处罚者
没有关系。假设你有只喜欢睡在沙发上的长毛大狗,但
你不想牠这么做,处罚(责骂或其他方式)可能会使牠
在你在场时不上沙发,但不在时立刻又会上去。早年的
训练方法是在沙棱上放置小型捕鼠夹(无人在场的处
罚),当狗儿跳上沙袭时,捕鼠夹马上跳起来,吓牠一跳,
或许还可能夹到牠;捕鼠夹处罚了跳上沙发的行为,它
同时也负增强为了避免被夹而待在地上的行为,狗儿的
行为引发不快事件发生,一次不佳的经验便足以停止偷
上沙发的行为。我得赶紧补充一点,这个方法不一定对
所有狗儿都管用,有个拳师犬饲主提报,他的狗在第二
次看到捕鼠夹时,从沙发背上把一条毯子拉到捕鼠夹上
头,让它们全跳起来,然后安然躺在沙发的毯子上。
第二招:处罚
这些方法极少奏效而且会越用越没效果,但仍受到
广泛使用。
行为 解决方法
室友 大吼大骂;威胁他这些衣服将被没收并
到 处 乱 丢 丢掉;真的把衣服丢掉
脏衣服
狗在 出去扁牠一顿;牠一吠叫就用水喷牠(注
院 子 里 整 意:狗儿可能很开心看到你出来,而「原谅」
夜狂吠 了这个处罚。)
孩子 大骂他们;威胁;转身打他们。
在车里太

老公 开始吵架;把晚餐煮焦;自怨自艾、骂
或 老 婆 回 对方、哭泣。
家时情绪
总是很差
网球 每次打坏球就对自己骂脏话、生气及批
挥 拍 动 作 评。
有问题
员工 最好在众目睽睽下骂他们或批评他们;
回 避 工 作 威胁扣薪水或真的扣薪水。
责任或濑

讨厌 以迟迟不写但同时却感到内疚的方式处
写谢函 罚自己。
猫味 打牠或赶牠下来。
跳上餐桌
公交 记下他的司机编号,向公司投诉,设法
车 司 机 粗 让他转职、受惩或被开除。
鲁无礼,
让你很生

你认 让他搬回来住,但是让他住得很难过。
为应该自
立的成年
子女想搬
回家住
当处罚有效停止行为时,这个过程对施行处罚者具
有极大的增强效果,于是以后处罚者很容易自信满满再
度施行处罚。有些人对处罚功效深信不疑的程度总是让
我感到讶异,我曾经看过严格的学校老师、恃强欺弱的
运动教练、跋扈的上司和善意的父母出现这种行为,而
且他们会为这种作法辩护。只要在一大堆不怎么好的结
果当中只出现几个成功例子即可能维持这些处罚行为,
而且即使眼见其他完全不处罚的同校老师、教练、公司
老板、将军、总统或家长出现同样好或更好的成果,他
们仍可能坚持这些处罚行为。
处罚常带有报复的成份,实际上有些处罚者可能并
不在乎受害者的行为是否改变,他只是想要报复。有时
向谁报复并不重要,例如那些暗自窃喜的难搞办事员,
借着一些小细节刻意刁难,拖延或不让你拿到驾照、贷
款或借书证;你受到处罚,他们得到报复。
处罚对处罚者之所以具有增强效果的另一个原因
是,它显示出强势地位并有助它的维持,在小男孩的体
型足以反击暴戾父亲以前,父亲感觉到自己的强势,而
且实际上也位居强势,它其实可能是人类倾于使用处罚
的主要背后动机:建立及维持强势地位,处罚者关心的
可能不是行为,而是想证实自己具有较高地位。
等级制度、地位争夺及试探是所有社会性动物(从
一群鹅至人类政府组织)的基本特质,但是或许只有人
类学会利用处罚为自己获取强势地位伴随而来的奖励。
你所想要的是让狗儿、小孩、配偶或员工改变某个
特定行为吗?如果是这样,这是个训练问题,你必须明
白利用处罚作为训练方法的缺点。但如果你要的其实是
报复?那么,你应该为自己寻求有益身心健康的增强物。
或许,你真的非常希望狗儿、小孩、配偶、员工或
邻国等等不再违章,无论用任何手段,你都不希望对方
继续违抗你至高无上的意愿及判断力!若是如此,你所
要的是争取地位,你得自己想办法,我不再多谈。
罪恶感和羞愧感是自我加诸的处罚形式,没有什么
感受比被罪恶感紧紧揪住更叫人不舒服,这是人类才发
展得出来的处罚方式,有凭.动物(尤其狗儿)或许可能
表现出困窘难堪的样子,但是我不认为牠们会浪费时间
对过去的行为感到内疚。
加诸自己身上的罪恶感有的人多有的人少,有人犯
下滔天大罪之后仍感到轻松自在、合理应当,有人却只
是嚼个口香糖就感到罪恶。很多人在日常生活中并不感
到罪恶或羞愧,这并非因为他们很完美或因为他们是迟
钝的乐天派,而是因为他们在处理自己的作为时另有他
法;当他们做出某项行为但日后回想起来感到不妥时,
他们就不再出现这个行为,不过有些人却会重蹈覆辙
--- 在派对上出糗、对所爱的人说出无可原谅的话语
--- 即使这些行为隔天一定会让他内疚难常。
大家可能以为害怕内疚的心理可以遏阻行为,但当
我们做出日后将导致内疚的行为时,当下通常无畏无惧,
因此以罪恶感作为改变行为的方法,它的作用与鞭打等
延迟发生的处罚方法差不多 --- 效果都不佳。
因此,如果你是这种以罪恶感处罚自己的人(我们
多半都是这种人,因为从小就被教导这么做),你应该认
清这个作法属于第二招,而且你可能对自己过度严苛,
想去除这个使你内疚的行为或许有个好理由,如果是如
此,改用自找处罚以外的方法或并用其他方法或许可以
获得更好的效果。
 第三招:负增强 .

负增强物是引起不快的事件或刺激(无论多么轻
微),但只要行为改变即可避免或让它停止。举例说明:
野地上有头牛伸出鼻头触碰通电围栏,牠感受到电击,
抽回鼻头之后电击即消失,因此牠学习到不碰围栏即可
避免电击;在碰触围栏的行为受到处罚的同时,避开围
栏的行为受到了增强,但这属于负增强物而非正增强物。
现实生活中到处充满了负增强物:当椅了坐得不舒
服时我们会改变坐姿、我们知道下雨时最好进屋里、有
些人觉得大蒜味引发食欲,但有些人觉得它令人作呕等。
一个刺激成为负增强物的条件是(1)行为者觉得它令人
不快(2)为了去除不快而改变了行为;例如,在公交车
上为了远离满嘴大蒜味的人而换位子。
如我们在第一章所见,几乎所有训练动物的传统方
法都是运用负增强原理,当马缰往佐拉时,马匹学会向
左转,如此能舒解牠左边嘴角感觉到的拉力;大象、公
牛、骆驼等荷重的工作动物为了避免被缰绳拉扯或遭棒
子、刺棍或鞭子戳抽,因而学会往前走、停下来或拖动
重物等动作。
负增强也可用来塑形行为,它与正增强一样,必须
与行为的出现有关连性,出现正确反应时必须停止这种
「恼人刺激」。不幸的是,由于任何形式的「恼人刺激」
都将导致行为改变,因此施予刺激的人可能同时受到正
增强,如同处罚一样,它将提高施予厌恶刺激的机率。
举例来说,当唠叨有效时,唠叨对唠叨者便具有增强作
用,所以他将变本加厉地唠叨,有时严重到即使想要的
行为已经出现,却仍持续唠叨。想想美国小说家罗斯
(Philip Roth)小说【波特诺伊的抱怨】(Portnoy’s
Complaint)中,一位母亲在儿子探视时仍抱怨着:「我
们从来都见不到你。 」
正增强和负增强的关连行为常交互作用,行为学家
麦尔娜.利比(Myrna Libby)博士向我举了以下例子:
一名小孩在店里耍脾气吵着要糖吃,家长作了让步给他
一支捧棒糖,因此耍脾气的行为受到糖果的正增强,但
是更为有效的是,家长的让步行为受到负增强,因为小
孩在公共场所耍脾气为家长带来的不快和难堪确实消失
了。
这个耍脾气的行为可能因此成为恶性循环的一环,
家长为了停止该行为,将竭尽所能使用安抚、反对、争
吵或增强的手段,所以耍脾气的行为逐渐变本加厉,也
正因如此,家长不自觉地也提高了增强的层级。我知道
有一户人家的小孩几乎每天晚上都要全力演出十五至二
十分钟耍脾气哭闹的戏码,它只在晚餐时间发生,这名
小孩的行为和家长的焦虑反应都被紧密关连的正增强和
负增强作用强烈维持,时间长达三年之久。
人们常常不由自主地对他人进行负增强:警告的眼
神、皱眉或不满的言辞,有些小孩日复一日的生活目的
就是努力避免他人不满,但过度处罚的小孩可能会变得
充满敌意或逃避,成年后自己也可能成为处罚者。相反
地,如果小孩成长过程中并非努力讨人欢心,而是长期
努力终止他人的不满(即便只是暂时性),他成年后可能
变得胆怯、自我猜疑且焦虑不安。一位专门治疗恐惧症
的治疗师告诉我,她那些对群众或电梯产生莫名恐惧而
妨碍正常机能的病患,在他们的成长过程中,都是长期
生活在负增强的要求之下。
由于负增强如同处罚一样,都可以有效塑形出行为
的改善,因此这个体验可能会增强训练者使用逼迫手段
的意愿。莫瑞·西德门博士向我提及他的观察:
「即便极
轻度的负增强,只要成功几次即可能使训练者变成奉行
负增强的使用者。」
不过,由于负增强使用对方想要避免的厌恶刺激,
每次使用负增强时必定存在处罚的意味,例如拉扯左侧
的马缰时,继续往前的行为便受到处罚,在此同时若马
匹开始向左转,这个行为便获得了负增强。传统训练师
通常不认为自己的负增强物(马缰、P 字链或口头纠正)
是种处罚,毕竟,他们解释这些工具的使用方法都相当
温和,如果训练师真的想处罚,更重的处罚方法多得是,
而且他们通常会接着补充,要是同时也大量给予称赞和
正增强物,长期来看并不会有什么伤害。
第三招:负增强.
负增强在某些情况下可能会奏效,而且可能是最佳
的选择:当车里的小孩太累且大闹脾气,无法乖乖听话
做其他事情,例如玩游戏或唱歌(第五招)时,这里提到
停车的解决方式非常有效。
行为 解决方法
拔掉电视接线或不让他吃饭,直到他把
室友
脏衣服捡起来(当对方照着做时即停止负增
到处乱丢
强;起初即使他只随便应付一下仍予以增
脏衣服
强)。
狗在 狗吠叫时用 强光手 电筒往 牠的狗 屋里
院 子 里 整 照,停止吠叫时即关掉手电筒。
夜狂吠
孩子 当吵闹的音量超过可以忍受的限度时,
在 车 里 太 把车停在路旁,看看书,不理会因为停车引
吵 起的争吵,等孩子全安静下来才开车。
老公 当对方语调胜来令人讨厌时,转过身或
或 老 婆 回 暂时离开房间,等到没声音或回复正常语调
家 时 情 绪 时再立刻回去注意对方。
总是很差
网球 请教练或旁观者在你每次挥拍动作不对
挥 拍 动 作 时,马上发出口头纠正(「啊啊啊!」或「不
有问题 对!」》,逐渐练出不会被纠正的挥拍动作·
员工 紧迫盯人,每次工作表现未达水平立即
回 避 工 作 予以才旨责。
责任或濑

亲友会自动自发给予负增强,艾莉丝姑
姑会让你知道她很担心你没收到围巾,你的
讨厌
家人也会让你知道你应该要写谢卡给她,而
写谢函
且他们告知你的语气绝对会让你不好受。
猫味跳上餐桌
猫味 把透明胶带反过来(黏的一面朝上)放在
跳上餐桌 餐桌边。
公交 挡住车门或站在司机身边,让他无法开
车 司 机 粗 车;当他停止讲话,即使只是片刻也立即移
鲁 无 礼 , 开。
让你很生

你认 让这个成年子女搬回家住,但和对待陌
为 应 该 自 生人一样,要求他付房租、饭钱和任何洗衣、
立 的 成 年 看顾孩子等特别服务费,付出足以贴补同住
子 女 想 搬 的费用才让他继续住。
回家住
然而,厌恶刺激的强烈程度取决于训练对象的感受,
训练者视为轻度的刺激对训练对象而言可能极度不快。
此外,由于依定义而言,所有负增强必定存在处罚,习
于使用负增强将使你冒着风险,因为所有无可预料的处
罚副作用都可能出现,诸如逃避、偷偷模摸、恐惧、迷
惘、反抗、表现被动顺从和减少主动性,也可能出现过
度联想,对任何当时刚好在场的周遭事物(包括训练环
境和训练者)出现厌恶感,而将设法避开或甚至逃离。
仔细观察传统训练利用负增强或纠错的训练方法,
可以发现这种训练方式导致的副作用昭然若褐。我参加
过美国全国性犬只服从竞赛,看到许多表现一流的狗儿
一脸闷闷不乐、不旦不摇尾巴而且小心翼翼不敢乱动,
这个样子让我很吃惊。你也可以到骑马学校或马术活动
上,看看马儿是否看起来开心,多数人(甚至包括专业
马术家和自认训练方法十分现代及人道的人)都不知道
马儿愉悦时是什么样子,因为他们从没见过。
负增强可以是相当无害的,如同前述接近羞怯骆马
的例子。我女儿的狗很热情,喜欢舔我孙子的脸,但这
个喜欢狗狗的一岁孩子并不喜欢让牠用口水洗脸,后来
他发现只要他伸出双手并且尖叫时,狗儿就不会上来舔,
现在当狗儿摇着尾巴靠近时,他就摆出小朋友版本的「绝
对不行!」姿势,阻止了舔脸行为。他对这个新行为的作
用相当满意,有时也拿来用在爸妈和手足身上(虽然效
果较为不佳)。
不过整体而言,婴儿是不适合以负增强教导的特定
族群,想利用厌恶刺激阻止婴孩做他必须做或想做的事
是很困难的,婴儿并不会了解暂停时间和责骂的意义,
爬行的婴孩伸手去拿祖母咖啡桌上的小装饰物时,她很
可能不会理睬大人「不可以!」的警告,手被大人打了,
她会哭嚎,但是她的手仍然会继续往前伸。这时如果应
用第八招(改变动机)把东西放在她拿不到地方,或者
第五招(训练不兼容的行为)给她别的东西玩,或两招
并用,成效将大大改善。
虽然要婴儿学习避开对自己不利的事物本来就不容
易,但是他们能够透过正增强快速学习,或许可以说婴
儿天生就喜欢讨人欢心,但并不会言听计从。幼年动物
也较易透过正增强学习,而容易因处罚和负增强变得困
惑惊怕。传统训犬师通常建议等到狗儿满六个月才正式
进行服从训练,理由是幼犬年纪太小无法学习,但真正
的原因在于正式训练一般采用厌恶刺激,而幼犬的年纪
太小,无法透过这种方式学习。你几乎可以利用称赞、
拍抚和食物教会幼大任何事情,甚至在断奶以前即可开
始,如果以 P 字链迫使幼犬脚侧随行、坐下或定点不动,
在你没教会牠之前早已把牠吓得魂飞魄散了。
野生动物是另一类特别不适合负增强的训练对象,
任何养野生动物(无论是豹猫、狼、浣熊或水獭)当作
宠物的人都知道,这些动物不会任你下令摆布;例如想
用绳子牵着狼散步尤其困难,即使你自幼狼养到大而且
牠也相当温顺亦然,如果你拉牠,牠会自动拉回去,而
且无论这匹狼平常多么稳定亲人,如果你太坚持又拉得
太用力,牠将变得惊慌失惜、设法逃离。如果你把一只
驯服的宠物水濑系上牵绳,不是你得往牠想走的方向去,
就是牠死命和牵绳挣扎搏斗,轻扯牵绳似乎不会出现介
于两者之间的反应,于是也无法拿来塑形顺服牵绳的行
为。
海豚也一样,即使人们大肆吹擂牠们很容易训练,
但其实当牠们受到任何强迫时不是出现反抗就是逃走,
推海豚一把,牠会反推回来,如果以围网将海豚群赶入
另一个水池时令牠们感到过于拥续,胆大的海豚将冲撞
围网,瞻小者则带着无助的恐惧沉入池底。你必须先利
用正增强塑形出安静游在围网前方的行为,而且即使你
已这么做,几乎每次围网骤赶海豚时都必须有一个人在
旁留神待命,随时准备跳人水中解开冲撞围网而被缠住
的海豚,以免牠无法换气而溺死。
心理学家哈瑞·法兰克(Harry Frank)提议,这种
反抗负增强的行为是野生动物和驯养动物的主要分野,
所有的驯养动物都能容许负增强,牠们可以被驱赶成群、
被牵着走、被嘘声驱赶或者大致来说可以任人随便推拉,
人类可能在有意或无意之下选择培育出牠们这些特性,
毕竟如果牛只无法被驱赶成群或被嘘声驱赶,反而像狼
或海豚面对厌恶刺激时不是反抗就是惊逃的话,牠们就
得待在围栏外头过夜而被山狮吃掉,或者因为老惹麻烦
而被杀来吃。
无论「服从」的表现方式是表现愿意屈服的样子,
或在负增强逼迫学习之下延迟出现战或逃的反应
(fight-or-flight reaction),我们所有的驯养动物都
具有这个自身反应。猫咪是唯一的例外,要教猫上牵绳
散步真的很难,你可以到猫秀场去看,猫界专业人士甚
至连试也不试— 猫咪不是抱在手里就是关在笼内,不会
有人牵着猫咪四处逛。
哈瑞·法兰克提议这是因为猫咪并没有真的被驯养,
因此缺乏接受负增强的能力,相反地,牠们可能是种共
生型(Commensal 原文 p.116)的动物,同老鼠和蟑螂一
样,为了自身利益才与我们共一早居所,不过猫咪却更
可能是种共生动物(symbiote 原文 p.116) ,双方互利互
惠(mutual benefit) --- 我们人类提供食物、庇护所及
拍抚,猫咪捉老鼠、提供我们娱乐及战出咕噜声,然而
要牠们工作及服从?门儿都没有。这可能解释了有些人
不 喜 欢 猫 的 原 因 , 猫 咪 的 桀 惊 不 驯
(uncontrollability)、无法掌控令他们感到害怕。
那些讨厌猫咪的人听好了,对着猫咪的脸喷洒水是
处罚猫咪一个极有效的方法,可用来当作负增强。有次
我穿着一套全新的黑色羊毛洋装参加晚宴,女主人的白
色安哥拉长毛猫一直跳到我大腿上,女主人觉得这个行
为很可爱,可是我并不希望我的洋装沾上白色猫毛,我
在女主人没看到时把手指放入酒里,然后把酒弹到猫脸
上,牠立即离开而且没再跑回来,这真是个不错又好用
的负增强物。
 第四招:消弱

如果你已经训练老鼠去压杠杆以交换食物奖励,当
关掉供给食物的机器时,起初老鼠仍会不断压杆,然后
越来越少去压,最后牠将完全放弃,在这个过程中,行
为已受到「消弱」。
「消弱」是来自心理学的专有名词,它指的不是动
物的灭绝,而是行为的消失,它是行为由于缺乏增强而
逐渐不再发生的过程,有如蜡被烧尽而熄灭的蜡烛。
如果行为没有产生任何后果 --- 不好也不坏,什么
影响也没有,这个行为大概即会消失,但是这并不代表
你忽略行为之后它一定会消失。
「不理会他人」的行为本
身就是一种后果,因为它极度违背我们的社会性,但想
藉忽略行为达到消弱的目的不见得总会管用。
若行为持续因受到关注而增强,这时候忽略它则可
能奏效。我曾经看过美国交响乐团指挥家汤玛士.许伯斯
(Thomas Schippers)与纽约爱乐乐团进行预演,这位
指挥家作风强烈,但该乐团团员也毫不逊色,当他走向
指挥台时,团员们仍继续玩闹着,木管乐器小声吹着『迪
克西』的曲子,小提琴拉出唯妙唯肖的人声「噢 ---
偶!」,许伯斯对这些愚蠢行为不予理会,它们很快便消
失了。
就我看来,人类互动中最有效的消弱应用就是拿来
对付口头行为,无事呻吟、拌嘴、挖苦、咄咄逼人的行
为,这些行为若无法获得反应、无法让人动怒的话,它
们就会消失。请记得一件事,
「使人恼怒」的行为可能具
有正增强的效果,当哥哥挖苦妹妹发型而使她生气发飘
时,哥哥便获得了增强;当同事占了上风而使你大动肝
火时,这个人便是赢家。
我们常在不经意下增强了我们希望消失的行为,小
孩哼哼唉唉、呻吟折磨人的行为往往是被家长训练出来
的。小孩累了、饿了或不舒服的时候可能会像幼犬一样
呻吟,然而磨人功夫特别厉害的小孩却有自制力超强的
父母,他们能够一直忍受不断哼哼唉唉的抱怨呻吟,直
到最后终于让步:「好啦,我会给你那个该死的冰淇淋,
现在请你闭上嘴巴可以吗?」我们往往忽略(或不了解)
这个最后才出现的让步,使得这类行为得以维持,而增
强物不定时出现的情形更使得行为变得非常耐得住考
验。我曾在纽约布鲁明戴尔百货公司看过一名漂亮的六
岁小女孩使出堪称经典的哭喊耍闹手段,她鬼喊着:「可
是你说过的,你答应过我的,我不要啦!」之类的话语,
她的母亲、祖母和整个床单部门的人完全陷入停顿、束
手无策,依据当时情景,我猜这个孩子逛街逛得很烦,
她的行为或许其来有自,又或者,她完全只是累了,不
想再待下去,而她过往的学习经验都以哭闹呻吟达成目
的,这个行为最后总是获得增强。
第四招:消弱
要以第四招去除自我增强的熟知行为并不管用,不
过把它拿来去除那些哼哼唉唉无事呻吟、自怨自艾或取
笑挖苦的行为,效果却极为见效,即使幼童也能学会(而
且乐意发现)只要不给任何反应(无论好坏的反应),年
长孩子取笑他们的行为就会停止·
行为 解决方法
室友 等他自己有所成长,表现成人的行为。
到处乱丢
脏衣服
狗在 这个行为具有自我增强的作用,很少自
院 子 里 整 动消失。
夜狂吠
孩子 有些噪音本来就正常无害,随他们去吧,
在 车 里 太 吵久了就会静下来了。

老公 务必记住听到对方难听的话时不要出现
或 老 婆 回 任何反应,无论好坏亦然。
家时情绪
总是很差
网球 练习其他挥拍动作或步法等等,设洗别
挥 拍 动 作 去注意那个问题,让它自动消失。
有问题
员工 如果这些不良行为是为了引人注目,则
回 避 工 作 不予理会:不过,回避工作责任的行为可能
责 任 或 濑 具有自我增强的作用。

这个行为一般会随着年纪增长而消失,
讨厌
生活里充满许多付账和报税等杂事,比较之
写谢函
下写谢卡反倒成了放松自己的一件事。
对此行为不予理会,它并不会停止出现,
猫味
但或许可以成功消除自己对食物出现猫毛的
跳上餐桌
反感。
公交 不理会司机的行为,把车钱付了,忘了
车 司 机 粗 这件事。
鲁无礼,
让你很生

你认 把它当成暂时对策,希望这名成年子女
为 应 该 自 的财务情况改善或当前困难解决后会立刻搬
立 的 成 年 走。
子女想搬
回家住
如果你有天碰巧得应付某个老爱呻吟磨人的小孩,
该怎么办呢?以下是我的作法:当小孩一开始用典型鼻
音哼哼唉唉抗议或抱怨时,我会马上告知小孩这招无事
呻吟对我不管用(这通常会让他们深思一下,因为他们
不认为这是无事呻吟,而是合理当然、甚至很高明的说
服手段),当他们停止呻吟时,我会赶紧予以增强,给予
称赞或拥抱,如果他忘记了又开始哼哼唉唉,只要我挑
高一下眉毛或投以压制性的眼神通常即能停止这个行
为。事实上会这么做的人通常相当聪明,当孩子停用这
个吵闹不休的策略时,与他们相处可能很愉悦甚至很有
趣。
处理言语表达的行为通常会遇见一个问题,那就是
我们往往过度重视语言,每字每句几乎都带着神奇力量,
遇到欺压嘲弄或呻吟抱怨的情形时,我们很容易专注在
对方所说的话,而不是他们的行为。一句「可是你答应
过的!」引发「不对,我没答应过!」或「我知道,可是
我明天得去芝加哥,没法履行我的承诺,你不能理解
吗?」之类的反应,你来我往没完没了。
我们必须划分言词和行为,例如夫妻争吵时,「争吵」
是当下发生的行为,然而争吵的主题却常成为重点,你
可以据理力争,你的每句话可能完全正确(像这样的争
吵录音带,治疗师得重复听千万遍),可是却仍然没有处
理眼前的行为 --- 吵架。
我们除了太容易被冲突字眼吸引之外(「他说我是懦
夫,我才不是!」),我们也常没有注意到,我们不只让自
己陷入愤怒之中,事实上自己也正在增强对方的行为,
就拿老是带着一肚子气回家的老公为例,他的脾气越大,
老婆越会赶紧试图讨好他,对不对?她真正增强的行为
是什么呢?
这时另一半若能表现愉悦,并不因此加速呈上晚餐
或被搞得激动生气,对方乱耍脾气的任何表现都将起不
了什么作用;相反的,冷若冰霜不出一语、大吵大闹响
应或予以处罚都可能导致增强作用。
利用忽略「行为」但不忽略「对方」的作法,你可
以使许多讨厌的行为自动消失,当它们无法产生任何好
或坏的后果,这些行为将变得毫无效用。表现敌意必须
花费大量能量,如果行为无效,它通常很快会被舍弃不
用。
许多行为本来就具时效性,当儿童、狗儿或马匹刚
从缺乏活动的封闭环境中被带到户外时,他们一心只想
奔跑及玩耍,若企图控制这个现象,你可能必须大费周
章,通常随他们自由自在一阵子会容易一些,等到他们
满足了活动筋骨的欲望,这时才要求中规中矩的行为或
开始作训练。聪明的训马师可能会让年轻马匹先进场几
分钟,一让牠踢踢撞撞跑一跑,接着再上马鞍工作。
军队操兵或足球练习前的暖身体操便有类似功用,
除了帮肌肉暖身、减少扭伤等伤害的机率外,这类「大
肌肉活动」会消耗一些多余的精力,所以打闹嬉耍的行
为因而消失,进行训练时士兵或球员可以变得专心一点。
「习惯化」(habituation)是一种消除非制约反应
的方法,如果训练对象曝露在厌恶刺激之下,无论怎么
尝试也无法逃离或避闻,久而久之牠的躲避反应
(avoidance responses)将会消失,牠将停止对该刺激出
现反应,不去注意到它,似乎变得对它视若无睹,这个
现象称为「习惯化」。我以前住在纽约的公寓时,街道噪
音起初吵得让我无法忍受,不过我像多数纽约客一样,
逐渐学会在警笛声、喊叫声、垃圾车清运声、甚至撞车
声之下安然睡眠,我已经习惯化了。
警骑马匹的训练有时必须让马儿接受各种令牠惊怕
的无害事件,例如打开的雨伞、飘抖的纸张、全身被嘎
嘎作响的金属罐子轻敲等等,让牠们对吓人的情景和声
音变得习以为常,无论市区街道上出现任何事物,牠们
依旧稳如泰山。
 第五招:训练不兼容的行为 .

接下来介绍不必当坏人的招数,利用正面方式去除
讨厌的行为。其中一个高招就是训练对方出现一个不可
能与讨厌行为同时存在的行为。
举例来说,有些人不喜欢狗儿在餐桌旁乞食,我自
己便很讨厌这种行为 – 当我叉起一片牛排送到口中
时,最让我倒尽胄口的事情当属狗儿的口臭、哀怨眼神
和用力搭在我膝上的一只脚。在吃饭时间把狗儿关在屋
外或别的房间,是第一招的解决方式,不过训练一个不
兼容的行为也可用来控制乞食行为,例如训练牠在人们
用餐时趴在餐厅门口;第一步是训练牠趴下,让这个行
为受到刺激控制,然后再训练牠在吃饭时间「去那边趴
下!」用餐完毕后在厨房给牠食物作为这个行为的奖励。
「走到他处趴下」与「在餐桌旁乞食」的行为无法兼容,
因为狗儿无法同时留在两处,于是乞食的行为便消失了。
我曾经在歌剧预演时见过一位交响乐团指挥家运用
不兼容行为的高明技巧。整个合唱部的歌声突然无法配
合乐团的演奏,他们背起来的乐章似乎少了一拍,指挥
家确认问题所在之后,他在这段乐章的歌词中寻找「s」
的音,他找到一个之后告诉合唱人员强调「s」音:“The
king’sssss coming.”他们拉长「斯 – 斯」音听起来
很好笑,但是这么做让他们不会太快唱完这段乐章,于
是解决了问题。
我自己第一次使用第五招的经验是处理一个本来可
能极为严重的海豚问题。我们在海洋生物世界曾经一度
同时让三类表演者演出户外秀:六只轻巧优雅的小型飞
旋海豚、一只硕大的母瓶鼻海豚(名为阿波)和一名漂
亮的夏威夷女郎,其中一段节目内容由她与飞旋海豚一
同游泳戏耍。跟大众认知不同的是,海豚并非永远亲和
友善,瓶鼻海豚尤其容易恃强欺弱,六百磅重的阿波在
女表演者入水后便闲始找她麻烦,急速游到表演者下方
再把她顶弹出水面,或者牠会以尾巴末端拍打她的头,
这些举动让表演者非常惊怕,事实上也极为危险。
我们并不想把阿波从表演中除名,因为牠的跳跃和
花式翻转动作已让牠成为节目的压轴明星。我们开始建
起隔离水池,夏威夷女郎表演期间便把牠困在里头(第
一招的解决办法),不过我们也训练牠一个不兼容的行
为,让牠去按压一个位于池边的水底杠杆,藉以交换鱼
儿奖励。
阿波兴致高昂地学会了不断压杆以获取鱼儿,牠甚
至还守护牠的杠杆,不让其他海豚接近。在演出节目进
行期间,训练师把阿波的杠杆放入池内,每当女表演者
在水中与飞旋海豚玩耍时,训练师便增强牠按压桢杆的
行为,阿波无法按压杠杆又同时游到池中央欺负表演者,
这是两个互不兼容的行为,所幸,比起欺压表演者,阿
波更喜欢去压杠杆,所以欺压的行为就消失了(不过,
那名女表演者对这个神奇改变从来不太怀抱信心,只有
在阿波被稳当地隔离关来后,她才能完全放松镇定下
来)。
第五招:训练另一个不兼容的行为
聪明的人常运用这一招,在车里唱歌或玩游戏不但
解除了父母的问题,也给了无聊的孩子事情做。遇到许
多气氛紧迫的情境时,分散注意、转移注意或使对方忙
着做愉快的事情是不错的方法。
行为 解决方法
室友 买个洗衣篮,如果室友把衣服放在篮里
到 处 乱 丢 就奖励他。洗衣篮满了就和他一起洗衣服,
脏衣服 让洗衣服成为社交互动的随会。「处理脏衣
服」和「忽视脏衣服」的行为无法同时存在。
训练牠听口令趴下,狗和我们多数人一
狗在
样,在趴下后很少发出叫声。在窗口对牠大
院子里整
喊口令,或在狗屋上装个对讲机,以口头称
夜狂吠
赞作为奖励。
孩子 让他们唱歌、说故事或玩猜猜看等动脑
在 车 里 太 游戏,即便三岁小孩也会唱儿歌,这些都与
吵 拌嘴鬼叫的行为不兼容。
开始在对方回家后安排无法耍脾气的愉
老公
悦活动,例如:与孩子玩耍或进行嗜好活动,
或老婆回
给对方三十分钟完全属于他的个人时间通常
家时情绪
也不错。另一半下班后也许需要一些时间放
总是很差
松才能够重新扮演家中的角色。
网球 训练新的挥拍动作(请见文中说明》
挥拍动作
有问题
员工 下令要他更快或更认真完成某项特定任
回 避 工 作 务,在一旁观察,当他完成时予以称赞。
责任或濑

训练一些替代行为:如果有人送你支票,
讨 厌 背书时在上头写些感谢之词,其余交给银行
写谢函 处理。如果是其他种类的礼物,当天晚上就
致电道谢,这样你永远都不必写信了。
训练猫咪坐在厨房椅子上才会有拍抚及
食物奖励,但迫切想要奖励或饥饿的猫昧也
猫味
许可能因过于心急而力道过猛。跳上椅子时
跳上餐桌
使它滑得老远,不过牠是待在你希望牠在的
地方没错,牠没跑到桌上。
面对咆哮或恶霸的行为时,以对视、礼
公交
貌性微笑和合宜的社交言词「早安!」作为对
车司机粗
应,或者当司机骂你骂个不停时,以同情的
鲁无礼,
语气回应:「你的工作一定非常辛苦!」这有
让你很生
时会引起对方客气回应,然后你便可以增强

这个行为。
你认 帮他找别的地方住,即便你起初也许得
为 应 该 自 帮他付房租。
立的成年
子女想搬
回家住
对于有问题的网球挥拍动作或其他由于过去错误学
习而出现的肌肉运动模式,训练不兼容的行为是个好方
法。肌肉「学习」的速度虽然不快,但是学成之后的效
果很好,当某个动作成为固定的肌肉运动模式时便很难
将它去除(我幼时学习弹琴的经验十分令人挫折,因为
无论我弹哪个曲子,只要我的手指学会弹错某个音,之
后每次在同一个地方就会出错)。解决这个问题的方法之
一就是训练一个不兼容的行为,以网球挥拍为例,先在
心里把挥拍分解成步骤动作 – 姿势、面向、步法、开
始挥拍、挥拍中、结束挥拍动作,然后慢慢地做出每个
分解步骤,必要的话可以把单一步骤重复多次。接着,
训练一个完全不同的挥拍动作,也就是学一套新的分解
步骤,当肌肉开始学习到新的模式时,把所有分解步骤
串起来一起做,再加快速度。
当你开始以正常速度使用这个新挥拍动作打网球
时,起初千万不要在意球飞出去的方向,只要练习动作
的进行模式就好。此时你应该有两个挥拍动作,一个是
有问题的旧有挥拍动作,另一个是新的挥拍动作,两者
无法兼容,所以你不可能同时做出这两个动作,不过,
旧有的动作模式可能无法完全去除,但改用新动作之后
可以使这个模式的出现减到最少。当新动作成为肌肉习
惯的运动模式之后,你可以再专心调整球的走向,而有
了较佳的挥拍动作,球的走向想必也会变得较好(我当
初学钢琴时的问题本来也可以如此获得解决)。
想改变自己行为时,训练不兼容的行为相当好用。
特别是面对哀伤、焦虑或寂寞等情绪状态时尤然,有些
行为与自怨自艾的行为完全不兼容,例如跳舞、唱赞美
诗或任何高动能的活动,甚至跑步也可以,你无法进行
这些活动却又同时沉溺于痛苦中。心情不好?试试第五
招吧!
 第六招:训练这个行为只依讯号出现

.有些情况之下只有这招能奏效,它遵从学习理论的
原理,当行为受到刺激控制 –也就是动物学会只在某个
讯号出现之后才出现行为反应,于是在讯号没有出现的
情况之下,这个行为通常不会出现。你可以利用这个自
然法则去除所有你不喜见的行为,只要让这些行为受到
讯号控制,以后不再给予讯号即可。
我在训练海豚戴眼罩时第一次发现这个高招十分好
用。我们想在海洋生物世界的表演秀里示范海豚的声纳
定位能力,我打算训练名为马酷亚的公瓶鼻海豚戴上眼
罩,让牠在暂时看不见的情况下利用声纳定位系统找寻
并拾回水底的对象,现在这个演出已经成为海洋秀表演
的常态戏码。
马酷亚戴上眼罩时并不会感到疼痛,但是牠并不喜
欢,当牠看见我手里拿着吸盘就会沉到池底不上来,每
次待在池底的时间可以长达五分钟,牠轻轻条摆着尾鳍,
从水底带着「难倒你了吧!」的眼神看着水面上的我。
我的判断是,试图利用惊吓或推戳让牠浮到水面应
该没什么用,而利用贿赂或引诱就太笨了,所以有天当
牠又沉到水底时,我吹了哨音并且给牠一堆鱼作为奖励,
马酷亚吐出了一个「惊讶气泡」(篮球大小的圆雕气泡),
这在海豚的语言中代表「什么?」的意思,牠游上来把
鱼吃掉,但很快牠便又故意沉到池底以获取增强物。
接着我加入一个水底声响作为讯号,并且只增强牠
听到讯号之后才下沉的行为,果然,牠停止了缺乏讯号
的下沉行为,从此下沉行为不再成为问题,当我回到戴
眼罩的训练时,牠很敬业地戴上眼罩。
第六招:训练行为依讯号出现
这个方法看似很不合理,但是它的效果可能出奇地
好,有时甚至能够实时解决问题。
行为 解决方法
来个乱丢脏衣服大会,看看你和他在十
分钟内可以把家里搞得多乱(这个方法很有
室 友 效,有时候当较不爱干净的人看到这片狗窝
到 处 乱 丢 景象时,反而会恍然大悟,开始整理脏乱的
脏衣服 情形,例如乱丢的衬衫或衬子等,他以前根
本看不出乱七八糟的样子,虽然你仍可能觉
得他进步不大)。
狗在 训练狗儿在下口令后才有食物奖励,如
院 子 里 整 果没下口令,叫也白费力气。
夜狂吠
孩子 把吵闹的行为加上刺激控制(请见内文
在 车 里 太 说明)。

老公 设定一个让对方耍脾气的时间和讯号,
或 老 婆 回 例如从傍晚五点钟开始坐下来,以专心聆听
家 时 情 绪 和同理心增强所有在十分钟内出现的抱怨行
总是很差 为,在这段时间以外出现的抱怨行为则不予
理会。
网球 倘若你要求自己打出坏球,并且学会故
挥 拍 动 作 意这么做,当你不叫自己做时,这个有问题
有问题 的挥拍动作便订能不再出现。
设定一个让对方耍脾气的时间和讯号,
员工
例如从傍晚五点钟开始坐下来,以专心聆听
回避工作
和同理心增强所有在十分钟内出现的抱怨行
责任或濑
为,在这段时间以外出现的抱怨行为则不予

理会。
买一迭便条纸、笔记本、一些邮票、一
枝笔、通讯簿和一个红色箱子,把东西放在
箱子里,收到礼物时把送遗者的名字写在便
讨厌
条纸上,放入箱子里,再把红箱子放在枕头
写谢函
或餐盘上。在按照红箱子的讯号写谢函、把
信封封口、贴上邮票寄出去之前不睡觉或吃
饭。
训练牠依讯号跳上桌子和跳下桌子(可
猫 味 以拿来向客人炫耀),然后再塑形拉长牠等待
跳上餐桌 讯号出现的时间(训练到最后可以拉长到等
待一整天)
公交 不建议使用第六招。
车司机粗
鲁无礼,
让你很生

你认 只要成年子女一离家自立,邀请他们回
为 应 该 自 来探访,明白告诉他们只有接到邀请时他们
立 的 成 年 才能回来,然后不邀请他们搬回来就好。
子女想搬
回家住
我也曾利用这一招让车子里吵杂的孩子们安静下
来。如果你们正开往某个很棒的目的地 – 例如马戏团
表演,孩子们可能会因为兴奋而喧嚷不休,他们已经兴
奋过头而无法照着第五招做(让他们玩游戏、唱歌),遇
到这种快乐出游的状况你也不会想用第三招的负增强方
式(停在路旁,等到他们安静为止再开车)。第六招便是
应对这种情境的最佳招式:让这个行为受到刺激控制,
当你说「好,现在请大家尽可能发出最吵的声音,开始!」
(你自己也加入),大概只有三十秒大家会觉得这么做很
好玩,接着就会觉得无聊了。通常只要重复做个两三次
便足够维持相当安静的车内时光,你或许可说是加上讯
号的吵闹行为使它的乐趣尽失,或者也可以说,刺激控
制下的行为在缺乏刺激时通常会消失,或许这招的效用
还不只如此,但它确实有效。
心理学家史金纳博士的女儿黛柏拉传授我一个运用
第六招的方法,用来控制狗儿在门口哀鸣的行为。她有
一只小型犬,每当牠被关在屋外就会在后门吠叫哀哭,
不去上厕所;黛柏拉制作了一个小的圆纸板,一面是黑
色,另一面是白色,她把圆纸板挂在屋外的门把上,当
黑色那一面出现时,即使狗儿鬼哭神嚎,屋里的人也不
会开门,但当白色那一面出现时,他们就开门让牠进来。
这只狗很快学会当黑色那一面出现时不必白费力气设法
进屋,当黛柏拉判断时间差不多了,她会把门打开一个
小缝,把圆纸板翻面,等狗儿一叫就放牠进屋。
当我女儿盖儿养了一只玩具贵宾幼犬时,我试过黛
柏拉这招门把讯号。彼特是只非常小的狗,两个月大时
几乎不到六吋高,无人看管牠时让牠四处乱跑(即使在
屋里)实在很不安全,于是当我很忙且盖儿又去上学时,
我会把牠关在盖儿的房间,房里备有食物、饮水、报纸
和毛毯。当然,当牠被独自关在房里时牠会大吵大叫,
我决定试试黛柏拉的方法,提供牠一个分辨何时叫有用、
何时叫不会有反应的讯号。我抓了身旁的一条小毛巾,
把它挂在房里的门把上,当毛巾在门把上时,牠再怎么
叫也不会有人理,但当毛巾拿掉时,要求陪伴和自由的
幼犬叫声将受到回应。
幼犬马上理解了它的意义,只要毛巾在门把上时即
放弃激动吵闹的行为,不过为了维持这个行为,我必须
记得的一件事,当我觉得可以让牠出房间时不能就这么
让牠出来,而是必须打开门,拿下毛巾,关上门,等牠
叫了才让牠出来,这么做吠叫的行为才能受到刺激控制
(以此例而言,
「无毛巾」的讯号代表吠叫将获得奖励),
因此也使其他状况下的吠叫行为消失了。
它的效果极佳 – 持续了三天,直到有天早上我又
突然听到彼特吵人的要求声,我打开门后发现牠想出了
办法,牠利用全身的小小力气奋力跳起来,扯掉门把上
的毛巾,当毛巾到了地面,牠当然觉得自由叫人开门的
时候到了。
 第七招:塑形出行为的消失.

当你只是希望对方停止当时的行为,但并没有特别
想要他做什么时,这个技巧便很好用;例如亲戚打电话
来发牢骚,使你心生内疚,如果你喜欢这个人,不希望
挂他电话(第一招)、责骂或奚落他(第二或第三招),
你可以使用第七招,这在学术上称为「区别增强其他行
为」(Differential Reinforcement of Other behavior,
简称 DRO)。
动物心理学家哈瑞·法兰克进行幼狼社会化研究时
每天带牠们进入屋内,他决定要以拍抚和关注增强任何
不在破坏物品之列的行为,结果发现在人类家中唯一可
以消磨时间却不会使幼狼想啃咬沙护、电话线、地毯等
东西的活动就是躺在床上,于是,哈瑞、妻子和三只越
长越大的幼狼渡过平静夜晚的方式便是一起躺在大床上
看夜间新闻!这就是第七招。
第七招:塑形出行为的消失
这招需要花点心思长期去做,但是通常是改变根深
蒂固的行为最好的方法。
行为 解决方法
室友 每当房间整洁或室友洗衣服时即买啤酒
到 处 乱 丢 请他喝或邀请异性来家中。
脏衣服
狗在 夜里不时到院子里去奖励牠安静的行
院 子 里 整 为,刚开始等牠安静十分钟,再来等二十分
夜狂吠 钟,慢慢到一个小时,依此类推拉长时问。
等到他们安静时说:「今天大家都很乖很
孩子
安静,我们等一下去麦当劳!」(当开近麦当
在车里太
劳时再说这句话,这样你可以立即履行承诺,

也让他们没机会又吵闹起来)
老公 动动脑筋想一些好的增强方式,当他们
或 老 婆 回 偶尔出现好情绪时就出乎意料地增强他们。
家时情绪
总是很差
网球 不理会错误的击球动作,击出好球时称
挥 拍 动 作 读自己(这个方法真的管用!)
有问题
员工 当他某项工作的表现令人满意时对他大
回 避 工 作 肆赞赏(不是叫你一辈子都这么做,等建立起
责 任 或 濑 新的行为倾向时即可停止)

讨厌 每次你接到礼物后即立刻寄出谢函时,
写谢函 犒赏自己去看场电影。
如果你人不在家时会关上厨房的门,不
猫味
纵容猫咪一直跳上餐桌,那么奖励牠不跳上
跳上餐桌
餐桌、并拉长这么做的时间才司能管用。
公交 若你每天都会遇上同一名司机,当他没
车 司 机 粗 有表现粗鲁时你可以愉悦地说声早安,或甚
鲁 无 礼 , 至送朵花或饮料给他,一两周内应该即可看
让 你 很 生 到改善。

你认 当成年子女离家后居住在很远地方时,
为 应 该 自 增强这个行为,不要批评他们理家的方式、
立 的 成 年 公寓、装沟或还择朋友的品味,不然他们可
子 女 想 搬 能认同你说的,去住你家比较好。
回家住
我利用第七招改变了自己母亲讲电话的习惯。那时
我罹病多年的母亲居住在养者院里,我有空会去探望她,
不过我们平日多半透过电话连络。这些电话困扰我多年,
电话里谈的通常是(有时完全是)她的问题 – 病痛、
寂寞、没钱等全是我无能为力的现实问题,她会从抱怨
转为哭泣,由哭泣又转为一些令我生气的控诉,这种言
词交流令我感到不快,甚至到了想回避电话不接的程度。
我突然想到一个也许更好的解决方法,我开始留意
自己与她通电话的行为,我运用了第四招和第七招,为
了让她自动停止抱怨和哭泣的行为,我故意用「啊!」、
「嗯!」和「这样噢!」等响应(第四招),但没有真正的
行为后果,不好也不坏,我没有挂电话或作言词攻击,
我没有让任何事情发生,然后我再增强任何不是抱怨的
话,例如当她询问我的子女如何、告知养老院的新消息、
讨论天气、书籍或朋友时,我便热切回应这些话语(第
七招)。
让我大感意外的是,在二十年冲突争执之后,我们
每周通电话的内容在两个月内从泪水和愁苦转变为聊天
和笑声,起初我母亲通电话时所挂心的事情,例如: 「把
支票寄来没有?」、「和医生谈过了吗?」、「打电话给我
的社工好不好?」等,这些不断唠叨的埋怨转成简明的
请求,于是其他时间便全用来聊八卦、忆旧时及讲笑话。
我母亲年轻时是位迷人风趣的女子,现在她又重现
了这种特质,此后在她安度余年的岁月里,我真的很喜
欢与她谈话,无论是见面对谈或通电话都是如此。
有位精神科医师朋友问过我:
「这样不算是耍心机操
纵人吗?」的确如此,不过在那之前我母亲对我的行为
也大有操纵的意味,或许某名治疗师能够说服我或我母
亲以其他方式处理我们的问题,不过这很难说。而当时
第七招看来简单多了,它的目标明确,应该增强哪个行
为?除了不喜见的行为以外都予以增强。
 第八招:改变动机

消除行为动机通常是最和善也最有效的方法,人在
食物充足的状况下就不会去偷面包。
我总是不忍观看一个常见景象:幼童在超市大吵大
闹,母亲猛扯着他的手臂要他快走。当然我们可以礼谅,
孩子吵闹很丢脸,猛扯他的手臂是想暗地偷偷把他震得
闭嘴,不会像破口大骂或动手打他那么明显(不过骨科
医师可能会告诉你,这个方法也很容易让幼 童手肘或
肩膀脱臼)。孩子出现这个问题通常是因为他饿了,受不
了眼前的食物和香味,极少年轻妈妈找得到人帮忙看孩
子而得以有空购物,而职业妇女在晚餐前往往必须去采
购,这时候她们自己早已又累又饿,自然容易动怒。解
决办法是在购物之前或购物时让孩子吃点东西,任何垃
圾食物都比大家被吵得意乱心烦来得好。
有些行为具有自我增强的作用,意谓行为的执行即
可使它增强,吃口香糖、抽烟和吸拇指的行为即为此类,
想去除自己或他人的这类行为最好改变行为的动机。我
小时候不吃口香糖,因为有位姑姑告诉我女孩子这样子
看起来很没水平,对我来说,看起来有水平比吃口香糖
的乐趣重要多了。当抽烟的动机以其他方式满足了或戒
烟的动机(例如怕得癌症)大于抽烟的增强作用时,抽
烟者便会戒烟。当小孩的自信变多时,吸拇指的行为便
会停止,因为他不再需要自我抚慰。
为了使动机产生改变,我们必须正确判断动机为何,
但是我们常无法胜任这一点,我们最爱妄下定论: 「她恨
我恨得入骨!」、「老板对我有偏见!」、「那孩子就是没半
点好!」甚至我们常常连自己的动机也不清楚,这正是心
理学和精神研究领域之所以兴起的原因之一。
第八招:改变动机 (p.189)
如果你找得到方法,这一招不但有效,而且是最好
的解决招数。
室友到处乱丢脏衣服
雇用佣人或管家来整理及洗衣服,你和室友都不必
克服这个问题,如果你和这名室友是夫妻关系又都是上
班族,这可能是最佳解决办法;或者,脏乱者可以塑形
整洁者的行为,让他变得随性一点。
狗在院子里整夜狂吠
吠叫的狗儿也许感到寂寞、害怕或无聊,利用白天
让牠运动、给牠关注,到了晚上牠才会累得想睡,或者。
晚上让狗伴陪牠睡觉。
孩子在车里太吵
吵闹和衡突越发剧烈的原因通常是饥饿和疲累,从
家里到学校的短短车程可以在车上提供果汁、水果、饼
干和枕头,让他们舒适地消磨时间;遇到长途车程时,
每小时停车十分钟,让他们下车动一动、跑一跑《这对
家长也好)。
老公或老婆回家时情绪总是很差
鼓励对方换工作。如果情绪不佳的动机是饥饿或疲
倦,对方一进门就给他吃点起司饼干或热汤·如果压力
才是问题,给对方喝杯红酒或呼吸新鲜空气和运动可能
较为适当。
网球挥拍动作有问题
不要以每场赢球为目的,转而为乐趣而打(这不适
用于世界级网球选手 --- 或者说不定也适合呢!)
员工回避工作责任或濑惰
论件给薪,不依工时给薪,任务取向的给薪方式对
非西方人的雇员极为管用,那是建谷仓的原则,大家一
起奋力工作直到任务完成,然后大家才能离开,好莱坞
电影的制作就是如此。
讨厌写谢函
我们之所以不喜欢这件事是因为它是个连锁行为
(请见第六招),因此很难起头着手,尤其整个行为完成
后缺乏好的增强物时更难(因为礼物旱到了我们手里!)。
有时我们迟迟不写的原因是我们认为要写就要写得好、
漂亮或完美,但是并非如此,收到谢函的人只需要知道
你感激对方的心意,谢函上的华美词藻和支票上的花俏
字迹也同样不具重要性,送谢函的时机恰如其时才最重
要。
猫味跳上餐桌
猫味为何跳上桌子?如果是找食物,就把食物收起
来,如果猫咪喜欢居高临下的视野,设置一个比餐桌高
的架子或高台,让你可以就近抚摸牠,观看厨房的视野
也不错,猫咪也可能比较喜欢这个位置。
公交车司机粗鲁无礼,让你很生气
避免在车上被骂,做好本份:准备好坐车的零钱,
知道哪站下车,不要挡住走道,询问问题时不含含糊糊,
试着体谅塞车的心情,公交车司机会情绪不佳有时实在
是因为乘客太烦了。
你认为应该自立的成年子女想搬回家住
如果成人拥有朋友、自尊、生活目标、工作和居处,
他们通常不会想和父母同住或依赖父母,在子女成长颠
问两他们找到前三项,通常他们就会自己找到工作和居
处,以后大家都可以维持友好关系。
即使我们自己并无偏颇的动机,我们仍为这种普遍
误解对方潜在动机的想法付出极大代价。当我们必须仰
赖医疗专业人士时尤其如此,当生理问题并非显着易见
时,它极常被误判为情绪引起的问题,并且据此进行治
疗,没有人会进一步检视真正原因是否与生理相关。我
曾见过一位生意人为了不再「感觉」精疲力竭而接受安
非他命治疗,但事实上他是因为工作过量才会精疲力竭。
美国西岸某城市有一名女子去看了六名医师,没人看得
出任何显着的生理肇因,于是她的症状被诊断为精神官
能症并以镇定剂治疗,在遇到第七名医师之前她几乎将
被送入精神病院,这位医师发现她并不是装病,其实她
是因为家中暖气设备漏气而受到一氧化碳的慢性毒害。
我自己曾经遇过一名医师,初次看诊就训了我一顿,然
后开镇定剂给我,但我当时的问题(我告诉过他我的猜
测)并不是胡乱想象自己喉咙痛,它其实是腮腺炎的初
期症状。
当然,有些动机实际上包含某种想要获得保证的需
要,如果给予纾解的人被视为可信赖的权威,镇定剂或
甚至糖衣药丸之类的安慰剂即可能安定心神、降低血压
及纾缓症状,只要你相信圣水和梼告的作用,它们也可
能奏效,所谓的安慰剂效用可能也有助巫医存在。我不
认为这有何不可,它的动机是获得保证的需求,一种非
常真切的需求,无论你遇到任何情境,窍门是找出动机,
不要直接跳到结论,一个作法是留意什么真正有助改变
行为、什么却无益。
这里的要旨是:如果你或朋友出现令人困惑不解的
行为问题,仔细思考可能的动机,不要忘记饥饿、罹病、
寂寞或恐惧等可能肇因,如果有可能消除背后肇因而使
动机消除或改变的话,眼前就是你的解决办法。
 有害无益的剥夺方法 .

动机是个许多科学家奉献毕生的重大研究要题,它
超乎本书想讨论的内容范围,但由于不良行为的发生与
动机相关,所以有必要对它进行讨论,也许我在这里恰
可讨论一个有时用来提高动机的训练技巧「剥夺」。该理
论说明动物为了获得正增强而工作,当牠越需要增强物,
牠将越加努力工作,牠的表现也将越可信赖。老鼠和鸽
子的制约学习实验常利用食物作为增强,为了提高动机,
牠们的喂食量常比自发摄食量来得少,惯常作法是只提
供牠们足以维持百分之八十五正常体重的食物量,这种
作法便称为「食物剥夺」

剥夺成为实验心理学广泛利用的标准技巧,以致我
刚开始训练时以为它大概是训练老鼠或鸽子时非用不可
的方法,当然,我们没将此法用在海豚身上,无论海豚
表现如何,结束每天工作时我们会提供足以让牠们吃饱
的食物量,因为进食不足的海豚常染病死亡。
那时我并没有意识到,我自己利用食物和社交机会
作为增强物训练迷你马和儿童的作法相当成功,不必事
先减少原来传达情感的表现或食物量就可以获得成果。
也许只有训练较简单的生物(例如老鼠或鸽子)时才需
要剥夺食物?可是,我们在海洋生物世界的训练师利用
食物增强物塑形出猪、鸡、企鹅,甚至鱼类和章鱼的行
为,从来没有人妄想事先让这些可怜的东西饿得半死。
我那时仍然认为剥夺对某些训练有其必要,因为它
是大家广为使用的方法,直到我遇到戴夫.布却尔(Dave
Butcher)的海狮才改观。我从未训练过海狮,粗略概念
是牠们只能用鱼作训练、不喜欢社交、会咬训练师,我
也以为接受训练的只有年轻海狮,因为所有我见过的受
训海狮都相当小只,体重在一百至两百磅之问,我知道
野生海狮可以长得相当大。
戴夫.布却尔是美国佛罗里达海洋世界的训练部主
任,他着实让我大开眼界,他除了利用鱼训练海狮,也
利用社交机会和抚摸作为增强物,同时还利用习得增强
物和变化性增强时制,因此他们不必饿海狮肚子也能使
牠们表演。海狮白天表演时和表演结束之后都有足够吃
饱的鱼,于是牠们不会像饥饿的动物一样容易生气动怒。
牠们对熟悉的人很友善,也喜欢被碰触,当我看到几位
年轻训练师在午餐时问和海狮群躺成一堆晒太阳时,大
为吃惊,每名男子以一只海狮的宽广侧腹为枕,另一只
海狮的头则枕在他们的大腿上。
因不采取食物剥夺,这些海狮不断地长大!戴夫推
测,过去训练的海狮体型之所以都很小,原因并不是年
纪轻,而是发育不良。海洋世界的表演海狮重达六百、
七百或八百磅,活动力十足,完全不会过胖。牠们体型
庞大,遵行大自然的原意,而且牠们表演起来很认真,
每日五场以上的演出场场精采。
我现在存疑的是,试图利用任何剥夺增加动机的方
法是不是非但没有必要,而且根本有害无益。训练之前
减少训练对象的正常喂食量、受到的关注或社交陪伴或
其他牠喜欢或需要的东西 --- 纯粹只为了提高增强物
的吸引力,使训练对象更需要它 --- 这种作法只是差劲
训练的烂借口,它在实验室里也许有必要,但是在现实
生活里,好的训练即能产生高度动机,而非倒果为因。
 解决复杂的问题 .

在本章列表中,我针对每个特定行为问题列出了所
有八招的应用方法,有些问题显然有一两个最好的解决
办法,针对狗儿夜里因寂寞害怕而吠叫的问题,把牠带
进屋内或提供同伴,通常可以确保牠只在真正需要警戒
时才吠叫,而其他问题则可因时制宜应用不同方法,要
让小孩在车里不要太吵有多种方法,可视状况选择适用
方法。
然而,有些行为问题起源于多项肇因,已经变得根
深蒂固而难以利用单一招数控制,例如咬指甲等紧迫症
状、经常迟到等不良习惯、抽烟等上瘾现象,这些行为
都可以透过这八招的精心运用而减少或消失,但是它也
许必须多管齐下才能让行为不再出现(再次提醒:此处
只指正常个体的行为问题,不包含心智罹病或心理受创
者的行为问题)。
以下我们来看看一些需要多管齐下才能解决的例
子。
 咬指甲

咬指甲是压力的症状,也可藉此转移注意力,暂时
纾解压力,这类行为被称为「转移行为」 (displacement
behavior);狗儿在紧张的情况下,例如在半推半就之下
接受陌生人拍抚时,牠可能会突然坐下来搔痒;两匹为
了争夺地位而大作威胁的马儿可能会突然出现吃草动
作。转移行为经常包括理毛等整理自身的行为,动物在
圈养环境里可能不断出现这类行为,甚至可能导致自我
伤害,鸟类不断整理羽毛,直到把自己的羽毛拔光;猫
咪猛舔脚掌舔到破皮;人类咬指甲的行为(拉头发、抓
痒等梳理行为)也可能如此极端,即使已产生疼痛也阻
止不了这个行为。
由于这类行为确实能够暂时转移对压力的注意,所
以它成为一种自我增强的行为,极难去除,事实上它变
成了一种习惯,即使没有压力也会出现。在这样的情况
下,第四招(消弱)有时候非常管用,当人们年纪渐长、
更有自信时,咬指甲的行为将逐渐消失,不过这可能得
花上数年;而运用第一招(例如:戴上手套而不可能咬
到指甲)或第二招(例如:让他滋生罪恶感或以责骂的
方式处罚他)将无法让他学会新行为。运用第三招负增
强(也许在指甲上涂必难吃的束西)可能奏效,但前提
是这个习惯本来就正慢慢消失(吸姆指的行为也可比照
处理)。
如果你有这个习惯,消除它的最好办法可能是并用
所有四个正增强的招数。首先运用第五招(训练不兼容
行为),学习观察自己什么时候开始皎指甲,每当手不知
不觉靠近嘴巴时,马上跳起来去做别件事:做四次深呼
吸、喝杯水、上下跳一跳、伸展一下,你在做这些事情
的时候将无法同时去咬指甲(而且这些运动本身就能纾
解紧张),同时运用第八招(改变动机),降低生活中的
整礼压力指数,让别人帮你分忧解劳,他们也许真的会
有解决办法,然而多多运动通常有助面对问题。你也可
以塑形出行为的消失(第七招),只要有一两只指头的指
甲长出来了,即马上送自己一个戒指或好好保养一下指
甲作为奖励。你也可试试心理学家珍妮弗.詹姆斯
(Jennifer James)的绝佳建议,训练行为依讯号出现,
选定一天时间,每当你发现自己开始咬指甲时就记下当
时困扰你的事情,然后每天晚上选个特定时间,坐下来
二十分钟,一边不断咬指甲,一边把清单上所有困扰拿
出来担心,久而久之你应该能够把咬指甲的行为塑形得
消失无踪,同时配合以上其他招数将特别有效。
 经常性迟到

生活复杂繁忙的人有时会迟到是因为他们有太多事
要忙,却必须利用有限时间全部做完,例如:职业妇女、
刚创业或正扩展事业的人、医师……等,但有些人无论
忙碌与否,很容易把迟到当成家常便饭。由于有些异常
忙碌的人仍极为准时,我们理当怀疑那些常迟到的人其
实是自己选择迟到。
你可能以为迟到的行为自有不良后果,会彩成负增
强的情形 – 例如只看到后半场电影、派对已快结束、
让等你的人等得非常生气,但是这些后果较像处罚,而
非负增强物,它们处罚了「到达」的行为,而且习惯性
迟到的人通常都准备了绝佳的借口,当他们被原谅时这
个行为便受到了不错的增强(他们因而发展出编造借口
的高明技巧,而它事实上对迟到的行为具有增强作用)。
最快克服迟到行为的方法是运用第八招(改变动
机),人们迟到的理由非常多,其中一种是恐惧,因为不
想去上学,所以四处闲晃;另一个理由则是试图寻求同
情,
「小小的我真可怜,背负了太多重责大任,让我没法
完成这些托付。」另外还有恶意迟到(暗地里并不想和这
些人在一起)和炫耀性迟到(让大家明白你的时间宝贵,
有比到场吏要紧的事要打理)。迟到的真正动机其实无关
紧要,如果你不想再迟到,只需要改变动机,下定决心
无论遇到任何状况都会把准时作为第一考虑,很快地你
将不再需要赶飞机或错过约会了。
我自己这辈子老是迟到,以下是我「治好」这个毛
病的作法,在我决定把「准时」视为重要的事之后,我
发现一些问题自动有了答案,例如: 「我去参加委员会议
之前有时间去做头发吗?」、「去看牙医之前有时间先去
处理一些杂事吗?」、
「我现在就得出发到场了吗?」,它
们的答案一定是「没有!」、「没有!」、「是的!」,我偶尔
还是会故态复萌,不过大致说来,选择了「准时」让我
的生活和亲友同事的生活都变得轻松容易多了。
如果改变动机还不够,你可以加上第五招(训练不
兼容的行为),目标是提早到达约定地点(带本书去),
或者加上第七招(塑形出行为的消失)。当你没有迟到时,
请给予自己增强,并且也请朋友增强你的行为,因为「不
迟到」这件事对别人来说也许很正常,但是你却得特别
努力才做得到。同时试试第六招,依讯号出现迟到的行
为,选出一些你厌根就不想准时到达的活动场合,告知
大家你会迟到,然后再姗姗来迟,由于依照讯号出现的
行为在缺乏讯号之下通常会消失,在没有风险的情况下
刻意迟到可能有助消除必须准时的情况下「意外或无意
间」迟到的行为。
 上瘾现象 .

沉迷于吸收性物质(香烟、酒精、咖啡因、毒品等)
的上瘾现象其有生理影响,这种作用通常让人用尽方法
都戒不了瘾,而且当人无法取得这些物质时将出现难受
的戒断症状。但是上瘾现象也有极大的行为成份,有些
人好似上瘾一般,对于茶、可乐和巧克力等相当无害的
东西,甚至对跑步或吃东西等消遣也出现戒断症状。不
过有些人可以轻易控制他们的瘾头,举例来说,抽烟者
多半发现自己的烟瘾如同时钟般规律浮现,如果身上的
烟一根不剩会让他们抓狂,可是有些正统犹太教徒能够
一周六天大肆抽烟,到了安息口则完全戒欲,并无任何
不快影响。
多数上瘾现象除了生理症状之外,也可暂时纾解压
力,因此它们成为转移性活动而加倍难以根除,不过由
于上瘾现象具有很大的行为成份,可想而知,任何上瘾
问题都可能藉由八招之一或并用多招而获得不错的成
果。
几乎所有成瘾行为的矫治计划(包括戒酒诊所和西
纳农勒戒村)都非常重用第一招和第八招,让矫治患者
无法取得沉迷物质,并且改变需要这凭.东西的动机 –
予以治疗而找到其他提供满足的来源(提升自尊、内心
成长、工作技能等)。许多疗程也依赖第二招(处罚),
一般作法是对把持不住再度犯瘾的行为大肆挞伐,因而
引发罪恶感,我曾经参加过一个戒烟计划,事实上它的
帮助甚大,虽然我仍不时犯规,当找犯规时(例如参加
气氛紧张的公事会议时偷偷吸别人的二手烟)我甚感罪
恶,甚至到了隔天早上我还会因过度内疚而出现病状,
可是这并未让我不再犯规,第二招(处罚)和第三招(负
增强)对我的作用不太大,但是对某些人很有用。许多
减重计划不但常着重在人们变瘦后的公开赞美,同时也
常强调在众人之前变胖有多么丢脸,有些人会因此努力
避免遭受羞辱的可能性。
很多上瘾行为含有迷信成份,无论是吃东西或抽烟
等行为,它碰巧与引发这种欲望的环境讯号产生了意外
关连性,例如每天到了某个时间就想喝杯酒、电话响时
就想点烟等等,你需要有系统地找出所有讯号,在每次
讯号出现时克制自己不去做这项行为,让它消失不见,
一个一个地一让这些讯号全部失效。去除上瘾习惯时可
以附带运用极为有用的第四招,这个方法很简单,例如
把烟灰缸收到看不到的地方、或者全面改变环境,搬到
一个完全不存在旧有引发讯号的新环境(若戒掉海洛英
毒瘾的人马上又回到熟悉街景里生活,他们很难继续保
持不犯瘾)。
人们一直以来鼓吹使用处罚的行为疗法可以控制上
瘾现象,举例来说,过去曾在酗酒成瘾的人身上装上电
线,只要一拿起酒杯即遭电击,也有让人饮酒后引发呕
吐的药物,这些方法能够奏效的前提和多数负增强物一
样,必须有人在旁执行,而且最好让对方无法预测何时
执行。
多数上瘾行为无法轻易利用单一方法改变,要对付
自己的上瘾行为应该好好研究这八招(行为者本身也许
即是最有效率的训练者)
,并且试着找寻哪些方法可以让
自己经常应用这些招数(当然,处罚除外)。
第五章. 生活中的增强现象
.我在前言讨论到史金纳的理论时,提到叔本华曾
说:
「每个创新的观念会先被人取笑,然后被人大肆挞伐,
到后来才会被视为理所当然。」我认为观念的演化还有第
四阶段 --- 不但被人接受,同时也被理解、珍惜及利用。
正增强的概念便是逐渐走入第四阶段,尤其出现于成长
于史金纳理论风行年代的人们,这些五○年代出生的人
毫不戒惧或抗拒地接受了正增强和塑形法,如同今日的
小孩轻易接受计算机,尽管他们的父母或许仍恐惧计算
机,这些人与前辈分享技巧,并用热情感染周遭的人。
以下是一些令我振奋的例子。
 增强之于运动

根据我的观察,多数团队运动(例如美式职业足球)
的训练方式仍维持十分传统的原始作法 – 经常予以剥
夺、处罚、偏颇、言词或精神摧残,不过个人运动项目
的训练似乎正历经剧变,事实上我正是因这个剧变的征
兆才着手撰写本书。我在纽约威彻斯特郡(Westchester
County, New York)的一个晚宴上被安排坐在女主人的
网球教练身旁,这位年轻的职业球员来自澳洲,他对我
说:「听说妳以前训练海豚,妳知道那些史金纳的理论
吗?」
「是啊!」我回答。
「那请妳告诉我哪里能买到史金纳的著作,我希望
成为更棒的网球教练。」
我知道当时并没有这样的书,至于为何没有的原因
我至今依然不解,不过我决定自己写一本,于是才诞生
了本书。同时,还有一件同样让我不解与惊讶的事:眼
前这位教练(想必还有一些像他一样的人)竟然完全明
白自己需要什么,这意味着有些人已经有了增强训练的
概念,而且还想了解更多相关信息。
当时我居住于纽约市,为了纾解困于家中、甚少活
动的都市生活,也为了满足一下训练师的好奇心,我开
始去上一些运动课程,包括赫赫有名的运动课程,也包
括回力球、航船、滑雪(滑降滑雪和越野滑雪)、溜冰和
舞蹈。
出乎我意料的是,除了一位讲师(运动课程讲师)
使用传统恫吓和嘲弄方式激发行为以外,其他人都运用
适时正增强的方式,也常运用十分高明的塑形技巧,这
与我早期学习运动(芭蕾、骑马和学校体育课)的记忆
大为不同,我从来不曾在运动上表现出色,而且对每一
项都既爱又怕。以溜冰为例,我幼时到一间很成功的大
型溜冰学校上花式溜冰课,讲师示范方法之后就让我们
自行练习,直到我们做出动作为止,讲师一边纠正我们
的姿势和手臂位置,并且告诫我们需要更努力。我从来
学不会多数花式溜冰招式的入门技巧(外刃滑行)
(outside edges)- 把重心放在左脚冰刃外侧,向左滑
出圆圈,所以我一直无法进步。
现在我到纽约一家由奥运教练管理的现代溜冰学校
试上几堂课,旗下员工无论对成人或小孩都使用相同的
教导方式 –不责骂也不催促,只要看到一点儿成绩即立
刻提供增强,那里有许许多多可以创造出成绩的机会,
从跌倒后如何站起来的基本技巧开始,所有溜冰须知的
技巧都分解成容易达成的很多小小阶段性塑形步骤。想
以单脚滑行?很简单,用力把自己从墙边推开,先以两
脚滑行,再抬起一只脚,只要很短的时问就好,把脚放
下,然后换抬另一脚,然后再重复所有动作,这次把脚
抬高稍久一点,依此类推,整个入门班的学员包括力气
较弱的人、站得不太稳的人、很年幼的孩子和年纪很大
的长者,十分钟内全都学会了以一只脚滑行,大家脸上
都带着甚为惊讶和欢欣得意的表情。
我甚至没意识到他们在第二堂课塑形出来的「剪冰」
(crossover)动作治好了我幼时的平衡问题,一直到我
在课后自行溜冰时能够自在快活地以外刃滑弯时才察觉
到这一点。我的改变还不止如此!到了第三堂课我便能
够作旋转动作(真的和电视上看到的溜冰选手动作一模
一样),以及灵巧的小小跳跃动作,这些全是我幼时不敢
奢望做到的动作(起初塑形这些动作时是靠着墙练习,
真是极富创意的方法!)原来事实的真相是,学习这类技
巧的困难并非来自体能,而是缺乏好的塑形步骤。
另一个例子是滑雪。玻璃纤维滑雪板和滑雪靴的出
现让一般大众也能接触滑雪运动,不再仅限于厉害的运
动员,但真正让大众出外滑雪的原因在于教授滑雪的方
法,初期利用短的滑雪板塑形出必要的行为(减速、转
弯和停下来,当然也包括如何跌倒和站起来),透过一连
串容易达成的小步骤训练,并以正增强物予以标定。我
曾到过科罗拉多州的滑雪胜地亚斯本(Aspen),遛上了
三堂滑雪课就滑下整座山,同班滑雪新手中有些精力充
沛的人在训练一周后即能挑战中级难度的坡道。
教学成效迅速的教师一直都零星存在,但我认为过
去一、二十年间的改变在于,迅速产生成效的教学原则
已逐渐融入标准教学策略中:「不骂学员,按步骤从一做
到十,每达成一个步骤即予以称赞增强,只要照着这么
做,多数人只需三天就能上山滑雪。」当多数讲师利用塑
形和增强收到迅速成效时,其他讲师为了竞争工作市场,
自己也必须改用新的教学方法。若每项个人运动都出现
这种现象,它或许就是形成现今所谓「健身风潮」的关
键因素,它让运动技能的学习过程变得好玩又有趣。
 增强之于经营

在美国,劳工和管理阶层在传统上居于对立角色,
美国商业文化的同舟共济概念一政 不是很普遍,商业
常规作法似乎注定双方尽可能设法只受不施,这从训练
的观点来看当然极其愚昧,而且有些管理阶层也倾于实
行其他作法。60 年代很流行「敏感性训练」 (sensitivity
training)等社会心理方法,它教授主管理解同侪和员
工的需求与感受,人们或许倍受启发,但却仍不知道如
何处理员工问题。企业的现实面在于,大家的职位有高
有低,有人下令、有人执行,在我们的国家里,工作的
情境多半不像家庭模式,也不应该走家庭模式,因此家
庭式人际问题的解决方法便不合用。
最近在商业新闻及期刊不断出现一些从训练角度出
发的管理作法,这些运用增强的作法有的富含创意、有
的高明至极,举例来说,一位管理顾问建议,当必须部
分裁员时,先找出工作表现最差的百分之十和最佳的百
分之二十,然后解雇那群表现最差的人,但必须记得告
诉另一群表现最佳的人,他们之所以被留下来是因为工
作表现优异。这真是个「敏感」的建议!在这种人心惶
惶的时期,这个作法可以省得最佳人名夜里失眠而且也
发挥相当大的增强效果,除此以外,它也可能激励表现
中等的人追求他们眼前所见的增强物,或者避免成为表
现最差的那一群人。
有些管理技巧的设计围绕在真正能使员工感受到增
强的事物上 – 注重什么对员工有用,不只注重什么能
够赚钱。对于中年的中阶主管而言,他们的增强物可能
不是升职,而是较有趣的工作任务,因为他们可能无法
胜任新职位(或因为必须举家搬迁而不想要新职位)。有
家计算机软件公司基于烟雾微粒可能会使产品受损的好
理由,发给不抽烟和戒烟的员工现金津贴。而其他增强
物的使用扩及到自由选择上班时间(「弹性上下班系统」
『flextime』,尤其受到职业妇女的欢迎)、在自我管理
的生产团队里工作、以完成的工作换取奖励(而非以工
作时数)。
缩减开销和加速产能的计划方案实质上只企图迫使
劳工不再表现得和目前一样糟,它的成效远不如一些协
助劳工表现更佳再予以奖赏的计划方案,运用正增强的
企业常在营运跌至亏损底线时收到成效。向来以员工福
利极为完善着称的达美航空公司即为一例,公元一九八
一年经济衰退期间,达美航空虽然负担营运损失,但它
仍不愿解雇旗下三万七千名员工中任何一人,每人还反
倒加了百分之八的薪水,在这种长期建立起来的正增强
风气下,达美航空的员工们集资为公司买了一架价值三
千万美元的新波音七六七客机,反过来对公司作了一次
增强动作。
 动物世界的增强现象

在本书中我不时提及增强理论发挥的作用,它让专
业动物训练师能够使无法以暴力训练的动物建立起行
为,牠们包括猫咪、美洲狮、鸡、鸟和鲸豚。增强式训
练开启了通往新发现的领域,而我相信这个探索之旅才
刚起步而已。
训练动物时不必先想好要动物做什么,是增强式训
练的好处之一,你可以增强任何一个牠刚好自行出现的
行为,再观察它可以演变成什么行为。没有人妄想斑海
豹会「说话」,但是新英格兰水族馆研究生贝兹.康斯坦
丁(Betsy Constantine)注意到一只因救援而来的斑海
豹「胡佛」能够发出类似人话的叫声,于是她利用鱼作
为增强物针对胡佛的叫声进行塑形,很快地胡佛已能
「说」很多话。
「向这位小姐打个招呼吧! 胡佛」
胡佛以低沉喉音,清楚地说出: 「嗨啊!甜心,哈 ---
尔 --- 呀?」(英文原为 How’re you? )
听到牠这么说很好玩,这个现象也引发哺乳动物学
家和生物声学专家进行科学研究的兴趣。
对我这个行为生物学家而言,增强式训练最有用也
最棒的地方在于它开启了通往动物心智的窗口。动物不
具有心智或感觉的否定性说法已经盛行数十年,这种说
法或许很「健康」,去除了诸多迷信、过度解读(「我的
狗懂得我说的话。」)和误判的情形,可是一批由康拉德.
劳伦兹(Konrad Lorenz)博士带头的行为学家指出,动
物具有不同的内在状态(生气、恐惧等),透过极为清楚
的姿势、表情和操作表现出来,这些都可被辨识及解读。
当训练者和动物彼此看得到对方,而且双方都受到
保护。无法作肢体接触或伤害对方(动物在笼内或栏内,
而训练者在笼外或栏外),那么这只动物便可以自由表达
任何训练互动时所引发的内在状态。动物里常会因此开
始向训练者表现出因此产生的社会性行为 – 这些讯号
可能是问候行为,也可能是大发脾气,如果对某个物种
一无所知,却知道这些动物对不同训练事件出现的经常
性反应,那么从半小时训练当中所了解的社交讯号可能
比花一个月观察牠与同类互动要来得多。举例来说,如
果我看见一只海豚跳到空中,池中也有其他海豚,在牠
入水时溅起了很大的水花,这时我只能推测牠为什么这
么做;但是如果在训练过程中,因为我没有增强一个过
去牠一直被增强的行为,而海豚跳到空中,入水时溅起
硕大水花对准我,让我从头到脚全身湿透,我就可以有
些肯定地说,这种跳高溅水的行为可能是种挑衅表现,
而且效果也很好。
能够解读的行为还不止如此。参与简单塑形过程的
野生动物可以让你惊鸿一瞥牠们的倾向,或可称作「物
种性情」(species temperament),意谓动物面对各项环
境挑战时,不只单一个体,而是该物种的所有个体都倾
于出现的应对反应。我在国家动物园教导管理员如何作
训练时,我使用许多不同物种作示范,我站在围栏外,
围栏内的动物可以自由活动,我利用哨音作为制约增强
物,并且丢入食物,结果一只北极熊极其坚持固执,由
于牠坐着不动时凑巧意外获得增强,于是牠开始坐着不
动,不断望眼欲穿地流着口水,死盯着训练者看,长达
半小时以上,只期待着获得增强,对这种在浮冰上追踪
海豹维生的动物,如此的固执和耐性可能具有重要的活
命价值。
无论大象对平时习惯的操作员多么温顺服从,我作
梦也不会妄想进入国家动物园的大象栏舍里,不过有了
管理员吉姆.琼斯(Jim Jones)的协助,找曾隔着护栏
和一头年轻雌印度象「仙提」 (Shanti)进行了两次「自
由发挥」训练。我决定塑形牠丢飞盘,我们先从拾回飞
盘开始,仙提立即开始与飞盘玩一○一件事的游戏,尤
其会用它制造声响(吉姆告诉找大象喜欢制造声响)。仙
提用飞盘制造声响的方法是先用鼻子抓住它,再用它拍
敲墙壁,或像拿着棍子的小孩一样在护栏上拖动飞盘发
出噪音,或把它放在地上,再用脚把它推来推去,我看
得很开心,牠真是很好玩。
仙提很快学会把飞盘拾给我,用来交换一声哨音和
水桶里的零食,牠也很快学会只要牠站得离我稍远一点,
我就必须把身子伸进去一些才拿得到飞盘,当找没上当
时,牠重重给了我的手臂一击,吉姆和我都因此大骂牠
(表示我们不赞同这个行为,大象会尊重这个讯号),牠
则又开始把拾回做得很好。但接下来牠却假装不记得如
何把胡萝卜拿走,牠整整花了一分钟,一边用鼻子碰触
着我手上的胡萝卜,一边还别有用心地探入我的水桶看,
想让我了解牠偏爱桶子里的苹果和地瓜。
当我开始给予牠偏爱的增强物,证实自己脑筋不差
又会顺着牠时,牠立刻故技重施,用鼻头碰碰触触,又
别有用心地瞥我一眼或与我四目相接,试图要我打开栏
舍的挂锁,大象不只是有点儿聪明而已,牠们实在聪明
得惊人。
许多动物在塑形训练中都会表现出物种性情。有次
我因为不慎而没有增强一只土狼,结果牠没有生气或放
弃,而是展现牠的魅力,来到我面前坐着,咧嘴咯咯笑
着,活像个披着毛皮的钱宁.卡森(Johnny Carson,美
国老牌脱口秀主持人)。我也曾在塑形一头狼绕过活动场
树丛时犯下相同错误,错过应该增强牠的时机,结果那
头狼转过头与我四目相接,若有所思地瞪着我很久,然
后跑走,直接绕过了那个树丛,我便把身上所有的食物
给了牠。那头狼刚才衡量了情势,也许牠的判断是,我
继续看着牠所以训练应仍在进行中,而牠也冒险孤注一
掷,看看是否猜得对。真是喜欢冒大险的动物,土狼如
果是搞笑的喜剧演员,狼可比是冒险犯难的北欧维京海
盗。
有些时候动物可能完全明白增强是怎么一回事。国
家动物园的玛兰妮.庞德(Melanie Bond)负责园内的巨
猿,她着手增强了黑猩猩「汉姆」的多项行为。有天早
上,汉姆把牠的食物全收集起来但并没吃掉,玛兰妮猜
测牠可能想带到户外吃,当汉姆看到玛兰妮终于要去开
门放牠出去时,牠很清楚该做什么 --- 牠递了一根西洋
芹给她。
我能够体谅生物学家为何想在毫无干扰或干预之下
观察动物的自然行为,而有些人也因此反对训练,认为
它极度干预行为;我也能了解(尽管我无法同理体谅)
实验心理学家为何回避只有观察记录却无数据支持的动
物相关结论,不过我仍深信塑形训练是结合两方研究策
略的有效方法,而且如果野地或实验研究工作者无法或
不愿采用这个工具,他们或许会错失重要的发现。
想要进入人类封闭起来的心灵世界,善加运用塑形
和增强可能极为重要。我的朋友贝佛莉是一家多重障碍
儿童收容机构的治疗师,机构儿童若非又聋又盲即瘫痪
弱智,她制作了一个可依麦克风声音变换闪动模式的彩
灯装置。一名脑性麻痹导致瘫痪弱智的孩子「黛比」终
日躺在床上了无生气、一动不动,她第一次看到这些灯
时就大笑了起来,她听见自己的声音被放大,看见亮灯
数目变多了,立即学会了只要继续笑和出声,她便可使
彩灯「跳起舞来」;由于发现了黛比有能力使这个有趣事
件发生,这名治疗师才有可能开始教导黛比如何沟通。
另一个孩子出生时即缺少部分头骨,必须永远戴着保护
头盔,大家一直以为他全盲,因为他只摸索着移动,而
且不曾对任何视觉刺激出现反应。贝佛莉鼓励他对着麦
克风出声,好让他听见自己的声音被放大后而获得增强,
接着她发现这个男孩也会转头朝向彩灯的闪光,而且为
了让灯光跳舞,他发出声音的时间越来越久,事实上他
是看得见的,这时机构人员知道,他们有了一个全新的
「频道」可以沟通并协助这个孩子。
但是这个特殊的训练玩具在机构环境之下被束之高
阁,理由是贝佛莉只有硕士学历,不应该带头施行创新
的治疗方法,没有研究报告证实彩灯对多重障碍的孩子
有所帮助,事实上这个违反既定规范的新作法还引起了
机构其他人员的嫌恶。但是这些都不重要,重要的是增
强式训练可以带来许多启发 – 它不但启发了训练对
象,也让人多加了解训练对象,有时只要几分钟的训练
就可以出现这些启发现象。
 增强之于社会.

有些人可能会认为,行为学者似乎向来宣扬人类所
有行为都是学习和制约的产物,而且每个「生了病」的
人(无论是好战或长疣)都可以透过适当的增强方式「治
愈」。事实当然不是如此,行为是综合外在和内在反应(无
论习得或天生)的结果,个体行为是天生的,每位母亲
都明白这一点(生物学家曾证实个体行为甚至出现于昆
虫身上)。此外,我们的行为和感受有极大部分是我们这
种社会性动物演化的结果,包括喜欢合作、善待他人的
倾向(「互惠利他行为」『reciprocal altruism』),也包
括有人践踏我们的想法或土地时表现攻击反应的倾向
(「领域性行为(territoriality)」),然而每个人在某时
某刻出现的行为或说出的话可能也视当时生理状态、过
往经验或未来期许而定,人饿得半死或患重感冒时的行
为可能相当不同于状态舒适时的行为,无论其他影响因
素存在与否。
因此,增强法并不是无所不能,我认为这没什么不
对。在我的想象中,我们对行为的认识有如相互交集的
三个圆,一个圆代表史金纳博士等行为学者以及有关学
习和获得行为的所有知识,另一个圆代表劳伦兹博士等
行为学家以及行为演化的所有相关知识,第三个圆则代
表我们尚未透彻了解的行为(例如游戏行为),每个圆都
有一部分范围与其他两个圆交集。
由于社会不只存在交互增强的关系,有些在集体情
境下施行的社会学增强实验获得了褒贬参半的结果;举
例来说,在阶级性社会团体(监狱、医院或少年感化院)
使用增强法时,使它效果不彰的人可能正是给予增强的
人。有位心理学家朋友向我描述过一个针对感化院少年
使用的代币系统,它的先导计划成效显着,但是移至另
一个机构施行时却一败涂地,甚至产生了不和及抗拒。
结果发现机构负责人员确实依照指示增强少年上课等好
的表现,可是他们发下增强代币时却没有面带微笑,这
个小小失误被那些男子气概十足的少年犯视为羞辱(我
认为这的确是正常反应)
,于是整个计划终告失败。
人们一直以来都把增强法应用于个人及团体身上,
目的不只是培养特定行为,也用来建立符合社会价值观
的个性(例如责任感)。个性通常被视为天生,不过它也
可以被塑形,诸如创造力就可以被增强;我儿子麦克读
艺术学校时住在曼哈顿区的一处阁楼,他从街上检来一
只幼猫,对牠增强了任何能逗他开心的「可爱」行为,
我不知道那只猫心中如何定义牠自己的可爱行为,不过
牠因此成了一只最不寻常的猫 –直至中年依然胆大、专
注、忠心,而且举手投足间尽是令人惊喜的表现。我们
在海洋生物世界曾塑形两只海豚的创造力(这个实验已
被收录在许多书籍中),作法是增强任何从未被增强过的
新奇行为,这两只海豚很快抓到要领,开始(发明)相
当有趣的行为,竞相出现越来越奇特的行为。一般说来,
即使在动物身上,创造力或想象力的多寡亦可能因个体
而异,但是训练可以「改变」每只动物的创造力曲线,
因此无论牠原先拥有多少创造力,任何人都可能让它提
高。
社会体系(尤其是学校系统体系)有时会因为压抑
创造力(而非予以鼓励)而受到批评,我认为这类批评
尽管有理,但社会偏于安于现状的倾向也是可以理解的。
那两只海豚学会发挥创意的重要性之后,牠们变成了确
确实实的捣蛋鬼,打开栅门、偷取表演器材并且发明淘
气的招数。喜欢求新求变的人,本质上即无可预测,或
许社会只能容许这类人存在一定的比例,要是所有人都
和那些创意十足的海豚一样,什么事情都别想办了,于
是个体创造力常受到遏阻,以利集体模式的出现。或许
挑战这种趋势所需要的勇气有助促成改革人士的成功
吧。
我认为增强理论对社会的重大影响并不在于改变了
特定行为或特定机构,而是在于接受正增强后所产生的
个体影响。增强就是信息 --- 这个信息告知你哪个行为
有用,如果我们拥有信息,懂得如何让环境增强我们,
我们便能控制环境,不再任它为所欲为,事实上就某些
层面来看,我们的演化适应度即取决于这类成功控制。
因此,训练对象喜欢透过增强法学习的原因并不是
为了显而易见的理由、获得食物或其他奖励,而是因为
牠们能够实际获得一些控制环境的能力。而人们喜欢利
用增强法改变其他人或动物的行为则是因为获得的反应
非常令人有成就感,当你看到自己协助达成的成就使得
动物变得活跃有精神、小朋友眼中闪耀光芒、人们变得
自信耀眼时,这个景象本身就是极具威力的增强物,这
种得到好成果的经验绝对会让人像上瘾般,再多也嫌不
够。
增强式训练有一个令人难解却极为重要的必然后果
--- 它会增进训练对象和训练者的感情。我在海洋生物
世界工作时曾目睹多次,经过标定讯号(哨音)和食物
增强物的塑形训练之后,野生海豚突然变得相当温驯,
允许人类拍抚并且寻求社交注意,完全不必特别让牠习
惯手或训练牠出现这种行为。我也看过马匹发生这种现
象,有时只要训练一回即会发生,我甚至也在多种决不
可能驯服或作为宠物的动物园动物身上看过这种现象,
这些动物表现出的样子就好像牠们爱上训练者了。
训练者也很快发展出情感,我想起大象「仙提」和
那匹狼「迪亚坦那」时仍怀着敬重之意,我甚至偏爱那
只脑袋不太灵光的北极熊,我相信这是因为成功的训练
互动使得参与者彼此成为类化后的习得增强物:对训练
对象而言,有趣、兴奋、有所回报、愉快满足的事件都
源自训练者,而对训练者而言,训练对象的反应既有趣
又有成就感,于是两者产生了相互依附的真实情感,它
并不是一种依赖,只是情感依附,双方在生命过程中是
共同作战的伙伴。
在人类关系的层面,善加运用正增强可能出现深远
的作用,它可以发展并强化家庭的归属感,巩固友谊,
带给孩子勇气,教导他们发挥想象力,而且他们日后也
将拥有高超的增强技巧,这将成就美妙的性爱关系,毕
竟在某种程度上,性爱是一种交互给予正增强物的关系,
如果两人都是增强对方的高手,他们很可能便是一对神
仙伴侣。
善用增强法的意思并不是「不加选择」或「从不拒
绝」地随便给赏,人们的确会陷入这样的错误迷思。有
次我看见一位母亲在街上推着婴儿车上的学步幼儿,我
注意到每次小孩开始吵闹,这名母亲就停下来,拿出一
小袋健康零食(葡萄干和核果)给小孩吃,然而小孩的
样子看起来并不像是肚子饿,有时还会推开她的手,虽
然她设法做正确的事,但是她正认真尽责地增强孩子的
吵闹行为,她并没有检查孩子衣服是否皱起来没穿好,
或孩子是否可能有其他不舒服的地方才吵闹。
没有人能完美无缺,我的提议并不是要大家必须时
时刻刻想着增强,而是建议大家改以正向反应进行人际
互动,取代残酷刻薄、激烈争辩、退缩不参与等普遍出
现于许多家庭和机构团体的反应,这个改变不仅将影响
互动的参与个体,也像水滴引起的涟漪一样,向外扩散
影响所属的社群。
就我看来,美国社会尽管拥有各方面的自由,它却
是个惩罚性社会,我们背负加尔文主义人性本恶
(Calvinistic negativeness)的重负,影响我们所有
制度和多数看法(无论个人的背景差异)。改采正增强可
能带来惊人的转变,一九八一年,一个极想留住好教师
的亚利桑那州小镇设立了基金会,它向地方人士募款,
由学校教职员和小区人士票选五名最佳教师并授予奖
金,有时金额几近一个月的薪水,颁奖仪式在高中毕业
典礼上举行,而且学生也自发地起立鼓掌,向获奖教师
致意。这个计划进行到第三年时,学生和教师似乎都同
样受益,当地由不同人种、族裔背景和贫富阶级构成的
学生出现了高于全国平均的学术评比成续。
这个故事让我觉得意义重大的地方并不是他们用来
增强优秀教师的方法(虽然这个主意不错),而是它成了
新闻,而且成了全国性报导,此时此刻我们的文化视正
增强为一种新奇主张,不过它很快成为众所接受的主张,
较少被当成实验或狂想了。
这种转变可能会花上一代、两代或三代的时间,现
在正增强已结合许多理论,而这些理论让我们能够在问
题出现时进行分析,我推测时间将证明正增强概念传播
力极强,不会受到压抑,但我料想多数行为学者的意见
应该与我一致,都想不透为何得花这么久的时问。
人道主义者反对大部分的行为学论,或许因为它暗
示社会上所有事物可能都受到人们心怀意图的操作,而
且本该如此(其实多数事情已是如此 --- 只不过操作成
效很差)。我认为这种恐惧毫无根据,史金纳建立在增强
原则之上的假想社会「桃源二村」(Walden Two),以我
身为生物学家的角度来看,这并不可能达成,理想主义
者的社会(无论是假想或实际)有时没有考虑到地位冲
突等的生物学事实,或者企图将它消除,但毕竟我们是
社会性动物,因而必须建立位阶制度,群体里竞争地位
的现象在所难免,无论是众所认同或规定的领域,所有
领域都一样,而且这个现象行使一个重要社会性功能:
不管是乌托邦理想国度或马群,位阶制度的完善存在具
有减少冲突的作用;大家明白自己的位置,所以不必一
面低吼表明这一点。我认为个体地位、群体地位和人类
许多其他需求和倾向都过于复杂,至少以长期来看,不
可能以事先计划增强的方式达到满足或超乎其上。
反过来看,令行为学者担心的是,他们看得出来在
社会上许多地方正确运用增强将大有成效,但是我们却
一昧顽固愚昧地使用错误方法,例如,我们给予他国武
器和援助,期待他们与我们站在同一边。老天!这种期
望自己获得好处而先给他人奖赏的方式是没有用的,甚
至在最基本的层面即已引发适得其反的效果(「她邀我到
她的派对去只是想要我带份澧物给她,我真是讨厌她!」、
「提莉姑妈今天表现得特别和蔼可亲,不知道这个老太
婆这次在盘算什么?」)我也不确定我们以强硬手段对付
不听话的国家是否较为有效,要是他们不在乎的话呢?
如果他们本来就想激怒我们呢?
我知道这种说法可能过于单纯,但是我认为,如果
一个国家采取的作法让任一位响片训练者都信誓无效,
那么持续这么做才真的是头脑简单。无论于国家或个人
层次,身为训练者都应该不断质问自己一个基本问题:
我真正增强的行为是什么?
增强原理是威力强大的工具,但是它的应用变化无
穷,超乎某些人的预设,事实上有些人还宁愿它不是如
此多变。运用增强有如参与一个持续改变、持续有施有
受、持续成长的过程,人们发觉到这种沟通的二元双向
性本质,变得较能意识到他人,也必然因而更意识到自
己。训练可以说是一个必须同时知已知彼的过程,是谁
在训练谁呢?双方都历经改变与学习。
有些人把增强理论视为控制、操纵及限制个人社会
的方法,但是如同物种改变必须从个别基因开始,社会
的改变也必须先由个人开始 – 先从有利个人的转变开
始,它不可能由控制、操纵及限制的作法达成,至少这
些不可能是长久之计(就生物学来看,作家乔治.奥韦尔
[George Orwell]的恐怖乌托邦小说『1984』中所描述的
世界并不可能实现) ,生物不只有获得食物和庇护处的权
利,也有处于增强性环境的权利。使用并了解增强是种
个人经验,这种经验可能导致所有人受益,它与限制压
抑相去甚远,它解放了我们所有人,使我们体验、察觉
并增进丰富绝妙的行为多样性,而非专注于行为的机械
形式。
第六章.响片训练·一种新的训练技巧
 日益普遍的响片训练 .

本书在一九八四年首度出版时,「应用行为分析」尚
未受到广泛利用,三十年的海豚训练并未让它广受应用,
虽然学术人士得以在企业和机构中成功运用行为分析,
但是他们尚未想出任何让人简单理解这些科学原理的办
法,无法让未经训练的人士加以运用。不过对狗儿饲主
来说,这种情形开始有了转变,兽医伊恩.唐拔(Ian
Dunbar)博士是一位极具天份且举足轻重的犬只行为学
家,他的文章及课程一向对狗儿饲主推崇以行为取向的
无胁迫训练法,他也向大家推荐本书!
六○年代,史金纳博士是首位提议以响片训练犬只
的人,但是我认为响片训练真正始于一九九二年五月于
旧 金 山 举 行 的 「 行 为 分 析 协 会 」( Association for
Behavior Analysis)会议,由训练师和科学家进行了一
次座谈会,几天后我与训犬师盖瑞.威尔克斯(Gary
Wilks)、海洋哺乳动物训练师英格丽.雪勒伯格(Ingrid
Shallenberger)举办了一个二百五十位训犬师与会的
「别毙了那只狗!」讲座,盖瑞在一家卖小玩意的店里找
到一些小小的塑料响片,它们不但是很棒的教学工具,
也是很棒的标定讯号,人们开始拿着它们训练。这场训
犬讲座促成了其他讲座,我相信这些群众讲座以及由它
们大量衍生的书籍、录像带和网络活动是响片训练运动
的开始。
参加这些讲座的观众并非全是专业训练师,有些人
可能只是热衷训练的业余爱好者,包括律师、飞机驾驶
员、警察、老师、程序设计师、公司经理、牙医、医生
和记者,这群人具有活跃的喜好兴趣,精力充沛,思维
条理分明,他们开始教导其他人进行这种训练,很快地
数以千计的人们尝试着响片训练,并且把它运用到我们
这些创始者都望尘莫及的境界。
两名维吉尼亚州的年轻女子制作了一段录像带,影
片中记录她们如何利用响片训练狗儿做到三十余项的把
戏,其中有容易的(在想出门时摇铃),也有邪恶至极的
难度(把狗饼干递给另一只狗)。西雅图警犭训练师史帝
夫.怀特设计了一个训练警用巡逻犬的响片训练计划,该
计划的其中一只警犭毕业生在第一晚到街上执勤即抓到
三个「坏人」 (整个过程中尾巴还摇个不停,这是狗儿接
受响片训练后的特色行为)。德州的罗丝玛丽.贝塞尼克
(Rosemary Besenick)开始教导一些行动受限的轮椅人
士(当中有些人还有发展迟缓的问题)训练自己的协助
犬。爱犬人士则利用响片训练狗展比赛的行为,一议狗
儿在美国威斯敏斯特狗展中(Westminster)得名。
德州警犭训练师暨高中计算机老师凯瑟琳.威佛
(Kathleen Weaver)为响片训练人士设置了一个网络讨
论区,共有两千人加入会员,有些响片训练人士也设置
了一些供问题及想法交流的网站,多位行为分析学家参
与网站讨论,协助大家解决问题,一让大家更了解学术
专有名词,其中的主力为科学家玛莉安.贝利(Marian
Breland Bailey)博士及先生鲍伯。 玛莉安曾是史余纳
博士的研究生,夫妇俩在网络的响片训练圈子里慷慨贡
献自己的时问和训练技巧,赢得科学界同侪和一群新听
众的崇敬。新墨西哥州天文学家喜莉克丝.费威勒(Helix
Fairweather)设立了一个网站,用来存放讨论区中最重
要有用的留言。上纽约州马术教练暨训马师硕历山卓.寇
特兰(Alexandra Kurland)发明了应用响片训练马匹的
方法,无论马匹品种或训练目的都能进行,包括重新训
练极度危险的攻击性马匹。
响片训练的新手也在网络上分享自己的成果,例如
从没学过训练的人利用响片训练教会家中狗儿寻找钥匙
或遥控器、把暖炉用的木头衔到屋里或者打开冰箱,选
择正确饮料之后关上冰箱,再拿饮料给下令的人。甚至
还有(拾回热狗网络大挑战),你能训练狗儿把一整条热
狗完整拾回吗?当然可以。一些真的很爱现的人还教会
狗儿拾回吉士汉堡 --- 不过大家都同意拾回来的吉士
汉堡已经沾了太多口水,不太适合人类食用。
这些现象都是大家集思广义、创意发挥一项新科技
的表现,这些发展以既存的科学原理作为应用,但是它
不可能亲临达成,例如实际把这么多人都收入同一个研
究所中,或把许多有想法的人全部找来面对面进行有效
沟通,这绝不可能。于是加拿大响片训练师黛安娜.喜利
尔德(Diana Hilliard)的观察是,透过因特网可以让
我们进行一个近似曼哈顿计划(Manhattan Project, 美
国研发原子弹的军事机密计划)的全球性计划,集结众
人之智,共同运用改善同一种新科技。
 响片训练的长期附加效应.

由于响片运动的爆发,我开始观察到增强式训练带
来一些让我始料未及的长期普遍效应。一九八一年我在
纽约科学院(New York Academy of Sciences)发表了
一篇报告,指出人们认为海豚拥有的特性(好玩、总明、
好奇、对人类友善等)或许与我们训练牠们的方法有关,
而非牠们的天性使然。现在我有了第一手的证据:无论
任何动物(狗、马、北极熊或甚至鱼),当你以正增强和
标定讯号进行塑形之后,牠们都会变得好玩、聪明、好
奇而且对你有兴趣。你不相信鱼真的可以如此?为了录
像示范,我塑形一只慈鲷穿过一个小圆圈并且跟随标的
(利用手电筒的闪光作为标定讯号是不错的方法),虽然
这些俗称猪仔鱼的鱼以温驯总明着称,但我从没见过哪
只像牠一样,这条鱼成了我家的城堡之王,为了吸引人
的目光牠会把水拍溅出来并且拍打鱼缸盖,隔着玻璃和
小孩碰鼻子,别家狗儿到访时牠会作威胁状,把鳍和鳃
伸展张开并不断作势攻击。令人惊讶的是,牠在五年寿
命期间,即使老早退休、不需上场表演、想吃即有得吃,
牠仍很好玩、听明、好奇又友善。
以下是另一个我最喜欢的例子,显示只要一次训练
就能够存在长期行为效应*。有天晚餐后,我为了娱乐表
亲的孩子而教他们家的猫弹钢琴,我利用「Good」作为
标定讯号,以小片火腿作为初级增强物,塑形出猫咪坐
在钢琴椅上、以一只脚掌拍击琴键的行为(猫咪多半约
花五分钟即能学会,牠们喜欢训练人类依照牠们的预期
提供零食)。那天晚上以后没有人再叫牠这么做,牠也不
再出现这个行为。
过了两年,有天早上我的表亲打电话来,他告诉我
前一晚他们被楼下传来的诡异声响吵醒,似乎有人弹奏
着钢琴,他探查之后发现,客厅的门一如往常,为了保
暖已全关上,但平时睡在楼上卧室里的猫咪当时却在客
厅里,坐在钢琴椅上。我们推测,当猫咪喵喵叫或抓门
的正常反应都失效时,牠出现了弹琴的这个习得行为,
但这次不是为了食物,而是为了回到牠偏爱的睡觉地点,
这个作法显然很成功。
无论哪个物种,接受响片训练的另一个长期效应是,
行为一旦习得之后便不会被忘记。十五年前我便已知道
海豚会出现这种现象,但当时我并不确定这是否是海豚
特有的现象。我现在已经了解更多了,传统训犬师改采
响片训练之后普遍常见的反应之一是,他们非常惊讶狗
儿习得行为之后竟能维持得很好,一旦行为到位了,它
便不会消失,不像处罚训练出来的行为,必须不断重新
训练和温习。我怀疑(但据我所知尚无正式数据支持)
这种行为持续存在的普遍现象不但可能是利用正增强或
负面刺激进行训练的根本差异之一,也是利用标定讯号
或只利用初级增强物训练的根木差异之一。
 突飞猛进的学习成效

另一个显着的响片训练新要素是伴随训练而来的加
速学习成效。厉害的响片训练者(有些人几乎从一开始
就是好手)可能在数日内即达成传统训练必须花上数月
或数年才能达成的行为,目前为止我发现最为明确的例
子出现于犬只服从竞赛中,在这个领域里采取传统训练
方法是相当标准的作法,测试的流程也极制式化,人们
发展及测试这些特定行为服从项目已达数十年之久,因
此任何改变都显而易见。
传统训练通常必须花上一年、甚至两年才能训练出
初级(Novice)选手,再花一两年培训出中级(Open)
选手,另外再花一两年才能培训出高级(Utility)选手,
而在人们利用响片训练后,训练狗儿达成相同行为的时
问可以缩短很多。曾有人从买狗到完成所有三级竞赛只
花了一年多的时间,还有一位狗儿饲主则在三分钟内教
会她的澳洲牧牛犬(Australian cattle dog)趴下、过
来、坐下等所有高级服从项目的手势,而有一名女子带
着一只十岁大的爱尔兰雪达犬(lrish setter)通过了
初级服从的三次资格赛,分数也非常不错,她只花了三
周训练时间(很抱歉我得提一下,众所皆知这不是个很
聪明的犬种);赛后不久这只狗即老死,牠的饲主表示要
是早能在牠年轻时就发现这么棒的沟通方式就好了,响
片训练对于训练者和训练对象而言都是加速的学习方
式。
*:摘自凯伦.布莱尔博士著作的『行为相关:随笔
小 品 及 研 究 』
(On.Behavior:.Essays.and.Research,.Sunshine.Boo
ks.1995)。.
.
有些人拒绝把这些超级快速学习的报告当成实证,
但是对我而言它们已经成为「诊断」工具。当老练的传
统训练师「跨域」到响片训练,并且兴奋地告诉我过去
得花几个月训练的行为,现在只要一周(或一个早上,
或一分钟)就达成了,即便我没看到他们训练也可以相
当确定,他们已经学到了响片训练的两个基本要素:首
先,他们按响片的时间很准。第二,他们也理解如何逐
步、但快速地一点一点地提高要求;顺带一提,另一个
显示响片新手正确使用这个科技的指标是,他能够自行
将训练转移到别的物种身上,例如:
「我今天早上教会我
的马三件事情,然后我进屋里用响片训练了狗儿、猫咪
和天竺鼠。」喀达,这就对了!
如果有数据显示响片训练有多迅速,那该多有趣!
我希望未来会有一些研究生以服从竞赛人士丰富的数
据,进行传统方法和这种新科技的比较研究。
.
 去除响片

人们不想在训练对象余生里都非得按响片给零食不
可,这是反对响片训练很常见也可以理解的想法。当然,
这是个误解,维持行为并不必使用响片,任何惯用的讯
号和任何形式的增强物都可达到这一点,响片的用途是
训练行为,一旦学习者学会了目标行为,即不再需要使
用响片。不过当你需要「解释」一些新的讯息时,你可
能会再度使用响片,你可以利用响片沟通相当特定的讯
息。
举例来说,我的朋友派翠西亚.布鲁英顿(Patricia
Brewington)有一只经过响片训练的佩什尔(Percheron)
公阉马,名为詹姆斯,派翠西亚和丈夫道西从詹姆斯还
是幼马时便持续对牠进行响片训练,完成了成马的所有
工作行为训练如乘载人们、拉车和拉雪撬、从林子拖出
砍下的木材。当詹姆斯接受过「完整的教育」之后,牠
已经不再须要响片和食物,詹姆斯懂得服从许多口头讯
号和手势,看得出来牠很喜欢工作表现优异时获得称赞
和拍抚等增强物,牠也喜欢冰块、玩球、以鼻子摇动雪
橇铃、回到谷仓、走出谷仓、观察人们做什么的机会,
以及生活里许多其他可利用的增强物。
有天詹姆斯脚上长了个脓疮,兽医要求牠必须定时
泡脚,所以派翠西亚拿来一桶温水放在詹姆斯身旁,把
牠的脚放入水桶中,詹姆斯随即把脚抽了出来,她又把
牠的脚放进去,詹姆斯又抽了出来。詹姆斯已是匹体型
硕大的马,而个头娇小的派翠西亚没办法施行强硬手段,
她也几乎从来不骂牠,这时该怎么办?她回到屋里找到
了响片,重新回到谷仓里,她把詹姆斯的脚放入水桶中
– 并且按下响片,派翠西亚以比喻的说法描述牠的反应
(增强式训练师也常这么做):「噢!你的意思是要我把
脚放在水桶里啊,噢,好吧!」这次并不需要给牠胡萝卜,
詹姆斯刚才只是不明白派翠西亚要牠做什么,在牠理解
之后牠并不介意这么做。
 训练对象有如参与游戏

在我训练海豚期间,我曾发表了一篇题为「海豚的
创造力:训练新奇行为」(The Creative Porpoise:
Training for Novel Behavior)的报告,描述了一些我
们在海洋生物世界进行过的训练,这篇期刊报告成为心
理学课程的经典文章,每年都被教授采用,用来激发学
生对操作制约的兴趣。我必须再次重提,当时我不太清
楚发明新行为的能力是否是海豚的特性,或者它是否与
训练系统有关,现在我可以稍微肯定地说,创造力 ---
或者至少实验性和主动性 --- 是响片训练的内在副作
用,训练者当然免不了会受到影响,训练对象也一样。
利用习得增强物训练时,训练对象有如参与游戏,
游戏规则是想办法出现会让训练者按下响片的行为。观
察小孩玩这个游戏,你应该会不加迟疑地说这个游戏会
促发小孩学习的欲望,或甚至让他们动脑思考,动物难
道不也会这样吗?
我曾经拍摄过一匹俊美的阿拉伯母马,牠接受响片
训练后会依口令竖起双耳,如此一来比赛时看起来较为
机灵警醒。牠显然知道响片声代表会有一把谷子吃,牠
知道这与自己的耳朵有关,牠也显然知道牠的行为可以
让训练师按下响片,但是做什么呢?牠把双耳竖起来,
分别转动它们:一只朝前,一只朝后,然后再对调动作,
然后牠把双耳像兔耳一般往两侧垂下来,我原本并不知
道马匹能够刻意这么做,最后牠的双耳同时朝前,喀达!
啊哈!牠自此便知道该怎么做了。这种过程迷人有趣,
我们通常并不要求马儿动脑筋思考或岭挥创造力,但牠
们看来很喜欢这么做。
在狗儿熟知响片训练之后,有些饲主变得非常习惯
狗儿采取主动及多加尝试,于是训练过程中让狗儿「自
行提供」行为(无论已习得的行为或全新的行为)成为
他们的惯常作法。许多响片训练者与狗儿玩一个游戏,
我昵称为「和盒子玩的一○一件事」(可以用椅子、球或
玩具取代食子),它的玩法与我们在海洋生物世界激发海
豚创造力的作法几乎一样,每次狗儿找到一个把玩该对
象的新方法就有人会按下响片,例如:你可以把纸箱放
在地上,狗儿去闻闻你就按下响片,然后等牠用鼻子去
碰它时按下响片,直到牠把纸箱推来推去。接下来你可
以让狗儿发现,推纸箱已经不再有用,但是用脚去抓它、
把脚跨入箱内,到最后跑到纸箱里名会让你按下响片。
狗儿也可能自己发明出一些行为:把纸箱拖过来拖
过去,或者把它衔起来四处走;曾经有只狗首度挑战这
个盒子游戏时,牠把自己所有玩具找来,一一把它们全
放入纸箱里,喀达!干得好!我的边境梗犬曾经把纸箱
翻倒盖住自己,然后盖着纸箱乱跑,营造出箱了神奇移
动的诡异景象,这让房间里的所有人笑得乐不可支,牠
似乎也因此而很开心。 在狗儿熟知响片训练之后,有
些饲主变得非常习惯狗儿采取主动及多加尝试,于是训
练过程中让狗儿「自行提供」行为(无论已习得的行为
或全新的行为)成为他们的惯常作法。
 免于恐惧的自由

「没有处罚」的响片训练引起响片训练者和其他人
士诸多争议,传统的看法(以及一些心理学家)仍然坚
持必须「奖善惩恶」才能多多少少获得居中的结果,但
事实上,许多传统训练的问题都直接源于处罚的使用;
前述提过的那匹阿拉伯母马变得无法参加马展竞赛,问
题便来自用来让马儿竖起耳朵的传统方法 – 在马匹头
上挥鞭子(牠们在谷仓里时即不时遭鞭子抽打,所以牠
们知道鞭子很危险),那匹母马不但没有因此出现警醒的
样子,反而把双耳向后贴耳,这个行为越处罚越发加剧,
看起来很不上相,于是才开始对牠进行矫正用的响片训
练。
响片训练者发现,如果在训练当中增强想要的行为,
又同时处罚(或纠正)不想要的行为,好的效应便会停
止出现。首先,快速的学习速度会停止,训练对象回到
牠的「正常」学习速度。第二、如果训练者很不小心,
训练对象将完全停止学习 – 而且也没有意愿学习,这
一点更糟!如同小孩可能会不情不愿地勉强上学,一路
上拖拖拉拉闲荡,狗儿也可能出现勉强表现的反应,而
且处于训练情境即感到紧迫,牠们喘着气、打着呵欠,
不想待着;但响片训练的狗儿常出现的情形是,牠们事
实上会主动引发训练,并且等不及似地赶紧跑到进行训
练的地方,表现出对训练的热切。
我并不是说响片训练者从来不说「不行!」当然,你
可能会因为狗儿看着桌上的小点心而斥喝牠一声,或者
在人潮拥挤的人行道上把牵绳牵短些,限制牠的自由,
但是我们必须避免把处罚(或说得好听一点是「纠正」)
当作促成学习的工具。进行训练时,动物可以自由冒险
试验、乱猜或设法自己发明出可能被增强的行为,如果
牠猜错了,没关系!最糟不过是响片不会响,在这种安
全的状况下,训练对象会很快发现一些表现自己最佳能
力的方法,而这些将带来很棒的成果。
 学习与乐趣

另一个人们不断呈报的响片训练附加效应就是,训
练对象的行为出现全面性的改变。受到处罚或纠正训练
的动物学习到,能少出力就尽量省,只要不会被处罚就
好,这类训练对象就像是「好士兵」一样,很听话,但
是不会自动。在这种训练体制之下,即使训练对象很服
从,但牠们较有兴趣的事仍是自己的行为和私生活,而
不是你或任何上权者想要什么,所以牠们不但很容易被
干扰所吸引,牠们也期待干扰的出现。此外,当牠们被
过度要求或处罚过头时,它们会生气或放弃,我们在家
犬、许多员工或学校里的孩子身上都看得到这些行为。
相反地,响片训练对训练者或训练对象而言都很好
玩,
「玩」是一个要素。我曾见过一名发展迟缓的青少年,
当她做出某个新行为而获得响片声时她笑了起来,而且
当她看见响片时,她比出「来玩!」的手语,老师并不知
道她原来懂得这个手语。响片训练者学会辨认出动物的
游戏行为,这是训练对象已经意识到哪个行为会被增强
的征兆,当牠们的「灯泡亮起来了」(比喻「恍然大悟」,
响片训练者惯常这么描述),狗儿会绷跳吠叫,马儿会腾
跃甩头,据说大象还会绕着圈子跑并发出唧呜,牠们很
开心,牠们也很兴奋,这个现象本身即具有增强作用。
这些情形都是可预期的,也会一再出现,而且它们几乎
都伴随出现生理变化,这类反应都是值得好好研究的题
目。
当动物有这种程度的参与度时,响片则变得威力无
穷,比食物更甚许多,响片和它的声音变得具有增强作
用。以下结一个例子:黛比.戴维斯是位响片训练课程讲
师,教导肢障人士训练自己的服务犬,她本身是轮椅肢
障者,以一只蝴蝶犬作为服务犬,这种小小的、黑白相
间的玩具犬种体型就像猫咪,虽然牠的个头袖珍,却非
常听明,可以拾回铅笔、找电视遥控器、取出干衣机里
的衣物。当黛比和牠去上训犬课时,这只小小的狗儿会
从她大腿上跳下来,在椅子底下穿梭,跑到人们的包包
里去偷响片,好像是说:
「妈咪,这里还有,这些东西越
多越好,不是吗?」
 将响片训练融入日常生活

学习原理如同物理定律,对我们任何人都有效,可
是要想象它在我们身上发挥作用却不见得容易。响片训
练新手常问:
「把响片拿来对付小孩(或老公、老婆)有
用吗?」然后一边尴尬地咯咯笑。它当然会有用,但是
你必须先学会方法,例如等候喜欢的事情出现并作增强,
而在看到不喜欢的事情时必须闭上大嘴,这些都有违人
的直觉反应,需要一些练习才做得到。
我们发现,与宠物一起体验响片训练其实是最佳的
起步点,人们会因此开始类化他们所理解的事情。参加
响片座谈的人聊到:
「我不再对我的狗又抽又拉地处罚了,然后我才顿
悟到,我仍这么对待自己的孩子!」
「我以前用下令和纠正的方法对待我的牙医诊所同
仁,现在我开始使用塑形和增强法,你知道吗?人事流
动率已经降到零。」
「这个作法对我的狗很好 --- 而对我而一百,它改
变了我和生命中每个人的关系。」
响片训练既简单又直接,它不只带给人们思想上的
深省,也带来一种新的应对策略,可以应用于许多不同
的行为情境。
现今这种转移应用情境的作法在响片训练界变得司
空见偿,拥有教学专职的响片训练者,例如高中教师和
大学讲师、特教者师、物理治疗师、机构照护者等都在
工作上运用这项技巧,一些子女具有不同发展迟缓或肢
障问题的父母与我分享过自己和孩子运用这些新技巧的
感想,一位母亲运用塑形和增强教导患有自闭症的女儿
与人进行适宜的社交对话。这些父母增进了失能子女的
技能,从吃饭穿衣到走路说话,用的就是增强物和一个
标定讯号。
了解增强式训练并无法修复肢体缺陷或神经缺损,
它也无法取代专业人员的协助,但是它可以使所有人的
日子变得容易一些,父母学习到如何塑形出合宜的行为,
避免不经意增强了不宜的行为 – 增强安静的行为,而
非吵闹;增强游戏行为,而非耍脾气。他们并没有「把
自己的孩子当成动物对待」,这是最普遍拿来攻击这种作
法的偏见,响片训练的重点不在于训练对象是人或动物,
而是更好的教导及学习方式。
最棒的一点是,不需要拥有博士学位也能拥有有效
的塑形技巧。最近我与女儿全家一同出游,在驾车返家
途中她一岁两个月大的儿子开始大吵大闹,他并没有哭
(至少,当时还没哭),他只是因为车程太久而且一直被
困在汽车座椅上而大吵抗议,但是我们还有二十分钟的
车程;一起坐在后座的七岁孙子怀利处之泰然地解决了
小弟弟的鬼叫问题,作法是增强越来越久的安静时间,
标定讯号是什么呢?怀利的微笑!增强物呢?舔一口怀
利的棒棒糖!
我最近教授了一个塑形及增强的课程,对象是五十
位左右的教育人士,我要求他们交一个塑形训练的作业。
沙伦.安姆斯(Sharon Ames)是语言治疗师,她选择以
自己三岁半的双胞胎进行塑形,她的挑战如下:虽然晚
上八点是双胞胎的上床时问,但每天晚上要让这两个小
宝贝蛋上床睡觉却得花上三小时以上的时间,沙伦开始
以投入瓶子的零钱作为增强物,双胞胎到了早上便可以
拿钱换取奖赏;第一天晚上两个孩子每完成一个上床的
准备工作就会获得「喀达声」(此处即投入一个零钱):
跳进浴缸,喀达!离关浴缸,喀达!穿好睡衣,喀达!
依此类推。接下来,关上灯以后,如果每次沙伦回来检
查时他们还在床上(不必在被子里,只要在床上),喀达!
(当然,也会投下零钱)。
第一天晚上的前半个小时里,她每隔一分钟就去检
查一次 –这样就有了三十次喀达声,之后一个小时改为
每五分钟去一次,此时双胞胎已睡着了。第二个晚上,
她把检查的间隔时间空开一点儿,每十分钟才去一次,
不到一个小时他们就睡着了,第三天晚上他们立刻睡着
了。在三天内双胞胎从上床到睡着的时间从每晚三个小
时减至约二十分钟,这个时间还挺适当的,之后一直维
持不变。这对双胞胎很赞同响片的作法:「我们可以再多
玩玩响片游戏吗?」当然,沙伦和丈夫获得的增强物才
是真正的大奖,他们因此有了充足的夜间睡眠。
安姆斯一家把响片训练融入了日常生活(沙伦告诉
我他们发现,偶尔才按一次响片并且加大增强物的话,
它的效果会更好),沙伦的母亲有时会帮他们看孩子,沙
伦也教她如何在孩子身上使用响片,然后她母亲认养了
一只狗,但常抱怨这只新宠物有些问题行为,沙伦建议
她:
「为何不试试响片呢?」她母亲半信半疑地说:「唔,
是啊,这招对小孩效果奇佳,但是妳真的认为它对狗也
有用吗?」
 更多应用在人类身上的作法

撰写本章的同时,我正亲自参与发展两项应用于人
类的响片新计划。一项计划利用响片训练飞行,此处的
响片是一个「黑盒子」电子响片声,连接到飞行员的耳
机,响片声不但较为精确,它也能够提供其他方式无法
做到的增强方法,例如当驾驶员转头去看仪表时,他们
的手不应该抓着方向盘,以免不小心使机身转向,然而
我们开车时却都学会了不可把手拿离方向盘,要去除习
得行为永远比训练新行为来得累人,口头提醒或告诫的
时间太长,而且发生时间也太迟,不过即便双手只稍微
离开方向般,响片声也能标定这个行为,并且使这个行
为永久维持。
飞行教练也可以在学生表现主动性及完善思维时按
下响片,例如在出现提醒之前即主动巡视仪表,因此响
片可以利用非口语的方式奖励非口语行为,在发生当下
即出现奖励。我儿子麦克.布莱尔是飞行员,也是发展这
个计划的负责人,他从初步资料呈报发现,在学习技能
(例如仪器飞行)时,响片似乎可以较快建立起执行能
力,并且长期维持习得行为,自从我们开始这个计划,
每位与我谈过的飞行员一听到不用经常回到飞行仿真器
练习即可能维持仪器飞行评比及技能时都竖起了耳朵。
响片训练对学生而言也有趣多了,麦克说:「当你认
为应该会有响片出现但却没有时,你会增加动作,吏加
努力企图找出自己应该做的事,等到响片响时,一种胜
利的感觉油然而生,这比被骂的感觉好太多了!」
第二项计划与我在麻州助氏布洛市(Southborough,
Massachusetts)新英格兰儿童特教巾心(New England
Center for Children)的顾问工作有关。这个中心有五
百名员工和两百名学生,是美国专事发展障碍儿童教育
的领导机构之一,它尤其着重自闭症儿童的教育,我们
正在探索使用事件标定器(响片或其他方式)的可能性,
对象是诊断出自闭症发展障碍的儿童。中心里活力充沛
的年轻教师对这些挑战性高的儿童提供日夜不休的一对
一亲自照料,他们都是大学毕业生,通常主修教育或相
关科系,中心提供他们行为分析应用的密集在职训练课
程,在这些专业技能以外增加响片的使用,至少就初步
而言,它可为那些对语言无法回应或不作响应的儿童傅
递一项清楚明白的正面信息,而且它的回馈也让教师明
白自己是否抓准时间点、要求标准的调整是否适当。
我在中心担任一年半的顾问,我觉得我们极有希望
能将一些初步观察整理成记录,我们注意到教导障碍儿
学习一些通常会训练他们的行为时,如果利用标定讯号
和他们偏好的零食似乎有所帮助,这类行为可能包括改
善肢体技能、增进眼神接触、参与意愿和听从指示,有
些与我合作的教师利用响片训练使动作激动的儿童减轻
反抗或不再反抗,以进行必要的程序如刷牙、剪头发和
量体温,而且有时他们真的看起来很开心。
我希望强调的是,这些说法都尚未经过科学验证,
新英格兰儿童特教中心极以研究取向,有了他们关切这
个研究方向,一个天大的好处就是它的研究或许可使我
们这些响片训练者不再停留在运用响片的趣闻轶事和叙
述性作用上,而且对于学习理论及应用也提供由数据支
持的贡献。
接下来的发展呢?行为分析协会一直不断有训练师
加入,并且在年会上发表报告及举办座谈,同时训练界
人士不断地探索这项科学,有些人甚至回到学校追求进
阶学位,我们正学习如何称呼我们以前完全凭直觉运用
的概念,并且学会辨识它们是什么样的概念,例如:精
进度(fluency)、延宕时间(latency)、引证(adduction)。
我从行为分析协会的活动中惊讶地发现,有一群研
究和教育人士在学校里也见到我们响片训练者所看到的
现象,他们所发展出来的应用方式称为「精准教学法和
直 接 教 学 法 」( Precision Teaching and Direct
Instruction),它的效率极佳。我参观过其中一个施行
该 教 学 法 的 主 要 地 点 「 晨 兴 学 院 」( Morningside
Academy),这个位于西雅图的实验学校由肯特.琼森
(Kent Johnson)博士创办,校长为乔安娜.罗宾森女士
(Joanne Robbins),它每次只收六十名学童,多半患有
注意力缺失症(attention deficit disorder)、过动症
( hyperactivity ) 或 学 习 障 碍 ( learning
disabilities),只有学习至少都落后了两个年级进度的
孩子才得以入学,它的学费相当可观,可是如果孩子每
年赶上的进度不到两个年级即可要求全额退费。
从来没有人向他们要求过全额退费,他们如何做到
的呢?为了让孩子获得好成绩,他们把每个孩子需要学
习的所有事情都分解成许多小步骤,训练孩子一个步骤
一个步骤地完成,每次的训练时问极短,由孩子自己追
踪进度,它的成效具有自我增强的作用 --- 挑战自己前
一次所花的时间,并且提升自己的技能程度,不过他们
也获得其他的增强物,例如玩计算机的时间或玩计算机
游戏(这些游戏的设计当然也依据逐步调整的增强时
制)。
有时孩子教育的小小缺失会导致层出不穷的问题,
可是这些缺失却很容易解决。在一间教室里,我从一名
九岁男孩身后探头看他做什么,他正尽快在一分钟内不
断重复把零到九的数字全写过一遍,为的只是获得一声
响片。他很聪明,但是学校系统的教育方式没法教会他
如何清楚快速地写下数字,这个小小的训练缺失很可能
造成他往后人生的梦魇,可能影响他作代数题目或写下
女孩子电话号码的表现,所以现在就得解决这个问题。
当然,这只是操作制约运用在教育上的一个小例子,
晨兴学院的教育模式正日渐普及,琼森博士和乔.莱因
(T.V. Joe Laying)博士也在芝加哥学校系统里进行一
项规模较大的计划,其他相关计划也存各地展开。
我的希望及期待是,如果欲使学校系统转型成真正
有效的教育模式,它应该由科学、改革人士(如琼森博
士和莱因博士等)及家长三头并进,而要使任一方发挥
作用,则必须从自己做起,不能只雇来专家,然后说:「解
决我家狗的问题!」或「解决我家小孩的问题」,甚或「解
决学校系统的问题!」你才是主要的训练者,而教育是一
种参与性的活动。
 世界各地的响片训练

我相信过去十五年间人家对于这个科学领域的态度
已经大为改观,有些人听到史金纳的名字时仍会惊颤,
因为他使这些人心中浮现美丽新世界**、心智控制和电
击的影像,不过却有更多人能够自在接受正增强的概念。
当然,有些人只呈口头说说,设立网络响片讨论区
的凯瑟琳·威佛指出,作训练的人所提到的「响片训练」
并不只是使用响片的意思,响片的「使用者」可能自称
「正向训练者」或「动机训练者」,他们或许借用了响片
这个特殊器具标定他们想耍的特定行为,但是他们仍然
继续利用处罚、肢体胁迫等传统训练使用的所有不快刺
激作为训练工具。
相反地,响片训练者订能利用任何刺激作为标定讯
号,他们不认为响片本身具有任何不可思议的神奇魔力,
但是他们也刻意避免迷信行为(例如加剧处罚的行为),
他们的工具箱里装着全套的塑形和正增强技巧以及相关
的操作制约原理,无论他们训练儿童或成人、马匹、狗
儿或其他任何动物,他们都可坐收成效:加速学习、行
为历久不忘、快乐且参与度高的训练对象以及完完全全
的乐趣;这些成效全来自响片训练的科技。
或许,使用这个新科技的人将来会帮它取一个比响
片训练更为独特的通称,我希望会如此,不过这个最后
终于出现的名称也许不会是英文。多亏有了因特网,响
片训练已扩展到全球各地,响片训练讨论区里某天可能
出现使用麋鹿骨哨的芬兰雪橇犬训练者(因为金属哨子
会冻黏在嘴唇上),改天又出现波斯尼亚的责宾狗饲主或
新加坡的兽医,或者出现英国女子描述她如何训练自家
养的刺猬拾回物件。公元一九九八年,我的网站
「www.dontshootthedog.com」在一个月内即有十五万次
点选浏览次数,每个月至少都有来自四十个不同国家的
人点选。
在这些所有分享的往来讯息、试验和发现当中有一
种蔚为风尚的兴奋感受,任何科技的发展初期应该都是
一样的,例如飞行的早期,或收音机刚出现的时期,偏
远农场上的孩子打开矿石收音机,只期望收听到某个穿
越时空的讯号。我们是这项科技的先驱者,我们尚无法
预料它将带领我们到何处。
【思想传染】(Thought Contagion)一书的作者阿
伦.林区(Aaron Lynch)
,他引用通讯工程科学的说法,
谈到科技传播过程中出现的特殊通讯现象,他说明若要
快速传播一项科技,必须具有三项特质:该科技必须很
容易,必须让使用者看得到好处,也必须能够让人一点
一点地逐渐习得。响片训练便符合这三项特质,而在狗
儿饲主身上绝对看得到它的传播,当人们看见传统训练
出身的狗儿表现时,他们常说: 「那一定花了好几年时间
训练,我不可能做得到。」或「我的狗不可能像牠一样总
明。」相反地,人们看见响片训练的狗儿表现时,他们会
惊呼:「你是怎么办到的?我也可以做到吗?示范给我
看,我来试试!」
你没有办法事先预知哪个事件将使新一群的使用者
迷上响片训练。训马师亚历山德拉.寇特兰在一家大型马
厩进行训练,每天周遭有数十人来来去去,她的马匹和
学员以惊人速度学习着各项新技能,但是旁观者只当那
些是「古怪的响片玩意儿」而嗤之以鼻,直到她教会一
匹马像狗儿一样把玩具拾回来,突然间,马厩里的每一
个人都非得要有一匹会拾回东西的马不可,大家都问:
「你怎么做到的?我也可以吗?」
最近亚历山德拉在一封电子邮件中写道:
「它已经发
生了,我们现在已无法让精灵回到魔瓶里,以后可好玩
了!」
我希望她对精灵和魔瓶一事说得没有错。
关于好玩一事,我知道她说得没错,训练一直都是
件好玩的事!

You might also like