提供国内最权威的边牧伴侣犬全程服务

爱边牧爱生活国内最贴心的知识分享

客服微信即时为您解答咨询服务

扫码进入手机站

国内规模最大的边境牧羊犬繁殖基地
世界犬业联盟认可机构CKU注册犬舍
响片训练
2013-01-24 15:10:13  来源:凌云边牧宠物公园

没有共通的语言叫人懊恼!当有人说他们作「响片训练」,除非我询问一些定义相关的问题或看著他们训练,我永远没法确定他们是否真这麼做。如果在讲座上的听眾说自己作响片训练,多达一半的人绝对只是『用响片』训练,而非作『响片训练』,这种模拟两可的情形令响片训练者懊恼,令认為自己作响片训练(而且想这样做)的人懊恼,也令身為讲座讲师的我感到懊恼。甚至我去参加一些所谓的响片讲座时,却失望地发现,一些德高望重、天赋聪颖的人以响片训练者自我推销,可是他们无疑却是「诱导奬励+响片」的训练师。

    為了区分出响片训练,以下描述四处通常会发生误解的地方,虽然有些训练师拥护响片训练的一些好处或甚至许多好处,明白不同训练之间深切却微妙的差异,明确阐明响片训练,特别是它為何不同於极类似的「诱导奬励+响片」训练依然很重要。我们必须把响片训练者一词保留给完全信奉全套响片训练的训练者,否则我们无法清楚沟通我们是何种训练者,持何种观念。

    以下涵盖获得行為和奬励时机的差异,两项重大差异则是给予零食的方式及狗儿不出现行為时的训练者反应。

零食给予的方式

    利用行為标定讯号(例如响片)的一大好处就是能够改变零食给予的方式,它比其他训练方法更能有效增进训练成效及加快进展。

    利用诱导法时,狗儿在达成诱导姿势或依讯号出现姿势时获得零食,例如诱导狗儿趴下就以趴姿获赏。训练等待不动时,狗儿必须留在原地才能获赏,如果牠在获赏前移动了就不给赏。

响片训练时,既然响片已标定成功的当下,使行為终结,狗儿不必保持姿势或位置也会获赏,响片训练者可针对每个行為选择最有效率的零食给予方式,藉以加速学习,下列一些例子显示行為标定讯号出现之后如何运用零食增进并加速训练:

·使行為回到起点:例如训练趴下时,当狗儿趴下,训练者按下响片,接著把零食递到牠得站起来才吃得到的地方或丢到不远处,让牠起身去取,狗儿吃下零食后即可再度趴下,如果餵到狗儿嘴裡让牠保持不动姿势,你将多出一个必须让牠改变姿势才能再度出现行為的步骤;诱导奬励法通常会利用来回诱导两个姿势解决这个问题,例如诱导站起来再诱导趴下去。

·定位奬励:响片训练者当然也会在原地奬励,例如训练长时间行為(例如等待不动或休息)时,响片声标定时间已结束,训练者可能就地奬励狗儿,减少重新调整姿势的必要性。训练位置相关的行為(例如:脚侧随行)时,直接在定位给予奬励很有效,但并不是非这样做不可。如果狗儿在响片声后离开位置,牠仍然可获赏,因為响片本来就代表终结行為。

·影响整体反应:给予零食的方式有助提高活泼度或使过於激动的狗儿冷静下来,例如,按响片后定位餵食或减少多餘的餵食动作可导致较冷静的反应,从另一方面来看,把零食滚到地上让狗儿追著它跑可能会提高兴奋度。

·要的是动态行為:当想训练的行為是退后或远离的动作,给予零食的方式可以让狗儿回到起点,这时不同於定位予赏的是,训练者在狗儿尚在动作进行当中即按下响片,不会等到牠完成整个动作,例如当牠往后退,响片告诉牠动作没有错,在牠回到训练者面前领赏后即能够再度出现动作,增强动态动作时若不利用标定讯号将很困难。

·增加距离:响片训练者很快便能远离狗儿,例如训练狗儿走向标的物或训练远距离讯号反应,由於狗儿成功出现行為时零食不必即时出现眼前,训练者也不必在牠眼前。诱导式训练时,零食必须刻意放在标的物上某处(通常设计起来不容易),或者训练者只能一点一点地,慢慢拉长离开的距离。

·时间:若使用行為标定讯号,增强物不必立刻在行為发生后出现,举例来说,如果奬励是到屋外玩耍,在响片标定行為之后,人走到门口、打开门再让狗儿出门时可能已经过一段时间。有了这个行為标定讯号的好处,响片训练者可利用很多活动作為奬励,但诱导式训练者多半无法这麼做。

不出现动作

   讲座示范上,第一次看见从未受训的狗儿或幼犬接受响片训练的人总是不可思议地发出惊叹,目睹从未受训的狗儿没有听过响片,在几分鐘之内即能开心衝到被子上趴下,看来真是神奇,它迅速使狗儿出现一连串看似复杂的行為,首次见识的人不得不对这种魔力印象深刻,他们是看到了,也相信它有可能──只要训练者经验老道,但是要他们產生信任,相信这种不作任何指引、不用暴力或肢体、也不作任何控制的作法对自家的狗真会有用?这对任何初入门的响片训练者都是很大的问号,对於来看诱导背景、习惯狗儿出现机械化自动反应的人尤其困难,虽然自动反应并非「学习」,即时的成就感对於诱导者具有高度增强作用。

刚开始时,很不容易相信响片这一套会管用──人们必须有耐性,让响片进行沟通。人类的天生倾向是减轻学习压力──减少狗儿当下的混淆或可能出现的混淆,急著帮忙狗儿是人们最隐而不见的习性,尤其是诱导式跨域训练者──狗儿看来困惑时就帮牠,狗儿挫折时也帮牠,狗儿无助也拯救牠。当训练者丧失对於训练方法的自信时,诱导法可以填补空缺。

於是当狗儿不提供某项行為(无论是何项行為),训练者拿出零食作诱导,让牠知道该做什麼,然后再试看看,情况又一样,狗儿没法出现行為;零食再度出现,再度诱导牠出现行為。训练者误以為这麼做就能让牠懂,牠是懂得某件事,但是并不是训练者希望的那件事:狗儿学习到什麼都不要做,直到训练者拿出零食,然后跟著零食动就能得赏,结果『没反应的行為受到增强』(或可称為习得无助)。

   狗儿不动的反应并不是意识下的抉择,牠没有坐在那儿想著:「我知道该做什麼,但是我不会这麼做。」其实是因為牠没有反应的等待行為带来了好的后果。

   更糟的是,训练者误以為问题是狗儿只是需要多几次示范,诱导几次之后就决心试图塑形行為或等待牠行為出现,所以他试著和狗儿比耐心──看看是否能等到牠出现行為,可是狗儿不会这麼做,毕竟牠已学会没反应才会获赏──只要等著跟随诱导就好。当训练者等得久一些,但终究仍掏出零食诱导,这麼做只会拉长狗儿等待零食出现的时间,不但增强等待行為,而且也使这个等待的行為受到随机增强,变得更不易消失。

   无论是否给予讯号,如果狗儿不出现动作之后人们无法克制想诱导的衝动,可能会一路每况愈下,最后到了训练者所谓的『顽固』地步:「我家狗拒绝服从我,他知道我要什麼,但是牠就是不干。」如果狗儿知道我们要什麼,也知道牠照做会获得很高报酬,但牠仍拒绝这麼做?诱导时牠完全会乐意配合,所以既然牠不愿出现行為,牠一定是『故意扛上』训练者?我们真能相信狗会这麼做?当然不是,答案是训练者训练了这种持之以恒的等待行為。 

我十分同情落入这种陷阱的训练者──毕竟,我们都只是想帮帮狗儿,但是暂缓的作法是错的,这种帮助牠的作法会消除让牠自己去发现、去学习的能力,而这种能力对狗儿或训练者有太大的好处了!

好消息是,只要训练者意识到自己无意的行為,并且去除自己想去帮牠的衝动──花些时间比耐性,撑得比牠久,训练就会往前迈一大步,而且看见狗儿脑子灯泡亮了的顿悟时刻,这种刺激和兴奋也值得耐心等待。

正名的请求!

   这些是响片训练不同於其他训练的地方,虽然我显然公开承认自己是响片训练者(我全心信仰响片的人──称我是响片训练传教士也可),我并不讨厌利用以下方式训练的人:1。一直利用诱导法获得行為,2。标定行為的同时送上零食,3。利用响片作為『继续加油』讯号或『替代称讚的讯号』,4。要求狗儿维持姿势或位置才奬励,5。狗儿迷惘时利用诱导协助牠,但不利用响片让牠自个儿找出答案。

   不过,请别再说这些人作响片训练,这夺去我们这群人清楚沟通我们身份和训练方法的能力──我们才是响片训练者。

   作者附註:有些狗儿的特定习得行為可称為『故意槓上』训练者的行為──但是它是不当训练在无意间训练出来的行為,在『诱导奬励+响片』训练的早期或甚至响片训练时狗儿并不会出现这类行為。




服务热线(微信同号)
13373735737
电子信箱
1624466507@qq.com
close