金牛座的老狼 金牛座的老狼
犬语者
关注数: 54 粉丝数: 400 发帖数: 4,380 关注贴吧数: 53
边牧的优缺点 优点 1.聪明 这是边境牧羊犬最大的优势。边牧的智商被列在犬类智商排名首位,这也是大部分宠物爱好者认识边牧的起点。但即使是人类,智商也是千差万别的。所以虽同为边牧,也不能一概而论。由其在中国更无法对于“边牧”做出正确的解释。 2.服从性高 就像聪明的孩子不一定听话。智商是先天的,而服从性由性格决定,所以并不是智商高的犬种,服从性就一定好;或者服从性高的狗,就一定聪明,但是边牧却同时兼有这两种优点,这也是边牧这种工作犬能成为非常合适的家庭伴侣犬的原因。 3.漂亮的外表 边境牧羊犬有犬类熊猫之称,是因为它黑白花色的分布和熊猫相似,尤其是60天以下的幼犬,圆滚滚的体型、蹒跚的步态,更像是一只小熊猫。当然边牧也有其它颜色和白色的搭配,诸如红白、蓝白、黄白、陨石色等等,但通常黑白的搭配被认为是最基础和最标准的。同样也会被人用来炒作,误导消费者进入某个误区。 4.团结,等级观念强烈 犬为脊索动物门哺乳动物纲食肉目犬科狼属,但在不断地进化和被人类进行饲养的过程中,很多犬种都丧失了群居动物应具备的团结、等级制度分层明确的观念,而边牧仍旧保持了这种性格。对内不管有过什么争斗,对外都非常一致,有一呼百应的效果。同时养过2只以上边境牧羊犬的犬主,对此会有切身的体会。(也就是为什么越来越多的人向往多边生活) 5.热情而谨慎 边牧对人很热情,除了哺乳期的母犬对幼犬正常的看护,是从来不会对陌人产生主动攻击的。已经具备自主判断能力的边牧(即非不懂事的幼犬)也绝对不会因为跟随陌生人而走失,尽管对人热情,但对陌生人却不是毫无保留,这也是边牧比较优秀的性格之一。 其它优点:反应敏捷、具有完美的弹跳力 边牧适合做飞盘和敏捷训练的原因,正是因为它们具有反应敏捷和弹跳力强的特点。 缺点 1.聪明 智商高原本是边牧的最大优点,但凡事有利就有弊。例如能关得住其它犬种的地方,就未必能关得住聪明的边牧。(甚至能学会用钥匙开锁,想教未必能教会) 2.胆小 边牧在自己的地盘上能够凭借聪明才智作威作福,但几乎50%以上的边牧甚至有被惊吓后小便失禁的经历。即使体形较大的成年边牧,在陌生的地方面对陌生人的抚摩,也会抿着耳朵甚至翻着肚皮表现出完全地臣服 3.精力旺盛 边牧的精力很旺盛,需要的运动量也相对较大。需要犬主能给它们提供足够的活动空间和时间。(得不到释放的满足就会有些破坏嫌疑) 其它缺点:遗传基因不稳定。(谨慎繁殖)
第十五节 团体中的增强为困难业务代表大会、家长会、卡内基课程或减肥中心,这类开授自我成长集体课程的机构其实大多非常仰赖集体对个人的加强效果,掌声、奖牌及颁奖仪式等集体嘉奖形式是很有效地加强物,有些做法还相当异想天开。以前有一位IBM业务主管希望加强手下业务团队的年度表现,于是他雇用了挤满一整个足球场的人,为员工、高阶主管和所有员工家属举行一场盛大派对,他让所有业务代表从球员出场的地方跑进球场,分数板上闪动着他们的大名,由全场群众高声欢呼迎接。 我上过沃纳·欧哈德(WernerErhard)的“欧哈德研讨会训练课程”(EST),他有些吹擂自我的推销意味,但是从训练的角度来看,我发现这个课程设计得很巧妙,经常高明的运用塑性及加强原则。我认为它的名字“训练课程”取得很贴切,带领课程的人称为“训练官”,塑性的目标是认识自我,主要加强物不是训练官的反应,而是所有人表现出的非语言的集体行为。 为了发展出集体加强行为,他们要求二百五十名学员在每位讲者讲完之后都必须鼓掌,无论他们是否想这么做,因此从一开始,害羞的人得到了鼓励,胆子大的人也得到鼓励,而且任何人的见解“无论见解深入或愚蠢”都被大家接受。 起初大家的鼓掌只是义务性质,但它很快变得具有真正的沟通意义——它不同于戏院里的掌声,并不是用来表达欣赏程度,而是表达不同程度的感受和意义。举例来说,我那次上课的学员里有名好争辩的男子,我想每次的EST课程里都会有这样的人,他经常从训练官的话里挑语病,到了第三或第四时,训练官开始回嘴,其实大家都看得很清楚,从逻辑来看这名男子说的一点也没错,但是随着他们吵得越来越久,早已没有人在乎谁对谁错,其余的二百四十九位学员都只希望他闭嘴坐下。 这里的规则——其实是塑性法的原则——并不允许我们提出抗议或叫他住嘴,但是他逐渐意识到周遭一片寂静,我们看着他渐渐领悟到没人在乎他是对的,当“对”或许并不重要时,他变得结结巴巴,慢慢地闭上了口,停止了争辩坐下来,所有人立刻爆发出哄堂掌声,表达大家赞同,谅解及全然放松之意——这对他刚刚的体会是极为有效的正加强。 在这种训练过程中,真正重要的是行为,因此不需要言语,但要想局外人解释这种训练常常极。欧哈德像是禅学导师,常以格言开示,以上例来看,欧哈德的课程格言是:“当你是对的,你就只是“对的”而已。”意思是,你不一定有人爱,也不一定人很好,你只是“对”而已。如果派对上有人高谈阔论、举止夸张,而我引用这句格言,上过欧哈德课程的人可能都会大笑——事实上,任何一位好的现代训练者可能都会大笑,不过多数听到这句话的人可能会以为我是白痴或喝醉了。好的训练概念并不一定可用言语解释清楚。
第十三节 迷信行为:意外的加强效果现实生活中无时无刻都会出现加强,而通常都是碰巧发生的。一位研究老鹰的生物学家注意到,如果老鹰在某处树根下抓到老鼠,随后约有一个星期的时间他每天都会回到该处侦察,他飞经那个特定地点的机率已经被强烈的加强。如果你在垃圾桶里找到一张二十美元的大钞,我相信你改天再次经过这个垃圾桶时,肯定会仔细往里头瞧瞧。 那个意外的加强对老鹰有利,事实上,动物行为可说是为了使每个物种从加强上获利而演化出来的,然而关连性也会意外产生,而且它仍可能对行为有深切的影响。如果某项行为与后果其实毫不相干,但动物仍出现该行为,仿佛它必须这么做才能获得加强,科学家称此行为为“迷信行为”。就举咬铅笔的例子,如果考试时把铅笔放到嘴里,正好在此时想到了正确的答案或好灵感,于是咬铅笔的行为即受到了加强。我上大学时每支铅笔都盖满了齿痕——遇到特别难的考试时,我有时还会把铅笔咬断。咬铅笔有助于思考吗?当然没有,这只是个被意外制约的行为罢了。 人们在参加重要活动时会穿上特定的衣物或进行某套仪式也是出于同理。我看过一名棒球投手每次准备投球前都会进行一套九个步骤地连锁动作:轻碰棒球帽、把球轻触手套、把棒球帽往前推、擦擦耳朵、把棒球帽往后推、单脚来回磨地等等,局势紧张时他可能还会把整套动作重复两遍,而且从来不会变动动作顺序。这套动作发生的时间相当短(球赛播报员从不会提及这些动作),然而他却是一套极为复杂的迷信行为。 动物接受训练时也常会蹦出迷信行为,它可能会出现一些你并没有特意要求的反应,但这些反应常被意外加强而受到制约,例如,动物可能出现它似乎必须呆在某处、面朝特定方向或出现特定坐姿时才能获得加强的样子,当你要他换地方训练或面朝另一个方向时,他的行为却难以理解地突然做不好了,想找出原因可能得花些功夫,因此聪明的做法是,在行为至少完成了部分训练之后,随即在进行训练是变化所有你不认为重要的情景变数,以免发展出一些日后可能成为阻碍的意外制约行为。 最重要的是,要注意不经形成的加强间隔模式。动物和人类对时间的间隔都很敏锐。有一次,我十分确信自己以训练两只海豚鼠以讯号跳跃(看我的手势),直到一位来访的科学家拿着马表告诉我,只要每隔二十九秒他们就会跳跃一次;果真没错,无论我是否给讯号,他们都回每二十九秒跳一次,我给讯号的行为意外被制约得极为规律,而海豚鼠是因为发觉了这个规律性而跳跃,并非依照我所给予的讯号而做动作。 许多传统动物训练时的想法及行为也都充斥着迷信,他们有些人告诉我,海豚较喜欢穿白色衣服的人、骡子一定非揍不可、熊不喜欢女性等等。而“训练”人类的人可能也一样糟糕,例如他们可能相信小学五年级的孩子一定得大声责骂不可。这类训练时受到传统的摆布,训练时每次都必须按照完全相同的步骤,因为他们无法区分那些方法有效,那些只是迷信。这种无能“或混淆”常见于多种专业领域——教育界、工程界、军中、特别是医界,令人胆寒的是,很多给予病人身上的处理程序并不具疗效,他们纯粹只是沿习或时兴的做法而已,任何住院过的病患者随便想都能想到六项不必要的选择,这些程序都是迷信行为罢了。 有趣的是,单单向人指出迷信行为无效并不一定能使它消失,由于它受到强烈制约,人们可能因而为它强烈辩护,如果攻击某位医生惯用的疗法无用或甚至有害,你一定会遭到猛烈反击。我相信如果有人命令那位有九个热身步骤的投手脱掉那顶他得碰四次的棒球帽时,他一定会奋力抗拒。 不过,你仍然可以去除自己的迷信行为,方法是让自己明白他与会获得加强物无关。我儿子泰得是银行家,他的嗜好是参加剑击比赛,他每个星期会找出两三段时间练习,而且常在周末四处旅行参加比赛。有天他碰上一名很强的对手,他却因为把最爱用的一把剑忘在家中而提不起劲,当然,他输了那场比赛。后来他发现提不起劲比起那把剑更影响他的剑击表现,而且使用“最爱用”的剑其实全是迷信行为。 泰德于是开始着手去除所有他找得出来的剑击相关迷信行为,他发现自己有很多迷信行为:一定要穿戴特定衣物,心中深信一夜睡不好、吵架或甚至比赛时把果汁喝光了等等都可能影响比赛表现,他系统性地一一检讨这些状况,每找到一个迷信行为就消除对他的依赖。现在,每次比赛他都能轻松自信的面对,即使赛前一小时他恶运连连地错过火车、弄丢球衣球具、与计程车司机争吵,或穿着练习用的服装和配错对的袜子、使用借来的剑也无所谓了。
《别毙了那只狗》第一章 第十二节 如何打破起头最难的障碍 第十二节 如何打破起头最难的障碍 除了变化性加强时制之外,我们也可以采用“固定加强时制”(fixed schedulesof reinforcements).这意味动物必须在预定时间内持续某项行为,或者必须完成预定次数的行为之后才会获得加强。举例来说,我可以安排海豚连续跳跃,每跳完六次就加强一次,于是连跳六次的行为很快就会经常出现。但固定加强时制的问题是,连续行为中较早出现的行为永远得不到加强,于是常会变得越来越马虎,过得去就好。以海豚跳跃威力,除了最后一次实际获得加强的跳跃动作以外,其他跳跃动作将逐渐变得越来越小。固定加强时制的缩减效应或许是影响人类许多完成任务的一项因素,以工厂装配线为例,人们通常必须工作一段固定时间才能获得加强,与工作表现优劣无关,人们当然只想尽量少花力气,只要足以让他们呆下来就好,而且每次刚开始工作时的表现可能会特别糟,以海豚来说,偶尔随即增强第一次或者第二次跳跃对于维持行为的效果与增强第六次跳跃一样有帮助。对人类来说,如果各式奖励津贴或其他形式的加强物“例如颁奖”,与工作量或工作表现有直接关系,并且不与平常的加强物同时出现,他的加强效果将会很好。 无论采取固定或变化性加强时制,都可以训练出一长串的连续性为,小鸡可以为了一粒玉米猛啄纽扣一百次以上,人类也有许多久候加强的例子,有位心理学家开玩笑地说,自人类存在以来,等待时间最久、一直未获加强的行为就是在研究所学习。 间隔极长的加强时制有时会因为超过极限而失效,小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能量高于一粒玉米提供的能量时,啄东西的行为通常会消失,因为做这件事所获得的好处太少,变得不值得做。这种情形当然也常发生在人类身上。 间隔极长的加强时制也可能产生另一个现象,小鸡一旦开始啄东西以后既会毫不间断的持续啄,因为每啄一次将更接近获得加强的机会,不过研究人员注意到,加强间隔拖得越长,小鸡开始啄东西的行为就会出现越晚,这种情形称为“长时间行为的延迟启始现象”(delayedstart of long-duration behavior),这是每个人在日常生活都非常熟悉的现象。 遇到任何耗时很长的工作时,无论是报所得税整理车库,每个人都想得出许多无法立即开始进行的理由。写作(有时甚至只是写封信)是个花时间的行为,虽然一旦开始写了后通常会进行顺利,但是要叫人坐下来开始写真的很难!作家詹姆斯·索伯(JamsThurber)发现,要他开始着手写稿真的非常困难,他有时会装装样子骗骗他老婆(可理解,他当然急着要他写稿,因为这样才能付房租),他会整个早上躺在书房沙发上用一只手看书,同时用另一只手随便敲着打字机键盘,将来可以获得金钱正加强物的远景不敌这个延迟启始的现象,而假装打字的动作至少阻止了被老婆斥责的负加强物。 要克服这种延迟启始的现象有一个方法:在行为刚开始时即给予一些加强物。我有时会在海豚连续跳跃六次的动作中增强第一次获第二次的跳跃动作,我也会用同样的技巧训练自己。多年来,我曾经每星期有一个晚上要上研究所的课,三小时的课再加上地铁个一小时的来回,每次都要花上很久的时间,每当接近下午五点钟我总是出现不想去上课的强烈欲望。不过后来我发现,假如我把这趟路程分段,再把第一段分成五个小步骤——走路到地下铁、赶上列车、转车、搭公车去大学和最后爬上楼梯去教室,而且每当在我完成一个小步骤就犒赏自己一小块我很喜欢但平常不吃的巧克力,这个加强每个初期小步骤的做法至少让我能够走出家门,而且几星期之后我已经能够一路前去上课,不再需要巧克力,心中也没有挣扎。
《别毙了那只狗》第一章 第十节 无法预料的奖励更具有吸引力 第十节 无法预料的奖励更具有吸引力有个广为流传的错误观念是,当开始以正加强训练某个行为时,便必须在训练对象的生活里一直使用正加强物,如果不这样做,这个行为将会消失。这个说法并不正确,事实上只有在学习的阶段才需要持续使用加强物。你可能会经常称赞幼儿使用马桶的行为,一旦这个行为完成学习,他将自行获得加强。我们应该常常给予初学者加强物,例如教小孩骑自行车时可能需要不断告诉他:“那就对了,现在骑稳,你做到了,很好!”如果当他学会汽车后而你却仍不断称赞他,这时你就很蠢了(小孩也会以为你发神经了)。 为了使学成的行为维持一定的稳定程度,非但没有必要每次都加强这个行为,而且极为重要的是,不可以经常加强这个行为,而要改为偶尔加强,而且是随时性让它“无法预料”的加强。 心理学家称这种加强方式为“变化性加强时制”,他维持行为的效果比起持续性、可预测的加强方式更好。一位心理学家曾跟我这样解释:假设你的新车总是很容易发动,某天当你坐上车后把车钥匙一转,他却没发动,你可能会在试着发动几次,但是你很快就会判断这辆车出了问题而打电话给修车场,由于转动车钥匙的行为没有立即带来期待的加强结果,这个转动钥匙发动车子的行为很快便会消失。相反地,如果这是台老旧的破车,机会很少在第一次就发动,而且通常还要花很久时间发动,这时候你便可能花上半个小时的时间不断试图启动,因为这个转动车钥匙的行为长期以来一直受到变化性加强,因而能稳定维持着这个行为。 如果海豚每次跳跃都一定有鱼吃,他跳跃的动作将很快变的马虎敷衍,过得去就好,然后要是不给鱼了,海豚跳跃的动作很快就会消失。不过,如果在它学会这个概念后就有鱼吃,我就现在开始增强它一次跳跃、第三次跳跃,接着便随机加强它的跳跃动作,这个行为就会稳定维持下来,当动物没获得奖励时,它们反而会更常跳跃,期盼下次中奖的机会,而且跳跃时甚至可能变得更有活力。如此一来,我便能够选择加强它较具活力的跳跃动作。 利用变化性加强时机可以塑造出较佳的表现。不过即使是专业动物训练师,有些人仍无法善用变化时制的正加强方法,对他来讲许多似乎都是个特别难以理解与接受的概念,我们都知道当错误行为停止时,我们就不必再继续处罚,可是我们往往无法理解为何没有要继续奖励好的行为,或甚至不应该这么做。这其实是因为我们想用正加强训练的训练方式,训练出进退有礼的良好行为时,我们自己也不太确定应该怎么做才好。 变化性加强时制的威力正是赌博的本质,要是每次投一块硬币到角子老虎机里就会有十块硬币掉出来,你很快就会丧失兴趣,虽然你的钱会越来越多,但是这种方式实在很无趣。人们之所以爱玩吃角子老虎机正是因为他们无法预料将会出现什么:可是能空空如也、可能掉下一些钱、也可能掉下很多钱。我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性加强的作用就是让他们上瘾的重要原因。 变化性加强出现的时间间隔越长,他所维持行为的效果就越强,不过如果你想设法消除某项行为,把时间间隔拉长的变化性加强就对你很不利。所有未获加强的行为都有自行消失的倾向,但是如果他不是获得加强,尽管只是偶发事件——抽根烟、喝杯酒或者对不断唠叨或哀求的人稍事让步——这个行为不仅不会消失,事实上他可能反而被这中间隔拉长的变化性加强时制维持得更好,这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。 我们都看到过一些遭到配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人却执迷不悔的情况,传统经验以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其他方式离开恶劣的另一半,他们又会 这些长期成为受害者的人是否具有严重的心理问题呢?有这个可能,不过他们也可能是长期间隔变化性加强时制的受害者。当你刚开始与对方交往时,认为对方迷人、性感、风趣又无微不至,即使这个人日后逐渐变得难以相处,甚至施暴,但偶尔还是对你展现出好的一面,及时获得这些美好加强物的时光变得越来越罕见,他却成了你的人生寄托。从常理来看,这似乎是十分反常的现象,但是从训练观点的角度来看却显而易见:这些美好时光出现的越少、越无可预料,他的加强作用就越强大,而且你的基本行为也将越持久。此外,也不难理解为什么曾经有过这类关系的人再度寻求同类对象,因为他们与和善正派的正常人交往时,可能就是少了那种加强物极少出现、令人渴盼、因而加强效果加倍所带来的快感。 从操纵者的角度来看,想任意使唤某个人、并且让它随时言听计从,只要偶尔给他想要的东西就可以达到目的了,这便是皮条客管理手下妓女的手法之一。他的确是个极为有效的方法,但是一旦受害者理解到操纵者的强烈“魅力”至少有部分来自这种变化性加强时制,他们通常便能冷静离开这种关系,找到不同的对象。
《别毙了那只狗》第一章 第八节 “继续加油” 第八节 “继续加油” 以刚刚史蒂夫在和他的巡逻德国牧羊犬沟通时的例子来看,它们之间的沟通有另一个特点,史蒂夫的响片声并不是作为一个结束讯号,而是一个“继续加油!”的讯号,由于狗儿尚未发现目标物件,响片的适时出现不但是加强了往上方嗅闻的行为,也让狗儿继续出现搜寻的行为。我在本书初版中曾写道,我们可以多次使用制约加强物但不给予真正的加强物,直到最后再给就可以。我之所以这样说是因为,有时候在训练海洋生物世界的海豚出现长时间的连锁行为时会这么做,但是我当初写书时并没有意识到,我们事实上使用了(至少) 两种的制约加强物(或标定讯号):一种是正常音量的哨音,代表“这就对了!食物随后就到,过去那边取食,完毕了!”另一种则是较轻的哨音,代表“这就对了,但是还没达到目标!” 我在九十年代曾与许多响片训练新手共事,驯犬书籍作家摩根·史贝克特(Morgan Spector)称这些人为“跨域训练者”(crossovertrainers),他们精通处罚式训练,但正试图使用塑型法和正加强的训练模式。当时我发现他们都很愿意按响片,但却极不愿意给食,甚至到了已经让响片意义不复存在的地步。对此我必须强调,唯有遵循“按一次响片,给一次零食”的通则才能教会人们如何有效塑造行为。 不过,在许多现实状况中,有些“过渡性的加强刺激”可能非常好用,如同上述史蒂夫与巡逻犬的例子所示,另择一个加强刺激,并借由这个刺激告知训练对象“那就对了,继续加油!”是个解决方法。“继续加油!”的讯号并不需要直接联系到初级加强物,只要在响片终结声出现之前插入这个讯号即可,学习者很快就可以理解到,他只是一个引领至最终加强物的讯号。 接下来你便可以好好运用这个“过渡性的加强刺激”,在连锁行为当中利用它作为蕴含讯息的标定讯号,不必让进行中的行为停下来;举例来说,敏捷赛中狗儿进行障碍竞速,主人必须在狗儿迅速移动之下指示他下一个障碍是什么,我曾见过狗儿在达成某项障碍后,表现出不知所措的样子,仿佛没听清楚指示,不知该穿入隧道还是跨栏,他的头在两项障碍之间来回摆动着,当狗儿朝跨栏望过去,主人大喊“没错”时,狗儿才立刻跑向正确的障碍项目。 如同最终才出现的响片声一样,这种过渡性的讯号可以是任何刺激,如“响片、哨音、大喊一声或挥一下手”,但要注意的是,这个刺激并不能只是怀抱希望的鼓励或加油打气(这么做可能使动物分心或不小心加强了其它的行为),它也必须是一种意义明确、精确使用的制约加强物。
《别毙了那只狗》第一章、第五节 第五节 意外的“大奖” “大奖”是一个对动物或人类都极为有效的技巧。大奖是指非常大的加强物,甚至可能比平常大上十倍,而且训练对象没料到他会出现。我曾在一家广告公司任职,公司除了有一般的圣诞派对,大案子结案或签下新客户时也会有非正式的庆祝活动,不过董事长还有个习惯,他每年总会举行一两次突如其来的惊喜派对,可能在某天下午三、四点时,他会阔步行经每个办公室,大喊着要大家停下工作、关上电话总机,从外面接踵而至的服务人员、乐师、调酒员、香槟、薰鲑鱼和所有派对应有的东西。这些全为我们而来,而且没有特殊的理由,这对五十名员工来说完全是出乎意外的大奖,我认为这对提升高昂的工作情绪有极大影响。 大奖也可以用来标定“突破性的意外进步”,以我认识的一名训马师为例,当年青马儿首度完成一项困难动作时,他随即从马背跃下,除去马鞍和马勒,然后放它在场地里任意奔跑——给予完全的自由便是一个大奖,而这么做似乎把新行为保留下来。 然而,遇到动物不听话、害怕或抗拒而完全不出现好行为时,偶尔给一次大奖也可能有效改善动物的反应。我们曾在海洋生物世界进行一项有美国海军资助的研究,做法是加强海豚的新反应,但不加强过去以训练过的行为,研究对象是一只极少出现新反应、名为“胡”的温顺海豚,如果它出现反应却未获得加强,它就会变得不动。后来有次训练时,它持续二十分钟没有出现反应,训练师在这时候丢给他两条鱼奖励它这个“没有反应的行为”,“胡”似乎被这个慷慨大礼下了一跳,再度变得活跃起来,很快出现一个可被增强的动作,后来的几次训练出现了真正进展。 我也亲身体会过这只海豚的经验。在我十五岁时,骑马课是我人生最大的乐事,每张骑马券可上十次课,但我每个月零用钱只够买一张。当时我与父亲菲利普·威利及继母瑞琪同住,虽然他们对我很好,但正处于青少年叛逆期的我,总是一幅刻薄残忍、暴躁易怒的态度。有天晚上这两位慈祥又聪明的家长告诉我,他们对我的行为感到忍无可忍,所以他们决定要嘉奖我:他们送给我一张全新的骑马券,这是他们其中一人不辞辛劳到马场购买的。哇!我完全没资格收下这样的大奖!我记得我当下洗心革面,多年后在我写这本书时,继母瑞琪确认了这段记忆的属实性。 我并不完全了解这种不劳而获的大奖为什么具有如此突如奇来而又效果深远的作用,我只知道那张额外的骑马券及时解放了我心中的压抑和憎恨,我猜这便是那只海豚的感受。或许将来有人会拿它作为博士研究论文,向我们解释原由。
学习训练理念与技巧的”圣经“《别毙了那只狗》第四节 第四节 加强物的大小 刚开始利用食物来加强的训练新手常搞不清除食物加强物应该多大,答案是尽可能越小越好,加强物越小,动物能越快吃掉它,不但可以减少训练者等待的时间,而且每次练习时还可以增加加强物的使用次数,不会让动物一下子就吃饱吃腻了。一九七九年,我担任化盛顿特区国立动物园的顾问,教导动物园员工使用正加强技巧。在训练课程上有位管理员抱怨自己的猫熊训练进展得太慢,我认为这不寻常,像猫熊这种贪心又活跃的大型动物以食物作为增强应该很容易训练,在我观察过一次他的训练后发现,这位管理员虽然已缓慢塑造出猫熊的动作,但是问题出在他每次给予猫熊的加强物竟是一整根胡罗卜,在管理员宝贵的十五分钟训练时间里熊猫得到了三次增强物(而且它也难免吃腻胡罗卜了)如果改成每次只给一片胡罗卜的话,情况将好得多。 一般来说,一小口加强物就足以让动物保持兴趣,对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,对大象则是半颗苹果,如果是特别喜爱的食物,分量甚至可以更少,例如喂给马一茶匙的榛子,美国国立动物园的管理员甚至只用葡萄干训练北极熊做出许多有用的行为(例如依照指令以东至西移动至另一个栏舍)。 训练的基本法则是,如果每天只训练一次,在满足每日给食的份量的四分之一前,动物的训练反应都会很好,等训练结束后再给它其余的份量,如果每天训练达到三至四次,你可以把平常份量分为约八十等份,每次训练用二十至三十份,八十份加强物似乎是任何动物维持学习兴趣的每日最高量(这或许是幻灯片匣里最多只能放入八十张幻灯片的原因,因为每当讲师要求换第二个幻灯片匣时我总是会抱怨一下)。 动物行为训练的难易程度也与加强物的大小有关,我们在海洋生物世界的经验发现,要求鲸鱼表演笔直冲出水面二十二尺的高难度跳跃动作时,必须给予一条大青鱼作为奖赏,如果只给平常加强用的两条小梭鱼,它们会拒绝表演这个动作。 至于人类,加强物的大小虽然没有一定的定律,但是有时候工作越艰难,报酬将会越大,如果我们完成了艰难工作却未获得相对报酬时,我们肯定痛恨不已。
学习训练理念与技巧的”圣经“《别毙了那只狗》第二节 第二节 哪些是“负加强物” 加强物的作用是增加行为发生频率,但他不一定都是学习者想要的东西,避免不喜欢的东西也可能是种加强。实验室研究显示,如果改变行为可以让刺激(aversivestimuli)消失,这个刺激剂可加强该行为的发生频率,这类刺激就称为“负加强物(negativereinforcers )”一种让人类或动物会设法避免的刺激。 负加强物可能是极其轻微的刺激,例如朋友在讲冷笑话时不削地瞥你一眼,或冷气吹过来的一阵凉风让你起来换个位子。再进一步剧烈的刺激,例如公开侮辱或者电击,除了可以当作处罚之外,也可拿来作为负加强物;我们被老板责骂的经历或许极具处罚性质,但是我们很快便学会了当爱骂人的老板站在前门时我们就从后门溜进公司上班。 负加强物有时改变就能停止或避免不良的刺激,只要新的行为一出现,不良的刺激立即停止,因而强化了新行为。假设我坐在姑妈家的客厅里,像自己家里一样把脚放在桌上,姑妈高挑眉毛表示不满,我便及时把脚放回地上,她的表情就放松了,我也松了口气。以这个例子来说,高挑眉毛是一种不良刺激,具有负加强物的作用,我以新行为停止了这个刺激,所以把脚从桌子上放回地上的行为将来可能再次发生,在我姑妈家里是这样,到了别人家里可能也会一样。 负加强物几乎能完成所有的训练,传统的训练方法多半就是这么做——当左边缰绳拉紧时,马儿只要向左转,拉扯嘴巴的讨厌压力即会减少,因此马儿学会了向左转;驯兽团的狮子在表演时退回台子上呆着不动,因为这么做才能避免被鞭子打到。 然而,负加强并不同于处罚,两者的差别在哪儿呢?处罚是指在意图改变的行为发生后才产生的不良刺激,对该行为可能毫无影响,我在本书初版中写道:“没人知道考试成绩不好而被修理的男孩将来的成绩会不会变好,但是他绝对不可能改变这张已经带回家的成绩单。”的确,当我们怀着意图需要处罚时,我们已经常常错过时机太久,不过这还不是处罚和负加强真正不同的地方。 现代行为分析学者把任何停止行为的事件都视为处罚。不懂事的幼儿把发夹插入电插座时,妈妈用力一抓,把它的手抓开——这个行为停止了,但其它的事情可能就发生——幼儿开始哭、妈妈感到愧疚等等,不过他把发夹插入插座的行为确实消失了,至少当时是如此,这就是处罚的作用。 心理学家史金纳(B.F.SKinner)更加明确了“处罚”的定义,是“某项行为导致喜欢的事情消失的过程”,或者是“某项行为导致不喜欢事情的过程。”不论是哪种情况,处罚让当时发生的行为停止了,但没有人可以预料以后会出现什么后果。我们已知加强物可以加强未来的行为,但无法预测处罚是否能够导致行为的改变。 妈妈抓住幼儿或用力打他的手(即使时间点抓得很准),这个做法是否能保证他将来不会再把东西插入电插座呢?问问任何一位家长,你就会明白现实情况往往是:家长把小东西收好,盖住墙上的插座或者用家具挡住插座。等幼儿长大后,他们特别想这么做的这个行动就会消失。 行为分析学者认为,加强或处罚都是一个有后果定义的“过程”。负加强物可以拿来进行有效的训练,,尽管使用了刺激,训练过程也可以没有伤害,以下是个利用负加强训练骡马的好例子(感谢骡马专家吉姆·洛根〔JimLogan〕提供这种方法)。骡马是种半驯化的动物,美国人把它们当成宠物饲养,其他地区的人则饲养骡马群作为毛料来源。 骡子和马一样都是非常胆怯敏感的动物,除非自幼时经常接触人类,否则人们很难靠近它们,虽然利用食物加强的训练法对骡马效果极佳,但当他们对人类过于害怕而不敢接近进食时,这个方法也派不上用场,所以有经验的骡马训练师做法是,利用响片作为讯号,让骡马它们的行为获得加强,但这时使用的初级加强物(或真正的加强物)是“负加强物”。 实际上,你对骡马的要求是:“如果我走近到离你三十尺处,你可以保持站着不动吗?可以?很好,我按下响片就会转身离去。”“现在,如果我走到离你二十五尺处,你能保持不动吗?可以?很好,我按下响片就走。”利用响片标定骡马站着不动的行为,并且利用“可怕人类的离开”作为加强物,有时在五至十分钟内即训练到能够触摸骡马的距离。骡马控制着整个局势,只要它站着不动,它就可以让人类走开!所以他继续站着不动。当人能够摸了骡马几次之后才离开,这时便打破僵局了,这个人不再令它感到害怕。现在饲料桶该出场了,沟通的行为转变为:“你站着不动是我可以摸摸你吗?可以?按响片就赏你好吃的东西。”这时骡马便进入了获取“正加强物”的阶段,这些正加强物包括食物、搔痒和抚摸,而且它正把站着不动的新行为做得很棒,而不是朝着别处逃命去。 利用离开(或好行为出现即不再施压)的做法就是所谓“通马语者”常利用的训练技巧,训马者在围起来的区域内与自由奔跑的马匹互动,在相当短的时间内让马匹脱胎换骨:野生的马儿从惊怕逃窜变得能够冷静接纳人类,甚至容许马鞍及人类骑乘,这种整体性的转变可说非常神奇。使用这些技巧的训练者虽然都习惯以某个声音或动作作为标定讯号(或制约加强物),但很少人真正意识到自己这么做,反而常用迷信说法解释这个现象。其实这种现象一点都不神奇,全是运用“操作制约”的结果。 虽然负加强很有效,但请牢记:每次使用负加强时,同时也使用了处罚。当拉紧左边的缰绳,在马儿转向左以前,向前走的行为即不断受到处罚。而且滥用负加强和刺激也可能导致莫瑞·西德门(MurraySidman )博士所谓的“附带作用”,也就是因为处罚引起的不良副作用。(详见第四章)
首页 1 2 下一页