增強 - Wikiwand

增强（英语：Reinforcement），台湾也称增强，是行为主义心理学中的一个重要概念，是关于理解和修正人的行为的一种学说。心理学研究发现，人类或动物为达到某种目的，会于所处的环境下采取特定行为；当这种行为带来的某种反应或后果对他有利时，这种行为就会在以后重复出现，而该结果就称为“增强物”；反之亦然，当其行为会对他带来不利时，这种行为就自然减弱或消失，个体对行为结果所产生的后续反应，就是以操作性条件反射进行的。而由于“增强物”的适时出现，增加了个体以后在相同情形下重复这种行为的机率，这表示“增强物”对于个体的反应起了增强作用。此种增强作用，即称之为“增强”。

“增强”这一概念的提出源于美国心理学家爱德华·桑代克，后经约翰·布罗德斯·华生、克拉克·L·赫尔等人的发展、修订，到新行为主义代表人物伯尔赫斯·弗雷德里克·斯金纳达到了一定的理论高度并发扬光大。他们都认为增强作用是决定人和动物所作所为的关键因素，并可以用这种“正增强”或“负增强”的办法来影响行为的后果，从而修正其行为。

增强的类型

正增强与负增强

行为的增强有2种类型：

正增强

正增强，也称积极增强、正向增强发生于一件渴求中的事或物作为一种结果而呈现，而这一结果刺激了这一渴求。在进行某个行为之后，增加对象喜爱的（通常是愉快的）刺激，并使该行为的出现频率增加。在斯金纳的实验中，以食物或糖水做为刺激，经由老鼠按下杠杆的行为来供给食物和糖水，造成老鼠按下杠杆的频率增加。

例一：老鼠按下一个按钮会得到奖励，因而老鼠更频繁地按下按钮，越来越多的奖励增加了其按下按钮的次数，因而正增强了其按按钮的行为。
例二：女儿收拾玩具则父亲给糖，如果女儿确实收拾玩具因而变得更勤快了，则糖是正增强物，正增强了收拾东西的行为。
例三: 公司依照员工销售业绩多少进行对应奖励，业绩高则奖励多，员工因此销售更勤快、更高效，则雇主收到正增强的效用。^[1]^:253
例四：自闭症儿童在与别人沟通时，眼睛看著别人就说：“做得好”。

负增强

在进行某个行为之后，减少对象厌恶的（通常是不愉快的）刺激，并使该行为的出现频率增加。在斯金纳的实验中，以噪音作为刺激，经由老鼠按下杠杆的行为来停止噪音，造成老鼠按下杠杆的频率增加。

例一：父母反复唠叨叫孩子打扫卫生后，孩子为了避免前述情况的发生而打扫卫生。此处，父母的唠叨是孩子想要避免的事件，因而负增强了孩子打扫卫生的行为。
例二：一个人用某品牌止痒软膏止蚊子叮咬痒，若止痒效果好，则此人更有可能继续购买使用该软膏，蚊子叮咬引起的瘙痒则是其中的负增强物，负增强了其购买行为。
例三: 公司规定员工布置的业绩进度如在周五前完成则可在周六休假。周六还要上班这一结果是负增强物，是大家所不愿意见到的，因而促进了公司的提升，这一过程则为一个负增强的过程。^[1]^:253

辨别正向与负向是个重要的问题。举例来说，对一个非常热的房间而言，来自外界的气流是正向的，因为它带来了相对凉爽的空气；但是它也同时是负向的，因为它带走了原本的热空气。有一些增强物可以同时以正向和负向作控制，例如一个毒瘾者以吸毒来增加兴奋和摆脱戒毒症状。另一个例子是进食，进食增加了愉悦感同时移除了饥饿的感觉。直到现在，许多行为心理学家以不带对立性（Polarity）的增强和惩罚来包含所有的环境变化。

负向增强有两种形式：第一种是逃脱制约，指令人厌恶的刺激出现，而作出行为去减少这些厌恶的刺激，例如抓痒或按下闹钟的按钮。而另一种则叫回避制约，指在目标为了避免出现厌恶刺激的行为，例如为了避免饥饿而进食，或是为了避开塞车而改变路径。

回避学习（avoidance learning）是一种学习模式，指某种行为能够造成一些令人厌恶的刺激停止。例如在大太阳下遮住眼睛，可以避免接受刺眼的阳光。

惩罚

惩罚是指用来减少、减慢、移除不想要的行为，这类技巧叫做行为减少器（英语：behavior decelerator）^[2]^:20。与增强相同的是，被惩罚的是行为而不是动物本身。只有知道一个刺激对于行为出现频率的效果时才能确知它是否为惩罚。

正向惩罚，又称第一型惩罚^[3]，实验者在环境中增加令人厌恶的刺激，以对行为进行惩罚。例如在某个行为之后，以电击或噪音作为刺激，造成该行为出现频率减少。
负向惩罚，又称第二型惩罚^[3]，亦可称omission，是将环境中的正向增强减少。例如拿走食物盘，或在小孩进行某个行为之后，以拿走小孩的玩具作为刺激，造成小孩进行该行为的频率减少。

与增强一样，辨认一个惩罚不经常需要提到它的正向或负向。而两种的惩罚分别在引入一个新的事物，如责骂，而另一个移除已有的东西事物，如罚款。另外，虽然Skinner认为惩罚只是一个“短暂的压抑”（temporary suppression），即惩罚不是百分百相对于增强，但实验^[4]^[5]^[6]却显示两种方法效果一样，最重要是施行即时性与一致性就可改变行为^[2]^:37。另外，某些行为心理学家认为惩罚是一个“初级过程”，也就是完全独立的学习现象，与增强有所区别。有些人认为它是负向增强的一种分类，创造任何一个造成回避惩罚行为（甚至不作反应）的状态可看成是一种增强。

惩罚的缺点

在行为改变上，虽然惩罚与增强一样有效^[7]，但是惩罚亦带来不少副作用：

情绪上会令到目标恐惧、生气，甚至令目标变得焦虑^[8]。
惩罚除了控制特定行为，也一并影响所有其他行为。例如，一个学生问了一条问题，老师说了：“这条问题真蠢”。虽然该老师最初只想减少学生少问蠢问题，但是反而无论好与坏，令到该学生都不再问问题。
比起增强，惩罚需要经常去监视目标行为。例如，小孩子若因为帮忙做家务受到奖励，他会主动去做家务。而且最重要他让家长知道，好待父母来给予想要的奖励。相反，若他因为不帮忙做家务而受到惩罚的话，家长就需要经常去检查儿子，因为小孩不会主动告诉父母自己没有家务（concealment）而想受罚。
惩罚令到目标想离开该学习环境，好像学生会因为老师的惩罚而扮病不愿上学。
惩罚令到目标更暴力^[9]。好像监牢的囚犯会袭击其他囚犯或监牢人员。也易令惩罚使用者误用权力。
因为惩罚习惯化（英语：Habituation）而通常使用强度要越来越大。

代替惩罚

避免反应（Response Blocking）：改变环境令到目标不能作出反应。例如精神病人被捆绑起来，防止作出伤人的行为。安全眼镜用来避免有发展障碍的人捅自己的眼睛^[10]。
消弱（extinction）：麻烦行为的发生有时候是因为有正向增强物支持下导致。例如在小朋友调皮研究的发现，小朋友作出行为失当是因为想得到家长的关注^[11]。只要父母关心小孩（withdraw reinforcer）就可以减少上述问题。在另一个研究中，比较老师如何训斥调皮学生的方法，发现老师如果偷偷细声地骂会比公开大声地斥责学生讨厌的行为，学生反而减少一半他们的不好行为^[12]。换言之，责骂其实是一种增强物。在其他研究治疗一些强逼症行为也发现病患不断重复伤害自己身体是因为怕失去了照顾者的倍伴^[13]。
差别性增强（Differential Reinforcement）：只对个别目标行为增强^[14]^[15]^[16]。好处是除了让目标知道他们不应做甚么，也同时教导他们甚么可以或应该去做^[2]^:25。
1. 不相容行为的差别性增强（DRI）：在没有惩罚的情况下增强特殊的不相容行为，这种方法用来减少已经频繁出现的行为，例如一个人不可能同时离开房间并在房间里与某人打架，或奖励小朋友安静地坐在座位而减少其在课室走来走去或不骚扰其他同学^[17]。
2. 其他行为的差别性增强（DRO）：增强非欲消除行为之外的任何其他行为，例如想让小朋友减少玩电脑游戏则可改为增加他温习的鼓励。
3. 低反应率差别性增强（DRL）：只增强出现频率低（较少出现）的行为，例如想让小朋友安静下来就奖励小朋友由每隔2小时至每隔4小时才大声叫嚣。对应高反应率差别性增强（DRH）
4. 交替行为的差别性增强（DRA）：将增强物用在较为认可的行为，而不是欲消除的行为上。通常家长想减少不想要行为，告诉小孩甚么不可以去做，但很少会教他们甚么是可以做。DRA就是透过奖励目标一些其他好的行为，让更多好的行为去代替不好的^[18]。例如老师将更多的注意力放在坐著的学生，而不是在课堂上说话的学生（假设老师的注意力是一种增强）。
无条件增强（Noncontingent reinforcement）：不用要求要先做甚么都能得到回报^[19]。例如老师每隔一回就关心一下其自闭症学生，不用学生做甚么就有更大机会减少学生的问题^[20]。
暂停（英语：Time-out (parenting)）（Time-out或In-school suspension）：类似负向惩罚，当目标出现不想要的行为，将其带离其原本愉快环境^[21]，如另一间没人的房间^[22]。

增强程序

当动物所处环境中够多的变因被减少或是被控制时，他们在增强后的行为型态将明显的能够被预测。甚至当增强的速率适应于特定方法时，非常复杂的行为也能够被预测。增强程序是用来测定将被增强的反应（特定行为的单独出现）的计画。有两种极端情况，一种是连续增强，指增强所有反应；另一种是消弱，指没有反应被增强。

固定比率增强（Fixed ratio schedule，简称 $FR$ ）: 每固定次数反应都被增强，如每20个反应提供老鼠一个小食，或者工人每做100件门铰就有$500。例子：按销量核算佣金收入。
固定时距增强（Fixed interval schedule，简称 $FI$ ）: 从训练开始或先前一个增强之后经过特定时间长度之后增强，假设在这段期间至少有一次反应出现。例子：每月奖金制度。
变动比率增强（Variable ratio schedule，简称 $VR$ ）: 在不同的反应次数增强，有一个大约的平均值，例如老虎机不知道中奖机会^[23]、升迁制度。
变动时距增强（Variable interval schedule，简称 $VI$ ）: 在经过一段不固定的时间之后增强，有一个大约的平均值，并假设在这段期间至少有一次反应。例如查看邮箱，不知道何时会有重要的信件或垃圾邮件，因为无法预测，所以会产生一个稳定的检查行为。例子：按绩效考核的特别奖项或收入。

比率程序能够比间隔程序产生更高的反应频率。变化程序也比固定程序产生更高的反应频率。变化比率程序产生较高的反应频率，且对消弱有较大的抵抗力，赌博是变化比率程序最有代表性的例子。在固定比率程序中，在增强之后会有一段反应暂停时间，称为后增强暂停，在图表上呈阶梯状。固定间隔程序也有后增强暂停，但是在图表上呈现的是扇型。由于在已消逝的时间并没有增强刺激，因此对象学会了以平缓的速率反应。如果生物个体是一个固定比率程序的对象，会有一个为获得增强的行为的次数的瞬间增加，然后生物个体被观察到在增强来到之前有一段周期性的暂停。这种现象被称为比率弯曲，对照在图形上的顺序为后增强暂停、比率上升、增强。

间歇性增强

比起每做一个行为就有奖励，与持续性增强（continous reinforcement）不同的是，间歇性增强（intermittent）指每一个反应都不一定有结果。例如，在教育应用中，当目标学生学到想要他们做的行为后，老师可以偶尔称赞他。与赌徒上瘾的逻辑相同，因为透过不能确定何时有回报，时不时的回报会鼓励赌徒，令该行为更难消失（resistant to extinction）。目标习惯了有时会没有奖励（赌徒则没有中奖）但不是永远没有机会（会赢钱的）。换言之，持续性增强的效果虽然快，但是快来也快去，所习得的行为也很快。

不完全的增强程序

考虑消弱的影响，不完全的增强程序比起连续性的增强程序有较大的抵抗力，这种现象称作不完全增强消弱效应（英语：Partial reinforcement extinction effect，简称PREE）。比率程序则比间隔程序更具抵抗力^[24]，而变化程序也比固定程序更有抵抗力。假说如下：

分辨能力：不能轻易分出该行为才会有反应（如赢钱）^[23]
挫折影响：像失败乃成功之母，必须持续进行某行为才能最终得到奖励。而减少挫折的感觉变成增强赌徒继续去赌的原因，不再太关乎有否赚钱。
开始次序：一开始有大量成功的经验（如赢钱），即使之后明显少了成功仍继续会
回应单位：其实根本没有不完全的增强程序，只是回应单位的分别（如1单位可以是10单位反应，也可以100单位反应）

同时几个增强程序

并行程序（英语：Concurrent schedule）指多个相对的（alternative）增强程序同时存在，程序间有不同的反应与增强物。试想像一个人在家庭与事业之间要取得平衡，当他投放更多精力在其中一样会有相应的正面回报（如维系更多时间在家庭上则与家人关系更好，或专攻事业就有更多财政回报^[25]）。在匹配律（英语：Matching law）^[26]中，当面对同时多个可行的选择时的可能反应（自由意志），如在理查德·赫恩斯坦（英语：Richard Herrnstein）的实验中白鸽要去按两个其中一个按钮，但按多久而带来食物都不同，而他则研究当有两个增强时，如何分配自己的反应是两者上^[27]。若某增强的回报比另一个多，当然目标会根据回报调整自己的反应策略^[28]。这个方程就是用来评估反应的偏好。这也可以预测小孩与父母的较量^[29]。像经济学中的代替品，除了所施放的增强物，现实中亦可能有多个增强物影响对目标增强的果效（英语：Reinforcement relativity）。

影响增强程序因素

某些因子的增加和减少，能够改变增强和惩罚刺激的效果，例如：

增强物的质与量：一般越多越容易增强某行为。一个刺激的效果也与成本效益有关，刺激的数量或是大小若是足够，对行为的刺激效果较大。例如特别庞大的乐透奖金，将使人愿意付出金钱和时间去购买彩券，如果奖金很少，可能不足以使人特地开车出门购买彩券。需要注意的是，在乐透的例子中除了奖金之外也存在惩罚（花费时间和金钱），行为是否表现，取决于增强和惩罚是否达到平衡。或某人给予$1000与$1去要求别人做事，正常来说前者会吸引（重赏之下必有勇夫）。这些改变效果的因子大多有生物学上的理由。生物个体的体内恒定可以用来解释满足感，例如生物个体需要补充糖类的时候，则糖的甜味会成为一个增强刺激；当生物体内的血糖浓度升高，甜味的刺激效果就会降低，甚至产生厌恶感。而不同的增强物对不同目标亦有不同的效果，只有投其所好^[30]才能令增强效果更显著。另外，当孩子长大后，不建议予一些实质的增强物，反而透过一些非物质（nontangible）的增强物会更好。例如：给多他们看最爱游戏的特权、赞赏等。
附带性：如果一个刺激并非总是伴随在行为之后，则刺激的效果将减少；如果一个刺激确实的附带在每一次行为之后，刺激的效果较大。例如当一位学生习惯迟到，而对于迟到的处罚是偶然性的，并非每次迟到都会处罚，则处罚的效果不如每次迟到都处罚的效果。而加强目标反应则需要让将所做带来的结果明显清楚（explicit），例如老师应说“你要安静地坐在你的坐位”^[31]而不是“你要乖些”或“你要考到超过70分”而不是“你要努力学习”^[32]。
增强延迟：个体进行一个行为过后，刺激回馈的立即性^[33]，会影响刺激的效果。行为与刺激的间隔愈短，效果愈大。例如一位在公路上超速的驾驶，若在一周之后才收到罚单，那么此罚单的效果将不如警察立即拦阻开罚单的效果。或要工作多久才会成功变得富有。这些叫做continous reinforcement，即指每当观察到目标有想要的行为，就要尽快立即给予相应的后果。
回应难度：如多容易就可以得到金钱，或若做好事做有多些分而获得小礼物，那做了坏事就扣分（response cost）^[34]^[35]。
行为惯性（英：Behavioral momentum）：当人们习惯了经常有回馈后，即使之后没有回馈仍会较大机会做该反应。如退休后仍继续工作^[36]。或者在戒毒治疗方面，戒毒人士得容易会复发再吸毒，因为旧有药物的带来的增强效果而令更难改变行为^[37]。
规则化：一些已知的规则比起偶然发生的事难改变行为。例如小朋友在文法书上学习英文会比直接从外国人身上学英文难^[38]。或者预先的指示会影响人们如何回应^[39]^[40]。
增强历史：有过去经验而对比到未来会如何（behavioural contrast）。如墨西哥人移民到美国后预计未来会有钱而努力工作（positive contrast），或者经常发梦未来会变成富翁而现在懒散不工作（negative contrast）。
满足感，也可称为厌腻感：刺激的效果与动物个体对该刺激的胃口有关，个体对刺激的欲望愈大，刺激的效果也愈大；如果某动物个体已经对某个刺激感到满足或是厌腻，那么该刺激将不再有效果。例如食物对一只已经被喂饱的狗，鼓励的效果很小。

其中立即性和附带性能够以神经化学来解释，当生物个体受到增强刺激，则大脑中的多巴胺通道将被活化，这些通道组成的网路释放短暂的多巴胺脉冲到许多树突，因此散发增强刺激讯号到突触后神经元^[41]。造成刚被活化的突触对输出讯号的感应加强，因此造成增强刺激之前的行为的出现机率增加。在统计学上显示对行为的增强刺激成功。然而当增强刺激的立即性和附带性减少，多巴胺对突触的影响能力也会减少。

增强物类型与作用

类型

非制约增强物 有时称为初级增强物 （primary reinforcer），以天生固有（inherited）的增强，作为一个刺激或状态，通常具有生物学上的理由（如爱、食物或睡眠机会）。
制约增强物，有时称为次级增强物（secondary reinforcer），一种需要与非制约增强物或更早成型的制约增强物（如金钱）许多次的同时出现的刺激或状态。在古典制约中，称为二级制约，如“称赞”。
普通增强物（generalized reinforcer）一种过去曾与其他许多增强物同时出现的制约增强物（如金钱）。
实质增强物（concrete reinforcer）一种真的摸得多的物件，如零食、玩具和贴纸。对较年幼的小朋友很有效^[42]。
社交增强物（social reinforcer）透过一些手势或动作来回馈目标其行为。例如老师给学生一个笑容、更多注意力或者称赞^[43]^[44]^[45]。
活动增强物（activity reinforcer）指目标有机会做他们想做的事^[46]。参见普墨克原则。
内在增强物（intrinsic reinforcer）指目标不需靠上述的外再鼓励，而是从心影响自己去做某行为。

用途

这些增强物主要用来

增加增强价值，令到更渴求该奖赏而加强增加效果。
提供讯息，让目标知道该回应是应该去做的，例如白鸽在实验中完成指定动后有相应颜色的小灯闪耀。
标记（英语：marking），突出该回应是意义的，例如给小朋友一个小贴纸。
连结（英语：bridging），让回应与奖赏更易连结起来。

塑型

塑型（英语：Shaping）影响了增强的成功，增加训练者所要求的精确的近似反应^[2]^:30。例如为了训练一只老鼠按下杠杆，可将身体转向杠杆作为第一个步骤，并增强这个动作。在训练过程中，对象的所增强的行为会愈来愈接近训练者的要求^[47]。譬如跑步选手最初训练只有0.4个单位速度，第二次去到0.8个单位速度，第三次0.7，第四次有0.6，第五次0.9⋯⋯不断训练后最终有1个单位速度。在改变病患行为也有应用，好像一个有严重呼吸病的8岁儿童只肯戴上口罩只有5秒，在不断鼓励下，他最终戴上了40秒^[48]。

连锁

连锁（英语：Chaining）将分散的几个行为连结成一个系列（塑型只处理一个行为），每一个行为造成的结果，都是对上一个行为的增强，与对下一个行为的刺激^[49]。有许多连锁的教导方式，如前进连锁，从连锁的第一个行为开始；后退连锁，从最后一个连锁开始；与全作业连锁（total task chaining），将所有的行为从头到尾教完，而不是以一系列的步骤。以打开一个被锁的门为例，首先将钥匙插入，然后转动，然后门打开。完成前一个要求，能作差别性刺激物（S^d）来让目标知道自己完成该步骤。

三者差异如下^[2]^:19:

前进连锁：将首先教导对象首先插入钥匙，直到这个动作熟练。之后对象会被要求插入钥匙，并教导转动钥匙，直到转动的动作熟练。然后教导将门打开。
后退连锁：训练者先自己插入并转动钥匙，然后再教导对象开门。当开门动作熟练，训练者自己插入钥匙，并教导对象转动钥匙，然后对象开门。最后教导对象插入钥匙，并由他们自己转动和开门，第一个动作学会的时候，所有的动作都学会了。
全作业连锁：将所有步骤作为单一系列来教学，在每个步骤中提示对象，并在熟练的过程中同时减少提示。

争议

理据

增强的理论被批评为循环论证。争论点在于这种循环定义:“增强物是造成增强效果的东西，而有增强效果的东西是增强物。”而薛菲尔德（F. D. Sheffield）建议定义改为“附带在反应上的完成行为（consummatory behavior contingent on a response）”，但这种定义尚未被心理学广泛使用。而有些同行亦批评其理论多是事后孔明，不是科学界想要的“预测”^[50]。另外，增强理论暗示了人们只能被动地回应环境的变化^[51]，忽略人的创意、动机与社会因素的影响^[52]。这个理论也不能很好地解释人的牺牲自己而令其他人得益的利他行为。

字眼

1920年代俄国心理学家巴甫洛夫可能是首先在行为方面使用“增强”一词的人，但是他保守地使用俄语中近似的词语，且用这一词语来指增强一个已学习但较弱的反应。他的这一用法与今天选择并增强新行为的意义不同。巴甫洛夫也使用了俄语中的消弱（extinction）一词作近似于现今的使用。

在一般大众的使用中，正向增强经常当作报偿的同义词来使用，且针对人而不是行为。负向增强则经常被一般人，甚至非心理学领域的社会学者用来指惩罚。虽然与专业上的用法不同，但是斯金纳在他1938年的书中如此使用该词语首开先河。在1953年，他才跟随其他人，减少了厌恶刺激的含义的使用。

在学术界也有学者^[53]认为正向与负向这个说法有点难去判断一个刺激物是否移除还是提供。例如，Iwata则问了一条问题“温度变化中，是提供冷气，还是移除热气？”^[54]^:363。换言之，增强可以因为改变前的情况代替改变后的情况，令到某行为跟随这变化而增强。

实验工具

斯金纳箱（英语：Skinner Box）：一个高度控制的动物实验箱
穿梭箱（英语：Shuttle boxes）：一个实验箱子分成两个房间，其中一间地面会通电，目标要学会离开（shuttling）原本房间来避免电击^[55]^[56]
累积记录器（英语：Cumulative recorder）：一种用来记录目标学习曲线，例如老鼠每按一次杠杆（level-pressing）或者鸽子啄向按钮时，像地震仪般的机器上的笔会移动，从而记录轨迹^[57]^[58]，并记录何时提供增加物^[59]。

一个穿梭箱来令到狗变得习得性无助
斯金纳箱：目标动物按了红制后会有食物。也可以用噪音或电击影响动物反应

应用

现实中有不少的例子应用了增强与惩罚这个操作制约原则，例如以下：

代币酬赏制（英语：token economy）：如当病患保持良好行为就给予或交换其想要的东西^[60]。例如戒烟者可以透过网上定期上载其没有吸烟的证据来获得一些代用券^[61]。
父母管理训练：父母管理训练是系列性的治疗方案，教授家长正向增强的一些方法，来改善学龄前儿童及学龄儿童的行为情形（如过动、易怒、难以遵照指令等）^[62]。
骑滑板的小鸡
动物训练（英语：Animal training）：动物训练员用一些针对性的指令或赏罚回应来配对目标动物的行为，例如透过使用一个发声的响片训练^[63]^[64]来让动物知道其行为是否正确。另外也常用在训练服务类动物，如导盲犬。
赞颂（英语：praise）：在操作制约中，这个可以是正向增强，用来令目标增加更多想要的行为。在学校理境中，老师用称赞方法可以提升学生的学业表现^[65]^[66]。这也可提升人们的工作表现^[66]。就是不是受赞的人，附近的人通过观察，例如我的同桌同学做了这件事而赞赏，他们也会跟随增强行为^[67]。与其他方法效果差不多，不过最重要的是要在目标好的行为出现后，家长要尽快赞赏，并明显地说明他们因为甚么而受赞^[68]。
应用行为分析：在自闭症儿童行为训练^[69]^[70]，治疗师用手指著自己的口，以提示（prompt）来让目标做更多社交沟通行为后，再以消退（fading）减少此类提示，改以简单的碰一碰患者的面^[71]。
运动技能学习：如何透过不同的回馈来让人学到技能（如弹琴、打球等）。
条件合同（英语：Contingent contract）：透过互给对方条件来解决婚姻关系问题，好像帮对方做一些事（lists the duties）就可以有甚么回报或特权^[72]，来改善夫妇间关系，也能知道对方需要甚么^[73]。这也是种认知行为疗法（CBT），让到双方讨论出问题所在。
游戏成瘾：在电子游戏中，游戏发行商传统赌场的老虎机诱使赌客继续下注的策略（即上述的变化比率增强，英语：variable ratio reinforcement），用虚拟抽奖这种变幻莫测方法来让玩家从抽奖中赢得稀有奖品而堕入强制循环（英语：Compulsion loop）的惯性中，而不少抽奖都会加入对结果没有影响的互动元素令玩家以为抽奖过程需要运用个人技巧^[74]^[75]

参考文献

Mazur, J. E. （2017）. Learning and behavior （Eighth edition）. New York: Routledge,Taylor & Francis Group.
Dinsmoor, James A. （2004） "The etymology of basic concepts in the experimental analysis of behavior." Journal of the Experimental Analysis of Behavior, 82 （3）: 311-316.
Michael, Jack. （1975） "Positive and negative reinforcement, a distinction that is no longer necessary; or a better way to talk about bad things." Behaviorism, 3 （1）: 33-44.
Skinner, B. F. （1938） The behavior of organisms. New York: Appleton-Century-Crofts.
Chance, Paul. （2003） Learning and Behavior. 5th edition Toronto: Thomson-Wadsworth.

外部链接

维基教科书中的相关电子教程：操作条件学习

（英语）An On-Line Positive Reinforcement Tutorial （页面存档备份，存于互联网档案馆）

引用来源

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.