第七章 :學(xué)習(xí) 和行為分析
條件作用(conditioning):事件與行為相互聯(lián)系起來的方式。每一種條件作用都代表著有機(jī)體獲得和使用其環(huán)境結(jié)構(gòu)信息的一種不同方式。
一、 學(xué)習(xí) 研究
1、什么是學(xué)習(xí)
學(xué)習(xí) (learning)是基于經(jīng)驗(yàn)而導(dǎo)致行為或行為潛能發(fā)生相對一致的變化的過程。
(1)行為或行為潛能的變化
學(xué)習(xí) 從你操作的進(jìn)步中顯而易見。
學(xué)習(xí) —表現(xiàn)差異(learning-performance distinction)——你學(xué)到的和你在外顯行為中表達(dá)出來或做出來之間的差異。
(2)相對一致的變化
一旦學(xué)會了某種行為,行為或行為潛能的變化就必須在不同場合表現(xiàn)出相對一致性。
(3)基于經(jīng)驗(yàn)的過程
學(xué)習(xí) 只有通過體驗(yàn)才能發(fā)生。體驗(yàn)包括吸收信息和做出反應(yīng)來影響環(huán)境。學(xué)習(xí) 包含記憶影響的反應(yīng)。學(xué)習(xí) 獲得的行為既不包括因有機(jī)體年齡增長而出現(xiàn)的自然成熟及大腦發(fā)育所帶來的變化,也不包括因疾病和腦損傷而引起的變化。
2、行為主義與行為分析
華生(John Watson,1878-1958)還將心理學(xué)的首要目標(biāo)定義為“預(yù)測和控制行為”。
斯金納(Skinner,1904-1990):激進(jìn)行為主義的立場,進(jìn)化為每一物種都提供了一個行為庫?!冻阶杂?和尊嚴(yán)》:所有超出行為庫的行為都可以被理解為簡單的。
斯金納:心理活動并不能產(chǎn)生行為。相反,它們都是環(huán)境刺激引起的行為樣本。動物的行為可以完全通過環(huán)境事件得到解釋——食物剝奪和運(yùn)用食物進(jìn)行強(qiáng)化。你不必理解任何有關(guān)其內(nèi)部的心理狀態(tài)——你只需要能讓鳥兒在行為與獎賞之間形成聯(lián)結(jié)的簡單學(xué)習(xí) 原則就可以了。
行為分析(behavior analysis):強(qiáng)調(diào)尋找學(xué)習(xí) 和行為的環(huán)境決定因子的心理學(xué)領(lǐng)域。
行為分析家認(rèn)為,人的本性可以通過將自然科學(xué)的方法和原則加以擴(kuò)展而得到理解。其任務(wù)是去發(fā)現(xiàn)在具有可比性的情景下,所有動物物種包括人類,共同出現(xiàn)的學(xué)習(xí) 的普遍規(guī)則。
通常假定,學(xué)習(xí) 的基本過程在物種演化中被保留下來——在所有動物物種中,這些過程就其基本特性來說是具有可比性的。
行為分析尋求的是確定一些順序性原則,它們是人們對其經(jīng)驗(yàn)所做出的行為改變之基礎(chǔ)。關(guān)心的焦點(diǎn),仍然是行為與環(huán)境事件的關(guān)系,而不是行為與心理事件的關(guān)系。
行為分析尋求的是確定一些順序性原則,它們是人們對其經(jīng)驗(yàn)所做出的行為改變之基礎(chǔ)。關(guān)心的焦點(diǎn),仍然是行為與環(huán)境事件的關(guān)系,而不是行為與心理事件的關(guān)系。
二、經(jīng)典條件作用:學(xué)習(xí) 可預(yù)期的信號
經(jīng)典條件作用(classical conditioning),一種由一個刺激或事件預(yù)示另一個刺激或事件之到來的基本學(xué)習(xí) 方式。
1、巴甫洛夫的意外觀察
經(jīng)典條件作用的核心是反射性反應(yīng)。反射(reflex)是一種無須學(xué)習(xí) 的反應(yīng),它是由有機(jī)體生物學(xué)相關(guān)的特定刺激自然誘發(fā)地。任何能夠自然誘發(fā)反射性行為的刺激,都叫無條件刺激(unconditioned stimulus , UCS),由無條件刺激誘發(fā)的行為,叫無條件反應(yīng)(unconditioned response , UCR)。
與無條件刺激相匹配的中性刺激,稱為條件刺激(conditioned stimulus , CS),因?yàn)樗T發(fā)UCR行為的力量是以它與UCS的聯(lián)系為條件的。經(jīng)過幾次匹配之后,CS所引發(fā)出的反應(yīng),稱為條件反應(yīng)(conditioned response , CR)。
2、條件作用的過程
習(xí) 得(acquisition),即CR首次被誘發(fā)出來并隨著試驗(yàn)的重復(fù)而不斷增強(qiáng)其頻率的過程。
延遲條件作用,CS先出現(xiàn)并至少要持續(xù)到UCS的呈現(xiàn)。
在痕跡條件作用中,CS在UCS呈現(xiàn)之前即結(jié)束或被取消了。痕跡指的是有機(jī)體對UCS出現(xiàn)時已經(jīng)不再呈現(xiàn)的CS的記憶。
在同時性條件作用中,CS和UCS是同時呈現(xiàn)的。
在倒攝條件作用情形下,CS出現(xiàn)在UCS之后。
通常,條件作用在CS和UCS之間間隔很短的延遲條件作用模式下最有效。不過,產(chǎn)生最佳條件作用的CS和UCS之間準(zhǔn)確的時間間隔依賴于幾個因素,包括CS的強(qiáng)度和被條件化的反應(yīng)。
同時性條件作用的效果通常都很差,而倒攝條件作用則更差。
當(dāng)CS(例如,聲音)不再預(yù)示CS(食物)時,CR(唾液分泌)會隨著時間的推移變得越來越弱,最終不再出現(xiàn),消退過程(extinction)就發(fā)生了。經(jīng)過一段休息或暫停后,無須再與UCS匹配,CR即可突然重現(xiàn)的現(xiàn)象,巴甫洛夫稱之為自發(fā)恢復(fù)(spontaneous recovery)。
節(jié)?。╯avings)學(xué)習(xí) 的一個例子:再次習(xí) 得某一反應(yīng)比初次習(xí) 得該反應(yīng)時所需的時間要少。
(1)刺激泛化
通常,一旦CR被一個特定的CS條件化了,與CS類似的刺激也能誘發(fā)CR。這種反應(yīng)自動擴(kuò)展到從未與最初的UCS匹配過的刺激上的現(xiàn)象,叫刺激泛化(stimulus generalization)。當(dāng)對一系列在某一維度上差異逐漸增加的刺激所誘發(fā)的反應(yīng)強(qiáng)度進(jìn)行測量時,我們發(fā)現(xiàn)了泛化梯度。
泛化梯度的存在表明了經(jīng)典條件作用在日常經(jīng)驗(yàn)中的作用方式。刺激泛化通過最初特定經(jīng)驗(yàn)拓展學(xué)習(xí) 范圍,從而建立相似的安全因素。借助這一特性,新的可比事件可以被認(rèn)為具有同樣的意義或行為價值。
(2)刺激辨別
刺激辨別(stimulus discrimination)就是生物體學(xué)會在某些維度上對與CS不同的刺激做出不同反應(yīng)的過程。
有機(jī)體欲在環(huán)境中表現(xiàn)出最佳行為,就必須平衡泛化和辨別過程。經(jīng)典條件作用提供了一種允許生物體對其環(huán)境結(jié)構(gòu)做出有效反應(yīng)的機(jī)制。
3、聚焦習(xí) 得
(1)相倚:羅伯特·雷斯科拉,為使經(jīng)典條件作用能夠發(fā)生,除了CS與UCS相接近——出現(xiàn)的時間靠近以外,CS還必須可靠地預(yù)期UCS的出現(xiàn)。
(2)信息性
里昂·卡明,CS還必須具有信息性。
UCS的先前經(jīng)驗(yàn)而使被試用第一個CS來降低第二個CS的信息性的能力,稱做阻斷(blocking)。
中性刺激僅僅當(dāng)它既有相倚性,又有信息性時,才能成為有效的CS。
4、經(jīng)典條件作用的應(yīng)用
(1) 情緒和偏好
恐懼條件作用。
(2)了解藥物成癮者的成因
巴甫洛夫(1927)和貝可夫指出,當(dāng)個體預(yù)期到鴉片的藥理學(xué)作用時,他對鴉片的耐藥性就會提高。
西格爾:毒品 的使用情境作為條件刺激物存在,個體通過阻止藥物的常規(guī)效應(yīng)而學(xué)會了保護(hù)自己。
機(jī)體對藥物的對抗反應(yīng)是無條件反應(yīng)(UCR)。隨著時間的推移,這種補(bǔ)償反應(yīng)就變成了條件反應(yīng)。換言之,在與使用藥物通常相聯(lián)系的情境(CS)中,機(jī)體會對藥物的預(yù)期效應(yīng)做出生理準(zhǔn)備(CR)。由于在那種情境下,有機(jī)體必須消耗一定量的藥物克服補(bǔ)償反應(yīng),才會開始出現(xiàn)“正”效應(yīng),因而抗藥力便提高了。
(3)利用經(jīng)典條件作用
學(xué)習(xí) 過程能夠影響機(jī)體的免疫能力。
羅伯特·阿德:習(xí) 得聯(lián)結(jié)本身就足以導(dǎo)致免疫系統(tǒng)的抑制,使實(shí)驗(yàn)組老鼠更易受到多種疾病的攻擊。學(xué)習(xí) 效應(yīng)是如此強(qiáng)烈以至于在后來的研究中,一些老鼠僅僅是喝了糖精溶液便死掉了。
心理神經(jīng)免疫學(xué)(psychoneuroimmunology):經(jīng)典條件作用可以用來調(diào)節(jié)免疫系統(tǒng)的功能。
研究領(lǐng)域的目標(biāo)之一就是發(fā)現(xiàn)一些技術(shù),利用條件反射來替代大劑量的藥物治療。
服藥真實(shí)的?,F(xiàn)儀式可以作為CS,所以當(dāng)它開始預(yù)言UCS——藥物時——其行動本身即可誘發(fā)降低血壓的反應(yīng)。這樣,安慰劑——無須給予有效物質(zhì)便能再現(xiàn)服藥儀式化情形——即能誘發(fā)有益的機(jī)體反應(yīng)。
三、 作性條件作用:對行為結(jié)果的學(xué)習(xí)
1、效果律
學(xué)習(xí) 是情境中的刺激和動物學(xué)會做出的反應(yīng)之間建立的一種聯(lián)想:刺激—反應(yīng)聯(lián)結(jié)。
S—R,聯(lián)結(jié)學(xué)習(xí) 是隨著動物通過盲目的嘗試錯誤體驗(yàn)到動作的結(jié)果之后,以一種機(jī)械的方式逐漸自動產(chǎn)生的。導(dǎo)致滿意結(jié)果的行為出現(xiàn)的頻率逐漸增加。桑代克將這種行為與結(jié)果之間的關(guān)系稱為效果律(law of effect):跟隨著滿意結(jié)果的反應(yīng),以后出現(xiàn)的概率會越來越大,而跟隨著不滿意結(jié)果的反應(yīng),以后出現(xiàn)的概率會越來越小。
2、行為的實(shí)驗(yàn)分析
斯金納:操作性條件作用(operant conditioning)
操作性行為(operant)指的是任何有機(jī)體自發(fā)的,而不是由特定刺激誘發(fā)的,能夠按照它作用于環(huán)境可觀察的結(jié)果來描述它的特點(diǎn)的行為。
行為將來出現(xiàn)的可能性可以通過操縱它們對環(huán)境作用的結(jié)果來增加或減少。操作性條件作用,作為行為產(chǎn)生的環(huán)境結(jié)果的函數(shù),就可以矯正不同類型的操作性行為概率。在許多操作性行為實(shí)驗(yàn)中,測量的興趣是動物在一段時間里能表現(xiàn)出多少次特定的行為。
3、強(qiáng)化相依
強(qiáng)化相倚(reinforcement contingency)是指某一反應(yīng)和它產(chǎn)生的環(huán)境變化之間的一致性關(guān)系。
(1)陽性和陰性強(qiáng)化物
強(qiáng)化物(reinforcer)即與行為相倚的——隨時間的推移能增加行為出現(xiàn)可能性的任何刺激。強(qiáng)化即在反應(yīng)之后呈現(xiàn)強(qiáng)化物。
當(dāng)某一行為之后伴隨著喜愛刺激出現(xiàn)時,我們稱這一事件為陽性強(qiáng)化(positive reinforcement)。當(dāng)某一行為之后伴隨著討厭刺激的解除時,我們稱這一事件為陰性強(qiáng)化(negative reinforcement)。
陽性強(qiáng)化和陰性強(qiáng)化都能增強(qiáng)在它們之前出現(xiàn)的行為反應(yīng)的可能性。陽性強(qiáng)化通過繼反應(yīng)之后呈現(xiàn)令人喜愛的刺激而增強(qiáng)行為反應(yīng)的頻率。陰性強(qiáng)化則相反,它通過解除、減少或阻止反應(yīng)之后出現(xiàn)討厭刺激來增強(qiáng)行為反應(yīng)的可能性。
若將強(qiáng)化消除,操作性消退(operant extinction)就會出現(xiàn)。因而,如果某一行為不再產(chǎn)生可預(yù)期的結(jié)果,那么它就會退回到操作性條件作用之前的水平——它就消失了。
(2)陽性和陰性懲罰
懲罰物(punisher)是在反應(yīng)之后施加懲罰物,任何一種刺激——當(dāng)它伴隨在某一反應(yīng)之后出現(xiàn)時——能降低該反應(yīng)以后發(fā)生的概率。某一行為之后伴隨著討厭刺激物時,我們稱這一事件為陽性懲罰(positive punishment)。
當(dāng)某一行為之后伴隨著喜愛刺激的去除時,我們稱這一事件為陰性懲罰(negative punishment)。
(3)辨別刺激與泛化
某些先于特定反應(yīng)的刺激——辨別性刺激(discriminative stimuli)——通過強(qiáng)化或懲罰相結(jié)合便可以設(shè)定行為發(fā)生的背景。
斯金納將辨別性刺激—行為—結(jié)果這一序列稱為三項(xiàng)相倚(three-term contingency)。
辨別性刺激出現(xiàn)時操縱行為的結(jié)果,可以對行為進(jìn)行強(qiáng)有力的控制。
有機(jī)體也會將反應(yīng)泛化到類似于辨別性刺激的其他刺激中去。
4、強(qiáng)化物的特性
(1)條件性強(qiáng)化物
初級強(qiáng)化物(primary reinforcers)比如食物和水,其強(qiáng)化特性是由于生物學(xué)因素所決定的。其他的中性刺激漸漸與初級強(qiáng)化物聯(lián)合在一起,作為條件性強(qiáng)化物(conditioned reinforcers)而對操作性反應(yīng)起作用。條件性強(qiáng)化物可以充當(dāng)強(qiáng)化本身的目標(biāo)。
教師發(fā)現(xiàn)條件性強(qiáng)化物比初級強(qiáng)化物更有效且更晚于使用。
* 在課堂情境中,可供使用的初級強(qiáng)化物非常少,而被教師所控制的任何刺激事件幾乎都可以被用作條件性強(qiáng)化物;
* 條件性強(qiáng)化物可以快速發(fā)放;
* 條件性強(qiáng)化物可以隨身攜帶;
* 條件性強(qiáng)化物的強(qiáng)化效果可以更及時地看到,因?yàn)樗鼉H依賴于接受強(qiáng)化物的知覺,而不是像初級強(qiáng)化物那樣,依賴于生物學(xué)過程。
(2)搞概率活動作為陽性強(qiáng)化物
普雷馬克原則(Premack principle)是指,更有可能發(fā)生的活動可以用來強(qiáng)化不太可能發(fā)生的活動。強(qiáng)化物可以是有機(jī)體認(rèn)為有價值的任何事件或活動。
5、強(qiáng)化程序表(schedules of reinforcement)
在現(xiàn)實(shí)生活或?qū)嶒?yàn)室里,強(qiáng)化物可以按照比率程序表——經(jīng)過一定次數(shù)的反應(yīng),或者間隔程序表——第一次反應(yīng)后經(jīng)過一個指定的時間間隔,來實(shí)施。
每種情況下,既可以有不變的或固定的強(qiáng)化模式,也可以有不規(guī)則的或可變的(variable)強(qiáng)化模式,它們構(gòu)成了強(qiáng)化程序表的四種主要類型。
部分強(qiáng)化效應(yīng)(partial reinforcement effect):在部分強(qiáng)化程序表中獲得的反應(yīng)比那些在連續(xù)強(qiáng)化中獲得的反應(yīng)更能抵抗行為的消退。
(1)固定-比率(FR)程序表(fixed-ratio schedule)
每次反應(yīng)后都伴有強(qiáng)化時,我們稱這種程序表為FR-1程序表。
很多售貨員都是由FR程序表強(qiáng)化的:他們必須賣出一定數(shù)量的貨物,才能得到報酬。
(2)可變-比率(VR)程序表(variable-ratio schedule)
在可變—比率程序表,強(qiáng)化物之間的平均反應(yīng)次數(shù)是預(yù)先確定了的??蓮?比率程序表產(chǎn)生的反應(yīng)速率最高,抗消退能力最強(qiáng),尤其是當(dāng)VR值較大的時候。
賭博 似乎就是受VR程序表控制的。
(3)固定—間隔(FI)程序表(fixed-interual schedule)
固定—間隔程序表中,強(qiáng)化物是在經(jīng)過一個固定的時間間隔后,有機(jī)體第一次做出某反應(yīng)時出現(xiàn)。
F1程序表中的反應(yīng)速率表現(xiàn)為扇形模式。隨著回報時間的臨近,動物的反應(yīng)越來越多。按月支付薪水即是將你置于FI程序表中。
(4)可變—間隔(VI)程序表(variable-interual schedule)
在可變—間隔程序表中,平均時間間隔是預(yù)先確定了的。產(chǎn)生中等的但卻很穩(wěn)定的反應(yīng)速率。
課上常有臨時的、不規(guī)則的突然測驗(yàn)。
6、行為塑造
連續(xù)接近塑造法(shaping by successive approximations),對任何連續(xù)接近并最終與預(yù)期反應(yīng)相匹配的行為進(jìn)行強(qiáng)化。
要讓塑造法起作用,你必須定義向著目標(biāo)行為前進(jìn)的各個行為成分,并運(yùn)用差別強(qiáng)化來推進(jìn)這一過程的每一步。
四、生物學(xué)與學(xué)習(xí)
學(xué)習(xí) 的生物制約性(Biological constraints on learning)指的是物種的遺傳天賦所帶來的學(xué)習(xí) 上的任何限制。這些約束可以是動物的感覺、行為和認(rèn)知能力。
1、本能漂移
凱勒·不里蘭和馬瑞恩·不里蘭(Keller Breland and Marion Breland)
即使動物學(xué)會了進(jìn)行完美的操作反應(yīng),隨著時間的推移,“習(xí) 得的行為也會向著本能行為漂移”。他們稱這種傾向?yàn)楸灸芷疲╥nstinctual drift)。
并非學(xué)習(xí) 的所有方面都受實(shí)驗(yàn)者的強(qiáng)化物控制。作為動物在環(huán)境中正常的、遺傳編排中的反應(yīng),行為或者更易被改變,或者更難被改變。當(dāng)目標(biāo)反應(yīng)與生物相關(guān)因素相一致時,反射作用就會非常有效。
2、味覺—厭惡學(xué)習(xí) (taste-aversion learning)
味覺厭惡僅僅通過CS與其后果的一次匹配即可形成。
一些條件反射的實(shí)例,不僅依賴刺激與行為間的關(guān)系,而且依賴由遺傳預(yù)先安排的有機(jī)體對待環(huán)境刺激的方式。
五、學(xué)習(xí) 的認(rèn)知影響
1、動物認(rèn)知
(1)認(rèn)知地圖
愛德華·托爾曼開創(chuàng)了學(xué)習(xí) 認(rèn)知過程的研究先河。
先前曾走過迷津的老鼠擁有對認(rèn)知地圖(cognitive map)迷津整體布局的表征做反應(yīng),而不是通過嘗試錯誤盲目地探索迷津的各個不同部分。表明:條件反射不僅涉及刺激情境之間或反應(yīng)與強(qiáng)化物之間形成簡單的聯(lián)結(jié),它包含著對全部行為背景的其他各方面的學(xué)習(xí) 與表征。
空間認(rèn)知地圖的功能:
* 動物運(yùn)用空間記憶來認(rèn)知和識別環(huán)境特征。
* 動物運(yùn)用空間記憶來發(fā)現(xiàn)環(huán)境中重要的目標(biāo)物。
* 動物運(yùn)用空間記憶來設(shè)計(jì)他們在環(huán)境中的旅行路線。
(2)概念性行為
泛化的根基是由新獲得的概念結(jié)構(gòu)而引起的認(rèn)知相似性。
鴿子能獲得相同和不同的抽象概念。
2、觀察學(xué)習(xí)
個體,僅僅是在觀察到他人的行為被強(qiáng)化或被懲罰后,才在后來或者做出類似行為,或者抑制該行為,這就是觀察學(xué)習(xí) (observational learning)。認(rèn)知通常以期待的方式進(jìn)入觀察學(xué)習(xí) 。
觀察學(xué)習(xí) 并非人類所特有。
阿爾波特·班杜拉(Albert Bandura):在下列情況下,所觀察到的榜樣行為最具影響力:
* 觀察到榜樣的行為得到了強(qiáng)化的結(jié)果。
* 榜樣被看成是正面的、令人喜愛和尊敬的。
* 榜樣和觀察者的相貌及特點(diǎn)具有可知覺的相似性。
* 觀察者因注意榜樣的行為而得到了獎賞。
* 榜樣的行為可以看到并且很突出——榜樣作為清晰的形象,從與其相競爭的人物背景中顯現(xiàn)出來。
* 榜樣的行為是在觀察者所能模仿的能力范圍內(nèi)。
脫敏,一種在看到暴力行為時情緒喚起和悲痛水平的降低。
對觀察學(xué)習(xí) 的分析,一方面證實(shí)了強(qiáng)化原則影響行為,另一方面也證實(shí)了人類有能力運(yùn)用認(rèn)知過程,借助替代獎賞和替代懲罰來改變行為。