CIE 9990 AS Level 四大取向之第三站。🐦多毛鸟飞进你的学习现场——看铃声怎么变成"晚餐铃"、奖励怎么塑造一个动作、一个波波娃怎么教会孩子打人。
~ 多毛鸟学飞 ~
Classical Conditioning
两个刺激配对,建立刺激-反应联结。代表:Pavlov、Watson。
→ 学会"信号"
Operant Conditioning
行为的后果决定它会不会重复。代表:Skinner。
→ 学会"动作"
Social Learning
观察榜样也能学会行为。代表:Bandura。
→ 学会"模仿"
💡 核心主张:学习取向认为,几乎所有行为都由环境中的经验塑造——你之所以是这样,是因为你被奖过、罚过、看过。无需追问内心,只看刺激、反应、后果。
学习(learning):由经验引起的、相对持久的行为或行为潜能的改变。
⚠ 关键:① 来自经验(非本能/成熟);② 持久(非短暂疲劳);③ 可以是行为潜能(不一定马上表现)。
→ 学习取向只研究可观察的行为变化。
Watson (1913)《行为主义者眼中的心理学》宣告:心理学应是客观、可观测的科学。
黑箱观点:内心(思维、情绪)无法客观测量,故不予研究——只看刺激 → 反应(S → R)。
→ "给我一打婴儿,我能把他们训练成任何专家。"
💡 三条路径:学习取向用三种机制解释行为——经典条件反射(自动联结)、操作性条件反射(后果强化)、社会学习(观察模仿)。三者互补,不是非此即彼。
在经典条件反射中,有机体学会的是两个刺激之间的联结。
中性刺激(NS,如铃声)原本不引发反应。
把它与天然能引发反应的刺激反复配对。
→ 最终,中性刺激单独出现,也能引发同样的反应。
① 你闻到食堂饭菜香 → 流口水(天然反应)。
② 每天中午 12:00 下课铃响起后,饭菜香就来了。
③ 反复配对后——
④ 铃声一响,你就流口水(即使还没闻到香味)。
→ 铃声学会了"预告"饭菜。这是自动的、被动的学习。
💡 关键区分:经典条件反射学的是不随意的、生理性反应(流口水、恐惧、心跳)。被试是被动的——刺激来了,反应就自动发生。
食物 (UCS) → 流口水 (UCR)
无条件刺激 → 无条件反应(天生的)
铃声 (NS) → 看一眼 / 无反应
中性刺激,啥也引不出
UCS=Unconditioned Stimulus · UCR=Unconditioned Response
② 配对:铃声 + 食物 反复同现(多次)
③ 建立后:
铃声 (CS) → 流口水 (CR)
条件刺激 → 条件反应(学来的)
此时 NS 已变成 CS;CR 与 UCR 相似但不完全相同(通常较弱)。
💡 四个必背术语:UCS(天生能引反应的刺激)、UCR(天生的反应)、CS(学来的信号)、CR(学来的反应)。记忆口诀:"无字头=天生,条字头=学会"。
① 配对前:铃声 → 几乎无唾液(NS)。
② 反复配对(铃声+食物)后——
• 铃声单独响起,狗立即分泌唾液(CS→CR)。
• 配对次数越多,CR 越强越快建立。
③ 还能建立二级条件作用(黑色方块+铃声+食物)。
→ 首次用实验证明:学习 = 刺激间联结的形成。
⚖️ 评价:✓ 高度控制、可量化(唾液滴数)、可复制、奠基行为主义;✗ 动物外推到人受限、生态效度低(实验室人工情境)、忽视认知、有手术伦理争议。
与 CS 相似的刺激也能引发 CR。
例:对铃声建立恐惧后,蜂鸣器、门铃也让你害怕。越相似,反应越强。
学会只对特定 CS 反应,对相似刺激不反应。
需通过配对 vs 不配对的差异化训练。例:只对特定音高的铃声流口水。
反复只给 CS 不给 UCS,CR 会逐渐减弱消失。
注意:消退的是表现,不是学习本身——记忆仍在。
消退后,休息一段时间,CR 可能突然重新出现(通常较弱)。→ 证明学习未被真正"删除"。
在已建立的 CS 之上,再接一个新中性刺激,也能形成条件反应(二级 CS)。例:方块+铃声+食物 → 方块也引唾液。
① 基线:Albert 对白鼠/兔/狗都不怕,反而想摸。
② 7 次配对(白鼠+巨响)后——
• 白鼠单独出现,Albert 就大哭、躲开。
③ 泛化:恐惧扩散到兔子、狗、皮毛大衣、棉花、圣诞老人面具(白毛物体)。
→ 首次实验证明:人类的恐惧可被条件化,支持行为主义。
⚖️ 评价:✓ 开创性、支持 CC 适用于人、变量清晰;✗ 严重伦理问题(制造恐惧且从未脱敏、母亲带走)、单一被试无法推广、无法重复验证、近期考证 Albert 实为神经系统有问题的患儿(混淆)。
Thorndike (1898) 迷笼实验:猫学会拉绳开门吃鱼。
效果律(Law of Effect):带来满意后果的行为更可能重复;带来烦恼后果的行为更可能减少。
→ 试错学习(trial-and-error),行为被后果筛选。
Skinner 把效果律发展成严谨的操作性条件反射理论。
操作性行为(operant):有机体主动发出、作用于环境的行为(按键、拉杆、说话)。
区别于经典条件反射的应答性行为(被刺激引出)。
→ 核心公式:行为 ← 后果。
💡 两种条件反射的根本区别:经典=刺激引出反应(被动、不随意,如流口水);操作=行为产生后果、后果反过来塑造行为(主动、随意,如按键)。一个学"信号",一个学"动作"。
• 操纵杆 / 按键(老鼠压杆 / 鸽子啄键)
• 食丸分发器(发放强化物)
• 电击网格(地板,可施加惩罚)
• 灯光/声音(辨别刺激)
→ 隔音、控光控温,排除一切干扰。
Skinner 发明累积记录仪(cumulative recorder),把每次反应实时画成曲线。
横轴=时间,纵轴=累计反应数。曲线越陡,反应越频繁。
→ 让"学习"第一次变成可精确测量的图形。
💡 为什么用箱子:高度控制变量(排除社会、认知干扰)、可复制、可量化。但也因此被批评生态效度低——箱子里的鸽子,未必代表教室里的孩子。
① 强化(食丸)→ 反应率显著上升。
② 惩罚(电击)→ 反应被抑制。
③ 不同程序产生不同曲线:FI 出现扇贝效应,VR 产生稳定高速。
④ 撤除强化后出现消退曲线(先快后慢)。
→ 证明:后果决定行为的发生率。
⚖️ 评价:✓ 极高控制、可复制、量化精确、概念清晰(影响教育/治疗/成瘾研究);✗ 动物外推到人受限、生态效度低、还原论(忽视思维情感)、伦理(食物剥夺/电击)。
加一个愉快刺激 → 行为增加。
例:孩子做作业 → 给表扬/贴纸 → 更爱做作业。
移除一个厌恶刺激 → 行为增加。
例:系安全带 → 蜂鸣声停止 → 以后上车就系带。⚠ 不是惩罚!
加一个厌恶刺激 → 行为减少。
例:上课讲话 → 被罚站/批评 → 讲话减少。
移除一个愉快刺激 → 行为减少。
例:打架 → 没收手机 / 取消零花钱 → 打架减少。
💡 辨析口诀:"正/负"指加/减刺激(不是好坏);"强化/惩罚"指行为增加/减少。最易错:负强化≠惩罚——负强化让行为增加,惩罚让行为减少。
每 N 次反应后强化。例:FR-10=每按 10 次给食丸。
特点:反应率很高,但强化后短暂停顿。
例:计件工资、买 10 杯咖啡送 1 杯。
平均每 N 次反应强化,但次数随机变化。
特点:反应率最高最稳定,极难消退。
例:老虎机、钓鱼、刷短视频——下一把"说不定就中"。
每固定时间(距上次强化后)给第一次反应强化。
特点:产生扇贝效应(临近奖励反应骤增)。
例:周薪、固定时间的小测验。
平均每固定时间强化,但时间随机。
特点:反应稳定中等,消退较慢。
例:随机抽查作业、等一封邮件。
💡 记忆矩阵:"比例=按次数,间隔=按时间";"固定=可预测,可变=不可预测"。比例程序总体比间隔程序反应率更高。
FI 程序下的典型曲线:刚强化完反应几乎为零,越接近下次强化时间,反应骤然加速。
图形像一排扇贝壳。
生活例:月底发工资前拼命赶工;考试前一周才突击复习。
老虎机用的是 VR 程序——你不知道哪一次会赢。
→ 不可预测的奖励让多巴胺反应最强,行为最顽固、最难消退。
这解释了为何赌博、手游抽卡、社交媒体让人上瘾。
→ VR 是行为成瘾的底层机制之一。
💡 考点链接:能解释"为何 VR 难消退"=拿分关键。答案是:因为每次不强化都可能是"差一点就中",被试无法区分"消退"与"还没轮到",于是持续反应。
塑造(shaping):通过连续接近(successive approximations),一步步强化越来越接近目标的行为。
① 强化第一步雏形。
② 提高标准,只强化更接近目标的反应。
③ 旧的雏形不再被强化而消退。
④ 最终拼出完整目标行为。
Skinner 用塑造教会鸽子打乒乓球、老鼠拉杆串成链。
语言训练:强化自闭症儿童从"发声→音节→单词→短句"。
运动技能:教练拆解动作,逐步奖励正确片段。
→ 塑造是行为矫正和特殊教育的核心技术。
💡 塑造 vs 简单强化:不是等行为完整出现才奖励(那样永远等不到),而是奖励"接近正确"的每一步。本质是 chaining + differential reinforcement 的结合。
Bandura 认为:人不必靠亲身奖惩才能学——观察他人(榜样)就够了。
这叫观察学习 / 模仿(observational learning / modelling)。
榜样可以是真人、电视角色、卡通。
→ 把认知重新请回了行为主义。
榜样(model):被观察、被模仿的对象。
替代性强化(vicarious reinforcement):看到榜样被奖,自己也更可能模仿;看到被罚,则抑制。
无表现学习:可能学会了但不表现,直到有动机才表现出来。
→ 学习 ≠ 表现。这挑战了纯行为主义。
💡 社会学习的位置:它是行为主义与认知取向的桥梁——保留了"学习来自经验/环境",但承认内心过程(注意、记忆、期待)的作用,因此又称社会认知论。
① 攻击模型组幼儿表现出大量模仿性攻击(连动作和语言都像)。
② 数据:攻击组男孩均分 ≈ 25.8,女孩 ≈ 12.7,远高于非攻击/对照组。
③ 同性模型效应:男孩更模仿男模型,女孩更模仿女模型(尤其身体攻击)。
④ 非攻击组几乎无攻击行为。
→ 证明:攻击行为可通过观察学会,无需直接强化。
⚖️ 评价:✓ 高控制、量化、变量清晰、高可靠性;✗ 实验室人为(波波娃非真人、诱导攻击)、伦理(教幼儿攻击且未随访)、能否推广到真实攻击存疑、短期效应未证长期。
必须注意到榜样的行为。
影响因素:榜样的吸引力、地位、相似性、观察者的唤醒水平。
例:孩子更注意酷炫的卡通英雄而非路人。
把观察到的行为储存下来。
以心理表象(imagery)和言语编码(verbal coding)两种形式记忆。
→ 这一步直接引入了认知过程。
把记忆中的行为转化为动作。
受身体能力、练习限制——你能记住球星投篮,但不一定做得到。
→ 解释了"看得懂 ≠ 做得出"。
即使学会了,也要有理由才表现出来。
动机来自:直接强化、替代强化、自我强化。
→ 解释了"学了一直没用"。
💡 记忆口诀:注意 → 记忆 → 再现 → 动机("注记再动")。任一环节缺失,模仿都不会发生——这是社会学习区别于"机械模仿"的关键。
① 三种模型都能显著增加幼儿的攻击行为。
② 真人模型组攻击行为最多,电影与卡通次之。
③ 即使是卡通,也能教会孩子攻击动作。
→ 榜样不必是真人,媒体同样有效。
💡 现实意义:这是"媒体暴力影响儿童"研究的奠基证据。它说明电视、电影、游戏、短视频里的攻击画面,都可能通过观察学习塑造儿童行为——这成为大众媒介与教育政策长期争论的科学基础。
学什么:刺激-刺激联结
机制:配对(CS+UCS)
主/被动:被动、不随意
场景:恐惧症、广告、味觉厌恶
学什么:行为-后果联结
机制:强化/惩罚
主/被动:主动、随意
场景:教育、行为矫正、成瘾
学什么:榜样行为
机制:观察+认知中介
主/被动:主动+认知
场景:榜样教育、媒体影响、性别角色
💡 关键洞察:三种理论不矛盾而是互补。一个孩子怕狗(经典)、为得贴纸而努力(操作)、模仿偶像的口头禅(社会)——常常同时发生。CIE 考题常要求比较,记住每个理论的"一句话核心"即可。
Systematic Desensitisation(Wolpe)
基于:经典条件反射 + 交互抑制。
① 学放松;② 建立恐惧等级;③ 在放松状态下逐级暴露,用放松替代恐惧。
→ 治恐惧症(蜘蛛、高空)。
Token Economy
基于:操作性条件反射(正强化)。
良好行为 → 得代币(贴纸/积分)→ 兑换实物奖励。
→ 用于精神病院、学校、监狱、特教。
Aversion Therapy
基于:经典条件反射(配对厌恶刺激)。
把不良行为与恶心/电击配对 → 形成对该行为的厌恶反应。
→ 治酒瘾、烟瘾、偏差行为(伦理争议大)。
💡 共同点:都不深究病因,只针对症状(行为本身);见效相对快、可量化。但批评者认为它治标不治本,未处理潜在心理冲突,且泛化到日常有时困难。
① 高度实证:实验室严格控制、可复制、可量化(反应率/唾液)。
② 实用价值强:催生行为疗法(脱敏、代币制),切实改善生活。
③ 机制清晰:刺激-反应-后果,易于教学与干预。
④ 跨物种:动物研究奠定基础,原理简洁有力。
① 忽视认知:把人当"黑箱",低估思维、期待、自由意志。
② 动物外推:箱子里的鸽子≠复杂的人类社会。
③ 环境决定论:暗示行为全由奖惩塑造,削弱个人责任。
④ 伦理问题:小阿尔伯特、动物剥夺/电击的争议。
经典条件反射四要素。"无"=天生,"条"=学会。
正/负强化都让行为增加。负强化≠惩罚。
连续接近,逐步强化接近目标的行为。
强化程序。比例=按次数,间隔=按时间。
社会学习中被观察、被模仿的对象。
观察学习四步:注意、记忆、再现、动机。
相似刺激也引发相同反应(小阿尔伯特)。
消退后休息,CR 自发恢复(证明未真删)。
用 Pavlov 的实验说清 UCS/UCR/CS/CR 四步骤。
正强化和负强化有什么区别?负强化是惩罚吗?
FR 和 VR 哪个反应率更高、更难消退?为什么?
观察学习的四个步骤是什么?
用小阿尔伯特实验说明恐惧如何被条件化,并指出泛化。
为什么老虎机让人上瘾?用 VR 解释。
系统脱敏、代币制、厌恶疗法分别基于哪种学习理论?
用三大理论对比解释同一攻击行为。
💡 答题技巧:CIE 考题常要求"描述研究 + 评价方法"。记住每个经典研究的被试/方法/IV/DV/结果/评价六要素,就能应对大部分题型。
Describe one study into social learning. [9 marks]
答题框架(9 分题):
① Aim 目的(1 分):Bandura 想看儿童是否会通过观察榜样学会攻击。
② Method 方法(2 分):实验室实验,72 名 3–6 岁幼儿,分3 组。
③ IV/DV(2 分):IV=模型类型/性别;DV=对波波娃的模仿攻击频次。
④ Results 结果(2 分):攻击组男孩均分 25.8、女孩 12.7;同性模型效应。
Conclusion 结论(1 分):攻击可经观察学会,无需直接强化。
💡 得分要点:① 用专业术语(modelling, vicarious reinforcement);② 具体数据(72 名、25.8);③ 结构清晰(Aim-Method-Results-Conclusion);④ 评价说"为什么是问题"。
• 把 负强化当成惩罚(负强化让行为增加!)。
• 混淆 CS 和 UCS(铃声是 CS,食物是 UCS)。
• 把 消退说成"忘记"(消退是不强化导致,不是记忆消失)。
• 混淆 经典与操作条件反射的"主/被动"。
• 只说"实验室不真实"而不说为什么是问题。
• 评价 Bandura 时不提伦理(教幼儿攻击)。
• 忘记 动物研究的外推局限与伦理。
• 把 VR 和 VI 的反应模式说反。
💡 记住:评价要"具体"。不要说"样本特殊",要说"72 名 3–6 岁斯坦福幼儿园幼儿,多为中产家庭,无法代表其他年龄/阶层"。
① 四步骤图:画 UCS/UCR→CS/CR 流程图。
② 2×2 矩阵:四种后果(正/负 × 强化/惩罚)。
③ 生活联想:每个概念配一个生活例子。
④ 对比表:三大理论做横向表格。
① 六要素:每个研究记 Aim/Method/IV/DV/Results/Eval。
② 专业术语:阅卷人按术语给分。
③ 具体数据:72 名、25.8、7 次配对不能错。
④ 评价深度:说出"为什么"是问题。
💡 最核心:CIE 学习取向考的不是死记硬背,而是"理解机制 + 评价研究"。能说清"VR 为什么难消退"和"Bandura 实验为何不能直接推广到真实暴力",你就稳了。
CIE AS · 取向 4/4
学习取向讲"个体怎么学",社会取向讲"群体怎么影响个体"——从众、服从、偏见、群体压力。🌿龙猫带你走进人群。
~ 社会心理学 ~
💡 🐦多毛鸟总结:你现在懂得——行为是学来的,但不只是奖惩塑造的。环境给你方向,认知决定你注意什么、记住什么,而你——可以选择模仿谁。
休息一下,翻开社会取向——看当个体走进人群,行为会如何被悄悄改变。
Cambridge International AS & A Level Psychology Coursebook (CUP) · CIE 9990 考纲
Pavlov (1927) ·《Conditioned Reflexes》经典条件反射系统论述
Watson & Rayner (1920) · Little Albert 实验,Journal of Experimental Psychology
Skinner (1953) ·《Science and Human Behavior》操作性条件反射
Bandura, Ross & Ross (1961) · 波波娃实验;(1963) 真人/电影/卡通版本
CIE 9990 Syllabus (2024–2026) · 官方考纲文档