← → 翻页 · ESC 鸟瞰

📚 CIE AS · 学习心理学全部页面 · 点击跳转

01 / 30

学习心理学
Learning ApproachBehaviour is Learned

CIE 9990 AS Level 四大取向之第三站。🐦多毛鸟飞进你的学习现场——看铃声怎么变成"晚餐铃"、奖励怎么塑造一个动作、一个波波娃怎么教会孩子打人。

经典条件反射操作性条件反射社会学习
多毛鸟学习飞翔

~ 多毛鸟学飞 ~

CIE 9990 · AS Level · 取向 3/4 → 按 → 开始
02 / 30

一切行为,
都是学来的

🔔 经典条件反射

Classical Conditioning

两个刺激配对,建立刺激-反应联结。代表:Pavlov、Watson。

→ 学会"信号"

🕹️ 操作性条件反射

Operant Conditioning

行为的后果决定它会不会重复。代表:Skinner。

→ 学会"动作"

📺 社会学习

Social Learning

观察榜样也能学会行为。代表:Bandura。

→ 学会"模仿"

💡 核心主张:学习取向认为,几乎所有行为都由环境中的经验塑造——你之所以是这样,是因为你被奖过、罚过、看过。无需追问内心,只看刺激、反应、后果。

03 / 30

什么是"学习"

📖 心理学定义

学习learning):由经验引起的、相对持久的行为或行为潜能的改变。

⚠ 关键:① 来自经验(非本能/成熟);② 持久(非短暂疲劳);③ 可以是行为潜能(不一定马上表现)。

→ 学习取向只研究可观察的行为变化。

🌱 行为主义渊源

Watson (1913)《行为主义者眼中的心理学》宣告:心理学应是客观、可观测的科学。

黑箱观点:内心(思维、情绪)无法客观测量,故不予研究——只看刺激 → 反应(S → R)。

→ "给我一打婴儿,我能把他们训练成任何专家。"

💡 三条路径:学习取向用三种机制解释行为——经典条件反射(自动联结)、操作性条件反射(后果强化)、社会学习(观察模仿)。三者互补,不是非此即彼。

04 / 30

铃声变成
"晚餐铃"

🔗 学习的本质

在经典条件反射中,有机体学会的是两个刺激之间的联结

中性刺激NS,如铃声)原本不引发反应。

把它与天然能引发反应的刺激反复配对

→ 最终,中性刺激单独出现,也能引发同样的反应

🍔 一个生活例子

① 你闻到食堂饭菜香 → 流口水(天然反应)。

② 每天中午 12:00 下课铃响起后,饭菜香就来了。

③ 反复配对后——

④ 铃声一响,你就流口水(即使还没闻到香味)。

→ 铃声学会了"预告"饭菜。这是自动的、被动的学习。

💡 关键区分:经典条件反射学的是不随意的、生理性反应(流口水、恐惧、心跳)。被试是被动的——刺激来了,反应就自动发生。

05 / 30

条件反射
怎么建立

① 建立前 (Before)

食物 (UCS)流口水 (UCR)

无条件刺激 → 无条件反应(天生的)

铃声 (NS) → 看一眼 / 无反应

中性刺激,啥也引不出

UCS=Unconditioned Stimulus · UCR=Unconditioned Response

② 配对中 / ③ 建立后

② 配对:铃声 + 食物 反复同现(多次)

③ 建立后

铃声 (CS)流口水 (CR)

条件刺激 → 条件反应(学来的)

此时 NS 已变成 CS;CR 与 UCR 相似但不完全相同(通常较弱)。

💡 四个必背术语:UCS(天生能引反应的刺激)、UCR(天生的反应)、CS(学来的信号)、CR(学来的反应)。记忆口诀:"字头=天生,字头=学会"。

06 / 30

实验档案 ·
巴甫洛夫的狗

🐦多毛鸟·研究者
🧪 实验设计
研究者Ivan Pavlov(1903 起,俄国生理学家,1904 诺奖)被试多条实验犬(最著名的系列实验)方法外科手术在唾液腺导管插入瘘管,隔音实验间内精确计量唾液IV条件刺激(铃声/节拍器)与食物(UCS)的配对次数DV条件刺激单独呈现时的唾液分泌量(滴数/毫升)
📊 关键结果

① 配对前:铃声 → 几乎无唾液(NS)。

② 反复配对(铃声+食物)后——

• 铃声单独响起,狗立即分泌唾液(CS→CR)。

• 配对次数越多,CR 越强越快建立。

③ 还能建立二级条件作用(黑色方块+铃声+食物)。

→ 首次用实验证明:学习 = 刺激间联结的形成

⚖️ 评价: 高度控制、可量化(唾液滴数)、可复制、奠基行为主义; 动物外推到人受限、生态效度低(实验室人工情境)、忽视认知、有手术伦理争议。

07 / 30

条件反射
还有五个脾气

🌐 泛化 Generalisation

与 CS 相似的刺激也能引发 CR。

例:对铃声建立恐惧后,蜂鸣器、门铃也让你害怕。越相似,反应越强。

🎯 分化 Discrimination

学会只对特定 CS 反应,对相似刺激不反应。

需通过配对 vs 不配对的差异化训练。例:只对特定音高的铃声流口水。

📉 消退 Extinction

反复只给 CS 不给 UCS,CR 会逐渐减弱消失

注意:消退的是表现,不是学习本身——记忆仍在。

👻 自发恢复 Spontaneous Recovery

消退后,休息一段时间,CR 可能突然重新出现(通常较弱)。→ 证明学习未被真正"删除"。

🏆 高级条件作用 Higher-Order

在已建立的 CS 之上,再接一个新中性刺激,也能形成条件反应(二级 CS)。例:方块+铃声+食物 → 方块也引唾液。

08 / 30

实验档案 ·
小阿尔伯特

🐦多毛鸟·研究者
🧪 实验设计
研究者John B. Watson & Rosalie Rayner (1920)被试"Little Albert",9 个月起基线测试,实验时约 11 个月的健康男婴方法个案 / 准实验,条件性恐惧(把 CC 用到人身上)IV白鼠 (CS)钢棒敲击巨响 (UCS) 的配对DVAlbert 的恐惧反应(哭泣、退缩、爬开)
📊 关键结果

① 基线:Albert 对白鼠/兔/狗都不怕,反而想摸。

7 次配对(白鼠+巨响)后——

• 白鼠单独出现,Albert 就大哭、躲开

泛化:恐惧扩散到兔子、狗、皮毛大衣、棉花、圣诞老人面具(白毛物体)。

→ 首次实验证明:人类的恐惧可被条件化,支持行为主义。

⚖️ 评价: 开创性、支持 CC 适用于人、变量清晰; 严重伦理问题(制造恐惧且从未脱敏、母亲带走)、单一被试无法推广、无法重复验证、近期考证 Albert 实为神经系统有问题的患儿(混淆)。

09 / 30

这一次,
主动出手

🐱 桑代克的效果律

Thorndike (1898) 迷笼实验:猫学会拉绳开门吃鱼。

效果律Law of Effect):带来满意后果的行为更可能重复;带来烦恼后果的行为更可能减少。

→ 试错学习(trial-and-error),行为被后果筛选。

🕹️ Skinner 的系统化

Skinner 把效果律发展成严谨的操作性条件反射理论。

操作性行为operant):有机体主动发出、作用于环境的行为(按键、拉杆、说话)。

区别于经典条件反射的应答性行为(被刺激引出)。

→ 核心公式:行为 ← 后果

💡 两种条件反射的根本区别:经典=刺激引出反应(被动、不随意,如流口水);操作=行为产生后果、后果反过来塑造行为(主动、随意,如按键)。一个学"信号",一个学"动作"。

10 / 30

一个箱子
装下整个行为主义

📦 箱子的构造

操纵杆 / 按键(老鼠压杆 / 鸽子啄键)

食丸分发器(发放强化物)

电击网格(地板,可施加惩罚)

灯光/声音(辨别刺激)

→ 隔音、控光控温,排除一切干扰。

📈 累积记录仪

Skinner 发明累积记录仪cumulative recorder),把每次反应实时画成曲线

横轴=时间,纵轴=累计反应数。曲线越陡,反应越频繁。

→ 让"学习"第一次变成可精确测量的图形。

💡 为什么用箱子:高度控制变量(排除社会、认知干扰)、可复制可量化。但也因此被批评生态效度低——箱子里的鸽子,未必代表教室里的孩子。

11 / 30

实验档案 ·
老鼠与鸽子

🐦多毛鸟·研究者
🧪 实验设计
研究者B. F. Skinner(1930s–1950s 系列)被试大鼠鸽子(常饿至约 80–85% 体重,以食物强化)仪器Skinner 箱 + 累积记录仪IV强化/惩罚的有无强化程序(FR/VR/FI/VI)DV压杆/啄键的反应率(每分钟次数)与反应模式
📊 关键结果

强化(食丸)→ 反应率显著上升

惩罚(电击)→ 反应被抑制

不同程序产生不同曲线:FI 出现扇贝效应,VR 产生稳定高速

④ 撤除强化后出现消退曲线(先快后慢)。

→ 证明:后果决定行为的发生率

⚖️ 评价: 极高控制、可复制、量化精确、概念清晰(影响教育/治疗/成瘾研究); 动物外推到人受限、生态效度低还原论(忽视思维情感)、伦理(食物剥夺/电击)。

12 / 30

行为之后
会发生什么

➕ 正强化 Positive Reinforcement

一个愉快刺激 → 行为增加

例:孩子做作业 → 给表扬/贴纸 → 更爱做作业。

➖ 负强化 Negative Reinforcement

移除一个厌恶刺激 → 行为增加

例:系安全带 → 蜂鸣声停止 → 以后上车就系带。⚠ 不是惩罚!

➕ 正惩罚 Positive Punishment

一个厌恶刺激 → 行为减少

例:上课讲话 → 被罚站/批评 → 讲话减少。

➖ 负惩罚 Negative Punishment

移除一个愉快刺激 → 行为减少

例:打架 → 没收手机 / 取消零花钱 → 打架减少。

💡 辨析口诀:"正/负"指加/减刺激(不是好坏);"强化/惩罚"指行为增加/减少最易错:负强化≠惩罚——负强化让行为增加,惩罚让行为减少

13 / 30

奖励,
多久给一次

🔢 固定比例 Fixed Ratio (FR)

每 N 次反应后强化。例:FR-10=每按 10 次给食丸。

特点:反应率很高,但强化后短暂停顿

例:计件工资、买 10 杯咖啡送 1 杯。

🎲 可变比例 Variable Ratio (VR)

平均每 N 次反应强化,但次数随机变化。

特点:反应率最高最稳定极难消退

例:老虎机、钓鱼、刷短视频——下一把"说不定就中"。

⏰ 固定间隔 Fixed Interval (FI)

每固定时间(距上次强化后)给第一次反应强化。

特点:产生扇贝效应(临近奖励反应骤增)。

例:周薪、固定时间的小测验。

🌀 可变间隔 Variable Interval (VI)

平均每固定时间强化,但时间随机

特点:反应稳定中等,消退较慢。

例:随机抽查作业、等一封邮件。

💡 记忆矩阵:"比例=按次数间隔=按时间";"固定=可预测可变=不可预测"。比例程序总体比间隔程序反应率更高。

14 / 30

为什么
停不下来

🐚 扇贝效应 Scalloping

FI 程序下的典型曲线:刚强化完反应几乎为零,越接近下次强化时间,反应骤然加速

图形像一排扇贝壳。

生活例:月底发工资前拼命赶工;考试前一周才突击复习。

🎰 赌博成瘾原理

老虎机用的是 VR 程序——你不知道哪一次会赢。

不可预测的奖励让多巴胺反应最强,行为最顽固、最难消退

这解释了为何赌博、手游抽卡、社交媒体让人上瘾

→ VR 是行为成瘾的底层机制之一。

💡 考点链接:能解释"为何 VR 难消退"=拿分关键。答案是:因为每次不强化都可能是"差一点就中",被试无法区分"消退"与"还没轮到",于是持续反应。

15 / 30

复杂行为
怎么出来?

🏆 塑造的原理

塑造shaping):通过连续接近successive approximations),一步步强化越来越接近目标的行为。

① 强化第一步雏形。

② 提高标准,只强化更接近目标的反应。

③ 旧的雏形不再被强化而消退。

④ 最终拼出完整目标行为。

🐾 经典与应用

Skinner 用塑造教会鸽子打乒乓球、老鼠拉杆串成链

语言训练:强化自闭症儿童从"发声→音节→单词→短句"。

运动技能:教练拆解动作,逐步奖励正确片段。

→ 塑造是行为矫正特殊教育的核心技术。

💡 塑造 vs 简单强化:不是等行为完整出现才奖励(那样永远等不到),而是奖励"接近正确"的每一步。本质是 chaining + differential reinforcement 的结合。

16 / 30

不用亲自试,
看一眼就会

📺 Bandura 的突破

Bandura 认为:人不必靠亲身奖惩才能学——观察他人(榜样)就够了。

这叫观察学习 / 模仿observational learning / modelling)。

榜样可以是真人、电视角色、卡通

→ 把认知重新请回了行为主义。

🧠 关键概念

榜样model):被观察、被模仿的对象。

替代性强化vicarious reinforcement):看到榜样被奖,自己也更可能模仿;看到被罚,则抑制

无表现学习:可能学会了但不表现,直到有动机才表现出来。

→ 学习 ≠ 表现。这挑战了纯行为主义。

💡 社会学习的位置:它是行为主义与认知取向的桥梁——保留了"学习来自经验/环境",但承认内心过程(注意、记忆、期待)的作用,因此又称社会认知论

17 / 30

实验档案 ·
波波娃实验

🐦多毛鸟·研究者
🧪 实验设计
研究者Albert Bandura, D. Ross & S. Ross (1961)被试72 名 3–6 岁幼儿(36 男 36 女),斯坦福大学幼儿园方法匹配被试 / 实验室实验,分 3 组IV① 模型类型(攻击 / 非攻击 / 对照)② 模型性别 ③ 幼儿性别DV幼儿在陌生房间对波波娃模仿性攻击频次(打、踢、坐、用锤子)
📊 关键结果

攻击模型组幼儿表现出大量模仿性攻击(连动作和语言都像)。

② 数据:攻击组男孩均分 ≈ 25.8女孩 ≈ 12.7,远高于非攻击/对照组。

同性模型效应:男孩更模仿男模型,女孩更模仿女模型(尤其身体攻击)。

④ 非攻击组几乎无攻击行为

→ 证明:攻击行为可通过观察学会,无需直接强化。

⚖️ 评价: 高控制、量化、变量清晰、高可靠性; 实验室人为(波波娃非真人、诱导攻击)、伦理(教幼儿攻击且未随访)、能否推广到真实攻击存疑、短期效应未证长期。

18 / 30

模仿,
需要四道关

👀 ① 注意 Attention

必须注意到榜样的行为。

影响因素:榜样的吸引力、地位、相似性、观察者的唤醒水平。

例:孩子更注意酷炫的卡通英雄而非路人。

🧠 ② 记忆 Retention

把观察到的行为储存下来。

心理表象(imagery)和言语编码(verbal coding)两种形式记忆。

→ 这一步直接引入了认知过程。

🏃 ③ 再现 Reproduction

把记忆中的行为转化为动作

身体能力、练习限制——你能记住球星投篮,但不一定做得到。

→ 解释了"看得懂 ≠ 做得出"。

⚡ ④ 动机 Motivation

即使学会了,也要有理由才表现出来。

动机来自:直接强化、替代强化、自我强化

→ 解释了"学了一直没用"。

💡 记忆口诀:意 → 忆 → 现 → 机("注记再动")。任一环节缺失,模仿都不会发生——这是社会学习区别于"机械模仿"的关键。

19 / 30

真人、电影、卡通
谁的影响力最大

🎬 实验设计
研究者Bandura, Ross & Ross (1963)被试幼儿,分组观看不同形式的攻击榜样分组真人模型 ② 电影(真人影片)模型 ③ 卡通模型(卡通猫 Felix)DV幼儿对波波娃的模仿性攻击行为
📊 关键结果

三种模型都能显著增加幼儿的攻击行为。

真人模型组攻击行为最多,电影与卡通次之。

③ 即使是卡通,也能教会孩子攻击动作。

→ 榜样不必是真人媒体同样有效。

💡 现实意义:这是"媒体暴力影响儿童"研究的奠基证据。它说明电视、电影、游戏、短视频里的攻击画面,都可能通过观察学习塑造儿童行为——这成为大众媒介与教育政策长期争论的科学基础。

20 / 30

三种学习,
到底学什么

🔔 经典条件反射

学什么:刺激-刺激联结

机制:配对(CS+UCS)

主/被动:被动、不随意

场景:恐惧症、广告、味觉厌恶

🕹️ 操作性条件反射

学什么:行为-后果联结

机制:强化/惩罚

主/被动:主动、随意

场景:教育、行为矫正、成瘾

📺 社会学习

学什么:榜样行为

机制:观察+认知中介

主/被动:主动+认知

场景:榜样教育、媒体影响、性别角色

💡 关键洞察:三种理论不矛盾而是互补。一个孩子怕狗(经典)、为得贴纸而努力(操作)、模仿偶像的口头禅(社会)——常常同时发生。CIE 考题常要求比较,记住每个理论的"一句话核心"即可。

21 / 30

把学习理论
变成治病工具

🧘 系统脱敏

Systematic Desensitisation(Wolpe)

基于:经典条件反射 + 交互抑制

① 学放松;② 建立恐惧等级;③ 在放松状态下逐级暴露,用放松替代恐惧

→ 治恐惧症(蜘蛛、高空)。

🪙 代币制

Token Economy

基于:操作性条件反射(正强化)。

良好行为 → 得代币(贴纸/积分)→ 兑换实物奖励

→ 用于精神病院、学校、监狱、特教

🚫 厌恶疗法

Aversion Therapy

基于:经典条件反射(配对厌恶刺激)。

不良行为恶心/电击配对 → 形成对该行为的厌恶反应

→ 治酒瘾、烟瘾、偏差行为(伦理争议大)。

💡 共同点:不深究病因,只针对症状(行为本身);见效相对快、可量化。但批评者认为它治标不治本,未处理潜在心理冲突,且泛化到日常有时困难。

22 / 30

这个取向
该信几分

✓ 优点

高度实证:实验室严格控制、可复制、可量化(反应率/唾液)。

实用价值强:催生行为疗法(脱敏、代币制),切实改善生活。

机制清晰:刺激-反应-后果,易于教学与干预。

跨物种:动物研究奠定基础,原理简洁有力。

✗ 缺点

忽视认知:把人当"黑箱",低估思维、期待、自由意志。

动物外推:箱子里的鸽子≠复杂的人类社会。

环境决定论:暗示行为全由奖惩塑造,削弱个人责任。

伦理问题:小阿尔伯特、动物剥夺/电击的争议。

"给我一打健康的婴儿,我能把他们训练成任何专家——医生、律师、甚至乞丐和小偷。"— Watson (1925),行为主义最著名的宣言
23 / 30

CIE 必考
关键术语

🔔 UCS / UCR / CS / CR

经典条件反射四要素。"无"=天生,"条"=学会。

➕➖ Reinforcement 强化

正/负强化都让行为增加。负强化≠惩罚。

🏆 Shaping 塑造

连续接近,逐步强化接近目标的行为。

📊 FR / VR / FI / VI

强化程序。比例=按次数,间隔=按时间。

📺 Modelling 榜样

社会学习中被观察、被模仿的对象。

👀 注/记/再/动

观察学习四步:注意、记忆、再现、动机。

🌐 Generalisation 泛化

相似刺激也引发相同反应(小阿尔伯特)。

👻 Spontaneous Recovery

消退后休息,CR 自发恢复(证明未真删)。

24 / 30

你能答出
这些吗

① 基础题

用 Pavlov 的实验说清 UCS/UCR/CS/CR 四步骤。

正强化和负强化有什么区别?负强化是惩罚吗?

FR 和 VR 哪个反应率更高、更难消退?为什么?

观察学习的四个步骤是什么?

② 应用题

小阿尔伯特实验说明恐惧如何被条件化,并指出泛化。

为什么老虎机让人上瘾?用 VR 解释。

系统脱敏、代币制、厌恶疗法分别基于哪种学习理论?

三大理论对比解释同一攻击行为。

💡 答题技巧:CIE 考题常要求"描述研究 + 评价方法"。记住每个经典研究的被试/方法/IV/DV/结果/评价六要素,就能应对大部分题型。

25 / 30

CIE 9990 风格
真题怎么答

📝 范例题目

Describe one study into social learning. [9 marks]

答题框架(9 分题):

Aim 目的(1 分):Bandura 想看儿童是否会通过观察榜样学会攻击。

Method 方法(2 分):实验室实验,72 名 3–6 岁幼儿,分3 组

IV/DV(2 分):IV=模型类型/性别;DV=对波波娃的模仿攻击频次。

Results 结果(2 分):攻击组男孩均分 25.8、女孩 12.7同性模型效应

Conclusion 结论(1 分):攻击可经观察学会,无需直接强化。

💡 得分要点:① 用专业术语(modelling, vicarious reinforcement);② 具体数据(72 名、25.8);③ 结构清晰(Aim-Method-Results-Conclusion);④ 评价说"为什么是问题"。

26 / 30

CIE 考生
最常犯的错

❌ 混淆概念

• 把 负强化当成惩罚(负强化让行为增加!)。

• 混淆 CSUCS(铃声是 CS,食物是 UCS)。

• 把 消退说成"忘记"(消退是不强化导致,不是记忆消失)。

• 混淆 经典操作条件反射的"主/被动"。

❌ 评价太浅

• 只说"实验室不真实"而不说为什么是问题

• 评价 Bandura 时不提伦理(教幼儿攻击)。

• 忘记 动物研究的外推局限与伦理。

• 把 VRVI 的反应模式说反。

💡 记住:评价要"具体"。不要说"样本特殊",要说"72 名 3–6 岁斯坦福幼儿园幼儿,多为中产家庭,无法代表其他年龄/阶层"。

27 / 30

怎么学
最有效

📚 记忆策略

四步骤图:画 UCS/UCR→CS/CR 流程图。

2×2 矩阵:四种后果(正/负 × 强化/惩罚)。

生活联想:每个概念配一个生活例子。

对比表:三大理论做横向表格。

✏️ 答题策略

六要素:每个研究记 Aim/Method/IV/DV/Results/Eval。

专业术语:阅卷人按术语给分。

具体数据:72 名、25.8、7 次配对不能错。

评价深度:说出"为什么"是问题。

💡 最核心:CIE 学习取向考的不是死记硬背,而是"理解机制 + 评价研究"。能说清"VR 为什么难消退"和"Bandura 实验为何不能直接推广到真实暴力",你就稳了。

28 / 30

CIE AS · 取向 4/4

社会取向
Social

学习取向讲"个体怎么学",社会取向讲"群体怎么影响个体"——从众、服从、偏见、群体压力。🌿龙猫带你走进人群。

下一取向:社会

~ 社会心理学 ~

29 / 30

学习取向
完成!

💡 🐦多毛鸟总结:你现在懂得——行为是学来的,但不只是奖惩塑造的。环境给你方向,认知决定你注意什么、记住什么,而你——可以选择模仿谁

休息一下,翻开社会取向——看当个体走进人群,行为会如何被悄悄改变。

30 / 30

本册
参考来源

📚 教材与文献

Cambridge International AS & A Level Psychology Coursebook (CUP) · CIE 9990 考纲

Pavlov (1927) ·《Conditioned Reflexes》经典条件反射系统论述

Watson & Rayner (1920) · Little Albert 实验,Journal of Experimental Psychology

Skinner (1953) ·《Science and Human Behavior》操作性条件反射

Bandura, Ross & Ross (1961) · 波波娃实验;(1963) 真人/电影/卡通版本

CIE 9990 Syllabus (2024–2026) · 官方考纲文档