← → 翻页 · ESC 鸟瞰

📚 语音学全部页面 · 点击跳转

01 / 32

语音学
PhoneticsThe Study of Speech Sounds

语言学的第一站🐦多毛鸟戴上声波麦克风、喉咙装上发光声带——带你看见"声音"是怎么从肺、声带、舌头、嘴唇里被制造出来的。

发声 Articulatory声学 Acoustic听觉 Auditory
多毛鸟戴着麦克风,喉咙处声带发光

~ 发声的多毛鸟 ~

核心分支 1/6 · 语言学系列 → 按 → 开始
02 / 32

语音学考什么 ✎

声音,是
可以被解剖的

发声语音学

Articulatory

研究发音器官怎么制造声音。最古老、最主流的分支。

→ 本册重点

声学语音学

Acoustic

研究声音的物理属性——频率、振幅、波形、共振峰。

→ 用仪器测量

听觉语音学

Auditory

研究耳朵和大脑怎么感知声音。

→ 心理学交叉

💡 核心区分:语音学研究"声音本身"——不管哪种语言、什么意思,只关心"人是怎么发出这个音、声音的物理性质是什么"。这与下一册音系学(研究音在语言里的功能)不同。

03 / 32

为什么
只有人会说话

这个问题听起来简单,其实是几千年的谜。鹦鹉能模仿、能吠叫、鲸鱼能歌唱——但它们都不能产生人类那样精细的语言声音。差别在哪里?

🦜 鹦鹉

会模仿,但没有理解。声音是"复制",不是"创造"。

🐕 狗

能发有限几种音(吠、呜、嗥)。声道结构简单。

🐳 鲸鱼

歌声复杂、能传千里,但没有口腔调音器官

🧑 人类

喉下降 + 直立 + 灵活舌头 → 能发几千种音。

04 / 32

教猩猩说话,
能成功吗?

FUN FACT 真实轶事

🐧 Nim Chimpsky——黑猩猩,名字双关乔姆斯基(Chomsky)。

哥伦比亚大学 Terrace 教授花了 4 年教 Nim 学美国手语(ASL)。

→ 1979 年结论:Nim 主要在模仿+乞讨食物,不是真对话。

🦍 Koko——雌性大猩猩,据称会上千个手语词

还据说会骂人(把"shit"当万能骂词)。

→ 但研究方法受争议,学界评价两极。

📚 来源:[Wikipedia Nim Chimpsky](https://en.wikipedia.org/wiki/Nim_Chimpsky);Terrace 1979《Science》;[Wikipedia Koko](https://en.wikipedia.org/wiki/Koko_(gorilla))

💡 启示:问题不在脑容量——黑猩猩脑也不小。问题在于声道结构。它们的喉部位置太高,无法发出人类那样精细的元音。能"说话"是身体硬件决定的,不只是软件(脑)。

05 / 32

你的身体,
就是一件乐器

🌬️ 动力区

lungs)提供气流,是声音的"电源"。

气流经气管向上,到达喉部。

大多数语音靠呼气产生;少数语言用吸气音(见后)。

🎵 发声区

声带vocal folds)在larynx)里。

声带振动 → 浊音(如 b, d, g, m)

声带不振动 → 清音(如 p, t, k, s)

→ 浊/清是元辅音的关键区分。

🎺 调音区(上)

气流离开喉后,进入口腔鼻腔

软腭控制气流走口还是鼻

是最灵活的调音器官

唇、齿、齿龈、硬腭都能调音

→ 发音部位决定音色。

📌 关键术语

声道 vocal tract:从声带到嘴唇的全部空间。

主动发音器官:能动的(舌、唇、下颌)。

被动发音器官:不动的(上齿、硬腭)。

💡 类比:人声 = 动力(肺)+ 震源(声带)+ 调音(口腔),和铜管乐器一模一样。区别只在于:你的"乐器"可以瞬间变形。

~ 你的发声器官 ~

~ 你的发声器官 ~

06 / 32

婴儿出生时,
喉比成人高

👶 婴儿期

喉位置很高,与鼻腔连通。

好处:可以一边喝奶一边呼吸(不会呛到)。

坏处:声道短,发不出 [i] [u] [a] 这些元音。

🧑 成人

3 岁起喉逐渐下降

代价:容易噎死(海姆立克急救法就是因为这个)。

好处:声道变长变弯,能发所有元音 → 能说话。

💡 语言是进化的奢侈品——人类为"说话"付出了"易噎"的代价。这是唯一一个动物为语言牺牲生存能力的反常例子。

07 / 32

辅音靠
在哪里挡住气流区分。

唇音 Labial

双唇音 bilabial [p b m]

唇齿音 labiodental [f v]

齿/齿龈 Dental/Alveolar

齿间音 [θ ð](英语 think 的 th)

齿龈音 [t d n s z l]

硬腭/软腭 Palatal/Velar

硬腭音 [j](汉语"衣"的声母)

软腭音 [k g ŋ](汉语 g k h)

小舌/声门 Uvular/Glottal

小舌音 [ʁ](法语 r)

声门音 [ʔ h](英语 uh-oh 的停顿)

💡 记忆法:气流从外向内,依次经过:唇 → 齿 → 齿龈 → 硬腭 → 软腭 → 小舌 → 声门。发音部位 = 气流遇到的第一道关卡

08 / 32

世界上
最古怪的辅音

FUN FACT 真实轶事

🔊 搭嘴音

南非科伊桑语系。不是呼气,而是舌头吸气产生——像"啧啧"。

IPA:[ǀ ǁ ǃ ǂ]

💥 挤喉音

高加索语言、印第安语言。声门关闭后用喉上气流挤出。

IPA:[pʼ tʼ kʼ]

🫀 咽化音

阿拉伯语。气流在咽部收紧——喉咙深处挤压。

汉语和英语都没有

📚 来源:[UCLA IPA Help](https://web.archive.org/web/20160304224302/http://hctv.humnet.ucla.edu/departments/linguistics/VowelsandConsonants/);Maddieson 1984《Patterns of Sounds》调查了 317 种语言

🌍 数据:世界语言的辅音库,从 6 个(巴布亚新几内亚 Rotokas 语)到 122 个(南非 !Xóõ 语)不等。汉语 22 个,英语 24 个,都属中等偏少。

09 / 32

辅音还靠
气流被挡得多狠区分。

塞音 Stop

气流完全阻断后突然释放。

[p t k b d g]

汉语:b p d t g k

擦音 Fricative

气流在窄缝中摩擦。

[f v s z θ ð ʃ ʒ h]

汉语:f s sh h

塞擦音 Affricate

塞音 + 擦音的组合。

[tʃ dʒ](英语 chair, judge)

汉语:z c zh ch j q

鼻音 Nasal

气流走鼻腔出口。

[m n ŋ]

软腭下垂才能发。

流音 Liquid

气流畅通但有摩擦

边音 [l]:气流走舌侧

颤音/弹音 [r ɾ]:舌尖颤动

滑音 Glide

气流几乎无阻,像元音。

[w j](半元音)

汉语:w y

💡 每个辅音 = 部位 × 方法 × 浊清。比如 [b] = 双唇 + 塞音 + 浊;[s] = 齿龈 + 擦音 + 清。三个维度组合就能定位任何一个辅音。

10 / 32

为什么日本人
分不清 r 和 l

FUN FACT 真实轶事

🎬 都市传说 vs 科学:网上常有笑话,说日本人把 "election" 说成 "erection"。这背后其实是严肃的语言学现象。

• 英语 [r](龈后)和 [l](齿龈边音)是两个不同音位,分别别义(red vs lead

• 日语只有一个 [ɾ](齿龈弹音),既不是 r 也不是 l,而是中间的第三种音

• 日本人耳朵"听不出" r 和 l 的区别——不是听力问题,是大脑按日语系统加工

📚 来源:[Best & Tyler 2007 范畴知觉研究](https://en.wikipedia.org/wiki/Categorical_perception);日本母语者 L2 习得经典话题

💡 反过来:中国人难发 [θ](英语 think),因为汉语音库里没有这个音——会用 [s] 替代。所有"难发的音"都是因为母语音库里没有。这就是语音学解释的,也是音系学下一册要展开的。

11 / 32

元音靠
舌位和唇形区分。

📐 元音的三维度

声道不阻塞,靠舌位变化区分音色:

舌位高低high-low): [i u]、 [e o]、 [a]

舌位前后front-back): [i e]、 [ə]、 [u o]

唇形rounded):圆唇 [u o y]、不圆唇 [i e a]

元音四边形就是这三个维度的二维投影。

📊 基本元音(IPA 基本元音图)

IPA 定义了 8 个基本元音作为基准(Daniel Jones 1917):

前:[i] [e] [ɛ] [a]

后:[ɑ] [ɔ] [o] [u]

汉语普通话有 ~10 个单元音。

英语有 ~14 个(含双元音)。

→ 但没有任何语言用全部基本元音——每个语言只挑一部分。

💡 关键区分:单元音 vs 双元音。[a](单元音,舌位不变)vs [ai](双元音,从 [a] 滑向 [i])。汉语"爱"、英语 "eye" 都是双元音。

~ 元音舌位图 ~

~ 元音舌位图 ~

12 / 32

元音
也有"度量衡"

FUN FACT 真实轶事

🧑‍🏫 Daniel Jones(1881-1967)——英国语音学家,IPA 国际音标系统的奠基人之一

他发现:元音不像辅音那样有清晰的"器官动作",怎么精确描述?

→ 1917 年提出"基本元音"cardinal vowels):

• 选 8 个极端位置作为基准(舌位最高、最低、最前、最后)

• 其他元音按听觉距离定位

• 像音乐的标准音 A4 = 440Hz 一样,给元音"定标"

📚 来源:[Wikipedia: Daniel Jones (phonetician)](https://en.wikipedia.org/wiki/Daniel_Jones_(phonetician));Jones 1918《An Outline of English Phonetics》

💡 趣味:这套"基本元音"至今仍是 IPA 元音图的骨架。每个语言学学生都要学——你正在学的就是 100 多年前一个英国人定的标准。

13 / 32

IPA:给
所有语言的声音一套统一记号。

🌍 为什么需要 IPA

问题:英语 thoughtough 的 "ough" 发音完全不同。

普通字母无法准确记录发音——一字多音、一音多字

IPA(International Phonetic Alphabet)1888 年由国际语音学会创立:一音一符,一符一音

→ 能记录世界所有语言的声音。

📋 IPA 辅音表(局部)

双唇:[p] [b] [m] [ɸ] [β]

齿龈:[t] [d] [n] [s] [z] [l] [r]

软腭:[k] [g] [ŋ] [x] [ɣ] [w]

声门:[ʔ] [h]

→ 网格:行 = 发音方法,列 = 发音部位。

💡 使用规则:IPA 标音用方括号 [ʃi](严式标音,记录物理细节)或斜杠 /ʃi/(音位标音,记录区别意义的单位)。[ ] 是语音学,/ / 是音系学——别混。

~ IPA 辅音表 ~

~ IPA 辅音表 ~

14 / 32

汉语拼音,
其实是一套"伪装"

FUN FACT 真实轶事

🔤 汉语拼音是 1958 年公布的,本来是给汉字注音、辅助扫盲,不是替代汉字。

但它的字母和英语字母读音完全不同,例如:

拼音 q → 实际是 [tɕʰ](接近英语 ch)

拼音 x → 实际是 [ɕ](接近英语 sh)

拼音 zh → 实际是 [tʂ](卷舌)

拼音 c → 实际是 [tsʰ](不是英语的 k 或 s)

拼音 b → 实际是 [p](清不送气,不是英语浊 [b])

→ 外国人按英语读拼音会读错一大半——这就是为什么外国人学中文"发音最难"。

📚 来源:《汉语拼音方案》(1958)原文;林焘王理嘉《语音学教程》

💡 核心提醒:拼音是文字方案(用于书写),IPA 是语音方案(用于标音)。两者不能混用。学语音学必须学会看 IPA,不能停留在拼音。

15 / 32

声音不是
一个一个蹦出来的

🔗 协同发音 Coarticulation

相邻音会互相影响——发音器官来不及"重置"。

例:英语 cap 里的 [k] 和 keep 里的 [k],舌位其实不同

前接前元音 → [k] 前移;后接后元音 → [k] 后移。

→ 这就是同化的物理基础。

📈 超音段特征

超出"单个音"的特征,作用在更大的单位上:

重音 stressREcord(名词)vs reCORD(动词)

声调 tone:汉语 mā/má/mǎ/mà

语调 intonation:"去?"↑ vs "去。"↓

音长节奏音节

💡 关键洞察:语言学早期以为"音是离散的积木",但语音学证明——真实的语音是连续流动的。我们听到的"离散音"是大脑加工的结果,不是物理事实。

16 / 32

把声音
变成看得见的波

📊 三个物理量

频率 frequency(Hz):每秒振动次数 → 决定音高。女声 ~220Hz,男声 ~120Hz。

振幅 amplitude:波的大小 → 决定音量

波形 waveform:波的形状 → 决定音色

🌊 共振峰 Formants

声道像一个可变形的共鸣管,会放大某些频率。

放大的频率叫共振峰F1, F2, F3...)。

F1 对应元音高低;F2 对应前后。

→ 元音的本质就是共振峰的组合

🔬 语图仪spectrograph)能画出"语图"(spectrogram):横轴时间、纵轴频率、深浅表能量。看语图就能"读出"说了什么——这是语音识别、法医声纹的基础。

17 / 32

语音学家
也能当侦探

FUN FACT 真实轶事

⚖️ 声纹鉴定voice identification)——法庭上用过,但有争议。

• 每个人的声道形状略有不同 → 共振峰"指纹"

• 历史上美国法庭曾采信"声纹"作为证据

• 但 NRC 1979 报告指出可靠性不足——比指纹差得多

→ 现代法庭:可作为辅助证据,不能单独定罪

📚 来源:[NRC 1979《On the Theory and Practice of Voice Identification》](https://en.wikipedia.org/wiki/Voiceprint);Nordby 1982 等批评性文献

💡 趣味:而 AI 语音合成(如 deepfake 配音)让声纹鉴定变得更难——别人可以"复制"你的声音。语音学家的工作从"识别说话人"转向"识别合成痕迹"。

18 / 32

听到的不等于
物理存在的

👂 听觉的过程

① 外耳收集声波 → 鼓膜振动

② 中耳放大振动 → 传到耳蜗

③ 内耳耳蜗的基底膜按频率分解信号

④ 听神经传到大脑听觉皮层

→ 脑再加工成"语音"。

🤯 知觉不是录音

大脑会"脑补"听到的东西:

范畴知觉:连续变化的音被听成离散类别

音位恢复效应:被噪音盖住的音,脑会"补全"

McGurk 效应:看到的口型改变听到的音

💡 核心洞察:"听见"是物理 + 生理 + 认知的综合产物。同一声波,不同语言背景的人会"听成"不同音——这就解释了为什么日本人难分 l/r,中国人难分 θ/s。

19 / 32

看见不同的口型,
听到的音就变了

FUN FACT 真实轶事

🎭 McGurk 效应(McGurk & MacDonald 1976):

• 让你一个人嘴型发 [ga]

• 同时到的声音是 [ba]

• 你的大脑会合成出一个不存在的音——[da]!

→ 即使你知道原理,也无法阻止这个错觉。

📚 来源:[McGurk & MacDonald 1976《Nature》](https://en.wikipedia.org/wiki/McGurk_effect);现在 YouTube 上能找到大量演示视频

💡 意义:听觉不是单纯的"听"——视觉也在参与语音知觉。这就是为什么电话沟通比面对面更易误解,也是为什么戴上口罩后大家觉得"听不清"(其实是看不到口型)。

20 / 32

世界语言的
声音库超乎想象

吸/搭嘴音

南非科伊桑语系、东非部分语言。

不是呼气,而是吸气产生。

IPA 用 [ǀ ǁ ǃ ǂ] 表示。

咽化音

阿拉伯语、希伯来语。

气流在咽部收紧——喉咙深处挤压。

汉语和英语都没有。

挤喉音

高加索语言、印第安语言。

声门关闭后用喉上气流挤出。

IPA 用 [pʼ tʼ kʼ] 表示。

🌍 统计:世界语言用到的不同辅音从 6 个(Rotokas 语)到 122 个(!Xóõ 语)不等。汉语普通话 22 个,英语 24 个,都属中等偏少。

21 / 32

用一种语言
打败密码学

FUN FACT 真实轶事

🪖 纳瓦霍语密码(Navajo Code Talkers)—— 二战太平洋战场。

• 美军招募了约 400 名纳瓦霍族士兵做通信员

• 用纳瓦霍语通话,日军无人能破——因为:

① 纳瓦霍语没有文字,外人无从学起

② 语法结构特殊(多式综合语,主宾格)

③ 发音有独特声调和长短对立

→ 战后美军说:"没有纳瓦霍人,硫磺岛战役永远拿不下来。"

📚 来源:[Wikipedia: Code talker](https://en.wikipedia.org/wiki/Code_talker);电影《Windtalkers》(风语者)2002

💡 启示:一种语言的"难懂"程度,取决于它和你已知语言的距离。从英语角度看,纳瓦霍语比德语、日语都难——这就是语音学和音系学"距离"的实战意义

22 / 32

试着
用 IPA 写一句话

📝 英语转写示例

原句:The quick brown fox jumps.

[ðə kwɪk braʊn fɒks dʒʌmps]

注意:th → [θ/ð],qu → [kw],x → [ks]。

📝 汉语转写示例(普通话)

原句:我爱学语音。

[wɔ˨˩˦ ai˥˩ ɕyɛ˧˥ y˥˥ in˥˥]

数字是声调(五度标记法:5 高、1 低)。汉语必须标声调。

💡 转写原则:严式记录所有物理细节(含变体);② 宽式只记区别意义的音。新手从宽式入手,再逐步精确。

23 / 32

两者是
兄弟,不是同一个

🔬 语音学 Phonetics

研究声音本身

• 物理/生理层面

跨语言:不管哪种语言

• 关心 [a] 怎么发、什么频率

→ 物理学/生理学视角

📊 音系学 Phonology

研究声音在语言里的功能

• 心理/系统层面

特定语言:这个语言的音怎么组织

• 关心 [a] 在汉语里是音位还是变体

→ 系统学/认知视角

💡 一句总结:语音学告诉你 [pʰ](送气)和 [p](不送气)在物理上不同;音系学告诉你 在汉语里它们区别意义(怕 vs 罢),在英语里它们是同一个音位的变体(pin/spin)

24 / 32

语音学家
怎么研究声音

👄 直接观察

口耳模仿:传统方法,靠训练有素的耳朵

palatography(腭位图):假腭上涂粉,看舌接触

→ 适合发不出仪器时的田野调查

🔬 仪器测量

声谱仪:画语图,分析频率

X 光 / MRI:看声道形状

EMA/EMG:追踪舌/唇运动

气流计:测鼻/口气流比例

🧪 实验范式

辨识实验(ABX):A 和 B 不同吗?

范畴知觉:渐变音被听成哪类?

眼动/脑电:加工过程

🌐 田野调查

深入濒危语言社区录音、转写。

语档学language documentation)的现代重要任务。

25 / 32

学了语音学,
能做什么

🤖 语音技术

语音识别 ASR:Siri、微信语音转文字

语音合成 TTS:导航、有声书

→ 全部建立在声学语音学基础上

🗣️ 语言教学

外语发音矫正:为什么中国人难发 [θ]?

对外汉语教学:声调怎么教?

正音治疗(构音障碍)

⚖️ 法医与医学

声纹鉴定:谁打来的勒索电话?

言语-语言治疗:腭裂、失语症

助听器设计

📚 语言研究

历史比较:古音怎么演变(见第 8 册)

方言调查:各地口音差异(见第 9 册)

语言类型学(见第 12 册)

26 / 32

语音学
必考点速记

⚡ 高频考点

三大分支:发声/声学/听觉

• 发音器官四区(动力/发声/调音)

• 辅音 = 部位 × 方法 × 浊清

• 元音 = 高低 × 前后 × 唇形

IPA 用 [ ] 标音

• 浊音 vs 清音的区分

🎯 易错点

语音学 ≠ 音系学(前者物理,后者功能)

[ ] vs / / 别混用

送气汉语区别意义,英语不区别

• 元音不阻塞声道

• 鼻音靠软腭下垂

• 声调是超音段,不是元音属性

💡 记忆口诀:"部位方法浊清"定位辅音,"高低前后圆展"定位元音,"[ ] 物理派,/ / 功能派"区分标音。

27 / 32

5 道题
试一试

Q1

[s] 这个音的发音部位和方法是什么?

提示:齿龈 + 擦音。

Q2

汉语拼音 b 和 p 在语音学上有什么区别?英语呢?

提示:送气。汉语别义,英语不变。

Q3

用 IPA 转写"你好"。

提示:[ni xau] + 声调。

Q4

为什么元音的"四边形"只画了二维?

提示:高低 + 前后;唇形用附加符。

📝 答题诀:描述辅音必带三个维度(部位+方法+浊清);描述元音必带三个维度(高低+前后+唇形);汉语题必带声调

28 / 32

语音学
常见错误

❌ 错误 1

用拼音代替 IPA

汉语拼音 [p] 其实是 [pʰ](送气),不是国际音标的 [p]。两者不同系统!

❌ 错误 2

混淆音素和字母

英语 sh 是两个字母但一个音 [ʃ]。c 一个字母可发 [k] [s] [ʃ]。

❌ 错误 3

把清浊当送气

汉语 b/d/g 是清不送气,不是"浊音"!汉语没有浊塞音。

❌ 错误 4

忽略协同发音

真实的 [k] 在不同元音环境下其实不同。严式标音要记这种差异。

核心提醒:汉语母语者最易犯的错——把汉语拼音直接当 IPA 用。记住:拼音是文字,IPA 是语音,两个系统。

29 / 32

语音学,
是语言学的大门

🔗 为后续奠基

音系学(下册):语音学的"功能版"

形态学:语素的语音实现

历史语言学:语音怎么演变

心理语言学:语音怎么被加工

🔗 跨学科桥梁

物理学:声学

生理学:发音器官

心理学:言语知觉

计算机科学:语音技术

医学:言语治疗

"语音学是所有语言学分支的共同语言——不管你研究什么,最终都要回到'声音是怎么发出来的'。" — 语音学在语言学中的地位
30 / 32

真题范例
(改编)

📝 题目

"用 IPA 描述汉语普通话 [tʂʰ](拼音 ch)的发音特征,并说明它和英语 [tʃ](chair 中的 ch)有何异同。"

汉语 ch [tʂʰ]

部位:卷舌(舌尖翘起触硬腭前)

方法:塞擦音 + 送气

浊清:清音

英语 ch [tʃ]

部位:龈后(舌叶触齿龈后)

方法:塞擦音 + 不送气(英语不别义)

浊清:清音

💡 关键区别:舌尖 vs 舌叶;② 卷舌 vs 龈后;③ 汉语送气别义,英语不别义。这三个维度缺一不可

31 / 32

下一册:
音系学

你已经知道"声音怎么发"。下一册问——为什么这些音在你母语里这样组织?为什么英语 pin/spin 的 [p] 不别义,汉语怕/霸却别义?答案藏在音位里。

音位 Phoneme互补分布最小对立对
多毛鸟望向音位网

~ 从物理走向系统 ~

32 / 32

语音学
完成

🐦 🐦多毛鸟:你现在能"看见"声音了——它的器官、它的波形、它的分类。下次说话时,试着想想舌头在哪里、声带在不在动。那是你身体里最精密的乐器。

休息一下,翻开第 2 册《音系学》