语言学的第一站。🐦多毛鸟戴上声波麦克风、喉咙装上发光声带——带你看见"声音"是怎么从肺、声带、舌头、嘴唇里被制造出来的。
~ 发声的多毛鸟 ~
语音学考什么 ✎
Articulatory
研究发音器官怎么制造声音。最古老、最主流的分支。
→ 本册重点
Acoustic
研究声音的物理属性——频率、振幅、波形、共振峰。
→ 用仪器测量
Auditory
研究耳朵和大脑怎么感知声音。
→ 心理学交叉
💡 核心区分:语音学研究"声音本身"——不管哪种语言、什么意思,只关心"人是怎么发出这个音、声音的物理性质是什么"。这与下一册音系学(研究音在语言里的功能)不同。
这个问题听起来简单,其实是几千年的谜。鹦鹉能模仿、狗能吠叫、鲸鱼能歌唱——但它们都不能产生人类那样精细的语言声音。差别在哪里?
会模仿,但没有理解。声音是"复制",不是"创造"。
能发有限几种音(吠、呜、嗥)。声道结构简单。
歌声复杂、能传千里,但没有口腔调音器官。
喉下降 + 直立 + 灵活舌头 → 能发几千种音。
🐧 Nim Chimpsky——黑猩猩,名字双关乔姆斯基(Chomsky)。
哥伦比亚大学 Terrace 教授花了 4 年教 Nim 学美国手语(ASL)。
→ 1979 年结论:Nim 主要在模仿+乞讨食物,不是真对话。
🦍 Koko——雌性大猩猩,据称会上千个手语词。
还据说会骂人(把"shit"当万能骂词)。
→ 但研究方法受争议,学界评价两极。
📚 来源:[Wikipedia Nim Chimpsky](https://en.wikipedia.org/wiki/Nim_Chimpsky);Terrace 1979《Science》;[Wikipedia Koko](https://en.wikipedia.org/wiki/Koko_(gorilla))
💡 启示:问题不在脑容量——黑猩猩脑也不小。问题在于声道结构。它们的喉部位置太高,无法发出人类那样精细的元音。能"说话"是身体硬件决定的,不只是软件(脑)。
肺(lungs)提供气流,是声音的"电源"。
气流经气管向上,到达喉部。
大多数语音靠呼气产生;少数语言用吸气音(见后)。
声带(vocal folds)在喉(larynx)里。
声带振动 → 浊音(如 b, d, g, m)
声带不振动 → 清音(如 p, t, k, s)
→ 浊/清是元辅音的关键区分。
气流离开喉后,进入口腔和鼻腔。
• 软腭控制气流走口还是鼻
• 舌是最灵活的调音器官
• 唇、齿、齿龈、硬腭都能调音
→ 发音部位决定音色。
声道 vocal tract:从声带到嘴唇的全部空间。
主动发音器官:能动的(舌、唇、下颌)。
被动发音器官:不动的(上齿、硬腭)。
💡 类比:人声 = 动力(肺)+ 震源(声带)+ 调音(口腔),和铜管乐器一模一样。区别只在于:你的"乐器"可以瞬间变形。

~ 你的发声器官 ~
喉位置很高,与鼻腔连通。
好处:可以一边喝奶一边呼吸(不会呛到)。
坏处:声道短,发不出 [i] [u] [a] 这些元音。
3 岁起喉逐渐下降。
代价:容易噎死(海姆立克急救法就是因为这个)。
好处:声道变长变弯,能发所有元音 → 能说话。
💡 语言是进化的奢侈品——人类为"说话"付出了"易噎"的代价。这是唯一一个动物为语言牺牲生存能力的反常例子。
双唇音 bilabial [p b m]
唇齿音 labiodental [f v]
齿间音 [θ ð](英语 think 的 th)
齿龈音 [t d n s z l]
硬腭音 [j](汉语"衣"的声母)
软腭音 [k g ŋ](汉语 g k h)
小舌音 [ʁ](法语 r)
声门音 [ʔ h](英语 uh-oh 的停顿)
💡 记忆法:气流从外向内,依次经过:唇 → 齿 → 齿龈 → 硬腭 → 软腭 → 小舌 → 声门。发音部位 = 气流遇到的第一道关卡。
🔊 搭嘴音
南非科伊桑语系。不是呼气,而是舌头吸气产生——像"啧啧"。
IPA:[ǀ ǁ ǃ ǂ]
💥 挤喉音
高加索语言、印第安语言。声门关闭后用喉上气流挤出。
IPA:[pʼ tʼ kʼ]
🫀 咽化音
阿拉伯语。气流在咽部收紧——喉咙深处挤压。
汉语和英语都没有
📚 来源:[UCLA IPA Help](https://web.archive.org/web/20160304224302/http://hctv.humnet.ucla.edu/departments/linguistics/VowelsandConsonants/);Maddieson 1984《Patterns of Sounds》调查了 317 种语言
🌍 数据:世界语言的辅音库,从 6 个(巴布亚新几内亚 Rotokas 语)到 122 个(南非 !Xóõ 语)不等。汉语 22 个,英语 24 个,都属中等偏少。
气流完全阻断后突然释放。
[p t k b d g]
汉语:b p d t g k
气流在窄缝中摩擦。
[f v s z θ ð ʃ ʒ h]
汉语:f s sh h
塞音 + 擦音的组合。
[tʃ dʒ](英语 chair, judge)
汉语:z c zh ch j q
气流走鼻腔出口。
[m n ŋ]
软腭下垂才能发。
气流畅通但有摩擦。
边音 [l]:气流走舌侧
颤音/弹音 [r ɾ]:舌尖颤动
气流几乎无阻,像元音。
[w j](半元音)
汉语:w y
💡 每个辅音 = 部位 × 方法 × 浊清。比如 [b] = 双唇 + 塞音 + 浊;[s] = 齿龈 + 擦音 + 清。三个维度组合就能定位任何一个辅音。
🎬 都市传说 vs 科学:网上常有笑话,说日本人把 "election" 说成 "erection"。这背后其实是严肃的语言学现象。
• 英语 [r](龈后)和 [l](齿龈边音)是两个不同音位,分别别义(red vs lead)
• 日语只有一个 [ɾ](齿龈弹音),既不是 r 也不是 l,而是中间的第三种音
• 日本人耳朵"听不出" r 和 l 的区别——不是听力问题,是大脑按日语系统加工
📚 来源:[Best & Tyler 2007 范畴知觉研究](https://en.wikipedia.org/wiki/Categorical_perception);日本母语者 L2 习得经典话题
💡 反过来:中国人难发 [θ](英语 think),因为汉语音库里没有这个音——会用 [s] 替代。所有"难发的音"都是因为母语音库里没有。这就是语音学解释的,也是音系学下一册要展开的。
声道不阻塞,靠舌位变化区分音色:
① 舌位高低(high-low):高 [i u]、中 [e o]、低 [a]
② 舌位前后(front-back):前 [i e]、中 [ə]、后 [u o]
③ 唇形(rounded):圆唇 [u o y]、不圆唇 [i e a]
→ 元音四边形就是这三个维度的二维投影。
IPA 定义了 8 个基本元音作为基准(Daniel Jones 1917):
前:[i] [e] [ɛ] [a]
后:[ɑ] [ɔ] [o] [u]
汉语普通话有 ~10 个单元音。
英语有 ~14 个(含双元音)。
→ 但没有任何语言用全部基本元音——每个语言只挑一部分。
💡 关键区分:单元音 vs 双元音。[a](单元音,舌位不变)vs [ai](双元音,从 [a] 滑向 [i])。汉语"爱"、英语 "eye" 都是双元音。

~ 元音舌位图 ~
🧑🏫 Daniel Jones(1881-1967)——英国语音学家,IPA 国际音标系统的奠基人之一。
他发现:元音不像辅音那样有清晰的"器官动作",怎么精确描述?
→ 1917 年提出"基本元音"(cardinal vowels):
• 选 8 个极端位置作为基准(舌位最高、最低、最前、最后)
• 其他元音按听觉距离定位
• 像音乐的标准音 A4 = 440Hz 一样,给元音"定标"
📚 来源:[Wikipedia: Daniel Jones (phonetician)](https://en.wikipedia.org/wiki/Daniel_Jones_(phonetician));Jones 1918《An Outline of English Phonetics》
💡 趣味:这套"基本元音"至今仍是 IPA 元音图的骨架。每个语言学学生都要学——你正在学的就是 100 多年前一个英国人定的标准。
问题:英语 though 和 tough 的 "ough" 发音完全不同。
普通字母无法准确记录发音——一字多音、一音多字。
IPA(International Phonetic Alphabet)1888 年由国际语音学会创立:一音一符,一符一音。
→ 能记录世界所有语言的声音。
双唇:[p] [b] [m] [ɸ] [β]
齿龈:[t] [d] [n] [s] [z] [l] [r]
软腭:[k] [g] [ŋ] [x] [ɣ] [w]
声门:[ʔ] [h]
→ 网格:行 = 发音方法,列 = 发音部位。
💡 使用规则:IPA 标音用方括号 [ʃi](严式标音,记录物理细节)或斜杠 /ʃi/(音位标音,记录区别意义的单位)。[ ] 是语音学,/ / 是音系学——别混。

~ IPA 辅音表 ~
🔤 汉语拼音是 1958 年公布的,本来是给汉字注音、辅助扫盲,不是替代汉字。
但它的字母和英语字母读音完全不同,例如:
拼音 q → 实际是 [tɕʰ](接近英语 ch)
拼音 x → 实际是 [ɕ](接近英语 sh)
拼音 zh → 实际是 [tʂ](卷舌)
拼音 c → 实际是 [tsʰ](不是英语的 k 或 s)
拼音 b → 实际是 [p](清不送气,不是英语浊 [b])
→ 外国人按英语读拼音会读错一大半——这就是为什么外国人学中文"发音最难"。
📚 来源:《汉语拼音方案》(1958)原文;林焘王理嘉《语音学教程》
💡 核心提醒:拼音是文字方案(用于书写),IPA 是语音方案(用于标音)。两者不能混用。学语音学必须学会看 IPA,不能停留在拼音。
相邻音会互相影响——发音器官来不及"重置"。
例:英语 cap 里的 [k] 和 keep 里的 [k],舌位其实不同。
前接前元音 → [k] 前移;后接后元音 → [k] 后移。
→ 这就是同化的物理基础。
超出"单个音"的特征,作用在更大的单位上:
• 重音 stress:REcord(名词)vs reCORD(动词)
• 声调 tone:汉语 mā/má/mǎ/mà
• 语调 intonation:"去?"↑ vs "去。"↓
• 音长、节奏、音节
💡 关键洞察:语言学早期以为"音是离散的积木",但语音学证明——真实的语音是连续流动的。我们听到的"离散音"是大脑加工的结果,不是物理事实。
• 频率 frequency(Hz):每秒振动次数 → 决定音高。女声 ~220Hz,男声 ~120Hz。
• 振幅 amplitude:波的大小 → 决定音量。
• 波形 waveform:波的形状 → 决定音色。
声道像一个可变形的共鸣管,会放大某些频率。
放大的频率叫共振峰(F1, F2, F3...)。
F1 对应元音高低;F2 对应前后。
→ 元音的本质就是共振峰的组合。
🔬 语图仪(spectrograph)能画出"语图"(spectrogram):横轴时间、纵轴频率、深浅表能量。看语图就能"读出"说了什么——这是语音识别、法医声纹的基础。
⚖️ 声纹鉴定(voice identification)——法庭上用过,但有争议。
• 每个人的声道形状略有不同 → 共振峰"指纹"
• 历史上美国法庭曾采信"声纹"作为证据
• 但 NRC 1979 报告指出可靠性不足——比指纹差得多
→ 现代法庭:可作为辅助证据,不能单独定罪
📚 来源:[NRC 1979《On the Theory and Practice of Voice Identification》](https://en.wikipedia.org/wiki/Voiceprint);Nordby 1982 等批评性文献
💡 趣味:而 AI 语音合成(如 deepfake 配音)让声纹鉴定变得更难——别人可以"复制"你的声音。语音学家的工作从"识别说话人"转向"识别合成痕迹"。
① 外耳收集声波 → 鼓膜振动
② 中耳放大振动 → 传到耳蜗
③ 内耳耳蜗的基底膜按频率分解信号
④ 听神经传到大脑听觉皮层
→ 脑再加工成"语音"。
大脑会"脑补"听到的东西:
• 范畴知觉:连续变化的音被听成离散类别
• 音位恢复效应:被噪音盖住的音,脑会"补全"
• McGurk 效应:看到的口型改变听到的音
💡 核心洞察:"听见"是物理 + 生理 + 认知的综合产物。同一声波,不同语言背景的人会"听成"不同音——这就解释了为什么日本人难分 l/r,中国人难分 θ/s。
🎭 McGurk 效应(McGurk & MacDonald 1976):
• 让你看一个人嘴型发 [ga]
• 同时听到的声音是 [ba]
• 你的大脑会合成出一个不存在的音——[da]!
→ 即使你知道原理,也无法阻止这个错觉。
📚 来源:[McGurk & MacDonald 1976《Nature》](https://en.wikipedia.org/wiki/McGurk_effect);现在 YouTube 上能找到大量演示视频
💡 意义:听觉不是单纯的"听"——视觉也在参与语音知觉。这就是为什么电话沟通比面对面更易误解,也是为什么戴上口罩后大家觉得"听不清"(其实是看不到口型)。
南非科伊桑语系、东非部分语言。
不是呼气,而是吸气产生。
IPA 用 [ǀ ǁ ǃ ǂ] 表示。
阿拉伯语、希伯来语。
气流在咽部收紧——喉咙深处挤压。
汉语和英语都没有。
高加索语言、印第安语言。
声门关闭后用喉上气流挤出。
IPA 用 [pʼ tʼ kʼ] 表示。
🌍 统计:世界语言用到的不同辅音从 6 个(Rotokas 语)到 122 个(!Xóõ 语)不等。汉语普通话 22 个,英语 24 个,都属中等偏少。
🪖 纳瓦霍语密码(Navajo Code Talkers)—— 二战太平洋战场。
• 美军招募了约 400 名纳瓦霍族士兵做通信员
• 用纳瓦霍语通话,日军无人能破——因为:
① 纳瓦霍语没有文字,外人无从学起
② 语法结构特殊(多式综合语,主宾格)
③ 发音有独特声调和长短对立
→ 战后美军说:"没有纳瓦霍人,硫磺岛战役永远拿不下来。"
📚 来源:[Wikipedia: Code talker](https://en.wikipedia.org/wiki/Code_talker);电影《Windtalkers》(风语者)2002
💡 启示:一种语言的"难懂"程度,取决于它和你已知语言的距离。从英语角度看,纳瓦霍语比德语、日语都难——这就是语音学和音系学"距离"的实战意义。
原句:The quick brown fox jumps.
[ðə kwɪk braʊn fɒks dʒʌmps]
注意:th → [θ/ð],qu → [kw],x → [ks]。
原句:我爱学语音。
[wɔ˨˩˦ ai˥˩ ɕyɛ˧˥ y˥˥ in˥˥]
数字是声调(五度标记法:5 高、1 低)。汉语必须标声调。
💡 转写原则:① 严式记录所有物理细节(含变体);② 宽式只记区别意义的音。新手从宽式入手,再逐步精确。
研究声音本身。
• 物理/生理层面
• 跨语言:不管哪种语言
• 关心 [a] 怎么发、什么频率
→ 物理学/生理学视角
研究声音在语言里的功能。
• 心理/系统层面
• 特定语言:这个语言的音怎么组织
• 关心 [a] 在汉语里是音位还是变体
→ 系统学/认知视角
💡 一句总结:语音学告诉你 [pʰ](送气)和 [p](不送气)在物理上不同;音系学告诉你 在汉语里它们区别意义(怕 vs 罢),在英语里它们是同一个音位的变体(pin/spin)。
• 口耳模仿:传统方法,靠训练有素的耳朵
• palatography(腭位图):假腭上涂粉,看舌接触
→ 适合发不出仪器时的田野调查
• 声谱仪:画语图,分析频率
• X 光 / MRI:看声道形状
• EMA/EMG:追踪舌/唇运动
• 气流计:测鼻/口气流比例
• 辨识实验(ABX):A 和 B 不同吗?
• 范畴知觉:渐变音被听成哪类?
• 眼动/脑电:加工过程
深入濒危语言社区录音、转写。
→ 语档学(language documentation)的现代重要任务。
• 语音识别 ASR:Siri、微信语音转文字
• 语音合成 TTS:导航、有声书
→ 全部建立在声学语音学基础上
• 外语发音矫正:为什么中国人难发 [θ]?
• 对外汉语教学:声调怎么教?
• 正音治疗(构音障碍)
• 声纹鉴定:谁打来的勒索电话?
• 言语-语言治疗:腭裂、失语症
• 助听器设计
• 历史比较:古音怎么演变(见第 8 册)
• 方言调查:各地口音差异(见第 9 册)
• 语言类型学(见第 12 册)
• 三大分支:发声/声学/听觉
• 发音器官四区(动力/发声/调音)
• 辅音 = 部位 × 方法 × 浊清
• 元音 = 高低 × 前后 × 唇形
• IPA 用 [ ] 标音
• 浊音 vs 清音的区分
• 语音学 ≠ 音系学(前者物理,后者功能)
• [ ] vs / / 别混用
• 送气汉语区别意义,英语不区别
• 元音不阻塞声道
• 鼻音靠软腭下垂
• 声调是超音段,不是元音属性
💡 记忆口诀:"部位方法浊清"定位辅音,"高低前后圆展"定位元音,"[ ] 物理派,/ / 功能派"区分标音。
[s] 这个音的发音部位和方法是什么?
提示:齿龈 + 擦音。
汉语拼音 b 和 p 在语音学上有什么区别?英语呢?
提示:送气。汉语别义,英语不变。
用 IPA 转写"你好"。
提示:[ni xau] + 声调。
为什么元音的"四边形"只画了二维?
提示:高低 + 前后;唇形用附加符。
📝 答题诀:描述辅音必带三个维度(部位+方法+浊清);描述元音必带三个维度(高低+前后+唇形);汉语题必带声调。
用拼音代替 IPA
汉语拼音 [p] 其实是 [pʰ](送气),不是国际音标的 [p]。两者不同系统!
混淆音素和字母
英语 sh 是两个字母但一个音 [ʃ]。c 一个字母可发 [k] [s] [ʃ]。
把清浊当送气
汉语 b/d/g 是清不送气,不是"浊音"!汉语没有浊塞音。
忽略协同发音
真实的 [k] 在不同元音环境下其实不同。严式标音要记这种差异。
⚠ 核心提醒:汉语母语者最易犯的错——把汉语拼音直接当 IPA 用。记住:拼音是文字,IPA 是语音,两个系统。
• 音系学(下册):语音学的"功能版"
• 形态学:语素的语音实现
• 历史语言学:语音怎么演变
• 心理语言学:语音怎么被加工
• 物理学:声学
• 生理学:发音器官
• 心理学:言语知觉
• 计算机科学:语音技术
• 医学:言语治疗
"用 IPA 描述汉语普通话 [tʂʰ](拼音 ch)的发音特征,并说明它和英语 [tʃ](chair 中的 ch)有何异同。"
部位:卷舌(舌尖翘起触硬腭前)
方法:塞擦音 + 送气
浊清:清音
部位:龈后(舌叶触齿龈后)
方法:塞擦音 + 不送气(英语不别义)
浊清:清音
💡 关键区别:① 舌尖 vs 舌叶;② 卷舌 vs 龈后;③ 汉语送气别义,英语不别义。这三个维度缺一不可。
你已经知道"声音怎么发"。下一册问——为什么这些音在你母语里这样组织?为什么英语 pin/spin 的 [p] 不别义,汉语怕/霸却别义?答案藏在音位里。
~ 从物理走向系统 ~
🐦 🐦多毛鸟:你现在能"看见"声音了——它的器官、它的波形、它的分类。下次说话时,试着想想舌头在哪里、声带在不在动。那是你身体里最精密的乐器。
休息一下,翻开第 2 册《音系学》。