索绪尔符号学详解
想象一下,你第一次看到一只狗,旁边的人跟你说”这是狗”。从那一刻起,每当你说”狗”这个字,脑子里浮现的就不再是别的动物,而是那个毛茸茸、四条腿、会摇尾巴的家伙。这个过程看起来简单得不能再简单了,但如果你仔细想想,会发现这里面有个奇怪的问题:为什么”狗”这个声音/文字偏偏就代表狗呢?它跟狗本身长得一点都不像啊!
这个问题看似无聊,但它触及了人类语言最底层的一个秘密。费迪南德·德·索绪尔,就是那个在一百多年前开始认真思考这个问题的人。他不是第一个注意到这个现象的人,但他是第一个把它系统化、理论化,让后来的哲学家、语言学家、甚至搞计算机的人都绕不开他的人。
今天咱们就来好好聊聊索绪尔的符号学,看看这个老派的语言学家到底说了什么,为什么他的思想到现在还能给人工智能、文学批评、哲学思考带来那么多启发。
关键词速览
| 核心术语 | 英文术语 | 简短定义 |
|---|---|---|
| 能指 | Signifier | 符号的物质形式(声音、文字等) |
| 所指 | Signified | 符号的概念意义(心理意象) |
| 语言 | Langue | 语言的社会性规约系统 |
| 言语 | Parole | 语言的实际使用行为 |
| 任意性 | Arbitrariness | 能指与所指关联的非必然性 |
| 差异性 | Difference | 意义由符号间的差异决定 |
| 符号 | Sign | 能指与所指的结合体 |
| 共时性 | Synchrony | 特定时间点的语言状态 |
| 历时性 | Diachrony | 语言随时间的历史演变 |
| 句段关系 | Syntagmatic | 符号在话语中的线性组合 |
| 联想关系 | Paradigmatic | 符号间的可替换选择关系 |
| 价值 | Value | 符号在系统中的相对位置 |
一、引言:费迪南德·德·索绪尔与结构语言学
费迪南德·德·索绪尔(Ferdinand de Saussure, 1857-1913)是瑞士人,家里祖祖辈辈都是搞语言学的,他爹还是个挺有名的语言学家。按理说这种家庭环境出来的孩子,要么继承家业要么叛逆出走,索绪尔呢,算是两者都沾点边——他学了语言学,但把整个学科的方向给彻底拧过来了。
索绪尔在日内瓦大学教书,1907年到1911年间开了三门课,分别叫普通语言学讲座。他讲课的时候挺有自己的想法,但据说脾气不太好,有时候讲着讲着就自己跑偏了。他死后,他的两个学生巴伊和塞歇根据他的讲义和同事的笔记,整理出版了《普通语言学教程》。有意思的是,这本书其实不是索绪尔自己写的,是他学生”替”他写的。所以后来有很多学者花大量时间精力去研究《教程》里的哪些观点是索绪尔本人的,哪些是学生添加的,吵得不可开交。
不管怎么说,这本书的影响实在太大了。1916年出版之后,整个语言学乃至人文社科的面貌都被它改变了。
索绪尔跟美国的皮尔斯并称为现代符号学的两大奠基人。皮尔斯是美国人,哲学家、逻辑学家,他研究符号是从逻辑学的角度出发;索绪尔是瑞士人,语言学家,他研究符号是从语言系统的角度出发。两个人的出发点不同,但都深刻地揭示了人类如何使用符号来表达意义。后来的符号学发展,基本上就是这两条路线不断交织、互相影响的过程。
二、能指与所指:符号的两面性
2.1 什么是符号?
咱们每天都在用符号,但你可能从没想过”符号”到底是个什么东西。索绪尔给出了一个简洁明了的定义:符号 = 能指 + 所指。
这个公式看起来简单,但含义很深。
能指,就是符号的物质形式——你听到的声音、看到的文字、感受到的触感,这些物理性的东西都是能指。在口语里,能指是一串声音;在书面语里,能指是一串文字符号;在盲文里,能指是凸起的点阵;在旗语里,能指是旗帜的形状和位置。
所指,就是符号在你脑子里引发的那个概念。注意,索绪尔说的”所指”不是客观存在的事物本身,而是心理层面的概念。你说”苹果”的时候,脑子里浮现的是”苹果”这个水果的抽象概念,而不是你面前那个具体的、红彤彤的苹果。客观事物是外在的,而概念是你脑子里的东西。
打个比方,你看电影的时候,屏幕上的人物是投影出来的光影,不是真人。但你就着这些光影,在脑子里构建出角色是谁、发生了什么故事。符号的运作方式有点像这个——能指是银幕上的光影,所指是你脑子里的故事。
2.2 心理实在性:符号存在于哪里?
索绪尔特别强调,能指和所指都是”心理现象”。
这话什么意思呢?他不是说符号是幻觉,而是说符号的存在方式不是物理的、客观的物质实体,而是心理上的印记和概念。
具体来说:
- 能指不是物理的声音本身,而是声音在我们大脑中留下的”印痕”。同一个声音,不同人听到的感受会有细微差别;同一个人反复听到同一个声音,每次的感受也不完全相同。但这些声音的”印象”有足够的稳定性,让我们能够识别它们。
- 所指不是客观事物,而是对事物的”心理表征”。世界上没有两片完全相同的树叶,但我们都能用”树叶”这个词来指代它们,因为我们脑子里有一个抽象的”树叶”概念,它不是任何一片具体的树叶,而是所有树叶的共同特征。
这种心理实在性的观点,让索绪尔的符号学跟当时的很多语言学理论都不一样。当时很多人觉得语言就是给事物贴标签,名称对应着事物本身。索绪尔说不对,语言不是给事物贴标签的简单系统,而是人类心理活动的复杂产物。
2.3 能指与所指的结合
索绪尔还强调了一件事:能指和所指是不可分割的,但又可以分离。
不可分割,是因为在实际使用中,我们不会把”狗”这个声音跟”狗”这个概念分开来理解。它们结合在一起,形成一个完整的符号。
可以分离,是因为在理论上,我们可以想象用别的符号来替代它。在中文里我们用”狗”,在英文里用”dog”,在法语里用”chien”,在日语里用”イヌ”——这些不同的能指指向相同的概念。这说明能指和所指的结合不是铁板一块,而是有一定的灵活性。
但这种灵活性又不是完全自由的。一旦一个语言社群确定了”狗”代表狗,你就不能随便改成”猫”代表狗,否则别人就听不懂了。所以符号的结合既有约定性,又有强制性。
三、符号任意性:为什么”狗”不是狗的样子?
3.1 任意性原则的核心
这是索绪尔最有名、也最让人震惊的观点:符号的能指和所指之间的关系是任意的。
换句话说,“狗”这个声音跟狗这种动物之间,没有必然的、本质的联系。你完全可以想象一个世界,那里的人用”猫”来称呼狗,用”汪汪”来称呼猫。这种语言完全可能存在,而且在逻辑上没有毛病。
这个观点之所以让人震惊,是因为它跟我们日常的直觉不太一样。我们从小被教导”狗就是dog”,“cat就是猫”,这些东西似乎是自然而然、天经地义的。但索绪尔说,不,这些都不是天经地义的,只是约定俗成。
索绪尔自己举了个很直观的例子:同样是表示”牛”这个动物,法语用”bœuf”,英语用”ox”,而拉丁语用”bos”。这三个词的发音完全不同,但指的都是同一种动物。反过来,中文的”牛”发音是”niú”,跟牛叫的声音也不太像。所以,能指和所指之间没有内在的、本质的联系。
3.2 不同层级的任意性
不过,索绪尔也承认,任意性不是铁板一块,它有强弱之分。
绝对任意性:某些符号的能指和所指之间几乎找不到任何理据性联系。比如”人”、“山”、“水”这些基本词汇,它们的发音跟这些事物的特征没有明显关联。
相对可论证性:某些符号的能指和所指之间存在一定程度的联系。比如拟声词,“bang”听起来像爆炸声,“crack”像断裂声,“whisper”像低语声。但这种联系也不是绝对的——不同语言对同一声音的模仿方式还是不一样的。英语的”moo”是牛的叫声,中文是”哞”。
复合词的理据性:由多个语素组成的词,有时可以从组成部分推断出整体意义。比如英语的”sunflower”(向日葵),由”sun”(太阳)+ “flower”(花)组成,你可以从字面推断它是一种像太阳的花。这种理据性让词汇更容易理解和记忆,但它的基础仍然是那些基本符号之间的任意性结合。
3.3 任意性不等于个人任意
这里有个容易搞混的地方:符号的任意性不是说你可以随便创造新符号来代替旧符号。
索绪尔强调,符号一旦在语言社群中确立,就具有了社会强制性。你不能自己发明一个词来表示”狗”,然后指望别人理解你。你必须遵守社群已经建立的符号规则,否则你的表达就没人能懂。
所以,任意性指的是符号起源的任意性,而不是符号使用时的任意性。符号可以”任意地”被创造出来,但一旦被社群接受,就必须被共同遵守。
3.4 任意性的哲学意义
符号任意性原则的提出,有几个重要的哲学含义:
第一,反对自然主义。如果符号意义是自然必然的,那就意味着词语天然地、内在地对应着事物的本质。但索绪尔说不对,符号意义是社会建构的,是人类约定的产物。这意味着不同的社群可以有不同的符号系统,而没有哪个系统天然地比其他系统更”正确”或更”真实”。
第二,强调约定的力量。符号的任意性不是说符号没有意义,而是说符号的意义来自于社群成员的共同认可。一个人可以创造符号,但只有被社群接受,符号才有意义。这让我们意识到,语言是一种社会活动,意义是社会性地生产出来的。
第三,语言相对论的雏形。既然不同语言用不同的方式切分世界,那么使用不同语言的人可能会有不同的思维方式。这启发了后来的萨皮尔-沃尔夫假说,虽然索绪尔本人并没有走得那么远。
四、差异原则:意义来自差异
4.1 “红”不是因为红本身
你有没有想过,“红色”为什么是红色?
不是因为红色本身有什么固定的、本质的属性让它成为红色。在索绪尔看来,“红”之所以是”红”,是因为它不是”绿”、不是”蓝”、不是”黄”……是因为它在颜色系统中占据了独特的位置,跟其他颜色区分开来。
这就是索绪尔的差异原则:在语言中,只有差异,没有绝对项。
每个符号的意义不是由它本身决定的,而是由它与其他符号的关系决定的。你理解”高”这个词,不是因为”高”本身有什么固定含义,而是因为你把它跟”矮”、“低”、“中等”等词区分开来。“父亲”的意义也是通过跟”母亲”、“儿子”、“女儿”等词的区别来确定的。
这个观点很反直觉,但细想一下确实有道理。如果每个词的意义都是独立自足的,那你怎么解释近义词的存在?“快乐”、“高兴”、“开心”、“愉快”——这些词的意思都很接近,但它们不是完全相同的。你之所以能区分它们,是因为每个词在语义网络中占据了不同的位置,跟不同的词产生不同的关系。
4.2 语音层面的差异
差异原则在语音层面表现得最明显。
英语里,/b/ 和 /p/ 是两个完全不同的音位。“bat”(蝙蝠)和”pat”(拍)只差一个辅音,但意思完全不同。这个区别完全是由 /b/ 和 /p/ 之间的差异造成的——一个是浊音,一个是不送气清音。
但问题来了:/b/ 本身有什么固定的意义吗?没有。它本身不表示任何东西,它的意义完全来自于它跟 /p/、/t/、/k/ 等音的区别。
法语里更极端一点:法语没有送气和不送气的区别,所以法国人发 “park” 的 /p/ 时,跟英语母语者发 /b/ 时听起来差不多。中国人学法语的时候经常被这个问题困扰,因为普通话里有送气和不送气的区别,我们能区分但法国人不一定能区分。
这说明什么?说明音位的划分本身就是语言系统的产物,而不是客观物理事实的自然反映。同一个物理声音,在不同语言系统里可能被归为同一个音位,也可能被归为不同的音位。
4.3 词汇层面的差异
差异原则在词汇层面也到处可见。
“红”的意义不是红色本身具有什么神秘属性,而是它在颜色系统中的独特位置。当你学会说”这是红色”的时候,你实际上是在学会把某个颜色区域从其他颜色中区分出来。
反过来,如果你处在一个没有区分”红”和”橙”的文化里,你可能就意识不到这两种颜色的区别。俄语里有”синий”(深蓝色)和”голубой”(浅蓝色)的区分,俄罗斯人从小就学会区分这两种蓝色,而很多其他语言的使用者一辈子都分不清这两种蓝色之间的界限。
这说明什么?说明我们感知世界的方式深受语言系统的影响。语言不只是被动地给事物贴标签,它还主动地塑造我们感知和理解世界的方式。
4.4 句法层面的差异
差异原则还延伸到语法和句法层面。
汉语的”我打你”和”你打我”通过主语和宾语的位置来区分。主语在前,宾语在后,这是汉语的基本语序。
英语也是类似的语序:“I hit you” 和 “You hit me” 意义完全不同,靠的就是词序。
但日语就不同了,日语的主要信息在句尾,语序相对自由,主语省略也很常见。所以同样的意思,日语可以说”私があなたを叩く”(我打你),也可以说”あなたを私が叩く”,语序变了但意思基本不变。
这说明什么?说明语法范畴(主语、宾语等)本身不是客观的存在,而是语言系统差异性建构的产物。不同的语言用不同的方式把句子切分成不同的组成部分。
4.5 差异性与系统性
差异原则揭示了一个重要事实:语言是一个系统,而不是一堆孤立符号的集合。
符号的意义来自它们之间的相互关系,整个语言系统就像一张巨大的网,每个符号都是网上的一个节点。任何节点的变化都会影响其他节点的位置。
这意味着,语言不能被还原为符号与事物之间的简单对应。语言是一个自足的系统,有自己的运作逻辑和内部规律。理解一个符号,不能只看它对应什么事物,还要看它在系统中的位置以及它与其他符号的关系。
五、语言与言语:系统与使用
5.1 为什么需要这个区分?
索绪尔提出的另一个重要区分是**语言(Langue)和言语(Parole)**的区分。
这个区分的提出,源于索绪尔对”语言学到底应该研究什么”这个根本问题的反思。在他之前,语言学往往把各种东西混在一起研究:具体的发音、词汇的使用、语法规则、历史演变……什么都研究,结果什么都没研究清楚。
索绪尔说,我们得把这些东西分开来。语言学应该把重点放在语言系统上,而不是具体的语言使用上。
5.2 语言是什么?
语言(Langue),简单说就是语言的社会性规约系统。
它有以下几个特点:
- 社会性:语言不是个人创造的,而是整个社群共享的。你出生在一个说中文的家庭,从小习得中文,而不是发明中文。
- 规约性:语言有明确的规则,这些规则是约定俗成的,不是某个人制定的。语法规则、音位规则、拼写规则——这些规则一旦确立,就具有强制性。
- 系统性:语言不是一堆散乱的词汇和规则,而是一个有机的系统。各个组成部分相互关联、相互制约。
- 稳定性:相对于个人言语的变化无常,语言系统是稳定的。你昨天说的中文和今天说的中文,基本结构是一样的。
5.3 言语是什么?
言语(Parole),简单说就是语言的具体使用行为。
它有以下几个特点:
- 个人性:言语是个人发出的行为,每个人说话的嗓音、习惯、用词都有个人特色。
- 暂时性:言语行为发生在特定的时刻,说完就没了(除非被录音记录下来)。
- 复杂性:言语行为涉及很多非语言的因素——心理活动、身体动作、语境条件……这些都让言语变得复杂无比。
- 创造性:虽然语言系统是稳定的,但言语使用可以有创造性。我们可以用现有的语言材料表达全新的意思,甚至创造出新的词汇和表达方式。
5.4 这个区分有什么意义?
语言/言语的区分,让语言学的研究对象变得清晰了。
索绪尔认为,语言学应该首先研究语言(系统),因为这是言语得以运作的基础。没有共同的语言系统,言语行为就无法被理解——你说的话之所以能被听懂,是因为你和听话者共享同一套语言规则。
当然,言语也很重要。语言的变化往往起源于言语中的创新,新的词汇和表达方式最初都是在言语中出现,然后慢慢被语言系统吸收。但索绪尔认为,语言学应该先搞清楚语言系统的结构,然后再去研究言语的变化。
这个观点影响了后来的很多语言学家,最著名的就是乔姆斯基。乔姆斯基把”语言能力”(competence)和”语言运用”(performance)区分开来,类似于索绪尔的语言/言语区分,只不过他更加强调语言能力(语法知识)的重要性。
5.5 对人工智能的启示
语言/言语的区分对人工智能有重要启示。
当你跟一个聊天机器人对话的时候,你实际上是在跟它共享的”语言系统”打交道。这个”系统”可能是基于大规模语料训练得到的统计模型,也可能是基于规则的人工设计。无论如何,机器人之所以能跟你对话,是因为它内部有一个跟你类似的语言知识结构。
但机器人对你具体说的话的理解,还取决于语境——这就是”言语”层面的东西。同一句话在不同语境下意思可能完全不同。“今天天气不错”在普通对话中是陈述天气,在面试场合可能暗示”我们可以开始了”,在谈判桌上可能暗示”时间差不多了”。
所以,理解语言不能只看系统规则,还得看具体的使用情境。这就是为什么语境建模(context modeling)成为现代NLP的核心课题之一。
六、共时性与历时性:快照与电影
6.1 两种看待语言的方式
索绪尔提出的另一个重要区分是**共时性(Synchrony)和历时性(Diachrony)**的区分。
共时性指的是特定时间点的语言状态。就像你给语言拍了一张快照,记录下某个时刻语言的完整面貌。
历时性指的是语言随时间的历史演变。就像你拍了一部电影,记录下语言从过去到现在是怎么变化的。
6.2 共时性研究
共时性研究关注语言在某一时期的系统状态。
比如,你可以研究21世纪初的汉语普通话,分析它的声母、韵母、声调系统,语法结构,核心词汇……这些就是共时性研究。
共时性研究的优势在于,它可以把语言当作一个相对稳定的系统来考察,分析各个组成部分之间的相互关系。这种研究方法适用于语言描写、语言教学、跨语言比较等任务。
6.3 历时性研究
历时性研究关注语言的历史演变。
比如,你可以研究汉语从古代汉语到现代汉语经历了哪些变化——语音怎么变的、词汇怎么变的、语法结构怎么变的……这些就是历时性研究。
历时性研究的优势在于,它可以看到语言变化的过程和规律,揭示语言的演变机制。这种研究方法适用于历史语言学、比较语言学、语言类型学等领域。
6.4 为什么要区分?
索绪尔强调,共时性研究和历时性研究必须严格区分,不能混在一起。
为什么?因为这是两种完全不同类型的事实。
当你研究某个时间点的语言系统时,你看到的是一张静态的快照,各个要素之间的关系是共时的、并列的。
当你研究语言的历史演变时,你看到的是一个动态的过程,要素之间的关系是历时的、前后的。
把这两个东西混在一起,就像把照片和电影放在同一个维度里分析,会导致混乱。
6.5 两种研究的互补性
不过,后来的语言学家也指出,共时性研究和历时性研究其实可以互补。
一方面,语言的历史演变会留下痕迹。今天的语言结构往往残留着历史演变的印记。比如英语里不规则的动词变化(go/went, see/saw)就是不同时期规则混杂的结果。
另一方面,语言的使用情境本身也有时间维度。语言学里有个”语法化”(grammaticalization)的概念,指的是实词慢慢变成虚词的过程——比如”will”从表示”想要”的意思演变成表示将来时态的助动词。这个过程既有历时性,又有共时性。
所以,虽然索绪尔的区分在理论上很有价值,但在实际研究中,我们往往需要把两种视角结合起来。
七、句段关系与联想关系:组合与选择
7.1 两种组织符号的方式
索绪尔还提出了**句段关系(Syntagmatic Relations)和联想关系(Paradigmatic Relations)**的区分。这两种关系描述了符号在语言中是如何组织的。
句段关系是符号在话语中的线性组合。符号一个接一个地排列,形成时间上的序列。你说的话、写下的句子,都是符号的线性排列。
联想关系是符号在心理联想中的选择关系。当你在某个位置使用一个符号的时候,你的脑子里会同时浮现其他可以替代它的符号,这些符号基于某种相似性组成一个潜在的集合。
7.2 句段关系:怎么组合?
句段关系也叫组合关系,它描述的是符号如何组合成更大的单位。
线性特征:符号在话语中依次出现,形成时间或空间上的线性序列。你不能同时说两个词,必须一个说完再说另一个(除非你是饶舌歌手在玩文字游戏)。符号之间有顺序关系,改变顺序往往改变意义。“狗咬人”和”人咬狗”意思完全不同,靠的就是词序。
层次组合:句子由词组成,词由语素组成,语素由音位组成。每一层都是下一层的组合。比如英语单词”unhappiness”由三个语素组成:un-(否定前缀)+ happy(形容词词根)+ -ness(名词后缀)。汉语的”现代化”由三个语素组成:现-代-化。
组合规则:不是所有符号都可以随意组合。组合要遵循语法规则。英语里可以说”big house”(大房子),但不能说”bigly house”。汉语里”我吃饭”是合法的,“饭吃我”虽然语法上有点怪但也勉强能懂,但如果说”*饭吃我睡觉”就不太对了。句段关系不是简单的线性排列,而是有结构层次的。
7.3 联想关系:怎么选择?
联想关系也叫聚合关系,它描述的是符号的选择和替换。
心理联想:当你使用一个符号的时候,你的脑子里会同时浮现其他相关的符号。看到”苹果”,你会想到”梨”、“香蕉”、“葡萄”等水果;看到”奔跑”,你会想到”走路”、“跳跃”、“游泳”等同类动词。
选择替换:在特定的句法位置上,可以用某些符号替换另一些符号。比如在”我喜欢____“这个句子里,你可以说”我喜欢读书”,也可以说”我喜欢运动”、“我喜欢音乐”、“我喜欢旅行”。这些不同的词都可以填在那个位置,但表达的意思不同。
相似性基础:联想关系基于符号之间的某种相似性——意义的相似性、语音的相似性、或者功能的相似性。“狗”和”狼”意义相似,“狗”和”cat”语音相似,“狗”和”猫”功能相似(都是宠物)。
7.4 两种关系的区别
| 维度 | 句段关系 | 联想关系 |
|---|---|---|
| 存在方式 | 实际出现在话语中 | 潜在于语言系统中 |
| 关系性质 | 组合关系(怎么组合) | 选择关系(怎么选择) |
| 线性特征 | 线性展开 | 非线性联想 |
| 分析维度 | 横向(in praesentia) | 纵向(in absentia) |
| 核心问题 | 这个位置放什么? | 这个位置还能放什么? |
7.5 对语言学习的启示
句段关系和联想关系的区分,对语言学习很有启发。
句段关系训练:帮助你掌握正确的语言组合规则。你得知道词和词怎么搭配,句子的结构怎么组织。比如学英语,你要学会说”take a shower”(洗澡),而不是”make a shower”;要说”watch TV”,而不是”see TV”。这些搭配规则就是句段关系。
联想关系训练:帮助你建立词汇网络,提高词汇选择能力。你得知道在某个情境下,有哪些词可以用,它们的细微差别是什么。比如要表达”看”的意思,英语里可以用look、see、watch、view、observe等词,每个词的用法和含义都有差别。掌握这些差别,就是掌握联想关系。
现代的语言教学往往强调语境的重要性。语境其实就是句段关系——在什么上下文中使用什么词。词汇量不只是知道多少词,还包括知道这些词在什么情况下可以用、跟什么词搭配、替换成别的词会有什么不同。
八、符号价值:符号的意义在于它不是什么
8.1 价值与意义的区别
索绪尔提出了一个深刻的问题:符号的价值(Value)不等于符号的意义(Meaning)。
你可能会说,这两个东西难道不是一回事吗?“狗”这个词的意义不就是”狗”吗?“狗”的价值不也是”狗”吗?
索绪尔说,不对。这两者虽然相关,但不是同一回事。
**意义(Signification)**是符号所指向的概念,是符号的心理内容。当你听到”狗”这个词的时候,你想到的是狗这种动物——四条腿、尾巴、会叫、能当宠物……这些内容就是”狗”的意义。
**价值(Value)**是符号在系统中的相对位置,是符号与其他符号的关系。“狗”的价值取决于它不是什么——不是猫、不是鸟、不是鱼、不是昆虫……只有在跟其他动物的区分中,“狗”才能获得自己的价值。
8.2 价值的相对性
索绪尔用了一个很精彩的比喻来说明这个问题。
一枚法国法郎的价值,不完全取决于它的金币含量(即它的”内在价值”),还取决于它能换来多少其他货币、购买多少其他商品。在货币系统中,法郎的价值是相对于法郎、美元、马克、日元等所有其他货币而言的。
符号的价值也是类似的。不完全取决于符号指向什么概念,还取决于它能替换什么、不能替换什么,在语言系统中占据什么位置。
英语里的”sheep”和”mutton”都跟羊有关,但”sheep”是活着的羊,“mutton”是羊肉。这两个词的价值差异不只是意义的差异,还包括它们在语言系统中的位置不同。“mutton”可以出现在”eat mutton”中,但不能说”see a mutton”;“sheep”可以出现在”see a sheep”中,但不能说”eat a sheep”。价值是关系性的,由系统中的差异决定。
8.3 价值的系统依赖性
这个观点进一步强化了索绪尔的系统性思想:符号的价值依赖于整个语言系统。
你不能单独理解任何一个符号,必须把它放在系统中、放在它与其他符号的关系网络中才能理解它的价值。
这就像下棋。你不能单独理解”车”这个棋子的价值——它是强是弱、该走哪步,都取决于整个棋盘的局面、取决于其他棋子的位置、取决于对手的可能走法。孤立地说”车比象强”或”车比象弱”都是没有意义的。
语言符号的价值也是如此。你不能单独地说“‘红’是什么意思”,你得说“‘红’在汉语颜色系统中的位置是什么,它跟其他颜色词的关系是什么”。
九、索绪尔 vs 皮尔斯:两种符号学传统的对比
9.1 两位符号学的开创者
说到符号学,不能不提皮尔斯(Charles Sanders Peirce, 1839-1914)。他是美国的哲学家、逻辑学家,跟索绪尔是同时代人,但两人的学术背景、研究方向、理论风格都很不一样。
索绪尔是语言学家,关心语言系统的结构;皮尔斯是逻辑学家,关心符号推理的过程。
索绪尔强调符号的静态结构;皮尔斯强调符号的动态解释。
这两种传统后来被称为结构主义符号学(以索绪尔为代表)和实用主义符号学(以皮尔斯为代表)。
9.2 符号的定义
索绪尔把符号定义为能指和所指的结合体。能指是物质形式,所指是心理概念。符号就是这两者的结合。
皮尔斯把符号定义为符号载体(Representamen)、**对象(Object)和解释项(Interpretant)**的三元关系。符号载体是符号的外在形式,对象是符号所指向的事物,解释项是符号在解释者心中产生的效果。
这两个定义看起来差不多,但侧重点不同。索绪尔的定义强调符号的主观-心理维度;皮尔斯的定义强调符号的逻辑-功能维度。
9.3 符号的分类
索绪尔没有对符号做详细的分类。他的理论主要关注语言符号,语言符号都是同质的——能指和所指的结合。
皮尔斯则发展出了一个庞大的符号分类体系。他根据符号载体与对象的关系,把符号分为三类:
- 图像符号(Icon):符号载体跟对象有相似性。比如照片、地图、漫画。
- 指示符号(Index):符号载体跟对象有因果或空间关联。比如烟指示火、风向标指示风向。
- 象征符号(Symbol):符号载体跟对象的关系是约定俗成的,没有内在的相似性或关联。比如语言符号、国旗、婚礼上的戒指。
这个分类影响很大,到现在还是符号学里的基本概念。我们可以说,语言符号主要是象征符号,但也可以包含图像符号(比如拟声词)和指示符号(比如代词”这”、“那”)的元素。
9.4 意义的生成
索绪尔认为意义来自差异——符号的意义由它与其他符号的差异决定。意义是系统性的、结构性的。
皮尔斯认为意义来自解释——符号的意义在于它被解释成什么。意义是动态的、无限的。一个符号可以产生无穷无尽的解释项,每个解释项又可能产生新的符号,形成一个无限延伸的意义链条。
这两种观点都有道理,只是侧重点不同。索绪尔让我们看到,语言系统如何通过差异建构意义;皮尔斯让我们看到,意义如何在解释过程中不断生成。
9.5 两种传统的融合
后来的符号学发展,往往是这两种传统的融合。
比如罗兰·巴特(Roland Barthes)的符号学理论,就是把索绪尔的结构主义方法跟皮尔斯的符号分类结合起来,用来分析大众文化中的符号现象。他写的《神话学》就是用符号学方法分析广告、电影、时尚等文化现象的经典之作。
在人工智能领域,这两种视角也都有应用。结构主义的方法启发了很多知识表示和语义网络的工作;皮尔斯的符号分类则被应用在多模态学习、视觉推理等领域。
十、索绪尔对现代语言学的影响:结构主义的兴起
10.1 结构主义的诞生
索绪尔的语言学理论是结构主义的直接理论来源。
“结构主义”这个名字听起来很学术,但其实它描述的是一种思维方式:整体大于部分之和,系统的性质不能还原为要素的性质,要素的意义由其在系统中的位置和关系决定。
这种思维方式在20世纪上半叶横扫了整个人文社科领域。语言学、人类学、文学理论、哲学、精神分析……到处都是结构主义的身影。
10.2 结构主义语言学的流派
索绪尔之后,结构主义语言学分成了几个主要流派:
布拉格学派:以特鲁别茨科伊(Nikolai Trubetzkoy)和雅科布森(Roman Jakobson)为代表。他们发展了索绪尔的音位学理论,提出了”音位系统”的概念,强调音位的区别性特征。布拉格学派对20世纪的语言学影响巨大,连乔姆斯基的生成语法都深受其影响。
哥本哈根学派:以叶尔姆斯列夫(Louis Hjelmslev)为代表。他发展了索绪尔的理论,提出了”语符学”(glossematics)理论,试图建立一种更加形式化的语言科学。
美国描写语言学:以布龙菲尔德(Leonard Bloomfield)为代表。虽然布龙菲尔德本人受行为主义影响很大,但他的语言描写方法还是体现了结构主义的精神——关注语言形式而非意义,注重分布分析。
10.3 结构主义向其他领域的扩展
结构主义很快就从语言学扩散到其他领域。
**列维-斯特劳斯(Claude Lévi-Strauss)**把结构主义方法应用到人类学上,分析神话、亲属关系、图腾制度等人类社会现象的结构。他的《神话学》系列是结构主义人类学的代表作。
**拉康(Jacques Lacan)**把结构主义方法应用到精神分析上,用索绪尔的符号学来重新解释弗洛伊德。他的名言”无意识像语言一样结构化”直接借用了索绪尔的观点。
罗兰·巴特把结构主义方法应用到文学批评上,分析文本的结构和意识形态功能。他的《S/Z》和《文本的愉悦》是文学理论的重要著作。
**福柯(Michel Foucault)**虽然不自称结构主义者,但他早期的考古学方法深受结构主义影响。他对知识史的分析,强调知识结构的历史变迁,很像索绪尔的共时性/历时性区分。
十一、结构主义与AI:语言的结构如何被计算机理解?
11.1 结构主义对NLP的启发
索绪尔的结构主义思想,对人工智能、特别是自然语言处理(NLP)有深刻的启发。
第一,意义的系统性。索绪尔告诉我们,词的意义不是孤立的原子,而是语言系统中的关系性存在。这启发了词向量模型的发展。词向量(word embeddings)就是用数学方式表示词与词之间的关系——语义相近的词在向量空间中距离相近,语义相反的词距离较远。这种表示方法抓住了意义的系统性特征。
第二,差异性原则。索绪尔强调,符号的意义来自差异。这个观点启发了语言模型对上下文的依赖。一个词的意义取决于它在特定上下文中的用法,而不是它的字典定义。现代的大语言模型(如GPT系列)之所以能理解自然语言,很大程度上是因为它们学会了根据上下文来确定词的意义。
第三,组合性原理。索绪尔指出,语言符号可以按照规则组合成更大的单位。这个”组合性原理”(Principle of Compositionality)是语义学的核心原则之一。它说的是:一个表达式的意义由其组成部分的意义和组合方式决定。NLP中的句法分析、语义解析等技术,都建立在这个原理之上。
11.2 结构主义与知识表示
结构主义对知识表示(Knowledge Representation)也有重要影响。
**语义网络(Semantic Networks)**用节点和边来表示知识,节点表示概念,边表示概念之间的关系。这直接体现了索绪尔的结构主义思想——概念的意义由其在网络中的位置和关系决定。
**知识图谱(Knowledge Graphs)**是语义网络的企业级应用,被Google、百度等公司用来增强搜索结果。知识图谱中的实体和关系,也体现了结构主义的原则。
**形式概念分析(Formal Concept Analysis)**是一种基于格论(Lattice Theory)的知识表示方法。它用概念格来表示概念之间的包含关系和层次结构,跟索绪尔的语言系统观念有相通之处。
11.3 认知语言学的补充
当然,结构主义不是万能的。认知语言学家批评了索绪尔的某些观点,特别是任意性原则。
Lakoff和Johnson的概念隐喻理论指出,很多语言表达其实不是任意的,而是基于身体经验和概念结构。比如”时间就是金钱”这个隐喻,让我们用金钱的概念来理解和谈论时间。“花时间”、“浪费时间”、“存时间”这些表达都是这个隐喻的具体应用。这些隐喻不是任意的,而是有认知基础的。
Langacker的认知语法认为,语法结构本身也是有意义的,而不是索绪尔所说的任意性符号。语法范畴(主语、宾语、时态等)反映了基本的认知范畴。
这些批评并没有推翻索绪尔的理论,而是丰富和修正了它。它们让我们看到,语言既有系统性、结构性的一面,也有体验性、认知性的一面。
十二、后结构主义对AI的启示:解构与意义的不确定性
12.1 后结构主义的挑战
20世纪60年代以后,以德里达(Jacques Derrida)为代表的后结构主义开始挑战索绪尔的理论。
德里达的核心观点是:文本之外别无他物(There is nothing outside the text)。这句话的意思不是说世界上只有文本,而是说我们所理解的”现实”、“真理”、“意义”,都是通过文本和符号建构出来的。没有纯粹的、未被符号中介的”现实”供我们去把握。
这个观点对结构主义造成了巨大冲击。结构主义认为,语言是一个稳定的、结构化的系统,意义可以通过分析这个系统来把握。后结构主义则认为,语言是一个开放的、延异的游戏,意义永远是延宕的、扩散的、不确定的。
12.2 德里达的解构
德里达提出的**解构(Deconstruction)**方法,就是要揭示文本中被压抑的边缘因素,暴露文本内部的矛盾和张力。
解构不是简单的”拆解”或”否定”,而是一种细致的阅读方式。它关注的是:文本在强调某些意义的同时,压抑了哪些意义?文本声称的”中心”如何被边缘所支撑和颠覆?
比如,索绪尔的能指/所指区分强调两者结合成符号。但德里达会问:能指和所指的边界真的那么清晰吗?所指难道不需要通过能指来表达吗?那么,所指不也是一种特殊的能指吗?这个区分本身就存在裂缝。
12.3 对AI的启示
后结构主义的观点,对人工智能有以下启示:
意义的不确定性。后结构主义提醒我们,意义不是固定的、确定的,而是依赖于语境、文化、权力关系的。如果AI要真正理解自然语言,就必须考虑这种不确定性,而不是简单地”匹配”到字典定义。
权力与意识形态。后结构主义关注语言中的权力运作——谁的声音被放大,谁的声音被压抑?什么知识被当作”真理”?这提醒AI研究者和使用者,要警惕算法可能内置的偏见和意识形态。
解释的多元性。后结构主义认为,一个文本可以有多种合法的解释,不存在唯一的”正确”解读。这对AI的”理解”提出了挑战:如果人类都无法就一个文本的”正确”意义达成共识,AI又如何能声称”理解”?
当然,这些哲学问题不会阻止AI在实际应用中的成功。但理解这些问题,可以帮助我们更清醒地认识AI的能力边界,避免对AI的过度拟人化或过度信赖。
十三、动手实验:用索绪尔的符号学视角分析网络流行语
13.1 理论联系实际
说了这么多理论,让我们来点实际的。下面我们用索绪尔的符号学视角来分析几个常见的网络流行语,看看这套理论到底有没有解释力。
13.2 案例一:“yyds”(永远的神)
“yyds”是2021年前后火遍全网的一个缩写,最初来自电竞圈,后来扩散到各个领域。
符号分析:
- 能指:四个字母的发音或形状,可以读作”歪歪滴艾斯”或”WANG WANG DEI SI”(按中文谐音)
- 所指:“永远的神”,表示对某人或某事物的极度赞美和崇拜
- 任意性:这个符号的能指和所指之间的关系完全是任意的、约定俗成的。你完全可以发明一个新词”wfds”来表示同样的意思。区别在于”yyds”被社群接受了,而其他缩写没有。
差异原则:
- “yyds”跟”厉害”、“绝了”、“太牛了”等表达有差异
- 差异不仅在于形式,还在于语义色彩和语用功能。“yyds”带有更强烈的、饭圈化的情感色彩
句段关系:
- “yyds”可以在句中使用,如”这个演员真是yyds”
- 也可以单独成句,表示强烈的赞叹
联想关系:
- 看到”yyds”,会联想到其他网络缩写:xdm(兄弟们)、nsdd(你说得对)、srds(虽然但是)等
- 这些词构成了一个”网络用语”的联想集合
13.3 案例二:“内卷”
“内卷”本来是人类学的学术术语,指的是一种社会或文化模式的内部竞争状态。后来被网友挪用,变成了网络流行语。
符号分析:
- 能指:两个汉字”内卷”
- 所指:原本指文化模式的僵化,现在泛指过度竞争、无意义的内部消耗
- 意义漂移:这是索绪尔理论的绝佳案例。同一个能指,在学术语境和日常语境中指向不同的所指。这种意义的变化,展示了符号的价值如何依赖于语境和系统。
差异原则:
- “内卷”和”竞争”、“内耗”有差异
- “内卷”强调的是那种”明明已经很卷了但谁都无法退出”的无奈感,而”竞争”和”内耗”没有这种语义色彩
语言/言语:
- “内卷”最初是学术界的语言(langue),被网友挪用后变成日常言语中的表达
- 这个词语义的扩散和演变,是言语层面的创新被语言系统吸收的过程
13.4 案例三:“躺平”
“躺平”是2021年的另一个爆款网络词。
符号分析:
- 能指:两个汉字”躺平”
- 所指:放弃过度竞争,选择低欲望、低消费的生活方式
- 理据性:这个符号有一定的理据性。“躺下”和”平躺”确实暗示了一种不抗争、不努力的状态,跟”躺平族”的生活态度有形象上的联系。
隐喻分析(结合认知语言学):
- “躺平”背后有一个身体隐喻:人是直立的、站着的,代表努力、奋斗;而”躺平”则是倒下、平躺,代表放弃抗争
- 这个隐喻不是任意的,而是基于身体体验和空间概念
意识形态维度(结合后结构主义):
- “躺平”不只是描述一种生活状态,还承载着对当代社会压力、阶层固化的隐晦批评
- 对”躺平”的讨论和争议,本身就是一场关于价值观和意识形态的符号斗争
13.5 小结
通过这几个案例,我们可以看到索绪尔的符号学框架确实有很强的解释力。它帮助我们看到:
- 符号不是透明的:每个符号都有其形式、意义和价值,不是简单的”标签”
- 符号是系统的:符号的意义来自于它与其他符号的关系,孤立无法理解
- 符号是社会的:符号的价值由社群约定,变化和演进都是社会过程
- 符号是历史的:符号的意义会随着时间和语境变化,永恒的”本义”是不存在的
十四、结论
索绪尔的符号学理论,是20世纪最重要的知识遗产之一。
他的核心洞见可以归结为一句话:语言是一个差异性的系统,符号的意义来自符号之间的相互区分。这个洞见不仅改变了语言学的面貌,也深刻影响了哲学、文学、人类学、心理学等各个领域。
当然,索绪尔的理论不是完美的。后来的学者指出了它的很多问题:过分强调任意性而忽视了认知基础;过分强调结构而忽视了使用者的能动性;过分强调系统而忽视了历史和语境。但这些问题与其说是反驳,不如说是补充和修正。索绪尔的框架仍然是理解语言和符号现象的重要起点。
对于人工智能来说,索绪尔的理论提供了宝贵的思想资源。它提醒我们:
- 语言意义是系统性的,不能孤立看待
- 语境和关系对意义有决定性影响
- 语言是社会性的、约定性的知识
这些洞见在今天的NLP研究中依然有生命力。词向量模型捕捉语义关系,注意力机制建模上下文依赖,大语言模型学习语用规则——这些都是索绪尔思想的技术实现。
学习索绪尔,不是为了背诵几个概念,而是学会一种思维方式:从关系、结构、系统的角度去理解我们周围的意义世界。
参考文献
- Saussure, F. de. (1916). Cours de linguistique générale. Payot.(《普通语言学教程》)
- Saussure, F. de. (1959). Course in General Linguistics. (W. Baskin, Trans.). Philosophical Library.(英译本)
- Culler, J. (1976). Saussure. Harvard University Press.
- Harris, R. (1988). Language, Saussure and Wittgenstein. Routledge.
- Dosse, F. (1997). History of Structuralism (Vol. 1: The Rising Sign, 1929-1966; Vol. 2: The Sign Sets, 1967-Present). University of Minnesota Press.
- 费尔迪南·德·索绪尔. (1980). 《普通语言学教程》. 高名凯译. 商务印书馆.
- 姚小平. (2011). 《索绪尔研究》. 外语教学与研究出版社.
- 德里达. (1999). 《论文字学》. 汪堂家译. 上海译文出版社.
- 巴特. (2009). 《神话学》. 许蔷蔷, 许绮玲译. 上海人民出版社.
本文档为索绪尔符号学详解,涵盖能指/所指区分、任意性原则、差异性原则、语言/言语对立、共时性/历时性区分、句段关系/联想关系及结构主义基础。相关文档参见:皮尔斯符号学深度指南(Peirce semiotics comparison)、符号逻辑与AI(semiotics and AI applications)、符号系统理论(semiotic systems theory)、结构主义与AI(structuralism in computational linguistics)。