信息论奠基之作《通信的数学理论》中文版面世,本文解读其对科技的深远影响,并阐述翻译策略,降低理解门槛,邀您一同领略香农思想。
原文标题:信息论之父香农携手数学家韦弗,这本书极大地改变了人类科技发展的进程
原文作者:图灵编辑部
冷月清谈:
怜星夜思:
2、文章提到中文版翻译在“术语直白化”方面做了努力,例如将“destination”翻译为“目的地”而非“信宿”。你认为在翻译科技类书籍时,应该如何平衡专业性和可读性?有没有其他翻译策略可以借鉴?
3、文章最后提到“大语言模型(如 ChatGPT)也能在此书中找到身影”。你认为信息论在人工智能领域有哪些应用?未来又可能发挥什么作用?
原文内容
这篇文章并非一篇传统意义上的书评或译后说明,而是一封写给当代读者的阅读邀请函。作者以清晰而克制的笔触,回溯信息论奠基之作《通信的数学理论》诞生以来对人类科技文明产生的深远影响,并解释了这本经典为何在七十余年后的今天仍值得被重新阅读、重新理解。
更重要的是,文章系统地说明了中文版在翻译理念与表达策略上的取舍:如何在忠实原意的前提下,降低理解门槛,让非专业读者也能直接接近香农思想的核心。这不仅是一篇关于如何翻译一本经典的说明,更是一篇关于如何与大师思想相遇的方法论阐述。
本文作者李锡涵,现为伦敦大学学院计算机系博士研究生,同时也是 Google 开发者专家,《简明的 TensorFlow 2》作者。其研究方向聚焦于学习优化,并曾以第一作者身份在 NeurIPS、ICLR 等国际顶级会议发表多篇论文。兼具前沿科研训练与技术写作经验的背景,使他既能准确把握信息论原著的学术脉络,又能以现代读者熟悉的语言,搭建起通往经典的桥梁。
希望本文能对各位读者有所启发!
“毫不夸张地说,本书极大改变了人类科技发展的进程。
是的,这不仅是一本介绍通信理论的小册子-它就是通信理论本身。1948年,香农发表了划时代的论文《通信的数学理论》,首次提出了基于信息熵的通信理论。
次年,该论文由伊利诺伊大学出版社以图书的形式出版,并一石激起千层浪,在随后的 70 多年里深刻影响了信息技术的发展。从电视机、手机、互联网等基础设施,到如今最前沿的人工智能和 5 G 通信技术,无不建立在香农提出的通信理论之上。
而这本看似单薄,实则重于泰山的信息论奠基之作,此刻正躺在你的手中。 76 年后的今天,在从伊利诺伊大学出版社引入版权后,此书的中文版终于得以和广大中国读者见面,可谓是一件幸事。
我在北京大学求学期间,主讲"信息论"课程的王立威教授便强调,阅读原著是学习大师思想最直接的途径,而学习信息论的不二法门就是阅读香农的这一经典原著。相信本书中文版的出版能够更好地帮助广大读者入门和理解香农通信理论,并以最直接的方式领略香农提出本理论的思想洞察。
关于本书的中文翻译,鉴于本书内容对于信息论领域的专业学者而言已是基本常识,且香农论文的英文原版早已在学界充分传播,因此,本书的中文版将更多地发挥"普及思想"的作用,向大众传播香农及其通信理论中蕴含的思想。这一点与香农的论文发表后,伊利诺伊大学出版社依然决定出版此书的原因,即 "saw the opportunity in a version of the'Mathematical Theory'for the general public" 是一脉相承的。
为了让此书更易为一般读者所接受,本书原著出版时即增加了由沃伦•韦弗撰写的导言(),以尽可能通俗的语言对香农的理论进行解读。而为了让此书更易为广大中文读者所接受,本书在中文译文上同样做出了努力,着重于降低阅读门槛,减轻读者语言理解方面的负担,从而将精力更多地投人理解香农的思想之中。这主要体现在三个方面。
1.指代明确化。英语存在一些固有特性(多用代词、被动形式等),并且原文为发表于学术期刊的论文,用语相对简洁。因此,在部分句子中会有指代不够"明确直白"的情况。例如在 4.6 节对应的英文原版中有
The coefficient is the weighting factor introduced because this second choice only occurs half the time.
若直接翻译,可为:
系数 为引入的加权因子,因为第二阶段选择只在一半的情况下发生。
这固然十分"正确",但上式中其实出现了四个 ,读者可能需要思考片刻才能意识到指哪一个,同时"第二阶段选择"也并没有和上式形成非常明确的对应。
译文会适当地将指代加以明确,例如此处译为:
第二阶段选择的 前面有加权系数 ,因为只有一半的可能性会进行第二阶段选择。
这里首先明确了第二阶段选择对应的 是上式中的 ,然后明确了 是指上式中 前面的系数 。
同理,本书中的部分 it、they 等代词在翻译时也用这些代词所指的对象加以代替,一方面减轻了读者的心智负担(香农这里到底指什么),另一方面也更符合中文使用习惯(中文的代词使用相对较少,例如中文中使用"它"的频率远低于英文中使用 it的频率)。
2.术语直白化。当一个术语在中文里有多种表达形式时,译文倾向于选择较为直白、对普通读者而言不太陌生的表达,同时以注释或括号的形式附上该术语的其他中文表达形式。这一方面是为了减轻读者的心智负担(减少生僻词汇记忆需求),另一方面则是希望尽可能避免引发读者的畏难心理("啊,出现了如此高深的词语,后面的内容我应该看不懂了吧,不读了")。例如,本书将 destination 直译为"目的地",而非"信宿"。固然"信宿"是 destination 在信息论中的标准中文表达形式,与"信源"相对,且附带一种中文的古典美感。然而遗憾的是,此词并未在中文环境中广泛使用。若未修读过信息论,想必 的普通中文读者都不知道"信宿"这个词的含义。
因此,本书将"信宿"这一表达以括号形式标出,令读者了解但无须强迫记忆这一生僻词(对于大众而言)。最困难的术语翻译在于 ensemble of functions。这个概念在第3章之后大量出现,但在现代的信息论研究中并未寻找到太多中文参考资料。ensemble 在统计物理中是常用概念,并译为 "系综",因此将这个概念翻译为"函数系综"也并非不可。然而,系综一词在中文中几乎只用于统计物理,且统计物理的系综理论相当深奥。但香农这里其实只是想表达一个相对单纯的数学概念,即"一个具有概率测度的函数集"。因此,这里权衡之后,选择了根据定义进行意译,即"函数概率空间"。
3.增加注释。当文中不加说明地使用了一些普通读者不熟悉的概念或结论,或因为历史原因,文中的一些概念在现今已经不常用或含义发生变化时,本中文版谨慎地添加了一些注释。例如,在香农写作本论文的时代,电子计算机还在襁褓之中,人们仍在广泛使用电传打字机。因此当香农以电传打字机举例时,文中添加了一些注释,以帮助不了解电传打字机的读者了解背景。对于原文中部分可能的笔误或印刷错误,本中文版亦进行了修订,并于注释中说明原文内容。这些额外的注释在文中均以"译者注"的形式标出,以与原始文献中的注释做出显性区别。
当然,尽管做出了以上努力,本书专业性强的特点仍不会改变。读者需要付出一定量的精力进行思考,才能领会本书的思想所在。但我相信这样的付出是值得的。一方面,香农的思想在半个多世纪之后依然熠熠生辉,甚至新近兴起的大语言模型(如 ChatGPT)也能在此书中找到身影 。另一方面,在 20 世纪以来的重大理论成就中,恐怕本书是为数极少的、非专业学者也能阅读的"原本"。你与现代科学巨擘之间的距离,从未如此之近。即使你阅读本书只是为了消遣,也能获得一些有益的启发。比如,你应当可以明白,著名游戏《命运石之门》中 "将记忆压缩到 36 字节从而得以通过短信发出"的设定,为何值得商榷了。
特别感谢贺司衡和他的朋友对本书全文的认真校对,上海交通大学的程帆教授对本书的意见反馈(他在"哔哩哔哩"网站有很好的信息论课程,标题为"信息论课程-上海交大- 2020 春季学期",以及人民邮电出版社的王军花编辑对本书的细致编校与出版流程跟进。
李锡涵
于伦敦大学学院 2025年7月