AI 文章已超过人类写作?“Slop”泛滥背后的语言与思考危机

AI 生成文章已超过人类写作,“slop”泛滥正在改变语言、思考与模型训练生态。

原文标题:AI生成文章数量已碾压人类!AI替你写了一切,你的大脑还剩什么?

原文作者:数据派THU

冷月清谈:

文章围绕 Graphite 对 CommonCrawl 的追踪研究展开:从 2024 年 11 月起,互联网上 AI 生成的英文文章数量首次超过人类写作内容,且 2025 年后长期稳定在 50% 以上。Merriam-Webster 将“slop”选为 2025 年度词汇,用来形容 AI 批量生成的低质内容。文章认为,AI 写作的风险不只是内容质量下降,更在于人类把表达外包给机器后,可能逐渐放弃通过写作整理思想的过程。另一方面,大模型依赖人类文本训练,当新内容越来越多来自 AI,自我训练可能导致“模型坍缩”,使输出更同质、更低质。文章最后提出一个值得警惕的中间状态:AI 未必完全取代人类思维,却足以让许多人不再主动思考。

怜星夜思:

1、如果 AI 能把文章写得又快又顺,人类还需要坚持自己写作吗?
2、AI 生成内容越来越多,会不会真的把互联网变成一个巨大的“低质内容池”?
3、所谓“模型坍缩”离普通用户远吗?我们平时用 AI 会受到影响吗?
4、未来判断一篇文章有没有价值,作者是不是“真人”会变得更重要吗?

原文内容

图片
来源:新智元
本文约2500字,建议阅读5分钟
2024 年 11 月,AI 生成的网络文章数量正式超过人类。Merriam-Webster 把「slop」选为 2025 年度词汇。当机器开始替人类说话,人类会不会忘记怎么思考?更麻烦的是,当人类停止书写,AI 用来学习的燃料也将一并耗尽。一场关于语言和思维的连环危机,正以多数人未曾警觉的速度展开。


数字营销机构 Graphite 在 2026 年 5 月发布了一项追踪研究,结论很刺眼,互联网上 AI 生成的英文文章数量,从 2024 年 11 月起正式超过了人类写作的文章。

ChatGPT 上线仅 12 个月,AI 文章就占到了全网发布量的 39%。

到 2025 年,这个比例稳定在 50% 以上,至今没有回落的迹象。

Graphite 从 CommonCrawl 数据库中随机抽取了 43000 篇文章,用 AI 检测算法逐篇扫描,误报率约 4.2%,漏报率仅 0.6%。

这还只是「纯 AI 生成」的口径。

那些 AI 起草、人类润色的「半成品」,根本没被计入。Graphite 在报告里坦承,这类内容可能更加普遍。

一个叫 Slop 的词,成了年度词汇

这股浪潮有了一个精准的名字。

Merriam-Webster 把「slop」选为 2025 年度词汇,专指那些 AI 批量生产的低质内容。

《纽约客》把 AI slop 比作 1919 年波士顿的大糖蜜洪水,储罐爆裂,两百多万加仑糖蜜灌满街区。清理花了好几周,地铁站数月后仍然黏脚。

AI slop 的黏性跟糖蜜如出一辙。

YouTube、Reddit、Facebook,到处都是机器生成的填充物。

文学评论家 Matthew Kirschenbaum 警告说,一场「textpocalypse」正在到来,未来人类亲手写下的文字,可能会变成挂在墙上的珍品,像银版照片一样稀有。

有意思的是,机器写作这件事远比想象中古老。

早在 1953 年,数学家 Christopher Strachey 就用曼彻斯特大学的计算机生成了情书,跟 Mad Libs 填词游戏没什么两样。

同一年,Roald Dahl 发表了短篇小说《伟大的自动语法机》,小说里一位工程师造了一台写故事的机器,一年之内就生产了英语世界一半的小说和故事。

Dahl 在结尾写道,「这让你惊讶吗?我怀疑不会。更糟的还在后面。」

七十年后,「更糟的」确实来了。

语言的边界,正在塌陷

AI slop 真正的危险,已经超出了内容质量的范畴。

它正在悄悄改变人类与语言的关系。

维特根斯坦在《逻辑哲学论》里写过一句被引用到烂的话,「我的语言的界限即是我的世界的界限」。

这句话在 AI 时代有了新的读法。

当一个人停止亲手写作,把表达外包给机器,缩小的不仅仅是技能,还有他的思维边界。

写作从来都不只是把想好的东西敲出来那么简单,写作的过程本身就是思考。

一个句子的措辞、一段论证的推进、一个比喻的选择,都在迫使写作者厘清自己到底想说什么。手指停下来的那一刻,这种厘清也就停了。

NYU 数字人文中心主任 Leif Weatherby 在《Language Machines》一书中提出了一个尖锐的观察,机器已经可以在没有理性参与的前提下生成语言,语言和理性被彻底解耦了。

他认为,冷战以来,「人文学科把语言拱手让给了认知科学和计算机科学」。

这段话听起来很学术,但落到每个人身上就是一件非常具体的事,当 ChatGPT 替你写完周报、替你回完邮件、替你编好朋友圈文案的时候,省下来的那些时间里,有没有人真的在「思考」?

还是说,省下来的只是思考本身?

意大利作家卡尔维诺 1967 年就期待过一种「真正的文学机器」,一种能自发制造混乱和创造力的机器。

但到今天,大语言模型生成的文字再精巧、再流畅,底色仍然是派生的、均值的、可预测的。用德国哲学家 Max Bense 的话说,这是「没有诗人的诗」。

养料正在枯竭

思维萎缩只是问题的一半。

另一半更隐蔽,也更致命。

大语言模型的能力来自海量人类文本。

互联网上几十年积累下来的文章、论文、小说、论坛帖子、代码注释,构成了训练这些模型的核心养料。

当越来越多的新内容由 AI 而非人类生产,这些养料正在被稀释。

这个问题在学术界已经有了名字,叫「模型坍缩」(model collapse)。

2024 年,《自然》期刊发表了一篇论文,指出当 AI 模型在自身生成的数据上反复训练时,输出的多样性和质量会逐代退化,最终坍缩为无意义的噪声。

https://www.nature.com/articles/s41586-024-07566-y

这跟近亲繁殖导致基因退化的逻辑几乎一模一样。

更要命的是,这两个问题会互相加速,形成一个飞轮。

AI 写得越多,人类写得越少。人类写得越少,AI 能学到的新鲜养料就越少。

养料枯竭让 AI 输出更加同质化,同质化的输出又进一步降低了人类亲自书写的动力。

转起来之后,要停下来就很难了。

Graphite 的数据也佐证了这一点。

虽然 AI 文章的占比自 2024 年 5 月以来基本持平,没有继续飙升,但这恰恰可能说明,容易被 AI 填充的生态位已经被填满了,剩下的缝隙也在被逐渐渗透。

终局

如果把视野拉到更远的地方,AGI 甚至 ASI 的终局会是什么样?

乐观者会说,超级智能一旦出现,它将拥有自主学习和创造的能力,根本不需要人类文本作为训练素材,上述飞轮会自动瓦解。

悲观者则认为,在那一天到来之前,人类可能已经在思维上严重退化,变成一个高度依赖 AI 输出的物种,到时候即使超级智能愿意交流,这边已经没有足够的理解力去接住它说的话了。

两种推演都可能太极端。

更值得警惕的是一种温水煮青蛙式的中间态,AI 没有强大到取代所有人类思维,但已经强大到让大多数人放弃了主动思考的习惯。

这个世界的语言没有消亡,只是变得越来越同质、越来越平庸、越来越缺乏那些只有在人类挣扎着组织语句时才会迸发出的意外和洞见。

Jill Lepore 引述 Leif Weatherby 的话,「有什么了不起的事情正在发生,我们能和机器对话了。但我们还没有找到描述这一转折的语言。真正的问题是,这个情节本该由人类来书写,但到目前为止,那个情节本身就是 slop。」

维特根斯坦说语言的边界就是世界的边界。

那么,当一种语言的生产者从碳基切换为硅基,这个世界的边界,是在扩展,还是在收缩?

Dahl 在 1953 年说,英语世界一半的小说已经出自机器之手。

「这让你惊讶吗?」他问。

2026 年,这句问话本身已经不带任何修辞色彩了。

参考资料:

https://www.newyorker.com/magazine/2026/05/25/the-prehistory-of-ai-slop

https://graphite.io/five-percent/more-articles-are-now-created-by-ai-than-humans

编辑:文婧



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU



真人当然重要,但也别搞成“碳基崇拜”。有些真人写得比 AI 还水。我的标准是:有没有具体观察、有没有反常识细节、有没有自己的判断。没有这些,真人写的也只是手工 slop。

2 个赞

我倒觉得没必要把“亲手写作”神圣化。古人还觉得打字毁书法呢。关键是人有没有判断力和审美。AI 写一版,你能看出哪里空、哪里假、哪里没逻辑,这也是一种能力。怕的不是 AI 写,怕的是你连好坏都分不出来。

1 个赞