死亡互联网理论
本文信息来源:kudmitry
以 HackerNews 的风格,我碰巧看到有人分享他们的开源项目。看到人们为自己的项目努力并决定向世界展示真是太好了。我认为人们低估了真正发布东西的恐惧——那意味着要把它分享给全世界。
一看到评论区,我就开始看到其他匿名参与者质疑该开源项目的真实性,怀疑其中有多少是由 AI 生成的。我拿出爆米花,开始跟着这条线索看下去。越来越多的指控开始出现:提交时间线不合理;代码里有 AI 生成的注释;等等。与此同时,作者试图回复每一条评论,声称他们百分之百是自己写的,未使用 AI。
我不介意人们用 AI 写代码,尽管我自己曾试图抵制,最终还是屈服了。但我认为披露使用 AI 是公平的,尤其是在开源软件中。互联网上的人大多是匿名的,通常无法核实某些个人的声明或专业知识。随着代码量的增长,考虑到每个人都在用 AI 生成他们想要的各种应用,我们不可能核实将要使用的每一段代码。所以我认为,知道某个项目是否由 AI 生成以及生成程度是公平的。归根结底,LLMs 只是概率性的下一个 token 生成器。尽管它们在大多数简单任务上变得非常擅长,但在更难的问题或边缘情形上,它们有可能造成严重后果(尤其是在没有具有领域知识的资深工程师来审查生成代码的情况下)。
在我跟进这个话题时,我开始看到一个模式:作者的评论也看起来像是 AI 生成的。
- 使用破折号——在大多数键盘上需要一个大多数人不知道的特殊组合键;在 Markdown 中两个短横会渲染为破折号,但 HackerNews 并非如此(因此你经常会在 HackerNews 评论中看到
--,作者可能习惯于 Markdown 渲染器把它变成破折号) - 臭名昭著的“你完全正确”,在我所知范围内以前从未有过任何活着的人这么说过
- 另一个臭名昭著的句末“如果你想[做那件事]或[探索另一件事],告诉我一声”
我坐在那里,不断刷新页面,看到作者在代码和评论中都被质疑使用了 AI,而作者却声称根本没用过 AI。老实说,我觉得自己快要疯了。我怀疑他们就错了吗?如果人们在现实生活中确实使用破折号呢?如果英语不是他们的母语,而在他们的母语中使用“你完全正确”这样的表达很正常呢?这真的是一个真人吗?那些发表评论的人是真的吗?
然后我恍然大悟。我们已经到达了死去的互联网 。死去的互联网理论声称,自大约 2016 年起(已经整整 10 年了),互联网主要已经死亡,也就是说大多数互动发生在机器人之间,大多数内容由机器生成,目的要么是卖东西,要么是为了在搜索引擎优化游戏中取胜(以便卖东西)。
我羞愧自豪地说,我把青少年时期的大部分时间都花在互联网上,和比我更有见识的真实人交流和学习。回到 2000 年代初,互联网上几乎没有机器人。普通非技术人对 phpBB 论坛一无所知,也不了解那些在里面混迹的用化名的怪人。我在 IRC 频道和 phpBB 论坛里花了无数小时,学习网络编程、操作系统开发、游戏开发,当然还有网页开发(这也成为我近二十年的职业)。我基本上是互联网大学的毕业生。那时没人怀疑自己在和真人交谈。没错,你可能以为自己在和一个性感女孩聊天,而实际上是个胖子,但嘿,至少他们是真实的!
但如今,我已经分不清什么是真实。我在领英上看到一张图片,来自一家真实的科技公司,发布关于他们“办公室氛围”和快乐员工的内容。然后我进了评论区,果不其然,这张图片是 AI 生成的(混乱不通的文字、奇怪的手部伪影)。它是由该公司的一名员工发布的,展示的是该公司的其他员工,却被 AI 修改成了另一种现实。见鬼,也许照片里的人根本不存在!
而这些还是轻微的例子。我不使用社交网络(不,HackerNews 不是社交网络),但我听到过关于 Facebook、Xitter、TikTok 上 AI 生成内容的可怕故事,从展示建造埃及金字塔的巨人照片,到漂亮女孩说欧盟对波兰不利的短视频,应有尽有。
那天我真的很难过。可以说是绝望。AI 容易被大众获取,使他们能够生成大量的 AI 垃圾。人们不再需要自己写评论或代码,他们只要把东西交给 AI 代理,就能生成下一个“你说得完全对”的杰作。
我喜欢科技。我喜欢软件工程,也喜欢互联网这个概念——人们可以在上面分享知识、创建社群。那时网络上有没有恶意行为者?当然有。但我今天所见,让我怀疑我们走向的未来是否还是一个科技有用的未来。或者更确切地说,那是一个机器人与机器人对话的未来,人类的知识只是被循环利用、重新包装成“解决你某个日常问题的10个步骤”,以便卖给你更多东西。