返回首页
信息来源:generalist.com 2026.04.24 00:37 约 20 分钟 AI

作家与研究者的 Claude Code 指南:我是如何构建一套完整的知识管理系统的,以及它由此释放了什么潜能

朋友们:

大约三个月前的某个时候,我有了一个顿悟。对你们中的许多人来说,这听起来也许显而易见;而对另一些人来说,则可能荒谬可笑。

那就是:去年 12 月发布的 Claude 模型(此后还持续得到改进),带来了我有生以来个人能力最大的一次跃升。

iPhone 改变了我获取信息和理解世界的方式。社交网络改变了我沟通与交往的方式。无数应用和程序改进了我的工作流,拓宽了机会,加速了我的思考。毫无疑问,还有许多更为静默的进步,在我尚未察觉时就已改变了我生活的肌理——更好的药物和更高效的机器。

但若论一次单独而明确的跃升,没有任何其他事物可以相提并论。在 Opus 4.5——Claude 的冬季升级版——出现之前,我只在极少数情况下打开过电脑的终端,而且大多还是误打误撞。上一次我真正尝试使用它,还是在 2015 年于 General Assembly 参加的一门继续教育课程上;当时我手忙脚乱,笨拙得像一只操作印刷机的猕猴。

如今,我有超过70%的工作时间都是在终端里度过的。我构建软件、搭建系统,并开展大规模研究任务。智能体会解析数百篇文章,从中寻找与我的兴趣或写作目标一致的细节,并按我偏好的风格整理成报告。另一些则负责简化行政事务、查找漏洞、打磨细节,并将我脑海中的下一个功能部署上线。

其结果是,这套系统给人的感觉越来越不像只是多了一名员工,而更像是多了20名员工。

经营像 The Generalist 这样的业务,挑战之一在于你无法只扮演单一角色。坐在空白屏幕前开始写作,或许是最能给我带来快乐的事,但账单要付、日程要排、仪表盘要看、增长策略要部署、赞助商要权衡、邮件要发送。每一天,都是深度工作与经营一家企业的现实之间的拉锯战。一个无法回避的事实是,花在这些事情上的每一个小时,都是我无法花在自己最享受、也最能发挥优势的部分上的时间。

即便不谈这些格外琐碎的任务,也还有成千上万细小的烦扰与干扰。试着就某个人或某个主题展开深入研究,数一数其中有多少摩擦时刻。你会撞上多少道付费墙,明明那些刊物你早已购买?又会遇到多少弹窗广告或 Cookie 提示?那条刻意分散注意力的新闻轮播,会怎样在文章底部滚动不休?又会有哪段视频从侧边硬生生挤进来?如果你想在 LinkedIn 或 Twitter 上查看某人的背景资料,又会有多少红色通知像肿起的伤痕般跳出来?有多少私信在争夺你的注意力?信息流里又有多少新产品公告朝你大声叫嚷?当你只是想从 A 走到 B、从意图抵达信息时,究竟有多少贪婪的手指试图攫取你的注意力?

现代互联网已经变成了一座“注意力赌场”,而我们也早已习惯在其中工作,对叮当作响的老虎机和旋转的轮盘视而不见。但如果你的工作空间能更像一张安静的课桌,置于一间灯光明亮的图书馆中,会怎样?如果你可以派出 20 名虚拟员工,替你趟过现代网络的泥沼,并把结果交付到你手中,会怎样?如果你能减少物流式的琐碎协调与拉扯,把时间留给那件你不想交给 AI 替你完成的事,会怎样?如果你能将投入深度工作的时间翻倍,又会怎样?

过去几个月里,我一直在使用 Claude Code 亲自探索这些问题。最终形成的,是一套覆盖多款软件产品、内部系统以及本地模型的全栈知识管理系统。(我还构建过其他一些东西,但这是最简洁明了的提炼。)它并不完美,也未必适合所有人。在过去几个月里,我向朋友和家人展示这些系统时发现,这往往能帮助人们更好地理解,这些模型如今已经能够做到什么,以及你可以如何利用它们为自己所用。

几天或几周后,当我再次联系这些人时,常常发现他们也经历了类似的转变,从浅尝辄止变成了坚定拥趸。诚然,把过多事情外包出去——甚至包括思考本身——无疑存在风险,但到目前为止,我自己和其他人都还没有出现这种情况。相反,人们似乎正乐在其中,构建能够消除繁琐劳动、并明确贴合自己思维方式的系统和界面。相比那些为大众设计出来的应用,一个能凭直觉按照你的大脑运作方式工作的应用,在使用时竟会轻松、愉快如此之多,这实在令人惊叹。

如果你对这些工具感兴趣,我建议你先给自己设定一个目标:做出你能想到的最小可行的东西。随着你越来越习惯坐在终端前,你很快就会发现自己的野心也在增长。

说到这里,下面来看看我的这套系统,以及它如何改变了我的工作流程。

资料库

有一种特定的认知烦扰,不妨称之为“找东西”。你肯定经历过。那就是你不得不在做某件事的中途停下来,问自己:“啊,那个东西到底是什么来着?那个人说过的那个东西 ?我读过的那个东西 ?我写过的那个东西 ?我把它存在哪儿了?是在 Google Drive 里吗?Finder 能找到它吗?(并不能!)”

经营一家媒体公司的职业风险之一,就是东西实在太多了。有研究资料、播客资料、文章资料、笔记资料、PDF 文件、电子邮件,还有采访资料。而且,这些东西往往都很难找到。过去,它们分散在我的电脑端、Google、Obsidian、Ulysses、The Generalist 的网站以及 Dropbox 各处。放在世界的苦难、宇宙冷酷莫测的奥秘、暗物质和无尽未知这些宏大命题面前,我知道这根本算不上什么真正的问题。但当你正写到一半,刚刚摸到那种脆弱的节奏感——那种连一辆慢吞吞的冰淇淋车路过都能打断的状态——这几乎是最令人恼火的干扰之一。

Delphi,这位洞悉一切的神谕,就是我为解决这个问题打造的方案。

一开始,我汇总了 The Generalist 迄今发表的每一篇文章、我录制的每一期播客的文字转录、我完整的 Obsidian 笔记库、我的 Readwise 高亮内容、Google Drive 中的很大一部分文件,以及我电脑端里各类零散文件。总计超过 4.5 万个可检索的“内容块”,而且这个数字还在每天增加。

搜索流程依赖于三层并融合运作:通过 Voyage-3 嵌入实现的向量搜索、通过 SQLite FTS5 实现的关键词搜索,以及一个在本地训练、从 Cohere 蒸馏而来的交叉编码器重排模型。我构建这个重排模型时,先采用了一个紧凑的开源模型,该模型已在 Microsoft 的 MS MARCO 搜索数据集上完成预训练,随后又用我们数据中近 4 万组查询—段落配对对其进行了微调。这让模型学会了在我们最初的 Cohere 配置下,“相关”应当呈现出什么样子,也使 Delphi 能以更快、更低成本的方式提供高质量结果。

如果你不知道这是什么意思,也别担心。完全没必要钻研得这么深。我当然也没想到自己竟然会去微调哪怕一个微型模型,但一步一步地,你就会开始对自己还能做些什么产生兴趣。我相信,上述这套系统远非完美,但至少目前对我来说,它运行得相当不错。

如今,借助 Delphi,我只需输入一句尚未成形的查询,比如“提醒我那位哲学家 Karol 在播客里谈了什么”,它就会回忆起 Karol Hausman——Physical Intelligence 的首席执行官——曾谈到他对斯宾诺莎的兴趣。

如果我想提出一个需要参考多个来源的问题——比如,各位 CEO 是如何谈论其招聘做法的——它也能处理,从我的整个语料库中调取相关参考资料。

过去,我本可以回答这些问题。第一个问题只需要我敲敲打打、切换几个标签页,花上几分钟;第二个问题则可能要耗费几个小时。很可能,我压根就不会费这个劲。

作为一个目的地,我并不经常使用 Delphi,而且我仍然认为它还有很大的改进空间。它的用户体验还没有达到我希望的那种精致程度,搜索功能虽然不错,但仍然可以更快、更智能。不过,它基本上能完成我想让它做的事情,而且知道在我需要时它就在那里,这让人感到安心。正如你将会看到的那样,它的能力也被运用到了我们的其他工具中。

研究员们

我打造的最有用之物既不可见,也难以轻易解释。它是由一整套技能、工具、方法与偏好串联而成的系统,让我能够广泛而深入地搜集信息,而无须亲自一点点东翻西找。

从根本上说,我的研究系统通过一组专门的智能体运转,它们负责从特定媒介中搜寻相关信息。一个会扫描我的内部语料库,查找已有内容。另一个会阅读相关文章。第三个则会寻找播客节目中的相关露面。

就像 Liam Neeson 在《Taken》中饰演的主角一样,这些工具都配备了一套“特殊技能”,帮助它们完成任务。Jina 和 Firecrawl 能将网页转换为干净、易读的文本。一款开源工具可以搜索 YouTube,并提取采访内容清晰准确的文字稿。各种脚本则会搜索某个对象已发表的文字内容(如博客或个人网页),或其在其他媒体上的露面。无头浏览器让智能体能够访问我已订阅但设有付费墙的网站文章。这样一来,你无需再逐一查看《The Financial Times》《The Economist》和《The New Yorker》;只要你已登录,智能体就能替你完成。

作家与研究者的 Claude Code 指南:我是如何构建一套完整的知识管理系统的,以及它由此释放了什么潜能

关键在于,当你处理其他事务时,它可以在后台完成所有这些工作。你不仅避开了现代网络带来的注意力陷阱和任务切换成本,还等于雇用了一位能干的研究助理。我一直希望,The Generalist 能发展到足够大的规模,让我有理由聘请这样的人;而如今,我仿佛一下子拥有了十几位这样的助手,而且他们都非常清楚我最有可能认为什么最相关。

为确保研究以高标准开展,我为这些智能体创建了一组可供参考的技能文件。其中包括如下准则:

保留证据,而非综合结论

每一份被阅读和收集的来源材料,都必须先进入结构化文件,然后才能开始撰写综合分析。我们必须能够清晰地将任何一项论断追溯到其原始出处。这能有效识别编造内容。

这些智能体负责收集信息,但不负责撰写研究结果。我发现,让另一个智能体接手写作流程并打磨成一份完整精炼的报告,效果会更好。没有这种分工时,研究智能体就可能受到诱惑而编造内容。经过一番搜索后,它会产生一种自我膨胀的错觉,以为自己已经掌握了所需的一切。当写作智能体从零开始时,往往能做得更好——它会更严格地遵循研究材料,也会更加谨慎地标注引用。

我们的技能文件也会在起草和写作阶段发挥作用,目的是防止失实,并产出真正让我愿意阅读的报告。几个核心原则:

  • 尽量解释充分 。写作可以假定读者是聪明的,但不应假定他们已经掌握太多背景知识。文中提到的引用、缩略语和细节都应加以说明,并提供必要语境。好的写作,是慷慨的写作。

  • 永远不要只相信自己的判断 。面对复杂议题,以一种带有质疑性的眼光审视作品会很有帮助。可以使用一个独立的代理来依据来源材料(而非训练数据)核实论断,审计证据密度,并标出被回避的反方论点。

  • 保留矛盾 。好的研究不会把细微差别磨平,而是会清楚地呈现出来。如果一个话题存在争议或尚不明确,这一点就应当显而易见,而不是被掩盖起来。不要急于得出结论。

如果报告出于某种原因仍然达不到要求,我有时会运行我所谓的“Caro Pass”。这一做法受到作家 Robert Caro 的启发(以及我让系统就其方法论所做的一些深入研究),其核心是让系统遵循他的箴言——“turn every page”。具体来说,这意味着重新审视我们收集的全部材料,并明确执行以下操作:

  • 审视审计覆盖漏洞 。不要假设信息已经完整,而要假设其并不完整,并标注出可能缺失的部分。

  • 寻找矛盾之处 。如果两个来源说法不一,或某个来源回避了某个话题,就要继续寻找更多信息。

  • 寻找“最后一位见证者”。我们可能漏掉了哪档冷门播客、哪篇博客文章,或哪个已废弃的网站?

  • 找到“揭示真相的细节”。我们能找到哪一条关键事实,从而改变我们对这个对象的认知?它可能是他们读过的一本小说,并与其工作形成呼应;也可能是他们在上一份工作时发布的一则帖子;或者是他们曾在另一种语言的采访中提到的一条家庭生活细节。

进行一次 Caro Pass 往往并不值得。但在那些我确实想尝试深入了解一个人的情况下,它可能会提供一个问题的素材,而这是我花上数十个小时研究也未必能发现的。

在我看来,在进入对话之前,对播客嘉宾进行充分研究并努力理解他们,是一种尊重。这套结构让我能够比过去挖得更深,提出更有趣得多的问题。它也在为两个长期项目收集研究资料方面发挥了关键作用,我希望不久后就能开始分享。正如你将看到的,我也会把它用于纯粹的兴趣,为自己恰好感兴趣的话题搜集信息。

工作台

当你需要坐下来,在电脑上阅读一些东西时,你会去哪里?

过去,我试过 Pocket、Instapaper、MyMind 和 Readwise 的 Reader。其中最后一个,是我所体验过的最接近真正令人愉悦的专注数字阅读空间的产品。(也就是说,如果不算 Kindle 或 Daylight 这样的专用设备。)但即便是 Readwise,也并不能完全按照我希望的方式运作。这又怎么可能呢?它是为成千上万的用户设计的,而不是为一位对工作流程有着一整套明确想法、主见鲜明的作者量身打造的。

于是,我打造了 Cuneiform。它证明了 Claude Code 令人上瘾的力量和真实潜力:Cuneiform 最初只是一个非常简单的产品。我当时只想要一个工具,能接收一份 URL 列表,并将其转换成排版精美的 PDF。我原以为自己会坐下来,在闲暇时慢慢阅读它,把它当作一种个人杂志。

但渐渐地,我开始意识到,这个想法还能做更多事情,而能够掌控自己的阅读界面,其实蕴藏着一种不易察觉却十分强大的力量。

那么,Cuneiform 是做什么的?从根本上说,它是一款用于保存文章、以精美的方式呈现内容,并按你的意愿进行整理的工具。它拥有优雅的排版、丰富的键盘快捷键,也能很好地抓取图片和视频。它还配有一个 Chrome 扩展,我在任何地方阅读文章时都可以触发它,将内容保存到我的资料库中。当然,存储在 Cuneiform 中的任何内容也都可以通过 Delphi 进行搜索。

要高亮一段文字,我按“h”;要添加批注,我按“n”。如果有不理解的地方,我可以按“a”直接提问,无需另开一个 Claude 标签页。能够在不切换工作上下文的情况下,围绕某一学科构建更完善的背景脉络,价值极大;同时,拥有一个可用于未来研究的笔记和高亮数据库,也同样意义重大。

我最喜欢 Cuneiform 的地方,不是它的设计或易用性,而是它在我的信息处理流程中所扮演的角色。如今,研究报告完成后,会进入 Cuneiform,并被标记到对应的项目下。等我想坐下来阅读时,就能轻松找到它们。

这种流程并不局限于传统的研究报告。正如上文所述,我已经利用自己构建的信息收集能力,整理出涉及各种我感兴趣主题的写作内容。The Generalist 的读者都知道,我一直对研究杰出投资者的职业生涯与行事方式很感兴趣。因此,我借助 Claude 着手研究了近 50 位这类人物。在完成这项工作后,我让 Claude 在这组样本中寻找共性。一年前,在我看来,这样的产出还相当薄弱。如今,借助这套系统,每一份人物简介都经过了极为扎实的研究,内容贴切,文字也相当不错。它距离优秀作者的水准还差一些,但肯定比阅读这些人物的 Wikipedia 页面更有趣、更令人印象深刻,也更有启发性。

除了这些定制化研究项目之外,我还开发了会定期向 Cuneiform 提供信息的工具。

其中一个例子是 Zeitgeist,这是我版本的每日总统简报。每隔几小时,我的系统就会扫描相关信息源,并将其整理成一份整合报告,供我在每天开始时阅读。其中包括国际新闻、科技新闻、近期风险投资公告,以及来自一个精选群组的高价值推文。大约 10 分钟内,我就能较好把握重要新闻、行业变化、新近获得融资的公司,以及办公室里热议的 AI 话题。打造这样一个我认为有价值的东西,需要我亲自投入——比如对信息源的编辑判断、呈现方式、何种内容算得上有趣,等等。

作家与研究者的 Claude Code 指南:我是如何构建一套完整的知识管理系统的,以及它由此释放了什么潜能

Call Intel 是另一项节省时间的工具。它会汇总我在某一天将要会见之人的预先简报,说明他们是谁、在哪里工作、通话背景,以及有哪些值得提及的话题。不到六十秒,我就能迅速掌握对方情况,并以更充分的准备赴会。

楔形文字仍有不少地方还不够完善。它还没有移动端应用,而我已经开始希望它能有了。键盘快捷键的运作方式也并不完全符合我的要求(某些地方有些奇怪的细微差别)。但它已经如此彻底地按照我的需求进行了调校,以至于我如今无法想象会去选择一个现成的替代方案。

记事本

这套拼图中最后一大块是 Scribe,这是我替代 Google Docs 的方案。说实话,我从未想过自己会觉得有必要打造一个土制版的免费、功能完备、久经考验的文档编辑器。这么做的意义何在?Google Docs 难道不正是完成这项工作的最佳工具吗?

对大多数人来说,答案是肯定的。但考虑到我花在文字处理器上的时间之多,我很想看看,自己是否能制作出一个更适合我的版本。

Scribe 是一款快速、极简且稳定可靠的文档编辑器,具备几个关键功能,因此对我来说更胜一筹。要把它打磨到现在这个状态并不容易,其间有几个小时令人心跳加速——我一度以为自己丢失了大段工作成果。(这或许也是一个发布公益提醒的机会:当一个没有技术背景的人开始自己开发软件时,你会在不知不觉中引入各种自己从未受过训练去应对的漏洞和安全隐患。在 Claude Code 出现之前,我从未考虑过这些;关于我后来实施的各种基础设施与安全措施,我完全可以另写一篇长文细谈。)

为应对那次事故,我设计了一套由八重故障保护机制支撑 Scribe 的系统,涵盖缓存、本地备份和 Backblaze。即便其中一环失效,其余机制也能确保最糟情况下只会损失几秒钟的工作成果。

在我看来,Scribe 最出色的功能是它对斜杠命令的运用。当我在编辑器中输入“//”时,会弹出一个模态窗口,让我无需离开文档,就能基于自己的研究提出问题。比如,在撰写关于 Satya Nadella 管理风格的文章时,我写到一处,突然想不起 Microsoft 在 1999 年有哪些重大事件。过去,我会在另一个窗口里询问 Claude——但那样无法调用我自己的研究——或者去找某篇特定文章,看看里面是否有相关信息。在 Scribe 中,我只需输入“// msft in 1999”,它就会结合我的资料来源以及外部信息,调取一份完整梳理。相关论断都附有引注,并配有便捷链接,我可以在侧边栏中打开阅读,或复制 URL 将其链接到文章中。仅仅省去这种来回切换的成本,对我来说就极具价值。

我还尝试过其他“//”结构的变体,但最终只保留了一个。当我输入“//t”时,它会调出一个迷你同义词词典,帮助我为输入的内容选择一个可能的近义词。

这只是个小小的好处,但在过去一次普通的写作会话中,这类事我往往要做上十几次。

除此之外,Scribe 还有其他一些我后来发现很有价值的功能:

  • 内置番茄钟计时器 。当我点击右上角的“专注”按钮时,系统会启动一个 25 分钟的计时器,随后是 5 分钟的休息时间。我的专注进度会以一颗小种子的形式呈现,随着我完成更多轮次,它会逐渐长成一棵树。

  • 深色模式 。与 Google Docs 不同,Scribe 提供了一种非常便捷的方式来启用深色模式。

  • 推送到 Google Docs。虽然我很乐意以单人模式写作,但把产出分享给其他人征求反馈往往也很有用。只需按下几个按键,Scribe 就能将整篇文章推送到 Google Docs,并以较高的保真度保留原有格式。

  • 与 Cuneiform 同步 。如果我在 Cuneiform 的一段内容上按下“w”,它就会被推送到 Scribe 文档中。我并不经常使用这个功能,但它是将相关引文发送到文档中以便列提纲的一个不错方式。

到了审阅一篇文章的时候,Scribe 会让这件事变得非常简单。只需按下“Cmd+E”,我就会调出一个“Review Panel”,它会读取当前文档,并从拼写和语法问题、事实错误、未填占位符以及缺失引文等方面进行分析。它还会调用 Delphi 来建议可作为支撑的资料来源,或寻找新的来源。归根结底,这相当于对草稿进行一整套健康检查,尽可能确保它接近无误且引证充分。它目前还没有达到我理想中的成熟度和可靠性,但已经证明了自己的价值。

未知事物

尽管构建这些工具给我带来了很多乐趣,但它们也让我不得不直面一些令人不安的问题:未来究竟会怎样。

与一年前相比,我的感觉是自己学到的东西更多了,把更多时间花在了更高质量的想法上,也吸收了更大范围的优质信息。我发现,使用自己的系统变得更容易,也更愉快;借助它们,我花在重复性、行政性工作上的时间更少了。相关信息更频繁地在恰当的时刻、恰当的地方浮现出来。那些我过去因为研究范围过于庞大,或仅仅因为需要投入我无暇给出的时间而根本无法开展的研究项目,如今变得既可行又令人兴奋。在一些方面,我显然获得了真正的杠杆效应。若想取得同等收益,The Generalist 需要一个规模大得多的团队;而在那样的世界里,我节省下来的任何时间都会被管理事务吞噬。这些都是好的一面。

不过,阳光也会投下阴影。我学到的东西更多了,但在我的研究过程中,我发现自己阅读由人类撰写的文章越来越少。比起逐篇翻阅一组来源,我更可能直接消化 Claude 给出的全面综合。除非有人拿枪指着我,否则我大概再也不会去读一篇 Business Insider 的文章了。这很糟吗?过去那种每一段都被拆成单独几行、再穿插图片的写法,是否曾给我带来某种隐秘的好处?我不这么认为,但这对某些人来说确实是坏消息。而且,趋势线会把我们带向何方,并不需要天才才能预见。一年后的今天,我所获取的信息中,有多少会是由机器创造的?这重要吗?这对某些人来说很重要。

(我仍会抽出时间阅读伟大的书籍——无论是小说还是非虚构作品。Claude 无法创作出 《刀锋》。)

尽管这些系统能呈现出大量信息,但你无法知道它们遗漏了什么。为什么 Robert Caro 要亲自翻阅每一页?因为他明白,你无法预知哪个细节最终会起决定性作用。作家的思维正是为了捕捉这样的瞬间而塑造、训练出来的,而当它们出现时,那感觉宛如魔法,仿佛宇宙的共谋在纸页上显现。你能信任一个筛选器去捕捉这些珍宝吗?当你阅读的是综合整理后的内容,而非原始文本时,你又可能错过了什么?那些金子般的碎屑,或许早已在某个环节被筛掉了。

当你沉湎于这些事情时,很容易变得伤感。仿佛过去曾有某种独特的品质,如今已被永远抹去,而未来也几乎不值得拥有其位置。然而,这同样天真。

归根结底,这项技术究竟意味着什么,很难说得清——无论是对作家、研究者,还是对那些兜售新闻通讯的奇特“准创业者”而言,都是如此。它是一种力量倍增器,让我们获得仿佛拥有一支更庞大团队的优势吗?一个独立个体,是否能凭借恰当的技能与工具,将自己的品味与才华放大百倍?抑或,这不过是一台制造过时的机器,是意义的死神,从我们的内部开始将我们一点点吞噬?

可以肯定的是,你无法让一颗彗星在飞行途中停下。浪潮不会因为你的请求而止步。若我们想从中受益,若你想找到那个能够驾驭这团轰鸣奔涌的计算与光芒之中的自己,你就必须学会使用它。即便在最理想的时候,这依然像是一场游戏。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读