AI Coding 的三位一体与上下文工程实践

AI coding 需要三位一体，我并不倾向于将其叫作 vibe coding，当然，这套流程完全可自动化，但是就是不断沟通、动态调整优化的过程最重要。

需求提出者与现阶段的整合者；（人类核心）
知晓理解需求并有着项目从 0 到 100 全部上下文的架构师；（Gemini-2.5-pro）
能够具体地执行架构师要求的工程师（我目前更倾向于使用 VS code 的插件 Augment）。

架构师与工程师均是 AI，每一个 system prompt 都要针对具体项目具体定制，并保持实时动态更新。切记不要使用通用的架构师或工程师 prompt 。这也可以通过与 AI 进行交流不断明确方向与需求。需要的也是不断的迭代。

通过这样的结构，个体完全可以运行一个较为复杂的项目，而不是普通前端网页页面。

这套流程本质是要求个人发挥顶层设计与具体选择，对个体能力要求高、选择成本高；架构师AI专注于架构、功能实现、逻辑完整、设计合理，面临着可能对最新技术文档不够了解、知识更新不到位等问题，还有更严重的幻觉问题；工程师AI则专注于执行架构师AI给出的任务，问题也在于知识更新的问题等问题。

同时，还有就是相互传递带来的信息损失与误差，甚至是小的幻觉造成更大的错误。

这同样可以迁移到其他领域。比如制作影视作品中。最重要的还是让AI了解全面，他们懂得比我们多得多，如何提取出来？这在过去其实就是所谓的提示工程（prompt engineering），但这还不够，如何传递足够准确的上下文才是最重要的。

这套流程是上下文工程（Context Engineering）的手动实践。自动化后，就成了上下文工程的艺术体现。

继 vibe coding、system prompt learning、Software 3.0 后，Andrej Karpathy 又提出了 Context Engineering（准确地讲是带火了）

Tobi Lutke（Shopify CEO）将其描述为“提供所有必要的上下文，让 LLM 能够合理地完成任务的一门艺术”

先回到 system prompt learning ，AK 提出，人类学习往往更依赖显式提示：我们写笔记、提炼策略，并以此增强记忆与行为。他将这视为第三范式：系统提示学习（System Prompt Learning）—— 模型通过编辑系统提示来累积、存储并运用解决问题的策略。

AK 之前在 YC 的演讲，将 System Prompt Learning 视为 Software 3.0 时代的重要组成，即：将 prompt 视作程序，并赋予其自主成长能力。他认为系统提示将成为 AI 的笔记本，不断积累经验与问题解决策略。

再回到 Context Engineering 之前，我们先看 prompt，具体是什么含义就不多解释；再到提示词工程（Prompt Engineering），本质就是不断优化 prompt 的工程实践。

最重要优化的是那个 role 为 system 的 prompt，不只是 user_input_prompt。通常，其定义角色、描述环境、任务要求等等。

现在，随着长期记忆、工具使用等不断成为必需的，如何能够让一个原本无状态的 LLM 具备这些要素呢？这就是通过注入到 system prompt 中去实现，prompt engineering 将固定的 prompt 奉为圭臬；而现在，system prompt 必须成为动态变化、动态发展，不断迭代与优化的一个操作系统。

我认为 system prompt learning 与 context engineering 的实现是类似的，即通过工程手段（甚至可以添加多个不同作用的模型去进行）动态地构建一个结构化、不断优化的 system prompt，一个包含角色定义、记忆（历史对话、长期记忆）、工具描述与参数、外部知识注入（RAG、工具返回结果）、当前状态与任务指令等等。

不应再将 Prompt 视为一个简单的字符串，而应将其视为一个结构化的、动态生成的、包含了整个世界模型（当前系统）的微型操作系统。LLM 就是运行在这个操作系统之上的 CPU。

我们的海马体与新皮层，负责存储事实、经验和技能。通过特定模块注入到 system prompt 中。构成基础人格。

我们的注意力机制与联想网络。它决定了我们在面对一个问题时，会从庞大的记忆中想起哪些最相关的信息。RAG等技术，进行语义相似度检索并返回到 LLM大脑。LLM 自主调用工具返回内容。

LLM 是否需要特定人格？可以有。会不会影响输出质量（如要求高度准确性）？并不一定。在执行任务时，并不需要与用户的对话历史与长期记忆，那就不要注入；我们人类在专注时，并不会回想起过去，除非走神。走神又是否是一种更深层次的优化呢？

我们的工作记忆 (Working Memory) 与前额叶皮层，负责整合感官输入、短期记忆和长期记忆，并形成当前的思考焦点。大脑是如何进行拼接那个 system prompt 的？工程手段能否实现类似功能？

所以，本质上我们一直在探讨，我们与 AI 协作、未来 AI与AI 协作的一套信息编排系统。

真正的 Context Engineering 不是简单的 Prompt Engineering 的升级版，而是重新定义了人与 AI、AI与AI 之间的信息接口。这套系统要求：

按需注入的上下文和记忆；
在任务目标与执行细节之间精确、低损耗的传递；
不同角色、能力间进行过渡。

这也许对比软件工程师去设计复杂软件系统，AI工程师则去设计AI与人、AI与AI之间的如何沟通、上下文如何共享与传递、各自的任务与具体的协作流程。我们如何去为 AI 设计可运行的认知环境和操作系统？我们不仅需要知道要做什么，还要知道要让 AI 如何知道。