# AI 应用工程师 · 学习知识树

> **创建**：2026-06-12 · **维护者**：扣子
> **主用户**：大扣子 · **目标**：3-5 年长线 → 找 AI 应用相关工作
> **核心原则**：先地基后高阶 / 复利优先 / 不追新不追热 / 读完即填 / 避开理解负债
> 📌 **新增原则（2026-07-01）**：**避开理解负债**——AI 生成代码/方案时必须同步理解原理，不能只拿产物跳过理解过程。AI 帮你加速编码但无法加速理解，跳过理解 = 借债。对应的三类负债：理解负债（个人层/不懂自己的代码）、认知负债（团队层/没人说得清系统）、意图负债（设计层/为什么这么做没人记录）。验证稀缺是反向警示——AI 让写代码近乎免费后，「定义什么是正确」变成最贵的事。
> 
> **选题 5 门槛**：① AI 应用岗强相关 ② 可复利 ③ 有实操案例 ④ 不是营销稿 ⑤ 来源权威性
> **权威性排序**：大厂技术博客（Anthropic/OpenAI/DeepMind）> 顶会/被引 arxiv > 顶级独立博主（Karpathy/Simon Willison/Lilian Weng）> 机构媒体（机器之心/量子位）> 个人 CSDN
> 📌 **门槛迭代（2026-06-19）**：从「大厂博客>CSDN」升级为「一手来源优先」——搜索到一手来源直接推一手，搜不到时区分「无一手但内容硬核」（标例外）和「纯二手水文」（直接放弃）。RAG 分块等工程实践总结无官方一手属正常例外

---

## 当前学习阶段

**L2 工程层 · 全部通关** ✅（2026-06-28 收工）⬅️ 当前聚焦
- 节奏：串讲打底 → 论文精读 ✅ → 工程实践
- ✅ 已学（2026-06-19 22:00-22:48）：缓存命中/未命中 / KV Cache / Transformer 架构 / Self-Attention Q·K·V
- ✅ 论文：精读《Attention Is All You Need》全部章节完成（2026-06-20）：§3.1-§3.5 架构核心（QKV/Self-Attention/Multi-Head/FFN/Embeddings/Softmax/Positional Encoding 旋转矩阵推导）+ §4 三指标设计动机 + §5 Adam(warmup)/Dropout/Label Smoothing + §6 BLEU 28.4/41.0 + §7 结论。额外深入：softmax 求导/Jacobian/梯度、Decoder-only/因果注意力/Next Token Prediction、Prefill-Decode 推理两阶段/KV Cache/显存、正弦编码→RoPE 演进
- 1 个月里程碑：完成 Transformer 完整笔记 + L0 编程基础自查

**L2 工程层 · RAG + CE 双主线已通关** ✅（2026-06-26 收工）
- ✅ RAG 五大子主题全部完成（检索/Embedding/Chunking/Rerank/评估，2026-06-24）
- ✅ CE 五节课全部完成（§1基础→§2窗口矛盾→§3策略操作→§4前沿→§5实战，2026-06-25~26）
- 📕 待读（可选）：Anthropic《Introducing Contextual Retrieval》
- 🔜 下一步：L3 实战层，路线已定（2026-07-01）：**A. MCP 深入（先行）→ B. 旅游搭子 AI 助手落地（接上）→ C. 多 Agent 系统（后续）**
- 📌 **AI 雷达案例（2026-07-01）**：Anthropic 发布 Claude Science（Beta），主Agent 协调 60+ 子Agent + 审阅Agent 把关——Agent 设计模式在工业级产品中的真实落地，验证了 Orchestrator-Workers + Evaluator 模式的有效性

---

## 知识树 · 6 层认知阶梯

### L0 · 地基层（地基，3-6 个月）🔄 AI 时代重构
> 不动 L0 直接盖 L3 会塌。所有 AI 应用能力最终都落地在代码里。
> **2026-06-29 重构**：AI 辅助编程时代，L0 重心从「会写」转向「会读 + 会审 + 会指挥」。每条保留但重心迁移。
- [ ] **Python 基础**：重心→读懂 AI 代码 + 审查类型/异步/并发的隐藏坑
  - 语法不用背（AI 补全比你快），但需要能一眼看出 AI 把 `==` 写成 `=` 或闭包变量引用错误
  - 数据结构重点：选型判断力（什么时候该用 dict vs database）——AI 不会替你决策
  - 类型注解：AI 生成的类型标注经常出错，读懂才能纠错
- [ ] **TypeScript / JavaScript**：现代 AI 前端应用的事实标准，重心→审查 AI 生成的前端代码
- [ ] **命令行 + Git + 调试**：权重翻倍 🔺
  - CLI 是 Loop 工程的核心载体（`/loop` `/goal` `/schedule` 全是命令行）
  - Git：AI 生成 10 个 commit，你能快速 `git diff` 扫一眼判断质量
  - 调试：查 AI 的 bug 比查自己的 bug 更难——逻辑正确但业务错误
  - ‼️ **理解力债务**：loop 合入代码越来越快，对代码库理解越来越浅，读 diff 是最后防线
  - 📌 **2026-06-24 基础概念梳理**：CLI（概念）→ Bash/CMD/PowerShell（具体实现）；Linux 是 CLI 驱动的开源 OS，AI 领域主流；BIOS 是主板固件，比 OS 更底层；PS/进程 = 正在运行的程序实例；数组是通用数据结构（Python list = 动态数组实现，JSON 只是表示格式）
- [ ] **HTTP / REST / JSON / API 调用**：不变但加一层——AI 能写 API 代码，但你得懂状态码/错误处理逻辑/JWT OAuth 认证流（AI 的 try-catch 经常形同虚设，鉴权代码最易出安全漏洞）
  - 新增：**MCP 协议**——AI 时代的「新 HTTP」，标准化工具调用接口
- [ ] **环境管理**：升级为日常刚需 🔺
  - venv / conda / Docker：AI 生成代码在不同环境下行为不同，环境隔离 = 风险隔离
- [ ] **🆕 Prompt / Loop 工程**：AI 时代新增模块
  - 把模糊需求转成精准结构化指令（Prompt Engineering）
  - 设计「目标 → AI 执行 → 自验收 → 重试」闭环（Loop Engineering）
  - 本质：面向 AI 的沟通能力 + 流程设计能力
  - 📌 参考：黄仁勋「Prompt 已死，Loop 当立」/ Claude Code `/loop` `/goal` / 谷歌 DORA 报告（90% 采用率，24% 信任率）
- [ ] **🆕 代码审查能力**：贯穿所有模块的横向能力
  - AI 代码审查五维清单：边界条件 / 异常处理 / 性能 / 安全 / 风格一致性
  - 核心矛盾：AI 写得越快，审查越重要——「被接受率 < 50% 说明 AI 在亏钱」
  - 📌 **理解负债防护（2026-07-01）**：代码审查是防理解负债的**最后防线**——AI 生成代码后必须读 diff、搞懂为什么、确认设计意图，不能"动就 OK"直接合并。AI 帮你加速编码但无法加速理解，跳过理解 = 借债，改需求/修 bug/换工具时债开始计息

### L1 · 概念层（理解 AI 在干什么，1-2 个月）
> 这一层是"通用语言"——和同行沟通、看技术博客、面试都需要。
- [x] **LLM 工作原理**：token / 上下文窗口 / 推理 vs 训练 / 幻觉成因
  - [x] **Transformer 架构**（论文全本精读，2026-06-19~20）
    - 编码器-解码器 → 现代 Decoder-only（GPT/Claude/Llama）
    - Self-Attention：QKV 投影 / Scaled Dot-Product / Multi-Head 并行
    - Positional Encoding：sin/cos 旋转矩阵 PE(pos+k)=Mₖ·PE(pos) → RoPE
    - 训练：Adam(warmup) / Dropout / Label Smoothing(ε=0.1)
    - 推理：Prefill(并行+KVCache写入) → Decode(逐token+KVCache追加) / 显存瓶颈
  - 详细笔记 → `学习笔记/Attention_Is_All_You_Need_核心精读.md`
- [x] **Prompt Engineering 基础** ✅（2026-06-26~27）：七大组件 / 六大核心技巧 / Zero-shot vs Few-shot / 三大实验室框架对比 / PE与CE关系 / SOUL vs Prompt角色层级(Isolate>Write)。笔记→[PE基础学习笔记](./学习笔记/PE基础学习笔记.md)
  - [x] **Scaling Law 完整学习** ✅（2026-06-27）：Kaplan vs Chinchilla 幂律公式 / C≈6ND 推导 / 推理时 Scaling 三类方法(顺序/并行/搜索) / 成本与Token经济。笔记→[Scaling_Law完整学习笔记](./学习笔记/Scaling_Law完整学习笔记.md)
- [x] **主流模型家族速览** ✅（2026-06-28）：海外三巨头（Claude/GPT/Gemini）+ 国产四强（DeepSeek/豆包/GLM/Kimi）+ 生态位分析 + 定价全景 + AA 智能指数/ECI 评测体系。笔记→[主流模型速览笔记](./学习笔记/主流模型速览笔记.md)
  - 📌 **DeepSeek 模型线修正（2026-07-03）**：官方只有 2 个模型（V4 Flash + V4 Pro），**没有**独立的 V4 Think/V4 Think Max。推理是参数开关（`thinking: {"type":"enabled"}` + `reasoning_effort`），不是独立模型线。7月24日后 `deepseek-chat`/`deepseek-reasoner` 弃用，统一为 V4 Flash/Pro。三大厂区分方式：DeepSeek=同一模型+开关 / OpenAI=两条产品线(GPT vs o) / Anthropic=Thinking 开关
  - 📌 **Claude Sonnet 5 发布（2026-07-03）**：6月30日发布，Agent 能力质变——Terminal-Bench 67%→80.4%(+13.4pp)、知识工作 GDPval 反超 Opus 4.8、Prompt 注入防御 50.7%→0.93%。Effort 五档取代 Extended Thinking。⚠️ 新 Tokenizer 多切~30% token（隐性成本），首发价 $2/$10 至 8.31，之后恢复 $3/$15
- [x] **AI 三大能力边界**：验证边界（Karpathy 框架/RL覆盖区/Jagged Intelligence）+ 判断力边界（三个上限/内生安全vs外生安全）+ 知识边界（存量整合 vs 原创突破）。笔记→`学习笔记/AI三大能力边界.md`

### L2 · 工程层（让 AI 真正"做事"，6-12 个月）⭐ 当前聚焦
> 从"能聊"到"能用"——这一层是找 AI 应用岗的核心区分线。
- [ ] **上下文工程 Context Engineering** ⬅️ 主线
  - 7 层架构 / Goldilocks Zone / 生命周期决策
  - CE 4 层文件架构（2026-06-15 深度讨论）：
    - 即时层：USER.md（画像）→ MEMORY.md（状态/规则）→ SOUL.md（身份设定）→ TOOLS.md（工具经验）→ SECRET.md（凭证）
    - 近中期层：recent_memory/index.json（索引）+ project/decision/todo（详情文件）
    - 长期层：memory_search（RAG语义检索）
    - 运作流程：用户输入 → CE引擎读取各层 → 结构化上下文 → 模型推理
  - 意图分层机制：CE 能识别主意图与附带问句，屏蔽次要干扰
  - 认知迭代方法论：新结论≠覆盖旧结论，保留旧版本 + 标注版本号 + 各自语境使用
  - 📌 **认知迭代（2026-06-19）**：上下文窗口与 Agent 上下文输入的关系——窗口=模型"锅"的容量（硬件约束），Agent 上下文="锅里装什么"（系统精选）。引发三个工程命题：
    - **三种任务策略**：一次性完成（输入输出明确）vs 分步迭代（需纠偏的创意任务）vs 拆成独立子任务（复杂任务各 session 互不污染，与上下文隔离同源）
    - **多任务防串台**：模型能区分"历史"和"当前任务"，真正风险是上下文过长被压缩丢细节——解决方案是独立子 session 隔离而非靠模型自己区分
    - **扣子压缩机制**：对话过长时自动触发压缩→生成 summary→旧对话细节丢失（如具体措辞），是记忆分层设计的根因
  - 📌 **上下文占用账单（2026-06-19）**：即时层五文件 ~15KB + 系统 prompt（记忆体系/Skill列表等）几十KB = 每次对话雷打不动的固定开销；`.skills/` 下其他技能（如 travel-companion 27KB）不自动加载，仅在显式 `skill_load` 时才进上下文
  - 当前：阅读 CSDN《AI 大模型上下文工程》+ Anthropic 速读
  - 📌 **CE 五节课收工（2026-06-25~26）**：§1基础概念（PE→CE范式升级/九种成分/70%失败来自上下文）→ §2窗口矛盾（四种失败模式：中毒/分心/混淆/过时）→ §3六大策略+四类操作（Write/Select/Compress/Isolate + 记忆三层架构）→ §4前沿（ACE自进化/GAM JIT记忆/SAC选择性压缩/mcpo MCP-to-OpenAPI）→ §5编程实战（AGENTS.md 局限性/三层加载策略/五个未解难题/扣子体系全映射）。笔记落档 `CE学习笔记.md`，词汇表新增 22 条目
  - 📌 **RAG+CE 双主线收工洞察（2026-06-26）**：RAG 管「怎么查」、CE 管「怎么记/怎么喂/怎么压缩」——检索完后顺势搞记忆架构最自然。记忆三层架构（Working/Episodic/Semantic）与扣子记忆体系完美映射：即时层=Working Memory 固定部分、近中期层=Episodic Memory索引+详情、长期层=Semantic Memory向量检索
  - 📌 **认知迭代（6-27）**：记忆管理工程实现——MECE五路分流（SOUL/USER/MEMORY/TOOLS/SECRET各司其职）+ 降级策略（MEMORY近上限时旧条目→recent_memory/index.json→MEMORY留摘要）+ 默认不记门槛原则。本质是CE Compress操作的工程落地
  - 📌 **认知迭代（6-27）**：上下文持久性原则——「上下文是易失的，文件是持久的」；扣子压缩会丢失对话历史细节，不可依赖上下文做跨session记忆锚点，MEMORY.md是不可压缩的持久锚点
  - 📌 **认知迭代（6-27）**：AGI进化路径——PE→CE→自主CE→元调度的四级进化链；模型派（Scaling Law堆规模造脑）vs 支架派（外部结构辅助）当前不是对立而是接力关系
  - 📌 **认知迭代（6-27）**：Agent推理双层架构——模型层内建推理（参数编码的推理模式/数学推导/因果分析）+ Agent层编排推理（工具调用/多步规划/Skill编排/错误恢复），两层级接力：模型负责「想」，Agent负责「查」和「做」
- [ ] **Agent 的 CE 范式**（活案例：旅游搭子 SKILL.md）
  - 核心定义（标注版本，不覆盖旧结论）：
    - **v1（2026-06-13）**：Agent = 按 SKILL.md 规则自动执行的 CE 工具
      → 视角有效但不够完整：缺少感知-推理-行动循环、以偏概全、降级 Agent 身份为"工具"
    - **v2（2026-06-15）**：Agent = 以上下文工程为核心手段、按规则自主执行感知-推理-行动循环的系统
      → 保留 v1 的 CE 核心视角，补全 Agent 全貌定义，两个版本在不同语境各自适用
  - 关键洞察：把策展从"人每次手动做"升级为"按规则自动做"（工业化）
  - 4 个新挑战：
    - 工具爆炸（11 个工具签名一次塞，怎么挑对）
    - 多轮一致性（Q4 生命周期决策就是这）
    - 错误传播（一个工具错，下游基于错信息继续）
    - 元策展盲点（SKILL.md 没写的场景兜底可能不是最优）
  - 范式分层（3 层）：
    - L1 按规则跑：现在大多数 Agent 在这层
    - L2 自主策展：Agent 自己判断"什么进、什么不进"
    - L3 自优化策展：Agent 自己优化策展策略（元学习/meta-prompt）
  - 旅游搭子活案例：
    - SKILL.md 一次性完整加载（13 核心能力 + 11 工具签名）
    - 缓解机制：结构化（标题 / 表格 / emoji 🚨🛡 锚定）
    - "挪位置"是末位修补，"结构化"才是主动防御
  - 关联：上下文工程主线 / Lost in the Middle / Anthropic CE 指南
  - 源自：2026-06-13 巩固提问 Q5 延伸讨论
  - 📌 **好搭档技能化（2026-06-19）**：自优化策展的工程落地——将纠偏体系技能化发布（good-partner，skill_id=7652749733957550080），含锚点体系（四步流程：提取锚点→行为对照→偏差归类→输出摘要，只标记不修改）+ 三层纠偏结构（audit快照层/lessons教训层/阈值层）+ 跨 session 审计概念（多次执行横向对比发现系统性模式）。每周一 Calendar 纠偏扫描 + 每两周外部方案对比
- [ ] **RAG 检索增强生成** ⬅️ 主线 · 详细笔记见 [RAG学习笔记.md](./学习笔记/RAG学习笔记.md)
  - 速查索引：
    - **检索核心机制** ✅（BM25 关键词 / 向量检索 / 混合检索 RRF / 6场景对比表）
    - **Embedding 训练** ✅（4种数据构造 / 分布式语义 / 硬负样本 / 完整流程图）
    - **InfoNCE Loss 推导** ✅（3定义+公式+τ+N=4算例+反例+论文风格公式图）
    - **分块策略 Chunking** ✅（§5.1-5.3 全部完成，2026-06-18~24）
    - **重排序 Rerank** ✅（Bi-Encoder vs Cross-Encoder / 两阶段流水线 / MarginRankingLoss / LLM-Reranker，2026-06-24）
    - **评估与可观测性** ✅（检索五指标 + RAGAS 三指标 + 端到端 + 生产实践，2026-06-24）
  - 📌 **认知迭代（6-18）**：Chunking §5.1 ✅ + §5.2 ✅，关键发现——**大 chunk ≠ 召回更好**：embedding 是全段平均导致"主题稀释"，512 是段落级默认而非越大越好
  - 关键洞察：BM25 与向量检索互补，混合检索+RRF是生产级默认；Embedding 训练本质是对比学习；InfoNCE Loss 是"让正样本概率最大"的经典套路
  - 公式渲染脚本：`学习笔记/渲染InfoNCE公式.py`（产物输出到 `/tmp/` 不入仓，可复用为后续公式模板）
  - 📌 **认知迭代（2026-06-16）**：AI学习目录组织规则固化——`AI学习/`顶层仅放速查索引（知识树+词汇表），详细笔记放`学习笔记/`，可复用脚本也放`学习笔记/`，中间产物（PNG/PDF/HTML）输出到`/tmp/`不入仓
  - 📌 **虾评记忆技能调研（2026-06-17）**：Context Relay Setup（跨 session 接力，todos.json + heartbeat 驱动）+ Agent 记忆系统搭建指南（五层架构：恢复层→毛坯层→长期记忆层→每日笔记层→归档层）。两者均假设显式 session 边界，扣子无此概念需改造。核心思想（索引轻量化/毛坯先行/按需加载）已融入自研 Agent 工作日志技能
- [x] **Function Calling / Tool Use** ✅（2026-06-27）：八章完整教学——FC 是什么 → Call/Result 循环 → JSON Schema 设计（三核心字段）→ Provider 差异 → 六大设计原则 → FC→Agent 演进路径 → 扣子 45 工具实战映射 → 核心洞察。笔记→[Function_Calling学习笔记](./学习笔记/Function_Calling学习笔记.md)
  - 📌 **2026-06-24 tools 数组设计原理**：tools 是数组而非单个对象，因为模型需要同时看到所有可用工具才能做选择（tool_choice: auto/required/none）；类比"扫一眼工具箱再挑家伙"，多个工具组合调用必须基于数组
  - 📌 **2026-06-27 FC 关键认知**：JSON Schema 是 FC 的命门（写得好坏直接决定成功率）；Constrained Decoding 是质的飞跃（JSON 解析失败率 15-25% → ~0%）；FC 是 Agent 的原子操作——后续 ReAct/Multi-Agent 等设计模式都是对 FC 调用链的编排策略
- [x] **Agent 设计模式** ✅（2026-06-27）：完整教学——Anthropic 官方框架 + 五种 Workflow + 四种 Agent 模式 + 扣子实战映射。笔记→[Agent设计模式学习笔记](./学习笔记/Agent设计模式学习笔记.md)
  - **五种 Workflow**：Prompt Chaining（固定步骤链）/ Routing（分类路由）/ Parallelization（Sectioning+Voting）/ Orchestrator-Workers（动态编排，Anthropic 最推荐）/ Evaluator-Optimizer（评估-优化循环，2-3轮 ~20% 提升）
  - **四种 Agent 模式**：ReAct（想→做→看循环，准确率~85%）/ Plan-Execute（先计划再执行，~92%，费50% token）/ Reflection（自我挑错修正）/ Multi-Agent（多 Agent 分工协作）
  - **三条核心原则**：① 保持简单 ② 优先透明 ③ 精心设计 ACI（工具定义决定 Agent 上限）
  - **四个常见坑**：工具死循环 / 上下文溢出 / 吞工具错误 / 无超时
  - 📌 **认知迭代（6-27）**：Agent 本质——**决策权移交的 CE 系统**。CE 管上下文、FC 管工具、设计模式管编排、决策权是灵魂。Workflow 和 Agent 不是对立而是谱系（从完全确定到完全自主）
  - 📌 **认知迭代（6-27）**：Agent 四层架构——①底层模型（推理）→②平台工具链（spawn/Calendar/search）→③记忆体系（CE工程实现）→④系统 Prompt（规则引擎 Router）。纯靠提示词的只有第④层，前三层是模型+平台+工程
  - 📌 **认知迭代（6-27）**：我的 CE 引擎本质是**规则驱动而非自主进化**——Write/Select/Compress/Isolate 四操作靠系统 prompt 规则匹配触发，不是模型"自己想"出来的
- [x] **Memory 管理** ✅（2026-06-28）：三层模型（Working/Episodic/Semantic）/ 语义检索与 RAG 同构 / 摘要压缩 / 结构化索引 / 扣子三层映射 / MemGPT+Contextual Retrieval+Graph Memory 前沿；笔记→[Memory管理学习笔记](./学习笔记/Memory管理学习笔记.md)
  - 📌 **Agent 工作日志系统（2026-06-17）**：自研轻量化记忆方案，已技能化发布（`agent-work-log` v7，skill_id=7652339198736842792）
    - 核心思路：借力扣子上下文压缩自动生成的 `<summary>` 做归档原料，agent 不需要自己维护毛坯
    - 四件套：`index.json`（极轻索引）+ `windows/`（窗口日志）+ `todos.md`（待办）+ `lessons.md`（经验）
    - 触发机制：主触发=检测 `<summary>` 标签即归档；兜底=Heartbeat 每 30min 检测缺口但仅提醒不写入
    - 回溯规则：问历史/进度/决策必须先读 index.json，按摘要定位窗口，按需加载
    - 标签约定：所有关联项打 `[agent-work-log]` 前缀，搜此标签即可统一管理
    - 关键限制：Heartbeat 是独立 session 无主对话上下文，只能检测缺口不能归档内容
    - 与 MEMORY.md 分工：工作日志管"做了什么"，MEMORY.md 管"规则+状态"，互补不重复

### L3 · 工具与生态层（用什么做，3-6 个月）
> 工具是杠杆，3-6 个月熟悉主流即可。不要陷在"学框架"上。
- [ ] **扣子平台深度玩法** ✅ 已有实操
  - 技能开发 / 工作流 / 插件 / 项目空间 / 云设备
  - 📌 **技能开发全流程（2026-06-17）**：`skill_builder` 加载 → `skill_draft_create` 创建草稿 → 编写 SKILL.md → 补充元信息 → 自动发布到「我的技能」；后续编辑自动打包升级版本号，需手动 `skill_draft_publish` 发布更新。经历 `agent-work-log` v1→v7 七版迭代，覆盖凭据配置、图标生成、初始化自动化等完整链路
  - 📌 **平台机制验证（2026-06-17）**：扣子无「新对话」功能，仅一条永续主对话流；「项目」= 独立子工作空间（非对话重置）；上下文边界由系统压缩触发（非用户操作）；平台内置记忆=自动提取+定期整理+向量检索，偏长期事实，session 级细节敏感度不足。详见 `平台探索/扣子平台局限性与发现.md`
  - 📌 **扣子远程执行机制（2026-06-24）**：扣子能操作用户本地 Windows 的原理——用户在电脑上部署扣子 agent 客户端（内置 WSL 或沙箱执行环境），云端 Agent 的 bash 指令经扣子平台→agent 客户端→本地执行→返回结果。这是一条远程通道，不是 Agent 和用户在同一台机器上
  - 📌 **飞书 MCP 文档能力（2026-07-03）**：飞书官方 MCP Server（`mcp.feishu.cn/mcp`）提供 6 个文档工具：search-doc / create-doc / fetch-doc / update-doc / get-comments / add-comments。Agent 通过 HTTP + TAT/UAT 令牌调用。另有 lark-cli（MIT 开源）覆盖 12 个业务域，支持文档/PPT/表格创建与精准编辑
- [ ] **AI 编程工具生态**（2026-06-30 社区调研 📌）
  - **社区黄金组合**：Cursor（日常主力，$20/月 Pro）+ Claude Code（重活按需，用完关）+ Copilot（企业合规）
  - **Cursor 效率实测**：项目骨架 8x / CRUD 6x / 补测试 4x / Bug排查 7.5x；Monorepo 偶发迷路
  - **Claude Code 限流真相**：Pro $20/月 15-30min 耗尽 + 缓存 bug 多吞 ~40% token + 三产品共享限额（网页/Cowork/Code 互抢）
  - **ccswitch 破局**：截胡 Claude Code API→DS V4 Pro，成本 ~1/29、不限流；丢失多模态（截图定位 bug 不可用），可随时切回 Anthropic
  - 📌 **Claude Code Sub-agent 机制（2026-07-02）**：Markdown 文件 = Agent（`.claude/agents/`），YAML 头控制元能力（model/allowedTools/description）+ 正文控制行为逻辑。Sub-agent 自动调度（独立上下文+受限工具+摘要回传）vs Slash Command 手动触发（共享上下文）。并行/串行编排规则写 CLAUDE.md，主 Claude 自动判断。内建 Agent：Explore（Haiku/只读）、Plan（只读）、General-purpose（全工具）。核心设计哲学：上下文隔离 = 防 token 爆炸的秘密武器
  - 📌 **Claude Code Effort 七档（2026-07-03）**：控制思考深度的旋钮，对 DeepSeek 后端也有效。low→medium→high(默认)→xhigh→max→ultracode→auto。三种设置：CLI `/effort xhigh` / 环境变量 `CLAUDE_CODE_EFFORT_LEVEL=xhigh` / settings.json。实操原则：日常 90% 用 medium/high，硬骨头临时切 xhigh/max；max 是 session-only 的别设全局。扣子平台是「自动挡」（Adaptive Thinking，模型自判思考深度），无法手动控制
  - 📌 **模型稳定性三线备份（2026-07-03）**：DeepSeek 2026年已崩18次（日活1.2亿→2亿涨66.7%，算力仅涨8.3%），高峰期 API 价格翻倍。备份方案：① 硅基流动（SiliconFlow）跑 DeepSeek V4 日常用（国内链路稳定，改 base_url 即可）② moxin.online 中转 Claude Sonnet 5 按需切（复杂 Agent 调试）③ 通义千问 Qwen3-Max 兜底（阿里基建永不崩）。CC Switch 可配 UI 切换，但 moxin 不支持 Anthropic 分级映射（Haiku/Sonnet/Opus 档位大概率不生效）
  - 核心原则：「工具是地板，方法才是天花板」——同工具不同人产出差数倍
  - 详细笔记 → `AI学习/学习笔记/主流模型速览笔记.md` 第七章「编程工具生态」
  - 💡 变现决策：WSL2 + ccswitch + Claude Code 搭建全链路 → `AI学习/变现决策/002-开发环境配置-ClaudeCode搭建.md`（面试可讲点：环境搭建/成本意识/安全边界/社区验证）
- [ ] **MCP 协议**：USB-C for AI（工具调用统一接口）🔜 下一课
  - 当前：已集成飞猪 + 滴滴 MCP。L3 路线 A 首选——MCP Server 开发/Tool 注册/资源管理待学
  - 📌 **2026-06-24 MCP vs CLI 进程模型**：MCP 长连接常驻后台（管家待命），CLI 每次调用启动新进程（用完即走）；MCP 后续调用轻量但占内存，CLI 冷启动有延迟但零驻留；PS 命令可查看进程状态。视频观点：CLI 更适合 AI Agent 批量自动化场景
  - 📌 **MCP 深入认知（2026-06-24）**：
    - **MCP Server 双重身份**：对 AI 应用是 Server（暴露工具/等待调用），对外部 API 是 Client（发 HTTP 请求获取实际数据）；MCP Server 是"中间翻译官"而非最终数据源——真正提供数据的服务器（天气/数据库等）在远端
    - **MCP vs Skill 本质类比**：MCP = 说明书（告诉 AI 工具有什么参数，协议层），Skill = 菜谱（告诉 Agent 多个工具怎么编排、有什么坑、什么顺序，业务编排层）；MCP 管"单个工具长什么样"，Skill 管"多个工具怎么编排"——两者是同一件事（包装外部能力给 AI）的两套方案，MCP 通用跨平台，Skill 扣子深度集成
  - 📌 **MCP 深入认知（2026-06-29）**：
    - **三层角色架构**：Host（AI 应用，如 Claude Desktop/Cursor/扣子）→ Client（内部连接器，1:1 管 Server）→ Server（提供工具的外部进程）；三个角色严格区分
    - **三大 Server 原语（按控制方区分）**：Tools（模型控制，Function Calling 标准化包装）→ Resources（应用控制，按需读取的只读数据）→ Prompts（用户控制，类似斜杠命令模板）
    - **两种传输方式**：stdio（本地子进程，JSON-RPC 走 stdin/stdout）→ Streamable HTTP（远程 POST JSON-RPC 到 `/mcp` 端点）；飞猪/滴滴 MCP 即 Streamable HTTP
    - **2026 最大变化（2026-07-28 RC）**：有状态→无状态，取消 Session-Id 和 initialize 握手，任何 Server 实例都能处理，可部署在普通负载均衡后面
    - **安全四硬原则**：用户同意 / 数据隐私 / 工具安全（annotation 不可信）/ Token 禁止透传（防混淆代理攻击）；HTTP 传输基于 OAuth 2.1 + PKCE
    - **与 FC 关系**：MCP 和 FC 不冲突——FC 是模型能力层，MCP 是协议层；Claude Code 用 FC 调工具，工具定义来自 MCP Server
  - 📌 **MCP vs Claude Code Sub-agent 互补（2026-07-02）**：MCP 管「单个工具长什么样」（协议标准），Sub-agent 管「复杂任务怎么分工协作」（编排机制）——两者解决不同层次问题、互补不替代。MCP 产物是 Server 代码（Python/TS），Sub-agent 产物是 Markdown 文件
- [ ] **LangChain / LlamaIndex**：看代码读代码，不深造轮子
  - 📌 **LangChain Agent 实战（2026-07-02，07-02 更新）**：旅游搭子项目首跑——经历 `create_tool_calling_agent` + `AgentExecutor` → 发现 LangChain 1.3.x 重新引入 `create_agent` → 最终方案：`create_agent(model, tools)` 不传 system_prompt + 手动注入 SystemMessage 实现动态记忆。笔记→[LangChain_Agent实战-旅游搭子搭建](./学习笔记/LangChain_Agent实战-旅游搭子搭建.md)
- [ ] **向量数据库**：Chroma / Milvus / Qdrant（选 1 个深入）
- [ ] **评估与可观测性框架**：Promptfoo / Langfuse / DeepEval

### L4 · 应用层（落地到具体产品，6-12 个月）
> 真正值钱的是"在场景里跑通"——技术是手段，产品是目的。
- [ ] **AI Agent 应用架构设计**：0 到 1 设计一个能跑的产品
- [ ] **多模态能力集成**：视觉 / 语音 / 视频 / 图像生成
- [x] **成本与性能优化**：token 经济 / 缓存 / 批处理 / 模型分级（2026-07-02 已实战：旅游搭子 Pro/Flash 双模型分流 + 跨模型四层路由方案）
- [ ] **用户体验设计**：对话流 / 反馈机制 / 兜底 / 主动触达节奏
- [ ] **提示词安全**：注入攻击 / 越狱防护 / 隐私脱敏

### L5 · 工程师能力层（找工作直接用）
> 技术到位 + 包装到位 = offer。简历是包装能力的 1/N 倍输出。
- [ ] **系统设计**：从 0 到 1 拆解一个 AI 应用（需求 → 架构 → 评估）
  - 📌 **Durable Streams 案例（2026-07-01）**：Jetson本地TTS用命名日志替代 queue+DB+对象存储——一条stream同时承担任务队列/状态存储/产物输出三角色。核心模式：条件追加替代锁表、offset替代状态DB、流即产物替代对象存储、内容寻址天然缓存。小而美的系统设计范本——8条stream+1个worker+1个gateway跑在$249 Jetson上
- [ ] **评估方法论**：怎么证明你的 Agent 比 baseline 好
- [ ] **可观测性**：日志 / Trace / 监控 / 异常告警
- [ ] **代码质量**：单元测试 / 重构 / 文档
- [ ] **简历 / 项目 / 面试表达**：把"会做"变成"能讲"

---

## 横向关联（不在主树上，但常遇到）

- **商业化**：订阅 / 计费 / ROI / LTV
- **行业场景**：教育 / 电商 / 客服 / 办公 / 创作 / 旅行
- 📌 **毕业论文选题（2026-06-17）**：方案A讨论后取消，不再追踪
- **AI 法规与伦理**：国内大模型备案 / 数据合规
- **职业路径**：创业 / 打工 / 自由职业 / 独立开发者

---

## 阅读追踪

### 已读归档
- [2026-06-12] CSDN《AI 大模型上下文工程：从提示词到认知管理的范式跃迁》
  - 链接：https://blog.csdn.net/hyc010110/article/details/152801878
  - 重点：七层架构 / Goldilocks Zone / 生命周期决策
  - **核心增量**（独有）：七层架构框架 / 跨模型对比表 / 3 阶段发展史 / 上下文污染 / Token 经济性 / 认知科学基础
  - 主人反馈："内容有用，但希望下次更权威" → 门槛 ⑤ 来源权威性 已加入
  - 关联：旅游搭子 SKILL.md 优化
- [2026-06-13] CSDN linshantang《Anthropic 发布 AI Agent 上下文工程指南：让你的 AI Agent 更聪明》
  - 链接：https://linshantang.blog.csdn.net/article/details/153198513
  - 重点：基于 Anthropic 官方原文翻译 + Just-in-time 策略
  - **核心增量**（独有）：Anthropic 原文翻译 / Just-in-time 随用随取 / Claude 玩宝可梦真实案例
  - **重叠警告**：与第一篇约 50% 重叠（上下文腐烂/金发姑娘/工具设计/三大长时技巧都讲过），仅 3 块增量有独立价值
  - 主人反馈："和第一篇有很多重复" → 选文规则修订：选文前必须做查重，重叠度 > 30% pass
  - 关联：Anthropic 官方 CE 指南中文版 / Claude Code 实战

### 主线阅读（每周 1-2 篇，每篇 ≤ 30 分钟）
- [2026-06-13] 📕 **Anthropic 官方《Effective context engineering for AI agents》** ⬅️ 候选备选（最权威原文）
  - 链接：https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents （官方）/ 镜像：https://www.ainbox.in/inbox/anthropic/Effective-context-engineering-for-AI-agents
  - 重点：Compaction / Structured note-taking / Sub-agent architectures
  - 预计：20-30 分钟（英文阅读 -30% 速度）
  - 门槛：① 强相关 ✅ ② 可复利 ✅（与两篇中文版查重，预期重叠 ~50%，**新规则：重叠度可能 > 30%，待复审**）③ 有实操（Claude Code 案例）✅ ④ 非营销 ✅ ⑤ 权威性 ⭐⭐⭐（CE 概念发源地）
  - **状态变更：暂停推荐，待主人决定是否要读"原汁原味英文版"**
- [2026-06-25~26] ✅ **上下文工程 CE 五节课系统学习** 全部完成
  - §1 基础概念 → §2 窗口矛盾(四种失败模式) → §3 六大策略+四类操作 → §4 前沿(ACE/GAM/SAC/mcpo) → §5 编程实战+扣子体系全映射
  - 笔记：`AI学习/学习笔记/CE学习笔记.md`，词汇表新增 22 条目
  - 核心结论：记忆三层架构与扣子体系完美映射，RAG+CE 构成 L2 工程层完整知识闭环

### 速读补充（5 分钟内）
- [2026-07-01] 📖 **Anthropic Claude Science (Beta)** — [IT之家](https://www.ithome.com/0/970/873.htm)
  - 一句话：Anthropic 6/30 发布科学家 AI 工作台，非新模型而是多 Agent 编排系统——主 Agent 协调 60+ 子 Agent + 审阅 Agent 把关，集成 NVIDIA BioNeMo 工具链
  - 关联：Agent 设计模式工业落地 / Orchestrator-Workers + Evaluator 模式验证
- [2026-07-01] 📖 **Durable Streams 架构** — [s2.dev/blog/local-ai](https://s2.dev/blog/local-ai)
  - 一句话：Jetson Orin Nano ($249) 部署 TTS，用命名日志替代 queue+DB+对象存储；条件追加替代锁表、流即产物、内容寻址天然缓存
  - 关联：L5 系统设计案例 / Event Sourcing / 旅游搭子后端架构可借鉴
- [2026-07-01] 📖 **Hermes Agent 175K Stars** — [GitHub](https://github.com/NousResearch/hermes-agent)
  - 一句话：开源 Agent 框架 4 个月 175K Stars（MIT），三层记忆架构、16+ 平台、技能市场 agentskills.io
  - 关联：Agent 生态 / 技能共享标准 / Memory 管理进化路线（L1→L4 知识图谱）
- [2026-06-22] 📖 **Sakana Fugu：多智能体系统即模型** — [sakana.ai/fugu/](https://sakana.ai/fugu/)
  - 一句话：Sakana AI 基于 ICLR 2026 TRINITY + Conductor 的多 Agent 编排系统（已提供 API）；不是「更好的模型」而是「模型的模型」——动态编排最强模型协作，多个模型协同可超过任何单个模型
  - 关联：Agent 编排 / Multi-Agent 架构 / L3 工具与生态层
- [2026-06-12] Anthropic June 2026《Intelligence is Moving Out of the Model》
  - 链接：https://latestllm.com/articles/anthropics-bold-ai-redesign-why-intelligence-is-moving-out-of-the-model-mq2tptpe
  - 一句话：Anthropic 把"智能"从模型本身移到了**外部支架**（系统提示+工具+验证+工作流）
  - 状态：📖 速读

### 历史归档
（暂无）

---

## 实战项目库（已落地能力）

| 项目 | 状态 | 沉淀能力 | 2.0 方向 |
|------|------|---------|---------|
| 旅游搭子 v1.0 | ✅ 已上线 | MCP 集成 / 多轮对话 / 主动触达雏形 | Memory + 旅伴偏好学习 |
| 健身搭子 v1.0 | ✅ 已上线 | 动作库 / 计划生成 / 追踪 | 肌肉图谱迁移到 body-muscles |
| 扣子云设备 | ✅ 已了解 | 云手机 + 云电脑 | 待 1 个月后决定要不要跑实操 |
| OpenClaw 本地部署 | ✅ 已完成 | Tailscale Funnel 公网 HTTPS | 健身打卡场景已验证 |
| 墨信online API | ✅ 已对接 | 自定义模型调度 | 已用 Opus 4.6 / DeepSeek-V4 |
| Agent 工作日志 v1.0.0 | ✅ 已发布虾评 | 技能开发全流程 / 极轻索引 / append陷阱 / RAG同构洞察 | 评测转正（≥20条SBI+≥2.0分）/ 跨Agent聚合 |

---

## 工具栈清单

- **主对话平台**：扣子（自动模式调度）
- **本地设备**：LAPTOP-4B5RQ2A7（Windows 11）
- **AI 编程工具**：Cursor（日常主力）+ Claude Code via WSL2 + ccswitch → DS V4 Pro（重活按需）
- **数据来源**：中国天气网（天气）/ Open-Meteo（API）/ 飞猪（旅行）/ 滴滴（出行）
- **邮箱链路**：Polaris_agent@coze.email ↔ 主人 QQ 邮箱

---

## 学习辅助工具

| 工具 | 用途 | 链接 | 创建日期 |
|------|------|------|---------|
| 词汇表搜索工具 | 实时搜索 AI 词汇表，中英文关键词检索 | `AI学习/词汇表搜索工具.html` | 2026-06-16 |
| 知识树浏览工具 | 六层树形可视化 + 层级统计 + 搜索，直观展现学习路径 | `AI学习/知识树浏览工具.html` | 2026-06-20 |

> 📌 **同步规则（2026-06-20）**：词汇表/知识树每次更新后，必须同步更新对应 HTML 工具中的共享链接（`file_to_url` 生成新链接替换），确保浏览器端始终拉取最新数据。

## 维护规则

| 触发场景 | 动作 |
|---------|------|
| 读完一篇主线/速读 | 在"阅读追踪"标 ✅，把核心 3 句话总结写进对应节点 |
| 新学一个概念 | 判断属于哪一层哪个节点，补进去；都不属于则新建节点 |
| 遇到认知卡点 | 在对应节点下加 `❓待解决` 标记 + 一句话描述 |
| 主人说「记笔记」 | 将当前学到的知识整理写入 `AI学习/学习笔记/`（规则：2026-06-19） |
| 完成一个项目/技能 | "实战项目库" +1 行，写清沉淀能力 |
| 主人画像更新 | USER.md 同步 |
| 每月 1 号 | 复盘：点亮节点数 / 卡住节点 / 是否调整层级 |

---

## 1 个月里程碑（2026-07-12）

- [x] L2 上下文工程 ✅ CE 五节课全部完成 + 已读 2 篇(CSDN hyc010110 + linshantang)；RAG ✅ 五大子主题全部完成。L2 双主线收工
- [x] L2 RAG 1/2 篇已读（腾讯云《企业级RAG深度指南》）
- [ ] L2 RAG 2/2 篇待读（Anthropic Contextual Retrieval）
- [x] L2 RAG Chunking + Rerank 论文已下载：Lost in the Middle + Cross-Encoder vs LLM Reranker（2026-06-21，arxiv-reader 获取）
- [x] L2 FC + Agent设计模式 + Memory管理 全部完成（2026-06-27~28）
- [x] AI编程工具生态深度调研完成 + Claude Code搭建全链路（2026-06-30）
- [x] L3 学习路线已确定：A. MCP深入 → B. 旅游搭子落地 → C. 多Agent系统（2026-07-01）
- [ ] L3 MCP 第二课（Tool 发现/动态注册，30-40分钟）
- [ ] L0 编程基础自查（评估自己 Python 水平）
- [ ] 旅游搭子 / 健身搭子任一做一次小迭代（验证 L2 学到能用）
- [ ] 完成 **Agent CE 范式** 活案例梳理：把旅游搭子 SKILL.md 作为 L1 按规则跑的真实样本过一遍，验证 4 个挑战是否都在踩点

---

## 偏差预警（防止跑偏）

来自 AI-2 长期格局分析的 3 条预警：
1. **追新不追深**：GPT-5 / Claude 5 / Gemini 4 出了别第一时间追，先把 L2 当前主题吃透
2. **学完才敢动手**：读到 60% 就可以开"边读边做"，不必等"全懂"
3. **技术自嗨**：评估一个东西值不值得学，看"3 个月后能不能用上"，不能就跳过
- [2026-06-15] 腾讯云《企业级RAG深度指南》
  - 链接：https://adp.tencentcloud.com/zh/blog/enterprise-rag-guide
  - 重点：企业级 RAG 完整架构选型 / 部署决策 / 评估体系 / 分块与检索策略
  - **核心增量**（独有）：企业级视角（多级缓存/搜索/知识库团队协作）、完整选型决策树、生产级评估方法论
  - 状态：✅ 已读，核心增量待提炼写入 L2 RAG 节点
  - 关联：L2 RAG 主线第一篇，与第二篇 Anthropic Contextual Retrieval 零重叠