学习与时间指引地图

三层之上,
把时间投在离工作最近的那层

这不是"读什么"的清单,而是"时间该往哪投"的决策图。三篇 Tw93 文章、几个动手项目,按你瞄准的 applied / product / FDE 目标,重新排过优先级。

▌ 定盘星 / 这张图的全部逻辑

你要卖的能力,是"把现成模型变得好用",不是"造模型"。所以时间分配是按这个目标倒过来排的:离你工作最近的层,投入最多;越往底层(造模型),越是"懂原理即可"的背景。一句话——FDE 的活,是 harness 层,不是模型层。

LAYER 2 · 主战场

Harness / Agent 层the controls — 你的吃饭家伙

拿一个现成的模型,组织成一个能稳定干活的系统:控制流、上下文工程、工具设计、记忆、评测、追踪、安全。

★ 这就是 FDE 的岗位描述本身

~55%

时间占比

理论地图

Tw93《你不知道的 Agent:原理、架构与工程实践》——它几乎就是 Claude Code 的内部原理说明书。

动手实验室

20 行循环 → learn-claude-code(20 章手搓 harness)→ 在 Claude Code 里逐项验证 → OpenClaw 对照真实源码

难点性质:后半截是经验工程(古德哈特定律 / 激励设计),不是数学。你十年商业运营、设 KPI、看人钻流程漏洞的背景,在这里是稀缺资产。
你的领先:你天天用 Claude Code、写过 cold-water-critic / khazix-writer / publish、对比过 OpenClaw——你早就在这层了,只是缺一张地图把"手感"变成"原理"。
补的空档:learn-claude-code 正是这层一直缺的"中间台阶"——agent 层的 nanoGPT / nanochat,从那 20 行一路加料到完整 harness,和你模型层的梯子结构对称。但要限时:20 章会上瘾,它是手段不是目的,别让它把 Layer 3 的作品挤掉。

LAYER 3 · 变现层

应用 / 交付层the product — 作品 > 简历

用上面两层的理解,做出真能跑的东西、建立可证明的作品集。FDE 招聘看的是"你做过什么",不是"你读过什么"。

~28%

时间占比

理论地图

你自己的项目;Tw93《AI Coding》《Claude Code》两篇当辅助参考。

动手实验室

你已有的资产:胖猴信奥工具(Luogu 诊断)、publish skill、写作/批评 skills——把它们升级到"作品集"级别。

关键连接:你的胖猴项目本来就是真实场景,正好当 Layer 2 技能的练兵场——把一个真实需求,用 Agent 工程的结构(工具/记忆/评测)重做一遍,它就同时是练习、是作品、是面试能讲的案例。三件事一次办成。

LAYER 1 · 背景层

模型层the engine — 懂原理即可

模型权重是怎么来的:架构 + 训练。理解它,是为了看懂上面两层"为什么"是这样,而不是为了自己去训模型。

~17%

时间占比

理论地图

Tw93《你不知道的大模型训练》——当全景地图读,别指望它"点火"。

动手实验室

3B1B 点火 → micrograd → nanoGPT →(选)nanochat / Raschka

难点性质:前半截(架构 / 反向传播)是数学,可推导,够用即止,不必钻 GRPO 工程那种深水区。
给孩子:这层的前半截(图 + 递归 + 一点导数)正好是孩子的菜,可以分给他——这是你俩唯一真正重叠、且他可能比你快的地方。

文章讲的层	配套动手
注意力 / 架构 / 预训练(前 3 节)	micrograd → nanoGPT
tokenizer、SFT、RL(GRPO)、完整流水线	nanochat
工业级完整复现	Raschka《Build a LLM from Scratch》

文章讲的层

配套动手

注意力 / 架构 / 预训练(前 3 节)

micrograd → nanoGPT

tokenizer、SFT、RL(GRPO)、完整流水线

nanochat

工业级完整复现

Raschka《Build a LLM from Scratch》

三层之上,
把时间投在离工作最近的那层

把三篇文章、所有动手,归到三层里

Harness / Agent 层the controls — 你的吃饭家伙

应用 / 交付层the product — 作品 > 简历

模型层the engine — 懂原理即可

接线规则:理论配动手,只在同层内配对

钱(时间)往哪花,一眼看清

看见全貌

主攻 Layer 2

穿插补 Layer 1 背景

Layer 3 变现,持续做

你不是从零开始

你已有的领先(直接折算成进度)

为什么"后半截"难,但你恰好装备齐全

本轮对话全文

一、它讲得对吗 —— 基本都对,是真懂的人写的

二、要不要结合"自己构建"—— 要,但有个关键反转

为什么对孩子尤其难

为什么对所有人(包括你)都难

给你的专属视角转换(今天最有用的一句)

一、文章本身 —— 写得很好,比训练那篇更"硬"

二、关键反转 —— 它不该配 nanochat,这是层级错位

三、该配什么动手 —— 比 nanochat 简单一万倍

最后:跟你转型方向直接相关