模型精读 Roadmap

Abstract

这篇回答：
在已经学完 TFB 主线框架之后，模型精读这一阶段应该怎么推进。

1. 当前阶段判断

你现在不再处于“理解 benchmark 怎么跑”的阶段。

你现在的阶段是：

固定框架入口，系统精读代表模型。

也就是：

外层框架主线已经有了
_eval_batch 这层协议也已经固定了
现在开始真正进入：
- 模型主链
- 论文理论
- 代码对象

2. 这一阶段的目标

不是“看很多模型”，而是：

用最少的代表模型，建立稳定的论文 - 代码 - 框架映射能力。

如果这一步做不好，后面你去：

改模型
做实验
找研究问题

都会虚。

3. 路线的总原则

原则 1：框架入口固定

所有模型精读都建立在同一条真实入口上：

text

run_benchmark
-> pipeline
-> eval_model
-> RollingForecast._eval_batch
-> fit_method / batch_forecast
-> _process
-> model.forward

原则 2：先模型主链，后细节模块

先搞清：

forward(...)
主分支
输入输出

再下钻：

embedding
encoder
decoder
attention

原则 2.5：先图，再代码；代码和例子一起讲

每一层都固定这个顺序：

顺序图
分层树图
完整代码
带中文注释的代码
toy example
参数与 tensor 映射

原则 3：先最小对照，再横向扩张

先学：

DLinear
Informer

再学：

PatchTST
iTransformer
Autoformer

原则 4：每个模型都要回到 TFB 坐标

不能只懂模型内部，也要知道：

在 benchmark 哪一层开始分叉
adapter 给它什么输入
它如何回到统一监督接口

4. 三层数据规模

L1 微型假数据

目的：

学 forward(...)
学 shape
学模块顺序

L2 一批真实 TFB 数据

目的：

学模型如何接入真实框架
学 _process(...) -> model.forward(...)

L3 完整 benchmark

目的：

学模型在完整外层里的真实位置
做最小模型对照实验

5. 当前模型顺序

第一阶段：建立最小对照

DLinear
Informer

第二阶段：Transformer 结构变体

PatchTST
iTransformer
Autoformer

第三阶段：机制扩展

FEDformer
Nonstationary_Transformer
TimeMixer

6. 每个模型的固定产物

每个模型最后都至少应该有：

一篇“模型在 TFB 中的真实入口”文档
一篇“模型主链”文档
一张“论文模块 -> 代码对象”映射表
一份 checkpoints

7. 当前最优先的任务

现在优先级只有这个：

任务 1

重写 Informer 的新一代文档。

不是修旧 phase1 文档，而是新写一套以真实 TFB 入口为起点的文档：

Informer 在 TFB 中的真实入口
Informer.forward 主链
DataEmbedding
Encoder
Decoder
论文 - 代码映射表
Checkpoints

8. 你现在不该做什么

不要：

再继续扩高层框架文档
同时开很多模型
一开始就追大实验
一开始就做大改动

9. 下一步动作

下一步就从这里开始：

写 Informer 在 TFB 中的真实入口。

然后按这个顺序继续：

Informer.forward 主链
参数总表
最小数学例子
DataEmbedding
Encoder
Decoder

10. 最后压成 5 句话

当前阶段是模型精读阶段，不是框架补课阶段。
这一阶段的核心是建立“论文 - 代码 - 框架”稳定映射。
所有模型精读都必须从真实 TFB 入口出发。
当前第一批顺序是 DLinear -> Informer -> PatchTST -> iTransformer -> Autoformer。
你现在最直接的下一步，就是沿着 Informer 这一套文档自顶向下细读。

DLinear_v1_archive

Informer_v1_archive

PatchTST_v1_archive

12-SelfAttention_Family

01-DLinear

02-PatchTST

03-Informer

模型精读 Roadmap

1. 当前阶段判断

2. 这一阶段的目标

3. 路线的总原则

原则 1：框架入口固定

原则 2：先模型主链，后细节模块

原则 2.5：先图，再代码；代码和例子一起讲

原则 3：先最小对照，再横向扩张

原则 4：每个模型都要回到 TFB 坐标

4. 三层数据规模

L1 微型假数据

L2 一批真实 TFB 数据

L3 完整 benchmark

5. 当前模型顺序

第一阶段：建立最小对照

第二阶段：Transformer 结构变体

第三阶段：机制扩展

6. 每个模型的固定产物

7. 当前最优先的任务

任务 1

8. 你现在不该做什么

9. 下一步动作

10. 最后压成 5 句话

模型精读 Roadmap ​

1. 当前阶段判断 ​

2. 这一阶段的目标 ​

3. 路线的总原则 ​

原则 1：框架入口固定 ​

原则 2：先模型主链，后细节模块 ​

原则 2.5：先图，再代码；代码和例子一起讲 ​

原则 3：先最小对照，再横向扩张 ​

原则 4：每个模型都要回到 TFB 坐标 ​

4. 三层数据规模 ​

L1 微型假数据 ​

L2 一批真实 TFB 数据 ​

L3 完整 benchmark ​

5. 当前模型顺序 ​

第一阶段：建立最小对照 ​

第二阶段：Transformer 结构变体 ​

第三阶段：机制扩展 ​

6. 每个模型的固定产物 ​

7. 当前最优先的任务 ​

任务 1 ​

8. 你现在不该做什么 ​

9. 下一步动作 ​

10. 最后压成 5 句话 ​

模型精读 Roadmap

1. 当前阶段判断

2. 这一阶段的目标

3. 路线的总原则

原则 1：框架入口固定

原则 2：先模型主链，后细节模块

原则 2.5：先图，再代码；代码和例子一起讲

原则 3：先最小对照，再横向扩张

原则 4：每个模型都要回到 TFB 坐标

4. 三层数据规模

L1 微型假数据

L2 一批真实 TFB 数据

L3 完整 benchmark

5. 当前模型顺序

第一阶段：建立最小对照

第二阶段：Transformer 结构变体

第三阶段：机制扩展

6. 每个模型的固定产物

7. 当前最优先的任务

任务 1

8. 你现在不该做什么

9. 下一步动作

10. 最后压成 5 句话