主题归档 · 2026-05-19
用小白能听懂的方式,从 Stable Diffusion 为什么难控制讲起,逐步解释 ControlNet 的动机、结构、零卷积、训练与推理流程,并配上伪代码和 diffusers 示例代码。
主题归档 · 2026-05-06
从概率路径、训练目标、采样动力学和工程优势四个层面解释 Flow Matching 与 Diffusion 的关系:Diffusion 可以看作一类带随机噪声的 score-based 生成过程,而 Flow Matching 更直接学习把噪声分布搬运到数据分布的确定性速度场,因此在训练目标、采样效率、路径设计和大模型工程上更统一、更方便。
主题归档 · 2026-05-04
从扩散模型的基本训练目标出发,解释 DiT 如何把 noisy image/latent 切成 token,用 Transformer 预测噪声或速度场,并用一个 CIFAR-10 教学版实现串起数据、shape、模块、loss 与采样流程。
主题归档 · 2026-04-30
解释为什么生成模型历史上先由 Diffusion 取得主导,而不是更直观的 Flow Matching:Diffusion 继承了去噪、score matching 和概率建模传统,训练稳定且早期经验成功;Flow Matching 则需要 ODE、continuous flow、optimal transport、rectified flow 等理论与工程共识成熟后才成为主流。
主题归档 · 2026-04-25
系统梳理视频生成从 GAN/VAE 时代、扩散范式崛起、级联与高分辨率、DiT 与大规模开源,到 2026 年多模态音视频联合生成与世界复杂性竞争的发展逻辑。