Autoencoder Training - 搜索 News

MiniMax海螺首次开源 VTP，打通了 Visual Tokenizer 的 Scaling Law

在 LDM、DiT 这类两阶段生成框架里，第一阶段的 visual tokenizer（常见是 VAE 或者是 AutoEncoder）把图像压进 latent，第二阶段扩散模型在 latent 上学生成。

一些您可能无法访问的结果已被隐去。