【论文精读】FramePack:在下一帧预测视频生成模型中打包输入帧上下文 摘要 FramePack由斯坦福大学张吕敏等提出,是一种输入预处理模块,可无缝集成到主流视频扩散模型(如混元视频模型),通过自适应帧压缩和反漂移采样,有效提升长时序一致性和生成质量,支持13B模型在6GB显存上流畅生成长视频,显著降低算力门槛。 目录 背景与研究目标 方法与创新点 实验与结果分析 模型启发与方法延伸 结论与未来展望 Lvmin Zhang, Maneesh Agrawala2025年4月26日大约 6 分钟视频生成论文精读张吕敏FramePack视频生成扩散模型输入预处理