摘要
ComfyUI-R1是一个创新的推理模型,能将自然语言指令转换为结构复杂的ComfyUI工作流。通过结合精心构建的知识库和两阶段训练流程(监督微调和GRPO强化学习),该模型在格式有效性、节点选择和端到端性能方面表现卓越。
目录
2025年6月12日大约 8 分钟
ComfyUI-R1是一个创新的推理模型,能将自然语言指令转换为结构复杂的ComfyUI工作流。通过结合精心构建的知识库和两阶段训练流程(监督微调和GRPO强化学习),该模型在格式有效性、节点选择和端到端性能方面表现卓越。
FramePack由斯坦福大学张吕敏等提出,是一种输入预处理模块,可无缝集成到主流视频扩散模型(如混元视频模型),通过自适应帧压缩和反漂移采样,有效提升长时序一致性和生成质量,支持13B模型在6GB显存上流畅生成长视频,显著降低算力门槛。
扩散模型 (DMs) 在下游任务中反向传播计算成本高昂。本文提出捷径扩散优化 (SDO),通过仅保留一步计算图优化目标函数,显著降低约90%计算成本,同时保持或超越完整反向传播性能。SDO适用于潜变量优化、模型微调等任务,兼具通用性、高性能和轻量级特点。