标签: AIGC

摘要

阿里巴巴 Ovis-U1 是一个仅3B参数的统一多模态模型，通过创新的六阶段训练，集成了理解、生成与编辑能力。该模型在 OpenCompass 基准上超越同级，生成和编辑能力媲美更大模型，展现了紧凑模型实现通用多模态能力的潜力。

ComfyUI-R1是一个创新的推理模型，能将自然语言指令转换为结构复杂的ComfyUI工作流。通过结合精心构建的知识库和两阶段训练流程（监督微调和GRPO强化学习），该模型在格式有效性、节点选择和端到端性能方面表现卓越。