摘要
阿里巴巴 Ovis-U1 是一个仅3B参数的统一多模态模型,通过创新的六阶段训练,集成了理解、生成与编辑能力。该模型在 OpenCompass 基准上超越同级,生成和编辑能力媲美更大模型,展现了紧凑模型实现通用多模态能力的潜力。
目录
2025年7月4日大约 6 分钟
阿里巴巴 Ovis-U1 是一个仅3B参数的统一多模态模型,通过创新的六阶段训练,集成了理解、生成与编辑能力。该模型在 OpenCompass 基准上超越同级,生成和编辑能力媲美更大模型,展现了紧凑模型实现通用多模态能力的潜力。
ComfyUI-R1是一个创新的推理模型,能将自然语言指令转换为结构复杂的ComfyUI工作流。通过结合精心构建的知识库和两阶段训练流程(监督微调和GRPO强化学习),该模型在格式有效性、节点选择和端到端性能方面表现卓越。