Qwen3-Coder开源代码生成王者|Higgs Audio V2革新音频生成|Neta-Lumina创新动漫生成【HF周报】

neverbiasu大约 5 分钟

Qwen3-Coder开源代码生成王者|Higgs Audio V2革新音频生成|Neta-Lumina创新动漫生成【HF周报】

摘要

本周亮点：Qwen3-Coder代码生成模型、Higgs Audio V2音频生成大模型、Neta Lumina动漫图像生成模型等重磅新品发布，涵盖代码、音频、图像等多领域创新。详情见下文，参考链接见文末。

Qwen3-Coder：480B参数的代码生成利器
Higgs Audio V2：音频生成新突破
Neta Lumina：艺术生成的未来
OmniSVG：矢量图生成的革命
Seed-X-PPO：强化学习的前沿探索
Solidity-LLM：智能合约生成专家
KAT-V1：40B参数的多模态模型
HunyuanWorld：腾讯的AI生态新成员

Qwen3-Coder：480B参数的代码生成利器

概要：Qwen团队发布了Qwen3-Coder，这是一款拥有480B参数、激活35B参数的混合专家（MoE）代码生成模型。它在代理式编码、浏览器使用等任务上表现出色，性能媲美Claude Sonnet。该模型原生支持256K长上下文，可扩展至1M，能轻松处理整个代码库级别的理解任务，并为Qwen Code、CLINE等平台提供强大的代理式编码支持。

标签：#Qwen #代码生成 #MoE #长上下文 #AI开发工具

Higgs Audio V2：音频生成新突破

概要：BosonAI推出了Higgs Audio V2，这是一款基于Llama-3.2-3B架构、拥有3.6B参数的强大音频基础模型。该模型在超过1000万小时的音频数据上进行预训练，展现出卓越的表现力音频生成能力，不仅在传统TTS基准测试中达到SOTA水平，还具备自动韵律适应、零样本多语种多说话人对话生成、克隆音色哼唱旋律以及语音与背景音乐同步生成等新兴能力。

标签：#BosonAI #音频生成 #TTS #多模态 #Llama-3.2

Neta Lumina：艺术生成的未来

概要：Neta.art Lab发布了Neta Lumina，这是一款高质量的动漫风格图像生成模型。该模型基于上海人工智能实验室Alpha-VLLM团队开源的Lumina-Image-2.0，并使用了大量高质量动漫图像和多语言标签数据进行微调。得益于Gemma文本编码器，它具备强大的理解和解释能力，能够精准响应复杂的自然语言提示，特别针对Furry、国风等多种创意场景进行了优化。

标签：#Neta #图像生成 #动漫风格 #Lumina #Gemma

OmniSVG：矢量图生成的革命

概要：OmniSVG团队推出了首个利用预训练视觉语言模型（VLM）的端到端多模态SVG生成模型系列——OmniSVG。该模型能够生成从简单图标到复杂动漫角色的各类SVG图像。同时，团队还发布了包含200万个丰富注释SVG资产的多模态数据集MMSVG-2M，并为条件SVG生成任务建立了标准化的评估协议，极大地推动了矢量图形生成领域的发展。

标签：#OmniSVG #矢量图生成 #VLM #多模态 #数据集

Seed-X-PPO：强化学习的前沿探索

概要：ByteDance Seed团队发布了Seed-X-PPO-7B，这是一款强大的开源多语言翻译语言模型。该模型通过强化学习进行训练，在7B参数规模内实现了顶尖的翻译能力，表现可与Gemini-2.5、Claude-3.5和GPT-4等超大模型相媲美。它基于Mistral架构，轻量高效，易于部署，并覆盖了互联网、科技、法律、金融等多个领域。

标签：#ByteDance #翻译模型 #强化学习 #Mistral #多语言

Solidity-LLM：智能合约生成专家

概要：Chain-GPT团队推出了Solidity-LLM，这是一款专为理解、生成和分析Solidity智能合约而设计的2B参数微调大语言模型。该模型在原始Solidity数据集上进行预训练，并在精选的指令数据集上进行微调，专注于以太坊兼容区块链的开发。其编译成功率高达83%，在Gas效率方面表现出色，为Web3和区块链开发者提供了高效、准确的辅助工具。

标签：#Chain-GPT #智能合约 #Solidity #Web3 #代码生成

KAT-V1：40B参数的多模态模型

概要：Kwaipilot团队发布了KAT-V1 (Kwaipilot-AutoThink)，这是一款40B参数的开源大语言模型，旨在通过学习何时生成显式思维链（CoT）来减少模型的“过度思考”。该模型在LiveCodeBench Pro基准测试中排名所有开源模型第一，甚至超越了部分强大的闭源系统。它通过独特的双阶段训练流程，实现了在需要时触发CoT，从而降低Token消耗并加速推理。

标签：#Kwaipilot #AutoThink #思维链 #代码生成 #模型优化

HunyuanWorld：腾讯的AI生态新成员

概要：腾讯混元3D团队发布了HunyuanWorld-1，这是一个能够从文本或像素生成沉浸式、可探索、可交互的3D世界的模型。该项目旨在实现“一沙一世界，一花一天堂”的愿景，为用户提供强大的3D内容生成能力，进一步丰富了腾讯在AI生成内容（AIGC）领域的生态布局，特别是在3D场景生成方面迈出了重要一步。

标签：#腾讯 #混元3D #3D世界生成 #AIGC #场景生成