HunyuanVideo-Foley音频生成|Agents.md规范AI编程助手|HealthBench医疗评估基准【AI日报】

neverbiasu大约 3 分钟

HunyuanVideo-Foley音频生成|Agents.md规范AI编程助手|HealthBench医疗评估基准【AI日报】

摘要

腾讯混元首发TV2A音频生成框架HunyuanVideo-Foley；OpenAI等推出Agents.md规范与HealthBench医疗评估基准；OpenGVLab发布InternVL3.5预览；ComfyUI发起Falling挑战赛。

HunyuanVideo-Foley：首个TV2A多模态音频生成框架

概要：腾讯混元团队发布 HunyuanVideo-Foley，首个端到端文本-视频-音频（TV2A）生成框架，通过多模态扩散变换器解决视频音频同步难题。采用双流时序融合、跨模态语义注入和自监督音频特征表示对齐（REPA）技术，在 MovieGen-Audio-Bench 等多个数据集上实现SOTA性能。

标签：#HunyuanVideo #Foley音效 #多模态生成 #视频转音频 #扩散模型

概要：OpenAI 联合 Cursor、Aider、Jules 等主流AI编程工具推出 Agents.md 标准，为AI编程助手提供统一的项目配置规范。类似README.md但专门服务于AI Agent，包含构建步骤、测试指令、代码规范等关键信息。已有超过2万个开源项目采用，支持 Codex、Cursor、Gemini CLI 等多平台，通过标准化配置提升AI编程体验。

标签：#Agentsmd #AI编程 #代码助手 #标准化 #开发者工具

HealthBench：医疗大模型评估基准数据集

概要**：OpenAI** 在 Hugging Face 发布 HealthBench 评估基准，专门评估大语言模型在医疗健康领域的表现。数据集包含多语言医疗问答、临床决策支持、药物咨询等场景，涵盖急诊转诊、全球健康、医疗沟通等主题。提供详细评分标准和医师审核标注，为医疗AI安全性和准确性评估提供权威基准。

标签：#HealthBench #医疗AI #评估基准 #临床决策 #安全评估

InternVL3.5-GPT-OSS-20B-A4B：新一代多模态大模型预览

概要：OpenGVLab 发布 InternVL3.5 系列多模态大模型，引入级联强化学习（Cascade RL）和视觉分辨率路由器（ViR）等创新技术。20B-A4B 预览版基于 GPT-OSS 架构，在推理性能上相比前代提升16%，推理速度提升4.05倍。支持GUI交互、具身智能等新能力，在MMMU、MathVista等评测中达到开源模型最佳水平。

标签：#InternVL35 #多模态大模型 #强化学习 #视觉推理 #开源模型

ComfyUI Challenge 2：Falling主题创意生成挑战

概要：ComfyUI 社区启动第二期创意挑战赛，主题为"Falling"（坠落），要求参赛者创作以坠落场景开头的视频作品。首期"Turn It Around"挑战收到约400份投稿，获胜者为 @Doc_workBox。新挑战提供100美元现金奖励，要求1:1比例、20秒内、主要使用ComfyUI制作，9月1日前提交。

标签：#ComfyUI #创意挑战赛 #视频生成 #Falling主题 #社区活动

HunyuanVideo-Foley音频生成|Agents.md规范AI编程助手|HealthBench医疗评估基准【AI日报】

HunyuanVideo-Foley音频生成|Agents.md规范AI编程助手|HealthBench医疗评估基准【AI日报】

摘要

目录

HunyuanVideo-Foley：首个TV2A多模态音频生成框架

Agents.md：AI编程助手配置标准化规范

HealthBench：医疗大模型评估基准数据集

InternVL3.5-GPT-OSS-20B-A4B：新一代多模态大模型预览

ComfyUI Challenge 2：Falling主题创意生成挑战

参考链接