首页
洞察
早报
日报
主题探索
关于
Higgs Audio V2
洞察 Insights
李沐Higgs Audio v2:大模型“听与说”的具身序章,重塑多模态交互新范式
李沐团队开源的Higgs Audio v2是一个突破性的音频基础模型,它通过将千万小时级的音频数据深度融入文本大语言模型,使AI具备了更自然、情感丰富的语音理解与生成能力。这一创新预示着未来人机交互将从以文本为主导的“读写”阶段,迈向更具沉浸感和情感智能的“听与说”多模态对话时代,对AIGC内容生产和智能助理体验产生革命性影响。
阅读全文