洞察 Insights

李沐Higgs Audio v2：大模型“听与说”的具身序章，重塑多模态交互新范式

李沐团队开源的Higgs Audio v2是一个突破性的音频基础模型，它通过将千万小时级的音频数据深度融入文本大语言模型，使AI具备了更自然、情感丰富的语音理解与生成能力。这一创新预示着未来人机交互将从以文本为主导的“读写”阶段，迈向更具沉浸感和情感智能的“听与说”多模态对话时代，对AIGC内容生产和智能助理体验产生革命性影响。

阅读全文