Llasa+: 加速和流式语音合成的免费午餐

13/08/2025 9 min
Llasa+: 加速和流式语音合成的免费午餐

Listen "Llasa+: 加速和流式语音合成的免费午餐"

Episode Synopsis

本期节目,我们将深入探讨 Llasa+,这是一种基于 Llasa 模型构建的加速和流式文本到语音(TTS)模型。我们将讨论其核心技术,包括多令牌预测(MTP)和创新的验证算法,如何实现显著的速度提升而又不牺牲语音质量。同时,我们还将介绍其流式声码器 XCodec2-S 的实现。