Latest episodes of the podcast AI Podcast
Mostrando página 5 de 21
Whispy: 让Whisper模型实现实时语音转写
03/08/2025
实时转写革命:揭秘Whisper-Streaming技术
03/08/2025
AI Radio FM - Technology Channel
02/08/2025
CosyVoice 3 揭秘:迈向‘野生’语音合成的百万小时数据与十亿参数模型
31/07/2025
OWSM v4: 数据致胜,开源语音模型的飞跃
30/07/2025
ESPnet-SpeechLM:解密开源语音语言模型工具包
30/07/2025
ESPnet:重塑语音识别的端到端革命
30/07/2025
WeNet 2.0:深入解析生产级端到端语音识别工具
30/07/2025
WeNet: 统一流式与非流式语音识别的生产级解决方案
30/07/2025
DeSTA2.5-Audio:通过自生成对齐打造通用大型音频语言模型
29/07/2025
AI广播电台FM - 科技频道:深入解析GLM-4.5 - 新一代统一大模型
29/07/2025
VALL-E 2: 实现人类水平的零样本语音合成
28/07/2025
MusicGen:简单可控的音乐生成模型
26/07/2025
EmergentTTS-Eval: 彻底改变语音合成模型的评估方式
25/07/2025
深入探讨Boson AI的Higgs Audio V2:开源音频生成的革命
24/07/2025
揭秘字节跳动Seed LiveInterpret 2.0:AI同声传译的革命
24/07/2025
揭秘Fast Conformer:更快、更强、更可扩展的语音识别新架构
24/07/2025
深入解析Seed-X:70亿参数模型如何挑战GPT-4o的翻译霸权
23/07/2025
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.