ZARZA We are Zarza, the prestigious firm behind major projects in information technology.

AI Podcast

AI Podcast

Por: weedge

Latest podcasts about AI Technology and Papers.

413 episodios disponibles

Latest episodes of the podcast AI Podcast

Mostrando página 5 de 21

Whispy: 让Whisper模型实现实时语音转写 03/08/2025

实时转写革命：揭秘Whisper-Streaming技术 03/08/2025

“ThinkSound”——一个利用多模态大语言模型和思维链（CoT）推理来实现视频到音频生成和编辑的框架。 03/08/2025

AI Radio FM - Technology Channel 02/08/2025

CosyVoice 3 揭秘：迈向‘野生’语音合成的百万小时数据与十亿参数模型 31/07/2025

Step-Audio 2: The Next Leap in AI Speech Conversation 30/07/2025

OWSM v4: 数据致胜，开源语音模型的飞跃 30/07/2025

ESPnet-SpeechLM：解密开源语音语言模型工具包 30/07/2025

ESPnet：重塑语音识别的端到端革命 30/07/2025

WeNet 2.0：深入解析生产级端到端语音识别工具 30/07/2025

WeNet: 统一流式与非流式语音识别的生产级解决方案 30/07/2025

DeSTA2.5-Audio：通过自生成对齐打造通用大型音频语言模型 29/07/2025

AI广播电台FM - 科技频道：深入解析GLM-4.5 - 新一代统一大模型 29/07/2025

VALL-E 2: 实现人类水平的零样本语音合成 28/07/2025

MusicGen：简单可控的音乐生成模型 26/07/2025

EmergentTTS-Eval: 彻底改变语音合成模型的评估方式 25/07/2025

深入探讨Boson AI的Higgs Audio V2：开源音频生成的革命 24/07/2025

揭秘字节跳动Seed LiveInterpret 2.0：AI同声传译的革命 24/07/2025

揭秘Fast Conformer：更快、更强、更可扩展的语音识别新架构 24/07/2025

深入解析Seed-X：70亿参数模型如何挑战GPT-4o的翻译霸权 23/07/2025

« Primera ‹ Anterior 1 ... 3 4 5 6 7 ... 21 Siguiente › Última »