Listen "CosyVoice 3 揭秘:迈向‘野生’语音合成的百万小时数据与十亿参数模型"
Episode Synopsis
                            深入探讨阿里巴巴的 CosyVoice 3 模型。我们将剖析其关键创新,从新颖的语音分词器和强化学习技术,到其海量的数据和模型扩展。我们还将讨论它在多语言和情感语音合成方面的顶尖性能。                        
                    More episodes of the podcast AI Podcast
                                
                                
                                    策略内蒸馏:LLM高效训练的秘密武器                                
                                                                    28/10/2025
                                                            
                                                    
                                
                                
                                    EchoMimicV3:13亿参数,统一多模态多任务人体动画的魔法!                                
                                                                    25/10/2025
                                                            
                                                    
                                
                                
                                    智读万卷:PaddleOCR-VL的文档解析革命                                
                                                                    24/10/2025
                                                            
                                                    
                                
                                
                                    LongLive:实时互动长视频生成的革新之路                                
                                                                    21/10/2025
                                                            
                                                    
                                
                                
                                    DeepSeek-OCR:开启长上下文光学压缩新纪元                                
                                                                    20/10/2025
                                                            
                                                    
                                
                                
                                    LightRAG:大模型检索增强生成的图谱新范式                                
                                                                    20/10/2025
                                                            
                                                    
                                
                                
                                    Voila:迈向自主语音AI的里程碑                                
                                                                    15/10/2025
                                                            
                                                    
                                
                                
                                    机器人学习:从经典到通用策略的深度探索                                
                                                                    15/10/2025
                                                            
                                                    
                                
                                
                                    Muon优化器:AI训练提速的秘密武器                                
                                                                    14/10/2025
                                                            
                                                    
                                
                                
                                    月光私酿:边缘设备上的微型专业ASR模型                                
                                                                    11/10/2025
                                                            
                                             ZARZA We are Zarza, the prestigious firm behind major projects in information technology.
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.
				 
                 In God we trust
 In God we trust