Listen "WeNet: 统一流式与非流式语音识别的生产级解决方案"
Episode Synopsis
                            本期播客深入探讨了名为WeNet的开源语音识别工具包。我们将详细解析其创新的U2架构如何巧妙地统一流式和非流式识别模式,有效解决了从学术研究到工业界生产部署之间的鸿沟。同时,我们还会分析其在不同平台上的性能基准测试,揭示其成为业界领先解决方案的奥秘。                        
                    More episodes of the podcast AI Podcast
                                
                                
                                    策略内蒸馏:LLM高效训练的秘密武器                                
                                                                    28/10/2025
                                                            
                                                    
                                
                                
                                    EchoMimicV3:13亿参数,统一多模态多任务人体动画的魔法!                                
                                                                    25/10/2025
                                                            
                                                    
                                
                                
                                    智读万卷:PaddleOCR-VL的文档解析革命                                
                                                                    24/10/2025
                                                            
                                                    
                                
                                
                                    LongLive:实时互动长视频生成的革新之路                                
                                                                    21/10/2025
                                                            
                                                    
                                
                                
                                    DeepSeek-OCR:开启长上下文光学压缩新纪元                                
                                                                    20/10/2025
                                                            
                                                    
                                
                                
                                    LightRAG:大模型检索增强生成的图谱新范式                                
                                                                    20/10/2025
                                                            
                                                    
                                
                                
                                    Voila:迈向自主语音AI的里程碑                                
                                                                    15/10/2025
                                                            
                                                    
                                
                                
                                    机器人学习:从经典到通用策略的深度探索                                
                                                                    15/10/2025
                                                            
                                                    
                                
                                
                                    Muon优化器:AI训练提速的秘密武器                                
                                                                    14/10/2025
                                                            
                                                    
                                
                                
                                    月光私酿:边缘设备上的微型专业ASR模型                                
                                                                    11/10/2025
                                                            
                                             ZARZA We are Zarza, the prestigious firm behind major projects in information technology.
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.
				 
                 In God we trust
 In God we trust