Latest episodes of the podcast AI Podcast
Mostrando página 15 de 21
增强多模态大型语言模型的推理能力:混合偏好优化
10/02/2025
InternVL 2.5:模型、数据和测试时扩展开放源代码多模态模型的性能边界
10/02/2025
InternVideo2.5:通过长文本和丰富上下文建模增强视频多模态大型语言模型
10/02/2025
AI的苦涩教训:计算力至上
09/02/2025
LLaVA-OneVision: 易于实现的视觉任务迁移
09/02/2025
VITA-1.5:迈向GPT-4o水平的实时视觉和语音交互
09/02/2025
Hibiki: 高保真同步语音到语音翻译
08/02/2025
Kimi k1.5: 基于强化学习的大语言模型扩展
08/02/2025
HumanOmni:以人为中心的视频理解大型视觉语音语言模型
07/02/2025
Align-Anything: 多模态模型训练与语言反馈
06/02/2025
OmniHuman: 混合条件的人体动画模型
06/02/2025
Scaling LLM Test-Time Compute Optimally
01/02/2025
JanusFlow: 统一多模态理解与生成框架
28/01/2025
AI科技前沿:Janus多模态统一框架解析
28/01/2025
Hunyuan3D 2.0: 高分辨率纹理3D资产生成的扩散模型
24/01/2025
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.