ZARZA We are Zarza, the prestigious firm behind major projects in information technology.

探索小型推理语言模型的极限：Phi-4-Mini-Reasoning 的数学能力

23/05/2025 8 min

探索小型推理语言模型的极限：Phi-4-Mini-Reasoning 的数学能力

Listen "探索小型推理语言模型的极限：Phi-4-Mini-Reasoning 的数学能力"

Descargar episodio Ver en sitio original

Episode Synopsis

本期播客深入探讨了微软的研究论文“Phi-4-Mini-Reasoning：探索小型推理语言模型在数学领域的极限”。我们讨论了如何通过一个创新的四步训练方法，使一个仅有38亿参数的小型语言模型 Phi-4-Mini 在数学推理任务上超越更大的模型。

More episodes of the podcast AI Podcast

智能体组织时代：语言模型如何学会异步思考 13/11/2025

MemOS：AI系统的记忆操作系统——革新LLM的记忆能力 12/11/2025

超感知：迈向视频空间智能的未来 11/11/2025

Nested Learning: The Illusion of Deep Learning Architectures - 嵌套学习：深度学习架构的幻象 09/11/2025

FM Agent：大型语言模型与进化搜索的协同——迈向通用AI研究代理 09/11/2025

AI Radio FM - 智能代理的进化秘籍：ACE上下文工程 07/11/2025

AI长时记忆突破：Mem0如何赋能智能体？ 06/11/2025

AI Radio FM - Technology Channel - 探秘智能体上下文工程：LLM的自我进化之路 05/11/2025

AI语境工程：机器如何真正“懂你”？ 05/11/2025

AI Radio FM - Technology Channel: Gated Delta Networks突破Mamba2的秘密 03/11/2025

Ver todos los episodios