探索小型推理语言模型的极限:Phi-4-Mini-Reasoning 的数学能力

23/05/2025 8 min
探索小型推理语言模型的极限:Phi-4-Mini-Reasoning 的数学能力

Listen "探索小型推理语言模型的极限:Phi-4-Mini-Reasoning 的数学能力"

Episode Synopsis

本期播客深入探讨了微软的研究论文“Phi-4-Mini-Reasoning:探索小型推理语言模型在数学领域的极限”。我们讨论了如何通过一个创新的四步训练方法,使一个仅有38亿参数的小型语言模型 Phi-4-Mini 在数学推理任务上超越更大的模型。

More episodes of the podcast AI Podcast