phi4-mini-reasoning AI Models
Phi 4 mini 推理专为内存 / 计算受限环境和延迟受限场景下的多步骤、逻辑密集型数学问题求解任务而设计。其用例包括形式化证明生成、符号计算、高级应用题以及各种数学推理场景。这些模型擅长跨步骤维护上下文、应用结构化逻辑,并在需要深度分析性思维的领域提供准确可靠的解决方案。
Phi-4-mini-reasoning 在长句生成方面的表现均优于其基础模型,甚至超过了 OpenThinker-7B、Llama-3.2-3B-instruct、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B 和 Bespoke-Stratos-7B 等规模更大的模型。
Phi-4-mini-reasoning 在数学基准测试中的表现与 OpenAI o1-mini 相当,在 Math-500 和 GPQA Diamond 评估中均超越了后者。如上所示,拥有 38 亿参数的 Phi-4-mini-reasoning 的表现优于其规模两倍以上的模型。