phi4-reasoning

显示行号 | 选择喜欢的代码风格

Phi 4 推理和推理 plus 是 140 亿参数开放权重推理模型，在复杂推理任务上可与更大的模型相媲美。

Phi 4 reasoning 参数量

14b

Phi 4 reasoning 模型介绍

Phi 4 reasoning AI Models

Phi 4 推理和推理增强模型拥有 140 亿个参数，在复杂的推理任务上可与规模更大的模型相媲美。

Phi 4 推理模型通过对 Phi 4 进行监督微调来训练，该模型基于 OpenAI o3-mini 精心挑选的推理演示。该模型展示了其严谨的数据管理和高质量的合成数据集，使小型模型能够与规模更大的模型相媲美。

Phi 4 推理增强模型建立在 Phi 4 推理之上，并通过强化学习进一步训练，以实现更高的准确率。

Phi-4-reasoning 在涵盖数学和科学推理的代表性推理基准测试中的表现。展示通过 Phi-4-reasoning (SFT) 和 Phi-4-reasoning-plus (SFT+RL) 对 Phi-4 进行以推理为重点的后训练所带来的性能提升，并结合了两大模型系列的代表性基线：DeepSeek 的开放权重模型，包括 DeepSeek R1（671B 混合专家模型）及其精炼密集变体 DeepSeek-R1 Distill Llama 70B，以及 OpenAI 的专有前沿模型 o1-mini 和 o3-mini。Phi-4-reasoning 和 Phi-4-reasoning-plus 的表现始终显著优于基础模型 Phi-4，超过了 DeepSeek-R1 Distill Llama 70B（大 5 倍），并且与 Deepseek-R1 等体量更大的模型相比也展现出竞争力。

ollama CLI 调用 Phi 4 reasoning

ollama run phi4-reasoning

ollama run phi4-reasoning:plus

phi4-reasoning

Phi 4 reasoning 参数量

Phi 4 reasoning 模型介绍

ollama CLI 调用 Phi 4 reasoning

AI 扩展阅读：

发表评论