140
亿参数开放权重推理模型,在复杂推理任务上可与更大的模型相媲美。
Phi 4 reasoning AI Models
Phi 4 推理和推理增强模型拥有 140 亿个参数,在复杂的推理任务上可与规模更大的模型相媲美。
Phi 4 推理模型通过对 Phi 4 进行监督微调来训练,该模型基于 OpenAI o3-mini 精心挑选的推理演示。该模型展示了其严谨的数据管理和高质量的合成数据集,使小型模型能够与规模更大的模型相媲美。
Phi 4 推理增强模型建立在 Phi 4 推理之上,并通过强化学习进一步训练,以实现更高的准确率。
ollama run phi4-reasoning ollama run phi4-reasoning:plus