MoE
模型。
qwen3 AI Models
Qwen 3 是 Qwen 系列中最新一代大型语言模型,提供全面的密集和混合专家 MoE
模型。旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准测试中取得了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比极具竞争力。此外,小型 MoE
模型 Qwen3-30B-A3B 的激活参数量是 QwQ-32B 的 10 倍,即使是像 Qwen3-4B 这样的微型模型也能与 Qwen2.5-72B-Instruct 的性能相媲美。
qwen3 功能包括::
ollama run qwen3:0.6b ollama run qwen3:1.7b ollama run qwen3:4b ollama run qwen3:8b ollama run qwen3:14b ollama run qwen3:32b ollama run qwen3:30b-a3b ollama run qwen3:235b-a22b