qwen3

| 选择喜欢的代码风格  

qwen3 参数量


tools 0.6b 1.7b 4b 8b 14b 30b 32b 235b
 

qwen3 模型介绍



qwen3 AI Models

Qwen 3 是 Qwen 系列中最新一代大型语言模型,提供全面的密集和混合专家 MoE 模型。旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准测试中取得了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比极具竞争力。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数量是 QwQ-32B 的 10 倍,即使是像 Qwen3-4B 这样的微型模型也能与 Qwen2.5-72B-Instruct 的性能相媲美。

qwen3 功能包括::

  • 独创性地支持单一模型在思维模式(用于复杂的逻辑推理、数学和编程)和非思维模式(用于高效的通用对话)之间无缝切换,确保在各种场景下实现最佳性能。
  • 推理能力显著提升:在数学、代码生成和常识性逻辑推理方面超越了之前的QwQ(思维模式)和Qwen2.5(非思维模式)。
  • 卓越的人类偏好匹配能力:在创意写作、角色扮演、多轮对话和指令遵循方面表现出色,带来更自然、引人入胜和沉浸式的对话体验。
  • 精通代理功能:能够在思维和非思维模式下与外部工具精准集成,并在复杂的基于代理的任务中取得开源模型中的领先性能。
  • 支持 100 多种语言和方言:拥有强大的多语言指令遵循和翻译能力。

 

ollama CLI 调用 qwen3


ollama run qwen3:0.6b
ollama run qwen3:1.7b
ollama run qwen3:4b
ollama run qwen3:8b
ollama run qwen3:14b
ollama run qwen3:32b
ollama run qwen3:30b-a3b
ollama run qwen3:235b-a22b
 

AI 扩展阅读:




发表评论