granite3.3 Models
IBM Granite 2B 和 8B 模型是 128K 上下文长度的语言模型,经过微调,提升了推理和指令执行能力。这些模型在 AlpacaEval-2.0 和 Arena-Hard 等通用性能测试基准上取得了显著提升,并在数学、编码和指令执行方面也取得了显著改进。它们还支持用于代码补全任务和结构化推理的中间填充 (FIM)。
ollama run granite3.3:2b ollama run granite3.3:8b
英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。不过,用户可以针对这 12 种语言以外的语言对 Granite 模型进行微调。这些模型可集成到包括商业应用程序在内的各个领域的人工智能助手中。
为了启用 granite3.3 思考功能,请添加一条带有 "role": "control"
的消息,并将 content 设置为 thinking。例如:
{ "messages": [ {"role": "control", "content": "thinking"}, {"role": "user", "content": "How do I get to the airport if my car won't start?"} ] }