mistrallite

显示行号 | 选择喜欢的代码风格

MistralLite 是 Amazon 在 HuggingFace 发布的基于 Mistral 的微调模型，增强了处理长上下文的能力。

mistrallite 参数量

7b

mistrallite 模型介绍

MistralLite AI Models

Mistrallite 是基于 Mistral 进行微调的模型，增强了处理长上下文（最多 32K 个 token）的能力。该模型在多项长上下文检索和问答任务中表现显著提升。

MistralLite 在保持原始模型简洁结构的同时，在多项长上下文检索和问答任务中表现显著提升。MistralLite 适用于长上下文行和主题检索、摘要、问答等应用。MistralLite 可以部署在单个 AWS g5.2x 实例上，并支持 Sagemaker Huggingface 文本生成推理 TGI 端点，非常适合在资源受限的环境中需要高性能的应用程序。

此外，MistralLite 还支持其他服务方式，例如 vLLM，并且您可以通过 HuggingFace 转换器和 FlashAttention-2 库在 Python 中使用 MistralLite。

mistrallite

mistrallite 参数量

mistrallite 模型介绍

AI 扩展阅读：

发表评论