mistrallite

| 选择喜欢的代码风格  

mistrallite 参数量


7b
 

mistrallite 模型介绍



MistralLite AI Models

Mistrallite 是基于 Mistral 进行微调的模型,增强了处理长上下文(最多 32Ktoken)的能力。该模型在多项长上下文检索和问答任务中表现显著提升。

MistralLite 在保持原始模型简洁结构的同时,在多项长上下文检索和问答任务中表现显著提升。MistralLite 适用于长上下文行和主题检索、摘要、问答等应用。MistralLite 可以部署在单个 AWS g5.2x 实例上,并支持 Sagemaker Huggingface 文本生成推理 TGI 端点,非常适合在资源受限的环境中需要高性能的应用程序。

此外,MistralLite 还支持其他服务方式,例如 vLLM,并且您可以通过 HuggingFace 转换器和 FlashAttention-2 库在 Python 中使用 MistralLite。

 

AI 扩展阅读:




发表评论