MistralLite AI Models
Mistrallite 是基于 Mistral 进行微调的模型,增强了处理长上下文(最多 32K
个 token)的能力。该模型在多项长上下文检索和问答任务中表现显著提升。
MistralLite 在保持原始模型简洁结构的同时,在多项长上下文检索和问答任务中表现显著提升。MistralLite 适用于长上下文行和主题检索、摘要、问答等应用。MistralLite 可以部署在单个 AWS g5.2x 实例上,并支持 Sagemaker Huggingface 文本生成推理 TGI 端点,非常适合在资源受限的环境中需要高性能的应用程序。
此外,MistralLite 还支持其他服务方式,例如 vLLM,并且您可以通过 HuggingFace 转换器和 FlashAttention-2 库在 Python 中使用 MistralLite。