Llama 是由 Meta 开发的一组开放模型,您可以在 Vertex AI 上微调和部署这些模型。Llama 为类似助理的聊天提供经过预训练和指令调优的生成文本和多模态模型。您可以在 Vertex AI 上部署 Llama 3.2、Llama 3.1、Llama 3 和 Llama 2 模型。
Llama 3.2
借助 Llama 3.2,开发者可以构建和部署最新的生成式 AI 模型和应用,这些模型和应用使用了 Llama 的功能来激发新的创新,例如图像推理。Llama 3.2 还旨在让设备端应用更易于访问。以下列表突出显示了 Llama 3.2 的功能:
- 提供更私密、更个性化的 AI 体验,并针对较小的模型进行设备端处理。
- 提供的模型旨在提高效率、缩短延迟时间并提升性能,因此适用于各种应用。
- 基于 Llama 堆栈构建,可简化应用的构建和部署。Llama Stack 是一个标准化接口,用于构建规范的工具链组件和代理应用。
- 支持视觉任务,采用了一种新的模型架构,可将图片编码器表示法集成到语言模型中。
10 亿和 30 亿模型是轻量级纯文本模型,支持设备端用例,例如多语言本地知识检索、总结和重写。
Llama 11B 和 90B 模型是具有图片推理功能的小型和中型多模态模型。例如,它们可以分析图表中的直观数据,以提供更准确的回答,还可以从图片中提取详细信息来生成文本说明。
如需了解详情,请参阅 Model Garden 中的 Llama 3.2 模型卡片。
注意事项
使用 11B 和 90B 时,在发送纯文本提示时没有任何限制。不过,如果您在提示中加入图片,该图片必须位于提示的开头,并且您只能加入一张图片。例如,您不能先添加文本,然后再添加图片。
Llama 3.1
Llama 3.1 多语言的大语言模型 (LLM) 集合是一组经过预训练和指令调优的生成模型,大小为 8B、70B 和 405B(文本输入/文本输出)。Llama 3.1 指令调优的纯文本模型(8B、70B、405B)针对多语言对话应用场景进行了优化,在常见的行业基准中优于许多可用的开源和封闭式聊天模型。
如需了解详情,请参阅 Model Garden 中的 Llama 3.1 模型卡片。
Llama 3
Llama 3 指令调优的模型是一组针对对话应用场景优化的 LLM。在常见行业基准中,Llama 3 模型的表现优于许多可用的开源聊天模型。
如需了解详情,请参阅 Model Garden 中的 Llama 3 模型卡片。
Llama 2
Llama 2 LLM 是一组经过预训练和微调的生成文本模型,大小范围从 7B 到 70B 参数不等。
如需了解详情,请参阅 Model Garden 中的 Llama 2 模型卡片。
Code Llama
Meta 的 Code Llama 模型专为代码合成、理解和指令而设计。
如需了解详情,请参阅 Model Garden 中的 Code Llama 模型卡片。
Llama Guard 3
Llama Guard 3 基于 Llama Guard 2 的功能而构建,并添加了三个新类别:诽谤、选举和代码解释器滥用。此外,此模型支持多种语言,并且提示格式与 Llama 3 或更高版本的 instruct 模型一致。
如需了解详情,请参阅 Model Garden 中的 Llama Guard 模型卡片。
资源
如需详细了解 Model Garden,请参阅在 Model Garden 中探索 AI 模型。