Vertex AI 上的 Anthropic Claude 模型以 API 形式提供全托管式无服务器模型。如需在 Vertex AI 上使用 Claude 模型,请直接向 Vertex AI API 端点发送请求。由于 Anthropic Claude 模型使用托管式 API,因此无需预配或管理基础设施。
您可以流式传输 Claude 回答,以降低对最终用户延迟的感知度。流式回答使用服务器发送的事件 (SSE) 来逐步流式传输回答。
您可以按实际用量(随用随付)或按固定费用(使用 [预配吞吐量][pt]时)为 Claude 模型付费。如需了解随用随付定价,请参阅 Vertex AI 价格页面上的 Anthropic Claude 模型。
可用的 Claude 模型
Anthropic 提供了以下模型,可在 Vertex AI 中使用。如需访问 Claude 模型,请前往其 Model Garden 模型卡片。
Anthropic 的 Claude 模型支持 Vertex AI 请求-响应日志记录。启用提示和完成活动的 30 天请求-响应日志记录,以跟踪用户滥用模型的行为。如需了解详情,请参阅记录请求和响应。
Claude Opus 4
Claude Opus 4 是 Anthropic 最智能的模型,在编码和智能体功能(尤其是智能体搜索)方面表现卓越。对于需要前沿情报的客户,该模型表现出色:
- 高级编码:独立规划和执行复杂的端到端开发任务。它会适应您的风格,并始终保持高代码质量。
- 长时程任务和复杂问题解决(虚拟协作工具):解锁涉及长时程任务的新应用场景,这些任务需要记忆、持续推理和长链式行动。
- AI 代理:使代理能够处理需要极高准确度的复杂多步骤任务。
- 智能体搜索和研究:连接到多个数据源,以综合分析知识库中的全面洞见。
- 内容创作:创作具有自然散文风格的人类质量内容。生成长篇创意内容、技术文档、营销文案和前端设计模拟。
- 记忆和上下文管理:具备记忆功能,可有效总结和参考之前的互动。
Claude Sonnet 4
Claude Sonnet 4 在编码方面表现出色,同时在速度和成本方面也达到了理想的平衡,适合大批量应用场景:
- 编码:以更出色的性能处理日常开发任务,通过即时反馈循环助力代码审核、bug 修复、API 集成和功能开发。
- AI 助理:为实时应用提供可用于生产环境的助理,从客户支持自动化到需要智能和速度的运营工作流。
- 高效研究:跨多个数据源执行重点分析,同时保持快速响应时间。非常适合快速商业智能、竞争分析和实时决策支持。
- 大规模内容:大规模生成和分析内容,并提高质量。创建客户沟通内容、分析用户反馈,并制作兼具质量和吞吐量的营销素材。
Claude 3.7 Sonnet
Claude 3.7 Sonnet 是 Anthropic 迄今为止最智能的模型,也是首个提供扩展思考功能的 Claude 模型,可通过仔细、逐步的推理解决复杂问题。Claude 3.7 Sonnet 是一个单一模型,您可以通过选择标准思考(用于进行近乎即时的回答)或扩展思考(用于高级推理)来平衡速度和质量。
如需详细了解扩展思考,请参阅 Anthropic 的文档。
Claude 3.7 Sonnet 针对以下应用场景进行了优化:
- 智能体编码 - Claude 3.7 Sonnet 是用于智能体编码的先进模型,可在整个软件开发生命周期内完成任务,从初始规划到 bug 修复,从维护到大规模重构。它在规划和解决复杂编码任务方面都具有出色的性能,因此 Claude 3.7 Sonnet 是推动端到端软件开发流程的理想之选。
- 面向客户的智能体 - Claude 3.7 Sonnet 可为面向客户的智能体和复杂的 AI 工作流提供出色的指令遵从、工具选择、错误更正和高级推理功能。
- 计算机用途 - Claude 3.7 Sonnet 是我们用于计算机用途的最准确模型,可让开发者以人类的方式引导 Claude 使用计算机。
- 内容生成和分析 - Claude 3.7 Sonnet 擅长写作,能够理解内容中的细微差别和语气,从而生成更具吸引力的内容并更深入地分析内容。
- 视觉数据提取 - Claude 3.7 Sonnet 具有强大的视觉分析能力,如果团队希望在 AI 工作流中从图表或图形等视觉内容中提取原始数据,Claude 3.7 Sonnet 是理想之选。
Claude 3.5 Sonnet v2
Claude 3.5 Sonnet v2 是用于处理实际的软件工程任务和智能体功能的先进模型。Claude 3.5 Sonnet v2 依靠与 Claude 3.5 Sonnet 相同的价格和速度实现了这些进步。
升级后的 Claude 3.5 Sonnet 模型能够与可操纵计算机桌面环境的工具进行交互。如需了解详情,请参阅 Anthropic 文档。
Claude 3.5 Sonnet 针对以下应用场景进行了优化:
- 智能体任务和工具使用 - Claude 3.5 Sonnet 可为需要使用工具的智能体工作流提供出色的指令遵循、工具选择、错误更正和高级推理功能。
- 编码 - 对于从代码迁移、代码修复和翻译等软件开发任务,Claude 3.5 Sonnet 在规划和解决复杂的编码任务方面都都具有出色的性能。
- 文档问答 - Claude 3.5 Sonnet 结合了强大的上下文理解、高级推理和综合能力,可提供准确且人性化的回答。
- 视觉数据提取 - 借助 Claude 3.5 Sonnet 领先的视觉技能,Claude 3.5 Sonnet 可以作为 AI 工作流的一部分从图表或图形等视觉内容中提取原始数据。
- 内容生成和分析 - Claude 3.5 Sonnet 可理解内容中的细微差别和语气,从而生成更具吸引力的内容并更深入地分析内容。
Claude 3.5 Haiku
Claude 3.5 Haiku 是 Anthropic 最快且最具成本效益的下一代模型,非常适合速度和经济性重要的应用场景。在各个技能方面都比前代产品有所提升。 Claude 3.5 Haiku 针对以下应用场景进行了优化:
- 代码补全 - Claude 3.5 Haiku 回答快速,且能理解编程模式,因此在实时开发工作流中提供快速准确的代码建议和补全方面表现出色。
- 互动式聊天机器人 - Claude 3.5 Haiku 具有更强的推理能力和自然对话能力,非常适合用于创建回答快速且富有吸引力的聊天机器人,以便高效处理大量用户互动。
- 数据提取和加标签 - 利用改进的分析技能,Claude 3.5 Haiku 可高效地处理和分类数据,从而有助于快速提取数据和自动执行加标签任务。
- 实时内容审核 - Claude 3.5 Haiku 具备强大的推理技能和内容理解能力,可为需要立即回答且规模较大的平台提供快速可靠的内容审核服务。
Claude 3 Haiku
Anthropic 的 Claude 3 Haiku 是 Anthropic 最快的视觉和文本模型,能够近乎即时地回答基本的查询,旨在打造模仿人类互动的无缝 AI 体验。
实时的客户互动和翻译。
内容审核,发现可疑行为或客户请求。
节省费用的任务,例如库存管理以及从非结构化数据中提取知识。
视觉任务,例如处理图片以返回文本输出,分析图表、图形、技术图表、报告和其他视觉内容。
Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Sonnet 凭借 Anthropic 的中端 Claude 3 Sonnet 的速度和成本,在 Anthropic 的多种评估中优于 Claude 3 Opus。Claude 3.5 Sonnet 针对以下应用场景进行了优化:
使用复杂的推理和问题排查功能进行编码,例如编写、编辑和运行代码。
通过了解用户背景并协调多步骤工作流,处理来自客户服务的复杂查询。
通过浏览非结构化数据并利用多个工具生成数据洞见,来进行数据科学和分析。
视觉处理,例如解释需要视觉理解的图形和图表。
以更自然、更像人类的语气撰写内容。