《Well-Architected Framework:AI 和机器学习视角》一文中的本文档简要介绍了在整个机器学习生命周期中优化 AI 系统费用的原则和建议。通过采用主动、明智的费用管理方法,您的组织可以实现 AI 和机器学习系统的全部潜力,并保持财务协调。本文档中的建议与 Google Cloud 精心设计的框架的费用优化支柱
AI 和机器学习系统可帮助您从数据中发掘有价值的数据洞见和预测功能。例如,您可以减少内部流程中的阻力、改善用户体验并获得更深入的客户数据洞见。该云提供大量资源和快速实现价值,无需对 AI 和机器学习工作负载进行大额前期投资。为了最大限度地提高业务价值并将支出与您的业务目标保持一致,您需要了解费用驱动因素、主动优化费用、设置支出控制并采用 FinOps 做法。
定义并衡量费用和退货金额
为了在 Google Cloud中有效管理 AI 和机器学习费用,您必须定义并衡量云资源的费用以及 AI 和机器学习计划的业务价值。 Google Cloud 提供全面的结算和费用管理工具,帮助您精细跟踪支出。您可以衡量的业务价值指标包括客户满意度、收入和运营费用。通过为费用和业务价值确定具体的指标,您可以就资源分配和优化做出明智的决策。
请考虑以下建议:
- 为您的 AI 和机器学习项目制定明确的业务目标和关键绩效指标 (KPI)。
- 使用 Google Cloud 提供的结算信息实现费用监控和报告流程,这有助于您将费用归因于特定的 AI 和机器学习活动。
- 建立信息中心、提醒和报告系统,以根据 KPI 跟踪费用和回报。
优化资源分配
为了实现 Google Cloud中的 AI 和机器学习工作负载的成本效益,您必须优化资源分配。通过根据工作负载的需求仔细调整资源分配,您可以避免不必要的费用,并确保 AI 和机器学习系统拥有实现最佳性能所需的资源。
请考虑以下建议:
- 使用自动扩缩功能动态调整用于训练和推理的资源。
- 从小模型和数据开始。请尽可能在较小的范围内测试假设,以节省费用。
- 通过实验发现您的计算需求。根据您的机器学习要求,合理调整用于训练和传送的资源的大小。
- 采用 MLOps 实践,减少重复内容、手动流程和低效的资源分配。
实施数据管理和治理实践
有效的数据管理和治理实践在费用优化中发挥着重要作用。结构清晰的数据有助于您的组织避免不必要的重复,减少获取高质量数据所需的工作量,并鼓励团队重复使用数据集。通过主动管理数据,您可以降低存储费用、提高数据质量,并确保机器学习模型在最相关、最有价值的数据上得到训练和运行。
请考虑以下建议:
- 建立并采用明确的数据治理框架。
- 在数据提取点向数据集应用标签和相关元数据。
- 确保数据集在整个组织中易于发现和访问。
- 在整个机器学习生命周期中,尽可能使您的数据集和特征可重复使用。
利用 MLOps 实现自动化和简化
从技术角度和人员活动角度来看,采用 MLOps 做法的主要好处是可以降低成本。自动化可帮助您避免重复机器学习活动,并提高数据科学家和机器学习工程师的工作效率。
请考虑以下建议:
- 提高数据收集和处理技术的自动化和标准化水平,以减少开发工作量和时间。
- 开发自动化训练流水线,以减少对人工干预的需求并提高工程师的工作效率。实现使流水线重复使用现有资产的机制,例如准备好的数据集和经过训练的模型。
- 使用 Google Cloud 中的模型评估和调整服务,通过更少的迭代提高模型性能。这使您的 AI 和机器学习团队能够在更短的时间内实现更多目标。
使用代管式服务以及预训练模型或现有模型
您可以通过多种方法使用 AI 和机器学习来实现业务目标。采用增量方法进行模型选择和模型开发。这有助于避免因每次执行刷新操作而产生的过高费用。如需控制费用,可从简单的方法入手:使用机器学习框架、托管式服务和预训练模型。
请考虑以下建议:
- 使用笔记本环境实现快速且探索性的机器学习实验。
- 使用现有模型和预训练模型作为起点,加快模型选择和开发过程。
- 使用代管式服务来训练或提供模型。AutoML 和托管式自定义模型训练服务都有助于降低模型训练费用。托管式服务还有助于降低模型服务基础架构的成本。
培养成本意识和持续优化文化
营造一个鼓励沟通和定期审核的协作环境。此方法可帮助团队在整个机器学习生命周期中发现并实现节省费用的机会。
请考虑以下建议:
- 在整个机器学习生命周期中采用 FinOps 原则。
- 确保 AI 和机器学习项目的所有费用和业务效益都已明确指定负责人。
贡献者
作者:
- Isaac Lo | AI 业务发展经理
- Filipe Gracio 博士 | 客户工程师
其他贡献者:
- Kumar Dhanagopal | 跨产品解决方案开发者
- Marwan Al Shawi | 合作伙伴客户工程师
- Nicolas Pintaux | 客户工程师,应用现代化改造专家