使用 AlloyDB AI 构建生成式 AI 应用

作为与 PostgreSQL 兼容的数据库,AlloyDB 不仅可与 PostgreSQL 支持的工具和框架无缝集成,还可与 Google Cloud 环境中的其他服务无缝集成。

AlloyDB AI 提供了一套 AI 和机器学习功能,可让您构建生成式 AI 应用。借助这些功能,您可以构建具有以下功能的应用:用于语义相似度的向量搜索、自然语言查询,以及与 Google、OpenAI 和 Anthropic 等提供商的机器学习模型集成。

为简化构建 AI 应用的过程,AlloyDB 提供了以下扩展程序:

  • vector 扩展程序:标准 pgvector PostgreSQL 扩展程序是针对 AlloyDB 自定义的,称为 vector。它支持将生成的嵌入存储在向量列中。该扩展程序还添加了对标量量化功能的支持,以创建 IVF 索引。您还可以创建 IVFFlat 索引或 HSNW 索引,这些索引可与原生 pgvector 搭配使用。

  • alloydb_scann 扩展程序:alloydb_scann 扩展程序可实现由 ScaNN 算法提供支持的高效最近邻索引。

    您可以将 alloydb_scann 扩展程序与 PostgreSQL 14 和 15 兼容的数据库搭配使用。

  • google_ml_integration 扩展程序:google_ml_integration 扩展程序提供 AI 查询引擎功能,其中包括用于生成嵌入内容、进行语义排名以及实现基于 AI 的过滤、联接和文本生成/摘要的函数。此扩展程序还提供用于注册 AI 模型元数据的函数。然后,注册的元数据用于调用这些模型的预测。

  • alloydb_ai_nl 扩展程序:借助 alloydb_ai_nl 扩展程序,开发者可以构建应用,让应用能够准确安全地回答最终用户提出的有关 AlloyDB 数据库中数据的自然语言问题。这样一来,即使是不擅长编写 SQL 的用户也能访问数据。

以下是这些扩展程序支持的一些应用场景:

  • 使用 AlloyDB AI 查询引擎执行智能 SQL 查询:直接在 SQL 查询中使用 AI。这样一来,您就可以重新对搜索结果进行排名以提高相关性,将自然语言集成到 SQL 查询中,并生成用于向量搜索的多模态嵌入。

  • 向量搜索:使用 AlloyDB 存储向量嵌入并执行高效的相似度搜索。您可以生成由 ScaNN 算法提供支持的高效最近邻索引。

  • 使用模型端点调用模型:将 AI 模型注册为模型端点,并从 AlloyDB 内调用这些端点,以生成嵌入、调用预测或执行相似度搜索。

  • 生成嵌入调用预测:使用 Vertex AI 文本嵌入模型或已注册的模型端点生成文本或多模态嵌入。

  • 通过自然语言生成 SQL 语句:为应用添加自然语言功能,并通过自然语言提问与 AlloyDB 进行互动。然后,AlloyDB AI 会处理自然语言问题,以自动生成可检索答案的准确 SQL 查询。

后续步骤