APPROX_COUNT_DISTINCT
APPROX_COUNT_DISTINCT
函数用于统计字段中的大致唯一项数。
语法
APPROX_COUNT_DISTINCT(X)
参数
field_expression
- 包含要统计的项的字段或表达式。
APPROX_COUNT_DISTINCT
函数的运作方式
APPROX_COUNT_DISTINCT
函数接受一个参数,该参数可以是任何类型的指标、维度或表达式的名称。APPROX_COUNT_DISTINCT
会返回该字段或表达式中唯一项的大致数量。
在查询处理方面,APPROX_COUNT_DISTINCT
比 COUNT_DISTINCT
更高效,但返回的结果不太精确。如果您的数据集非常大,或者报告的性能比确切计数更重要,请考虑使用 APPROX_COUNT_DISTINCT
。使用 APPROX_COUNT_DISTINCT
而非 COUNT_DISTINCT
还可以帮助降低使用 BigQuery 数据源时的查询费用。
如需详细了解近似聚合的工作原理,请参阅 BigQuery 文档。
示例
APPROX_COUNT_DISTINCT(Page)
- 统计“网页”维度中的大致唯一值数量。
APPROX_COUNT_DISTINCT
的限制
APPROX_COUNT_DISTINCT
函数仅适用于与 BigQuery 数据源搭配使用。对于不支持
APPROX_COUNT_DISTINCT
的数据源,APPROX_COUNT_DISTINCT
将像COUNT_DISTINCT
一样运作。您无法将此函数应用于预聚合的指标(聚合类型为自动),也无法将其应用于其他聚合函数的结果表达式。例如,Google Analytics 数据源中的
APPROX_COUNT_DISTINCT(Sessions)
等公式会产生错误。