Se a indexação avançada de sites estiver ativada no seu repositório de dados, você poderá usar os seguintes tipos de dados estruturados para enriquecer a indexação:
Esta página apresenta os dois tipos de dados estruturados para suas páginas da Web e descreve como adicionar atributos estruturados personalizados ao esquema do seu repositório de dados.
Sobre datas de páginas predefinidas e inferidas pelo Google
Ao rastrear as páginas da Web no repositório de dados do seu site, o Google infere dados da página usando as propriedades aplicáveis ao seu conteúdo. A Vertex AI para Pesquisa adiciona essas propriedades de dados de página inferidas ao seu esquema. Esses dados inferidos incluem as seguintes propriedades de data predefinidas, também chamadas de datas de crédito:
datePublished
: a data e a hora em que a página foi publicada pela primeira vezdateModified
: a data e a hora em que a página foi modificada mais recentemente
Essas propriedades são indexadas automaticamente. Você pode usar essas propriedades de data diretamente para enriquecer sua pesquisa sem adicioná-las ao esquema. Para adicionar datas de autoria ao seu site, consulte Influenciar suas datas de autoria na Pesquisa Google.
Para entender como incluir essas propriedades de data predefinidas nas suas solicitações de pesquisa, como em expressões de filtro e especificações de reforço, consulte Exemplo de caso de uso com uma data de página inferida pelo Google.
Sobre campos de data e hora personalizados em uma página da Web
É possível adicionar campos de data e hora personalizados às suas páginas da Web. Essas tags podem ser usadas com
indexação avançada quando você
adiciona atributos de dados estruturados personalizados ao esquema do repositório de dados.
Confira um exemplo de onde adicionar
uma metatag de data e hora personalizada chamada lastModified
na sua página da Web.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Vertex AI Search can use this date. -->
<meta name="lastModified" content="2022-07-01">
</head>
<body>
</body>
</html>
Para entender como incluir essas tags personalizadas de data e hora nas suas solicitações de pesquisa, como em expressões de filtro e especificações de reforço, consulte Exemplo de caso de uso com um atributo personalizado de data e hora.
Sobre atributos personalizados de dados estruturados
Você pode adicionar atributos de dados estruturados como tags meta
e PageMaps às suas páginas da Web e usá-los para enriquecer a indexação. Para usar atributos estruturados personalizados na indexação, atualize seu esquema.
Exemplo de caso de uso para tags meta
Suponha que você tenha um grande número de páginas da Web relevantes para vários departamentos da sua organização. É possível usar tags meta
para rotular as páginas relevantes para cada departamento. Em seguida, use as tags indexadas como filtros nas suas consultas. Isso permite restringir os resultados da pesquisa a páginas da Web
que contêm um rótulo correspondente a qualquer um dos departamentos especificados.
Esse processo pode ser resumido da seguinte forma:
- Adicione as seguintes tags
meta
a um subconjunto das suas páginas da Web:- Relevante para departamentos de engenharia e TI:
<meta name="department" content="eng, infotech">
- Relevante para os departamentos de finanças e RH:
<meta name="department" content="finance, human resources">
- Relevante para departamentos de engenharia e TI:
- Rastrear novamente as páginas atualizadas.
- Adicione
department
ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.
Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente.
Depois que a reindexação for concluída, use o filtro department
em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários do departamento financeiro fazem consultas, os resultados da pesquisa podem ser mais relevantes para eles com o department
filtro definido como finance
.
Exemplo de tags meta
em uma página da Web
Confira um exemplo das tags meta
que podem ser adicionadas à sua página da Web. Essas tags podem ser usadas com indexação avançada
quando você
adiciona atributos de dados estruturados personalizados ao esquema do repositório de dados.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Robots instructions for crawlers and for Vertex AI Search. -->
<meta name="robots" content="index,follow">
<!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
<meta name="lastModified" content="2024-09-06">
<!-- Vertex AI Search can filter by category or tags. -->
<meta name="category" content="archived">
<meta name="tags" content="legacy,interesting,faq">
<!-- Vertex AI Search can index these common HTML tags. -->
<meta name="description" content="A description of your web page's content.">
<meta name="author" content="Your name or organization">
<meta name="keywords" content="relevant,keywords,separated,by,commas">
<link rel="canonical" href="https://www.yourwebsite.com/this-page">
<meta property="og:title" content="Your Webpage Title">
<meta property="og:description" content="A description of your webpage's content.">
<meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
<meta property="og:url" content="https://www.yourwebsite.com/this-page">
<meta property="og:type" content="website">
<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:title" content="Your customized Webpage Title">
<meta name="twitter:description" content="A description of your webpage's content.">
<meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>
Exemplo de caso de uso para PageMaps
Suponha que você tenha várias páginas da Web com receitas de comida. Você pode adicionar dados do PageMap ao conteúdo HTML de cada página. Em seguida, use os nomes de atributos indexados do PageMap como filtros nas suas consultas. Por exemplo, se você pretende aumentar ou diminuir a classificação de páginas da Web dependendo das avaliações de receitas, siga este processo:
Adicione dados do PageMap semelhantes aos seguintes às suas páginas da Web:
<html> <head> ... <!-- <PageMap> <DataObject type="document"> <Attribute name="title">Baked potatoes</Attribute> <Attribute name="author">Dana A.</Attribute> <Attribute name="description">Homestyle baked potatoes in oven. This recipe uses Russet potatoes.</Attribute> <Attribute name="rating">4.9</Attribute> <Attribute name="lastUpdate">2015-01-01</Attribute> </DataObject> </PageMap> --> </head> ... </html>
Rastrear novamente as páginas atualizadas.
Adicione
rating
ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.
Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente.
Depois que a reindexação for concluída, use o atributo rating
em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários pesquisam receitas, aumente os resultados da pesquisa mais bem avaliados usando rating
como um atributo numérico personalizado.
Exemplo de caso de uso para dados do schema.org
Suponha que você tenha um site de avaliações e que as páginas da Web dele estejam anotadas com
dados do schema.org no formato JSON-LD na tag HTML script
. Em seguida, use as anotações indexadas como filtros nas suas consultas. Por exemplo, se você quiser
promover ou ocultar páginas da Web de acordo com as classificações agregadas, siga
este processo:
Adicione as anotações do schema.org para conteúdo de avaliação semelhante ao seguinte nas suas páginas da Web. Para conferir outros tipos de modelos do schema.org disponíveis, consulte Esquemas:
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Review", "aggregateRating": { "@type": "Average Rating", "ratingValue": 3.5, "reviewCount": 11 }, "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.", "name": "A Christmas Carol", "image": "christmas-carol-first-ed.jpg", "review": [ { "@type": "Review", "author": "Alex T.", "datePublished": "2000-01-01", "reviewBody": "Read this in middle school and have loved this ever since.", "name": "Worth all the adaptations", "reviewRating": { "@type": "Rating", "bestRating": 5, "ratingValue": 5, "worstRating": 1 } } ] } </script>
Rastrear novamente as páginas atualizadas.
Adicione o caminho para
ratingValue
ao esquema do repositório de dados. Use um identificador como o nome do campo no esquema do repositório de dados, comorating_value
, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.
Depois de atualizar o esquema, o repositório de dados é reindexado automaticamente.
Depois que a reindexação for concluída, use o atributo rating_value
em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários pesquisam livros, aumente os resultados da pesquisa mais bem avaliados usando rating_value
como um atributo numérico personalizado.
Antes de começar
Antes de atualizar o esquema do repositório de dados, faça o seguinte:
- Ative a indexação avançada de sites para o repositório de dados. Para mais informações, consulte Ativar a indexação avançada de sites.
- Entender como os dados estruturados funcionam.
- Entenda como usar PageMaps. Revise a lista de DataObjects reconhecidos que podem ser adicionados aos dados do PageMap.
- Entenda como usar tags
meta
. Não use metatags excluídas ou não compatíveis. - Verifique se o atributo que precisa ser indexado não tem nenhum dos seguintes valores:
datePublished
dateModified
siteSearch
- Entenda que, depois de adicionar dados estruturados às suas páginas da Web, você precisa rastrear as páginas novamente. Isso pode levar várias horas.
- Depois de adicionar atributos de dados estruturados ao esquema do repositório de dados, as páginas da Web no repositório são reindexadas automaticamente. A reindexação é uma operação de longa duração que pode levar várias horas.
Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados
Para adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados:
Adicione tags
meta
, dados do PageMap e dados do schema.org a todas as páginas do seu site que você quer enriquecer com a indexação de dados estruturados:Para tags
meta
:- Cada tag
meta
precisa ter o atributoname
definido como o campo que você quer indexar e o atributocontent
como uma string de um ou mais valores separados por vírgula. A Pesquisa da Vertex AI aceita tags
meta
com nomes que correspondem ao padrão[a-zA-Z0-9][a-zA-Z0-9-_]*
. Não use metatags excluídas ou não compatíveis.Se o nome da tag
meta
contiver um caractere especial, como dois pontos (:
), escolha um identificador diferente no esquema para representá-lo e especifique o nome exato da tagmeta
no campositeSearchMetatagName
do esquema.
- Cada tag
Para dados do PageMap:
- Os dados do PageMap precisam consistir em DataObjects reconhecidos que contêm nomes de atributos que você quer indexar. Os nomes de atributos em DataObjects precisam ser definidos como o campo que você quer indexar.
Para dados do schema.org:
- As anotações precisam estar em um formato JSON-LD, microdados ou RDFa válido. Para mais informações, consulte Formatos compatíveis.
Rastreie novamente as páginas da Web atualizadas.
Confira a definição de esquema do seu repositório de dados na API REST.
Atualize o esquema do repositório de dados usando o console Google Cloud ou a API. Se você optar por fazer isso pela API, saiba como fornecer seu próprio esquema como um objeto JSON.
- Adicione objetos para cada atributo personalizado que você quer tornar pesquisável, recuperável ou indexável.
- Adicione o atributo personalizado e defina o
type
comoarray
. - Adicione o tipo de dados do valor do atributo personalizado.
- Especifique a origem do atributo personalizado em que ele pode ser encontrado no
campo
siteSearchStructuredDataSources
. - Para dados do schema.org: especifique o caminho do atributo na anotação do schema.org, começando com a string
_root
no campositeSearchSchemaOrgPaths
.
Confira a seguir um exemplo de atualização de esquema para um site:
{ "type": "object", "properties": { "CUSTOM_ATTRIBUTE": { "type": "array", "items": { "type": "DATA_TYPE", "searchable": true, "retrievable": true, "indexable": true, "siteSearchMetatagName": "METATAG_NAME", "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"] } } }, { "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": { "type": "array", "items": { "type": "DATA_TYPE_SCHEMA_ORG_FIELD", "searchable": true, "retrievable": true, "indexable": true, "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"] } } }, "$schema": "https://json-schema.org/draft/2020-12/schema" }
Substitua:
CUSTOM_ATTRIBUTE
: o valor do atributoname
. Exemplo:- Para uma tag
meta
definida como<meta name="department" content="eng, infotech">
, usedepartment
- Para um atributo PageMap definido como
<Attribute name="rating">4.9</Attribute>
, userating
Às vezes, o nome da tag
meta
que você quer adicionar ao esquema não segue o padrão[a-zA-Z0-9][a-zA-Z0-9-_]*
e contém caracteres especiais, como dois pontos:
. Nesses casos, especifique um atributo personalizado representativo do nome da tagmeta
e o nome exato da tagmeta
no campositeSearchMetatagName
. Por exemplo, se o nome da tagmeta
forog:updated_time
, useog_updated_time
como o identificador no campoCUSTOM_ATTRIBUTE
e useog:updated_time
no campoMETATAG_NAME
.- Para uma tag
DATA_TYPE
: o tipo de dados do atributoname
. Precisa ser string, número ou data/hora. Exemplo:- Para uma tag
meta
definida como<meta name="department" content="eng, infotech">
, usestring
- Para um atributo PageMap definido como
<Attribute name="rating">4.9</Attribute>
, usenumber
- Para um atributo PageMap definido como
<Attribute name="lastPublished">2015-01-01</Attribute>
, usedatetime
Para ver mais informações, consulte
FieldType
.- Para uma tag
METATAG_NAME
: o nome exato da tagmeta
encontrada na página da Web. Esse campo é útil quando o nome da tagmeta
que você quer adicionar ao esquema não segue o padrão[a-zA-Z0-9][a-zA-Z0-9-_]*
e contém caracteres especiais, como dois pontos:
. Nesses casos, especifique um atributo personalizado representativo do nome da tagmeta
emCUSTOM_ATTRIBUTE
e, em seguida, especifique o nome exato da tagmeta
no campositeSearchMetatagName
. Por exemplo, se o nome da tagmeta
forog:updated_time
, useog_updated_time
como o identificador no campoCUSTOM_ATTRIBUTE
eog:updated_time
no campoMETATAG_NAME
. Ao adicionar esse campo para atualizar o esquema, use o endpoint v1alpha em vez do v1 para chamar o métodoschema
.STRUCTURED_DATA_SOURCE_N
: uma matriz que consiste em uma ou ambas as seguintes origens de dados estruturados em que o atributoCUSTOM_ATTRIBUTE
pode ser encontrado:- Se o atributo personalizado puder ser encontrado como uma tag
meta
, especifiqueMETATAGS
. - Se o atributo personalizado puder ser encontrado como um atributo PageMap, especifique
PAGEMAP
- Se o atributo personalizado puder ser encontrado como um dado do schema.org, especifique
SCHEMA_ORG
. - Se o campo
siteSearchStructuredDataSources
estiver ausente ou vazio, os valores de todas as fontes de dados serão mesclados em uma matriz.
- Se o atributo personalizado puder ser encontrado como uma tag
IDENTIFIER_FOR_SCHEMA_ORG_FIELD
: um identificador personalizado para indicar o campo schema.org. Não precisa ser exatamente igual ao nome do campo na anotação schema.org da sua página da Web. Por exemplo, se o caminho do campo for_root.nutrition.calories
, o identificador poderá sercalorific_value
ounutrition_value
.DATA_TYPE_SCHEMA_ORG_FIELD
: o tipo de dados do campo schema.org. Precisa ser string, número ou data/hora. Exemplo:- Para um campo schema.org definido como "calories":"240 calories",
use
string
- Para um campo schema.org definido como "calorias": 240,
use
number
- Para um campo schema.org definido como "foundingDate": "1991-05-01",
use
datetime
Para ver mais informações, consulte
FieldType
.- Para um campo schema.org definido como "calories":"240 calories",
use
PATH_TO_THE_SCHEMA_ORG_FIELD
: o caminho para um único campo no campo schema.org que precisa ser acessado. Ele é especificado usando separadores de ponto após cada nível aninhado. Você precisa especificar o caminho completo necessário para acessar o campo obrigatório. Por exemplo, se um camporatingValue
estiver aninhado no campoaggregateRating
, você poderá especificar o caminho como_root.aggregateRating.ratingValue
.
Depois de atualizar o esquema do site, ele será reindexado automaticamente. Essa é uma operação de longa duração que pode levar várias horas.
A seguir
Use os metadados indexados para o seguinte:
- Controles de veiculação, como otimizar, ocultar e filtrar
- Aparecer como atributos nos resultados da pesquisa
- Filtrar resultados da pesquisa
- Melhorar os resultados da pesquisa