Si la indexación avanzada de sitios web está habilitada en tu almacén de datos, puedes usar los siguientes tipos de datos estructurados para enriquecer tu indexación:
- Fechas de página predefinidas y obtenidas por Google
- Atributos de datos estructurados personalizados
En esta página, se presentan ambos tipos de datos estructurados para tus páginas web y se describe cómo agregar atributos estructurados personalizados al esquema de tu almacén de datos.
Acerca de las fechas de páginas predefinidas y las que infiere Google
Cuando rastrea las páginas web en el almacén de datos de tu sitio web, Google infiere los datos de la página con las propiedades que se aplican a tu contenido. Vertex AI Search agrega estas propiedades de datos de la página inferidas a tu esquema. Estos datos inferidos incluyen las siguientes propiedades de fecha predefinidas, que también se denominan fechas de firma:
datePublished
: La fecha y hora en que se publicó la página por primera vezdateModified
: La fecha y hora en la que se modificó la página por última vez
Estas propiedades se indexan automáticamente. Puedes usar directamente estas propiedades de fecha para enriquecer tu búsqueda sin agregarlas a tu esquema. Para agregar fechas de firma a tu sitio web, consulta Cómo influir en las fechas de firma de tus artículos en la Búsqueda de Google.
Para comprender cómo incluir estas propiedades de fecha predefinidas en tus solicitudes de búsqueda, como en las expresiones de filtro y las especificaciones de refuerzo, consulta el Ejemplo de caso de uso con una fecha de página inferida por Google.
Acerca de los campos de fecha y hora personalizados en una página web
Puedes agregar campos de fecha y hora personalizados a tus páginas web. Estas etiquetas se pueden usar con la indexación avanzada cuando agregas atributos de datos estructurados personalizados al esquema del almacén de datos.
Este es un ejemplo que muestra dónde agregar una metaetiqueta de fecha y hora personalizada llamada lastModified
en tu página web.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Vertex AI Search can use this date. -->
<meta name="lastModified" content="2022-07-01">
</head>
<body>
</body>
</html>
Para comprender cómo incluir estas etiquetas personalizadas de fecha y hora en tus solicitudes de búsqueda, como en las expresiones de filtro y las especificaciones de refuerzo, consulta el Ejemplo de caso de uso con un atributo personalizado de fecha y hora.
Acerca de los atributos de datos estructurados personalizados
Puedes agregar atributos de datos estructurados como etiquetas meta
y PageMaps a tus páginas web, y usarlos para enriquecer tu indexación. Para usar atributos estructurados personalizados para la indexación, debes actualizar tu esquema.
Ejemplo de caso de uso para las etiquetas meta
Supongamos que tienes una gran cantidad de páginas web relevantes para varios departamentos de tu organización. Puedes usar etiquetas meta
para etiquetar las páginas que son relevantes para cada departamento. Luego, puedes usar las etiquetas indexadas como filtros en tus consultas. Esto te permite restringir los resultados de la búsqueda a las páginas web que contienen una etiqueta que coincide con cualquiera de los departamentos especificados.
Este proceso se puede resumir de la siguiente manera:
- Agrega las siguientes etiquetas
meta
a un subconjunto de tus páginas web:- Es relevante para los departamentos de ingeniería y TI:
<meta name="department" content="eng, infotech">
- Información relevante para los departamentos de finanzas y RR.HH.:
<meta name="department" content="finance, human resources">
- Es relevante para los departamentos de ingeniería y TI:
- Vuelve a rastrear las páginas actualizadas.
- Agrega
department
al esquema de tu almacén de datos como un array indexable, como se describe en la sección Cómo agregar atributos de datos estructurados personalizados al esquema del almacén de datos.
Después de actualizar tu esquema, se vuelve a indexar automáticamente tu almacén de datos.
Una vez que se complete la reindexación, podrás usar el filtro department
en una expresión de filtro para reordenar o filtrar los resultados de la búsqueda. Por ejemplo, cuando los usuarios del departamento de finanzas emiten búsquedas, los resultados pueden ser más relevantes para ellos con el department
filtro establecido en finance
.
Ejemplo de etiquetas meta
en una página web
A continuación, se muestra un ejemplo de las etiquetas meta
que puedes agregar a tu página web. Estas etiquetas se pueden usar con la indexación avanzada cuando agregas atributos de datos estructurados personalizados al esquema del almacén de datos.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Robots instructions for crawlers and for Vertex AI Search. -->
<meta name="robots" content="index,follow">
<!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
<meta name="lastModified" content="2024-09-06">
<!-- Vertex AI Search can filter by category or tags. -->
<meta name="category" content="archived">
<meta name="tags" content="legacy,interesting,faq">
<!-- Vertex AI Search can index these common HTML tags. -->
<meta name="description" content="A description of your web page's content.">
<meta name="author" content="Your name or organization">
<meta name="keywords" content="relevant,keywords,separated,by,commas">
<link rel="canonical" href="https://www.yourwebsite.com/this-page">
<meta property="og:title" content="Your Webpage Title">
<meta property="og:description" content="A description of your webpage's content.">
<meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
<meta property="og:url" content="https://www.yourwebsite.com/this-page">
<meta property="og:type" content="website">
<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:title" content="Your customized Webpage Title">
<meta name="twitter:description" content="A description of your webpage's content.">
<meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>
Ejemplo de caso de uso de PageMaps
Supongamos que tienes varias páginas web que contienen recetas de comida. Puedes agregar datos de PageMap al contenido HTML de cada página. Luego, puedes usar los nombres de los atributos de PageMap indexados como filtros en tus búsquedas. Por ejemplo, si deseas potenciar o enterrar páginas web según las calificaciones de las recetas, puedes seguir este proceso:
Agrega datos de PageMap similares a los siguientes a tus páginas web:
<html> <head> ... <!-- <PageMap> <DataObject type="document"> <Attribute name="title">Baked potatoes</Attribute> <Attribute name="author">Dana A.</Attribute> <Attribute name="description">Homestyle baked potatoes in oven. This recipe uses Russet potatoes.</Attribute> <Attribute name="rating">4.9</Attribute> <Attribute name="lastUpdate">2015-01-01</Attribute> </DataObject> </PageMap> --> </head> ... </html>
Vuelve a rastrear las páginas actualizadas.
Agrega
rating
al esquema de tu almacén de datos como un array indexable, como se describe en la sección Cómo agregar atributos de datos estructurados personalizados al esquema del almacén de datos.
Después de actualizar tu esquema, se vuelve a indexar automáticamente tu almacén de datos.
Una vez que se complete la reindexación, podrás usar el atributo rating
en una expresión de filtro para reordenar o filtrar los resultados de la búsqueda. Por ejemplo, cuando los usuarios buscan recetas, puedes potenciar los resultados de la búsqueda que tienen las mejores calificaciones con rating
como un atributo numérico personalizado.
Ejemplo de caso de uso para los datos de schema.org
Supongamos que tienes un sitio web de opiniones y sus páginas web están anotadas con datos de schema.org en formato JSON-LD dentro de la etiqueta script
de HTML. Luego, puedes usar las anotaciones indexadas como filtros en tus consultas. Por ejemplo, si deseas potenciar o enterrar páginas web según las calificaciones agregadas, puedes seguir este proceso:
Agrega las anotaciones de schema.org para el contenido de opiniones similares a las siguientes a tus páginas web. Para ver otros tipos de plantillas de schema.org disponibles, consulta Esquemas:
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Review", "aggregateRating": { "@type": "Average Rating", "ratingValue": 3.5, "reviewCount": 11 }, "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.", "name": "A Christmas Carol", "image": "christmas-carol-first-ed.jpg", "review": [ { "@type": "Review", "author": "Alex T.", "datePublished": "2000-01-01", "reviewBody": "Read this in middle school and have loved this ever since.", "name": "Worth all the adaptations", "reviewRating": { "@type": "Rating", "bestRating": 5, "ratingValue": 5, "worstRating": 1 } } ] } </script>
Vuelve a rastrear las páginas actualizadas.
Agrega la ruta de acceso a
ratingValue
al esquema de tu almacén de datos. Usa un identificador como nombre de campo en el esquema del almacén de datos, comorating_value
, según se describe en la sección Cómo agregar atributos de datos estructurados personalizados al esquema del almacén de datos.
Después de actualizar tu esquema, se vuelve a indexar automáticamente tu almacén de datos.
Una vez que se complete la reindexación, podrás usar el atributo rating_value
en una expresión de filtro para reordenar o filtrar los resultados de la búsqueda. Por ejemplo, cuando los usuarios buscan libros, puedes potenciar los resultados de la búsqueda que tienen las mejores calificaciones con rating_value
como un atributo numérico personalizado.
Antes de comenzar
Antes de actualizar el esquema del almacén de datos, haz lo siguiente:
- Activa la indexación avanzada de sitios web para el almacén de datos. Para obtener más información, consulta Cómo activar la indexación avanzada de sitios web.
- Comprende cómo funcionan los datos estructurados.
- Comprende cómo usar PageMaps. Revisa la lista de DataObjects reconocidos que se pueden agregar a los datos de PageMap.
- Comprende cómo usar las etiquetas
meta
. Asegúrate de no usar etiquetas meta excluidas ni no admitidas. - Asegúrate de que el atributo que se debe indexar no tenga ninguno de los siguientes valores:
datePublished
dateModified
siteSearch
- Ten en cuenta que, después de agregar datos estructurados a tus páginas web, debes volver a rastrearlas. Este proceso puede tardar varias horas.
- Ten en cuenta que, después de agregar atributos de datos estructurados al esquema del almacén de datos, se vuelven a indexar automáticamente las páginas web de tu almacén de datos. La reindexación es una operación de larga duración que puede tardar varias horas.
Agrega atributos de datos estructurados personalizados al esquema del almacén de datos
Sigue estos pasos para agregar atributos de datos estructurados personalizados al esquema del almacén de datos:
Agrega etiquetas
meta
, datos de PageMap y datos de schema.org a todas las páginas de tu sitio web que desees enriquecer con la indexación de datos estructurados:Para las etiquetas de
meta
, haz lo siguiente:- Cada etiqueta
meta
debe tener su atributoname
establecido en el campo que deseas indexar y su atributocontent
en una cadena de uno o más valores separados por comas. Vertex AI Search admite etiquetas
meta
con nombres que coinciden con el patrón[a-zA-Z0-9][a-zA-Z0-9-_]*
. Asegúrate de no usar metaetiquetas excluidas ni no admitidas.Si el nombre de tu etiqueta
meta
contiene un carácter especial, como dos puntos (:
), debes elegir un identificador diferente en el esquema para representarlo y, luego, especificar el nombre exacto de la etiquetameta
en el campositeSearchMetatagName
del esquema.
- Cada etiqueta
Para los datos de PageMap:
- Los datos de PageMap deben constar de objetos DataObject reconocidos que contengan nombres de atributos que desees indexar. Los nombres de los atributos dentro de los DataObjects deben establecerse en el campo que deseas indexar.
Para los datos de schema.org, haz lo siguiente:
- Las anotaciones deben estar en formato JSON-LD, microdatos o RDFa válidos. Para obtener más información, consulta Formatos compatibles.
Vuelve a rastrear las páginas web actualizadas.
Consulta la definición del esquema de tu almacén de datos a través de la API de REST.
Actualiza el esquema del almacén de datos con la consola de Google Cloud o la API. Si decides hacerlo a través de la API, consulta cómo proporcionar tu propio esquema como un objeto JSON.
- Agrega objetos para cada atributo personalizado que quieras que se pueda buscar, recuperar o indexar.
- Agrega el atributo personalizado y establece su
type
enarray
. - Agrega el tipo de datos del valor del atributo personalizado.
- Especifica la fuente del atributo personalizado en el campo
siteSearchStructuredDataSources
. - Para los datos de schema.org, especifica la ruta de acceso del atributo en la anotación de schema.org que comienza con la cadena
_root
en el campositeSearchSchemaOrgPaths
.
El siguiente es un ejemplo de una actualización de esquema para un sitio web:
{ "type": "object", "properties": { "CUSTOM_ATTRIBUTE": { "type": "array", "items": { "type": "DATA_TYPE", "searchable": true, "retrievable": true, "indexable": true, "siteSearchMetatagName": "METATAG_NAME", "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"] } } }, { "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": { "type": "array", "items": { "type": "DATA_TYPE_SCHEMA_ORG_FIELD", "searchable": true, "retrievable": true, "indexable": true, "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"] } } }, "$schema": "https://json-schema.org/draft/2020-12/schema" }
Reemplaza lo siguiente:
CUSTOM_ATTRIBUTE
: Es el valor del atributoname
. Por ejemplo:- Para una etiqueta
meta
definida como<meta name="department" content="eng, infotech">
, usadepartment
. - Para un atributo de PageMap definido como
<Attribute name="rating">4.9</Attribute>
, usarating
.
A veces, el nombre de la etiqueta
meta
que deseas agregar al esquema no sigue el patrón[a-zA-Z0-9][a-zA-Z0-9-_]*
y contiene caracteres especiales, como dos puntos:
. En esos casos, especifica un atributo personalizado que represente el nombre de la etiquetameta
y, luego, especifica el nombre exacto de la etiquetameta
en el campositeSearchMetatagName
. Por ejemplo, si el nombre de tu etiquetameta
esog:updated_time
, usaog_updated_time
como el identificador en el campoCUSTOM_ATTRIBUTE
y usaog:updated_time
en el campoMETATAG_NAME
.- Para una etiqueta
DATA_TYPE
: Es el tipo de datos del atributoname
. Debe ser una cadena, un número o una fecha y hora. Por ejemplo:- Para una etiqueta
meta
definida como<meta name="department" content="eng, infotech">
, usastring
. - Para un atributo de PageMap definido como
<Attribute name="rating">4.9</Attribute>
, usanumber
. - Para un atributo de PageMap definido como
<Attribute name="lastPublished">2015-01-01</Attribute>
, usadatetime
.
Para obtener más información, consulta
FieldType
.- Para una etiqueta
METATAG_NAME
: Es el nombre exacto de la etiquetameta
tal como se encuentra en la página web. Este campo es útil cuando el nombre de la etiquetameta
que deseas agregar al esquema no sigue el patrón[a-zA-Z0-9][a-zA-Z0-9-_]*
y contiene caracteres especiales, como dos puntos:
. En esos casos, especifica un atributo personalizado que represente el nombre de la etiquetameta
enCUSTOM_ATTRIBUTE
y, luego, especifica el nombre exacto de la etiquetameta
en el campositeSearchMetatagName
. Por ejemplo, si el nombre de tu etiquetameta
esog:updated_time
, usaog_updated_time
como identificador en el campoCUSTOM_ATTRIBUTE
y usaog:updated_time
en el campoMETATAG_NAME
. Cuando agregues este campo para actualizar el esquema, debes usar el extremo v1alpha en lugar del extremo v1 para llamar al métodoschema
.STRUCTURED_DATA_SOURCE_N
: Es un array que consta de una o ambas de las siguientes fuentes de datos estructurados en las que se puede encontrar el atributoCUSTOM_ATTRIBUTE
:- Si el atributo personalizado se puede encontrar como una etiqueta
meta
, especificaMETATAGS
. - Si el atributo personalizado se puede encontrar como un atributo de PageMap, especifica
PAGEMAP
. - Si el atributo personalizado se puede encontrar como datos de schema.org, especifica
SCHEMA_ORG
. - Si el campo
siteSearchStructuredDataSources
no está presente o se deja vacío, los valores de las tres fuentes de datos se combinan en un array.
- Si el atributo personalizado se puede encontrar como una etiqueta
IDENTIFIER_FOR_SCHEMA_ORG_FIELD
: Es un identificador personalizado para denotar el campo de schema.org. No es necesario que sea exactamente igual al nombre del campo en la anotación de schema.org de tu página web. Por ejemplo, si la ruta del campo es_root.nutrition.calories
, el identificador puede sercalorific_value
onutrition_value
.DATA_TYPE_SCHEMA_ORG_FIELD
: Es el tipo de datos del campo de schema.org. Debe ser una cadena, un número o una fecha y hora. Por ejemplo:- Para un campo de schema.org definido como "calorías":"240 calorías", usa
string
. - Para un campo de schema.org definido como "calories": 240, usa
number
- Para un campo de schema.org definido como "foundingDate": "1991-05-01", usa
datetime
Para obtener más información, consulta
FieldType
.- Para un campo de schema.org definido como "calorías":"240 calorías", usa
PATH_TO_THE_SCHEMA_ORG_FIELD
: Es la ruta de acceso a un solo campo en el campo schema.org al que se debe acceder. Se especifica con separadores de puntos después de cada nivel anidado. Debes especificar la ruta de acceso completa necesaria para acceder al campo obligatorio. Por ejemplo, si un camporatingValue
está anidado en el campoaggregateRating
, puedes especificar la ruta de acceso como_root.aggregateRating.ratingValue
.
Después de que actualices el esquema del sitio web, se volverá a indexar automáticamente. Esta es una operación de larga duración que puede tardar varias horas.
¿Qué sigue?
Usa los metadatos indexados para lo siguiente:
- Controles de publicación, como mejorar, ocultar y filtrar
- Aparecen como facetas en los resultados de la búsqueda
- Cómo filtrar los resultados de la búsqueda
- Mejora los resultados de la búsqueda