Strukturierte Daten für die erweiterte Websiteindexierung verwenden

Wenn die erweiterte Websiteindexierung in Ihrem Datenspeicher aktiviert ist, können Sie die folgenden Arten von strukturierten Daten verwenden, um die Indexierung zu optimieren:

Auf dieser Seite werden beide Arten von strukturierten Daten für Ihre Webseiten vorgestellt und es wird beschrieben, wie Sie Ihrem Datenspeicherschema benutzerdefinierte strukturierte Attribute hinzufügen.

Vordefinierte, von Google abgeleitete Seitendatumsangaben

Beim Crawlen der Webseiten in Ihrem Website-Datenspeicher leitet Google Seitendaten anhand der Eigenschaften ab, die für Ihre Inhalte gelten. Vertex AI Search fügt diese abgeleiteten Seitendatenattribute Ihrem Schema hinzu. Diese abgeleiteten Daten enthalten die folgenden vordefinierten Datumseigenschaften, die auch als Byline-Daten bezeichnet werden:

  • datePublished: Datum und Uhrzeit der Erstveröffentlichung der Seite
  • dateModified: Datum und Uhrzeit der letzten Änderung der Seite.

Diese Properties werden automatisch indexiert. Sie können diese Datumseigenschaften direkt verwenden, um Ihre Suche zu optimieren, ohne sie Ihrem Schema hinzuzufügen. Informationen zum Hinzufügen von Daten der Verfasserzeile auf Ihrer Website finden Sie unter Datum der Verfasserzeile in der Google Suche beeinflussen.

Informationen dazu, wie Sie diese vordefinierten Datumseigenschaften in Ihre Suchanfragen einbeziehen, z. B. in Filterausdrücke und Boost-Spezifikationen, finden Sie unter Beispiel für einen Anwendungsfall mit einem von Google abgeleiteten Seitendatum.

Benutzerdefinierte Datums-/Uhrzeitfelder auf einer Webseite

Sie können Ihren Webseiten benutzerdefinierte Datums-/Uhrzeitfelder hinzufügen. Solche Tags können mit der erweiterten Indexierung verwendet werden, wenn Sie dem Datenspeicherschema benutzerdefinierte Attribute für strukturierte Daten hinzufügen.
Hier sehen Sie ein Beispiel dafür, wo Sie auf Ihrer Webseite ein benutzerdefiniertes Meta-Tag für Datum und Uhrzeit mit dem Namen lastModified hinzufügen.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Informationen dazu, wie Sie solche benutzerdefinierten Datums-/Zeit-Tags in Ihre Suchanfragen einfügen, z. B. in Filterausdrücke und Boost-Spezifikationen, finden Sie unter Beispiel für die Verwendung eines benutzerdefinierten Datums-/Zeit-Attributs.

Benutzerdefinierte Attribute für strukturierte Daten

Sie können Ihren Webseiten Attribute für strukturierte Daten als meta-Tags und PageMaps hinzufügen und so die Indexierung optimieren. Wenn Sie benutzerdefinierte strukturierte Attribute für die Indexierung verwenden möchten, müssen Sie Ihr Schema aktualisieren.

Beispielanwendungsfall für meta-Tags

Angenommen, Sie haben eine große Anzahl von Webseiten, die für verschiedene Abteilungen in Ihrer Organisation relevant sind. Mit meta-Tags können Sie die Seiten kennzeichnen, die für die einzelnen Abteilungen relevant sind. Anschließend können Sie die indexierten Tags als Filter in Ihren Abfragen verwenden. So können Sie Suchergebnisse auf Webseiten beschränken, die ein Label enthalten, das mit einer der angegebenen Abteilungen übereinstimmt.

Dieser kann so zusammengefasst werden:

  1. Fügen Sie den folgenden meta-Tags eine Teilmenge Ihrer Webseiten hinzu:
    • Relevant für Engineering- und IT-Abteilungen: <meta name="department" content="eng, infotech">
    • Relevant für die Finanz- und Personalabteilung: <meta name="department" content="finance, human resources">
  2. Aktualisierte Seiten neu crawlen
  3. Fügen Sie department Ihrem Datenspeicherschema als indexierbares Array hinzu, wie im Abschnitt Benutzerdefinierte Attribute für strukturierte Daten zum Datenspeicherschema hinzufügen beschrieben.

Nach der Aktualisierung Ihres Schemas wird Ihr Datenspeicher automatisch neu indexiert. Nach Abschluss der Neuindexierung können Sie den department-Filter in einem Filterausdruck verwenden, um Suchergebnisse neu zu sortieren oder zu filtern. Wenn Nutzer aus der Finanzabteilung beispielsweise Anfragen stellen, können die Suchergebnisse für sie relevanter gemacht werden, indem der department Filter auf finance gesetzt wird.

Beispiel für meta-Tags auf einer Webseite

Hier sehen Sie ein Beispiel für die meta-Tags, die Sie Ihrer Webseite hinzufügen können. Solche Tags können mit der erweiterten Indexierung verwendet werden, wenn Sie dem Datenspeicherschema benutzerdefinierte Attribute für strukturierte Daten hinzufügen.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Beispielanwendungsfall für PageMaps

Angenommen, Sie haben mehrere Webseiten mit Kochrezepten. Sie können den HTML-Inhalten jeder Seite PageMap-Daten hinzufügen. Sie können die indexierten PageMap-Attributnamen dann als Filter in Ihren Abfragen verwenden. Wenn Sie beispielsweise Webseiten je nach Rezeptbewertung hervorheben oder ausblenden möchten, können Sie so vorgehen:

  1. Fügen Sie Ihren Webseiten PageMap-Daten hinzu, die in etwa so aussehen:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Aktualisierte Seiten neu crawlen

  3. Fügen Sie rating Ihrem Datenspeicherschema als indexierbares Array hinzu, wie im Abschnitt Benutzerdefinierte Attribute für strukturierte Daten zum Datenspeicherschema hinzufügen beschrieben.

Nach der Aktualisierung Ihres Schemas wird Ihr Datenspeicher automatisch neu indexiert. Nachdem die Neuindexierung abgeschlossen ist, können Sie das Attribut rating in einem Filterausdruck verwenden, um Suchergebnisse neu zu sortieren oder zu filtern. Wenn Nutzer beispielsweise nach Rezepten suchen, können Sie die Suchergebnisse mit den besten Bewertungen mithilfe von rating als benutzerdefiniertes numerisches Attribut hervorheben.

Beispielanwendungsfall für schema.org-Daten

Angenommen, Sie haben eine Rezensionswebsite und ihre Webseiten sind mit schema.org-Daten im JSON-LD-Format innerhalb des HTML-Tags script annotiert. Sie können die indexierten Anmerkungen dann als Filter in Ihren Abfragen verwenden. Wenn Sie beispielsweise Webseiten basierend auf den aggregierten Bewertungen hervorheben oder unterdrücken möchten, können Sie so vorgehen:

  1. Fügen Sie Ihren Webseiten die Schema.org-Anmerkungen für Rezensionsinhalte hinzu, die dem folgenden Beispiel ähneln. Andere verfügbare schema.org-Vorlagen finden Sie unter Schemas:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Aktualisierte Seiten neu crawlen

  3. Fügen Sie den Pfad zu ratingValue in Ihr Datenspeicherschema ein. Verwenden Sie eine Kennung als Feldname im Datenspeicherschema, z. B. rating_value, wie im Abschnitt Benutzerdefinierte Attribute für strukturierte Daten zum Datenspeicherschema hinzufügen beschrieben.

Nach der Aktualisierung Ihres Schemas wird Ihr Datenspeicher automatisch neu indexiert. Nachdem die Neuindexierung abgeschlossen ist, können Sie das Attribut rating_value in einem Filterausdruck verwenden, um Suchergebnisse neu zu sortieren oder zu filtern. Wenn Nutzer beispielsweise nach Büchern suchen, können Sie die Suchergebnisse mit den besten Bewertungen mithilfe von rating_value als benutzerdefiniertes numerisches Attribut hervorheben.

Hinweise

Führen Sie vor dem Aktualisieren des Datenspeicherschemas die folgenden Schritte aus:

Benutzerdefinierte Attribute für strukturierte Daten zum Datenspeicherschema hinzufügen

So fügen Sie dem Datenspeicher-Schema benutzerdefinierte Attribute für strukturierte Daten hinzu:

  1. Fügen Sie allen Seiten Ihrer Website, die Sie mit der Indexierung strukturierter Daten anreichern möchten, meta-Tags, PageMap-Daten und schema.org-Daten hinzu:

    • Für meta-Tags:

      • Für jedes meta-Tag muss das Attribut name auf das Feld festgelegt werden, das Sie indexieren möchten, und das Attribut content auf einen String mit einem oder mehreren durch Kommas getrennten Werten.
      • Vertex AI Search unterstützt meta-Tags mit Namen, die dem Muster [a-zA-Z0-9][a-zA-Z0-9-_]* entsprechen. Verwenden Sie keine ausgeschlossenen oder nicht unterstützten Meta-Tags.

        Wenn der Name Ihres meta-Tags ein Sonderzeichen wie einen Doppelpunkt (:) enthält, müssen Sie im Schema eine andere Kennzeichnung dafür auswählen und dann den genauen Namen des meta-Tags im Feld siteSearchMetatagName des Schemas angeben.

    • Für PageMap-Daten:

      • PageMap-Daten müssen aus erkannten DataObjects bestehen, die Attributnamen enthalten, die Sie indexieren möchten. Die Attributnamen in den DataObjects müssen auf das Feld festgelegt werden, das Sie indexieren möchten.
    • Für Schema.org-Daten:

      • Die Anmerkungen müssen im gültigen JSON-LD-, Mikrodaten- oder RDFa-Format vorliegen. Weitere Informationen finden Sie unter Unterstützte Formate.
  2. Crawlen Sie die aktualisierten Webseiten noch einmal.

  3. Schema für Ihren Datenspeicher über die REST API aufrufen

  4. Aktualisieren Sie das Datenspeicherschema über die Google Cloud -Konsole oder die API. Wenn Sie das über die API tun möchten, erfahren Sie hier, wie Sie Ihr eigenes Schema als JSON-Objekt bereitstellen.

    1. Fügen Sie Objekte für jedes benutzerdefinierte Attribut hinzu, das durchsuchbar, abrufbar oder indexierbar sein soll.
    2. Fügen Sie das benutzerdefinierte Attribut hinzu und legen Sie dessen type auf array fest.
    3. Fügen Sie den Datentyp des Werts des benutzerdefinierten Attributs hinzu.
    4. Geben Sie die Quelle des benutzerdefinierten Attributs an, aus der es im Feld siteSearchStructuredDataSources abgerufen werden kann.
    5. Für schema.org-Daten: Geben Sie den Pfad des Attributs in der schema.org-Annotation an. Beginnen Sie mit dem String _root im Feld siteSearchSchemaOrgPaths.

    Das folgende Beispiel zeigt eine Schemaaktualisierung für eine Website:

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      },
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Ersetzen Sie Folgendes:

    • CUSTOM_ATTRIBUTE: Der Wert des Attributs name. Beispiel:

      • Verwenden Sie für ein meta-Tag, das als <meta name="department" content="eng, infotech"> definiert ist, department.
      • Verwenden Sie für ein PageMap-Attribut, das als <Attribute name="rating">4.9</Attribute> definiert ist, rating.

      Manchmal entspricht der meta-Tag-Name, den Sie dem Schema hinzufügen möchten, nicht dem Muster [a-zA-Z0-9][a-zA-Z0-9-_]* und enthält Sonderzeichen wie einen Doppelpunkt :. Geben Sie in solchen Fällen ein benutzerdefiniertes Attribut an, das für den meta-Tag-Namen steht, und geben Sie dann den genauen meta-Tag-Namen im Feld siteSearchMetatagName an. Wenn der Name Ihres meta-Tags beispielsweise og:updated_time ist, verwenden Sie og_updated_time als Kennzeichnung im Feld CUSTOM_ATTRIBUTE und og:updated_time im Feld METATAG_NAME.

    • DATA_TYPE: Der Datentyp des Attributs name. Muss entweder ein String, eine Zahl oder ein Datums-/Uhrzeitwert sein. Beispiel:

      • Verwenden Sie für ein meta-Tag, das als <meta name="department" content="eng, infotech"> definiert ist, string.
      • Verwenden Sie für ein PageMap-Attribut, das als <Attribute name="rating">4.9</Attribute> definiert ist, number.
      • Verwenden Sie für ein PageMap-Attribut, das als <Attribute name="lastPublished">2015-01-01</Attribute> definiert ist, datetime.

      Weitere Informationen finden Sie unter FieldType.

    • METATAG_NAME: Der genaue Name des meta-Tags, wie er auf der Webseite zu finden ist. Dieses Feld ist hilfreich, wenn der meta-Tag-Name, den Sie dem Schema hinzufügen möchten, nicht dem Muster [a-zA-Z0-9][a-zA-Z0-9-_]* entspricht und Sonderzeichen wie einen Doppelpunkt : enthält. Geben Sie in solchen Fällen im Feld CUSTOM_ATTRIBUTE ein benutzerdefiniertes Attribut an, das für den Tag-Namen meta steht, und dann im Feld siteSearchMetatagName den genauen Tag-Namen meta. Wenn der Name des meta-Tags beispielsweise og:updated_time lautet, verwenden Sie og_updated_time als Kennzeichnung im Feld CUSTOM_ATTRIBUTE und og:updated_time im Feld METATAG_NAME. Wenn Sie dieses Feld hinzufügen, um das Schema zu aktualisieren, müssen Sie den v1alpha-Endpunkt anstelle des v1-Endpunkts verwenden, um die Methode schema aufzurufen.

    • STRUCTURED_DATA_SOURCE_N: Ein Array, das eine oder beide der folgenden strukturierten Datenquellen enthält, in denen das Attribut CUSTOM_ATTRIBUTE zu finden ist:

      • Wenn das benutzerdefinierte Attribut als meta-Tag gefunden werden kann, geben Sie METATAGS an.
      • Wenn das benutzerdefinierte Attribut als PageMap-Attribut gefunden werden kann, geben Sie PAGEMAP an.
      • Wenn das benutzerdefinierte Attribut als Schema.org-Daten gefunden werden kann, geben Sie SCHEMA_ORG an.
      • Wenn das Feld siteSearchStructuredDataSources fehlt oder leer gelassen wird, werden die Werte aus allen drei Datenquellen in einem Array zusammengeführt.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: Eine benutzerdefinierte Kennung für das schema.org-Feld. Er muss nicht genau mit dem Feldnamen in der schema.org-Annotation auf Ihrer Webseite übereinstimmen. Wenn der Pfad des Felds beispielsweise _root.nutrition.calories ist, kann der Bezeichner calorific_value oder nutrition_value sein.

    • DATA_TYPE_SCHEMA_ORG_FIELD: Der Datentyp des schema.org-Felds. Muss ein String, eine Zahl oder ein Datums-/Uhrzeitwert sein. Beispiel:

      • Für ein schema.org-Feld, das als „calories“ definiert ist: „240 calories“, verwende string
      • Für ein schema.org-Feld, das als „calories“ definiert ist: 240, verwenden Sie number
      • Für ein schema.org-Feld, das als „foundingDate“ definiert ist: „1991-05-01“, verwenden Sie datetime

      Weitere Informationen finden Sie unter FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: der Pfad zu einem einzelnen Feld im schema.org-Feld, auf das zugegriffen werden muss. Sie wird mit Punkt-Trennzeichen nach jeder verschachtelten Ebene angegeben. Sie müssen den vollständigen Pfad angeben, der für den Zugriff auf das erforderliche Feld benötigt wird. Wenn beispielsweise ein Feld ratingValue im Feld aggregateRating verschachtelt ist, können Sie den Pfad als _root.aggregateRating.ratingValue angeben.

Nachdem Sie das Website-Schema aktualisiert haben, wird die Website automatisch neu indexiert. Dies ist ein Vorgang mit langer Ausführungszeit, der mehrere Stunden dauern kann.

Nächste Schritte

Die indexierten Metadaten können für Folgendes verwendet werden: