Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Speech-to-Text mithilfe der Google Cloud Console transkribieren
In dieser Kurzanleitung wird die Cloud Speech-to-Text-Konsole vorgestellt. In dieser Kurzanleitung erstellen und optimieren Sie eine Transkription und erfahren, wie Sie diese Konfiguration mit der Speech-to-Text API für Ihre eigenen Anwendungen verwenden.
Wie Sie Anfragen senden und Antworten mithilfe der REST API statt der Console senden, erfahren Sie unter Hinweise.
Hinweis
Bevor Sie die Speech-to-Text-Konsole verwenden können, müssen Sie die API in der Google Cloud Platform Console aktivieren. Die unten stehenden Schritte führen Sie durch die folgenden Aktionen:
Speech-to-Text in einem Projekt aktivieren.
Die Abrechnung für Speech-to-Text muss aktiviert sein.
Sie können entweder ein vorhandenes Projekt auswählen oder ein neues erstellen. Weitere Informationen zum Erstellen eines Projekts finden Sie in der Google Cloud Platform-Dokumentation.
Wenn Sie ein neues Projekt erstellen, werden Sie aufgefordert, ein Abrechnungskonto mit diesem Projekt zu verknüpfen. Wenn Sie ein bereits vorhandenes Projekt verwenden, muss die Abrechnung aktiviert sein.
Nachdem Sie ein Projekt ausgewählt und mit einem Rechnungskonto verknüpft haben, können Sie die Speech-to-Text API aktivieren. Öffnen Sie oben auf der Seite die Leiste Produkte und Ressourcen suchen und geben Sie speech ein.
Wählen Sie in der Ergebnisliste die Cloud Speech-to-Text API aus.
Wenn Sie Speech-to-Text ausprobieren möchten, ohne es mit Ihrem Projekt zu verknüpfen, wählen Sie die Option DIESE API TESTEN aus. Klicken Sie auf AKTIVIEREN, um die Speech-to-Text API für die Verwendung mit Ihrem Projekt zu aktivieren.
Transkription erstellen
Erforderliche Berechtigungen für diese Aufgabe
Zum Ausführen dieser Aufgabe benötigen Sie folgende Berechtigungen:
storage.buckets.get
storage.buckets.list
storage.buckets.update
Auf Projekt- oder Bucketebene:
storage.objects.create
storage.objects.delete
storage.objects.get
storage.objects.list
storage.objects.update
Verwenden Sie die Google Cloud Console, um eine neue Transkription zu erstellen:
Wenn Sie die Konsole zum ersten Mal verwenden, werden Sie aufgefordert, auszuwählen, wo in Cloud Storage Ihre Konfigurationen und Transkriptionen gespeichert werden sollen.
Laden Sie auf der Seite Transkription erstellen eine Quell-Audiodatei hoch.
Sie können eine Datei auswählen, die bereits in Cloud Storage gespeichert ist, oder eine neue in Ihr angegebenes Cloud Storage-Ziel hochladen.
Wählen Sie den Codierungstyp der hochgeladenen Audiodatei aus.
Legen Sie die Abtastrate fest.
Klicken Sie auf Weiter. Sie werden zu Transkriptionsoptionen weitergeleitet.
Transkriptionsoptionen
Wählen Sie den Sprachcode des Audioquells aus. Dies ist die Sprache, die in der Aufzeichnung gesprochen wird.
Wählen Sie das Transkriptionsmodell aus, das Sie für die Datei verwenden möchten.
Die Standardoption ist vorab ausgewählt. Im Allgemeinen ist keine Änderung erforderlich. Das Abgleichen des Modells mit der Art der Audiodaten kann jedoch zu einer höheren Genauigkeit führen.
Die Modellkosten variieren.
Klicken Sie auf Weiter. Sie werden zu Modellanpassung weitergeleitet.
Modellanpassung (optional)
Wenn Ihre Quell-Audioinhalte seltene Wörter, Eigennamen oder proprietäre Begriffe enthalten und Sie bei der Erkennung auf Probleme stoßen, kann die Modellanpassung hilfreich sein.
Klicken Sie das Kästchen Modellanpassung aktivieren an.
Wählen Sie Einmalige Anpassungsressource aus.
Fügen Sie relevante Wortgruppen hinzu und weisen Sie ihnen einen Optimierungswert zu.
Klicken Sie in der linken Spalte auf Senden, um die Transkription zu erstellen.
Transkription prüfen
Je nach Größe der Audiodatei kann die Transkription zwischen Minuten und Stunden dauern. Nachdem die Transkription erstellt wurde, kann sie überprüft werden. Wenn Sie die Tabelle nach Zeitstempel sortieren, können Sie Ihre letzten Transkriptionen ganz einfach finden.
Klicken Sie auf den Namen der Transkription, die Sie sich ansehen möchten.
Vergleichen Sie den Transkriptionstext mit der Audiodatei.
Wenn Sie Änderungen vornehmen möchten, klicken Sie auf Konfiguration wiederverwenden.
Dadurch gelangen Sie zum Ablauf Transkription erstellen mit denselben vorgewählten Optionen, damit Sie ein paar Dinge ändern, eine neue Transkription erstellen und die Ergebnisse vergleichen können.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-18 (UTC)."],[],[],null,["# Quickstart: Transcribe speech to text by using the Google Cloud console\n\nTranscribe speech to text by using the Google Cloud console\n===========================================================\n\nThis quickstart introduces you to the\n[Cloud Speech-to-Text Console](https://console.cloud.google.com/speech). In this\nquickstart, you will create and refine a transcription and learn how to\nuse this configuration with the Speech-to-Text API for your own applications.\n\nTo learn how to send requests and receive responses using the REST API instead\nof the Console, see the\n[before you begin](/speech-to-text/docs/before-you-begin) page.\n\nBefore you begin\n----------------\n\nBefore you can begin using the Speech-to-Text Console, you must enable the\nAPI in the Google Cloud Platform Console. The steps below walk you through the\nfollowing actions:\n\n- Enable Speech-to-Text on a project.\n- Make sure billing is enabled for Speech-to-Text.\n\n### Set up your Google Cloud project\n\n1. [Sign in to Google Cloud console](https://console.cloud.google.com/)\n\n2. [Go to the project selector page](https://console.cloud.google.com/projectselector2/home/dashboard)\n\n You can either choose an existing project or create a new one. For more details\n about creating a project, see\n [Google Cloud Platform documentation](/resource-manager/docs/creating-managing-projects).\n3. If you create a new project, you will be prompted to link a billing account\n to this project. If you are using a pre-existing project, make sure that you\n have billing enabled.\n\n [Learn how to confirm that billing is enabled for your project](/billing/docs/how-to/modify-project)\n | **Note:** You must enable billing to use Speech-to-Text API, however you will not be charged unless you exceed the free quota. See the [pricing](/speech-to-text/pricing) page for more details.\n4. Once you have selected a project and linked it to a billing account, you\n can enable the Speech-to-Text API. Go to the **Search products and\n resources** bar at the top of the page and type in **\"speech\"**.\n\n5. Select the **Cloud Speech-to-Text API** from the list of results.\n\n6. To try Speech-to-Text without linking it to your project, choose\n the **TRY THIS API** option. To enable the Speech-to-Text API for use\n with your project, click **ENABLE**.\n\nCreate a transcription\n----------------------\n\n#### Permissions required for this task\n\nTo perform this task, you must have the following\n[permissions](/iam/docs/overview#permissions):\n\n\n- `storage.buckets.get`\n- `storage.buckets.list`\n- `storage.buckets.update`\n\nAt the project or bucket level:\n\n- `storage.objects.create`\n- `storage.objects.delete`\n- `storage.objects.get`\n- `storage.objects.list`\n- `storage.objects.update`\n\nUse the Google Cloud console to create a new transcription:\n\n### Audio configuration\n\n1. Open the [**Speech-to-Text** overview](https://console.cloud.google.com/speech).\n\n \u003cbr /\u003e\n\n2. Click **Create transcription**.\n\n - If this is your first time using the console, you will be asked to choose where in Cloud Storage to store your configurations and transcriptions.\n3. In the **Create transcription** page, **Upload a source audio file**.\n You can choose a file that is already saved in Cloud Storage or upload a\n new one to your specified Cloud Storage destination.\n\n4. Select the uploaded audio file's **encoding type**.\n\n5. Specify its **sample rate**.\n\n6. Click **Continue** . You will be taken to **Transcription options**.\n\n### Transcription options\n\n1. Select the **language code** of your source audio. This is the language\n being spoken in the recording.\n\n2. Choose the **transcription model** you would like to use on the file.\n The Default option is pre-selected and, generally, no change is needed,\n but matching the model to the type of audio may result in higher accuracy.\n Note that model costs vary.\n\n \u003cbr /\u003e\n\n3. Click **Continue** . You will be taken to **Model adaptation**.\n\n### Model adaptation (optional)\n\nIf your source audio contains things like rare words, proper names, or\nproprietary terms and you experience problems with recognition, model\nadaptation can help.\n\n1. Check **Turn on model adaptation**.\n\n2. Choose **One-time adaptation resource**.\n\n3. Add relevant **phrases** and give them a **boost value**.\n\n \u003cbr /\u003e\n\n4. In the left column, click **Submit** to create your transcription.\n\n### Review your transcription\n\nDepending on the size of your audio file, a transcription may take from minutes\nto hours to create. Once your transcription has been created, it's ready for\nreview. Sorting the table by timestamp can help you easily locate your recent\ntranscriptions.\n\n1. Click on the **Name** of the transcription you would like to review.\n\n2. Compare the **Transcription** text to the audio file\n\n3. If you would like to make changes, click **Reuse configuration** .\n This will bring you to the **Create transcription** flow with the same\n options pre-selected, allowing you to change a few things, create a new\n transcription, and compare the results.\n\nWhat's next\n-----------\n\n\n- Practice [transcribing short audio files](/speech-to-text/docs/sync-recognize).\n- Learn how to [batch long audio files for speech recognition](/speech-to-text/docs/async-recognize).\n- Learn how to [transcribe streaming audio](/speech-to-text/docs/streaming-recognize) like from a microphone.\n- Get started with the Speech-to-Text in your language of choice by using a [Speech-to-Text client library](/speech-to-text/docs/reference/libraries).\n- Work through the [sample applications](/speech-to-text/docs/samples).\n- For best performance, accuracy, and other tips, see the [best practices](/speech-to-text/docs/best-practices) documentation.\n\n\u003cbr /\u003e"]]