Speech-to-Text mithilfe von Clientbibliotheken transkribieren
Auf dieser Seite wird beschrieben, wie Sie mithilfe der Clientbibliotheken vonGoogle Cloud eine Spracherkennungsanfrage in Ihrer bevorzugten Programmiersprache an Cloud Speech-to-Text senden.
Cloud Speech-to-Text ermöglicht die einfache Integration von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Cloud Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Grundlagen von Cloud Speech-to-Text.
Hinweis
Bevor Sie eine Anfrage an die Cloud Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Aktivieren Sie Cloud Speech-to-Text in einem Projekt von Google Cloud .
- Die Abrechnung für Cloud Speech-to-Text muss aktiviert sein.
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud initWenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- Prüfen Sie, ob Sie die Berechtigungen haben, die für diese Anleitung erforderlich sind. Wenn Sie ein neues Projekt für diese Anleitung erstellt haben, haben Sie bereits die erforderlichen Berechtigungen.
- (Optional) Erstellen Sie einen neuen Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Service Usage Consumer (roles/serviceusage.serviceUsageConsumer) für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Transkribieren von Sprache in Text benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Clientbibliothek installieren
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code or IntelliJ, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
npm install @google-cloud/speech
Python
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
pip install --upgrade google-cloud-speech
Anfrage zur Audiotranskription stellen
Jetzt können Sie mithilfe von Cloud STT Audiodateien in Text transkribieren. Mit dem folgenden Code senden Sie eine recognize-Anfrage an die Speech-to-Text API.
Go
Java
Node.js
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Node.js-Entwicklung vorbereitet haben.
Python
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
Glückwunsch! Sie haben Ihre erste Anfrage an Cloud STT gesendet.
Wenn Sie einen Fehler oder eine leere Antwort von Cloud STT erhalten, sehen Sie sich die Schritte zur Fehlerbehebung und Fehlerreduzierung an.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Konto von Google Cloud die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
- Löschen Sie das Projekt mit Google Cloud console , wenn Sie es nicht benötigen.
Nächste Schritte
- Transkribieren kurzer Audiodateien üben
- Mehr über die Zusammenfassung langer Audiodateien für die Spracherkennung
- Mehr über das Transkribieren von Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde
- Erste Schritte mit Cloud STT in Ihrer bevorzugten Sprache unter Zuhilfenahme einer Cloud STT-Clientbibliothek
- Beispielanwendungen durcharbeiten
- Für maximale Leistung, Genauigkeit und weitere Tipps die Best Practices lesen