Speech-to-Text mithilfe des gcloud CLI transkribieren
Auf dieser Seite wird beschrieben, wie Sie mit dem gcloud
-Tool über die Befehlszeile eine Spracherkennungsanfrage an Speech-to-Text senden.
Speech-to-Text ermöglicht die einfache Einbindung von Google-Spracherkennungstechnologien in Entwickleranwendungen. Sie können Audiodaten an die Speech-to-Text API senden, die dann eine Texttranskription dieser Audiodatei zurückgibt. Weitere Informationen zu diesem Dienst finden Sie unter Spracherkennung – Grundlagen.
Hinweis
Bevor Sie eine Anfrage an die Speech-to-Text API senden können, müssen Sie die folgenden Aktionen abgeschlossen haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Speech-to-Text in einem GCP-Projekt aktivieren.
- Die Abrechnung für Speech-to-Text muss aktiviert sein.
-
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit folgendem Befehl:
gcloud init
- (Optional) Erstellen Sie einen neuen Google Cloud Storage-Bucket zum Speichern Ihrer Audiodaten.
Anfrage zur Audiotranskription stellen
Jetzt können Sie mithilfe von Speech-to-Text Audiodateien in Text transkribieren. Mit dem folgenden Codebeispiel können Sie eine recognize
-Anfrage an die Speech-to-Text API senden.
Öffnen Sie die Befehlszeilen-Shell und führen Sie den folgenden Befehl aus:
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Mit diesem Befehl wird Speech-to-Text aufgefordert, die Audiodaten einer FLAC-Datei zu transkribieren, die an einem öffentlich zugänglichen Speicherort gehostet ist.
Wenn die Anfrage erfolgreich ist, gibt der Server eine Antwort im JSON-Format zurück:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Glückwunsch! Sie haben Ihre erste Anfrage an Speech-to-Text gesendet.
Wenn Sie eine Fehlermeldung oder eine leere Antwort von Speech-to-Text erhalten, lesen Sie die Informationen unter Fehlerbehebung und die Schritte zur Fehlerminimierung.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
- Löschen Sie das Projekt mit der Google Cloud console , wenn Sie es nicht benötigen.
Nächste Schritte
- Transkribieren kurzer Audiodateien üben
- Mehr über die Zusammenfassung langer Audiodateien für die Spracherkennung
- Mehr über das Transkribieren von Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde
- Erste Schritte mit Speech-to-Text in Ihrer bevorzugten Sprache unter Verwendung einer Speech-to-Text-Clientbibliothek
- Beispielanwendungen durcharbeiten
- Für maximale Leistung, Genauigkeit und weitere Tipps die Best Practices lesen