Abilitazione del filtro per il linguaggio volgare

Questa pagina descrive come utilizzare Speech-to-Text per rilevare automaticamente le parole profane nei dati audio e censurarle nella trascrizione.

Puoi attivare il filtro per il linguaggio volgare impostando profanityFilter=true in RecognitionFeatures. Se è attivata, la funzionalità Converti Speech-to-Text tenterà di rilevare le parole offensive e restituirà solo la prima lettera seguita da asterischi nella trascrizione (ad esempio, f***). Se questo campo è impostato su false o non è impostato, Speech-to-Text non tenterà di filtrare le parolacce.

L'esempio seguente mostra come attivare il filtro per i contenuti inappropriati per far riconoscere l'audio archiviato in un bucket Cloud Storage.

Python

Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.

Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.

from google.cloud import speech
from google.cloud.speech import RecognizeResponse


def sync_recognize_with_profanity_filter_gcs(audio_uri: str) -> RecognizeResponse:
    """Recognizes speech from an audio file in Cloud Storage and filters out profane language.
    Args:
        audio_uri (str): The Cloud Storage URI of the input audio, e.g., gs://[BUCKET]/[FILE]
    Returns:
        cloud_speech.RecognizeResponse: The full response object which includes the transcription results.
    """
    # Define the audio source
    audio = {"uri": audio_uri}

    client = speech.SpeechClient()
    config = speech.RecognitionConfig(
        encoding=speech.RecognitionConfig.AudioEncoding.FLAC,  # Audio format
        sample_rate_hertz=16000,
        language_code="en-US",
        # Enable profanity filter
        profanity_filter=True,
    )

    response = client.recognize(config=config, audio=audio)

    for result in response.results:
        alternative = result.alternatives[0]
        print(f"Transcript: {alternative.transcript}")

    return response.results