Media TranslationBeta
Añade traducciones de audio en tiempo real directamente a tu contenido y tus aplicaciones.
Escala de forma rápida y mundial con la traducción dinámica de audio
Novedades
Calidad contrastada
Gracias a los conocimientos de Google en materia de aprendizaje automático, la calidad de las tecnologías de traducción y reconocimiento de voz de Google Cloud goza de gran prestigio en todo el mundo. La API Media Translation aúna varias tecnologías de vanguardia para ofrecerte los últimos avances en traducción de audio junto con las funciones de nuestras conocidas API Translation y Speech-to-Text.
Traducción optimizada de contenido
Traduce contenido directamente a partir de los datos de audio. La API Media Translation optimiza la integración de los modelos de audio a texto para mejorar la precisión de la interpretación y abstrae los posibles conflictos cuando inicias varias llamadas a la API. Solo hace falta una única llamada a la API para que Media Translation se encargue de todo.
Traducción en streaming a gran velocidad
El resultado de la traducción se transmite conforme se recibe el sonido de un micrófono o de un archivo de audio grabado previamente. La API Media Translation minimiza la latencia entre los datos de entrada y los resultados de la traducción, mejorando así la experiencia de los usuarios y posibilitando la interacción en tiempo real entre idiomas y zonas geográficas distintas.
Características
Traducción en streaming
La traducción en tiempo real se genera durante la entrada de audio en streaming procedente de un micrófono o un archivo de sonido grabado previamente. Por su parte, la API optimiza la integración para reducir la latencia.
Puntuación automática
La API puntúa correctamente los resultados de la traducción (es decir, emplea puntos, comas, signos de interrogación, etc.).
Modelos mejorados
La API Media Translation incorpora dos modelos mejorados (vídeo y llamada telefónica) para que optimices la precisión del audio que utilices en cada caso.
Idiomas compatibles
La API Media Translation es compatible con 12 idiomas.
"Nuestro objetivo en OnePlus es compartir la mejor tecnología con el mundo entero, codo con codo con nuestros usuarios. Una de las características más importantes de nuestro producto es que posibilita la comunicación cara a cara con personas que estén en otros países, en otras zonas horarias e, incluso, que hablen otros idiomas. La API Media Translation de Google Cloud nos permite generar traducciones en tiempo real de los chats de vídeo con una sencilla integración de la API. Y como la latencia es mínima, nuestros clientes no tienen ningún problema para sentirse conectados".
Gary Chen, director de Producto de Software de OnePlus
Recursos
-
Documentos básicosConsulta esta guía en la que se detallan los conceptos básicos para usar la API Media Translation.
-
Idiomas disponiblesLa API Media Translation es compatible con 12 idiomas.
-
Prácticas recomendadasTe damos algunas recomendaciones sobre cómo enviar datos de audio a la API Media Translation.
-
Bibliotecas de clienteLas bibliotecas de cliente de la API Media Translation se basan en las bibliotecas de cliente de Google Cloud.
-
Traducir audio en streamingTe explicamos algunos códigos de ejemplo que muestran cómo traducir audio en streaming a formato de texto.
-
Notas de la versiónConsulta las últimas actualizaciones de la API Media Translation.
-
Traducción de vídeo en tiempo real con subtítulos en realidad aumentadaDescubre cómo añadir subtítulos traducidos a cualquier vídeo en tiempo real.
-
Creación de superposiciones de traducciones en tiempo realAprende a superponer traducciones en forma de subtítulos sobre un feed de vídeo en directo utilizando un mezclador de vídeo y una herramienta de claves de luminancia.
Precios
El precio de la API Media Translation se determina mensualmente en función del volumen de audio traducido que el servicio haya procesado y del modelo de traducción empleado. El uso se mide en incrementos redondeados a los siguientes 15 segundos.
Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.
Añade traducciones de audio en tiempo real directamente a tu contenido y tus aplicaciones.