Precios de Dataproc
- Precios de Dataproc en Compute Engine
- Dataproc sobre los precios de GKE
- Precios de Dataproc Serverless
Precios de Dataproc en Compute Engine
El precio de Dataproc en Compute Engine se basa en el tamaño de los clústeres de Dataproc y su tiempo de ejecución. El tamaño de un clúster se basa en la cantidad total de CPU virtuales (vCPU) en todo el clúster, incluyendo los nodos maestro y de trabajo. La duración de un clúster es el tiempo transcurrido entre su creación y su detención o eliminación.
La fórmula de precios de Dataproc es: $0.010 * # of vCPUs * hourly duration
.
Aunque la fórmula de precios se expresa como una tarifa por hora, Dataproc se factura por segundo, y todos los clústeres de Dataproc se facturan en incrementos de un segundo, con un mínimo de 1 minuto. El uso se expresa en fracciones de hora (por ejemplo, 30 minutos se expresan como 0,5 horas) para aplicar el precio por hora al uso segundo a segundo.
El precio de Dataproc se suma al precio por instancia de Compute Engine para cada máquina virtual (consulte Uso de otros recursos de Google Cloud ).
Cargos acumulados
Las siguientes operaciones y escenarios de Dataproc generan la acumulación de cargos:
Escalado y escalado automático : Al añadir máquinas virtuales al clúster, se acumulan cargos mientras estén activas. Estos cargos se mantienen hasta que se eliminan.
Clústeres en estado de error : Cuando un clúster de Dataproc se encuentra en estado de error, las máquinas virtuales del clúster permanecen activas y se siguen acumulando cargos. Estos cargos acumulados continúan hasta que se elimina el clúster.
Ejemplo de precios
A modo de ejemplo, considere un clúster (con nodos maestros y de trabajo) que tiene la siguiente configuración:
Artículo | Tipo de máquina | CPU virtuales | Disco persistente adjunto | Número en el grupo |
---|---|---|---|---|
Nodo maestro | n1-estándar-4 | 4 | 500 GB | 1 |
Nodos de trabajo | n1-estándar-4 | 4 | 500 GB | 5 |
Este clúster de Dataproc cuenta con 24 CPU virtuales: 4 para el maestro y 20 distribuidas entre los trabajadores. Para la facturación de Dataproc, el precio de este clúster se basaría en esas 24 CPU virtuales y el tiempo de ejecución del clúster (suponiendo que no se reduzca ni se preempte ningún nodo). Si el clúster funciona durante 2 horas, el precio de Dataproc se basaría en la siguiente fórmula:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
En este ejemplo, el clúster también incurriría en cargos por Compute Engine y espacio aprovisionado en disco persistente estándar, además del cargo de Dataproc (consulte Uso de otros recursos) . Google Cloud recursos ). La calculadora de facturación se puede utilizar para determinar por separado Google Cloud costos de recursos.
Uso de otros recursos de Google Cloud
Como solución administrada e integrada, Dataproc se basa en otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos, cada uno con su propio precio:
- Compute Engine : todas las instancias de Compute Engine para un clúster Dataproc tienen un tiempo de reloj mínimo de 1 minuto y se facturan según incrementos de facturación por segundo y reglas de precio de uso sostenido .
- Espacio aprovisionado en disco persistente estándar
- Monitoreo de la nube : consulte los precios de Google Cloud Observability
Los clústeres de Dataproc pueden utilizar opcionalmente los siguientes recursos, cada uno facturado a su propio precio, que incluyen, entre otros:
Dataproc sobre los precios de GKE
En esta sección se explican los cargos que se aplican únicamente al clúster virtual de Dataproc que se ejecuta en un GKE administrado por el usuario. Consulte los precios de GKE para obtener más información sobre los cargos adicionales que se aplican al clúster de GKE administrado por el usuario.
La fórmula de precios de Dataproc en GKE , $0.010 * # of vCPUs * hourly duration
, es la misma que la de Dataproc en Compute Engine y se aplica al número total de CPU virtuales que se ejecutan en instancias de máquinas virtuales en grupos de nodos creados por Dataproc en el clúster. La duración de una instancia de máquina virtual es el tiempo transcurrido desde su creación hasta su eliminación. Al igual que con Dataproc en Compute Engine, Dataproc en GKE se factura por segundo, con un mínimo de 1 minuto por instancia de máquina virtual. Otros Google Cloud Se aplican cargos además de los cargos de Dataproc.
Los grupos de nodos creados por Dataproc siguen existiendo tras la eliminación del clúster de Dataproc, ya que pueden ser compartidos por varios clústeres. Si elimina los grupos de nodos o reduce su número a cero instancias, no se generarán cargos adicionales de Dataproc. Las máquinas virtuales restantes del grupo de nodos seguirán generando cargos hasta que las elimine.
Precios de Dataproc Serverless
Consulte los precios de Dataproc Serverless .
¿Qué sigue?
- Lea la documentación de Dataproc .
- Comience a utilizar Dataproc .
- Pruebe la calculadora de precios .
- Conozca las soluciones y casos de uso de Dataproc .