En esta página se describen los pasos para solucionar problemas que pueden resultarte útiles si tienes algún problema mientras usas Vertex AI Workbench.
Consulta también la sección Solución de problemas de Vertex AI para obtener ayuda sobre cómo usar otros componentes de Vertex AI.
Para filtrar el contenido de esta página, haz clic en un tema:
Instancias de Vertex AI Workbench
En esta sección se describen los pasos para solucionar problemas de instancias de Vertex AI Workbench.
Conectarse a JupyterLab y abrirlo
En esta sección se describen los pasos para solucionar problemas de conexión y apertura de JupyterLab.
No pasa nada después de hacer clic en Abrir JupyterLab
Problema
Cuando haces clic en Abrir JupyterLab, no ocurre nada.
Solución
Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.
No se puede acceder a la terminal de una instancia de Vertex AI Workbench
Problema
Si no puedes acceder a la terminal o no encuentras la ventana de la terminal en el menú de aplicaciones, puede deberse a que tu instancia de Vertex AI Workbench no tenga habilitado el acceso a la terminal.
Solución
Debes crear una instancia de Vertex AI Workbench con la opción Acceso a terminal habilitada. Esta opción no se puede cambiar después de crear la instancia.
Error 502 al abrir JupyterLab
Problema
Un error 502 puede significar que tu instancia de Vertex AI Workbench aún no está lista.
Solución
Espera unos minutos, actualiza la pestaña del navegador de la consola Google Cloud y vuelve a intentarlo.
El cuaderno no responde
Problema
Tu instancia de Vertex AI Workbench no ejecuta celdas o parece que está bloqueada.
Solución
Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:
- Actualiza la página del navegador de JupyterLab. La salida de las celdas no guardadas no se conserva, por lo que debes volver a ejecutar esas celdas para regenerar la salida.
- Restablece tu instancia.
No se puede conectar con una instancia de Vertex AI Workbench mediante SSH
Problema
No puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal.
Las instancias de Vertex AI Workbench usan OS Login para habilitar el acceso SSH. Cuando creas una instancia, Vertex AI Workbench habilita el inicio de sesión con SO de forma predeterminada al definir la clave de metadatos enable-oslogin
en TRUE
. Si no puedes usar SSH para conectarte a tu instancia, es posible que tengas que asignar el valor TRUE
a esta clave de metadatos.
Solución
No se admite la conexión a una instancia de Vertex AI Workbench mediante la Google Cloud consola. Si no puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal, consulta lo siguiente:
Para definir la clave de metadatos enable-oslogin
en TRUE
, usa el método
projects.locations.instances.patch
en la API Notebooks o el comando
gcloud workbench instances update
en el SDK de Google Cloud.
Se ha superado la cuota de GPUs
Problema
No puedes crear una instancia de Vertex AI Workbench con GPUs.
Solución
Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota de GPUs de Compute Engine. Consulta Solicitar un límite de cuota superior.
Crear instancias de Vertex AI Workbench
En esta sección se describe cómo solucionar problemas relacionados con la creación de instancias de Vertex AI Workbench.
La instancia permanece en estado pendiente indefinidamente o se queda bloqueada en el estado de aprovisionamiento
Problema
Después de crear una instancia de Vertex AI Workbench, permanece en el estado pendiente indefinidamente. Puede que aparezca un error como el siguiente en los registros de serie:
Could not resolve host: notebooks.googleapis.com
Si tu instancia se queda bloqueada en el estado de aprovisionamiento, puede deberse a que tienes una configuración de red privada no válida para tu instancia.
Solución
Sigue los pasos que se indican en la sección Los registros de instancias muestran errores de conexión o de tiempo de espera.
No se puede crear una instancia en una red de VPC compartida
Problema
Si intentas crear una instancia en una red de VPC compartida, se mostrará un mensaje de error como el siguiente:
Required 'compute.subnetworks.use' permission for 'projects/network-administration/regions/us-central1/subnetworks/v'
Solución
El problema es que la cuenta de servicio de Notebooks intenta crear la instancia sin los permisos correctos.
Para asegurarte de que la cuenta de servicio de Notebooks tiene los permisos necesarios para crear una instancia de Vertex AI Workbench en una red de VPC compartida, pide a tu administrador que le conceda el rol de usuario de red de Compute (roles/compute.networkUser
) de gestión de identidades y accesos en el proyecto host.
Este rol predefinido contiene los permisos necesarios para asegurarse de que la cuenta de servicio de Notebooks pueda crear una instancia de Vertex AI Workbench en una red de VPC compartida. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:
Permisos obligatorios
Se necesitan los siguientes permisos para asegurarse de que la cuenta de servicio de Notebooks pueda crear una instancia de Vertex AI Workbench en una red de VPC compartida:
-
Para usar subredes, sigue estos pasos:
compute.subnetworks.use
Es posible que tu administrador también pueda conceder estos permisos a la cuenta de servicio de Notebooks con roles personalizados u otros roles predefinidos.
No se puede crear una instancia de Vertex AI Workbench con un contenedor personalizado
Problema
No hay ninguna opción para usar un contenedor personalizado al crear una instancia de Vertex AI Workbench en la Google Cloud consola.
Solución
No se admite la adición de un contenedor personalizado a una instancia de Vertex AI Workbench, y no puedes añadir un contenedor personalizado mediante la consola de Google Cloud .
Te recomendamos que añadas un entorno de conda en lugar de usar un contenedor personalizado.
Puedes añadir un contenedor personalizado a una instancia de Vertex AI Workbench mediante la API Notebooks, pero esta función no es compatible.
No aparece el botón Montar almacenamiento compartido
Problema
El botón Montar almacenamiento compartido no está en la pestaña Explorador de archivos de la interfaz de JupyterLab.
Solución
Se necesita el permiso storage.buckets.list
para que aparezca el botón Montar almacenamiento compartido en la interfaz de JupyterLab de tu instancia de Vertex AI Workbench. Pide a tu administrador que conceda a la cuenta de servicio de tu instancia de Vertex AI Workbench el permiso storage.buckets.list
en el proyecto.
Error 599 al usar Dataproc
Problema
Si intentas crear una instancia con Dataproc habilitado, se mostrará un mensaje de error como el siguiente:
HTTP 599: Unknown (Error from Gateway: [Timeout while connecting] Exception while attempting to connect to Gateway server url. Ensure gateway url is valid and the Gateway instance is running.)
Solución
En la configuración de Cloud DNS, añade una entrada de Cloud DNS para el dominio *.googleusercontent.com
.
No se puede instalar una extensión de JupyterLab de terceros
Problema
Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500
.
Solución
Las extensiones de JupyterLab de terceros no se admiten en las instancias de Vertex AI Workbench.
No se puede editar la máquina virtual subyacente
Problema
Cuando intentas editar la máquina virtual subyacente de una instancia de Vertex AI Workbench, es posible que recibas un mensaje de error similar al siguiente:
Current principal doesn't have permission to mutate this resource.
Solución
Este error se produce porque no puedes editar la VM subyacente de una instancia mediante la consola Google Cloud o la API de Compute Engine.
Para editar la VM subyacente de una instancia de Vertex AI Workbench, usa el método
projects.locations.instances.patch
de la API Notebooks o el comando
gcloud workbench instances update
del SDK de Google Cloud.
Los paquetes pip
no están disponibles después de añadir el entorno de conda
Problema
Tus paquetes pip
no estarán disponibles después de añadir un kernel basado en conda.
Solución
Para solucionar el problema, consulta Añadir un entorno de conda y prueba lo siguiente:
Comprueba que has usado la variable
DL_ANACONDA_ENV_HOME
y que contiene el nombre de tu entorno.Comprueba que
pip
se encuentre en una ruta similar aopt/conda/envs/ENVIRONMENT/bin/pip
. Puedes ejecutar el comandowhich pip
para obtener la ruta.
No se puede acceder a los datos de una instancia con acceso de un solo usuario ni copiarlos
Problema
No se puede acceder a los datos de una instancia con acceso de un solo usuario.
En las instancias de Vertex AI Workbench configuradas con acceso de un solo usuario, solo el usuario especificado (el propietario) puede acceder a los datos de la instancia.
Solución
Si no eres el propietario de la instancia, abre un caso de asistencia para acceder a los datos o copiarlos.
Apagado inesperado
Problema
Tu instancia de Vertex AI Workbench se cierra de forma inesperada.
Solución
Si tu instancia se apaga de forma inesperada, puede deberse a que se haya iniciado el apagado por inactividad.
Si has habilitado el apagado por inactividad, tu instancia se apagará cuando no haya actividad del kernel durante el periodo de tiempo especificado. Por ejemplo, ejecutar una celda o imprimir una salida nueva en un cuaderno es una actividad que restablece el temporizador de tiempo de espera por inactividad. El uso de la CPU no reinicia el temporizador de tiempo de espera por inactividad.
Los registros de la instancia muestran errores de conexión o de tiempo de espera
Problema
Los registros de tu instancia de Vertex AI Workbench muestran errores de conexión o de tiempo de espera.
Solución
Si detectas errores de conexión o de tiempo de espera en los registros de la instancia, asegúrate de que el servidor Jupyter se esté ejecutando en el puerto 8080. Sigue los pasos que se indican en la sección Verificar que la API interna de Jupyter está activa.
Si has desactivado External IP
y usas una red VPC privada, asegúrate de haber seguido también la documentación sobre las opciones de configuración de la red.
Ten en cuenta lo siguiente:
Debes habilitar Acceso privado de Google en la subred elegida de la misma región en la que se encuentra tu instancia en el proyecto host de la VPC. Para obtener más información sobre cómo configurar Acceso privado de Google, consulta la documentación de Acceso privado de Google.
Si usas Cloud DNS, la instancia debe poder resolver los dominios de Cloud DNS necesarios especificados en la documentación de opciones de configuración de red. Para comprobarlo, sigue los pasos que se indican en la sección Verificar que la instancia puede resolver los dominios DNS necesarios.
Los registros de instancias muestran el error "Unable to contact Jupyter API" (No se puede contactar con la API de Jupyter) o "ReadTimeoutError" (Error de tiempo de espera de lectura)
Problema
Los registros de tu instancia de Vertex AI Workbench muestran un error como el siguiente:
notebooks_collection_agent. Unable to contact Jupyter API:
HTTPConnectionPool(host=\'127.0.0.1\', port=8080):
Max retries exceeded ReadTimeoutError(\"HTTPConnectionPool(host=\'127.0.0.1\', port=8080
Solución
Sigue los pasos que se indican en la sección Los registros de instancias muestran errores de conexión o de tiempo de espera.
También puedes probar a modificar la secuencia de comandos del agente de la colección Notebooks para cambiar HTTP_TIMEOUT_SESSION
por un valor mayor, como 60
, para verificar si la solicitud ha fallado porque la llamada ha tardado demasiado en responder o porque no se puede acceder a la URL solicitada.
docker0
conflictos de direcciones con el direccionamiento de VPC
Problema
De forma predeterminada, la interfaz docker0
se crea con la dirección IP 172.17.0.1/16
. Esto podría entrar en conflicto con el direccionamiento IP de tu red VPC, de modo que la instancia no pueda conectarse a otros endpoints con direcciones 172.17.0.1/16
.
Solución
Puedes forzar la creación de la interfaz docker0
con una dirección IP que no entre en conflicto con tu red VPC mediante la siguiente secuencia de comandos posterior al inicio y configurando el comportamiento de la secuencia de comandos posterior al inicio como run_once
.
#!/bin/bash # Wait for Docker to be fully started while ! systemctl is-active docker; do sleep 1 done # Stop the Docker service systemctl stop docker # Modify /etc/docker/daemon.json cat </etc/docker/daemon.json { "bip": "CUSTOM_DOCKER_IP/16" } EOF # Restart the Docker service systemctl start docker
Las reservas especificadas no existen
Problema
La operación para crear la instancia da como resultado un mensaje de error Specified reservations do
not exist
. La salida de la operación puede ser similar a la siguiente:
{ "name": "projects/PROJECT/locations/LOCATION/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.notebooks.v2.OperationMetadata", "createTime": "2025-01-01T01:00:01.000000000Z", "endTime": "2025-01-01T01:00:01.000000000Z", "target": "projects/PROJECT/locations/LOCATION/instances/INSTANCE_NAME", "verb": "create", "requestedCancellation": false, "apiVersion": "v2", "endpoint": "CreateInstance" }, "done": true, "error": { "code": 3, "message": "Invalid value for field 'resource.reservationAffinity': '{ \"consumeReservationType\": \"SPECIFIC_ALLOCATION\", \"key\": \"compute.googleapis.com/reservation-name...'. Specified reservations [projects/PROJECT/zones/ZONE/futureReservations/RESERVATION_NAME] do not exist.", "details": [ { "@type": "type.googleapis.com/google.rpc.RequestInfo", "requestId": "REQUEST_ID" } ] } }
Solución
Algunos tipos de máquinas de Compute Engine requieren parámetros adicionales al crearse, como discos locales o una plataforma de CPU mínima. La especificación de la instancia debe incluir estos campos adicionales.
Por ejemplo, el tipo de máquina a3-megagpu-8g
requiere 16 discos SSD locales, que deben incluirse en la reserva y especificarse en la solicitud de creación de la instancia.
BODY='{ "gce_setup": { "machine_type": "a3-megagpu-8g", "reservation_affinity": { "consume_reservation_type": "RESERVATION_SPECIFIC", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] }, "bootDisk": { "disk_type": "PD_SSD", "diskSizeGb": "150", "diskEncryption": "GMEK" }, "data_disks": [ { "disk_type": "PD_SSD", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, { "disk_type": "SCRATCH", "interface_type": "NVME", }, ], } }'
Cuadernos gestionados
En esta sección se describen los pasos para solucionar problemas de los cuadernos gestionados.
Conectarse a JupyterLab y abrirlo
En esta sección se describe cómo solucionar problemas al conectar y abrir JupyterLab.
No pasa nada después de hacer clic en Abrir JupyterLab
Problema
Cuando haces clic en Abrir JupyterLab, no ocurre nada.
Solución
Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.
No se puede conectar con una instancia de cuadernos gestionados mediante SSH
Problema
No hay ninguna opción para conectarse a instancias de notebooks gestionados mediante SSH.
Solución
No se puede acceder a las instancias de cuadernos gestionados mediante SSH.
No se puede acceder a la terminal de una instancia de cuadernos gestionados
Problema
Si no puedes acceder a la terminal o no encuentras la ventana de la terminal en el menú de aplicaciones, puede deberse a que tu instancia de cuadernos gestionados no tenga habilitado el acceso a la terminal.
Solución
Debes crear una instancia de cuadernos gestionados con la opción Acceso a terminal habilitada. Esta opción no se puede cambiar después de crear la instancia.
Error 502 al abrir JupyterLab
Problema
Un error 502 puede significar que tu instancia de cuadernos gestionados aún no está lista.
Solución
Espera unos minutos, actualiza la pestaña del navegador de la consola Google Cloud y vuelve a intentarlo.
Al abrir un cuaderno, se produce un error 524 (Se ha producido un tiempo de espera)
Problema
Un error 524 suele indicar que el agente de proxy inverso no se conecta al servidor de proxy inverso o que las solicitudes tardan demasiado en el lado del servidor backend (Jupyter). Entre las causas habituales de este error se incluyen problemas de red, que el agente de proxy inverso no se esté ejecutando o que el servicio Jupyter no se esté ejecutando.
Solución
Comprueba que la instancia de cuadernos gestionados se haya iniciado.
El cuaderno no responde
Problema
La instancia de cuaderno gestionado no ejecuta celdas o parece que está bloqueada.
Solución
Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:
- Actualiza la página del navegador de JupyterLab. La salida de las celdas no guardadas no se conserva, por lo que debes volver a ejecutar esas celdas para regenerar la salida.
- Restablece tu instancia.
Migrar a instancias de Vertex AI Workbench
En esta sección se describen los métodos para diagnosticar y resolver problemas al migrar de una instancia de cuadernos gestionados a una instancia de Vertex AI Workbench.
No encuentro un kernel que estaba en la instancia de cuadernos gestionados
Problema
Un kernel que estaba en tu instancia de cuadernos gestionados no aparece en la instancia de Vertex AI Workbench a la que has migrado.
Los contenedores personalizados aparecen como kernels en los cuadernos gestionados. La herramienta de migración de Vertex AI Workbench no admite la migración de contenedores personalizados.
Solución
Para solucionar este problema, añade un entorno de conda a tu instancia de Vertex AI Workbench.
Versión diferente del framework en la instancia migrada
Problema
Un framework de tu instancia de cuadernos gestionados tenía una versión diferente a la de la instancia de Vertex AI Workbench a la que migraste.
Las instancias de Vertex AI Workbench proporcionan un conjunto predeterminado de versiones de frameworks. La herramienta de migración no añade versiones del framework de tu instancia original de cuadernos gestionados. Consulta los comportamientos predeterminados de la herramienta de migración.
Solución
Para añadir una versión específica de un framework, añade un entorno de conda a tu instancia de Vertex AI Workbench.
Las GPUs no se migran a la nueva instancia de Vertex AI Workbench
Problema
Las GPUs que estaban en tu instancia de cuadernos gestionados no están en la instancia de Vertex AI Workbench a la que has migrado.
Las instancias de Vertex AI Workbench admiten un conjunto predeterminado de GPUs. Si las GPUs de tu instancia de notebooks gestionados original no están disponibles, tu instancia se migrará sin GPUs.
Solución
Después de la migración, puedes añadir GPUs a tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch
de la API Notebooks o el comando gcloud workbench instances update
del SDK de Google Cloud.
El tipo de máquina de la instancia migrada es diferente
Problema
El tipo de máquina de tu instancia de cuadernos gestionados es diferente de la instancia de Vertex AI Workbench a la que has migrado.
Las instancias de Vertex AI Workbench no admiten todos los tipos de máquinas. Si el tipo de máquina de tu instancia de notebooks gestionados original no está disponible, tu instancia se migrará al tipo de máquina e2-standard-4
.
Solución
Después de la migración, puedes cambiar el tipo de máquina de tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch
de la API Notebooks o el comando gcloud workbench instances update
del SDK de Google Cloud.
Se ha superado la cuota de GPUs
Problema
No puedes crear una instancia de cuadernos gestionados con GPUs.
Solución
Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota. Consulta Solicitar un aumento de cuota.
Usar imágenes de contenedor
En esta sección se describe cómo solucionar problemas relacionados con el uso de imágenes de contenedor.
La imagen de contenedor no aparece como kernel en JupyterLab
Problema
Las imágenes de contenedor que no tienen un archivo kernelspec válido no se cargan correctamente como kernels en JupyterLab.
Solución
Asegúrate de que tu contenedor cumpla nuestros requisitos. Para obtener más información, consulta los requisitos de los contenedores personalizados.
El cuaderno se desconecta en trabajos de larga duración
Problema
Si ves el siguiente mensaje de error al ejecutar un trabajo en un cuaderno, puede deberse a que la solicitud tarda demasiado en cargarse o a que el uso de la CPU o la memoria es elevado, lo que puede hacer que el servicio Jupyter no responda.
{"log":"2021/06/29 18:10:33 failure fetching a VM ID: compute: Received 500
`internal error`\n","stream":"stderr","time":"2021-06-29T18:10:33.383650241Z"}
{"log":"2021/06/29 18:38:26 Websocket failure: failed to read a websocket
message from the server: read tcp [::1]:40168-\u003e[::1]:8080: use of closed
network connection\n","stream":"stderr","time":"2021-06-29T18:38:26.057622824Z"}
Solución
Este problema se debe a que se ejecuta un trabajo de larga duración en un cuaderno. Para ejecutar un trabajo que puede tardar mucho tiempo en completarse, se recomienda usar el ejecutor.
Usar el ejecutor
En esta sección se describe cómo solucionar problemas al usar el ejecutor.
El ejecutor no puede instalar paquetes
Problema
El ejecutor ejecuta el código del cuaderno en un entorno independiente del kernel, donde se ejecuta el código del archivo del cuaderno. Por este motivo, es posible que algunos de los paquetes que hayas instalado no estén disponibles en el entorno del ejecutor.
Solución
Para solucionar este problema, consulta la sección Asegurarse de que las instalaciones de paquetes estén disponibles para el ejecutor.
Errores 401 o 403 al ejecutar el código del cuaderno con el ejecutor
Problema
Si se produce un error 401 o 403 al ejecutar el ejecutor, puede significar que este no puede acceder a los recursos.
Solución
Consulta las posibles causas a continuación:
El ejecutor ejecuta el código del cuaderno en un proyecto de inquilino independiente del proyecto de tu instancia de cuadernos gestionados. Por lo tanto, cuando accedas a los recursos a través del código que ejecuta el ejecutor, es posible que este no se conecte al proyecto correcto de forma predeterminada. Google Cloud Para resolver este problema, selecciona un proyecto explícitamente.
De forma predeterminada, tu instancia de cuaderno gestionado puede acceder a los recursos que se encuentran en el mismo proyecto. Por lo tanto, cuando ejecutas el código del archivo de cuaderno manualmente, estos recursos no necesitan autenticación adicional. Sin embargo, como el ejecutor se ejecuta en un proyecto de inquilino independiente, no tiene el mismo acceso predeterminado. Para solucionar este problema, autentica el acceso mediante cuentas de servicio.
El ejecutor no puede usar las credenciales del usuario final para autenticar el acceso a los recursos, por ejemplo, el comando
gcloud auth login
. Para solucionar este problema, autentica el acceso mediante cuentas de servicio.
Error exited with a non-zero status of 127
al usar el ejecutor
Problema
Se puede producir un error exited with a non-zero status of 127
o un error "no se ha encontrado el comando" cuando usas el ejecutor para ejecutar código en un contenedor personalizado que no tiene instalada la extensión nbexecutor
.
Solución
Para asegurarte de que tu contenedor personalizado tiene la extensión nbexecutor
, puedes crear una imagen de contenedor derivada a partir de una imagen de Deep Learning Containers.
Las imágenes de Deep Learning Containers incluyen la extensión nbexecutor
.
Mensaje de error de configuración de red de servicio no válida
Problema
Este error puede tener el siguiente aspecto:
Invalid Service Networking configuration. Couldn't find free blocks in allocated IP ranges.
Please use a valid range using: /24 mask or below (/23,/22, etc).
Esto significa que no se han encontrado bloques libres en los intervalos de IP asignados de tu red.
Solución
Usa una máscara de subred de /24
o inferior. Crea un intervalo de direcciones IP asignado más grande
y adjúntalo modificando la conexión de servicio privada
de servicenetworking-googleapis-com
.
Para obtener más información, consulta Configurar una red.
No se puede instalar una extensión de JupyterLab de terceros
Problema
Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500
.
Solución
Las extensiones de JupyterLab de terceros no se admiten en las instancias de cuadernos gestionados.
No se puede acceder a los datos de una instancia con acceso de un solo usuario ni copiarlos
Problema
No se puede acceder a los datos de una instancia con acceso de un solo usuario.
Solución
En las instancias de cuaderno gestionadas que se configuran con acceso de un solo usuario, solo el usuario especificado (el propietario) puede acceder a los datos de la instancia.
Si no eres el propietario de la instancia, abre un caso de asistencia para acceder a los datos o copiarlos.
Apagado inesperado
Problema
Tu instancia de Vertex AI Workbench se cierra de forma inesperada.
Solución
Si tu instancia se apaga de forma inesperada, puede deberse a que se haya iniciado el apagado por inactividad.
Si has habilitado el apagado por inactividad, tu instancia se apagará cuando no haya actividad del kernel durante el periodo de tiempo especificado. Por ejemplo, ejecutar una celda o imprimir una salida nueva en un cuaderno es una actividad que restablece el temporizador de tiempo de espera por inactividad. El uso de la CPU no reinicia el temporizador de tiempo de espera por inactividad.
Restaurar instancia
Problema
No se admite la restauración de una instancia de cuadernos gestionados después de que se haya eliminado.
Solución
Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub.
Recuperar datos de una instancia
Problema
No se admite la recuperación de datos de una instancia de cuadernos gestionados después de que se haya eliminado.
Solución
Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub.
Crear instancias de cuadernos gestionados
En esta sección se describe cómo solucionar problemas al crear instancias de cuadernos gestionados.
Error: se ha producido un problema al crear una conexión
Problema
Se produce este error al crear una instancia:
We encountered a problem while creating a connection.
Service 'servicenetworking.googleapis.com' requires at least
one allocated range to have minimal size; please make sure
at least one allocated range will have prefix length at most '24'.
Solución
Crea un intervalo de IP asignado mayor que /24
y adjúntalo modificando la conexión de servicio privada de la conexión servicenetworking-googleapis-com
.
Al crear una instancia, se produce un error de disponibilidad de recursos
Problema
No puedes crear una instancia debido a un error de disponibilidad de recursos.
Este error puede tener el siguiente aspecto:
Creating notebook INSTANCE_NAME: ZONE does not have enough resources available to fulfill the request. Retry later or try another zone in your configurations.
Los errores de recursos se producen cuando solicitas recursos nuevos en una zona que no puede satisfacer tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.
Los errores de recursos solo se aplican a las nuevas solicitudes de recursos de la zona y no afectan a los recursos ya creados. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.
Solución
Para continuar, prueba lo siguiente:
- Crea una instancia con otro tipo de máquina.
- Crea la instancia en otra zona.
- Vuelve a intentar la solicitud más tarde.
- Reduce la cantidad de recursos que solicitas. Por ejemplo, intenta crear una instancia con menos GPUs, discos, vCPUs o memoria.
Al iniciar una instancia, se produce un error de disponibilidad de recursos
Problema
No puedes iniciar una instancia debido a un error de disponibilidad de recursos.
Este error puede tener el siguiente aspecto:
The zone ZONE_NAME doesn't have enough resources available to fulfill the request. '(resource type:compute)'.
Los errores de recursos se producen cuando intentas iniciar una instancia en una zona que no puede atender tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.
Los errores de recursos solo se aplican a los recursos que especificaste en tu solicitud en el momento en que la enviaste, no a todos los recursos de la zona. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.
Solución
Para continuar, prueba lo siguiente:
- Cambia el tipo de máquina de tu instancia.
- Migra tus archivos y datos a una instancia de otra zona.
- Vuelve a intentar la solicitud más tarde.
- Reduce la cantidad de recursos que solicitas. Por ejemplo, inicia otra instancia con menos GPUs, discos, vCPUs o memoria.
No route to host
en conexiones salientes de cuadernos gestionados
Problema
Normalmente, las únicas rutas que puedes ver en la Google Cloud consola son las que conoce tu propia VPC, así como los intervalos reservados cuando completas la configuración de emparejamiento entre redes de VPC.
Las instancias de cuadernos gestionados residen en una red gestionada por Google y ejecutan una versión modificada de Jupyter en un espacio de nombres de redes Docker dentro de la instancia.
La interfaz de red de Docker y el puente de Linux de esta instancia pueden seleccionar una IP local que entre en conflicto con los intervalos de IP que tu VPC exporta a través del emparejamiento. Por lo general, se encuentran en los intervalos 172.16.0.0/161
y 192.168.10.0/24
, respectivamente.
En estas circunstancias, las conexiones salientes de la instancia a estos intervalos fallarán con un mensaje de error que será una variación de No route to host
, aunque las rutas de VPC se hayan compartido correctamente.
Solución
Invoca ifconfig
en una sesión de terminal y comprueba que ninguna dirección IP de las interfaces virtuales de la instancia entre en conflicto con los intervalos de IP que tu VPC exporta a la conexión de peering.
Cuadernos gestionados por usuarios
En esta sección se describen los pasos para solucionar problemas de los cuadernos gestionados por el usuario.
Conectarse a JupyterLab y abrirlo
En esta sección se describe cómo solucionar problemas al conectar y abrir JupyterLab.
No pasa nada después de hacer clic en Abrir JupyterLab
Problema
Cuando haces clic en Abrir JupyterLab, no ocurre nada.
Solución
Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.
No se puede acceder a JupyterLab mediante el servidor proxy inverso
Problema
No puedes acceder a JupyterLab.
Vertex AI Workbench usa un servidor proxy inverso interno de Google para proporcionar acceso a JupyterLab. Los ajustes de la instancia de cuaderno gestionada por el usuario, la configuración de red y otros factores pueden impedir el acceso a JupyterLab.
Solución
No se puede conectar con una instancia de cuadernos gestionados por usuarios mediante SSH
Problema
No puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal.
Las instancias de cuadernos gestionados por usuarios usan OS Login
para habilitar el acceso SSH. Cuando creas una instancia, Vertex AI Workbench habilita el inicio de sesión del SO de forma predeterminada al definir la clave de metadatos enable-oslogin
en TRUE
. Si no puedes usar SSH para conectarte a tu instancia, es posible que tengas que asignar el valor TRUE
a esta clave de metadatos.
Solución
Para habilitar el acceso SSH a los cuadernos gestionados por el usuario, sigue los pasos para configurar los roles de inicio de sesión del SO en las cuentas de usuario.
Al abrir una instancia de cuadernos gestionados por usuarios, se produce un error 403 (Forbidden)
Problema
Un error 403 (Forbidden)
al abrir una instancia de cuadernos gestionados por el usuario
suele significar que hay un problema de acceso.
Solución
Para solucionar los problemas de acceso, ten en cuenta las tres formas en las que se puede conceder acceso a una instancia de cuadernos gestionados por usuarios:
- Un solo usuario
- Cuenta de servicio
- Editores del proyecto
El modo de acceso se configura durante la creación de la instancia de cuadernos gestionados por el usuario y se define en los metadatos del cuaderno:
- Un solo usuario:
proxy-mode=mail, proxy-user-mail=user@domain.com
- Cuenta de servicio:
proxy-mode=service_account
- Editores del proyecto:
proxy-mode=project_editors
Si no puedes acceder a un cuaderno al hacer clic en Abrir JupyterLab, prueba lo siguiente:
Comprueba que la entrada de metadatos
proxy-mode
sea correcta.Verifica que el usuario que accede a la instancia tenga el permiso
iam.serviceAccounts.ActAs
para la cuenta de servicio de la instancia. La cuenta de servicio es la cuenta de servicio predeterminada de Compute Engine o una cuenta de servicio que se especifica al crear la instancia.Si tu instancia usa el acceso de un solo usuario con una cuenta de servicio especificada como único usuario, consulta No tengo acceso a JupyterLab y el modo de un solo usuario está habilitado.
En el siguiente ejemplo se muestra cómo especificar una cuenta de servicio al crear una instancia:
gcloud notebooks instances create nb-1 \ --vm-image-family=tf-latest-cpu \ --metadata=proxy-mode=mail,proxy-user-mail=user@domain.com \ --service-account=your_service_account@project_id.iam.gserviceaccount.com \ --location=us-west1-a
Cuando haces clic en Abrir JupyterLab para abrir un cuaderno, este se abre en una pestaña nueva del navegador. Si has iniciado sesión en más de una cuenta de Google, la nueva pestaña se abrirá con tu cuenta de Google predeterminada. Si no has creado tu instancia de cuadernos gestionados por el usuario con tu cuenta de Google predeterminada, en la nueva pestaña del navegador se mostrará un error 403 (Forbidden)
.
Sin acceso a JupyterLab, modo de un solo usuario habilitado
Problema
No puedes acceder a JupyterLab.
Solución
Si un usuario no puede acceder a JupyterLab y el acceso de la instancia a JupyterLab está configurado como Single user only
, prueba lo siguiente:
En la página Notebooks gestionados por el usuario de la Google Cloud consola, haz clic en el nombre de tu instancia para abrir la página Detalles del cuaderno.
Junto a Ver detalles de VM, haz clic en Ver en Compute Engine.
En la página de detalles de la VM, haz clic en Editar.
En la sección Metadatos, compruebe que la entrada de metadatos
proxy-mode
esté definida comomail
.Verifica que la entrada de metadatos
proxy-user-mail
esté configurada con una dirección de correo de usuario válida, no con una cuenta de servicio.Haz clic en Guardar.
En la página Cuadernos gestionados por usuarios de la consola Google Cloud , inicializa los metadatos actualizados deteniendo la instancia y volviendo a iniciarla.
Al abrir un cuaderno, se produce un error 504 (Tiempo de espera de pasarela agotado)
Problema
Esto indica que se ha agotado el tiempo de espera de un proxy interno o de un servidor backend (Jupyter). Esto se puede ver cuando:
- La solicitud nunca llegó al servidor proxy interno de inversión
- El backend (Jupyter) devuelve un error 504.
Solución
Abre un caso de asistencia de Google.
Al abrir un cuaderno, se produce un error 524 (Se ha producido un tiempo de espera)
Problema
El servidor proxy inverso interno no ha recibido una respuesta del agente proxy inverso a la solicitud durante el periodo de tiempo de espera. Inverting Proxy agent se ejecuta en tu instancia de cuadernos gestionados por usuarios como un contenedor de Docker. Un error 524 suele indicar que el agente de proxy inverso no se conecta al servidor de proxy inverso o que las solicitudes tardan demasiado en el lado del servidor backend (Jupyter). Un caso habitual de este error es en el lado del usuario (por ejemplo, un problema de red o que el servicio del agente de proxy inverso no se esté ejecutando).
Solución
Si no puedes acceder a un cuaderno, comprueba que la instancia de cuadernos gestionados por el usuario se haya iniciado y prueba lo siguiente:
Opción 1: Ejecuta la herramienta de diagnóstico para comprobar y reparar automáticamente los servicios principales de los cuadernos gestionados por el usuario, verificar el almacenamiento disponible y generar archivos de registro útiles. Para ejecutar la herramienta en tu instancia, sigue estos pasos:
Asegúrate de que tu instancia tenga la versión M58 o una posterior.
Conéctate a tu instancia de imágenes de máquina virtual de aprendizaje profundo mediante SSH.
Ejecuta el siguiente comando:
sudo /opt/deeplearning/bin/diagnostic_tool.sh [--repair] [--bucket=$BUCKET]
Ten en cuenta que las marcas
--repair
y--bucket
son opcionales. La marca--repair
intentará corregir los errores habituales del servicio principal y la marca--bucket
te permitirá especificar un segmento de Cloud Storage para almacenar los archivos de registro creados.La salida de este comando mostrará mensajes de estado útiles para los servicios principales de los cuadernos gestionados por el usuario y exportará los archivos de registro de sus resultados.
Opción 2: Sigue estos pasos para comprobar los requisitos de los cuadernos gestionados por el usuario de forma individual.
Verifica que el disco de la instancia de notebooks gestionada por el usuario no se haya quedado sin espacio.
Conéctate a tu instancia de imágenes de máquina virtual de aprendizaje profundo mediante SSH.
Ejecuta el siguiente comando:
df -h -T /home/jupyter
Si el valor de Usado% es superior a
85%
, debes eliminar manualmente los archivos de/home/jupyter
. En primer lugar, puedes vaciar la papelera con el siguiente comando:sudo rm -rf /home/jupyter/.local/share/Trash/*
Comprueba que el agente de proxy inverso se está ejecutando. Si el agente se ha iniciado, prueba a reiniciarlo.
Comprueba que el servicio Jupyter se esté ejecutando. Si lo es, prueba a reiniciarlo.
Verifica la utilización de la memoria en la instancia de cuadernos gestionados por usuarios.
Conéctate a tu instancia de máquina virtual de aprendizaje profundo mediante SSH.
Ejecuta el siguiente comando:
free -t -h
Si la memoria usada es más de
85%
de la total, te recomendamos que cambies el tipo de máquina.Puedes instalar el agente de Cloud Monitoring para monitorizar si hay un uso elevado de memoria en tu instancia de cuadernos gestionados por usuarios. Consulta la información sobre precios.
Comprueba que estés usando la versión M55 o una posterior de la imagen de máquina virtual de aprendizaje profundo. Para obtener más información sobre cómo actualizar, consulta Actualizar el entorno de una instancia de cuadernos gestionados por usuarios.
Al abrir un cuaderno, se produce un error 598 (Tiempo de espera de lectura de red)
Problema
El servidor proxy inverso no ha recibido ninguna señal del agente proxy inverso en más de 10 minutos. Esto es un claro indicio de un problema con el agente de proxy inverso.
Solución
Si no puedes acceder a un cuaderno, prueba lo siguiente:
Comprueba que la instancia de cuadernos gestionados por usuarios se haya iniciado.
Comprueba que el agente de proxy inverso se está ejecutando. Si el agente se ha iniciado, prueba a reiniciarlo.
Comprueba que el servicio Jupyter se esté ejecutando. Si lo es, prueba a reiniciarlo.
Comprueba que estés usando la versión M55 o una posterior de la imagen de máquina virtual de aprendizaje profundo. Para obtener más información sobre cómo actualizar, consulta Actualizar el entorno de una instancia de cuadernos gestionados por usuarios.
El cuaderno no responde
Problema
Tu instancia de cuaderno gestionado por el usuario no ejecuta celdas o parece que se ha bloqueado.
Solución
Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:
- Actualiza la página del navegador de JupyterLab. Los resultados de las celdas que no se hayan guardado no se conservarán, por lo que deberás volver a ejecutar esas celdas para regenerar los resultados.
- En una sesión de terminal del cuaderno, ejecuta el comando
top
para ver si hay procesos que consumen la CPU. - En el terminal, comprueba la cantidad de espacio libre en disco con el comando
df
o la RAM disponible con el comandofree
. - Para detener la instancia, selecciónala en la página Cuadernos gestionados por usuarios y haz clic en Detener. Cuando se haya detenido por completo, selecciónalo y haz clic en Iniciar.
Migrar a instancias de Vertex AI Workbench
En esta sección se describen los métodos para diagnosticar y resolver problemas al migrar de una instancia de cuadernos gestionados por el usuario a una instancia de Vertex AI Workbench.
No encuentro R, Beam u otros kernels que estaban en la instancia de notebooks gestionada por el usuario
Problema
Un kernel que estaba en tu instancia de cuadernos gestionados por el usuario no aparece en la instancia de Vertex AI Workbench a la que has migrado.
Algunos kernels, como los kernels R y Beam, no están disponibles de forma predeterminada en las instancias de Vertex AI Workbench. No se admite la migración de esos kernels.
Solución
Para solucionar este problema, añade un entorno de conda a tu instancia de Vertex AI Workbench.
No se puede configurar una instancia de Dataproc Hub en la instancia de Vertex AI Workbench
Problema
Dataproc Hub no se admite en las instancias de Vertex AI Workbench.
Solución
Sigue usando Dataproc Hub en instancias de cuadernos gestionados por usuarios.
Versión diferente del framework en la instancia migrada
Problema
Un framework que estaba en tu instancia de cuadernos gestionados por el usuario tenía una versión diferente a la de la instancia de Vertex AI Workbench a la que migraste.
Las instancias de Vertex AI Workbench proporcionan un conjunto predeterminado de versiones de frameworks. La herramienta de migración no añade versiones del framework de tu instancia original de cuadernos gestionada por el usuario. Consulta los comportamientos predeterminados de la herramienta de migración.
Solución
Para añadir una versión específica de un framework, añade un entorno de conda a tu instancia de Vertex AI Workbench.
Las GPUs no se migran a la nueva instancia de Vertex AI Workbench
Problema
Las GPUs que estaban en tu instancia de cuadernos gestionados por el usuario no están en la instancia de Vertex AI Workbench a la que has migrado.
Las instancias de Vertex AI Workbench admiten un conjunto predeterminado de GPUs. Si las GPUs de tu instancia de notebooks gestionada por el usuario original no están disponibles, tu instancia se migrará sin ninguna GPU.
Solución
Después de la migración, puedes añadir GPUs a tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch
de la API Notebooks o el comando gcloud workbench instances update
del SDK de Google Cloud.
El tipo de máquina de la instancia migrada es diferente
Problema
El tipo de máquina de tu instancia de notebooks gestionados por el usuario es diferente de la instancia de Vertex AI Workbench a la que has migrado.
Las instancias de Vertex AI Workbench no admiten todos los tipos de máquinas.
Si el tipo de máquina de tu instancia de notebooks gestionados por el usuario original no está disponible, tu instancia se migrará al tipo de máquina e2-standard-4
.
Solución
Después de la migración, puedes cambiar el tipo de máquina de tu instancia de Vertex AI Workbench con el método projects.locations.instances.patch
de la API Notebooks o con el comando gcloud workbench instances update
del SDK de Google Cloud.
Trabajar con archivos
En esta sección se describe cómo solucionar problemas con los archivos de instancias de cuadernos gestionados por usuarios.
Descarga de archivos inhabilitada, pero el usuario puede seguir descargando archivos
Problema
No se puede inhabilitar la descarga de archivos desde la interfaz de usuario de JupyterLab en las instancias de cuadernos gestionados por usuarios de Dataproc Hub. Las instancias de cuadernos gestionadas por el usuario que usan el framework de Dataproc Hub permiten descargar archivos aunque no selecciones la opción Habilitar descarga de archivos desde la interfaz de usuario de JupyterLab al crear la instancia.
Solución
Las instancias de cuadernos gestionados por usuarios de Dataproc Hub no admiten la restricción de descargas de archivos.
Los archivos descargados están truncados o no se descargan por completo
Problema
Cuando descargas archivos de tu instancia de cuadernos gestionada por el usuario, un ajuste de tiempo de espera del agente de reenvío de proxy limita el tiempo de conexión para que se complete la descarga. Si la descarga tarda demasiado, puede que el archivo descargado se trunque o que no se descargue.
Solución
Para descargar el archivo, cópialo en Cloud Storage y, a continuación, descárgalo desde Cloud Storage.
Te recomendamos que migres tus archivos y datos a una nueva instancia de cuadernos gestionados por el usuario.
Después de reiniciar la VM, no se puede hacer referencia a los archivos locales desde la terminal del cuaderno
Problema
A veces, después de reiniciar una instancia de cuadernos gestionada por el usuario, no se puede hacer referencia a los archivos locales desde un terminal de cuaderno.
Solución
Se trata de un problema conocido. Para hacer referencia a tus archivos locales desde un terminal de cuaderno, primero debes volver a establecer tu directorio de trabajo actual con el siguiente comando:
cd PWD
En este comando, sustituye PWD por tu directorio de trabajo actual. Por ejemplo, si tu directorio de trabajo actual es /home/jupyter/
, usa el comando cd /home/jupyter/
.
Después de volver a establecer el directorio de trabajo actual, se puede hacer referencia a los archivos locales desde la terminal del cuaderno.
Crear instancias de cuadernos gestionados por usuarios
En esta sección se describe cómo solucionar problemas al crear instancias de cuadernos gestionados por usuarios.
Se ha superado la cuota de GPUs
Problema
No puedes crear una instancia de cuadernos gestionados por usuarios con GPUs.
Solución
Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota. Consulta Solicitar un aumento de cuota.
La instancia permanece en estado pendiente indefinidamente
Problema
Después de crear una instancia de cuadernos gestionados por usuarios, esta permanece en estado pendiente indefinidamente. Puede que aparezca un error como el siguiente en los registros de serie:
Could not resolve host: notebooks.googleapis.com
Solución
Tu instancia no puede conectarse al servidor de la API Notebooks debido a un problema de configuración de Cloud DNS u otro problema de red. Para solucionar el problema, comprueba las configuraciones de Cloud DNS y de red. Para obtener más información, consulta la sección sobre opciones de configuración de red.
No se crea una instancia de cuadernos gestionados por usuarios (permisos insuficientes)
Problema
Normalmente, se tarda aproximadamente un minuto en crear una instancia de cuadernos gestionados por usuarios. Si tu nueva instancia de notebooks gestionados por el usuario permanece en el estado pending
indefinidamente, puede deberse a que la cuenta de servicio utilizada para iniciar la instancia de notebooks gestionados por el usuario no tenga los permisos necesarios en tu proyecto Google Cloud .
Puedes iniciar una instancia de cuadernos gestionada por el usuario con una cuenta de servicio personalizada que crees o en el modo de un solo usuario con un ID de usuario. Si inicias una instancia de notebooks gestionada por el usuario en modo de un solo usuario, la instancia de notebooks gestionada por el usuario empieza el proceso de arranque con la cuenta de servicio predeterminada de Compute Engine antes de ceder el control a tu ID de usuario.
Solución
Para comprobar que una cuenta de servicio tiene los permisos adecuados, sigue estos pasos:
Consola
Abre la página de IAM en la Google Cloud consola.
Determina la cuenta de servicio que se usa con tu instancia de cuadernos gestionados por el usuario, que es una de las siguientes:
Una cuenta de servicio personalizada que hayas especificado al crear tu instancia de cuadernos gestionados por el usuario.
La cuenta de servicio predeterminada de Compute Engine de tuGoogle Cloud proyecto, que se usa cuando inicias tu instancia de cuadernos gestionados por el usuario en el modo de un solo usuario. La cuenta de servicio predeterminada de Compute Engine de tu proyecto Google Cloud se llama
PROJECT_NUMBER-compute@developer.gserviceaccount.com
. Por ejemplo:113377992299-compute@developer.gserviceaccount.com
.
Comprueba que tu cuenta de servicio tenga el rol Ejecutor de cuadernos (
roles/notebooks.runner
). Si no es así, concede a la cuenta de servicio el rol Ejecutor de cuadernos (roles/notebooks.runner
).
Para obtener más información, consulta cómo conceder, cambiar y revocar el acceso a los recursos en la documentación de IAM.
gcloud
Si aún no lo has hecho, instala la CLI de Google Cloud.
Obtén el nombre y el número de proyecto de tu Google Cloud proyecto con el siguiente comando. Sustituye PROJECT_ID por el ID del proyecto deGoogle Cloud .
gcloud projects describe PROJECT_ID
Debería ver un resultado similar al siguiente, que muestra el nombre (
name:
) y el número de proyecto (projectNumber:
) de su proyecto.createTime: '2018-10-18T21:03:31.408Z' lifecycleState: ACTIVE name: my-project-name parent: id: '396521612403' type: folder projectId: my-project-id-1234 projectNumber: '113377992299'
Determina la cuenta de servicio que se usa con tu instancia de cuadernos gestionados por usuarios, que es una de las siguientes:
Una cuenta de servicio personalizada que hayas especificado al crear tu instancia de cuadernos gestionados por el usuario.
La cuenta de servicio predeterminada de Compute Engine de tuGoogle Cloud proyecto, que se usa cuando inicias tu instancia de cuadernos gestionados por el usuario en el modo de un solo usuario. La cuenta de servicio predeterminada de Compute Engine de tu proyecto Google Cloud se llama
PROJECT_NUMBER-compute@developer.gserviceaccount.com
. Por ejemplo:113377992299-compute@developer.gserviceaccount.com
.
Añade el rol
roles/notebooks.runner
a la cuenta de servicio con el siguiente comando. Sustituye project-name por el nombre de tu proyecto y service-account-id por el ID de la cuenta de servicio de tu instancia de cuadernos gestionados por el usuario.gcloud projects add-iam-policy-binding project-name \ --member serviceAccount:service-account-id \ --role roles/notebooks.runner
Al crear una instancia, se produce un error Permission denied
Problema
La cuenta de servicio de la instancia proporciona acceso a otros servicios de Google Cloud. Puedes usar cualquier cuenta de servicio del mismo proyecto, pero debes tener el permiso Usuario de cuenta de servicio (iam.serviceAccounts.actAs
) para crear la instancia. Si no se especifica, se usa la cuenta de servicio predeterminada de Compute Engine.
Solución
Al crear una instancia, comprueba que el usuario que la crea tenga el permiso
iam.serviceAccounts.ActAs
para la cuenta de servicio definida.
En el siguiente ejemplo se muestra cómo especificar una cuenta de servicio al crear una instancia:
gcloud notebooks instances create nb-1 \ --vm-image-family=tf-latest-cpu \ --service-account=your_service_account@project_id.iam.gserviceaccount.com \ --location=us-west1-a
Para asignar el rol Usuario de cuenta de servicio, consulta Gestionar acceso a cuentas de servicio.
Al crear una instancia, se produce un error already exists
Problema
Al crear una instancia, comprueba que Compute Engine no haya eliminado previamente una instancia de cuadernos gestionados por el usuario con el mismo nombre y que siga existiendo en la base de datos de la API Notebooks.
Solución
En el siguiente ejemplo se muestra cómo enumerar instancias mediante la API Notebooks y verificar su estado.
gcloud notebooks instances list --location=LOCATION
Si el estado de una instancia es DELETED
, ejecuta el siguiente comando para eliminarla de forma permanente.
gcloud notebooks instances delete INSTANCE_NAME --location=LOCATION
No se puede crear una instancia en una VPC compartida
Problema
No puedes crear una instancia en una VPC compartida.
Solución
Si usas VPC compartida, debes añadir los proyectos host y de servicio al perímetro de servicio. En el proyecto host, también debes asignar el rol Usuario de red de Compute (roles/compute.networkUser
) al agente de servicio de cuadernos del proyecto de servicio. Para obtener más información, consulta el artículo sobre cómo gestionar perímetros de servicio.
Al crear una instancia, se produce un error de disponibilidad de recursos
Problema
No puedes crear una instancia debido a un error de disponibilidad de recursos.
Este error puede tener el siguiente aspecto:
Creating notebook INSTANCE_NAME: ZONE does not have enough resources available to fulfill the request. Retry later or try another zone in your configurations.
Los errores de recursos se producen cuando solicitas recursos nuevos en una zona que no puede satisfacer tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.
Los errores de recursos solo se aplican a las nuevas solicitudes de recursos de la zona y no afectan a los recursos ya creados. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.
Solución
Para continuar, puedes probar lo siguiente:
- Crea una instancia con otro tipo de máquina.
- Crea la instancia en otra zona.
- Vuelve a intentar la solicitud más tarde.
- Reduce la cantidad de recursos que solicitas. Por ejemplo, intenta crear una instancia con menos GPUs, discos, vCPUs o memoria.
Al iniciar una instancia, se produce un error de disponibilidad de recursos
Problema
No puedes iniciar una instancia debido a un error de disponibilidad de recursos.
Este error puede tener el siguiente aspecto:
The zone ZONE_NAME doesn't have enough resources available to fulfill the request. '(resource type:compute)'.
Los errores de recursos se producen cuando intentas iniciar una instancia en una zona que no puede atender tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.
Los errores de recursos solo se aplican a los recursos que especificaste en tu solicitud en el momento en que la enviaste, no a todos los recursos de la zona. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.
Solución
Para continuar, puedes probar lo siguiente:
- Cambia el tipo de máquina de tu instancia.
- Migra tus archivos y datos a una instancia de otra zona.
- Vuelve a intentar la solicitud más tarde.
- Reduce la cantidad de recursos que solicitas. Por ejemplo, inicia otra instancia con menos GPUs, discos, vCPUs o memoria.
Actualizar instancias de cuadernos gestionados por usuarios
En esta sección se describe cómo solucionar problemas al actualizar instancias de cuadernos gestionados por usuarios.
No se puede actualizar porque no se puede obtener información del disco de la instancia
Problema
No se puede actualizar una instancia de cuadernos gestionados por usuarios con un solo disco.
Solución
Puede que quieras migrar tus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario.
No se puede actualizar porque la instancia no es compatible con UEFI
Problema
Vertex AI Workbench depende de la compatibilidad con UEFI para completar una actualización.
Las instancias de notebooks gestionadas por el usuario creadas a partir de algunas imágenes antiguas no son compatibles con UEFI y, por lo tanto, no se pueden actualizar.
Solución
Para verificar que tu instancia es compatible con UEFI, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.
gcloud compute instances describe INSTANCE_NAME \ --zone=ZONE | grep type
Haz los cambios siguientes:
INSTANCE_NAME
: el nombre de tu instanciaZONE
: la zona en la que se encuentra tu instancia
Para verificar que la imagen que has usado para crear tu instancia es compatible con UEFI, usa el siguiente comando:
gcloud compute images describe VM_IMAGE_FAMILY \ --project deeplearning-platform-release | grep type
Sustituye VM_IMAGE_FAMILY
por el nombre de familia de la imagen que usaste para crear tu instancia.
Si determina que su instancia o imagen no es compatible con UEFI, puede intentar migrar sus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario. Para hacerlo, sigue estos pasos:
Comprueba que la imagen que quieres usar para crear la nueva instancia sea compatible con UEFI. Para ello, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.
gcloud compute images describe VM_IMAGE_FAMILY \ --project deeplearning-platform-release --format=json | grep type
Sustituye
VM_IMAGE_FAMILY
por el nombre de la familia de imágenes que quieras usar para crear tu instancia.Migra tus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario.
No se puede acceder a la instancia de cuadernos gestionados por usuarios después de la actualización
Problema
Si no se puede acceder a la instancia de cuadernos gestionada por el usuario después de una actualización, es posible que se haya producido un error durante la sustitución de la imagen del disco de arranque.
Las instancias de cuadernos gestionados por usuarios que se pueden actualizar tienen dos discos: uno de arranque y otro de datos. Durante el proceso de actualización, el disco de arranque se actualiza a una nueva imagen, pero los datos del disco de datos se conservan.
Solución
Sigue estos pasos para adjuntar una imagen válida nueva al disco de arranque.
Para almacenar los valores que usarás para completar este procedimiento, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.
export INSTANCE_NAME=MY_INSTANCE_NAME export PROJECT_ID=MY_PROJECT_ID export ZONE=MY_ZONE
Haz los cambios siguientes:
MY_INSTANCE_NAME
: el nombre de tu instanciaMY_PROJECT_ID
: tu ID de proyectoMY_ZONE
: la zona en la que se encuentra tu instancia
Usa el siguiente comando para detener la instancia:
gcloud compute instances stop $INSTANCE_NAME \ --project=$PROJECT_ID --zone=$ZONE
Desconecta el disco de datos de la instancia.
gcloud compute instances detach-disk $INSTANCE_NAME --device-name=data \ --project=$PROJECT_ID --zone=$ZONE
Elimina la VM de la instancia.
gcloud compute instances delete $INSTANCE_NAME --keep-disks=all --quiet \ --project=$PROJECT_ID --zone=$ZONE
Usa la API Notebooks para eliminar la instancia de cuadernos gestionados por usuarios.
gcloud notebooks instances delete $INSTANCE_NAME \ --project=$PROJECT_ID --location=$ZONE
Crea una instancia de cuadernos gestionados por usuarios con el mismo nombre que la instancia anterior.
gcloud notebooks instances create $INSTANCE_NAME \ --vm-image-project="deeplearning-platform-release" \ --vm-image-family=MY_VM_IMAGE_FAMILY \ --instance-owners=MY_INSTANCE_OWNER \ --machine-type=MY_MACHINE_TYPE \ --service-account=MY_SERVICE_ACCOUNT \ --accelerator-type=MY_ACCELERATOR_TYPE \ --accelerator-core-count=MY_ACCELERATOR_CORE_COUNT \ --install-gpu-driver \ --project=$PROJECT_ID \ --location=$ZONE
Haz los cambios siguientes:
MY_VM_IMAGE_FAMILY
: el nombre de la familia de imágenesMY_INSTANCE_OWNER
: el propietario de tu instanciaMY_MACHINE_TYPE
: el tipo de máquina de la VM de tu instanciaMY_SERVICE_ACCOUNT
: la cuenta de servicio que se va a usar con esta instancia o"default"
MY_ACCELERATOR_TYPE
: el tipo de acelerador. Por ejemplo,"NVIDIA_TESLA_T4"
MY_ACCELERATOR_CORE_COUNT
: el número de núcleos. Por ejemplo,1
Monitorizar el estado de las instancias de cuadernos gestionados por usuarios
En esta sección se describe cómo solucionar problemas con errores de monitorización del estado de salud.
Error de estado de docker-proxy-agent
Sigue estos pasos si se produce un error con el estado docker-proxy-agent
:
Comprueba que el agente Inverting Proxy se esté ejecutando. En caso contrario, ve al paso 3.
Error de estado de docker-service
Sigue estos pasos si se produce un error con el estado docker-service
:
Error de estado de jupyter-service
Sigue estos pasos si se produce un error con el estado jupyter-service
:
Error de estado de jupyter-api
Sigue estos pasos si se produce un error con el estado jupyter-api
:
Porcentaje de uso del disco de arranque
El estado del espacio del disco de arranque es incorrecto si el espacio del disco está lleno en más de un 85 %.
Si el estado del espacio en disco de arranque no es correcto, prueba lo siguiente:
Desde una sesión de terminal en la instancia de notebooks gestionada por el usuario o mediante ssh para conectarte, consulta la cantidad de espacio libre en el disco con el comando
df -H
.Usa el comando
find . -type d -size +100M
para encontrar archivos grandes que puedas eliminar, pero no los elimines a menos que estés seguro de que puedes hacerlo sin problemas. Si no lo tienes claro, puedes pedir ayuda al equipo de Asistencia.Si los pasos anteriores no solucionan el problema, ponte en contacto con el equipo de Asistencia.
Porcentaje de uso del disco de datos
El estado del espacio en disco de datos es incorrecto si el espacio en disco está lleno en más de un 85 %.
Si el estado del espacio en disco de datos no es correcto, prueba lo siguiente:
Desde una sesión de terminal en la instancia de notebooks gestionada por el usuario o mediante ssh para conectarte, consulta la cantidad de espacio libre en el disco con el comando
df -h -T /home/jupyter
.Elimina archivos grandes para aumentar el espacio en disco disponible. Usa el comando
find . -type d -size +100M
para encontrar archivos grandes.Si los pasos anteriores no solucionan el problema, ponte en contacto con el equipo de Asistencia.
No se puede instalar una extensión de JupyterLab de terceros
Problema
Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500
.
Solución
Las extensiones de JupyterLab de terceros no se admiten en instancias de cuadernos gestionados por usuarios.
Restaurar instancia
Problema
No se admite la restauración de una instancia de cuadernos gestionados por usuarios después de que se haya eliminado.
Solución
Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub o hacer una instantánea del disco.
Recuperar datos de una instancia
Problema
No se admite la recuperación de datos de una instancia de cuadernos gestionada por el usuario después de que se haya eliminado.
Solución
Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub o hacer una instantánea del disco.
No se puede aumentar la memoria compartida
Problema
No puedes aumentar la memoria compartida en una instancia de cuadernos gestionados por usuarios.
Solución
Sin embargo, puedes especificar un tamaño de memoria compartida al crear una instancia de cuaderno gestionado por el usuario mediante la clave de metadatos container-custom-params
, con un valor como el siguiente:
--shm-size=SHARED_MEMORY_SIZE gb
Sustituye SHARED_MEMORY_SIZE
por el tamaño que quieras en GB.
Procedimientos útiles
En esta sección se describen procedimientos que pueden resultarle útiles.
Usar SSH para conectarse a una instancia de cuadernos gestionados por usuarios
Usa SSH para conectarte a tu instancia escribiendo el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada Google Cloud CLI.
gcloud compute ssh --project PROJECT_ID \
--zone ZONE \
INSTANCE_NAME -- -L 8080:localhost:8080
Haz los cambios siguientes:
PROJECT_ID
: tu ID de proyectoZONE
: la zona en la que se encuentra tu instancia Google CloudINSTANCE_NAME
: el nombre de tu instancia
También puedes conectarte a tu instancia abriendo la página de detalles de Compute Engine y haciendo clic en el botón SSH.
Volver a registrarse en el servidor proxy inverso
Para volver a registrar la instancia de cuadernos gestionados por el usuario en el servidor proxy inverso interno, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a la instancia de cuadernos gestionados por el usuario e introducir lo siguiente:
cd /opt/deeplearning/bin sudo ./attempt-register-vm-on-proxy.sh
Verificar el estado del servicio Docker
Para verificar el estado del servicio Docker, puedes usar SSH para conectarte a tu instancia de cuadernos gestionada por el usuario e introducir lo siguiente:
sudo service docker status
Verificar que el agente de proxy inverso se está ejecutando
Para verificar si el agente de proxy inverso del cuaderno está en ejecución, usa SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introduce lo siguiente:
# Confirm Inverting Proxy agent Docker container is running (proxy-agent) sudo docker ps # Verify State.Status is running and State.Running is true. sudo docker inspect proxy-agent # Grab logs sudo docker logs proxy-agent
Verificar el estado del servicio Jupyter y recoger registros
Para verificar el estado del servicio Jupyter, puedes usar SSH para conectarte a tu instancia de cuadernos gestionados por usuarios e introducir lo siguiente:
sudo service jupyter status
Para recoger los registros del servicio Jupyter, sigue estos pasos:
sudo journalctl -u jupyter.service --no-pager
Verificar que la API interna de Jupyter esté activa
La API de Jupyter siempre debe ejecutarse en el puerto 8080. Para comprobarlo, inspecciona los registros del sistema de la instancia para ver si hay una entrada similar a la siguiente:
Jupyter Server ... running at: http://localhost:8080
Para verificar que la API interna de Jupyter está activa, también puedes usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:
curl http://127.0.0.1:8080/api/kernelspecs
También puedes medir el tiempo que tarda la API en responder si las solicitudes tardan demasiado:
time curl -V http://127.0.0.1:8080/api/status
time curl -V http://127.0.0.1:8080/api/kernels
time curl -V http://127.0.0.1:8080/api/connections
Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.
Reiniciar el servicio Docker
Para reiniciar el servicio Docker, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:
sudo service docker restart
Reiniciar el agente de proxy inverso
Para reiniciar el agente de proxy inverso, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:
sudo docker restart proxy-agent
Reiniciar el servicio de Jupyter
Para reiniciar el servicio Jupyter, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:
sudo service jupyter restart
Reiniciar el agente de recogida de cuadernos
El servicio del agente de recogida de cuadernos ejecuta un proceso de Python en segundo plano que verifica el estado de los servicios principales de la instancia de Vertex AI Workbench.
Para reiniciar el servicio del agente de recogida de cuadernos, puedes detener e iniciar la VM desde la Google Cloud consola o usar SSH para conectarte a tu instancia de Vertex AI Workbench e introducir lo siguiente:
sudo systemctl stop notebooks-collection-agent.service
seguido de:
sudo systemctl start notebooks-collection-agent.service
Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.
Modificar la secuencia de comandos del agente de colección de cuadernos
Para acceder al script y editarlo, abre una terminal en nuestra instancia o usa SSH para conectarte a tu instancia de Vertex AI Workbench e introduce lo siguiente:
nano /opt/deeplearning/bin/notebooks_collection_agent.py
Cuando hayas editado el archivo, guárdalo.
Después, debes reiniciar el servicio del agente de la colección Notebooks.
Verifica que la instancia pueda resolver los dominios DNS necesarios
Para verificar que la instancia puede resolver los dominios DNS necesarios, puedes usar SSH para conectarte a tu instancia de cuaderno gestionada por el usuario e introducir lo siguiente:
host notebooks.googleapis.com
host *.notebooks.cloud.google.com
host *.notebooks.googleusercontent.com
host *.kernels.googleusercontent.com
También puedes hacerlo de esta otra forma, si lo prefieres:
curl --silent --output /dev/null "https://notebooks.cloud.google.com"; echo $?
Si la instancia tiene habilitado Dataproc, puedes verificar que la instancia resuelve *.kernels.googleusercontent.com
ejecutando lo siguiente:
curl --verbose -H "Authorization: Bearer $(gcloud auth print-access-token)" https://${PROJECT_NUMBER}-dot-${REGION}.kernels.googleusercontent.com/api/kernelspecs | jq .
Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.
Hacer una copia de los datos de usuario en una instancia
Para almacenar una copia de los datos de usuario de una instancia en Cloud Storage, sigue estos pasos.
Crear un segmento de Cloud Storage (opcional)
En el mismo proyecto en el que se encuentra tu instancia, crea un segmento de Cloud Storage en el que puedas almacenar tus datos de usuario. Si ya tienes un segmento de Cloud Storage, sáltate este paso.
-
Create a Cloud Storage bucket:
Replacegcloud storage buckets create gs://BUCKET_NAME
BUCKET_NAME
with a bucket name that meets the bucket naming requirements.Copiar los datos de usuario
En la interfaz de JupyterLab de tu instancia, selecciona Archivo > Nuevo > Terminal para abrir una ventana de terminal. En el caso de las instancias de notebooks gestionadas por el usuario, puedes conectarte al terminal de la instancia mediante SSH.
Usa la CLI de gcloud para copiar tus datos de usuario en un segmento de Cloud Storage. El siguiente comando de ejemplo copia todos los archivos del directorio
/home/jupyter/
de tu instancia en un directorio de un segmento de Cloud Storage.gcloud storage cp /home/jupyter/* gs://BUCKET_NAMEPATH --recursive
Haz los cambios siguientes:
BUCKET_NAME
: el nombre de tu segmento de Cloud StoragePATH
: la ruta al directorio en el que quieres copiar los archivos. Por ejemplo:/copy/jupyter/
Investigar una instancia que se ha quedado bloqueada en el aprovisionamiento con gcpdiag
gcpdiag
es una herramienta de código abierto. No es un producto Google Cloud oficialmente compatible. Puedes usar lagcpdiag
herramienta para identificar y solucionar Google Cloudproblemas de proyectos. Para obtener más información, consulta el proyecto gcpdiag en GitHub.Estegcpdiag
manual de procedimientos investiga las posibles causas por las que una instancia de Vertex AI Workbench se queda bloqueada en el estado de aprovisionamiento, incluidas las siguientes áreas:- Estado: comprueba el estado actual de la instancia para asegurarse de que se ha quedado bloqueada en el aprovisionamiento y no está detenida ni activa.
- Imagen del disco de arranque de la VM de Compute Engine de la instancia:
comprueba si la instancia se ha creado con un contenedor personalizado, una imagen oficial de
workbench-instances
, imágenes de máquina virtual de aprendizaje profundo o imágenes no admitidas que pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento. - Secuencias de comandos personalizadas: comprueba si la instancia usa secuencias de comandos de inicio o posteriores al inicio personalizadas que cambian el puerto predeterminado de Jupyter o rompen dependencias que pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
- Versión del entorno: comprueba si la instancia usa la versión más reciente del entorno comprobando si se puede actualizar. Las versiones anteriores pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
- Rendimiento de la VM de Compute Engine de la instancia: comprueba el rendimiento actual de la VM para asegurarse de que no se vea afectado por un uso elevado de la CPU, una memoria insuficiente o problemas de espacio en disco que puedan interrumpir las operaciones normales.
- Puerto serie de Compute Engine de la instancia o registro del sistema: comprueba si la instancia tiene registros del puerto serie, que se analizan para asegurarse de que Jupyter se ejecuta en el puerto
127.0.0.1:8080
. - Acceso a la terminal y a SSH de Compute Engine de la instancia: comprueba si la VM de Compute Engine de la instancia está en ejecución para que el usuario pueda acceder a SSH y abrir una terminal para verificar que el uso del espacio en "home/jupyter" es inferior al 85%. Si no queda espacio, es posible que la instancia se quede atascada en el estado de aprovisionamiento.
- IP externa desactivada: comprueba si el acceso a la IP externa está desactivado. Una configuración de red incorrecta puede provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
Docker
Puedes ejecutar
gcpdiag
mediante un envoltorio que iniciegcpdiag
en un contenedor Docker. Debes tener instalado Docker o Podman.- Copia y ejecuta el siguiente comando en tu estación de trabajo local.
curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
- Ejecuta el comando
gcpdiag
../gcpdiag runbook vertex/workbench-instance-stuck-in-provisioning \ --parameter project_id=PROJECT_ID \ --parameter instance_name=INSTANCE_NAME \ --parameter zone=ZONE
Consulta los parámetros disponibles de este runbook.
Haz los cambios siguientes:
- PROJECT_ID: el ID del proyecto que contiene el recurso.
- INSTANCE_NAME: nombre de la instancia de Vertex AI Workbench de destino de tu proyecto.
- ZONE: la zona en la que se encuentra la instancia de Vertex AI Workbench de destino.
Marcas útiles:
--universe-domain
: Si procede, el dominio Trusted Partner Sovereign Cloud que aloja el recurso--parameter
o-p
: parámetros de runbook
Para ver una lista y una descripción de todas las marcas de la herramienta
gcpdiag
, consulta lasgcpdiag
instrucciones de uso.Errores de permisos al usar roles de cuenta de servicio con Vertex AI
Problema
Se producen errores generales de permisos al usar roles de cuenta de servicio con Vertex AI.
Estos errores pueden aparecer en Cloud Logging en los registros de componentes del producto o en los registros de auditoría. También pueden aparecer en cualquier combinación de los proyectos afectados.
Estos problemas pueden deberse a uno o ambos de los siguientes motivos:
Uso del rol
Service Account Token Creator
cuando se debería haber usado el rolService Account User
, o viceversa. Estos roles conceden diferentes permisos en una cuenta de servicio y no son intercambiables. Para obtener información sobre las diferencias entre los rolesService Account Token Creator
yService Account User
, consulta Roles de cuenta de servicio.Has concedido permisos a una cuenta de servicio en varios proyectos, lo que no está permitido de forma predeterminada.
Solución
Para solucionar el problema, prueba una o varias de las siguientes opciones:
Determina si se necesita el rol
Service Account Token Creator
oService Account User
. Para obtener más información, consulta la documentación de gestión de identidades y accesos de los servicios de Vertex AI que estés usando, así como cualquier otra integración de producto que estés usando.Si has concedido permisos a una cuenta de servicio en varios proyectos, habilita la opción para que las cuentas de servicio se puedan adjuntar en varios proyectos. Para ello, asegúrate de que
iam.disableCrossProjectServiceAccountUsage
. no se aplica. Para asegurarte de queiam.disableCrossProjectServiceAccountUsage
no se aplica, ejecuta el siguiente comando:gcloud resource-manager org-policies disable-enforce \ iam.disableCrossProjectServiceAccountUsage \ --project=PROJECT_ID