Solucionar problemas de Vertex AI Workbench

En esta página se describen los pasos para solucionar problemas que pueden resultarte útiles si tienes algún problema mientras usas Vertex AI Workbench.

Consulta también la sección Solución de problemas de Vertex AI para obtener ayuda sobre cómo usar otros componentes de Vertex AI.

Para filtrar el contenido de esta página, haz clic en un tema:

Instancias de Vertex AI Workbench

En esta sección se describen los pasos para solucionar problemas de instancias de Vertex AI Workbench.

Conectarse a JupyterLab y abrirlo

En esta sección se describen los pasos para solucionar problemas de conexión y apertura de JupyterLab.

No pasa nada después de hacer clic en Abrir JupyterLab

Problema

Cuando haces clic en Abrir JupyterLab, no ocurre nada.

Solución

Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.

No se puede acceder a la terminal de una instancia de Vertex AI Workbench

Problema

Si no puedes acceder a la terminal o no encuentras la ventana de la terminal en el menú de aplicaciones, puede deberse a que tu instancia de Vertex AI Workbench no tenga habilitado el acceso a la terminal.

Solución

Debes crear una instancia de Vertex AI Workbench con la opción Acceso a terminal habilitada. Esta opción no se puede cambiar después de crear la instancia.

Error 502 al abrir JupyterLab

Problema

Un error 502 puede significar que tu instancia de Vertex AI Workbench aún no está lista.

Solución

Espera unos minutos, actualiza la pestaña del navegador de la consola Google Cloud y vuelve a intentarlo.

El cuaderno no responde

Problema

Tu instancia de Vertex AI Workbench no ejecuta celdas o parece que está bloqueada.

Solución

Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:

  • Actualiza la página del navegador de JupyterLab. La salida de las celdas no guardadas no se conserva, por lo que debes volver a ejecutar esas celdas para regenerar la salida.
  • Restablece tu instancia.

No se puede conectar con una instancia de Vertex AI Workbench mediante SSH

Problema

No puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal.

Las instancias de Vertex AI Workbench usan OS Login para habilitar el acceso SSH. Cuando creas una instancia, Vertex AI Workbench habilita el inicio de sesión con SO de forma predeterminada al definir la clave de metadatos enable-oslogin en TRUE. Si no puedes usar SSH para conectarte a tu instancia, es posible que tengas que asignar el valor TRUE a esta clave de metadatos.

Solución

No se admite la conexión a una instancia de Vertex AI Workbench mediante la Google Cloud consola. Si no puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal, consulta lo siguiente:

Para definir la clave de metadatos enable-oslogin en TRUE, usa el método projects.locations.instances.patch en la API Notebooks o el comando gcloud workbench instances update en el SDK de Google Cloud.

Se ha superado la cuota de GPUs

Problema

No puedes crear una instancia de Vertex AI Workbench con GPUs.

Solución

Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota de GPUs de Compute Engine. Consulta Solicitar un límite de cuota superior.

Crear instancias de Vertex AI Workbench

En esta sección se describe cómo solucionar problemas relacionados con la creación de instancias de Vertex AI Workbench.

La instancia permanece en estado pendiente indefinidamente o se queda bloqueada en el estado de aprovisionamiento

Problema

Después de crear una instancia de Vertex AI Workbench, permanece en el estado pendiente indefinidamente. Puede que aparezca un error como el siguiente en los registros de serie:

Could not resolve host: notebooks.googleapis.com

Si tu instancia se queda bloqueada en el estado de aprovisionamiento, puede deberse a que tienes una configuración de red privada no válida para tu instancia.

Solución

Sigue los pasos que se indican en la sección Los registros de instancias muestran errores de conexión o de tiempo de espera.

No se puede crear una instancia en una red de VPC compartida

Problema

Si intentas crear una instancia en una red de VPC compartida, se mostrará un mensaje de error como el siguiente:

Required 'compute.subnetworks.use' permission for
'projects/network-administration/regions/us-central1/subnetworks/v'

Solución

El problema es que la cuenta de servicio de Notebooks intenta crear la instancia sin los permisos correctos.

Para asegurarte de que la cuenta de servicio de Notebooks tiene los permisos necesarios para crear una instancia de Vertex AI Workbench en una red de VPC compartida, pide a tu administrador que le conceda el rol de usuario de red de Compute (roles/compute.networkUser) de gestión de identidades y accesos en el proyecto host.

Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para asegurarse de que la cuenta de servicio de Notebooks pueda crear una instancia de Vertex AI Workbench en una red de VPC compartida. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:

Permisos obligatorios

Se necesitan los siguientes permisos para asegurarse de que la cuenta de servicio de Notebooks pueda crear una instancia de Vertex AI Workbench en una red de VPC compartida:

  • Para usar subredes, sigue estos pasos: compute.subnetworks.use

Es posible que tu administrador también pueda conceder estos permisos a la cuenta de servicio de Notebooks con roles personalizados u otros roles predefinidos.

No se puede crear una instancia de Vertex AI Workbench con un contenedor personalizado

Problema

No hay ninguna opción para usar un contenedor personalizado al crear una instancia de Vertex AI Workbench en la Google Cloud consola.

Solución

No se admite la adición de un contenedor personalizado a una instancia de Vertex AI Workbench, y no puedes añadir un contenedor personalizado mediante la consola de Google Cloud .

Te recomendamos que añadas un entorno de conda en lugar de usar un contenedor personalizado.

Puedes añadir un contenedor personalizado a una instancia de Vertex AI Workbench mediante la API Notebooks, pero esta función no es compatible.

No aparece el botón Montar almacenamiento compartido

Problema

El botón Montar almacenamiento compartido no está en la pestaña Explorador de archivos de la interfaz de JupyterLab.

Solución

Se necesita el permiso storage.buckets.list para que aparezca el botón Montar almacenamiento compartido en la interfaz de JupyterLab de tu instancia de Vertex AI Workbench. Pide a tu administrador que conceda a la cuenta de servicio de tu instancia de Vertex AI Workbench el permiso storage.buckets.list en el proyecto.

Error 599 al usar Dataproc

Problema

Si intentas crear una instancia con Dataproc habilitado, se mostrará un mensaje de error como el siguiente:

HTTP 599: Unknown (Error from Gateway: [Timeout while connecting]
Exception while attempting to connect to Gateway server url.
Ensure gateway url is valid and the Gateway instance is running.)

Solución

En la configuración de Cloud DNS, añade una entrada de Cloud DNS para el dominio *.googleusercontent.com.

No se puede instalar una extensión de JupyterLab de terceros

Problema

Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500.

Solución

Las extensiones de JupyterLab de terceros no se admiten en las instancias de Vertex AI Workbench.

No se puede editar la máquina virtual subyacente

Problema

Cuando intentas editar la máquina virtual subyacente de una instancia de Vertex AI Workbench, es posible que recibas un mensaje de error similar al siguiente:

Current principal doesn't have permission to mutate this resource.

Solución

Este error se produce porque no puedes editar la VM subyacente de una instancia mediante la consola Google Cloud o la API de Compute Engine.

Para editar la VM subyacente de una instancia de Vertex AI Workbench, usa el método projects.locations.instances.patch de la API Notebooks o el comando gcloud workbench instances update del SDK de Google Cloud.

Los paquetes pip no están disponibles después de añadir el entorno de conda

Problema

Tus paquetes pip no estarán disponibles después de añadir un kernel basado en conda.

Solución

Para solucionar el problema, consulta Añadir un entorno de conda y prueba lo siguiente:

  • Comprueba que has usado la variable DL_ANACONDA_ENV_HOME y que contiene el nombre de tu entorno.

  • Comprueba que pip se encuentre en una ruta similar a opt/conda/envs/ENVIRONMENT/bin/pip. Puedes ejecutar el comando which pip para obtener la ruta.

No se puede acceder a los datos de una instancia con acceso de un solo usuario ni copiarlos

Problema

No se puede acceder a los datos de una instancia con acceso de un solo usuario.

En las instancias de Vertex AI Workbench configuradas con acceso de un solo usuario, solo el usuario especificado (el propietario) puede acceder a los datos de la instancia.

Solución

Si no eres el propietario de la instancia, abre un caso de asistencia para acceder a los datos o copiarlos.

Apagado inesperado

Problema

Tu instancia de Vertex AI Workbench se cierra de forma inesperada.

Solución

Si tu instancia se apaga de forma inesperada, puede deberse a que se haya iniciado el apagado por inactividad.

Si has habilitado el apagado por inactividad, tu instancia se apagará cuando no haya actividad del kernel durante el periodo de tiempo especificado. Por ejemplo, ejecutar una celda o imprimir una salida nueva en un cuaderno es una actividad que restablece el temporizador de tiempo de espera por inactividad. El uso de la CPU no reinicia el temporizador de tiempo de espera por inactividad.

Los registros de la instancia muestran errores de conexión o de tiempo de espera

Problema

Los registros de tu instancia de Vertex AI Workbench muestran errores de conexión o de tiempo de espera.

Solución

Si detectas errores de conexión o de tiempo de espera en los registros de la instancia, asegúrate de que el servidor Jupyter se esté ejecutando en el puerto 8080. Sigue los pasos que se indican en la sección Verificar que la API interna de Jupyter está activa.

Si has desactivado External IP y usas una red VPC privada, asegúrate de haber seguido también la documentación sobre las opciones de configuración de la red. Ten en cuenta lo siguiente:

Los registros de instancias muestran el error "Unable to contact Jupyter API" (No se puede contactar con la API de Jupyter) o "ReadTimeoutError" (Error de tiempo de espera de lectura)

Problema

Los registros de tu instancia de Vertex AI Workbench muestran un error como el siguiente:

notebooks_collection_agent. Unable to contact Jupyter API:
HTTPConnectionPool(host=\'127.0.0.1\', port=8080):
Max retries exceeded ReadTimeoutError(\"HTTPConnectionPool(host=\'127.0.0.1\', port=8080

Solución

Sigue los pasos que se indican en la sección Los registros de instancias muestran errores de conexión o de tiempo de espera. También puedes probar a modificar la secuencia de comandos del agente de la colección Notebooks para cambiar HTTP_TIMEOUT_SESSION por un valor mayor, como 60, para verificar si la solicitud ha fallado porque la llamada ha tardado demasiado en responder o porque no se puede acceder a la URL solicitada.

docker0 conflictos de direcciones con el direccionamiento de VPC

Problema

De forma predeterminada, la interfaz docker0 se crea con la dirección IP 172.17.0.1/16. Esto podría entrar en conflicto con el direccionamiento IP de tu red VPC, de modo que la instancia no pueda conectarse a otros endpoints con direcciones 172.17.0.1/16.

Solución

Puedes forzar la creación de la interfaz docker0 con una dirección IP que no entre en conflicto con tu red VPC mediante la siguiente secuencia de comandos posterior al inicio y configurando el comportamiento de la secuencia de comandos posterior al inicio como run_once.

   #!/bin/bash
   # Wait for Docker to be fully started
   while ! systemctl is-active docker; do
    sleep 1
   done
   # Stop the Docker service
   systemctl stop docker
   # Modify /etc/docker/daemon.json
   cat < /etc/docker/daemon.json
   {
    "bip": "CUSTOM_DOCKER_IP/16"
   }
   EOF
   # Restart the Docker service
   systemctl start docker
   

Las reservas especificadas no existen

Problema

La operación para crear la instancia da como resultado un mensaje de error Specified reservations do not exist. La salida de la operación puede ser similar a la siguiente:

{
  "name": "projects/PROJECT/locations/LOCATION/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.notebooks.v2.OperationMetadata",
    "createTime": "2025-01-01T01:00:01.000000000Z",
    "endTime": "2025-01-01T01:00:01.000000000Z",
    "target": "projects/PROJECT/locations/LOCATION/instances/INSTANCE_NAME",
    "verb": "create",
    "requestedCancellation": false,
    "apiVersion": "v2",
    "endpoint": "CreateInstance"
  },
  "done": true,
  "error": {
    "code": 3,
    "message": "Invalid value for field 'resource.reservationAffinity': '{  \"consumeReservationType\": \"SPECIFIC_ALLOCATION\",  \"key\": \"compute.googleapis.com/reservation-name...'. Specified reservations [projects/PROJECT/zones/ZONE/futureReservations/RESERVATION_NAME] do not exist.",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.RequestInfo",
        "requestId": "REQUEST_ID"
      }
    ]
  }
}

Solución

Algunos tipos de máquinas de Compute Engine requieren parámetros adicionales al crearse, como discos locales o una plataforma de CPU mínima. La especificación de la instancia debe incluir estos campos adicionales.

Por ejemplo, el tipo de máquina a3-megagpu-8g requiere 16 discos SSD locales, que deben incluirse en la reserva y especificarse en la solicitud de creación de la instancia.

BODY='{
  "gce_setup": {
    "machine_type": "a3-megagpu-8g",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_SPECIFIC",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    },
    "bootDisk": {
        "disk_type": "PD_SSD",
        "diskSizeGb": "150",
        "diskEncryption": "GMEK"
    },
    "data_disks": [
      {
        "disk_type": "PD_SSD",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
      {
        "disk_type": "SCRATCH",
        "interface_type": "NVME",
      },
    ],
  }
}'

Cuadernos gestionados

En esta sección se describen los pasos para solucionar problemas de los cuadernos gestionados.

Conectarse a JupyterLab y abrirlo

En esta sección se describe cómo solucionar problemas al conectar y abrir JupyterLab.

No pasa nada después de hacer clic en Abrir JupyterLab

Problema

Cuando haces clic en Abrir JupyterLab, no ocurre nada.

Solución

Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.

No se puede conectar con una instancia de cuadernos gestionados mediante SSH

Problema

No hay ninguna opción para conectarse a instancias de notebooks gestionados mediante SSH.

Solución

No se puede acceder a las instancias de cuadernos gestionados mediante SSH.

No se puede acceder a la terminal de una instancia de cuadernos gestionados

Problema

Si no puedes acceder a la terminal o no encuentras la ventana de la terminal en el menú de aplicaciones, puede deberse a que tu instancia de cuadernos gestionados no tenga habilitado el acceso a la terminal.

Solución

Debes crear una instancia de cuadernos gestionados con la opción Acceso a terminal habilitada. Esta opción no se puede cambiar después de crear la instancia.

Error 502 al abrir JupyterLab

Problema

Un error 502 puede significar que tu instancia de cuadernos gestionados aún no está lista.

Solución

Espera unos minutos, actualiza la pestaña del navegador de la consola Google Cloud y vuelve a intentarlo.

Al abrir un cuaderno, se produce un error 524 (Se ha producido un tiempo de espera)

Problema

Un error 524 suele indicar que el agente de proxy inverso no se conecta al servidor de proxy inverso o que las solicitudes tardan demasiado en el lado del servidor backend (Jupyter). Entre las causas habituales de este error se incluyen problemas de red, que el agente de proxy inverso no se esté ejecutando o que el servicio Jupyter no se esté ejecutando.

Solución

Comprueba que la instancia de cuadernos gestionados se haya iniciado.

El cuaderno no responde

Problema

La instancia de cuaderno gestionado no ejecuta celdas o parece que está bloqueada.

Solución

Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:

  • Actualiza la página del navegador de JupyterLab. La salida de las celdas no guardadas no se conserva, por lo que debes volver a ejecutar esas celdas para regenerar la salida.
  • Restablece tu instancia.

Migrar a instancias de Vertex AI Workbench

En esta sección se describen los métodos para diagnosticar y resolver problemas al migrar de una instancia de cuadernos gestionados a una instancia de Vertex AI Workbench.

No encuentro un kernel que estaba en la instancia de cuadernos gestionados

Problema

Un kernel que estaba en tu instancia de cuadernos gestionados no aparece en la instancia de Vertex AI Workbench a la que has migrado.

Los contenedores personalizados aparecen como kernels en los cuadernos gestionados. La herramienta de migración de Vertex AI Workbench no admite la migración de contenedores personalizados.

Solución

Para solucionar este problema, añade un entorno de conda a tu instancia de Vertex AI Workbench.

Versión diferente del framework en la instancia migrada

Problema

Un framework de tu instancia de cuadernos gestionados tenía una versión diferente a la de la instancia de Vertex AI Workbench a la que migraste.

Las instancias de Vertex AI Workbench proporcionan un conjunto predeterminado de versiones de frameworks. La herramienta de migración no añade versiones del framework de tu instancia original de cuadernos gestionados. Consulta los comportamientos predeterminados de la herramienta de migración.

Solución

Para añadir una versión específica de un framework, añade un entorno de conda a tu instancia de Vertex AI Workbench.

Las GPUs no se migran a la nueva instancia de Vertex AI Workbench

Problema

Las GPUs que estaban en tu instancia de cuadernos gestionados no están en la instancia de Vertex AI Workbench a la que has migrado.

Las instancias de Vertex AI Workbench admiten un conjunto predeterminado de GPUs. Si las GPUs de tu instancia de notebooks gestionados original no están disponibles, tu instancia se migrará sin GPUs.

Solución

Después de la migración, puedes añadir GPUs a tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch de la API Notebooks o el comando gcloud workbench instances update del SDK de Google Cloud.

El tipo de máquina de la instancia migrada es diferente

Problema

El tipo de máquina de tu instancia de cuadernos gestionados es diferente de la instancia de Vertex AI Workbench a la que has migrado.

Las instancias de Vertex AI Workbench no admiten todos los tipos de máquinas. Si el tipo de máquina de tu instancia de notebooks gestionados original no está disponible, tu instancia se migrará al tipo de máquina e2-standard-4.

Solución

Después de la migración, puedes cambiar el tipo de máquina de tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch de la API Notebooks o el comando gcloud workbench instances update del SDK de Google Cloud.

Se ha superado la cuota de GPUs

Problema

No puedes crear una instancia de cuadernos gestionados con GPUs.

Solución

Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota. Consulta Solicitar un aumento de cuota.

Usar imágenes de contenedor

En esta sección se describe cómo solucionar problemas relacionados con el uso de imágenes de contenedor.

La imagen de contenedor no aparece como kernel en JupyterLab

Problema

Las imágenes de contenedor que no tienen un archivo kernelspec válido no se cargan correctamente como kernels en JupyterLab.

Solución

Asegúrate de que tu contenedor cumpla nuestros requisitos. Para obtener más información, consulta los requisitos de los contenedores personalizados.

El cuaderno se desconecta en trabajos de larga duración

Problema

Si ves el siguiente mensaje de error al ejecutar un trabajo en un cuaderno, puede deberse a que la solicitud tarda demasiado en cargarse o a que el uso de la CPU o la memoria es elevado, lo que puede hacer que el servicio Jupyter no responda.

{"log":"2021/06/29 18:10:33 failure fetching a VM ID: compute: Received 500
`internal error`\n","stream":"stderr","time":"2021-06-29T18:10:33.383650241Z"}
{"log":"2021/06/29 18:38:26 Websocket failure: failed to read a websocket
message from the server: read tcp [::1]:40168-\u003e[::1]:8080: use of closed
network connection\n","stream":"stderr","time":"2021-06-29T18:38:26.057622824Z"}

Solución

Este problema se debe a que se ejecuta un trabajo de larga duración en un cuaderno. Para ejecutar un trabajo que puede tardar mucho tiempo en completarse, se recomienda usar el ejecutor.

Usar el ejecutor

En esta sección se describe cómo solucionar problemas al usar el ejecutor.

El ejecutor no puede instalar paquetes

Problema

El ejecutor ejecuta el código del cuaderno en un entorno independiente del kernel, donde se ejecuta el código del archivo del cuaderno. Por este motivo, es posible que algunos de los paquetes que hayas instalado no estén disponibles en el entorno del ejecutor.

Solución

Para solucionar este problema, consulta la sección Asegurarse de que las instalaciones de paquetes estén disponibles para el ejecutor.

Errores 401 o 403 al ejecutar el código del cuaderno con el ejecutor

Problema

Si se produce un error 401 o 403 al ejecutar el ejecutor, puede significar que este no puede acceder a los recursos.

Solución

Consulta las posibles causas a continuación:

  • El ejecutor ejecuta el código del cuaderno en un proyecto de inquilino independiente del proyecto de tu instancia de cuadernos gestionados. Por lo tanto, cuando accedas a los recursos a través del código que ejecuta el ejecutor, es posible que este no se conecte al proyecto correcto de forma predeterminada. Google Cloud Para resolver este problema, selecciona un proyecto explícitamente.

  • De forma predeterminada, tu instancia de cuaderno gestionado puede acceder a los recursos que se encuentran en el mismo proyecto. Por lo tanto, cuando ejecutas el código del archivo de cuaderno manualmente, estos recursos no necesitan autenticación adicional. Sin embargo, como el ejecutor se ejecuta en un proyecto de inquilino independiente, no tiene el mismo acceso predeterminado. Para solucionar este problema, autentica el acceso mediante cuentas de servicio.

  • El ejecutor no puede usar las credenciales del usuario final para autenticar el acceso a los recursos, por ejemplo, el comando gcloud auth login. Para solucionar este problema, autentica el acceso mediante cuentas de servicio.

Error exited with a non-zero status of 127 al usar el ejecutor

Problema

Se puede producir un error exited with a non-zero status of 127 o un error "no se ha encontrado el comando" cuando usas el ejecutor para ejecutar código en un contenedor personalizado que no tiene instalada la extensión nbexecutor.

Solución

Para asegurarte de que tu contenedor personalizado tiene la extensión nbexecutor, puedes crear una imagen de contenedor derivada a partir de una imagen de Deep Learning Containers. Las imágenes de Deep Learning Containers incluyen la extensión nbexecutor.

Mensaje de error de configuración de red de servicio no válida

Problema

Este error puede tener el siguiente aspecto:

Invalid Service Networking configuration. Couldn't find free blocks in allocated IP ranges.
Please use a valid range using: /24 mask or below (/23,/22, etc).

Esto significa que no se han encontrado bloques libres en los intervalos de IP asignados de tu red.

Solución

Usa una máscara de subred de /24 o inferior. Crea un intervalo de direcciones IP asignado más grande y adjúntalo modificando la conexión de servicio privada de servicenetworking-googleapis-com.

Para obtener más información, consulta Configurar una red.

No se puede instalar una extensión de JupyterLab de terceros

Problema

Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500.

Solución

Las extensiones de JupyterLab de terceros no se admiten en las instancias de cuadernos gestionados.

No se puede acceder a los datos de una instancia con acceso de un solo usuario ni copiarlos

Problema

No se puede acceder a los datos de una instancia con acceso de un solo usuario.

Solución

En las instancias de cuaderno gestionadas que se configuran con acceso de un solo usuario, solo el usuario especificado (el propietario) puede acceder a los datos de la instancia.

Si no eres el propietario de la instancia, abre un caso de asistencia para acceder a los datos o copiarlos.

Apagado inesperado

Problema

Tu instancia de Vertex AI Workbench se cierra de forma inesperada.

Solución

Si tu instancia se apaga de forma inesperada, puede deberse a que se haya iniciado el apagado por inactividad.

Si has habilitado el apagado por inactividad, tu instancia se apagará cuando no haya actividad del kernel durante el periodo de tiempo especificado. Por ejemplo, ejecutar una celda o imprimir una salida nueva en un cuaderno es una actividad que restablece el temporizador de tiempo de espera por inactividad. El uso de la CPU no reinicia el temporizador de tiempo de espera por inactividad.

Restaurar instancia

Problema

No se admite la restauración de una instancia de cuadernos gestionados después de que se haya eliminado.

Solución

Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub.

Recuperar datos de una instancia

Problema

No se admite la recuperación de datos de una instancia de cuadernos gestionados después de que se haya eliminado.

Solución

Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub.

Crear instancias de cuadernos gestionados

En esta sección se describe cómo solucionar problemas al crear instancias de cuadernos gestionados.

Error: se ha producido un problema al crear una conexión

Problema

Se produce este error al crear una instancia:

We encountered a problem while creating a connection.

Service 'servicenetworking.googleapis.com' requires at least
one allocated range to have minimal size; please make sure
at least one allocated range will have prefix length at most '24'.

Solución

Crea un intervalo de IP asignado mayor que /24 y adjúntalo modificando la conexión de servicio privada de la conexión servicenetworking-googleapis-com.

Al crear una instancia, se produce un error de disponibilidad de recursos

Problema

No puedes crear una instancia debido a un error de disponibilidad de recursos.

Este error puede tener el siguiente aspecto:

Creating notebook INSTANCE_NAME: ZONE does not have
enough resources available to fulfill the request.
Retry later or try another zone in your configurations.

Los errores de recursos se producen cuando solicitas recursos nuevos en una zona que no puede satisfacer tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.

Los errores de recursos solo se aplican a las nuevas solicitudes de recursos de la zona y no afectan a los recursos ya creados. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.

Solución

Para continuar, prueba lo siguiente:

  • Crea una instancia con otro tipo de máquina.
  • Crea la instancia en otra zona.
  • Vuelve a intentar la solicitud más tarde.
  • Reduce la cantidad de recursos que solicitas. Por ejemplo, intenta crear una instancia con menos GPUs, discos, vCPUs o memoria.

Al iniciar una instancia, se produce un error de disponibilidad de recursos

Problema

No puedes iniciar una instancia debido a un error de disponibilidad de recursos.

Este error puede tener el siguiente aspecto:

The zone ZONE_NAME doesn't have enough resources available to fulfill
the request. '(resource type:compute)'.

Los errores de recursos se producen cuando intentas iniciar una instancia en una zona que no puede atender tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.

Los errores de recursos solo se aplican a los recursos que especificaste en tu solicitud en el momento en que la enviaste, no a todos los recursos de la zona. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.

Solución

Para continuar, prueba lo siguiente:

  • Cambia el tipo de máquina de tu instancia.
  • Migra tus archivos y datos a una instancia de otra zona.
  • Vuelve a intentar la solicitud más tarde.
  • Reduce la cantidad de recursos que solicitas. Por ejemplo, inicia otra instancia con menos GPUs, discos, vCPUs o memoria.

No route to host en conexiones salientes de cuadernos gestionados

Problema

Normalmente, las únicas rutas que puedes ver en la Google Cloud consola son las que conoce tu propia VPC, así como los intervalos reservados cuando completas la configuración de emparejamiento entre redes de VPC.

Las instancias de cuadernos gestionados residen en una red gestionada por Google y ejecutan una versión modificada de Jupyter en un espacio de nombres de redes Docker dentro de la instancia.

La interfaz de red de Docker y el puente de Linux de esta instancia pueden seleccionar una IP local que entre en conflicto con los intervalos de IP que tu VPC exporta a través del emparejamiento. Por lo general, se encuentran en los intervalos 172.16.0.0/161 y 192.168.10.0/24, respectivamente.

En estas circunstancias, las conexiones salientes de la instancia a estos intervalos fallarán con un mensaje de error que será una variación de No route to host, aunque las rutas de VPC se hayan compartido correctamente.

Solución

Invoca ifconfig en una sesión de terminal y comprueba que ninguna dirección IP de las interfaces virtuales de la instancia entre en conflicto con los intervalos de IP que tu VPC exporta a la conexión de peering.

Cuadernos gestionados por usuarios

En esta sección se describen los pasos para solucionar problemas de los cuadernos gestionados por el usuario.

Conectarse a JupyterLab y abrirlo

En esta sección se describe cómo solucionar problemas al conectar y abrir JupyterLab.

No pasa nada después de hacer clic en Abrir JupyterLab

Problema

Cuando haces clic en Abrir JupyterLab, no ocurre nada.

Solución

Comprueba que tu navegador no bloquee la apertura automática de pestañas nuevas. JupyterLab se abre en una nueva pestaña del navegador.

No se puede acceder a JupyterLab mediante el servidor proxy inverso

Problema

No puedes acceder a JupyterLab.

Vertex AI Workbench usa un servidor proxy inverso interno de Google para proporcionar acceso a JupyterLab. Los ajustes de la instancia de cuaderno gestionada por el usuario, la configuración de red y otros factores pueden impedir el acceso a JupyterLab.

Solución

Usa SSH para conectarte a JupyterLab y consulta más información sobre por qué es posible que no tengas acceso a través del proxy inverso.

No se puede conectar con una instancia de cuadernos gestionados por usuarios mediante SSH

Problema

No puedes conectarte a tu instancia mediante SSH a través de una ventana de terminal.

Las instancias de cuadernos gestionados por usuarios usan OS Login para habilitar el acceso SSH. Cuando creas una instancia, Vertex AI Workbench habilita el inicio de sesión del SO de forma predeterminada al definir la clave de metadatos enable-oslogin en TRUE. Si no puedes usar SSH para conectarte a tu instancia, es posible que tengas que asignar el valor TRUE a esta clave de metadatos.

Solución

Para habilitar el acceso SSH a los cuadernos gestionados por el usuario, sigue los pasos para configurar los roles de inicio de sesión del SO en las cuentas de usuario.

Al abrir una instancia de cuadernos gestionados por usuarios, se produce un error 403 (Forbidden)

Problema

Un error 403 (Forbidden) al abrir una instancia de cuadernos gestionados por el usuario suele significar que hay un problema de acceso.

Solución

Para solucionar los problemas de acceso, ten en cuenta las tres formas en las que se puede conceder acceso a una instancia de cuadernos gestionados por usuarios:

  • Un solo usuario
  • Cuenta de servicio
  • Editores del proyecto

El modo de acceso se configura durante la creación de la instancia de cuadernos gestionados por el usuario y se define en los metadatos del cuaderno:

  • Un solo usuario: proxy-mode=mail, proxy-user-mail=user@domain.com
  • Cuenta de servicio: proxy-mode=service_account
  • Editores del proyecto: proxy-mode=project_editors

Si no puedes acceder a un cuaderno al hacer clic en Abrir JupyterLab, prueba lo siguiente:

En el siguiente ejemplo se muestra cómo especificar una cuenta de servicio al crear una instancia:

gcloud notebooks instances create nb-1 \
  --vm-image-family=tf-latest-cpu \
  --metadata=proxy-mode=mail,proxy-user-mail=user@domain.com \
  --service-account=your_service_account@project_id.iam.gserviceaccount.com \
  --location=us-west1-a

Cuando haces clic en Abrir JupyterLab para abrir un cuaderno, este se abre en una pestaña nueva del navegador. Si has iniciado sesión en más de una cuenta de Google, la nueva pestaña se abrirá con tu cuenta de Google predeterminada. Si no has creado tu instancia de cuadernos gestionados por el usuario con tu cuenta de Google predeterminada, en la nueva pestaña del navegador se mostrará un error 403 (Forbidden).

Sin acceso a JupyterLab, modo de un solo usuario habilitado

Problema

No puedes acceder a JupyterLab.

Solución

Si un usuario no puede acceder a JupyterLab y el acceso de la instancia a JupyterLab está configurado como Single user only, prueba lo siguiente:

  1. En la página Notebooks gestionados por el usuario de la Google Cloud consola, haz clic en el nombre de tu instancia para abrir la página Detalles del cuaderno.

  2. Junto a Ver detalles de VM, haz clic en Ver en Compute Engine.

  3. En la página de detalles de la VM, haz clic en Editar.

  4. En la sección Metadatos, compruebe que la entrada de metadatos proxy-mode esté definida como mail.

  5. Verifica que la entrada de metadatos proxy-user-mail esté configurada con una dirección de correo de usuario válida, no con una cuenta de servicio.

  6. Haz clic en Guardar.

  7. En la página Cuadernos gestionados por usuarios de la consola Google Cloud , inicializa los metadatos actualizados deteniendo la instancia y volviendo a iniciarla.

Al abrir un cuaderno, se produce un error 504 (Tiempo de espera de pasarela agotado)

Problema

Esto indica que se ha agotado el tiempo de espera de un proxy interno o de un servidor backend (Jupyter). Esto se puede ver cuando:

  • La solicitud nunca llegó al servidor proxy interno de inversión
  • El backend (Jupyter) devuelve un error 504.

Solución

Abre un caso de asistencia de Google.

Al abrir un cuaderno, se produce un error 524 (Se ha producido un tiempo de espera)

Problema

El servidor proxy inverso interno no ha recibido una respuesta del agente proxy inverso a la solicitud durante el periodo de tiempo de espera. Inverting Proxy agent se ejecuta en tu instancia de cuadernos gestionados por usuarios como un contenedor de Docker. Un error 524 suele indicar que el agente de proxy inverso no se conecta al servidor de proxy inverso o que las solicitudes tardan demasiado en el lado del servidor backend (Jupyter). Un caso habitual de este error es en el lado del usuario (por ejemplo, un problema de red o que el servicio del agente de proxy inverso no se esté ejecutando).

Solución

Si no puedes acceder a un cuaderno, comprueba que la instancia de cuadernos gestionados por el usuario se haya iniciado y prueba lo siguiente:

Opción 1: Ejecuta la herramienta de diagnóstico para comprobar y reparar automáticamente los servicios principales de los cuadernos gestionados por el usuario, verificar el almacenamiento disponible y generar archivos de registro útiles. Para ejecutar la herramienta en tu instancia, sigue estos pasos:

  1. Asegúrate de que tu instancia tenga la versión M58 o una posterior.

  2. Conéctate a tu instancia de imágenes de máquina virtual de aprendizaje profundo mediante SSH.

  3. Ejecuta el siguiente comando:

    sudo /opt/deeplearning/bin/diagnostic_tool.sh [--repair] [--bucket=$BUCKET]

    Ten en cuenta que las marcas --repair y --bucket son opcionales. La marca --repair intentará corregir los errores habituales del servicio principal y la marca --bucket te permitirá especificar un segmento de Cloud Storage para almacenar los archivos de registro creados.

    La salida de este comando mostrará mensajes de estado útiles para los servicios principales de los cuadernos gestionados por el usuario y exportará los archivos de registro de sus resultados.

Opción 2: Sigue estos pasos para comprobar los requisitos de los cuadernos gestionados por el usuario de forma individual.

Al abrir un cuaderno, se produce un error 598 (Tiempo de espera de lectura de red)

Problema

El servidor proxy inverso no ha recibido ninguna señal del agente proxy inverso en más de 10 minutos. Esto es un claro indicio de un problema con el agente de proxy inverso.

Solución

Si no puedes acceder a un cuaderno, prueba lo siguiente:

El cuaderno no responde

Problema

Tu instancia de cuaderno gestionado por el usuario no ejecuta celdas o parece que se ha bloqueado.

Solución

Primero, intenta reiniciar el kernel haciendo clic en Kernel en el menú de la parte superior y, a continuación, en Reiniciar kernel. Si no funciona, puedes probar lo siguiente:

  • Actualiza la página del navegador de JupyterLab. Los resultados de las celdas que no se hayan guardado no se conservarán, por lo que deberás volver a ejecutar esas celdas para regenerar los resultados.
  • En una sesión de terminal del cuaderno, ejecuta el comando top para ver si hay procesos que consumen la CPU.
  • En el terminal, comprueba la cantidad de espacio libre en disco con el comando df o la RAM disponible con el comando free.
  • Para detener la instancia, selecciónala en la página Cuadernos gestionados por usuarios y haz clic en Detener. Cuando se haya detenido por completo, selecciónalo y haz clic en Iniciar.

Migrar a instancias de Vertex AI Workbench

En esta sección se describen los métodos para diagnosticar y resolver problemas al migrar de una instancia de cuadernos gestionados por el usuario a una instancia de Vertex AI Workbench.

No encuentro R, Beam u otros kernels que estaban en la instancia de notebooks gestionada por el usuario

Problema

Un kernel que estaba en tu instancia de cuadernos gestionados por el usuario no aparece en la instancia de Vertex AI Workbench a la que has migrado.

Algunos kernels, como los kernels R y Beam, no están disponibles de forma predeterminada en las instancias de Vertex AI Workbench. No se admite la migración de esos kernels.

Solución

Para solucionar este problema, añade un entorno de conda a tu instancia de Vertex AI Workbench.

No se puede configurar una instancia de Dataproc Hub en la instancia de Vertex AI Workbench

Problema

Dataproc Hub no se admite en las instancias de Vertex AI Workbench.

Solución

Sigue usando Dataproc Hub en instancias de cuadernos gestionados por usuarios.

Versión diferente del framework en la instancia migrada

Problema

Un framework que estaba en tu instancia de cuadernos gestionados por el usuario tenía una versión diferente a la de la instancia de Vertex AI Workbench a la que migraste.

Las instancias de Vertex AI Workbench proporcionan un conjunto predeterminado de versiones de frameworks. La herramienta de migración no añade versiones del framework de tu instancia original de cuadernos gestionada por el usuario. Consulta los comportamientos predeterminados de la herramienta de migración.

Solución

Para añadir una versión específica de un framework, añade un entorno de conda a tu instancia de Vertex AI Workbench.

Las GPUs no se migran a la nueva instancia de Vertex AI Workbench

Problema

Las GPUs que estaban en tu instancia de cuadernos gestionados por el usuario no están en la instancia de Vertex AI Workbench a la que has migrado.

Las instancias de Vertex AI Workbench admiten un conjunto predeterminado de GPUs. Si las GPUs de tu instancia de notebooks gestionada por el usuario original no están disponibles, tu instancia se migrará sin ninguna GPU.

Solución

Después de la migración, puedes añadir GPUs a tu instancia de Vertex AI Workbench mediante el método projects.locations.instances.patch de la API Notebooks o el comando gcloud workbench instances update del SDK de Google Cloud.

El tipo de máquina de la instancia migrada es diferente

Problema

El tipo de máquina de tu instancia de notebooks gestionados por el usuario es diferente de la instancia de Vertex AI Workbench a la que has migrado.

Las instancias de Vertex AI Workbench no admiten todos los tipos de máquinas. Si el tipo de máquina de tu instancia de notebooks gestionados por el usuario original no está disponible, tu instancia se migrará al tipo de máquina e2-standard-4.

Solución

Después de la migración, puedes cambiar el tipo de máquina de tu instancia de Vertex AI Workbench con el método projects.locations.instances.patch de la API Notebooks o con el comando gcloud workbench instances update del SDK de Google Cloud.

Trabajar con archivos

En esta sección se describe cómo solucionar problemas con los archivos de instancias de cuadernos gestionados por usuarios.

Descarga de archivos inhabilitada, pero el usuario puede seguir descargando archivos

Problema

No se puede inhabilitar la descarga de archivos desde la interfaz de usuario de JupyterLab en las instancias de cuadernos gestionados por usuarios de Dataproc Hub. Las instancias de cuadernos gestionadas por el usuario que usan el framework de Dataproc Hub permiten descargar archivos aunque no selecciones la opción Habilitar descarga de archivos desde la interfaz de usuario de JupyterLab al crear la instancia.

Solución

Las instancias de cuadernos gestionados por usuarios de Dataproc Hub no admiten la restricción de descargas de archivos.

Los archivos descargados están truncados o no se descargan por completo

Problema

Cuando descargas archivos de tu instancia de cuadernos gestionada por el usuario, un ajuste de tiempo de espera del agente de reenvío de proxy limita el tiempo de conexión para que se complete la descarga. Si la descarga tarda demasiado, puede que el archivo descargado se trunque o que no se descargue.

Solución

Para descargar el archivo, cópialo en Cloud Storage y, a continuación, descárgalo desde Cloud Storage.

Te recomendamos que migres tus archivos y datos a una nueva instancia de cuadernos gestionados por el usuario.

Después de reiniciar la VM, no se puede hacer referencia a los archivos locales desde la terminal del cuaderno

Problema

A veces, después de reiniciar una instancia de cuadernos gestionada por el usuario, no se puede hacer referencia a los archivos locales desde un terminal de cuaderno.

Solución

Se trata de un problema conocido. Para hacer referencia a tus archivos locales desde un terminal de cuaderno, primero debes volver a establecer tu directorio de trabajo actual con el siguiente comando:

cd PWD

En este comando, sustituye PWD por tu directorio de trabajo actual. Por ejemplo, si tu directorio de trabajo actual es /home/jupyter/, usa el comando cd /home/jupyter/.

Después de volver a establecer el directorio de trabajo actual, se puede hacer referencia a los archivos locales desde la terminal del cuaderno.

Crear instancias de cuadernos gestionados por usuarios

En esta sección se describe cómo solucionar problemas al crear instancias de cuadernos gestionados por usuarios.

Se ha superado la cuota de GPUs

Problema

No puedes crear una instancia de cuadernos gestionados por usuarios con GPUs.

Solución

Para determinar el número de GPUs disponibles en tu proyecto, consulta la página de cuotas. Si las GPUs no aparecen en la página de cuotas o necesitas más cuota de GPU, puedes solicitar un aumento de cuota. Consulta Solicitar un aumento de cuota.

La instancia permanece en estado pendiente indefinidamente

Problema

Después de crear una instancia de cuadernos gestionados por usuarios, esta permanece en estado pendiente indefinidamente. Puede que aparezca un error como el siguiente en los registros de serie:

Could not resolve host: notebooks.googleapis.com

Solución

Tu instancia no puede conectarse al servidor de la API Notebooks debido a un problema de configuración de Cloud DNS u otro problema de red. Para solucionar el problema, comprueba las configuraciones de Cloud DNS y de red. Para obtener más información, consulta la sección sobre opciones de configuración de red.

No se crea una instancia de cuadernos gestionados por usuarios (permisos insuficientes)

Problema

Normalmente, se tarda aproximadamente un minuto en crear una instancia de cuadernos gestionados por usuarios. Si tu nueva instancia de notebooks gestionados por el usuario permanece en el estado pending indefinidamente, puede deberse a que la cuenta de servicio utilizada para iniciar la instancia de notebooks gestionados por el usuario no tenga los permisos necesarios en tu proyecto Google Cloud .

Puedes iniciar una instancia de cuadernos gestionada por el usuario con una cuenta de servicio personalizada que crees o en el modo de un solo usuario con un ID de usuario. Si inicias una instancia de notebooks gestionada por el usuario en modo de un solo usuario, la instancia de notebooks gestionada por el usuario empieza el proceso de arranque con la cuenta de servicio predeterminada de Compute Engine antes de ceder el control a tu ID de usuario.

Solución

Para comprobar que una cuenta de servicio tiene los permisos adecuados, sigue estos pasos:

Consola

  1. Abre la página de IAM en la Google Cloud consola.

    Abre la página Gestión de identidades y accesos

  2. Determina la cuenta de servicio que se usa con tu instancia de cuadernos gestionados por el usuario, que es una de las siguientes:

    • Una cuenta de servicio personalizada que hayas especificado al crear tu instancia de cuadernos gestionados por el usuario.

    • La cuenta de servicio predeterminada de Compute Engine de tuGoogle Cloud proyecto, que se usa cuando inicias tu instancia de cuadernos gestionados por el usuario en el modo de un solo usuario. La cuenta de servicio predeterminada de Compute Engine de tu proyecto Google Cloud se llama PROJECT_NUMBER-compute@developer.gserviceaccount.com. Por ejemplo: 113377992299-compute@developer.gserviceaccount.com.

  3. Comprueba que tu cuenta de servicio tenga el rol Ejecutor de cuadernos (roles/notebooks.runner). Si no es así, concede a la cuenta de servicio el rol Ejecutor de cuadernos (roles/notebooks.runner).

Para obtener más información, consulta cómo conceder, cambiar y revocar el acceso a los recursos en la documentación de IAM.

gcloud

  1. Si aún no lo has hecho, instala la CLI de Google Cloud.

  2. Obtén el nombre y el número de proyecto de tu Google Cloud proyecto con el siguiente comando. Sustituye PROJECT_ID por el ID del proyecto deGoogle Cloud .

    gcloud projects describe PROJECT_ID
    

    Debería ver un resultado similar al siguiente, que muestra el nombre (name:) y el número de proyecto (projectNumber:) de su proyecto.

    createTime: '2018-10-18T21:03:31.408Z'
    lifecycleState: ACTIVE
    name: my-project-name
    parent:
     id: '396521612403'
     type: folder
    projectId: my-project-id-1234
    projectNumber: '113377992299'
    
  3. Determina la cuenta de servicio que se usa con tu instancia de cuadernos gestionados por usuarios, que es una de las siguientes:

    • Una cuenta de servicio personalizada que hayas especificado al crear tu instancia de cuadernos gestionados por el usuario.

    • La cuenta de servicio predeterminada de Compute Engine de tuGoogle Cloud proyecto, que se usa cuando inicias tu instancia de cuadernos gestionados por el usuario en el modo de un solo usuario. La cuenta de servicio predeterminada de Compute Engine de tu proyecto Google Cloud se llama PROJECT_NUMBER-compute@developer.gserviceaccount.com. Por ejemplo: 113377992299-compute@developer.gserviceaccount.com.

  4. Añade el rol roles/notebooks.runner a la cuenta de servicio con el siguiente comando. Sustituye project-name por el nombre de tu proyecto y service-account-id por el ID de la cuenta de servicio de tu instancia de cuadernos gestionados por el usuario.

    gcloud projects add-iam-policy-binding project-name \
     --member serviceAccount:service-account-id \
     --role roles/notebooks.runner
    

Al crear una instancia, se produce un error Permission denied

Problema

La cuenta de servicio de la instancia proporciona acceso a otros servicios de Google Cloud. Puedes usar cualquier cuenta de servicio del mismo proyecto, pero debes tener el permiso Usuario de cuenta de servicio (iam.serviceAccounts.actAs) para crear la instancia. Si no se especifica, se usa la cuenta de servicio predeterminada de Compute Engine.

Solución

Al crear una instancia, comprueba que el usuario que la crea tenga el permiso iam.serviceAccounts.ActAs para la cuenta de servicio definida.

En el siguiente ejemplo se muestra cómo especificar una cuenta de servicio al crear una instancia:

gcloud notebooks instances create nb-1 \
  --vm-image-family=tf-latest-cpu \
  --service-account=your_service_account@project_id.iam.gserviceaccount.com \
  --location=us-west1-a

Para asignar el rol Usuario de cuenta de servicio, consulta Gestionar acceso a cuentas de servicio.

Al crear una instancia, se produce un error already exists

Problema

Al crear una instancia, comprueba que Compute Engine no haya eliminado previamente una instancia de cuadernos gestionados por el usuario con el mismo nombre y que siga existiendo en la base de datos de la API Notebooks.

Solución

En el siguiente ejemplo se muestra cómo enumerar instancias mediante la API Notebooks y verificar su estado.

gcloud notebooks instances list --location=LOCATION

Si el estado de una instancia es DELETED, ejecuta el siguiente comando para eliminarla de forma permanente.

gcloud notebooks instances delete INSTANCE_NAME --location=LOCATION

No se puede crear una instancia en una VPC compartida

Problema

No puedes crear una instancia en una VPC compartida.

Solución

Si usas VPC compartida, debes añadir los proyectos host y de servicio al perímetro de servicio. En el proyecto host, también debes asignar el rol Usuario de red de Compute (roles/compute.networkUser) al agente de servicio de cuadernos del proyecto de servicio. Para obtener más información, consulta el artículo sobre cómo gestionar perímetros de servicio.

Al crear una instancia, se produce un error de disponibilidad de recursos

Problema

No puedes crear una instancia debido a un error de disponibilidad de recursos.

Este error puede tener el siguiente aspecto:

Creating notebook INSTANCE_NAME: ZONE does not have enough
resources available to fulfill the request. Retry later or try another zone in
your configurations.

Los errores de recursos se producen cuando solicitas recursos nuevos en una zona que no puede satisfacer tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.

Los errores de recursos solo se aplican a las nuevas solicitudes de recursos de la zona y no afectan a los recursos ya creados. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.

Solución

Para continuar, puedes probar lo siguiente:

  • Crea una instancia con otro tipo de máquina.
  • Crea la instancia en otra zona.
  • Vuelve a intentar la solicitud más tarde.
  • Reduce la cantidad de recursos que solicitas. Por ejemplo, intenta crear una instancia con menos GPUs, discos, vCPUs o memoria.

Al iniciar una instancia, se produce un error de disponibilidad de recursos

Problema

No puedes iniciar una instancia debido a un error de disponibilidad de recursos.

Este error puede tener el siguiente aspecto:

The zone ZONE_NAME doesn't have enough resources available to fulfill
the request. '(resource type:compute)'.

Los errores de recursos se producen cuando intentas iniciar una instancia en una zona que no puede atender tu solicitud debido a la falta de disponibilidad de recursos de Compute Engine, como GPUs o CPUs.

Los errores de recursos solo se aplican a los recursos que especificaste en tu solicitud en el momento en que la enviaste, no a todos los recursos de la zona. Los errores de recursos no están relacionados con tu cuota de Compute Engine. Los errores de recursos son temporales y pueden cambiar con frecuencia en función de las fluctuaciones de la demanda.

Solución

Para continuar, puedes probar lo siguiente:

  • Cambia el tipo de máquina de tu instancia.
  • Migra tus archivos y datos a una instancia de otra zona.
  • Vuelve a intentar la solicitud más tarde.
  • Reduce la cantidad de recursos que solicitas. Por ejemplo, inicia otra instancia con menos GPUs, discos, vCPUs o memoria.

Actualizar instancias de cuadernos gestionados por usuarios

En esta sección se describe cómo solucionar problemas al actualizar instancias de cuadernos gestionados por usuarios.

No se puede actualizar porque no se puede obtener información del disco de la instancia

Problema

No se puede actualizar una instancia de cuadernos gestionados por usuarios con un solo disco.

Solución

Puede que quieras migrar tus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario.

No se puede actualizar porque la instancia no es compatible con UEFI

Problema

Vertex AI Workbench depende de la compatibilidad con UEFI para completar una actualización.

Las instancias de notebooks gestionadas por el usuario creadas a partir de algunas imágenes antiguas no son compatibles con UEFI y, por lo tanto, no se pueden actualizar.

Solución

Para verificar que tu instancia es compatible con UEFI, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.

gcloud compute instances describe INSTANCE_NAME \
  --zone=ZONE | grep type

Haz los cambios siguientes:

  • INSTANCE_NAME: el nombre de tu instancia
  • ZONE: la zona en la que se encuentra tu instancia

Para verificar que la imagen que has usado para crear tu instancia es compatible con UEFI, usa el siguiente comando:

gcloud compute images describe VM_IMAGE_FAMILY \
  --project deeplearning-platform-release | grep type

Sustituye VM_IMAGE_FAMILY por el nombre de familia de la imagen que usaste para crear tu instancia.

Si determina que su instancia o imagen no es compatible con UEFI, puede intentar migrar sus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario. Para hacerlo, sigue estos pasos:

  1. Comprueba que la imagen que quieres usar para crear la nueva instancia sea compatible con UEFI. Para ello, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.

    gcloud compute images describe VM_IMAGE_FAMILY \
      --project deeplearning-platform-release --format=json | grep type

    Sustituye VM_IMAGE_FAMILY por el nombre de la familia de imágenes que quieras usar para crear tu instancia.

  2. Migra tus datos de usuario a una nueva instancia de cuadernos gestionados por el usuario.

No se puede acceder a la instancia de cuadernos gestionados por usuarios después de la actualización

Problema

Si no se puede acceder a la instancia de cuadernos gestionada por el usuario después de una actualización, es posible que se haya producido un error durante la sustitución de la imagen del disco de arranque.

Las instancias de cuadernos gestionados por usuarios que se pueden actualizar tienen dos discos: uno de arranque y otro de datos. Durante el proceso de actualización, el disco de arranque se actualiza a una nueva imagen, pero los datos del disco de datos se conservan.

Solución

Sigue estos pasos para adjuntar una imagen válida nueva al disco de arranque.

  1. Para almacenar los valores que usarás para completar este procedimiento, escribe el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada la CLI de Google Cloud.

    export INSTANCE_NAME=MY_INSTANCE_NAME
    export PROJECT_ID=MY_PROJECT_ID
    export ZONE=MY_ZONE

    Haz los cambios siguientes:

    • MY_INSTANCE_NAME: el nombre de tu instancia
    • MY_PROJECT_ID: tu ID de proyecto
    • MY_ZONE: la zona en la que se encuentra tu instancia
  2. Usa el siguiente comando para detener la instancia:

    gcloud compute instances stop $INSTANCE_NAME \
      --project=$PROJECT_ID --zone=$ZONE
  3. Desconecta el disco de datos de la instancia.

    gcloud compute instances detach-disk $INSTANCE_NAME --device-name=data \
      --project=$PROJECT_ID --zone=$ZONE
  4. Elimina la VM de la instancia.

    gcloud compute instances delete $INSTANCE_NAME --keep-disks=all --quiet \
      --project=$PROJECT_ID --zone=$ZONE
  5. Usa la API Notebooks para eliminar la instancia de cuadernos gestionados por usuarios.

    gcloud notebooks instances delete $INSTANCE_NAME \
      --project=$PROJECT_ID --location=$ZONE
  6. Crea una instancia de cuadernos gestionados por usuarios con el mismo nombre que la instancia anterior.

    gcloud notebooks instances create $INSTANCE_NAME \
      --vm-image-project="deeplearning-platform-release" \
      --vm-image-family=MY_VM_IMAGE_FAMILY \
      --instance-owners=MY_INSTANCE_OWNER \
      --machine-type=MY_MACHINE_TYPE \
      --service-account=MY_SERVICE_ACCOUNT \
      --accelerator-type=MY_ACCELERATOR_TYPE \
      --accelerator-core-count=MY_ACCELERATOR_CORE_COUNT \
      --install-gpu-driver \
      --project=$PROJECT_ID \
      --location=$ZONE

    Haz los cambios siguientes:

    • MY_VM_IMAGE_FAMILY: el nombre de la familia de imágenes
    • MY_INSTANCE_OWNER: el propietario de tu instancia
    • MY_MACHINE_TYPE: el tipo de máquina de la VM de tu instancia
    • MY_SERVICE_ACCOUNT: la cuenta de servicio que se va a usar con esta instancia o "default"
    • MY_ACCELERATOR_TYPE: el tipo de acelerador. Por ejemplo, "NVIDIA_TESLA_T4"
    • MY_ACCELERATOR_CORE_COUNT: el número de núcleos. Por ejemplo, 1

Monitorizar el estado de las instancias de cuadernos gestionados por usuarios

En esta sección se describe cómo solucionar problemas con errores de monitorización del estado de salud.

Error de estado de docker-proxy-agent

Sigue estos pasos si se produce un error con el estado docker-proxy-agent:

  1. Comprueba que el agente Inverting Proxy se esté ejecutando. En caso contrario, ve al paso 3.

  2. Reinicia el agente Inverting Proxy.

  3. Vuelve a registrarte en el servidor proxy inverso.

Error de estado de docker-service

Sigue estos pasos si se produce un error con el estado docker-service:

  1. Comprueba que el servicio Docker se esté ejecutando.

  2. Reinicia el servicio Docker.

Error de estado de jupyter-service

Sigue estos pasos si se produce un error con el estado jupyter-service:

  1. Verifica que el servicio Jupyter se esté ejecutando.

  2. Reinicia el servicio de Jupyter.

Error de estado de jupyter-api

Sigue estos pasos si se produce un error con el estado jupyter-api:

  1. Verifica que la API interna de Jupyter esté activa.

  2. Reinicia el servicio de Jupyter.

Porcentaje de uso del disco de arranque

El estado del espacio del disco de arranque es incorrecto si el espacio del disco está lleno en más de un 85 %.

Si el estado del espacio en disco de arranque no es correcto, prueba lo siguiente:

  1. Desde una sesión de terminal en la instancia de notebooks gestionada por el usuario o mediante ssh para conectarte, consulta la cantidad de espacio libre en el disco con el comando df -H.

  2. Usa el comando find . -type d -size +100M para encontrar archivos grandes que puedas eliminar, pero no los elimines a menos que estés seguro de que puedes hacerlo sin problemas. Si no lo tienes claro, puedes pedir ayuda al equipo de Asistencia.

  3. Si los pasos anteriores no solucionan el problema, ponte en contacto con el equipo de Asistencia.

Porcentaje de uso del disco de datos

El estado del espacio en disco de datos es incorrecto si el espacio en disco está lleno en más de un 85 %.

Si el estado del espacio en disco de datos no es correcto, prueba lo siguiente:

  1. Desde una sesión de terminal en la instancia de notebooks gestionada por el usuario o mediante ssh para conectarte, consulta la cantidad de espacio libre en el disco con el comando df -h -T /home/jupyter.

  2. Elimina archivos grandes para aumentar el espacio en disco disponible. Usa el comando find . -type d -size +100M para encontrar archivos grandes.

  3. Si los pasos anteriores no solucionan el problema, ponte en contacto con el equipo de Asistencia.

No se puede instalar una extensión de JupyterLab de terceros

Problema

Si intentas instalar una extensión de JupyterLab de terceros, se mostrará un mensaje de Error: 500.

Solución

Las extensiones de JupyterLab de terceros no se admiten en instancias de cuadernos gestionados por usuarios.

Restaurar instancia

Problema

No se admite la restauración de una instancia de cuadernos gestionados por usuarios después de que se haya eliminado.

Solución

Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub o hacer una instantánea del disco.

Recuperar datos de una instancia

Problema

No se admite la recuperación de datos de una instancia de cuadernos gestionada por el usuario después de que se haya eliminado.

Solución

Para crear una copia de seguridad de los datos de tu instancia, puedes guardar tus cuadernos en GitHub o hacer una instantánea del disco.

No se puede aumentar la memoria compartida

Problema

No puedes aumentar la memoria compartida en una instancia de cuadernos gestionados por usuarios.

Solución

Sin embargo, puedes especificar un tamaño de memoria compartida al crear una instancia de cuaderno gestionado por el usuario mediante la clave de metadatos container-custom-params, con un valor como el siguiente:

--shm-size=SHARED_MEMORY_SIZE gb

Sustituye SHARED_MEMORY_SIZE por el tamaño que quieras en GB.

Procedimientos útiles

En esta sección se describen procedimientos que pueden resultarle útiles.

Usar SSH para conectarse a una instancia de cuadernos gestionados por usuarios

Usa SSH para conectarte a tu instancia escribiendo el siguiente comando en Cloud Shell o en cualquier entorno en el que esté instalada Google Cloud CLI.

gcloud compute ssh --project PROJECT_ID \
  --zone ZONE \
  INSTANCE_NAME -- -L 8080:localhost:8080

Haz los cambios siguientes:

  • PROJECT_ID: tu ID de proyecto
  • ZONE: la zona en la que se encuentra tu instancia Google Cloud
  • INSTANCE_NAME: el nombre de tu instancia

También puedes conectarte a tu instancia abriendo la página de detalles de Compute Engine y haciendo clic en el botón SSH.

Volver a registrarse en el servidor proxy inverso

Para volver a registrar la instancia de cuadernos gestionados por el usuario en el servidor proxy inverso interno, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a la instancia de cuadernos gestionados por el usuario e introducir lo siguiente:

cd /opt/deeplearning/bin
sudo ./attempt-register-vm-on-proxy.sh

Verificar el estado del servicio Docker

Para verificar el estado del servicio Docker, puedes usar SSH para conectarte a tu instancia de cuadernos gestionada por el usuario e introducir lo siguiente:

sudo service docker status

Verificar que el agente de proxy inverso se está ejecutando

Para verificar si el agente de proxy inverso del cuaderno está en ejecución, usa SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introduce lo siguiente:

# Confirm Inverting Proxy agent Docker container is running (proxy-agent)
sudo docker ps

# Verify State.Status is running and State.Running is true.
sudo docker inspect proxy-agent

# Grab logs
sudo docker logs proxy-agent

Verificar el estado del servicio Jupyter y recoger registros

Para verificar el estado del servicio Jupyter, puedes usar SSH para conectarte a tu instancia de cuadernos gestionados por usuarios e introducir lo siguiente:

sudo service jupyter status

Para recoger los registros del servicio Jupyter, sigue estos pasos:

sudo journalctl -u jupyter.service --no-pager

Verificar que la API interna de Jupyter esté activa

La API de Jupyter siempre debe ejecutarse en el puerto 8080. Para comprobarlo, inspecciona los registros del sistema de la instancia para ver si hay una entrada similar a la siguiente:

Jupyter Server ... running at:
http://localhost:8080

Para verificar que la API interna de Jupyter está activa, también puedes usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:

curl http://127.0.0.1:8080/api/kernelspecs

También puedes medir el tiempo que tarda la API en responder si las solicitudes tardan demasiado:

time curl -V http://127.0.0.1:8080/api/status
time curl -V http://127.0.0.1:8080/api/kernels
time curl -V http://127.0.0.1:8080/api/connections

Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.

Reiniciar el servicio Docker

Para reiniciar el servicio Docker, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:

sudo service docker restart

Reiniciar el agente de proxy inverso

Para reiniciar el agente de proxy inverso, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:

sudo docker restart proxy-agent

Reiniciar el servicio de Jupyter

Para reiniciar el servicio Jupyter, puedes detener e iniciar la VM desde la página Cuadernos gestionados por el usuario o usar SSH para conectarte a tu instancia de cuadernos gestionados por el usuario e introducir lo siguiente:

sudo service jupyter restart

Reiniciar el agente de recogida de cuadernos

El servicio del agente de recogida de cuadernos ejecuta un proceso de Python en segundo plano que verifica el estado de los servicios principales de la instancia de Vertex AI Workbench.

Para reiniciar el servicio del agente de recogida de cuadernos, puedes detener e iniciar la VM desde la Google Cloud consola o usar SSH para conectarte a tu instancia de Vertex AI Workbench e introducir lo siguiente:

sudo systemctl stop notebooks-collection-agent.service

seguido de:

sudo systemctl start notebooks-collection-agent.service

Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.

Modificar la secuencia de comandos del agente de colección de cuadernos

Para acceder al script y editarlo, abre una terminal en nuestra instancia o usa SSH para conectarte a tu instancia de Vertex AI Workbench e introduce lo siguiente:

nano /opt/deeplearning/bin/notebooks_collection_agent.py

Cuando hayas editado el archivo, guárdalo.

Después, debes reiniciar el servicio del agente de la colección Notebooks.

Verifica que la instancia pueda resolver los dominios DNS necesarios

Para verificar que la instancia puede resolver los dominios DNS necesarios, puedes usar SSH para conectarte a tu instancia de cuaderno gestionada por el usuario e introducir lo siguiente:

host notebooks.googleapis.com
host *.notebooks.cloud.google.com
host *.notebooks.googleusercontent.com
host *.kernels.googleusercontent.com

También puedes hacerlo de esta otra forma, si lo prefieres:

curl --silent --output /dev/null "https://notebooks.cloud.google.com"; echo $?

Si la instancia tiene habilitado Dataproc, puedes verificar que la instancia resuelve *.kernels.googleusercontent.com ejecutando lo siguiente:

curl --verbose -H "Authorization: Bearer $(gcloud auth print-access-token)" https://${PROJECT_NUMBER}-dot-${REGION}.kernels.googleusercontent.com/api/kernelspecs | jq .

Para ejecutar estos comandos en tu instancia de Vertex AI Workbench, abre JupyterLab y crea una nueva terminal.

Hacer una copia de los datos de usuario en una instancia

Para almacenar una copia de los datos de usuario de una instancia en Cloud Storage, sigue estos pasos.

Crear un segmento de Cloud Storage (opcional)

En el mismo proyecto en el que se encuentra tu instancia, crea un segmento de Cloud Storage en el que puedas almacenar tus datos de usuario. Si ya tienes un segmento de Cloud Storage, sáltate este paso.

  • Create a Cloud Storage bucket:
    gcloud storage buckets create gs://BUCKET_NAME
    Replace BUCKET_NAME with a bucket name that meets the bucket naming requirements.

    Copiar los datos de usuario

    1. En la interfaz de JupyterLab de tu instancia, selecciona Archivo > Nuevo > Terminal para abrir una ventana de terminal. En el caso de las instancias de notebooks gestionadas por el usuario, puedes conectarte al terminal de la instancia mediante SSH.

    2. Usa la CLI de gcloud para copiar tus datos de usuario en un segmento de Cloud Storage. El siguiente comando de ejemplo copia todos los archivos del directorio /home/jupyter/ de tu instancia en un directorio de un segmento de Cloud Storage.

      gcloud storage cp /home/jupyter/* gs://BUCKET_NAMEPATH --recursive
      

      Haz los cambios siguientes:

      • BUCKET_NAME: el nombre de tu segmento de Cloud Storage
      • PATH: la ruta al directorio en el que quieres copiar los archivos. Por ejemplo: /copy/jupyter/

    Investigar una instancia que se ha quedado bloqueada en el aprovisionamiento con gcpdiag

    gcpdiag es una herramienta de código abierto. No es un producto Google Cloud oficialmente compatible. Puedes usar la gcpdiag herramienta para identificar y solucionar Google Cloudproblemas de proyectos. Para obtener más información, consulta el proyecto gcpdiag en GitHub.

    Este gcpdiag manual de procedimientos investiga las posibles causas por las que una instancia de Vertex AI Workbench se queda bloqueada en el estado de aprovisionamiento, incluidas las siguientes áreas:
    • Estado: comprueba el estado actual de la instancia para asegurarse de que se ha quedado bloqueada en el aprovisionamiento y no está detenida ni activa.
    • Imagen del disco de arranque de la VM de Compute Engine de la instancia: comprueba si la instancia se ha creado con un contenedor personalizado, una imagen oficial de workbench-instances, imágenes de máquina virtual de aprendizaje profundo o imágenes no admitidas que pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
    • Secuencias de comandos personalizadas: comprueba si la instancia usa secuencias de comandos de inicio o posteriores al inicio personalizadas que cambian el puerto predeterminado de Jupyter o rompen dependencias que pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
    • Versión del entorno: comprueba si la instancia usa la versión más reciente del entorno comprobando si se puede actualizar. Las versiones anteriores pueden provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.
    • Rendimiento de la VM de Compute Engine de la instancia: comprueba el rendimiento actual de la VM para asegurarse de que no se vea afectado por un uso elevado de la CPU, una memoria insuficiente o problemas de espacio en disco que puedan interrumpir las operaciones normales.
    • Puerto serie de Compute Engine de la instancia o registro del sistema: comprueba si la instancia tiene registros del puerto serie, que se analizan para asegurarse de que Jupyter se ejecuta en el puerto 127.0.0.1:8080.
    • Acceso a la terminal y a SSH de Compute Engine de la instancia: comprueba si la VM de Compute Engine de la instancia está en ejecución para que el usuario pueda acceder a SSH y abrir una terminal para verificar que el uso del espacio en "home/jupyter" es inferior al 85%. Si no queda espacio, es posible que la instancia se quede atascada en el estado de aprovisionamiento.
    • IP externa desactivada: comprueba si el acceso a la IP externa está desactivado. Una configuración de red incorrecta puede provocar que la instancia se quede bloqueada en el estado de aprovisionamiento.

    Docker

    Puedes ejecutar gcpdiag mediante un envoltorio que inicie gcpdiag en un contenedor Docker. Debes tener instalado Docker o Podman.

    1. Copia y ejecuta el siguiente comando en tu estación de trabajo local.
      curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
    2. Ejecuta el comando gcpdiag.
      ./gcpdiag runbook vertex/workbench-instance-stuck-in-provisioning \
          --parameter project_id=PROJECT_ID \
          --parameter instance_name=INSTANCE_NAME \
          --parameter zone=ZONE

    Consulta los parámetros disponibles de este runbook.

    Haz los cambios siguientes:

    • PROJECT_ID: el ID del proyecto que contiene el recurso.
    • INSTANCE_NAME: nombre de la instancia de Vertex AI Workbench de destino de tu proyecto.
    • ZONE: la zona en la que se encuentra la instancia de Vertex AI Workbench de destino.

    Marcas útiles:

    Para ver una lista y una descripción de todas las marcas de la herramienta gcpdiag, consulta las gcpdiaginstrucciones de uso.

    Errores de permisos al usar roles de cuenta de servicio con Vertex AI

    Problema

    Se producen errores generales de permisos al usar roles de cuenta de servicio con Vertex AI.

    Estos errores pueden aparecer en Cloud Logging en los registros de componentes del producto o en los registros de auditoría. También pueden aparecer en cualquier combinación de los proyectos afectados.

    Estos problemas pueden deberse a uno o ambos de los siguientes motivos:

    • Uso del rol Service Account Token Creator cuando se debería haber usado el rol Service Account User, o viceversa. Estos roles conceden diferentes permisos en una cuenta de servicio y no son intercambiables. Para obtener información sobre las diferencias entre los roles Service Account Token Creator y Service Account User, consulta Roles de cuenta de servicio.

    • Has concedido permisos a una cuenta de servicio en varios proyectos, lo que no está permitido de forma predeterminada.

    Solución

    Para solucionar el problema, prueba una o varias de las siguientes opciones:

    • Determina si se necesita el rol Service Account Token Creator o Service Account User. Para obtener más información, consulta la documentación de gestión de identidades y accesos de los servicios de Vertex AI que estés usando, así como cualquier otra integración de producto que estés usando.

    • Si has concedido permisos a una cuenta de servicio en varios proyectos, habilita la opción para que las cuentas de servicio se puedan adjuntar en varios proyectos. Para ello, asegúrate de que iam.disableCrossProjectServiceAccountUsage. no se aplica. Para asegurarte de que iam.disableCrossProjectServiceAccountUsage no se aplica, ejecuta el siguiente comando:

      gcloud resource-manager org-policies disable-enforce \
        iam.disableCrossProjectServiceAccountUsage \
        --project=PROJECT_ID