Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Vertex AI propose des prédictions en ligne sur Google Distributed Cloud (GDC) air-gapped via l'API Online Prediction. Une prédiction est le résultat d'un modèle de machine learning entraîné. Plus précisément, les prédictions en ligne sont des requêtes synchrones adressées au point de terminaison de votre modèle.
La prédiction en ligne vous permet d'importer, de déployer, de diffuser et d'effectuer des requêtes à l'aide de vos propres modèles de prédiction sur un ensemble de conteneurs compatibles.
Utilisez la prédiction en ligne pour effectuer des requêtes en réponse à des entrées d'application ou dans des situations nécessitant une inférence rapide.
Vous pouvez utiliser l'API Online Prediction en appliquant des ressources personnalisées Kubernetes au cluster de prédiction dédié que votre opérateur d'infrastructure (IO) crée pour vous.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/16 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/07/16 (UTC)."],[[["Online Prediction is a Preview feature within Vertex AI on Google Distributed Cloud (GDC) air-gapped, designed for synchronous requests to trained machine-learning model endpoints, but not recommended for production environments."],["You can utilize Online Prediction to upload, deploy, serve, and request predictions from your own models using a set of specified containers."],["The Online Prediction API, accessed through Kubernetes custom resources, requires a dedicated prediction cluster set up by your Infrastructure Operator."],["Before using Online Prediction, you must export model artifacts and deploy the model to an endpoint, associating it with compute resources for low-latency predictions."],["Supported containers for Online Prediction in Distributed Cloud include TensorFlow (version 2.14 for both CPU and GPU) and PyTorch (version 2.1 for both CPU and GPU)."]]],[]]