Gemini pour Google Cloud et l'IA responsable

Ce document décrit la conception de Gemini pour Google Cloud en fonction des fonctionnalités, des limites et des risques associés à l'IA générative.

Capacités et risques des grands modèles de langage

Les grands modèles de langage (LLM) peuvent effectuer de nombreuses tâches utiles, par exemple:

  • Traduire la langue.
  • Résumer du texte
  • Générer du code et écrire de manière créative
  • Alimentez les chatbots et les assistants virtuels.
  • Compléter les moteurs de recherche et les systèmes de recommandation

Parallèlement, les capacités techniques en constante évolution des LLM peuvent être sujettes à une mauvaise application, une utilisation abusive et des conséquences inattendues ou imprévues.

Les LLM peuvent générer des résultats inattendus, y compris du texte offensant, insensible ou incorrect. Étant donné que les LLM sont incroyablement polyvalents, il peut être difficile de prédire exactement les types de résultats involontaires ou imprévus qu'ils pourraient produire.

Compte tenu de ces risques et de ces complexités, Gemini pour Google Cloud est conçu en tenant compte des principes de l'IA de Google. Toutefois, il est important que les utilisateurs comprennent certaines des limites de Gemini pour Google Cloud afin de travailler de manière sécurisée et responsable.

Limites de Gemini pour Google Cloud

Voici quelques-unes des limites que vous pouvez rencontrer lorsque vous utilisez Gemini pour Google Cloud (liste non exhaustive) :

  • Cas particuliers Les cas particuliers font référence à des situations inhabituelles, rares ou exceptionnelles qui ne sont pas bien représentées dans les données d'entraînement. Ces cas peuvent entraîner des limites dans la sortie des modèles Gemini, telles qu'une confiance excessive du modèle, une mauvaise interprétation du contexte ou des sorties inappropriées.

  • Modéliser les hallucinations, l'ancrage et la factualité Les modèles Gemini peuvent manquer de base et de factualité dans les connaissances réelles, les propriétés physiques ou la compréhension précise. Cette limitation peut conduire à des blocages du modèle, c'est-à-dire des instances dans lesquelles des résultats peuvent être générés de manière cohérente, mais statistiquement incorrecte, non pertinente, inappropriée ou absurde. Les hallucinations peuvent également inclure la création de liens vers des pages Web qui n'existent pas et n'ont jamais existé. Pour en savoir plus, consultez la section Rédiger de meilleures requêtes pour Gemini pour Google Cloud.

  • Qualité et réglage des données La qualité, la précision et le biais des données de requête saisies dans les produits Gemini pour Google Cloud peuvent avoir un impact significatif sur ses performances. Si les utilisateurs saisissent des requêtes inexactes ou incorrectes, Gemini pour Google Cloud peut renvoyer des réponses non optimales ou fausses.

  • Amplification des biais Les modèles de langage peuvent amplifier par inadvertance les biais existants dans leurs données d'entraînement, ce qui peut se traduire par un renforcement supplémentaire des préjugés sociétaux et du traitement inégal de certains groupes.

  • Qualité de la langue Bien que Gemini pour Google Cloud offre des fonctionnalités multilingues impressionnantes sur les benchmarks que nous avons évalués, la majorité de nos benchmarks (y compris toutes les évaluations de l'équité) sont en anglais américain.

    Les modèles de langage peuvent fournir une qualité de service incohérente à différents utilisateurs. Par exemple, la génération de texte peut ne pas être aussi efficace pour certains dialectes ou variantes de langues, car ils sont sous-représentés dans les données d'entraînement. Les performances peuvent être inférieures pour les langues autres que l'anglais ou pour les langues anglaises moins représentées.

  • Benchmarks et sous-groupes d'équité Les analyses d'équité des modèles Gemini de Google Research ne fournissent pas un compte exhaustif des différents risques potentiels. Par exemple, nous nous concentrons sur les biais en fonction du genre, de l'origine ethnique, de la philosophie et de la culture, mais nous n'effectuons l'analyse que sur les données en anglais américain et les résultats du modèle.

  • Expertise limitée dans le domaine. Les modèles Gemini ont été entraînés sur la technologie Google Cloud, mais ils peuvent ne pas posséder les connaissances nécessaires pour fournir des réponses précises et détaillées sur des sujets hautement spécialisés ou techniques, ce qui entraîne des informations fictives ou incorrectes.

    Lorsque vous utilisez le volet Gemini dans la console Google Cloud, Gemini n'est pas conscient du contexte de votre environnement spécifique. Il ne peut donc pas répondre à des questions telles que "Quand ai-je créé une VM pour la dernière fois ?".

    Dans certains cas, Gemini pour Google Cloud envoie un segment spécifique de votre contexte au modèle pour recevoir une réponse spécifique au contexte (par exemple, lorsque vous cliquez sur le bouton Suggestions de dépannage sur la page du service Error Reporting).

Filtrage de sécurité et de toxicité Gemini

Les requêtes et les réponses de Gemini pour Google Cloud sont comparées à une liste complète d'attributs de sécurité, le cas échéant, pour chaque cas d'utilisation. Ces attributs de sécurité visent à filtrer les contenus qui enfreignent notre Politique d'utilisation autorisée. Si une sortie est considérée comme dangereuse, la réponse est bloquée.

Étape suivante