L'analyseur de flux analyse les données des journaux de flux VPC stockées dans un format d'enregistrement. Les enregistrements de journal contiennent des champs de base, qui constituent les principaux champs de chaque enregistrement de journal, ainsi que des champs de métadonnées, qui fournissent plus d'informations. Les enregistrements de journal pour la surveillance des flux de trafic se composent de trois composants principaux:
- Informations sur la ressource
- Types de métriques
- Séries temporelles
Informations sur la ressource
Les enregistrements de journal incluent les données suivantes sur les ressources:
- Informations de connexion
- Données du signaleur
- Détails sur GKE
- Détails de l'instance
- Données géographiques
- Détails du VPC
Types de métriques
Les enregistrements de journal incluent les données des types de métriques suivants:
- Octets envoyés: contient des informations sur les volumes de charge utile et n'inclut pas les en-têtes. La valeur de cette métrique peut être nulle, car certains paquets ne comportent que des en-têtes et n'incluent aucune charge utile.
- Paquets envoyés:indique le nombre de paquets envoyés depuis la source vers la destination.
Données brutes de séries temporelles
La quantité de données brutes de métrique d'une série temporelle peut être considérable. Or, à un type de métrique donné sont généralement associées de nombreuses séries temporelles. Pour analyser l'ensemble de données complet afin de rechercher les similarités, les tendances ou les anomalies, vous devez effectuer un traitement sur les séries temporelles qu'il contient. Sans quoi il y aurait trop de données à prendre en compte.
Pour illustrer les notions d'échantillonnage et d'agrégation des exemples de cette page, utilisez un petit nombre de séries temporelles fictives. Par exemple, le diagramme suivant montre quelques minutes de données brutes pour le type de métrique octets par seconde:
Les données de séries temporelles brutes doivent être manipulées avant d'être analysées. L'analyse implique souvent d'échantillonner les données et de les agréger. Cette page décrit deux techniques principales pour affiner les données brutes:
- L'échantillonnage, qui supprime certaines données à ne pas prendre en compte. Google Cloud effectue l'échantillonnage et utilise les données requises des enregistrements de journal pour effectuer les opérations indiquées dans les requêtes.
- L'agrégation, qui combine plusieurs éléments de données en un ensemble plus petit le long des dimensions que vous spécifiez.
L'échantillonnage et l'agrégation sont des outils puissants qui aident à identifier des modèles intéressants, et à mettre en évidence les tendances ou les anomalies dans les données, entre autres.
Comprendre la durée de l'alignement
La première étape de l'agrégation des données de séries temporelles est l'alignement. L'alignement crée une nouvelle série temporelle dans laquelle les données brutes sont régularisées dans le temps afin d'être combinées avec d'autres séries temporelles alignées. L'alignement génère des séries temporelles avec des données régulièrement espacées.
L'alignement comprend deux étapes :
- Diviser la série temporelle en intervalles de temps réguliers, également appelés binning des données. L'intervalle est appelé période d'alignement.
- Calculer une seule valeur de métrique pour les points de la période d'alignement. Vous choisissez le mode de calcul de ce point unique, en additionnant toutes les valeurs, en calculant la moyenne ou en utilisant la valeur maximale.
Le diagramme suivant montre comment la période d'alignement est utilisée pour regrouper les données entre l'heure de début et l'heure de fin.
Le schéma suivant montre le résultat de l'utilisation d'une période d'alignement de cinq minutes avec les étapes suivantes:
- Création d'une période d'alignement d'une durée de cinq minutes.
- Calcul de la valeur unique de la métrique à l'aide de la somme des valeurs de la métrique à partir des données brutes.
Précision
Si vous savez qu'un événement s'est produit en quelques minutes et que vous souhaitez approfondir la question, vous pouvez utiliser une période d'une minute pour l'alignement.
Si vous souhaitez explorer les tendances sur des périodes plus longues, il peut être judicieux de choisir une période d'alignement plus longue. Les longues périodes d'alignement ne sont généralement pas adéquates pour examiner des anomalies transitoires, telles que de courtes pointes de trafic. Par exemple, si vous utilisez une période d'alignement longue de plusieurs semaines, vous pourrez sans doute détecter si une anomalie est survenue au cours d'une période, mais les données alignées ne pourront probablement pas vous en apprendre davantage car elles manquent de précision.
Pour de longues durées, une période d'alignement plus courte n'est pas utile. Par exemple, si vous sélectionnez un alignement d'une minute sur une période de 30 jours, l'outil d'analyse des flux génère plus de 43 000 points de données. Étant donné que 43 000 points de données représentent 10 fois plus de pixels que l'écran 4K, vous ne pouvez pas afficher tous les détails et certaines options sont désactivées pour de longues durées.
Options d'alignement
Les options d'alignement incluent sommer les valeurs, trouver la valeur maximale, minimale ou moyenne de ces valeurs, rechercher une valeur de centile choisie, compter les valeurs, etc. Avec Flow Analyzer, vous pouvez utiliser différentes agrégations de métriques comme options d'alignement.
Si vous sélectionnez Octets envoyés comme type de métrique et Source et destination comme agrégation du trafic, les options suivantes sont disponibles.
- Trafic total
- Taux moyen de trafic
- Taux médian de trafic
- Taux de trafic au 95e centile
- Taux de trafic maximal
Si vous sélectionnez Paquets envoyés comme type de métrique et Source et destination comme agrégation du trafic, les options suivantes sont disponibles.
- Total de paquets
- Taux moyen de paquets
- Taux médian de paquets
- Taux de paquets au 95e centile
- Taux maximal de paquets
Le diagramme suivant montre le résultat de l'utilisation de deux options d'alignement : trafic total et taux de trafic moyen.
Utiliser la période d'alignement
Vous pouvez utiliser l'option Période d'alignement pour agréger les flux de trafic en intervalles de temps de la durée sélectionnée. Vous pouvez effectuer un zoom avant sur le graphique et consulter les détails spécifiques, si nécessaire.
Étape suivante
- Analyser les flux de trafic
- Activer l'Analyse de journaux
- Configurer un bucket central
- Lancer des tests de connectivité depuis l'analyseur de flux
- Surveiller vos flux de trafic
- Résoudre les problèmes liés aux données dans Flow Analyzer