O Flow Analyzer analisa os dados dos registros de fluxo de VPC armazenados em um formato de gravação. Os registros contêm campos básicos, que são os campos principais de cada registro, e campos de metadados, que fornecem mais informações. Os registros do de monitoramento de fluxos de tráfego consistem em três componentes principais:
- Informações do recurso
- Tipos de métricas
- Série temporal
Informações do recurso
Os registros incluem os seguintes dados sobre os recursos:
- Detalhes da conexão
- Dados do repórter
- Detalhes do GKE
- Detalhes da instância
- Detalhes geográficos
- Detalhes da VPC
Tipos de métricas
Os registros incluem dados dos seguintes tipos de métricas:
- Bytes enviados: contém informações sobre os volumes de payload e não inclui cabeçalhos. O valor dessa métrica pode ser zero porque alguns pacotes têm apenas cabeçalhos e não incluem payloads.
- Pacotes enviados:indica o número de pacotes enviados da origem. até o destino.
Dados brutos de séries temporais
A quantidade de dados brutos de métricas em uma única série temporal pode ser enorme, e geralmente há muitas séries temporais associadas a um tipo de métrica. Para analisar todo o conjunto de dados em busca de semelhanças, tendências ou valores atípicos, é necessário fazer algum processamento na série temporal do conjunto. Caso contrário, haverá muitos dados a serem considerar.
Para introduzir a amostragem e a agregação dos exemplos nesta página, use um pequeno número de séries temporais hipotéticas. Por exemplo, o diagrama a seguir mostra alguns minutos de dados brutos para o tipo de métrica bytes por segundo:
Os dados brutos de séries temporais precisam ser manipulados antes de serem analisados, e a análise geralmente envolve a amostragem dos dados e a agregação de alguns deles. Esta página descreve duas técnicas principais para refinar dados brutos:
- Amostragem, que remove alguns dados da consideração. O Google Cloud faz a amostragem e usa os dados necessários do registro para executar operações conforme indicado nas consultas.
- Agregação, que combina vários dados em um conjunto menor ao longo das dimensões especificadas.
A amostragem e a agregação são ferramentas poderosas para ajudar a identificar padrões interessantes e destacar tendências ou valores atípicos nos dados, entre outras informações.
Como entender o período de alinhamento
A primeira etapa na agregação de dados de série temporal é o alinhamento. Alinhamento cria uma nova série temporal na qual os dados brutos são regularizados no tempo para que e podem ser combinados com outrassérie temporals alinhadas. O alinhamento produz hora com dados regularmente espaçados.
O alinhamento envolve duas etapas:
- Dividir a série temporal em intervalos de tempo regulares, também chamados de agrupamento por classes dos dados. Esse intervalo é chamado de período de alinhamento.
- Calcular um único valor de métrica para os pontos no período de alinhamento. Você escolhe como esse ponto único é calculado. É possível somar todos os valores, calcular a média deles ou usar o valor máximo.
O diagrama a seguir mostra como o período de alinhamento é usado para agrupar os dados entre o horário de início e o horário de término.
O diagrama a seguir mostra o resultado do uso de um período de alinhamento de cinco minutos com as seguintes etapas:
- Criação de um período de alinhamento de cinco minutos.
- Calcular o valor de uma única métrica usando a soma dos valores da métrica dos dados brutos.
Granularidade
Se você sabe que algo aconteceu dentro de um período de alguns minutos e quer se aprofundar, é recomendável usar um período de um minuto para o alinhamento.
Se você estiver interessado em explorar tendências durante períodos mais longos, um maior período de alinhamento pode ser mais apropriado. Períodos de alinhamento grandes normalmente não são úteis para analisar condições anômalas de curto prazo, como picos curtos no tráfego. Se você usar, por exemplo, um período de alinhamento de várias semanas, a existência de uma anomalia nesse período ainda poderá ser detectada, mas os dados alinhados podem ser muito gerais para ajudar bastante.
Para períodos longos, um período de alinhamento menor não é útil. Para exemplo, se você selecionar um alinhamento de 1 minuto para um período de 30 dias, o Flow Analyzer gera mais de 43 mil pontos de dados. Como 43.000 pontos de dados é 10 vezes mais do que os pixels de exibição em 4K, não será possível ver todos os detalhes e algumas opções ficam desativadas por períodos longos.
Opções de alinhamento
As opções de alinhamento incluem somar os valores ou encontrar o máximo, o mínimo ou a média dos valores, encontrar um valor de percentil escolhido, contar os valores e outros. Com o Flow Analyzer, é possível usar várias agregações de métricas como as opções de alinhamento.
Se você selecionar Bytes enviados como o tipo de métrica e Origem e destino como a agregação de tráfego, as opções a seguir estarão disponíveis.
- Tráfego total
- Taxa de tráfego média
- Taxa de tráfego mediana
- Taxa de tráfego P95
- Taxa de tráfego máxima
Se você selecionar Pacotes enviados como o tipo de métrica e Origem e destino como a agregação de tráfego, as opções a seguir estarão disponíveis.
- Pacotes agregados
- Taxa de pacotes média
- Taxa de pacotes mediana
- Taxa de pacotes P95
- Taxa máxima de pacotes
O diagrama a seguir mostra o resultado do uso de duas opções de alinhamento de tráfego total e taxa de tráfego média.
Como usar o período de alinhamento
Você pode usar a opção Período de alinhamento para agregar os fluxos de tráfego em intervalos de tempo da duração selecionada. Você pode ampliar ainda mais o gráfico e consultar os detalhes específicos, se necessário.
A seguir
- Analisar fluxos de tráfego
- Ativar a Análise de dados de registros
- Configure um bucket central
- Executar testes de conectividade no Flow Analyzer
- Monitorar seus fluxos de tráfego
- Resolver problemas de dados no Flow Analyzer