Visão geral das anomalias nas operações

Esta página se aplica à Apigee e à Apigee híbrida.

Confira a documentação da Apigee Edge.

Visão geral das anomalias nas operações?

As operações de anomalias identificam padrões de dados de API incomuns ou inesperados nas suas APIs, com base em padrões de dados recentes. Por exemplo: neste gráfico da taxa de erros da API, ela aumenta subitamente por volta das 7h. Comparado aos dados que levaram a esse período, esse aumento é incomum o suficiente para ser classificado como uma anomalia.

Gráfico de uma anomalia na taxa de erros.

Nem todas as variações nos dados da API representam anomalias: a maioria são flutuações aleatórias. Por exemplo, você pode ver algumas pequenas variações na taxa de erros que levou à anomalia, mas isso não é significativo o suficiente para ser categorizado como anomalia.

Anomalias em comparação com variações de dados aleatórias.

As anamalias nas operações monitoram continuamente os dados da API e realizam análises estatísticas para diferenciar anomalias reais de flutuações aleatórias nos dados.

As anomalias de operações detectam automaticamente estes tipos de anomalia:

  • Aumento nos erros HTTP 503 para organização, ambiente e região
  • Aumento nos erros HTTP 504 no nível da organização, do ambiente e da região
  • Aumento de todos os erros HTTP 4xx ou 5xx nos níveis de organização, ambiente e região
  • Aumento da latência total da resposta para o 90o percentil (p90) no nível da organização, do ambiente e da região

Uma anomalia detectada inclui estas informações:

  • A métrica que causou a anomalia, como a latência de proxy ou um código de erro HTTP.
  • A gravidade da anomalia. A gravidade pode ser leve, moderada ou grave, com base no nível de confiança no modelo. Um nível de confiança baixo indica que a gravidade é leve, enquanto um alto nível de confiança indica que ela é grave.

Pré-requisitos para usar as anomalias nas operações

Para usar anomalias de operações:

Conferir as anomalias nas operações detectadas

Quando as anomalias de operações detectam uma anomalia, elas mostram os detalhes dela no Painel de anomalias de operações. É possível investigar a anomalia nos painéis de monitoramento da API e tomar as medidas apropriadas, se necessário. Também é possível criar um alerta para notificar você caso eventos semelhantes ocorram no futuro.

O painel "Anomalias operacionais" na interface da Apigee é a principal fonte de informações sobre as anomalias operacionais detectadas. O painel exibe uma lista de anomalias recentes.

Para abrir o painel "Anomalias operacionais":

  1. Faça login na interface da Apigee no console do Cloud.
  2. Alterne para a organização que você quer monitorar.
  3. No menu à esquerda, selecione Analytics > Anomalias de operações.

O painel de anomalias de operações será exibido.

Conferir anomalias no painel "Anomalias nas operações"

Por padrão, o painel mostra anomalias que ocorreram na hora anterior. Se nenhuma anomalia for detectada durante esse período, nenhuma linha será exibida no painel. É possível selecionar um período maior no menu de intervalo de tempo no canto superior direito do painel.

Conferir anomalias no painel "Anomalias nas operações"

Cada linha na tabela corresponde a uma anomalia detectada e exibe as seguintes informações:

  • A data e hora da anomalia.
  • Um breve resumo da anomalia, incluindo o proxy em que ocorreu e o código da falha que a acionou.
  • O ambiente em que a anomalia ocorreu.
  • A região em que a anomalia ocorreu.
  • A gravidade do evento da anomalia: leve, moderada ou grave. A gravidade é baseada em uma medida estatística (valor p) da chance do evento ocorrer por probabilidade (quanto mais improvável o evento, maior a gravidade).

Você também pode investigar uma anomalia nos painéis de monitoramento da API, que mostram vários gráficos de dados recentes de tráfego da API.

Como funciona a detecção de anomalias

A detecção de anomalias envolve as seguintes etapas:

Treinar modelos

As anomalias de operações funcionam com o treinamento de um modelo do comportamento dos proxies de API com base em dados históricos de séries temporais. Nenhuma ação é necessária de sua parte para treinar o modelo. A Apigee cria e treina modelos automaticamente para você com base nas seis horas anteriores de dados da API. Portanto, a Apigee requer no mínimo seis horas de dados em um proxy de API para treinar o modelo antes de registrar uma anomalia.

O objetivo do treinamento é melhorar a precisão do modelo, que pode ser testada em dados históricos. A maneira mais simples de testar a precisão de um modelo é calcular a taxa de erros, que é a soma dos falsos positivos e falsos negativos, dividida pelo número total de eventos previstos.

Registrar eventos de anomalias

No ambiente de execução, a Operations Anomalies compara o comportamento atual dos seus proxies de API com o comportamento previsto pelo modelo. As anomalias operacionais podem determinar, com um nível de confiança específico, quando uma métrica operacional está excedendo o valor previsto. Por exemplo, quando a taxa de erros 5xx excede a taxa prevista pelo modelo.

Quando a Apigee detecta uma anomalia, ela registra automaticamente o evento no Painel de anomalias de operações. A lista de eventos exibidos no painel inclui todas as anomalias detectadas, além de alertas acionados.