Utiliser la déduplication dans la recherche et les tableaux de bord
Ce document explique ce qui se passe lorsque vous recherchez des données dans Google Security Operations. Il peut arriver que les résultats incluent des doublons. Cela se produit souvent parce que l'infrastructure d'entreprise génère des journaux pour le même événement à partir de plusieurs systèmes. Par exemple, vos systèmes d'authentification et de sécurité peuvent tous deux consigner un même événement de connexion.
Pour réduire les résultats en double, utilisez les champs UDM dans la section dedup
de votre syntaxe YARA-L. Ajoutez des champs UDM à cette section pour renvoyer un seul résultat pour chaque combinaison distincte de valeurs. .
Déduplication dans les requêtes
La déduplication s'applique aux types de requêtes de recherche et de tableau de bord suivants :
Requêtes de recherche agrégées : incluent les sections
match
,match
etoutcome
, ouaggregated outcome
. La déduplication a lieu une fois les résultats déterminés.Pour les requêtes de recherche agrégées, incluez les champs suivants dans la section
dedup
:- Champs de la section
match
- Champs de la section
outcome
- Champs de la section
Requêtes de recherche UDM : excluez les sections
match
,outcome
ouaggregated outcome
. Notez que les requêtes de recherche UDM peuvent inclure une sectionoutcome
tant qu'il n'y a pas d'agrégats ni de sectionmatch
.Pour les requêtes UDM, ajoutez les champs suivants à la section
dedup
:- Tous les champs d'événement non répétés, non matriciels et non groupés
- Champs d'espace réservé de la section
events
- Variables de résultat de la section
outcome
Exemples de déduplication dans la recherche
Cette section présente la syntaxe YARA-L et peut être exécutée dans Recherche.
Exemple : Recherche simple d'adresses IP uniques
L'exemple de recherche suivant affiche les connexions réseau entre les événements où une adresse IP unique de votre entreprise (principal.ip
) se connecte à une adresse IP externe unique en dehors de votre entreprise (target.ip
). Les événements sont dédupliqués en fonction de principal.ip
.
events:
metadata.event_type = "NETWORK_CONNECTION"
target.ip != ""
principal.ip != ""
match:
target.ip, principal.ip
dedup:
principal.ip
Exemple : Adresses IP uniques
Comme dans l'exemple précédent, la requête de recherche suivante affiche les événements de connexion réseau avec des adresses IP uniques. L'application de dedup
à principal.ip
permet de limiter les résultats aux événements associés à des adresses IP uniques. La section outcome
affiche le nombre total d'octets envoyés entre principal.ip
et target.ip
, en classant les résultats du volume de trafic le plus élevé au plus faible.
events:
metadata.event_type = "NETWORK_CONNECTION"
target.ip != ""
principal.ip != ""
match:
target.ip, principal.ip
outcome:
$total_bytes = sum(network.sent_bytes)
dedup:
principal.ip
order:
$total_bytes desc
Exemple : Recherche simple de noms d'hôte uniques
L'exemple suivant recherche chaque nom d'hôte unique auquel votre entreprise a accédé. L'application de dedup
à target.hostname
permet de limiter les résultats aux événements associés à des noms d'hôte externes uniques.
metadata.log_type != ""
dedup:
target.hostname
Voici un exemple équivalent sans l'option dedup
. Il renvoie généralement beaucoup plus d'événements.
metadata.log_type != "" AND target.hostname != ""
Exemple : Noms d'hôte uniques
Comme dans l'exemple précédent, cette recherche affiche les événements de connexion réseau avec des noms d'hôte uniques. L'application de l'option dedup
à principal.hostname
permet de limiter les résultats aux événements associés à des hôtes uniques :
events:
metadata.event_type = "NETWORK_CONNECTION"
target.hostname != ""
principal.hostname != ""
match:
target.hostname, principal.hostname
outcome:
$total_bytes = sum(network.sent_bytes)
dedup:
principal.hostname
order:
$total_bytes desc
Vous avez encore besoin d'aide ? Obtenez des réponses de membres de la communauté et de professionnels Google SecOps.