Esta página se ha traducido con Cloud Translation API.

Recopilar registros de Censys

Disponible en:

SecOps de Google SIEM

En este documento se explica cómo ingerir registros de Censys en Google Security Operations mediante Amazon S3. Censys ofrece una gestión integral de la superficie de ataque e inteligencia de Internet a través de su API. Esta integración te permite recoger eventos de descubrimiento de hosts, eventos de riesgo y cambios en los recursos de Censys ASM y reenviarlos a Google SecOps para analizarlos y monitorizarlos. El analizador transforma los registros sin procesar en un formato estructurado conforme al UDM de Google SecOps. Extrae campos del mensaje de registro sin procesar, convierte los tipos de datos y asigna la información extraída a los campos de UDM correspondientes, lo que enriquece los datos con contexto y etiquetas adicionales.

Antes de empezar

Asegúrate de que cumples los siguientes requisitos previos:

Instancia de Google SecOps
Acceso privilegiado a Censys ASM
Acceso privilegiado a AWS (S3, IAM, Lambda y EventBridge)

Recoger los requisitos previos de Censys (credenciales de API)

Inicia sesión en la consola de Censys ASM en app.censys.io.
Ve a Integraciones, en la parte superior de la página.
Copia y guarda los valores de API Key (Clave de API) y Organization ID (ID de organización).
Anota la URL base de la API: https://api.platform.censys.io.

Configurar un segmento de AWS S3 y IAM para Google SecOps

Crea un segmento de Amazon S3 siguiendo esta guía de usuario: Crear un segmento.
Guarda el nombre y la región del segmento para consultarlos más adelante (por ejemplo, censys-logs).
Crea un usuario siguiendo esta guía: Crear un usuario de gestión de identidades y accesos.
Selecciona el Usuario creado.
Selecciona la pestaña Credenciales de seguridad.
En la sección Claves de acceso, haz clic en Crear clave de acceso.
Selecciona Servicio de terceros como Caso práctico.
Haz clic en Siguiente.
Opcional: añade una etiqueta de descripción.
Haz clic en Crear clave de acceso.
Haz clic en Descargar archivo CSV para guardar la clave de acceso y la clave de acceso secreta para usarlas más adelante.
Haz clic en Listo.
Selecciona la pestaña Permisos.
En la sección Políticas de permisos, haz clic en Añadir permisos.
Selecciona Añadir permisos.
Seleccione Adjuntar políticas directamente.
Busca y selecciona la política AmazonS3FullAccess.
Haz clic en Siguiente.
Haz clic en Añadir permisos.

Configurar la política y el rol de gestión de identidades y accesos para las subidas de S3

En la consola de AWS, vaya a IAM > Policies > Create policy > JSON tab (IAM > Políticas > Crear política > pestaña JSON).

Introduce la siguiente política:

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "AllowPutObjects",
      "Effect": "Allow",
      "Action": "s3:PutObject",
      "Resource": "arn:aws:s3:::censys-logs/*"
    },
    {
      "Sid": "AllowGetStateObject",
      "Effect": "Allow",
      "Action": "s3:GetObject",
      "Resource": "arn:aws:s3:::censys-logs/censys/state.json"
    }
  ]
}

Sustituye censys-logs si has introducido otro nombre de segmento.

Haz clic en Siguiente > Crear política.
Ve a IAM > Roles > Crear rol > Servicio de AWS > Lambda.
Adjunta la política que acabas de crear y la política gestionada AWSLambdaBasicExecutionRole (para acceder a los registros de CloudWatch).
Dale el nombre censys-lambda-role al rol y haz clic en Crear rol.

Crear la función Lambda

En la consola de AWS, ve a Lambda > Funciones > Crear función.
Haz clic en Crear desde cero.
Proporciona los siguientes detalles de configuración:

Ajuste	Valor
Nombre	`censys-data-collector`
Tiempo de ejecución	Python 3.13
Arquitectura	x86_64
Rol de ejecución	`censys-lambda-role`

Una vez creada la función, abra la pestaña Código, elimine el stub e introduzca el siguiente código (censys-data-collector.py):

import json
import boto3
import urllib3
import gzip
import logging
import os
from datetime import datetime, timedelta, timezone
from typing import Dict, List, Any, Optional
from urllib.parse import urlencode

# Configure logging
logger = logging.getLogger()
logger.setLevel(logging.INFO)

# AWS S3 client
s3_client = boto3.client('s3')
# HTTP client
http = urllib3.PoolManager()

# Environment variables
S3_BUCKET = os.environ['S3_BUCKET']
S3_PREFIX = os.environ['S3_PREFIX']
STATE_KEY = os.environ['STATE_KEY']
CENSYS_API_KEY = os.environ['CENSYS_API_KEY']
CENSYS_ORG_ID = os.environ['CENSYS_ORG_ID']
API_BASE = os.environ.get('API_BASE', 'https://api.platform.censys.io')

class CensysCollector:
    def __init__(self):
        self.headers = {
            'Authorization': f'Bearer {CENSYS_API_KEY}',
            'X-Organization-ID': CENSYS_ORG_ID,
            'Content-Type': 'application/json'
        }

    def get_last_collection_time(self) -> Optional[datetime]:
        """Get the last collection timestamp from S3 state file."""
        try:
            response = s3_client.get_object(Bucket=S3_BUCKET, Key=STATE_KEY)
            state = json.loads(response['Body'].read().decode('utf-8'))
            return datetime.fromisoformat(state.get('last_collection_time', '2024-01-01T00:00:00Z'))
        except Exception as e:
            logger.info(f"No state file found or error reading state: {e}")
            return datetime.now(timezone.utc) - timedelta(hours=1)

    def save_collection_time(self, collection_time: datetime):
        """Save the current collection timestamp to S3 state file."""
        state = {'last_collection_time': collection_time.strftime('%Y-%m-%dT%H:%M:%SZ')}
        s3_client.put_object(
            Bucket=S3_BUCKET,
            Key=STATE_KEY,
            Body=json.dumps(state),
            ContentType='application/json'
        )

    def collect_logbook_events(self, cursor: str = None) -> List[Dict[str, Any]]:
        """Collect logbook events from Censys ASM API using cursor-based pagination."""
        events = []
        url = f"{API_BASE}/v3/logbook"

        # Use cursor-based pagination as per Censys API documentation
        params = {}
        if cursor:
            params['cursor'] = cursor

        try:
            query_string = urlencode(params) if params else ''
            full_url = f"{url}?{query_string}" if query_string else url

            response = http.request('GET', full_url, headers=self.headers)

            if response.status != 200:
                logger.error(f"API request failed with status {response.status}: {response.data}")
                return []

            data = json.loads(response.data.decode('utf-8'))
            events.extend(data.get('logbook_entries', []))

            # Handle cursor-based pagination
            next_cursor = data.get('next_cursor')
            if next_cursor:
                events.extend(self.collect_logbook_events(next_cursor))

            logger.info(f"Collected {len(events)} logbook events")
            return events

        except Exception as e:
            logger.error(f"Error collecting logbook events: {e}")
            return []

    def collect_risks_events(self) -> List[Dict[str, Any]]:
        """Collect risk events from Censys ASM API."""
        events = []
        url = f"{API_BASE}/v3/risks"

        try:
            response = http.request('GET', url, headers=self.headers)

            if response.status != 200:
                logger.error(f"API request failed with status {response.status}: {response.data}")
                return []

            data = json.loads(response.data.decode('utf-8'))
            events.extend(data.get('risks', []))

            logger.info(f"Collected {len(events)} risk events")
            return events

        except Exception as e:
            logger.error(f"Error collecting risk events: {e}")
            return []

    def save_events_to_s3(self, events: List[Dict[str, Any]], event_type: str):
        """Save events to S3 in compressed NDJSON format."""
        if not events:
            return

        timestamp = datetime.now(timezone.utc).strftime('%Y%m%d_%H%M%S')
        filename = f"{S3_PREFIX}{event_type}_{timestamp}.json.gz"

        try:
            # Convert events to newline-delimited JSON
            ndjson_content = 'n'.join(json.dumps(event, separators=(',', ':')) for event in events)

            # Compress with gzip
            gz_bytes = gzip.compress(ndjson_content.encode('utf-8'))

            s3_client.put_object(
                Bucket=S3_BUCKET,
                Key=filename,
                Body=gz_bytes,
                ContentType='application/gzip',
                ContentEncoding='gzip'
            )

            logger.info(f"Saved {len(events)} {event_type} events to {filename}")

        except Exception as e:
            logger.error(f"Error saving {event_type} events to S3: {e}")
            raise

def lambda_handler(event, context):
    """AWS Lambda handler function."""
    try:
        collector = CensysCollector()

        # Get last collection time for cursor state management
        last_collection_time = collector.get_last_collection_time()
        current_time = datetime.now(timezone.utc)

        logger.info(f"Collecting events since {last_collection_time}")

        # Collect different types of events
        logbook_events = collector.collect_logbook_events()
        risk_events = collector.collect_risks_events()

        # Save events to S3
        collector.save_events_to_s3(logbook_events, 'logbook')
        collector.save_events_to_s3(risk_events, 'risks')

        # Update state
        collector.save_collection_time(current_time)

        return {
            'statusCode': 200,
            'body': json.dumps({
                'message': 'Censys data collection completed successfully',
                'logbook_events': len(logbook_events),
                'risk_events': len(risk_events),
                'collection_time': current_time.strftime('%Y-%m-%dT%H:%M:%SZ')
            })
        }

    except Exception as e:
        logger.error(f"Lambda execution failed: {str(e)}")
        return {
            'statusCode': 500,
            'body': json.dumps({
                'error': str(e)
            })
        }

Ve a Configuración > Variables de entorno > Editar > Añadir nueva variable de entorno.

Introduce las siguientes variables de entorno y sustituye los valores por los tuyos:

Clave	Valor de ejemplo
`S3_BUCKET`	`censys-logs`
`S3_PREFIX`	`censys/`
`STATE_KEY`	`censys/state.json`
`CENSYS_API_KEY`	`<your-censys-api-key>`
`CENSYS_ORG_ID`	`<your-organization-id>`
`API_BASE`	`https://api.platform.censys.io`

Una vez creada la función, permanece en su página (o abre Lambda > Funciones > tu-función).
Seleccione la pestaña Configuración.
En el panel Configuración general, haz clic en Editar.
Cambia Tiempo de espera a 5 minutos (300 segundos) y haz clic en Guardar.

Crear una programación de EventBridge

Ve a Amazon EventBridge > Scheduler > Create schedule (Amazon EventBridge > Programador > Crear programación).
Proporcione los siguientes detalles de configuración:
- Programación periódica: Precio (1 hour).
- Destino: tu función Lambda censys-data-collector.
- Nombre: censys-data-collector-1h.
Haz clic en Crear programación.

Opcional: Crear un usuario y claves de gestión de identidades y accesos de solo lectura para Google SecOps

En la consola de AWS, ve a IAM > Usuarios > Añadir usuarios.
Haz clic en Add users (Añadir usuarios).
Proporcione los siguientes detalles de configuración:
- Usuario: secops-reader.
- Tipo de acceso: Clave de acceso (acceso programático).
Haz clic en Crear usuario.
Asigna una política de lectura mínima (personalizada): Usuarios > secops-reader > Permisos > Añadir permisos > Asignar políticas directamente > Crear política.

En el editor de JSON, introduce la siguiente política:

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": ["s3:GetObject"],
      "Resource": "arn:aws:s3:::censys-logs/*"
    },
    {
      "Effect": "Allow",
      "Action": ["s3:ListBucket"],
      "Resource": "arn:aws:s3:::censys-logs"
    }
  ]
}

Asigna el nombre secops-reader-policy.
Ve a Crear política > busca o selecciona > Siguiente > Añadir permisos.
Ve a Credenciales de seguridad > Claves de acceso > Crear clave de acceso.
Descarga el archivo CSV (estos valores se introducen en el feed).

Configurar un feed en Google SecOps para ingerir registros de Censys

Ve a Configuración de SIEM > Feeds.
Haz clic en + Añadir nuevo feed.
En el campo Nombre del feed, introduce un nombre para el feed (por ejemplo, Censys logs).
Selecciona Amazon S3 V2 como Tipo de fuente.
Seleccione CENSYS como Tipo de registro.
Haz clic en Siguiente.
Especifique los valores de los siguientes parámetros de entrada:
- URI de S3: s3://censys-logs/censys/
- Opciones de eliminación de la fuente: selecciona la opción de eliminación que prefieras.
- Antigüedad máxima del archivo: incluye los archivos modificados en los últimos días. El valor predeterminado es 180 días.
- ID de clave de acceso: clave de acceso de usuario con acceso al bucket de S3.
- Clave de acceso secreta: clave secreta del usuario con acceso al bucket de S3.
- Espacio de nombres de recursos: el espacio de nombres de recursos.
- Etiquetas de ingestión: la etiqueta aplicada a los eventos de este feed.
Haz clic en Siguiente.
Revise la configuración de la nueva fuente en la pantalla Finalizar y, a continuación, haga clic en Enviar.

Tabla de asignación de UDM

Campo de registro	Asignación de UDM	Lógica
assetId	read_only_udm.principal.asset.hostname	Si el campo assetId no es una dirección IP, se asigna a principal.asset.hostname.
assetId	read_only_udm.principal.asset.ip	Si el campo assetId es una dirección IP, se asigna a principal.asset.ip.
assetId	read_only_udm.principal.hostname	Si el campo assetId no es una dirección IP, se asigna a principal.hostname.
assetId	read_only_udm.principal.ip	Si el campo assetId es una dirección IP, se asigna a principal.ip.
associatedAt	read_only_udm.security_result.detection_fields.value	El campo associatedAt se asigna a security_result.detection_fields.value.
autonomousSystem.asn	read_only_udm.additional.fields.value.string_value	El campo autonomousSystem.asn se convierte en una cadena y se asigna a additional.fields.value.string_value con la clave "autonomousSystem_asn".
autonomousSystem.bgpPrefix	read_only_udm.additional.fields.value.string_value	El campo autonomousSystem.bgpPrefix se asigna a additional.fields.value.string_value con la clave "autonomousSystem_bgpPrefix".
banner	read_only_udm.principal.resource.attribute.labels.value	El campo de banner se asigna a principal.resource.attribute.labels.value con la clave "banner".
nube	read_only_udm.metadata.vendor_name	El campo de nube se asigna a metadata.vendor_name.
comments.refUrl	read_only_udm.network.http.referral_url	El campo comments.refUrl se asigna a network.http.referral_url.
data.cve	read_only_udm.additional.fields.value.string_value	El campo data.cve se asigna a additional.fields.value.string_value con la clave "data_cve".
data.cvss	read_only_udm.additional.fields.value.string_value	El campo data.cvss se asigna a additional.fields.value.string_value con la clave "data_cvss".
data.ipAddress	read_only_udm.principal.asset.ip	Si el campo data.ipAddress no es igual al campo assetId, se asigna a principal.asset.ip.
data.ipAddress	read_only_udm.principal.ip	Si el campo data.ipAddress no es igual al campo assetId, se asigna a principal.ip.
data.location.city	read_only_udm.principal.location.city	Si el campo location.city está vacío, el campo data.location.city se asigna a principal.location.city.
data.location.countryCode	read_only_udm.principal.location.country_or_region	Si el campo location.country está vacío, el campo data.location.countryCode se asigna a principal.location.country_or_region.
data.location.latitude	read_only_udm.principal.location.region_coordinates.latitude	Si los campos location.coordinates.latitude y location.geoCoordinates.latitude están vacíos, el campo data.location.latitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.latitude.
data.location.longitude	read_only_udm.principal.location.region_coordinates.longitude	Si los campos location.coordinates.longitude y location.geoCoordinates.longitude están vacíos, el campo data.location.longitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.longitude.
data.location.province	read_only_udm.principal.location.state	Si el campo location.province está vacío, el campo data.location.province se asigna a principal.location.state.
data.mailServers	read_only_udm.additional.fields.value.list_value.values.string_value	Cada elemento de la matriz data.mailServers se asigna a una entrada additional.fields independiente con la clave "Mail Servers" y el valor value.list_value.values.string_value definido como el valor del elemento.
data.names.forwardDns[].name	read_only_udm.network.dns.questions.name	Cada elemento de la matriz data.names.forwardDns se asigna a una entrada network.dns.questions independiente con el campo name definido como el campo name del elemento.
data.nameServers	read_only_udm.additional.fields.value.list_value.values.string_value	Cada elemento de la matriz data.nameServers se asigna a una entrada additional.fields independiente con la clave "Name nameServers" y el valor value.list_value.values.string_value definido como el valor del elemento.
data.protocols[].transportProtocol	read_only_udm.network.ip_protocol	Si el campo data.protocols[].transportProtocol es uno de los siguientes: TCP, EIGRP, ESP, ETHERIP, GRE, ICMP, IGMP, IP6IN4, PIM, UDP o VRRP, se asigna a network.ip_protocol.
data.protocols[].transportProtocol	read_only_udm.principal.resource.attribute.labels.value	El campo data.protocols[].transportProtocol se asigna a principal.resource.attribute.labels.value con la clave "data_protocols {index}".
http.request.headers[].key, http.request.headers[].value.headers.0	read_only_udm.network.http.user_agent	Si el campo http.request.headers[].key es "User-Agent", el campo http.request.headers[].value.headers.0 correspondiente se asigna a network.http.user_agent.
http.request.headers[].key, http.request.headers[].value.headers.0	read_only_udm.network.http.parsed_user_agent	Si el campo http.request.headers[].key es "User-Agent", el campo http.request.headers[].value.headers.0 correspondiente se analiza como una cadena de user-agent y se asigna a network.http.parsed_user_agent.
http.request.headers[].key, http.request.headers[].value.headers.0	read_only_udm.principal.resource.attribute.labels.key, read_only_udm.principal.resource.attribute.labels.value	Por cada elemento de la matriz http.request.headers, el campo de clave se asigna a principal.resource.attribute.labels.key y el campo value.headers.0 se asigna a principal.resource.attribute.labels.value.
http.request.uri	read_only_udm.principal.asset.hostname	Se extrae la parte del nombre de host del campo http.request.uri y se asigna a principal.asset.hostname.
http.request.uri	read_only_udm.principal.hostname	La parte del nombre de host del campo http.request.uri se extrae y se asigna a principal.hostname.
http.response.body	read_only_udm.principal.resource.attribute.labels.value	El campo http.response.body se asigna a principal.resource.attribute.labels.value con la clave "http_response_body".
http.response.headers[].key, http.response.headers[].value.headers.0	read_only_udm.target.hostname	Si el campo http.response.headers[].key es "Server", el campo http.response.headers[].value.headers.0 correspondiente se asigna a target.hostname.
http.response.headers[].key, http.response.headers[].value.headers.0	read_only_udm.principal.resource.attribute.labels.key, read_only_udm.principal.resource.attribute.labels.value	Por cada elemento de la matriz http.response.headers, el campo key se asigna a principal.resource.attribute.labels.key y el campo value.headers.0 se asigna a principal.resource.attribute.labels.value.
http.response.statusCode	read_only_udm.network.http.response_code	El campo http.response.statusCode se convierte en un número entero y se asigna a network.http.response_code.
ip	read_only_udm.target.asset.ip	El campo ip se asigna a target.asset.ip.
ip	read_only_udm.target.ip	El campo ip se asigna a target.ip.
isSeed	read_only_udm.additional.fields.value.string_value	El campo isSeed se convierte en una cadena y se asigna a additional.fields.value.string_value con la clave "isSeed".
location.city	read_only_udm.principal.location.city	El campo location.city se asigna a principal.location.city.
location.continent	read_only_udm.additional.fields.value.string_value	El campo location.continent se asigna a additional.fields.value.string_value con la clave "location_continent".
location.coordinates.latitude	read_only_udm.principal.location.region_coordinates.latitude	El campo location.coordinates.latitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.latitude.
location.coordinates.longitude	read_only_udm.principal.location.region_coordinates.longitude	El campo location.coordinates.longitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.longitude.
location.country	read_only_udm.principal.location.country_or_region	El campo location.country se asigna a principal.location.country_or_region.
location.geoCoordinates.latitude	read_only_udm.principal.location.region_coordinates.latitude	Si el campo location.coordinates.latitude está vacío, el campo location.geoCoordinates.latitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.latitude.
location.geoCoordinates.longitude	read_only_udm.principal.location.region_coordinates.longitude	Si el campo location.coordinates.longitude está vacío, el campo location.geoCoordinates.longitude se convierte en un valor flotante y se asigna a principal.location.region_coordinates.longitude.
location.postalCode	read_only_udm.additional.fields.value.string_value	El campo location.postalCode se asigna a additional.fields.value.string_value con la clave "Postal code".
location.province	read_only_udm.principal.location.state	El campo location.province se asigna a principal.location.state.
operación	read_only_udm.security_result.action_details	El campo de operación se asigna a security_result.action_details.
perspectiveId	read_only_udm.principal.group.product_object_id	El campo perspectiveId se asigna a principal.group.product_object_id.
puerto	read_only_udm.principal.port	El campo de puerto se convierte en un número entero y se asigna a principal.port.
risks[].severity, risks[].title	read_only_udm.security_result.category_details	El campo risks[].severity se concatena con el campo risks[].title y se asigna a security_result.category_details.
serviceName	read_only_udm.network.application_protocol	Si el campo serviceName es "HTTP" o "HTTPS", se asigna a network.application_protocol.
sourceIp	read_only_udm.principal.asset.ip	El campo sourceIp se asigna a principal.asset.ip.
sourceIp	read_only_udm.principal.ip	El campo sourceIp se asigna a principal.ip.
timestamp	read_only_udm.metadata.event_timestamp	El campo de marca de tiempo se analiza como una marca de tiempo y se asigna a metadata.event_timestamp.
transportFingerprint.id	read_only_udm.metadata.product_log_id	El campo transportFingerprint.id se convierte en una cadena y se asigna a metadata.product_log_id.
transportFingerprint.raw	read_only_udm.additional.fields.value.string_value	El campo transportFingerprint.raw se asigna a additional.fields.value.string_value con la clave "transportFingerprint_raw".
tipo	read_only_udm.metadata.product_event_type	El campo type se asigna a metadata.product_event_type.
-	read_only_udm.metadata.product_name	El valor "CENSYS_ASM" se asigna a metadata.product_name.
-	read_only_udm.metadata.vendor_name	El valor "CENSYS" se asigna a metadata.vendor_name.
-	read_only_udm.metadata.event_type	El tipo de evento se determina en función de la presencia de campos específicos: NETWORK_CONNECTION si has_princ_machine_id y has_target_machine son true y has_network_flow es false, NETWORK_DNS si has_network_flow es true, STATUS_UPDATE si has_princ_machine_id es true y GENERIC_EVENT en el resto de los casos.

¿Necesitas más ayuda? Recibe respuestas de los miembros de la comunidad y de los profesionales de Google SecOps.