Konfigurasi jaringan Serverless for Apache Spark

Dokumen ini menjelaskan persyaratan yang diperlukan untuk konfigurasi jaringan Google Cloud Serverless for Apache Spark.

Persyaratan subnetwork Virtual Private Cloud

Dokumen ini menjelaskan persyaratan jaringan Virtual Private Cloud untuk Google Cloud Serverless for Apache Spark batch workloads dan sesi interaktif.

Akses Google Pribadi

Workload batch dan sesi interaktif Serverless untuk Apache Spark berjalan di VM dengan alamat IP internal saja dan di subnet regional dengan Akses Google Pribadi (PGA) yang otomatis diaktifkan di subnet.

Jika Anda tidak menentukan subnet, Serverless for Apache Spark akan memilih subnet default di region workload batch atau sesi sebagai subnet untuk workload batch atau sesi.

Jika beban kerja Anda memerlukan akses internet atau jaringan eksternal, misalnya untuk mendownload resource seperti model ML dari PyTorch Hub atau Hugging Face, Anda dapat menyiapkan Cloud NAT untuk mengizinkan traffic keluar menggunakan IP internal di jaringan VPC Anda.

Membuka konektivitas subnet

Subnet VPC untuk region yang dipilih untuk Serverless for Apache Spark batch workload atau sesi interaktif harus mengizinkan komunikasi subnet internal di semua port antara instance VM.

Perintah Google Cloud CLI berikut melampirkan firewall jaringan ke subnet yang mengizinkan komunikasi ingress internal antar-VM menggunakan semua protokol di semua port:

gcloud compute firewall-rules create allow-internal-ingress \
    --network=NETWORK_NAME \
    --source-ranges=SUBNET_RANGES \
    --destination-ranges=SUBNET_RANGES \
    --direction=ingress \
    --action=allow \
    --rules=all

Catatan:

  • SUBNET_RANGES: Lihat Mengizinkan koneksi masuk internal antar-VM. Jaringan VPC default dalam project dengan aturan firewall default-allow-internal, yang memungkinkan komunikasi masuk di semua port (tcp:0-65535, udp:0-65535, dan icmp protocols:ports), memenuhi persyaratan konektivitas subnet terbuka. Namun, aturan ini juga mengizinkan ingress oleh instance VM mana pun di jaringan.

Serverless untuk Apache Spark dan jaringan VPC-SC

Dengan Kontrol Layanan VPC, administrator jaringan dapat menentukan perimeter keamanan di sekitar resource layanan yang dikelola Google untuk mengontrol komunikasi ke dan di antara layanan tersebut.

Perhatikan strategi berikut saat menggunakan jaringan VPC-SC dengan Serverless untuk Apache Spark:

Untuk mengetahui informasi selengkapnya, lihat Kontrol Layanan VPC—Serverless untuk Apache Spark.