Profil jaringan RDMA
Halaman ini memberikan ringkasan profil jaringan RDMA di Google Cloud.
Tentang profil jaringan RDMA
Dengan profil jaringan RDMA, Anda dapat membuat jaringan Virtual Private Cloud (VPC) yang memungkinkan Anda menjalankan workload AI pada instance VM yang memiliki NIC ConnectX. NIC ini mendukung konektivitas akses memori langsung jarak jauh (RDMA)
dan memiliki jenis NIC MRDMA
di Google Cloud.
Jaringan VPC dengan profil jaringan RDMA mendukung komunikasi RDMA berlatensi rendah dan bandwidth tinggi antara GPU VM yang dibuat dalam jaringan menggunakan RDMA melalui ethernet v2 terkonvergensi (RoCE v2).
Untuk mengetahui informasi selengkapnya tentang cara menjalankan workload AI di Google Cloud, lihat dokumentasi AI Hypercomputer.
Spesifikasi
Jaringan VPC yang dibuat dengan profil jaringan RDMA memiliki spesifikasi berikut:
- Jaringan hanya menerima lampiran dari
MRDMA
NIC. VM Ultra A3 dan VM A4 adalah satu-satunya jenis VM yang mendukungMRDMA
NIC. Jenis NIC lainnya, misalnya GVNIC dari VM A3 Ultra, harus dikaitkan ke jaringan VPC reguler. - Kumpulan fitur yang didukung dalam jaringan telah dikonfigurasi sebelumnya oleh Google Cloud untuk mendukung pengoperasian AI yang memerlukan RDMA. Jaringan VPC dengan profil jaringan RDMA memiliki lebih banyak batasan daripada jaringan VPC reguler. Untuk informasi selengkapnya, lihat Fitur yang didukung dan tidak didukung.
Jaringan dibatasi pada zona profil jaringan yang Anda tentukan saat membuat jaringan. Misalnya, setiap instance yang Anda buat di jaringan harus dibuat di zona profil jaringan. Selain itu, setiap subnet yang Anda buat di jaringan harus berada di region yang sesuai dengan zona profil jaringan.
Profil jaringan RDMA hanya tersedia di zona tertentu. Untuk melihat zona tempat profil jaringan tersedia, lihat Zona yang didukung. Anda juga dapat melihat instance spesifik per zona dari profil jaringan yang tersedia dengan mencantumkan profil jaringan.
Nama resource profil jaringan RDMA yang Anda tentukan saat membuat jaringan memiliki format
ZONE-vpc-roce
berikut, misalnya,europe-west1-b-vpc-roce
.MTU default di jaringan VPC yang dibuat dengan profil jaringan RDMA adalah
8896
. Default ini memberi driver RDMA di OS tamu VM fleksibilitas untuk menggunakan MTU yang sesuai. MTU default di jaringan VPC reguler mungkin terlalu kecil untuk beberapa workload RDMA. Untuk mendapatkan performa terbaik, Google merekomendasikan agar Anda tidak mengubah MTU default.
Zona yang didukung
Profil jaringan RDMA tersedia di zona berikut:
europe-west1-b
us-central1-a
us-central1-b
us-east4-b
us-west1-c
Fitur yang didukung dan tidak didukung
Bagian ini menjelaskan fitur yang didukung dan tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA.
Fitur jaringan VPC reguler didukung kecuali jika dikonfigurasi untuk dinonaktifkan oleh profil jaringan, bergantung pada fitur yang dinonaktifkan oleh profil jaringan, atau tidak berlaku untuk traffic dari NIC RDMA seperti yang dijelaskan pada bagian ini.
Fitur yang dikonfigurasi oleh profil jaringan
Tabel ini mencantumkan fitur khusus yang dikonfigurasi oleh resource profil jaringan dan menjelaskan apakah fitur tersebut didukung atau tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA. Properti ini mencakup nilai properti profil jaringan yang ditetapkan oleh Google Cloud.
Fitur | Didukung | Nama properti | Nilai properti | Detail |
---|---|---|---|---|
MRDMA NIC |
interfaceTypes |
MRDMA |
Jaringan hanya mendukung Jaringan tidak mendukung jenis NIC lain, seperti |
|
Multi-NIC di jaringan yang sama | allowMultiNicInSameNetwork |
MULTI_NIC_IN_SAME_NETWORK_ALLOWED |
Jaringan ini mendukung VM multi-NIC tempat NIC yang berbeda dari VM yang sama dapat dipasang ke jaringan VPC yang sama. Namun, NIC harus terhubung ke subnet yang berbeda dalam jaringan.
Lihat Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama. |
|
Subnet khusus IPv4 | allowedSubnetStackTypes |
SUBNET_STACK_TYPE_IPV4_ONLY |
Jaringan ini mendukung subnet khusus IPv4, termasuk Rentang IPv4 yang valid yang sama seperti jaringan VPC reguler. Jaringan tidak mendukung subnet dual-stack atau subnet khusus IPv6. Untuk mengetahui informasi selengkapnya, lihat Jenis subnet. |
|
Tujuan subnet PRIVATE |
allowedSubnetPurposes |
SUBNET_PURPOSE_PRIVATE |
Jaringan mendukung subnet reguler, yang memiliki tujuan Jaringan tidak mendukung subnet Private Service Connect, subnet khusus proxy, atau subnet Private NAT. Untuk mengetahui informasi selengkapnya, lihat Tujuan subnet. |
|
Tujuan alamat GCE_ENDPOINT |
addressPurposes |
GCE_ENDPOINT |
Jaringan mendukung alamat IP dengan tujuan Jaringan tidak mendukung alamat IP dengan tujuan khusus, seperti
tujuan |
|
Alamat IP eksternal untuk VM | allowExternalIpAccess |
EXTERNAL_IP_ACCESS_BLOCKED |
Jaringan tersebut tidak mendukung penetapan alamat IP eksternal ke VM. NIC yang terhubung ke jaringan tidak dapat menjangkau internet publik. | |
Rentang IP alias | allowAliasIpRanges |
ALIAS_IP_RANGE_BLOCKED |
Jaringan ini tidak mendukung penggunaan rentang IP alias, termasuk rentang alamat IPv4 sekunder, yang hanya dapat digunakan oleh rentang IP alias. | |
Mode otomatis | allowAutoModeSubnet |
AUTO_MODE_SUBNET_BLOCKED |
Mode pembuatan subnet jaringan VPC tidak dapat disetel ke mode otomatis. | |
Peering Jaringan VPC | allowVpcPeering |
VPC_PEERING_BLOCKED |
Jaringan tidak mendukung Peering Jaringan VPC. Selain itu, jaringan ini tidak mendukung akses layanan pribadi, yang bergantung pada Peering Jaringan VPC. | |
Rute statis | allowStaticRoutes |
STATIC_ROUTES_BLOCKED |
Jaringan tidak mendukung rute statis. | |
Duplikasi Paket | allowPacketMirroring |
PACKET_MIRRORING_BLOCKED |
Jaringan tidak mendukung Pencerminan Paket. | |
Cloud NAT | allowCloudNat |
CLOUD_NAT_BLOCKED |
Jaringan tidak mendukung Cloud NAT. | |
Cloud Router | allowCloudRouter |
CLOUD_ROUTER_BLOCKED |
Jaringan tidak mendukung pembuatan Cloud Router. | |
Cloud Interconnect | allowInterconnect |
INTERCONNECT_BLOCKED |
Jaringan tidak mendukung Cloud Interconnect. | |
Cloud VPN | allowVpn |
VPN_BLOCKED |
Jaringan tidak mendukung Cloud VPN. | |
Cloud Load Balancing | allowLoadBalancing |
LOAD_BALANCING_BLOCKED |
Jaringan tidak mendukung Cloud Load Balancing. Anda tidak dapat membuat load balancer di jaringan. Selain itu, Anda tidak dapat menggunakan Google Cloud Armor di jaringan karena kebijakan keamanan Google Cloud Armor hanya berlaku untuk load balancer dan VM dengan alamat IP eksternal. | |
Akses Google Pribadi | allowPrivateGoogleAccess |
PRIVATE_GOOGLE_ACCESS_BLOCKED |
Jaringan tidak mendukung Akses Google Pribadi. | |
Private Service Connect | allowPsc |
PSC_BLOCKED |
Jaringan tidak mendukung konfigurasi Private Service Connect apa pun. |
Fitur tambahan yang tidak berlaku untuk traffic dari NIC RDMA
Beberapa fitur jaringan VPC reguler yang tersedia untuk traffic protokol lain tidak berlaku untuk traffic di jaringan dengan profil jaringan RDMA, seperti berikut:
- Aturan Firewall Cloud Next Generation tidak didukung.
- Log Aliran VPC tidak didukung.
- Uji Konektivitas tidak didukung.
Meskipun Google Cloud tidak mencegah Anda mengonfigurasi fitur ini, fitur ini tidak efektif dalam jaringan VPC dengan profil jaringan RDMA.
Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama
Untuk mendukung workload yang mendapatkan manfaat dari komunikasi GPU ke GPU lintas-rail, profil jaringan RDMA memungkinkan Anda membuat VM yang memiliki beberapa NIC MRDMA
yang terpasang ke jaringan yang sama. Namun, konektivitas lintas kolom
dapat memengaruhi performa jaringan, seperti melalui
peningkatan latensi. VM yang memiliki NIC MRDMA
menggunakan NCCL,
yang berupaya melakukan rail-align semua transfer jaringan bahkan untuk komunikasi
lintas kereta, misalnya dengan menggunakan PXN untuk menyalin data melalui NVlink ke
GPU yang disambungkan dengan rel sebelum mentransfer melalui jaringan.