Tutorial, panduan memulai, dan dokumentasi Cloud TPU

Cloud Tensor Processing Unit (TPU)

Mempercepat pengembangan AI dengan Google Cloud TPU

Cloud TPU mengoptimalkan performa dan biaya untuk semua workload AI, mulai dari pelatihan hingga inferensi. Dengan menggunakan infrastruktur pusat data kelas dunia, TPU menawarkan keandalan, ketersediaan, dan keamanan yang tinggi.

Coba gratis Hubungi bagian penjualan Buka konsol Hubungi bagian penjualan

Tidak yakin apakah TPU sesuai dengan kebutuhan Anda? Pelajari kapan saatnya harus menggunakan GPU atau CPU di instance Compute Engine untuk menjalankan workload machine learning.

Ringkasan

Apa itu Tensor Processing Unit (TPU)?

Google Cloud TPU adalah akselerator AI yang dirancang khusus serta dioptimalkan untuk pelatihan dan inferensi model AI berskala besar. Google Cloud TPU ideal untuk berbagai kasus penggunaan, seperti chatbot, pembuatan kode, pembuatan konten media, ucapan sintetis, layanan visi, mesin pemberi saran, model personalisasi, dan lainnya.

Apa saja keuntungan Cloud TPU?

Cloud TPU dirancang untuk menskalakan berbagai workload AI secara hemat biaya, termasuk pelatihan, fine-tuning, dan inferensi. Cloud TPU memberikan fleksibilitas untuk mempercepat workload pada framework AI terkemuka, termasuk PyTorch, JAX, dan TensorFlow. Orkestrasikan workload AI berskala besar dengan lancar melalui integrasi Cloud TPU di Google Kubernetes Engine (GKE). Pelanggan yang mencari cara paling sederhana untuk mengembangkan model AI juga dapat memanfaatkan Cloud TPU di Vertex AI, platform AI yang terkelola sepenuhnya.

Kapan harus menggunakan Cloud TPU?

Cloud TPU dioptimalkan untuk melatih model deep learning yang besar dan kompleks serta membutuhkan banyak penghitungan matriks, misalnya ketika membangun model bahasa besar (LLM). Cloud TPU juga memiliki SparseCore, yaitu pemroses dataflow yang mempercepat model dengan mengandalkan embedding yang ada dalam model rekomendasi. Kasus penggunaan lainnya mencakup layanan kesehatan, seperti pemodelan pelipatan protein dan penemuan obat.

Apa perbedaan Cloud TPU dengan GPU?

GPU adalah pemroses khusus yang awalnya dirancang untuk memanipulasi grafis komputer. Dengan struktur paralelnya, GPU cocok untuk algoritma yang memproses blok data besar yang biasanya ditemukan dalam workload AI. Pelajari lebih lanjut.

TPU adalah application-specific integrated circuit (ASIC) yang dirancang oleh Google untuk jaringan neural. TPU memiliki fitur khusus, seperti matrix multiply unit (MXU) dan topologi interkoneksi eksklusif, sehingga cocok untuk mempercepat pelatihan dan inferensi AI.

Versi Cloud TPU

Cloud TPU v5e

Cloud TPU yang paling efisien, fleksibel, dan skalabel.

Cloud TPU v5e akan tersedia di Amerika Utara (region Amerika Serikat Barat/Tengah/Timur), EMEA (Belanda), dan APAC (Singapura)

Cloud TPU v4

Cloud TPU yang paling canggih untuk melatih model AI.

Cloud TPUv4 tersedia di region us-central2

Versi Cloud TPU	Deskripsi	Ketersediaan
Cloud TPU v5e	Cloud TPU yang paling efisien, fleksibel, dan skalabel.	Cloud TPU v5e akan tersedia di Amerika Utara (region Amerika Serikat Barat/Tengah/Timur), EMEA (Belanda), dan APAC (Singapura)
Cloud TPU v4	Cloud TPU yang paling canggih untuk melatih model AI.	Cloud TPUv4 tersedia di region us-central2

Cloud TPU v5e tersedia di Amerika Utara (us-west4) selama dalam versi pratinjau.

Cara Kerjanya

Lihatlah lebih dalam keajaiban Google Cloud TPU, termasuk tampilan dalam yang langka dari pusat data tempat semua hal terjadi. Pelanggan menggunakan Cloud TPU untuk menjalankan beberapa workload AI terbesar di dunia dan keunggulan tersebut berasal dari lebih dari sekedar chip. Dalam video ini, lihat komponen sistem TPU, termasuk jaringan pusat data, tombol sirkuit optik, sistem pendingin air, verifikasi keamanan biometrik, dan banyak lagi.

Penggunaan Umum

Menjalankan workload pelatihan AI berskala besar

Penskalaan yang hemat biaya dengan Cloud TPU Multislice

TPU v5e memberikan performa pelatihan per dolar hingga 2x lebih tinggi untuk model LLM dan AI Generatif dibandingkan dengan TPU v4. Teknologi multislice memungkinkan pengguna dengan mudah menskalakan model AI di luar satu pod TPU, melatih puluhan ribu chip Cloud TPU, untuk TPU v5e dan TPU v4. Dengan Multislice, developer dapat memanfaatkan model pemrograman XLA yang sama untuk menskalakan workload melalui interkoneksi antar-chip (ICI) dalam satu pod, atau antar-pod melalui jaringan pusat data (DCN).

Penskalaan near-linear hingga puluhan ribu chip dengan Pelatihan Multislice

Meningkatkan kualitas model AI dasar

Melayani workload inferensi AI berskala besar

Memaksimalkan performa/$ dengan infrastruktur AI yang dapat diskalakan

Cloud TPU v5e memungkinkan inferensi berperforma tinggi dan hemat biaya untuk berbagai workload AI, termasuk model LLM dan AI Generatif terbaru. TPU v5e menghadirkan performa throughput hingga 2,5x per dolar lebih banyak dan kecepatan hingga 1,7x dibandingkan Cloud TPU v4. Setiap chip TPU v5e menyediakan hingga 393 triliun operasi int8 per detik, sehingga memungkinkan model kompleks membuat prediksi dengan cepat. Pod TPU v5e menghasilkan hingga 100 kuadriliun operasi int8 per detik, atau 100 petaOps daya komputasi.

Pelajari lebih lanjut di sini

Cloud TPU di GKE

Cloud TPU di Vertex AI

Harga

Harga Cloud TPU

Semua harga Cloud TPU adalah per chip-jam

Cloud TPU v5e

Mulai dari

$1,200

per chip-jam

Mulai dari

$0,8400

per chip-jam

Mulai dari

$0,5400

per chip-jam

Cloud TPU v4

Mulai dari

$3,2200

per chip-jam

Mulai dari

$2,0286

per chip-jam

Mulai dari

$1,4490

per chip-jam

Harga Cloud TPU	Semua harga Cloud TPU adalah per chip-jam
Versi Cloud TPU	Harga Evaluasi (USD)	Komitmen 1 tahun (USD)	Komitmen 3 tahun (USD)
Cloud TPU v5e	Mulai dari $1,200 per chip-jam	Mulai dari $0,8400 per chip-jam	Mulai dari $0,5400 per chip-jam
Cloud TPU v4	Mulai dari $3,2200 per chip-jam	Mulai dari $2,0286 per chip-jam	Mulai dari $1,4490 per chip-jam

Harga Cloud TPU

Semua harga Cloud TPU adalah per chip-jam

Versi Cloud TPU

Harga Evaluasi (USD)

Komitmen 1 tahun (USD)

Komitmen 3 tahun (USD)

Cloud TPU v5e

Mulai dari

$1,200

per chip-jam

Mulai dari

$0,8400

per chip-jam

Mulai dari

$0,5400

per chip-jam

Cloud TPU v4

Mulai dari

$3,2200

per chip-jam

Mulai dari

$2,0286

per chip-jam

Mulai dari

$1,4490

per chip-jam

Harga Cloud TPU bervariasi menurut produk dan region, lihat detailnya di sini.

KALKULATOR HARGA

Perkirakan biaya Cloud TPU bulanan Anda, termasuk harga dan biaya khusus region.

Perkirakan biaya Anda

PENAWARAN HARGA KHUSUS

Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

Minta penawaran harga

Mulai bukti konsep Anda

Cobalah Cloud TPU secara gratis

Memulai

Dapatkan pengantar singkat terkait cara menggunakan Cloud TPU

Pelajari lebih lanjut

Jalankan TensorFlow di VM Cloud TPU

Baca panduan

Jalankan JAX di VM Cloud TPU

Baca panduan

Jalankan PyTorch di VM Cloud TPU

Baca panduan

Cloud Tensor Processing Unit (TPU)

Mempercepat pengembangan AI dengan Google Cloud TPU

Sorotan

Apa itu Tensor Processing Unit (TPU)?

Apa saja keuntungan Cloud TPU?

Kapan harus menggunakan Cloud TPU?

Apa perbedaan Cloud TPU dengan GPU?

Menjalankan workload pelatihan AI berskala besar

Penskalaan yang hemat biaya dengan Cloud TPU Multislice

Meningkatkan kualitas model AI dasar

Menyesuaikan LLM untuk aplikasi Anda dengan Pytorch/XLA

Melayani workload inferensi AI berskala besar

Memaksimalkan performa/$ dengan infrastruktur AI yang dapat diskalakan

Cloud TPU di GKE

Penskalaan yang mudah dengan GKE

Cloud TPU di Vertex AI

Vertex AI Training & Prediction dengan Cloud TPU

KALKULATOR HARGA

PENAWARAN HARGA KHUSUS

Mulai bukti konsep Anda

Cobalah Cloud TPU secara gratis

Dapatkan pengantar singkat terkait cara menggunakan Cloud TPU

Jalankan TensorFlow di VM Cloud TPU

Jalankan JAX di VM Cloud TPU

Jalankan PyTorch di VM Cloud TPU