Google Cloud Managed Service for Prometheus adalah solusi lintas project multi-cloud yang terkelola sepenuhnya untuk metrik Prometheus dan OpenTelemetry. Google CloudDengan layanan ini, Anda dapat memantau dan membuat pemberitahuan terkait workload secara global dengan menggunakan Prometheus dan OpenTelemetry, tanpa harus mengelola dan mengoperasikan Prometheus secara manual dalam skala besar.
Managed Service for Prometheus mengumpulkan metrik dari pengekspor Prometheus dan memungkinkan Anda membuat kueri data secara global menggunakan PromQL. Artinya, Anda dapat terus menggunakan dasbor Grafana yang ada, pemberitahuan berbasis PromQL, dan alur kerja. Layanan ini kompatibel dengan hybrid dan multi-cloud, dapat memantau workload Kubernetes, VM, dan serverless di Cloud Run, menyimpan data selama 24 bulan, dan mempertahankan portabilitas dengan tetap kompatibel dengan Prometheus upstream. Anda juga dapat melengkapi pemantauan Prometheus dengan membuat kueri lebih dari 6.500 metrik gratis di Cloud Monitoring, termasuk metrik sistem GKE gratis, menggunakan PromQL.
Dokumen ini memberikan ringkasan layanan terkelola, dan dokumen selanjutnya menjelaskan cara menyiapkan dan menjalankan layanan. Untuk menerima info terbaru secara rutin tentang fitur dan rilis baru, kirimkan formulir pendaftaran opsional.
Dengarkan cara The Home Depot menggunakan Managed Service for Prometheus untuk mendapatkan kemampuan pengamatan terpadu di 2.200 toko yang menjalankan cluster Kubernetes on-premise:
Ringkasan sistem
Google Cloud Managed Service for Prometheus memberikan keakraban Prometheus yang didukung oleh infrastruktur global, multi-cloud, dan lintas project dari Cloud Monitoring.
Managed Service for Prometheus dibangun di atas Monarch, penyimpanan data skalabel global yang sama dengan yang digunakan untuk pemantauan Google sendiri. Karena Managed Service for Prometheus menggunakan backend dan API yang sama dengan Cloud Monitoring, metrik Cloud Monitoring dan metrik yang diserap oleh Managed Service for Prometheus dapat dikueri menggunakan PromQL di Cloud Monitoring, Grafana, atau alat lain yang dapat membaca Prometheus API.
Dalam deployment Prometheus standar, pengumpulan data, evaluasi kueri, evaluasi aturan dan pemberitahuan, serta penyimpanan data ditangani dalam satu server Prometheus. Managed Service for Prometheus membagi tanggung jawab untuk fungsi-fungsi ini menjadi beberapa komponen:
- Pengumpulan data ditangani oleh kolektor terkelola, kolektor yang di-deploy sendiri, OpenTelemetry Collector, atau Ops Agent, yang meng-scrape eksportir lokal dan meneruskan data yang dikumpulkan ke Monarch. Pengumpul ini dapat digunakan untuk beban kerja Kubernetes, tanpa server, dan VM tradisional serta dapat berjalan di mana saja, termasuk di cloud lain dan deployment lokal.
- Evaluasi kueri ditangani oleh Monarch, yang menjalankan kueri dan menggabungkan hasil di semua wilayah Google Clouddan di hingga 3.500 projectGoogle Cloud .
- Evaluasi aturan dan pemberitahuan ditangani dengan menulis pemberitahuan PromQL di Cloud Monitoring yang sepenuhnya dijalankan di cloud, atau dengan menggunakan komponen evaluator aturan yang dijalankan secara lokal dan dikonfigurasi secara lokal yang menjalankan aturan dan pemberitahuan terhadap penyimpanan data Monarch global dan meneruskan pemberitahuan yang diaktifkan ke Prometheus AlertManager.
- Penyimpanan data ditangani oleh Monarch, yang menyimpan semua data Prometheus selama 24 bulan tanpa biaya tambahan.
Grafana terhubung ke penyimpanan data Monarch global, bukan terhubung ke server Prometheus individual. Jika Anda telah mengonfigurasi pengumpul Managed Service for Prometheus di semua deployment, satu instance Grafana ini akan memberi Anda tampilan terpadu dari semua metrik di semua cloud Anda.
Pengumpulan data
Anda dapat menggunakan Managed Service for Prometheus dalam salah satu dari empat mode: dengan pengumpulan data terkelola, dengan pengumpulan data yang di-deploy sendiri, dengan OpenTelemetry Collector, atau dengan Ops Agent.
Managed Service for Prometheus menawarkan operator untuk pengumpulan data terkelola di lingkungan Kubernetes. Sebaiknya gunakan koleksi terkelola; dengan menggunakannya, Anda tidak perlu repot men-deploy, menskalakan, membagi, mengonfigurasi, dan memelihara server Prometheus. Pengumpulan terkelola didukung untuk lingkungan Kubernetes GKE dan non-GKE.
Dengan pengumpulan data yang di-deploy sendiri, Anda mengelola penginstalan Prometheus seperti biasa. Satu-satunya perbedaan dari Prometheus upstream adalah Anda menjalankan biner pengganti Managed Service for Prometheus, bukan biner Prometheus upstream.
OpenTelemetry Collector dapat digunakan untuk menyalin pengekspor Prometheus dan mengirim data ke Managed Service for Prometheus. OpenTelemetry mendukung strategi satu agen untuk semua sinyal, di mana satu pengumpul dapat digunakan untuk metrik (termasuk metrik Prometheus), log, dan trace di lingkungan mana pun.
Anda dapat mengonfigurasi Agen Operasional di instance Compute Engine mana pun untuk melakukan scraping dan mengirim metrik Prometheus ke datastore global. Penggunaan agen sangat menyederhanakan penemuan VM dan menghilangkan kebutuhan untuk menginstal, men-deploy, atau mengonfigurasi Prometheus di lingkungan VM.
Jika Anda memiliki layanan Cloud Run yang menulis metrik Prometheus atau metrik OTLP, Anda dapat menggunakan file bantuan dan Managed Service for Prometheus untuk mengirim metrik ke Cloud Monitoring.
- Untuk mengumpulkan metrik Prometheus dari Cloud Run, gunakan file bantuan Prometheus.
- Untuk mengumpulkan metrik OTLP dari Cloud Run, gunakan file bantuan OpenTelemetry.
Anda dapat menjalankan kolektor yang dikelola, di-deploy sendiri, dan OpenTelemetry dalam deployment lokal dan di cloud mana pun. Pengumpul yang berjalan di luar Google Cloud mengirim data ke Monarch untuk penyimpanan jangka panjang dan kueri global.
Saat memilih opsi pengumpulan, pertimbangkan hal berikut:
Koleksi terkelola:
- Pendekatan yang direkomendasikan Google untuk semua lingkungan Kubernetes.
- Di-deploy menggunakan UI GKE, gcloud CLI,
kubectl
CLI, atau Terraform. - Pengoperasian Prometheus—membuat konfigurasi pengambilan data, menskalakan penyerapan, mencakup aturan ke data yang tepat, dan sebagainya—sepenuhnya ditangani oleh operator Kubernetes.
- Scraping dan aturan dikonfigurasi menggunakan resource kustom (CR) yang ringan.
- Cocok untuk Anda yang menginginkan pengalaman yang lebih mudah dan terkelola sepenuhnya.
- Migrasi intuitif dari konfigurasi prometheus-operator.
- Mendukung sebagian besar kasus penggunaan Prometheus saat ini.
- Bantuan penuh dari Google Cloud dukungan teknis.
Pengumpulan yang di-deploy sendiri:
- Pengganti langsung untuk biner Prometheus upstream.
- Anda dapat menggunakan mekanisme deployment pilihan Anda, seperti prometheus-operator atau deployment manual.
- Scraping dikonfigurasi menggunakan metode pilihan Anda, seperti anotasi atau prometheus-operator.
- Penskalaan dan sharding fungsional dilakukan secara manual.
- Cocok untuk integrasi cepat ke dalam penyiapan yang sudah ada dan lebih kompleks. Anda dapat menggunakan kembali konfigurasi yang ada serta menjalankan Prometheus upstream dan Managed Service for Prometheus secara berdampingan.
- Aturan dan pemberitahuan biasanya berjalan dalam server Prometheus individual, yang mungkin lebih disukai untuk deployment edge karena evaluasi aturan lokal tidak menimbulkan traffic jaringan.
- Dapat mendukung kasus penggunaan long-tail yang belum didukung oleh koleksi terkelola, seperti penggabungan lokal untuk mengurangi kardinalitas.
- Bantuan terbatas dari Google Cloud dukungan teknis.
OpenTelemetry Collector:
- Satu pengumpul yang dapat mengumpulkan metrik (termasuk metrik Prometheus) dari lingkungan mana pun dan mengirimkannya ke backend yang kompatibel. Dapat juga digunakan untuk mengumpulkan log dan rekaman aktivitas, lalu mengirimkannya ke backend yang kompatibel, termasuk Cloud Logging dan Cloud Trace.
- Di-deploy di lingkungan komputasi atau Kubernetes secara manual atau dengan menggunakan Terraform. Dapat digunakan untuk mengirim metrik dari lingkungan stateless seperti Cloud Run.
- Scraping dikonfigurasi menggunakan konfigurasi mirip Prometheus di penerima Prometheus pengumpul.
- Mendukung pola pengumpulan metrik berbasis push.
- Metadata disuntikkan dari cloud mana pun menggunakan pemroses detektor resource.
- Aturan dan pemberitahuan dapat dijalankan menggunakan kebijakan pemberitahuan Cloud Monitoring atau evaluator aturan mandiri.
- Mendukung alur kerja dan fitur lintas sinyal terbaik seperti contoh.
- Bantuan terbatas dari Google Cloud dukungan teknis.
Agen Operasional:
- Cara termudah untuk mengumpulkan dan mengirim data metrik Prometheus yang berasal dari lingkungan Compute Engine, termasuk distro Linux dan Windows.
- Di-deploy menggunakan gcloud CLI, UI Compute Engine, atau Terraform.
- Scraping dikonfigurasi menggunakan konfigurasi seperti Prometheus di penerima Prometheus Agen, yang didukung oleh OpenTelemetry.
- Aturan dan pemberitahuan dapat dieksekusi menggunakan Cloud Monitoring atau evaluator aturan mandiri.
- Dilengkapi dengan agen Logging opsional dan metrik proses.
- Bantuan penuh dari Google Cloud dukungan teknis. Untuk memulai, lihat Mulai menggunakan koleksi terkelola, Mulai menggunakan koleksi yang di-deploy sendiri, Mulai menggunakan OpenTelemetry Collector, atau Mulai menggunakan Ops Agent.
Jika Anda menggunakan layanan terkelola di luar Google Kubernetes Engine atau Google Cloud, beberapa konfigurasi tambahan mungkin diperlukan; lihat Menjalankan pengumpulan data terkelola di luar Google Cloud, Menjalankan pengumpulan data yang di-deploy sendiri di luarGoogle Cloud, atau Menambahkan pemroses OpenTelemetry.
Evaluasi kueri
Managed Service for Prometheus mendukung UI kueri apa pun yang dapat memanggil Prometheus Query API, termasuk Grafana dan UI Cloud Monitoring. Dasbor Grafana yang ada akan terus berfungsi saat beralih dari Prometheus lokal ke Managed Service for Prometheus, dan Anda dapat terus menggunakan PromQL yang ada di repositori open source populer dan forum komunitas.
Anda dapat menggunakan PromQL untuk membuat kueri lebih dari 6.500 metrik gratis di Cloud Monitoring, bahkan tanpa mengirim data ke Managed Service for Prometheus. Anda juga dapat menggunakan PromQL untuk membuat kueri metrik Kubernetes gratis, metrik kustom, dan metrik berbasis log.
Untuk mengetahui informasi tentang cara mengonfigurasi Grafana untuk membuat kueri data Managed Service for Prometheus, lihat Membuat kueri menggunakan Grafana.
Untuk mengetahui informasi tentang cara membuat kueri metrik Cloud Monitoring menggunakan PromQL, lihat PromQL di Cloud Monitoring.
Evaluasi aturan dan pemberitahuan
Managed Service for Prometheus menyediakan pipeline pemberitahuan berbasis cloud sepenuhnya dan evaluator aturan mandiri, yang keduanya mengevaluasi aturan terhadap semua data Monarch yang dapat diakses dalam cakupan metrik. Mengevaluasi aturan terhadap cakupan metrik multi-project menghilangkan kebutuhan untuk menempatkan semua data yang diminati di satu server Prometheus atau dalam satu project Google Cloud , dan memungkinkan Anda menetapkan izin IAM pada grup project.
Karena semua opsi evaluasi aturan menerima format rule_files
Prometheus standar, Anda dapat dengan mudah bermigrasi ke Managed Service for Prometheus dengan menyalin dan menempelkan
aturan yang ada atau dengan menyalin dan menempelkan aturan yang ditemukan di repositori
open source populer. Bagi pengguna yang menggunakan pengumpul yang di-deploy sendiri, Anda dapat terus mengevaluasi aturan perekaman secara lokal di pengumpul Anda. Hasil perekaman dan aturan pemberitahuan disimpan di Monarch, seperti data metrik yang dikumpulkan secara langsung. Anda juga dapat memigrasikan aturan pemberitahuan Prometheus ke kebijakan pemberitahuan berbasis PromQL di Cloud Monitoring.
Untuk evaluasi pemberitahuan dengan Cloud Monitoring, lihat Pemberitahuan PromQL di Cloud Monitoring.
Untuk evaluasi aturan dengan koleksi terkelola, lihat Evaluasi dan pemberitahuan aturan terkelola.
Untuk evaluasi aturan dengan koleksi yang di-deploy sendiri, OpenTelemetry Collector, dan Agen Operasional, lihat Pemberitahuan dan evaluasi aturan yang di-deploy sendiri.
Untuk mengetahui informasi tentang cara mengurangi kardinalitas menggunakan aturan perekaman pada pengumpul yang di-deploy sendiri, lihat Kontrol biaya dan atribusi.
Penyimpanan data
Semua data Managed Service for Prometheus disimpan selama 24 bulan tanpa biaya tambahan.
Managed Service for Prometheus mendukung interval pengambilan minimum 5 detik. Data disimpan dengan tingkat perincian penuh selama 1 minggu, lalu di-downsample ke titik 1 menit selama 5 minggu berikutnya, lalu di-downsample ke titik 10 menit dan disimpan selama sisa periode retensi.
Managed Service for Prometheus tidak memiliki batasan jumlah deret waktu aktif atau total deret waktu.
Untuk mengetahui informasi selengkapnya, lihat Kuota dan batas dalam dokumentasi Cloud Monitoring.
Penagihan dan kuota
Managed Service for Prometheus adalah produk Google Cloud , dan kuota penagihan dan penggunaan berlaku.
Penagihan
Penagihan untuk layanan ini terutama didasarkan pada jumlah sampel metrik yang diserap ke dalam penyimpanan. Ada juga biaya nominal untuk panggilan API baca. Managed Service for Prometheus tidak mengenakan biaya untuk penyimpanan atau retensi data metrik.
- Untuk mengetahui harga saat ini, lihat Ringkasan harga Google Cloud Managed Service for Prometheus.
- Untuk memperkirakan tagihan berdasarkan perkiraan jumlah deret waktu atau perkiraan sampel per detik, lihat tab Cloud Operations dalam Google Cloud Kalkulator Harga.
- Untuk mendapatkan tips tentang cara mengurangi tagihan atau menentukan sumber biaya tinggi, lihat Kontrol dan atribusi biaya.
- Untuk mengetahui informasi tentang alasan model harga, lihat Mengoptimalkan biaya untuk Google Cloud Managed Service for Prometheus.
- Untuk mengetahui contoh harga, lihat Data metrik yang dikenakan biaya berdasarkan sampel yang diserap.
Kuota
Managed Service for Prometheus berbagi kuota penyerapan dan pembacaan dengan Cloud Monitoring. Kuota penyerapan default adalah 500 QPS per project dengan hingga 200 sampel dalam satu panggilan, yang setara dengan 100.000 sampel per detik. Kuota baca default adalah 100 QPS per cakupan metrik.
Anda dapat meningkatkan kuota ini untuk mendukung volume metrik dan kueri. Untuk mengetahui informasi tentang cara mengelola kuota dan meminta penambahan kuota, lihat Menangani kuota.
Persyaratan Layanan dan kepatuhan
Managed Service for Prometheus adalah bagian dari Cloud Monitoring dan oleh karena itu mewarisi perjanjian dan sertifikasi tertentu dari Cloud Monitoring, termasuk (tetapi tidak terbatas pada):
- Google Cloud Persyaratan layanan
- Perjanjian Tingkat Layanan (SLA) Operasi
- Tingkat kepatuhan US DISA dan FedRAMP
- Dukungan VPC-SC (VPC Service Controls)
Langkah berikutnya
- Mulai menggunakan koleksi terkelola.
- Mulai menggunakan koleksi yang di-deploy sendiri.
- Mulai menggunakan OpenTelemetry Collector.
- Mulai menggunakan Agen Operasional.
- Gunakan PromQL di Cloud Monitoring untuk membuat kueri metrik Prometheus.
- Gunakan Grafana untuk membuat kueri metrik Prometheus.
- Buat kueri metrik Cloud Monitoring menggunakan PromQL.
- Baca praktik terbaik dan lihat diagram arsitektur.