Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Last reviewed 2024-09-25 UTC
Prinsip ini dalam pilar pengoptimalan biaya dari Google Cloud Framework dengan Arsitektur yang Baik
memberikan rekomendasi untuk membantu Anda mengoptimalkan biaya deployment cloud
berdasarkan sasaran bisnis yang terus berubah dan berkembang.
Seiring pertumbuhan dan perkembangan bisnis Anda, beban kerja cloud Anda perlu beradaptasi dengan perubahan
persyaratan resource dan pola penggunaan. Untuk mendapatkan nilai maksimum dari belanja cloud, Anda harus mempertahankan efisiensi biaya sekaligus terus mendukung tujuan bisnis. Hal ini memerlukan pendekatan proaktif dan adaptif yang berfokus
pada peningkatan dan pengoptimalan berkelanjutan.
Ringkasan prinsip
Untuk mengoptimalkan biaya secara berkelanjutan, Anda harus memantau dan menganalisis
lingkungan cloud secara proaktif dan melakukan penyesuaian yang sesuai untuk memenuhi persyaratan saat ini.
Fokuskan upaya pemantauan Anda pada indikator performa utama (KPI) yang secara langsung
memengaruhi pengalaman pengguna akhir, selaras dengan sasaran bisnis Anda, dan memberikan
insight untuk peningkatan berkelanjutan. Pendekatan ini memungkinkan Anda mengidentifikasi dan mengatasi
inefisiensi, beradaptasi dengan kebutuhan yang berubah, dan terus menyelaraskan pembelanjaan cloud
dengan sasaran bisnis strategis. Untuk menyeimbangkan visibilitas komprehensif dengan efektivitas biaya,
pahami biaya dan manfaat pemantauan penggunaan resource, serta gunakan strategi pengoptimalan dan peningkatan proses yang sesuai.
Rekomendasi
Untuk memantau lingkungan Google Cloud Anda secara efektif dan mengoptimalkan biaya
secara berkelanjutan, pertimbangkan rekomendasi berikut.
Berfokus pada metrik yang relevan dengan bisnis
Pemantauan yang efektif dimulai dengan mengidentifikasi metrik yang paling penting
untuk bisnis dan pelanggan Anda. Metrik ini mencakup:
Metrik pengalaman pengguna: Metrik latensi, rasio error, throughput, dan kepuasan
pelanggan berguna untuk memahami pengalaman pengguna akhir
saat menggunakan aplikasi Anda.
Metrik hasil bisnis: Pendapatan, pertumbuhan pelanggan, dan engagement dapat
dikaitkan dengan penggunaan resource untuk mengidentifikasi peluang pengoptimalan biaya.
Metrik DevOps Research & Assessment (DORA): Metrik
seperti frekuensi deployment, waktu tunggu untuk perubahan, tingkat kegagalan perubahan, dan
waktu untuk memulihkan memberikan insight tentang efisiensi dan keandalan
proses pengiriman software Anda. Dengan meningkatkan metrik ini, Anda dapat meningkatkan
produktivitas, mengurangi periode nonaktif, dan mengoptimalkan biaya.
Metrik Site Reliability Engineering (SRE): Anggaran error membantu tim mengukur dan mengelola tingkat gangguan layanan yang dapat diterima. Dengan menetapkan ekspektasi yang jelas untuk keandalan, anggaran error
memberdayakan tim untuk berinovasi dan menerapkan perubahan dengan lebih percaya diri, dengan mengetahui
margin keamanan mereka. Pendekatan proaktif ini mendorong keseimbangan antara inovasi
dan stabilitas, sehingga membantu mencegah biaya operasional yang berlebihan yang terkait dengan
penghentian layanan besar atau periode nonaktif yang berkepanjangan.
Menggunakan kemampuan observasi untuk pengoptimalan resource
Berikut adalah rekomendasi untuk menggunakan visibilitas guna mengidentifikasi bottleneck resource dan resource yang kurang dimanfaatkan dalam deployment cloud Anda:
Pantau pemanfaatan resource: Gunakan metrik pemanfaatan resource untuk mengidentifikasi
resourceGoogle Cloud yang kurang dimanfaatkan. Misalnya, gunakan metrik
seperti penggunaan CPU dan memori untuk mengidentifikasi resource VM yang tidak ada aktivitas.
Untuk Google Kubernetes Engine (GKE), Anda dapat melihat perincian biaya mendetail dan metrik pengoptimalan terkait biaya.
Untuk Google Cloud VMware Engine, tinjau penggunaan resource
untuk mengoptimalkan CUD, penggunaan penyimpanan, dan penyesuaian ukuran ESXi.
Gunakan rekomendasi cloud: Active Assist
adalah portofolio alat cerdas yang membantu Anda mengoptimalkan operasi cloud. Alat ini memberikan rekomendasi yang dapat ditindaklanjuti untuk mengurangi biaya, meningkatkan performa, meningkatkan keamanan, dan bahkan membuat keputusan yang berfokus pada keberlanjutan. Misalnya, insight penyesuaian ukuran VM
dapat membantu mengoptimalkan alokasi resource dan menghindari pembelanjaan yang tidak perlu.
Mengaitkan penggunaan resource dengan performa: Menganalisis hubungan
antara penggunaan resource dan performa aplikasi untuk menentukan apakah
Anda dapat mendowngrade ke resource yang lebih murah tanpa memengaruhi pengalaman
pengguna.
Menyeimbangkan kebutuhan pemecahan masalah dengan biaya
Data kemampuan observasi yang mendetail dapat membantu mendiagnosis dan memecahkan masalah.
Namun, menyimpan data visibilitas dalam jumlah yang berlebihan atau mengekspor data yang tidak perlu ke alat pemantauan eksternal dapat menyebabkan biaya yang tidak perlu. Untuk pemecahan masalah
yang efisien, pertimbangkan rekomendasi berikut:
Kumpulkan data yang memadai untuk pemecahan masalah: Pastikan solusi pemantauan Anda mengumpulkan data yang memadai untuk mendiagnosis dan menyelesaikan masalah secara efisien saat masalah tersebut muncul. Data ini dapat mencakup log, rekaman aktivitas, dan metrik pada berbagai tingkat perincian.
Gunakan sampling dan agregasi: Seimbangkan kebutuhan akan data mendetail dengan
pertimbangan biaya menggunakan teknik sampling dan agregasi. Dengan pendekatan ini,
Anda dapat mengumpulkan data perwakilan tanpa menimbulkan biaya penyimpanan yang berlebihan.
Pahami model harga alat dan layanan pemantauan Anda: Evaluasi
berbagai solusi pemantauan dan pilih opsi yang sesuai dengan
kebutuhan, anggaran, dan pola penggunaan spesifik project Anda. Pertimbangkan faktor-faktor seperti
volume data, persyaratan retensi, dan fitur yang diperlukan saat
membuat pilihan.
Tinjau konfigurasi pemantauan Anda secara berkala: Hindari pengumpulan data yang berlebihan dengan menghapus metrik atau log yang tidak diperlukan.
Menyesuaikan pengumpulan data dengan peran dan menetapkan kebijakan retensi khusus peran
Pertimbangkan kebutuhan data spesifik dari berbagai peran. Misalnya, developer
mungkin terutama memerlukan akses ke rekaman aktivitas dan log tingkat aplikasi, sedangkan administrator
IT mungkin berfokus pada log sistem dan metrik infrastruktur. Dengan menyesuaikan
pengumpulan data, Anda dapat mengurangi biaya penyimpanan yang tidak perlu dan menghindari
pengguna yang kewalahan dengan informasi yang tidak relevan.
Selain itu, Anda dapat menentukan kebijakan retensi berdasarkan kebutuhan setiap peran
dan persyaratan peraturan apa pun. Misalnya, developer mungkin memerlukan akses ke
log mendetail untuk jangka waktu yang lebih singkat, sementara analis keuangan mungkin memerlukan
data jangka panjang.
Pertimbangkan persyaratan peraturan dan kepatuhan
Di industri tertentu, persyaratan peraturan mewajibkan retensi data. Untuk menghindari
risiko hukum dan keuangan, Anda harus memastikan bahwa praktik pemantauan dan retensi data
membantu Anda mematuhi peraturan yang relevan. Pada saat yang sama,
Anda perlu mempertahankan efisiensi biaya. Pertimbangkan rekomendasi berikut:
Tentukan persyaratan retensi data spesifik untuk industri atau wilayah Anda, dan pastikan strategi pemantauan Anda memenuhi persyaratan tersebut.
Terapkan mekanisme pengarsipan dan pengambilan data yang sesuai untuk memenuhi kebutuhan audit
dan kepatuhan sekaligus meminimalkan biaya penyimpanan.
Menerapkan pemberitahuan cerdas
Pemberitahuan membantu mendeteksi dan menyelesaikan masalah secara tepat waktu. Namun, perlu keseimbangan antara pendekatan yang terus memberi tahu Anda, dan pendekatan yang
membebankan Anda dengan notifikasi. Dengan mendesain sistem pemberitahuan cerdas,
Anda dapat memprioritaskan masalah penting yang memiliki dampak bisnis yang lebih tinggi. Pertimbangkan rekomendasi berikut:
Prioritaskan masalah yang memengaruhi pelanggan: Buat pemberitahuan yang dipicu
dengan cepat untuk masalah yang secara langsung memengaruhi pengalaman pelanggan, seperti pemadaman layanan
situs, waktu respons yang lambat, atau kegagalan transaksi.
Menyesuaikan untuk masalah sementara: Gunakan nilai minimum dan mekanisme
penundaan yang sesuai untuk menghindari pemberitahuan yang tidak perlu terkait masalah sementara atau masalah sistem perbaikan mandiri
yang tidak memengaruhi pelanggan.
Menyesuaikan tingkat keparahan pemberitahuan: Pastikan masalah yang paling mendesak menerima perhatian langsung dengan membedakan antara pemberitahuan kritis dan nonkritis.
Gunakan saluran notifikasi dengan bijak: Pilih saluran yang sesuai untuk notifikasi pemberitahuan (email, SMS, atau paging) berdasarkan tingkat keparahan dan urgensi pemberitahuan.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2024-09-25 UTC."],[[["\u003cp\u003eContinuously monitoring and analyzing your cloud environment is essential for optimizing costs and adapting to changing business needs, which includes focusing on key performance indicators that impact end-users and align with business goals.\u003c/p\u003e\n"],["\u003cp\u003eObservability tools are critical for identifying underutilized resources and bottlenecks, utilizing resources like Active Assist to receive actionable recommendations for reducing costs, improving performance, and increasing sustainability.\u003c/p\u003e\n"],["\u003cp\u003eBalancing detailed data collection for troubleshooting with cost considerations requires using sampling and aggregation techniques, and regularly reviewing monitoring configurations to avoid excessive data storage.\u003c/p\u003e\n"],["\u003cp\u003eTailoring data collection to specific roles, such as developers and IT administrators, and defining role-specific data retention policies can reduce unnecessary storage costs and improve data relevance.\u003c/p\u003e\n"],["\u003cp\u003eImplementing smart alerting that prioritizes issues affecting customers, tunes for temporary problems, and uses notification channels effectively helps to ensure timely issue resolution without overwhelming teams.\u003c/p\u003e\n"]]],[],null,["# Optimize continuously\n\nThis principle in the cost optimization pillar of the [Google Cloud Well-Architected Framework](/architecture/framework)\nprovides recommendations to help you optimize the cost of your cloud deployments\nbased on constantly changing and evolving business goals.\n\nAs your business grows and evolves, your cloud workloads need to adapt to changes\nin resource requirements and usage patterns. To derive maximum value from your\ncloud spending, you must maintain cost-efficiency while continuing to support\nbusiness objectives. This requires a proactive and adaptive approach that focuses\non continuous improvement and optimization.\n\nPrinciple overview\n------------------\n\nTo optimize cost continuously, you must proactively monitor and analyze your\ncloud environment and make suitable adjustments to meet current requirements.\nFocus your monitoring efforts on key performance indicators (KPIs) that directly\naffect your end users' experience, align with your business goals, and provide\ninsights for continuous improvement. This approach lets you identify and address\ninefficiencies, adapt to changing needs, and continuously align cloud spending\nwith strategic business goals. To balance comprehensive observability with cost\neffectiveness, understand the costs and benefits of monitoring resource usage\nand use appropriate process-improvement and optimization strategies.\n\nRecommendations\n---------------\n\nTo effectively monitor your Google Cloud environment and optimize cost\ncontinuously, consider the following recommendations.\n\n### Focus on business-relevant metrics\n\nEffective monitoring starts with identifying the metrics that are most important\nfor your business and customers. These metrics include the following:\n\n- **User experience metrics**: Latency, error rates, throughput, and customer satisfaction metrics are useful for understanding your end users' experience when using your applications.\n- **Business outcome metrics**: Revenue, customer growth, and engagement can be correlated with resource usage to identify opportunities for cost optimization.\n- **[DevOps Research \\& Assessment (DORA)](https://dora.dev) metrics**: Metrics like deployment frequency, lead time for changes, change failure rate, and time to restore provide insights into the efficiency and reliability of your software delivery process. By improving these metrics, you can increase productivity, reduce downtime, and optimize cost.\n- **[Site Reliability Engineering (SRE)](https://sre.google) metrics**: Error budgets help teams to quantify and manage the acceptable level of service disruption. By establishing clear expectations for reliability, error budgets empower teams to innovate and deploy changes more confidently, knowing their safety margin. This proactive approach promotes a balance between innovation and stability, helping prevent excessive operational costs associated with major outages or prolonged downtime.\n\n### Use observability for resource optimization\n\nThe following are recommendations to use observability to identify resource\nbottlenecks and underutilized resources in your cloud deployments:\n\n- **Monitor resource utilization** : Use resource utilization metrics to identify Google Cloud resources that are underutilized. For example, use metrics like CPU and memory utilization to identify [idle VM resources](/monitoring/agent/process-metrics#view_performance_metrics_for_top_resource-consuming_vms). For Google Kubernetes Engine (GKE), you can view a detailed [breakdown of costs](/kubernetes-engine/docs/how-to/cost-allocations) and [cost-related optimization metrics](/kubernetes-engine/docs/how-to/cost-optimization-metrics). For Google Cloud VMware Engine, [review resource utilization](https://cloud.google.com/blog/topics/cost-management/cost-optimization-of-google-cloud-vmware-engine-deployments) to optimize CUDs, storage consumption, and ESXi right-sizing.\n- **Use cloud recommendations** : [Active Assist](/solutions/active-assist) is a portfolio of intelligent tools that help you optimize your cloud operations. These tools provide actionable recommendations to reduce costs, increase performance, improve security and even make sustainability-focused decisions. For example, [VM rightsizing insights](/compute/docs/instance-groups/apply-machine-type-recommendations-managed-instance-groups) can help to optimize resource allocation and avoid unnecessary spending.\n- **Correlate resource utilization with performance**: Analyze the relationship between resource utilization and application performance to determine whether you can downgrade to less expensive resources without affecting the user experience.\n\n### Balance troubleshooting needs with cost\n\nDetailed observability data can help with diagnosing and troubleshooting issues.\nHowever, storing excessive amounts of observability data or exporting unnecessary\ndata to external monitoring tools can lead to unnecessary costs. For efficient\ntroubleshooting, consider the following recommendations:\n\n- **Collect sufficient data for troubleshooting**: Ensure that your monitoring solution captures enough data to efficiently diagnose and resolve issues when they arise. This data might include logs, traces, and metrics at various levels of granularity.\n- **Use sampling and aggregation**: Balance the need for detailed data with cost considerations by using sampling and aggregation techniques. This approach lets you collect representative data without incurring excessive storage costs.\n- **Understand the pricing models of your monitoring tools and services**: Evaluate different monitoring solutions and choose options that align with your project's specific needs, budget, and usage patterns. Consider factors like data volume, retention requirements, and the required features when making your selection.\n- **Regularly review your monitoring configuration**: Avoid collecting excessive data by removing unnecessary metrics or logs.\n\n### Tailor data collection to roles and set role-specific retention policies\n\nConsider the specific data needs of different roles. For example, developers\nmight primarily need access to traces and application-level logs, whereas IT\nadministrators might focus on system logs and infrastructure metrics. By tailoring\ndata collection, you can reduce unnecessary storage costs and avoid overwhelming\nusers with irrelevant information.\n\nAdditionally, you can define retention policies based on the needs of each role\nand any regulatory requirements. For example, developers might need access to\ndetailed logs for a shorter period, while financial analysts might require\nlonger-term data.\n\n### Consider regulatory and compliance requirements\n\nIn certain industries, regulatory requirements mandate data retention. To avoid\nlegal and financial risks, you need to ensure that your monitoring and data\nretention practices help you adhere to relevant regulations. At the same time,\nyou need to maintain cost efficiency. Consider the following recommendations:\n\n- Determine the specific data retention requirements for your industry or region, and ensure that your monitoring strategy meets the requirements of those requirements.\n- Implement appropriate data archival and retrieval mechanisms to meet audit and compliance needs while minimizing storage costs.\n\n### Implement smart alerting\n\nAlerting helps to detect and resolve issues in a timely manner. However, a\nbalance is necessary between an approach that keeps you informed, and one that\noverwhelms you with notifications. By designing intelligent alerting systems,\nyou can prioritize critical issues that have higher business impact. Consider\nthe following recommendations:\n\n- **Prioritize issues that affect customers**: Design alerts that trigger rapidly for issues that directly affect the customer experience, like website outages, slow response times, or transaction failures.\n- **Tune for temporary problems**: Use appropriate thresholds and delay mechanisms to avoid unnecessary alerts for temporary problems or self-healing system issues that don't affect customers.\n- **Customize alert severity**: Ensure that the most urgent issues receive immediate attention by differentiating between critical and noncritical alerts.\n- **Use notification channels wisely**: Choose appropriate channels for alert notifications (email, SMS, or paging) based on the severity and urgency of the alerts."]]