選擇 SSD 或 HDD 儲存空間

建立 Bigtable 執行個體時,您可以選擇叢集將資料儲存在固態硬碟 (SSD) 或硬碟 (HDD):

  • 在大多數的情況下,SSD 的儲存空間是最有效且最具成本效益的選擇。
  • 有時,HDD 儲存空間適合用於不對延遲時間敏感或不常存取的大型資料集。

不管您選取了哪一種儲存型態,您的資料都會被儲存於橫跨多個實體硬碟的分散式複製檔案系統中。

此頁面的指南將幫助您選擇 SSD 或 HDD。

若不確定,選擇 SSD 儲存空間就對了

通常最好為 Bigtable 叢集使用 SSD 儲存空間,原因如下:

  • 與 HDD 相比之下,SSD 快速許多且其效能可控制在預期範圍內。 在 Bigtable 叢集中,SSD 儲存空間的讀寫延遲遠低於 HDD 儲存空間。
  • 與 SSD 的總處理量相比,HDD 的總處理量較有限。在採用 HDD 儲存空間的叢集中,CPU 使用率可能在達到 100% 之前,就已達到最大輸送量,您可以透過「磁碟負載」指標監控這種情況。如要提高輸送量,必須新增更多節點,但額外節點的費用可能會超過使用硬碟儲存空間所節省的費用。SSD 儲存空間就沒有以上限制,因為其在單一節點提供了較大的總處理量。在一般情況下,採用 SSD 儲存空間的叢集只會在所有可用的 CPU 及記憶體都被使用的狀況下,才會達到最大總處理量。
  • HDD 的個別資料列讀取速度非常緩慢。這是因為在磁碟搜尋時間,HDD 儲存空間支援的每秒資料列讀取數目只有 SSD 儲存空間的 5%。然而,大型的多資料列掃描作業則不會受到不利影響。
  • 相對於 Bigtable 叢集節點的成本,除非您要儲存大量資料,否則 HDD 節省的成本微不足道。因此,除非您要儲存至少 10 TB 的資料,且工作負載對延遲時間不敏感,否則一般來說,不建議使用 HDD 儲存空間。

使用 SSD 儲存空間有一項潛在的缺點,那就是當您儲存大量的資料時,您的叢集需要更多的節點。但實際上,您可能需要這些額外的節點,讓您的叢集足以負荷傳入的流量,而不僅是承受您儲存的大量資料。

HDD 儲存空間的使用案例

HDD 儲存空間適用於符合下列所有條件的用途:

  • 您希望儲存 10 TB 以上的資料。
  • 您不會將這些資料用於與使用者互動或易受延遲時間影響的應用。
  • 您不打算啟用節點 2 倍擴充
  • 您的工作負載符合以下其中一種類別:

    • 批次工作負載包含掃描和寫入作業,且隨機讀取少量資料列或點讀取作業的次數不多。
    • 資料封存:寫入大量資料,但很少讀取這些資料。

例如,若您打算為大量的遠端感測裝置儲存豐富的歷史資料,並且用這些資料生成每日報告,則使用 HDD 儲存空間,以效能換取節省成本是可行的。另一方面,如果您打算使用資料顯示即時資訊主頁,則使用 HDD 儲存空間可能不適合,因為在這種情況下,讀取作業會更加頻繁,而且使用 HDD 儲存空間時,非掃描讀取作業的速度會慢很多。

切換 SSD 及 HDD 儲存空間

建立 Bigtable 執行個體時,您為執行個體選擇的 SSD 或 HDD 儲存空間將無法變更。您無法使用Google Cloud 控制台變更執行個體使用的儲存空間類型。

如要變更表格的儲存類型,請使用備份功能

  1. 建立或規劃使用所需儲存空間類型的執行個體。
  2. 建立資料表備份。
  3. 從備份還原至其他執行個體中的新資料表。

後續步驟

使用 SSD 或 HDD 儲存空間來建立執行個體