透過 SAP Datasphere 將資料從 SAP S/4HANA 複製到 BigQuery

本文件將概略說明如何透過 SAP Datasphere,將資料從 SAP S/4HANA 複製到 BigQuery。SAP Datasphere 提供強大的資料轉換功能,可確保資料正確載入至 BigQuery。這個工作流程會使用 BigQuery Storage Write API,以近乎即時的方式將資料寫入 BigQuery 資料集。

複製方法

如要從 SAP S/4HANA 來源系統讀取資料,您可以使用下列任一複製方法:

  • 以 CDS 為基礎的複製作業:此方法會使用 Core Data Services (CDS) 檢視畫面,這些檢視畫面含有豐富的語意,並在 SAP S/4HANA 中提供預先定義的業務資料模型。

  • 以 SLT 為基礎的複製:此方法會直接複製 SAP S/4HANA 系統的基礎資料庫表格,通常會使用 SAP Landscape Transformation (SLT) 做為複製技術。複製的資料表可用於 Google Cloud Cortex Framework 的資料基礎。

主要差異和注意事項

下表摘要列出這兩種複製方法的主要差異:

功能 以 CDS 為基礎的複製 以 SLT 為基礎的複製
資料表示法 提供以業務為導向的資料檢視畫面,通常會將多個資料表的資料組合成有意義的結構。 可直接存取原始資料表結構。如果您需要精細控管資料,或需要複製自訂資料表,這項複製方法就很適合您。
易用性 如果您在 SAP Datasphere 中使用預先提供的 CDS 檢視畫面,則設定複製作業會變得更簡單。 可能需要更多技術設定,尤其是在初始設定 SLT 和處理表格依附元件時。
工作彈性 如果您需要複製自訂資料表或未透過標準 CDS 檢視表公開的資料表,靈活度會降低。 提供更大的彈性,可複製任何資料表,包括自訂開發的資料表。
效能
  • 由於商業邏輯和差異計算,會導致正式版資料庫的 CPU 使用量增加。這個方法可能需要為 SAP 資料庫提供額外的 CPU 資源。
  • 由於 CDS 檢視邏輯可能會預先匯總,因此傳輸的資料會減少。
  • 會複製整個資料表,導致網路流量增加,因此這個方法會大量使用網路。不過,這會導致資料庫 CPU 資源的使用量減少。
  • 在未預先匯總的情況下複製完整資料表時,會傳輸更多資料。
Google Cloud Cortex Framework 相容性 如要產生可與 Google Cloud Cortex Framework 相容的支援擷取器的 CDS 檢視畫面,您可以使用社群開發的實用工具,詳情請參閱 GitHub 與預先提供的技術加速器完全相容。

選擇複製方法

最適合的複製方法取決於多項因素,包括預期用途和其他考量因素,例如:

  • 業務需求:如果您主要需要標準業務資料,且希望快速完成設定,則以 CDS 為基礎的複製作業可能會是理想的選擇。如果您需要更專門的資料,或有大量自訂的資料表,請考慮採用以 SLT 為基礎的複製作業。

  • Cortex Framework 相容性。如果您想使用 Cortex Framework,請使用以 SLT 為基礎的複寫功能。

  • 專業技術:如果您具備 SAP Basis 或資料複製專業知識,就能更輕鬆地使用以 CDS 為基礎的複製功能。

  • 資料量和複雜度:如果資料量達到數 TB 或表格關係複雜,則以 SLT 為基礎的複製作業可能更具擴充性。

後續步驟