SAP BW Open Hub 批次來源

本指南說明如何部署、設定及執行使用 SAP BW Open Hub 批次來源外掛程式的資料管道。您可以透過 BW Open Hub Service,在 Cloud Data Fusion 中使用 SAP 做為批次式和差異式資料擷取作業的來源。

這個外掛程式可讓您透過 Cloud Data Fusion 整合 SAP 應用程式的大量資料。您可以從 SAP DataSources設定及執行大量資料移轉作業,完全不需要進行編碼。

如要瞭解支援的 SAP 應用程式和物件,請參閱支援詳細資料。如要進一步瞭解如何在 Google Cloud上執行 SAP,請參閱「在 Google Cloud上執行 SAP 的簡介」。

目標

  • 設定 SAP BW 系統。
  • 在 Cloud Data Fusion 環境中部署外掛程式。
  • 從 Cloud Data Fusion 下載 SAP 轉移作業,並在 SAP 中安裝。
  • 使用 Cloud Data Fusion 和 SAP BW Open Hub 批次來源,建立資料管道以整合 SAP 資料。

事前準備

如要使用這個外掛程式,您必須具備下列領域的專業知識:

使用者角色

本頁面的工作由 Google Cloud 或 SAP 系統中具有下列角色的使用者執行:

使用者類型 說明
Google Cloud 管理員 獲派此角色的使用者是 Google Cloud 帳戶的管理員。
Cloud Data Fusion 使用者 獲派此角色的使用者有權設計及執行資料管道。他們至少會獲得 Data Fusion 檢視者 ( roles/datafusion.viewer) 角色。如果您使用角色式存取權控管,可能需要其他角色
SAP 管理員 獲派此角色的使用者是 SAP 系統的管理員。他們可以從 SAP 服務網站下載軟體。並非 IAM 角色。
SAP 使用者 指派此角色的使用者可連線至 SAP 系統。這不是 IAM 角色。

SAP BW 的必要條件

您需要使用 SAP HANA Studio 建立及編輯資料移轉程序和程序鏈結。

Cloud Data Fusion 的先決條件

  • 建立 Cloud Data Fusion 執行個體時,必須使用虛擬私有雲網路。
  • 必須使用 Cloud Data Fusion 執行個體 (任何版本,版本 6.8.0 以上)。
  • 必須將必要角色授予指派給 Cloud Data Fusion 執行個體的服務帳戶。詳情請參閱「授予服務帳戶使用者權限」。
  • 您必須在 VPC 和 Google 的共用虛擬私有雲網路之間使用對等互連連線。

設定 SAP BW 系統

SAP BW Open Hub 批次來源使用遠端函式模組 (RFM),必須在擷取資料的每個 SAP 伺服器上安裝。這項 RFM 會以 SAP 傳輸方式提供。

如要設定 SAP 系統,請按照下列步驟操作:

  1. Cloud Data Fusion 使用者必須下載包含 SAP 傳輸的 ZIP 檔案,並提供給 SAP 管理員。詳情請參閱「設定 Cloud Data Fusion」。
  2. SAP 管理員必須將 SAP 傳輸匯入 SAP 系統,並驗證已建立的物件。詳情請參閱「安裝 SAP 傳輸服務」。
  3. 選用:SAP 使用者可以根據機構的安全性政策,修改已提供角色 /GOOG/BWOH_CDF_AUTH 的 SAP 標準授權物件。

安裝 SAP 傳輸檔案

如要在 Cloud Data Fusion 中設計及執行資料管道,SAP 元件會透過 SAP 傳輸檔案提供,並以 ZIP 檔案封存。在 Cloud Data Fusion Hub 中部署外掛程式後,即可下載。

如要安裝 SAP 傳輸工具,請按照下列步驟操作:

步驟 1:上傳運算要求檔案

  1. 登入 SAP 執行個體的作業系統。
  2. 使用 SAP 交易代碼 AL11 取得 DIR_TRANS 資料夾的路徑。通常路徑為 /usr/sap/trans/
  3. 將 cofiles 複製到 DIR_TRANS/cofiles 資料夾。
  4. 將資料檔案複製到 DIR_TRANS/data 資料夾。
  5. 將資料和共用檔案的使用者和群組設為 <sid>admsapsys

步驟 2:匯入傳輸要求檔案

SAP 管理員可以使用下列任一選項匯入傳輸要求檔案:

方法 1:使用 SAP 傳輸管理系統匯入傳輸要求檔案
  1. 以 SAP 管理員身分登入 SAP 系統。
  2. 輸入交易 STMS。
  3. 依序點選「總覽」>「匯入」。
  4. 在「佇列」欄中,按兩下目前的 SID。
  5. 依序點選「額外」>「其他要求」>「新增」
  6. 選取運送要求 ID,然後按一下「繼續」
  7. 在匯入作業佇列中選取運送要求,然後依序點選「要求」>「匯入」。
  8. 輸入客戶編號。
  9. 在「Options」分頁中,選取「Overwrite Originals」和「Ignore Invalid Component Version」

    選用:選取「Leave Transports Requests in Queue for Later Import」(將運送要求保留在佇列中,以便稍後匯入)。這會導致系統在下次匯入所有要求時,以正確的順序再次匯入要求。如果您必須為個別要求進行初步匯入,這個選項就很實用。

  10. 按一下「繼續」

  11. 使用任何適當的交易 (例如 SE80PFCG),確認函式模組和授權角色是否已成功匯入。

方法 2:在作業系統層級匯入傳輸要求檔案
  1. 以 SAP 管理員身分登入 SAP 系統。
  2. 將適當的請求新增至匯入緩衝區:

    tp addtobuffer TRANSPORT_REQUEST_ID SID
    

    例如:tp addtobuffer BW1K900054 DD1

  3. 匯入運輸要求:

    tp import TRANSPORT_REQUEST_ID SID client=NNN U1238
    

    NNN 替換為客戶編號。例如:

    tp import BW1K900054 DD1 client=100 U1238
    
  4. 使用任何適當的交易 (例如 SE80PFCG),確認函式模組和授權角色是否已成功匯入。

必要的 SAP 授權

如要在 Cloud Data Fusion 中執行資料管道,您需要 SAP 使用者。SAP 使用者必須是 CommunicationsDialog 類型。為避免使用 SAP 對話方塊資源,建議您使用 Communications 類型。SAP 管理員可以使用 SAP 交易代碼 SU01 建立使用者。

您必須取得 SAP 授權,才能設定 SAP 連接器。特定連接器的 SAP 授權物件會隨運輸要求一併傳送。按照「安裝 SAP 傳輸」一文的說明匯入授權角色傳輸,將角色帶入系統,並從 PFCG 交易代碼產生角色。

對於標準 SAP 授權物件,貴機構可使用自身的安全性機制管理權限。您可以根據貴機構的安全性政策維護授權物件。

建立程序鏈結 (PC) 和資料移轉程序 (DTP)

建立程序鏈和資料移轉程序需要一些額外的技能和背景知識。

背景概念

如要建立或編輯 PC 和 DTP,請使用 SAP HANA Studio。

必要技能

  • 您已使用轉換定義來源和目標物件之間的資料流。
  • 您熟悉 BW 和 HANA 的基本概念,例如 DataStore 物件 (DSO)、資料轉換、InfoCube、查詢最佳化、HANA 模擬,以及使用 HANA Studio 的 HANA DB 功能。如要進一步瞭解這些概念,請參閱 BW 和 HANA 的 SAP 教學課程

擷取類型

資料移轉程序有兩種資料擷取模式:完整和差異。

  • Full:根據 DTP 中提及的篩選器條件,選取來源中的所有可用資料。如果資料來源是下列 InfoProvider 之一,則只能使用「完整擷取」模式:

    • InfoObjects
    • InfoSets
    • 用於直接更新的 DataStore 物件
  • Delta:與 InfoPackage 不同,使用 DTP 的 Delta 轉移不需要明確初始化。當以 Delta 擷取模式首次執行 DTP 時,系統會從來源擷取所有現有請求,直到擷取時間為止,然後自動初始化差異。

    使用擷取模式 Delta 的 DTP 可使用下列選項:

    • 只取得一次 Delta
    • 取得所有新資料要求
    • Retrieve Until No More New Data

套件大小:這是個別資料套件中資料記錄的數量。預設值為 50,000

建立程序鏈結

如要建立程序鏈 (PC),請在 SAP GUI 中使用 RSPC 交易。定義啟動程序,然後新增程序步驟和 DTP。詳情請參閱 SAP 說明文件,瞭解如何建立程序鏈

HANA Studio 提供多種選項,可用於監控及管理 PC。詳情請參閱 SAP BW/4HANA 程序鏈作業

使用程序鏈結建立資料移轉程序

前往要用於資料移轉程序的程序鏈結的「規劃」檢視畫面。您可以透過「Planning」檢視畫面,使用 HANA Studio 建立 DTP。如需更多資訊,請參閱 SAP 說明文件,瞭解如何建立資料移轉程序

如要進一步瞭解設定選項,請參閱「Data Transfer Process (DTP) – SAP BW 7 相關資訊」。

RFC 連線

如要通知回呼系統 (例如 SAP BW Open Hub Batch Source 外掛程式) 資料可供使用,請務必更新程序鏈結,以便使用 RFC 目的地:

  1. 在 SM59 中,建立類型為 TCP/IP 連線的 RFC 連線,以便在 BI 完成資料載入後,從 BW 通知目標系統。

  2. 請雙擊 RFC 連線,確認已在 RFC 連線中設定 Program ID。為避免執行階段事件監聽器發生衝突,每個 RFC 目的地的 Program ID 不得重複。

  3. 使用程序鏈結中新建立的 TCP/IP 連線傳送通知,以便完成 Cloud Data Fusion 批次工作。處理程序鏈結的名稱不區分大小寫。在端對端整合程序中,必須正確使用大寫字母指定此值。

顯示程序鏈和資料轉移程序的記錄

  1. 前往 Tcode:RSPC,然後點選「Process Chains」

  2. 在要顯示記錄的程序鏈結上按一下滑鼠右鍵,然後點選「Display Logs」

使用程序鏈結時設定 Dataproc 叢集

如要啟用透過 RFC 伺服器的通訊功能,您必須在 Dataproc 叢集節點的 /etc/services 檔案中新增 SAP Gateway 連接埠項目。建議使用 init action,這是叢集初始化時要執行的指令碼。詳情請參閱「初始化動作」。

建立指令碼檔案並儲存至 Cloud Storage 值區。以下範例顯示指令碼檔案的內容:

gs://cdf-sap-dependent-files/addgw.sh
#!/bin/bash
echo 'sapgw00 3300/tcp' >> /etc/services
echo 'sapgw01 3301/tcp' >> /etc/services
echo 'sapgw02 3302/tcp' >> /etc/services
echo 'sapgw03 3303/tcp' >> /etc/services
echo 'sapgw04 3304/tcp' >> /etc/services

在上述範例中,請注意以下事項:

  • 項目格式為 sapgwxx 33xx/tcp,其中 XX 是 SAP 例項編號。

  • 新增 SAP 執行個體 0004 的通訊埠。

如果您使用的是暫時性叢集、新建立的永久性叢集或現有的永久性 Dataproc 叢集,請執行下列步驟。

暫時性 Dataproc 叢集

如果您使用的是暫時性 Dataproc 叢集,請將 init 指令碼路徑新增至叢集屬性:

  1. 在工作監控器中,按一下 Cloud Data Fusion 中的管道頁面中的「設定」
  2. 選取運算資源設定檔,然後按一下「自訂」
  3. 在「進階設定」下方的「初始化動作」欄位中,輸入 init 指令碼的路徑。

新的永久 Dataproc 叢集

如果您使用的是新建立的永久 Dataproc 叢集,請使用 gcloud 指令中的 init 指令碼建立叢集。例如:

gcloud dataproc clusters create cluster-name \
  --region=${REGION} \
  --initialization-actions=gs://cdf-sap-dependent-files/addgw.sh \
  ... other flags ...

現有的永久 Dataproc 叢集

如果您使用的是現有的持續性 Dataproc 叢集,請按照下列步驟操作:

如果叢集已建立,但未使用 init 指令碼,請在 Dataproc 叢集的主節點和工作節點中手動新增項目。

  1. 使用 SSH 連線至主要執行個體和叢集節點。
  2. 登入超級使用者 ID。
  3. 前往 /etc/,然後在 VI 編輯器中開啟 /etc/services 檔案。
  4. 新增項目 sapgwxx 33xx/tcp。將 xx 替換為您的 SAP 例項編號。
  5. 儲存 /etc/services 檔案。

設定 Cloud Data Fusion

請確認 Cloud Data Fusion 執行個體與 SAP 伺服器之間已啟用通訊功能。如為私人執行個體,請設定網路對等連線。與代管 SAP 系統的專案建立網路對等互連之後,您不需要額外設定,即可連線至 Cloud Data Fusion 執行個體。SAP 系統和 Cloud Data Fusion 執行個體必須位於同一個專案中。

Cloud Data Fusion 使用者的步驟

  1. 前往執行個體詳細資料:
    1. 在 Google Cloud 控制台中,前往 Cloud Data Fusion 頁面。

    2. 按一下「Instances」(執行個體) ,然後點選執行個體名稱,前往「Instance details」(執行個體詳細資料) 頁面。

      前往「Instances」(執行個體)

  2. 請確認執行個體已升級至 6.8.0 以上版本。如果執行個體是舊版,則必須升級。
  3. 開啟執行個體。Cloud Data Fusion UI 開啟後,按一下「Hub」
  4. 依序選取「SAP」分頁標籤 >「SAP BW」。如果看不到 SAP 分頁,請參閱排解 SAP 整合問題
  5. 按一下「Deploy SAP BW Plugin」。外掛程式會顯示在 Studio 頁面的「Source」選單中。

SAP 管理員和 Google Cloud 管理員的步驟

SAP 管理員會從 SAP 支援網站下載下列 JCo 構件,並將其提供給 Google Cloud 管理員。

  • 一個獨立於平台的 (sapjco3.jar)
  • 一個依平台而異的 (在 Unix 上為 libsapjco3.so)

如要下載檔案,請按照下列步驟操作:

  1. 前往「SAP 連接器」頁面。
  2. 按一下「SAP Java Connector」/「Tools and Services」。您可以選取特定平台的下載連結。
  3. 選取 Cloud Data Fusion 執行個體的執行平台:

    1. 如果您為叢集中的 VM 使用標準 Google Cloud 映像檔 (Cloud Data Fusion 的預設值),請選取「Linux for Intel-compatible processors 64-bit x86」。
    2. 如果您使用自訂映像檔,請選取相應的平台。
  4. Google Cloud 管理員必須將 JCo 檔案複製到可讀取的 Cloud Storage 值區。請將值區路徑提供給 Cloud Data Fusion 使用者,讓他們在 Cloud Data Fusion 的對應外掛程式屬性中輸入:SAP JCo Library GCS Path。請參閱「設定外掛程式」一節。

  5. Google Cloud 管理員必須將這兩個檔案的讀取權限授予設計環境的 Cloud Data Fusion 服務帳戶,以及執行環境的 Dataproc 服務帳戶。詳情請參閱「Cloud Data Fusion 服務帳戶」。

設定外掛程式

SAP BW Open Hub Batch Source 外掛程式會讀取 SAP 資料來源的內容。

如要篩選記錄,您可以為 SAP BW Open Hub 批次來源設定下列屬性。

下列指標用於定義欄位:

  • (M):表示巨集可用於相應欄位
  • (O):選填欄位

標籤:畫布上的外掛程式標籤。

基本

在下列屬性清單中,(M) 表示該選項支援巨集,可用於集中管理 SAP 連線。舉例來說,您可以為連線屬性使用巨集,並使用執行階段參數或引數設定器外掛程式,在執行階段設定值。

  • 參考名稱:用於明確識別此來源的名稱,以便追蹤處理歷程和註解中繼資料。
  • 使用連線 (開/關切換鈕):是否使用現有連線 (請參閱「管理連線」)。如果您選擇使用現有連線,則不必提供任何 SAP 連線詳細資料。

  • 連線 (瀏覽連線):選擇要使用的現有連線。你也可以使用巨集函式 ${conn(connection-name)}

  • SAP 用戶端 (M):要使用的 SAP 用戶端。例如:100

  • SAP 語言 (M):SAP 登入語言。例如:EN

  • 連線類型:SAP 連線類型 (直接或負載平衡)。負載平衡連線不支援以程序鏈為基礎的擷取作業。詳情請參閱「支援詳細資料」。

    選取連線類型後,可用的欄位會隨之變更。

    直接連線可使用下列欄位:

    • SAP 應用程式伺服器主機 (M):SAP 伺服器名稱或 IP 位址。
    • SAP 系統編號 (M):SAP 系統編號。例如:00
    • SAP Router (M、O):路由器字串。

    對於負載平衡連線,您可以使用下列欄位:

    • SAP 訊息伺服器主機 (M):SAP 訊息主機名稱或 IP 位址。
    • SAP 訊息伺服器服務或通訊埠號碼 (M):SAP 訊息伺服器服務或通訊埠號碼。例如:sapms02
    • SAP 系統 ID (SID) (M):SAP 系統 ID。例如:N75
    • SAP 登入群組名稱 (M):SAP 登入群組名稱。例如:PUBLIC
  • 使用程序鏈 (M):這個欄位包含兩個選項。

    如果您使用「是」選項啟用程序鏈結,系統會啟用下列屬性:

    • 自動解決 PC 和 DTP 錯誤:控制系統在偵測到先前執行失敗的情況時的行為。停用後,外掛程式會在管道中發生錯誤。啟用 (預設) 後,外掛程式會檢查 SAP 中的程序鏈結和資料傳輸程序狀態。如果系統偵測到下列任何錯誤,外掛程式會自動嘗試解決這些錯誤:

    • Data Transfer Process in error state:外掛程式刪除先前的請求

    • 紅色狀態的程序鏈結發生錯誤 previous request status has not been set:外掛程式會從程序鏈結記錄取得要求 ID,然後刪除阻斷要求,並嘗試執行程序鏈結。

    • 程序鏈結狀態通知等候時間 (以分鐘為單位) (M、O):等待指定的時間 (以分鐘為單位),讓程序鏈結完成資料暫存作業,並通知管道開始擷取作業。如果您指定 0 或留空,系統會採用預設值 10 分鐘。

    • Process Chain (M):SAP Process Chain 名稱。例如:PC_RFC

    如果您使用「否」選項停用程序鏈結,系統會啟用下列屬性:

    • Open Hub Destination (M):要讀取的 Open Hub Destination 名稱。
    • 要求 ID (M,O):已執行資料移轉程序的要求 ID。

憑證

  • SAP 登入使用者名稱 (M):SAP 使用者名稱。建議:如果 SAP 登入使用者名稱會定期變更,請使用巨集
  • SAP 登入密碼 (M):SAP 使用者密碼。建議:如果是使用者密碼等敏感值,請使用安全巨集

SAP JCo 詳細資料

  • GCP 專案 ID (M): Google Cloud 專案 ID,可用於唯一識別專案。您可以在Google Cloud 控制台的「資訊主頁」中找到這項資訊。
  • SAP JCo 程式庫 GCS 路徑 (M):包含使用者上傳的 SAP JCo 程式庫檔案的 Cloud Storage 路徑。
  • 取得結構定義:如果您希望外掛程式根據 SAP 中的中繼資料產生結構定義,並將 SAP 資料類型自動對應至對應的 Cloud Data Fusion 資料類型,請按一下這個選項。這個按鈕的功能與「驗證」按鈕相同。

如要進一步瞭解用戶端憑證,請參閱「在 ABAP 適用的 SAP NetWeaver Application Server 上使用 X.509 用戶端憑證」。

進階

  • 要產生的分割數量 (M, O):分割數量會用於分割輸入資料。分區數量越多,平行處理的程度就越高,但所需的資源和額外負擔也會增加。在 SAP 內部系統中,如果 UI 未指定值,則分割作業會占 SAP 中可用的對話方塊工作程序 50%。否則,系統會在使用者指定的值與可用工作程序的 50% 之間,將分割作業最佳化。

    建議:除非您熟悉 SAP 系統設定,否則請將屬性留空。

  • 其他 SAP 連線屬性 (M、O):設定其他 SAP JCo 屬性,覆寫 SAP JCo 預設值。舉例來說,設定 jco.destination.pool_capacity = 10 會覆寫預設的連線池容量。

    下表列出支援的 SAP JCo 屬性:

屬性 說明
jco.destination.peak_limit 可同時為目的地建立的有效連線數量上限。
jco.destination.pool_capacity 目的地可維持開放的閒置連線數量上限。0 值的效果是沒有連線集區,也就是在每次要求後關閉連線。
jco.destination.expiration_time ms 中的時間,在該時間過後,內部集區可關閉所保留的連線。
jco.destination.expiration_check_period ms 中的間隔,逾時檢查器執行緒會檢查集區中的連線是否過期。
jco.destination.max_get_client_time 如果應用程式分配的連線數量上限,ms 最多會等待多久等待連線。

資料擷取模式的行為

資料擷取模式可透過資料移轉程序設定控管。使用程序鏈結與使用 Open Hub 目的地時的行為有所不同。

使用程序鏈時

資料移轉程序層級的設定可控制是否執行完整或差異載入作業。要求 ID 會以 SAP 傳送至外掛程式的通知形式傳送。外掛程式會讀取與此單一要求 ID 相關聯的封包資料。

使用 Open Hub 目的地時,但沒有要求 ID

完整載入:首次執行管道時,會取得 Open Hub 表格中的所有可用要求 ID。外掛程式會讀取與這些要求 ID 相關聯的封包資料。

差異載入:在下次執行相同管道時,會在擷取上次要求 ID 後,擷取所有可用的差異要求 ID。外掛程式會讀取與這些要求 ID 相關聯的封包資料。

使用 Open Hub 目的地搭配要求 ID

全載:第一次執行管道時,會取得所有大於指定要求 ID 的下一個可用要求 ID。外掛程式會讀取與這些要求 ID 相關聯的封包資料。

Delta 載入:下次執行相同管道時,會在擷取上次要求 ID 後,擷取所有可用的 Delta 要求 ID。外掛程式會讀取與這些要求 ID 相關聯的封包資料。

資料類型對應

下表顯示 SAP BW 和 Cloud Data Fusion 中使用的資料類型之間的對應關係。

BW 資料類型 ABAP 類型 說明 (SAP) Cloud Data Fusion 資料類型
數字
INT1 b 1 位元組整數 integer
INT2 s 2 位元組整數 integer
INT4 i 4 位元整數 integer
INT8 8 8 位元整數 long
12 月 p BCD 格式的已壓縮數字 (DEC) decimal
DF16_DEC
DF16_RAW
a 十進位浮點 8 個位元組 IEEE 754r decimal
DF34_DEC
DF34_RAW
e 十進位浮點 16 位元組 IEEE 754r decimal
FLTP f 二進位浮點數 double
角色
CHAR
LCHR
c 字元字串 string
SSTRING
GEOM_EWKB
string 字元字串 string
STRING string 字元字串 CLOB bytes
NUMC
ACCP
n 數字文字 string
位元組
RAW
LRAW
x 二進位資料 bytes
RAWSTRING xstring 位元組字串 BLOB bytes
日期/時間
DATS d 日期 date
TIMS t 時間 time
TIMESTAMP utcl 時間戳記
Utclong
timestamp

驗證

按一下「驗證」或「取得結構定義」

外掛程式會驗證屬性,並根據 SAP 中的中繼資料產生結構定義。會自動將 SAP 資料類型對應至相應的 Cloud Data Fusion 資料類型。

執行資料管道

  1. 部署管道後,按一下「設定」
  2. 選取「資源」
  3. 如有需要,請根據整體資料大小和管道中使用的轉換次數,變更 Executor CPUMemory
  4. 按一下 [儲存]
  5. 如要啟動資料管道,請按一下「Run」

發揮最大效能

最佳化外掛程式設定

請在執行管道時使用下列屬性,以發揮最佳效能:

  • Cloud Data Fusion 外掛程式屬性中的 Number of Splits to Generate:直接控制 Cloud Data Fusion 端的平行作業。執行階段引擎會在擷取資料表記錄時,建立指定數量的分區和 SAP 連線。建議使用介於 816 之間的值,但您也可以在 SAP 端使用適當的設定,將值提高至 3264,方法是為 SAP 中的作業程序分配適當的記憶體資源。

    如果值為 0 或留空 (建議),系統會根據可用的 SAP 工作程序數量、要擷取的記錄和套件大小,自動選擇適當的值。

  • BW 資料移轉程序屬性中的「Package Size」:此屬性可控制個別資料包中顯示的資料記錄數量。預設值為 50,000。提高這個值雖然可能會提升效能,但也會增加資源負載。如果您已使用較高的值,請將其調低,以便更有效地並行執行擷取作業。

Cloud Data Fusion 資源設定

建議:每個執行緒使用 1 個 CPU 和 4 GB 記憶體。這個值適用於每個執行緒程序。請在「設定」>「資源」對話方塊中設定這些值。

Dataproc 叢集設定

建議:至少在工作站之間分配總 CPU 數量,且該數量應大於預期的分割數量。請參閱外掛程式設定

舉例來說,如果有 16 個分割作業,請在所有 worker 中定義總共 20 個以上的 CPU。協調作業會使用 4 個 CPU,因此會產生額外負擔。

建議:使用永久 Dataproc 叢集,縮短資料管道執行時間。這樣一來,您就不需要執行佈建步驟,這可能需要幾分鐘或更長的時間。請在 Compute Engine 設定部分設定這項資訊。

支援詳情

支援的 SAP 產品和版本

支援的來源:

  • SAP NW BW 7.5 以上版本
  • SAP BW4HANA 2.0 SP9 (包含 Open Hub Destination API;BW4HANA 的舊版不支援 Open Hub Destination API)

支援 SAP 負載平衡 (訊息伺服器) 連線

針對 Open Hub 目的地式擷取作業 (不使用 RFC 伺服器),系統支援 SAP 負載平衡 (訊息伺服器) 連線。

系統不支援以程序鏈結為基礎的擷取作業,使用 SAP 負載平衡 (訊息伺服器) 連線。原因是 SAP 在向用戶端系統提供 data ready 通知時有限制,需要在 BW 環境中的每個 SAP 伺服器上註冊 RFC 伺服器 (外掛程式事件監聽器),這會增加連接器的足跡,並可能影響 SAP 效能和資源使用情形。詳情請參閱 SAP 注意事項 2572564 (需登入 SAP 支援帳戶才能查看)。

支援的 SAP 部署模式

我們已使用部署在 Google Cloud上的 SAP 伺服器測試此外掛程式。

支援的 SAP 物件

開放式中樞目的地資料來源:資訊提供者 (資訊物件、資訊立方、資料儲存庫物件、進階資料儲存庫物件、複合式供應者)

程序鏈結,自動將資料轉移程序執行至 Open Hub 目的地。

使用 Oracle HTTP Server 從 SAP 擷取資料的專屬授權

您不需要另外購買授權,即可使用 Oracle HTTP Server (OHS) 從 SAP 擷取資料;不過,請向 SAP 代表洽詢您的特定協議和用途。

預期的外掛程式處理量

如果環境是根據「最佳化效能」一文中的指南進行設定,外掛程式每小時可擷取約 38 GB 的資料。實際效能可能會因 Cloud Data Fusion 和 SAP 系統負載或網路流量而異。

後續步驟