Terraform:RHEL 上 SAP NetWeaver 的 HA 叢集設定指南

本指南說明如何自動部署效能最佳化的 Red Hat Enterprise Linux (RHEL) 高可用性 (HA) 叢集,以便用於 SAP NetWeaver。

本指南會使用 Terraform 部署兩部 Compute Engine 虛擬機器 (VM)、一個虛擬 IP 位址 (VIP) 和內部傳送網路負載平衡器實作方式,以及一個以作業系統為基礎的 HA 叢集,所有這些都遵循 Google Cloud、SAP 和作業系統供應商的最佳做法。

如要瞭解如何為 SAP NetWeaver 部署非高可用性的 Compute Engine VM,請參閱您作業系統適用的 SAP NetWeaver 部署指南

如要在 SUSE Linux Enterprise Server (SLES) 上為 SAP NetWeaver 設定 HA 叢集,請參閱 SLES 上 SAP NetWeaver 的 HA 叢集手動設定指南

本指南適用對象為熟悉如何針對 SAP NetWeaver 進行 Linux 高可用性設定的進階 SAP NetWeaver 使用者。

本指南部署的系統

您將按照本指南的說明,部署兩個 SAP NetWeaver 執行個體,並在 RHEL 上設定 HA 叢集。您可以在相同地區內的不同區域中,將每個 SAP NetWeaver 執行個體部署至 Compute Engine VM。本指南未涵蓋基礎資料庫的高可用性安裝作業。

適用單一節點 SAP NetWeaver 系統的高可用性 Linux 叢集總覽

已部署叢集包含下列功能和特色:

  • 兩個主機 VM,一個用於有效的 ASCS 例項,另一個用於 ENSA2 Enqueue Replicator 或 ENSA1 Enqueue Replication Server (ENSA1) 的有效例項。ENSA2 和 ENSA1 執行個體都稱為「有效收益分成」ERS
  • Pacemaker 高可用性叢集資源管理員。
  • STONITH 防護機制。
  • 自動將故障的執行個體重新啟動為新的次要執行個體。

事前準備

建立 SAP NetWeaver 高可用性叢集前,請確保符合下列必備條件:

除了 Google Cloud 環境所需的部分外,本指南中的資訊與 Red Hat 和 SAP 的以下相關指南一致:

建立網路

基於安全性考量,請建立新的網路。您可以新增防火牆規則或使用另一個存取權控管方法,藉此控管具有存取權的對象。

如果您的專案具有預設的虛擬私有雲網路,請勿使用。請建立您自己專屬的虛擬私有雲網路,確保系統只套用您明確建立的防火牆規則。

在部署期間,Compute Engine 執行個體通常需要網際網路的存取權,才能下載 Google Cloud的 SAP 代理程式。如果您使用 Google Cloud提供的其中一種 SAP 認證 Linux 映像檔,則計算機執行個體也需要存取網際網路,才能註冊憑證並且存取 OS 供應商存放區。具有 NAT 閘道和 VM 網路標記的設定即可支援上述存取需求,即便目標運算執行個體沒有外部 IP 也沒關係。

如要為專案建立虛擬私有雲網路,請完成下列步驟:

  1. 建立自訂模式網路。詳情請參閱「建立自訂模式網路」。

  2. 建立子網路,並指定地區和 IP 範圍。詳情請參閱「新增子網路」。

設定 NAT 閘道

如果您需要建立一或多個沒有公開 IP 位址的 VM,就必須使用網路位址轉譯 (NAT),讓 VM 能夠存取網際網路。使用 Cloud NAT,這是一項 Google Cloud 分散式軟體定義的受控服務,可讓 VM 將傳出封包傳送至網際網路,並接收任何相應的已建立傳入回應封包。或者,您也可以設定個別的 VM 做為 NAT 閘道。

如要為專案建立 Cloud NAT 執行個體,請參閱「使用 Cloud NAT」。

為專案設定 Cloud NAT 後,VM 執行個體就能在不使用公開 IP 位址的情況下,安全地存取網際網路。

新增防火牆規則

根據預設,系統會封鎖來自您 Google Cloud 網路以外的連入連線。如要允許連入的連線,請為 VM 設定防火牆規則。防火牆規則只管制新進入 VM 的連入流量。與 VM 建立連線後,系統將允許透過該連線的雙向流量。

您可以建立防火牆規則來允許存取特定連接埠,或允許同一個子網路中不同 VM 之間的存取作業。

建立防火牆規則允許下列存取作業:

  • SAP NetWeaver 使用的預設連接埠,如適用於所有 SAP 產品的 TCP/IP 連接埠網頁所述。
  • 從電腦或公司網路環境到 Compute Engine VM 執行個體的連線。如果不確定要使用哪一個 IP 位址,請詢問貴公司的網路管理員。
  • 3 層、擴充或高可用性設定中不同 VM 之間的通訊。舉例來說,如果您部署的是 3 層系統,則子網路中至少要有 2 個 VM:一個 VM 用於 SAP NetWeaver,另一個 VM 用於資料庫伺服器。如要讓兩個 VM 之間進行通訊,您必須建立防火牆規則,允許來自子網路的流量。
  • Cloud Load Balancing 健康狀態檢查。

如要為專案建立防火牆規則,請參閱「建立防火牆規則」。

建立 SAP NetWeaver 適用的高可用性 Linux 叢集

以下說明如何使用 Terraform 設定檔,為 SAP NetWeaver 建立具備兩個 Compute Engine VM 的 RHEL 高可用性叢集。在 SAP 中央服務和排隊複寫的自動容錯設定中,在兩個目標區域中建立 Compute Engine VM。

您將在 Terraform 設定檔中定義 SAP NetWeaver 高可用性叢集的設定選項。

  1. 開啟 Cloud Shell。

    前往 Cloud Shell

  2. 將 SAP NetWeaver 高可用性叢集的 sap_nw_ha.tf 設定檔下載到工作目錄:

    $ wget https://storage.googleapis.com/cloudsapdeploy/terraform/latest/terraform/sap_nw_ha/terraform/sap_nw_ha.tf
  3. 在 Cloud Shell 程式碼編輯器中開啟 sap_nw_ha.tf 檔案。

    如要開啟 Cloud Shell 程式碼編輯器,請按一下 Cloud Shell 終端機視窗右上角的鉛筆圖示。

  4. sap_nw_ha.tf 檔案中,使用安裝的值取代雙引號內的內容,即可更新引數值。下表說明引數。

    引數 資料類型 說明
    source 字串

    指定在部署期間要使用的 Terraform 模組位置和版本。

    sap_nw_ha.tf 設定檔包含兩個 source 引數例項:一個是處於啟用狀態,另一個則是做為註解加入。預設啟用的 source 引數會將 latest 指定為模組版本。source 引數的第二個例項預設會因開頭的 # 字元而停用,用來指定可識別模組版本的時間戳記。

    如果您需要所有部署作業都使用相同的模組版本,請從指定版本時間戳記的 source 引數中移除開頭的 # 字元,然後將其新增至指定 latestsource 引數。

    project_id 字串 指定您要部署此系統的 Google Cloud 專案 ID。例如:my-project-x
    machine_type 字串 指定您需要執行 SAP 系統的 Compute Engine 虛擬機器 (VM) 類型。如果您需要自訂的 VM 類型,請指定預先定義的 VM 類型,並將 vCPU 數量設為最接近您所需數量的數字,但仍要大於該數字。部署完成後,請修改 vCPU 數量和記憶體容量

    例如 n1-highmem-32

    network 字串 指定您需要建立負責管理 VIP 的負載平衡器所在網路名稱。

    如果您使用共用虛擬私有雲網路,則必須將主專案的 ID 新增為網路名稱的父項目錄。例如:HOST_PROJECT_ID/NETWORK_NAME

    subnetwork 字串 指定您在先前步驟中建立的子網路名稱。如果您要部署共用虛擬私有雲端,請將這個值指定為 SHARED_VPC_PROJECT_ID/SUBNETWORK。例如:myproject/network1
    linux_image 字串 指定要部署 SAP 系統的 Linux 作業系統映像檔名稱。例如:rhel-9-2-sap-ha。如需可用的作業系統映像檔清單,請參閱 Google Cloud 控制台的「映像檔」頁面。
    linux_image_project 字串 請指定 Google Cloud 專案,該專案包含您為引數 linux_image 指定的圖片。這個專案可能是您自己的專案或 Google Cloud 映像檔專案。如為 Compute Engine 映像檔,請指定 rhel-sap-cloud。如要查看作業系統的映像檔專案,請參閱「作業系統詳細資料」。
    sap_primary_instance 字串 指定主要 SAP NetWeaver 系統的 VM 執行個體名稱。 這是初始 ASCS 位置。名稱可包含小寫英文字母、數字或連字號,但長度不得超過 13 個半形字元。
    sap_primary_zone 字串 指定部署主要 SAP NetWeaver 系統的區域。主要和次要系統的區域須位於同一地區。例如:us-east1-b
    sap_secondary_instance 字串 指定次要 SAP NetWeaver 系統的 VM 執行個體名稱。 這是你最初的 ERS 位置。名稱可包含小寫英文字母、數字或連字號,但長度不得超過 13 個半形字元。
    sap_secondary_zone 字串 指定部署次要 SAP NetWeaver 系統的區域。主要和次要系統的區域須位於同一地區。例如:us-east1-c
    nfs_path 字串 指定共用檔案系統的 NFS 掛接點。例如:10.163.58.114:/ssd_nfs
    sap_sid 字串 指定 SAP 系統 ID。ID 必須包含 3 個英數字元,並以字母開頭。所有字母都必須大寫。例如 ED1
    hc_firewall_rule_name 字串 (非必要) 指定健康狀態檢查防火牆規則的名稱。預設值為 SAP_SID-hc-allow
    hc_network_tag 字串 (非必要) 指定一或多個以半形逗號分隔的網路標記,這些標記會與健康狀態檢查防火牆規則的 VM 例項建立關聯。預設值為 SAP_SID-hc-allow-tag
    scs_inst_group_name 字串 (非必要) 指定 ASCS 執行個體群組的名稱。預設值為 SAP_SID-scs-ig
    scs_hc_name 字串 (非必要) 指定 ASCS 健康狀態檢查的名稱。預設值為 SAP_SID-scs-hc
    scs_hc_port 字串 (非必要) 為 ASCS 健康檢查指定通訊埠。為避免與其他服務衝突,請在私人範圍 49152-65535 中指定 ASCS 健康檢查的通訊埠編號。預設值為 60000
    scs_vip_address 字串 (非必要) 在先前 subnetwork 指定的子網路中指定未使用的 IP 位址,做為 ASCS 執行個體的虛擬 IP 位址。如果未指定,部署指令碼會自動從指定子網路中選取未使用的 IP 位址。
    scs_vip_name 字串 (非必要) 指定 ASCS 虛擬 IP 的名稱。預設值為 SAP_SID-scs-vip
    scs_backend_svc_name 字串 (非必要) 指定 ASCS 後端服務的名稱。預設值為 SAP_SID-scs-backend-svc
    scs_forw_rule_name 字串 (非必要) 指定 ASCS 轉送規則的名稱。預設值為 SAP_SID-scs-fwd-rule
    ers_inst_group_name 字串 (非必要) 指定 ERS 執行個體群組的名稱。預設值為 SAP_SID-ers-ig
    ers_hc_name 字串 (非必要) 指定 ERS 健康檢查的名稱。預設值為 SAP_SID-ers-hc
    ers_hc_port 字串 (非必要) 指定 ERS 健康檢查的通訊埠。為避免與其他服務衝突,請在私人範圍 49152-65535 中指定 ERS 健康檢查的通訊埠號碼。預設值為 60010
    ers_vip_address 字串 (非必要) 在先前 subnetwork 指定的子網路中指定未使用的 IP 位址,做為 ERS 執行個體的虛擬 IP 位址。如果未指定,部署指令碼會自動從指定子網路中選取未使用的 IP 位址。
    ers_vip_name 字串 (非必要) 指定 ERS 虛擬 IP 的名稱。預設值為 SAP_SID-ers-vip
    ers_backend_svc_name 字串 (非必要) 指定 ERS 後端服務的名稱。預設值為 SAP_SID-ers-backend-svc
    ers_forw_rule_name 字串 (非必要) 指定 ERS 轉送規則的名稱。預設值為 SAP_SID-ers-fwd-rule
    usr_sap_size 整數 (非必要) 以 GB 為單位指定 /usr/sap 磁碟的大小。 最小大小為 8 GB。預設值為 8
    sap_mnt_size 整數 (非必要) 以 GB 為單位指定 /sapmnt 磁碟的大小。 最小大小為 8 GB。預設值為 8
    swap_size 整數 (非必要) 以 GB 為單位指定交換磁碟區的大小。最小大小為 8 GB。預設值為 8
    sap_scs_instance_number 字串 (非必要) 請指定 ASCS 執行個體編號。sap_scs_instance_number 必須是兩位數字。如果您需要指定單位數字,請在號碼前方加上 0。例如 07。預設值為 00
    sap_ers_instance_number 字串 (非必要) 請指定 ERS 執行個體編號。sap_ers_instance_number 必須是兩位數字。如果您需要指定單位數字,請在號碼前方加上 0。例如 07。預設值為 10
    sap_nw_abap 布林值 (非必要) 指定您要部署 SAP NetWeaver 的 ABAP 堆疊還是 Java 堆疊。如為 SAP NetWeaver 的 Java 堆疊,請指定 false。預設值為 true
    pacemaker_cluster_name 字串 (非必要) 指定 Pacemaker 叢集的名稱。預設值為 SAP_SID-cluster
    public_ip 布林值 (非必要) 如要為 VM 執行個體建立臨時公開 IP 位址,請將 public_ip 設為 true。預設值為 false
    service_account 字串 (非必要) 指定使用者代管的服務帳戶電子郵件地址,供主機 VM 和在主機 VM 上執行的程式使用。例如:svc-acct-name@project-id.iam.gserviceaccount.com

    如果您指定這個引數但未附加值,或省略這個引數,安裝指令碼就會使用 Compute Engine 的預設服務帳戶。詳情請參閱「Google Cloud 中的 SAP 程式身分與存取權管理」。 Google Cloud

    network_tags 字串 (非必要) 指定一或多個以半形逗號分隔的網路標記,用於與 VM 執行個體建立關聯,以便用於防火牆或轉送。

    ILB 元件的網路標記會自動新增至 VM 的網路標記

    如果 public_ip = false 且未指定網路標記,請務必提供其他能存取網際網路的方式。

    sap_deployment_debug 布林值 (非必要) 只有在 Cloud 客戶服務團隊要求您為部署作業啟用偵錯功能時,才指定 true,這樣部署作業就會產生詳細的部署記錄。預設值為 false
    primary_reservation_name 字串 (非必要) 如要使用特定 Compute Engine VM 保留項目來佈建主機代管 HA 叢集主要 SAP HANA 執行個體的 VM 執行個體,請指定保留項目名稱。根據預設,安裝指令碼會根據下列條件選取任何可用的 Compute Engine 預留容量。

    無論您是否指定名稱,或安裝指令碼是否自動選取名稱,保留項目都必須設定下列項目,才能使用:

    • specificReservationRequired 選項已設為 true,或是在 Google Cloud 控制台中選取「Select specific reservation」(選取特定保留項目) 選項。
    • 部分 Compute Engine 機器類型支援的 CPU 平台並未納入機器類型的 SAP 認證範圍。如果目標保留項目適用於下列任何機器類型,則保留項目必須指定最低 CPU 平台,如下所示:
      • n1-highmem-32:Intel Broadwell
      • n1-highmem-64:Intel Broadwell
      • n1-highmem-96:Intel Skylake
      • m1-megamem-96:Intel Skylake
    • 所有其他機器類型 (已獲 SAP 認證,可用於 Google Cloud ) 的最低 CPU 平台,均符合 SAP 最低 CPU 需求。
    secondary_reservation_name 字串 (非必要) 如要使用特定的 Compute Engine VM 保留項目,為代管 HA 叢集次要 SAP HANA 執行個體的 VM 執行個體進行佈建,請指定保留項目名稱。根據預設,安裝指令碼會根據下列條件選取任何可用的 Compute Engine 預留容量。

    無論您是否指定名稱,或安裝指令碼是否自動選取名稱,保留項目都必須設定下列項目,才能使用:

    • specificReservationRequired 選項已設為 true,或是在 Google Cloud 控制台中選取「Select specific reservation」(選取特定保留項目) 選項。
    • 部分 Compute Engine 機器類型支援的 CPU 平台並未納入機器類型的 SAP 認證範圍。如果目標保留項目適用於下列任何機器類型,則保留項目必須指定最低 CPU 平台,如下所示:
      • n1-highmem-32:Intel Broadwell
      • n1-highmem-64:Intel Broadwell
      • n1-highmem-96:Intel Skylake
      • m1-megamem-96:Intel Skylake
    • 所有其他機器類型 (已獲 SAP 認證,可用於 Google Cloud ) 的最低 CPU 平台,均符合 SAP 最低 CPU 需求。
    can_ip_forward 布林值

    指定是否允許傳送和接收具有不相符來源或目的地 IP 的封包,這可讓 VM 像路由器一樣運作。預設值為 true

    如果您只想使用 Google 內部負載平衡器來管理已部署 VM 的虛擬 IP,請將值設為 false。系統會自動部署內部負載平衡器,做為高可用性範本的一部分。

    以下範例顯示已完成的設定檔,其中定義了 SAP NetWeaver 的高可用性叢集。叢集會使用內部直通式網路負載平衡器來管理 VIP。

    Terraform 會部署設定檔中定義的 Google Cloud資源,然後啟動指令碼接手設定作業系統和 Linux HA 叢集。

    為方便說明,範例中省略了設定檔中的註解。

       # ...
         module "sap_nw_ha" {
         source = "https://storage.googleapis.com/cloudsapdeploy/terraform/latest/terraform/sap_nw_ha/sap_nw_ha_module.zip"
       #
       # By default, this source file uses the latest release of the terraform module
       # for SAP on Google Cloud.  To fix your deployments to a specific release
       # of the module, comment out the source argument above and uncomment the source argument below.
       #
       # source = "https://storage.googleapis.com/cloudsapdeploy/terraform/202201240926/terraform/sap_nw_ha/sap_nw_ha_module.zip"
       #
       # ...
       #
       project_id = "example-project-123456"
       machine_type = "n2-highmem-32"
       network = "example-network"
       subnetwork = "example-subnet-us-central1"
       linux_image = "rhel-8-4-sap-ha"
       linux_image_project = "rhel-sap-cloud"
    
       sap_primary_instance = "nw-ha-vm-1"
       sap_primary_zone = "us-central1-a"
    
       sap_secondary_instance = "nw-ha-vm-2"
       sap_secondary_zone = "us-central1-c"
    
       nfs_path = "10.223.55.130:/pr1_nw"
    
       sap_sid = "PR1"
       # ...
    }
  5. 初始化目前的工作目錄,並下載 Google Cloud的 Terraform 供應器外掛程式和模組檔案:

    terraform init

    terraform init 指令會為其他 Terraform 指令準備工作目錄。

    如要強制重新整理工作目錄中的提供者外掛程式和設定檔,請指定 --upgrade 標記。如果省略 --upgrade 標記,且您未在工作目錄中進行任何變更,Terraform 會使用本機快取的副本,即使 latest 已在 source 網址中指定也一樣。

    terraform init --upgrade 
  6. 視需要建立 Terraform 執行計畫:

    terraform plan

    terraform plan 指令會顯示目前設定所需的變更。如果您略過這個步驟,terraform apply 指令會自動建立新企劃書,並提示您核准。

  7. 套用執行計畫:

    terraform apply

    出現核准動作的提示時,請輸入 yes

    terraform apply 指令會設定 Google Cloud 基礎架構,然後將控制權交給指令碼,以便根據 terraform 設定檔中定義的引數設定 HA 叢集。

    在 Terraform 控制時,系統會將狀態訊息寫入 Cloud Shell。指令碼叫用後,系統會將狀態訊息寫入 Logging,並在 Google Cloud 主控台中顯示,如「檢查 Logging 記錄」一節所述。

    完成時間可能有所不同,但整個程序通常會在 30 分鐘內完成。

驗證 SAP NetWeaver HA 系統的部署作業

驗證 SAP NetWeaver HA 叢集包含多種不同程序:

  • 檢查記錄
  • 檢查 VM 的設定

檢查記錄

  1. 在 Google Cloud 控制台中開啟 Cloud Logging,監控安裝進度及檢查錯誤。

    前往 Cloud Logging

  2. 篩選記錄:

    記錄檔探索工具

    1. 在「Logs Explorer」頁面中,前往「查詢」窗格。

    2. 在「Resource」下拉式選單中,選取「Global」,然後點選「Add」

      如果找不到「Global」選項,請在查詢編輯器中輸入以下查詢:

      resource.type="global"
      "Deployment"
      
    3. 點選「執行查詢」

    舊版記錄檢視器

    • 在「Legacy Logs Viewer」頁面中,從基本選取器選單中選取「Global」做為記錄資源。
  3. 分析篩選過的記錄:

    • 如果顯示 "--- Finished",表示部署程序已完成,您可以繼續進行下一個步驟。
    • 如果畫面顯示配額錯誤:

      1. 在 IAM 和管理員「Quotas」(配額) 頁面上,增加 SAP NetWeaver 規劃指南中所列出不符 SAP NetWeaver 規定的任何配額。

      2. 開啟 Cloud Shell。

        前往 Cloud Shell

      3. 前往工作目錄並刪除部署,清除安裝失敗的 VM 與永久磁碟:

        terraform destroy

        出現是否核准該動作的提示時,請輸入 yes

      4. 重新執行部署。

檢查 VM 的設定

  1. VM 執行個體部署完成且無發生錯誤後,使用 SSH 連線到每個 VM。您可以在 Compute Engine VM 執行個體頁面中,按一下各個 VM 執行個體的 SSH 按鈕,也可以使用您偏好的 SSH 方法。

  2. 變更為超級使用者:

    sudo su -
  3. 在命令提示字元中輸入 df -h。確保畫面顯示 /usr/sap 目錄的輸出內容,例如 /usr/sap/trans

    nw-ha-vm-1:~ # df -h
    Filesystem                             Size  Used Avail Use% Mounted on
    ...
    /dev/mapper/vg_usrsap-vol              8.0G  242M  7.8G   3% /usr/sap
    /dev/mapper/vg_sapmnt-vol              8.0G   90M  7.9G   2% /sapmnt
    10.95.255.130:/pr1_nw/sapmntPR1       1007G     0  956G   0% /sapmnt/PR1
    10.95.255.130:/pr1_nw/usrsaptrans     1007G     0  956G   0% /usr/sap/trans
    10.95.255.130:/pr1_nw/usrsapPR1ASCS00 1007G     0  956G   0% /usr/sap/PR1/ASCS00
    ...
      
    autofs 會在部署期間自動設定,以便在首次存取檔案目錄時掛載常見的共用檔案目錄。叢集軟體會管理 ASCSASCS_INSTANCE_NUMBERERSERS_INSTANCE_NUMBER 目錄的掛載作業,這也是在部署期間設定的項目。

  4. 輸入狀態指令,查看新叢集的狀態: pcs status

    您會看到類似以下示例的結果,其中兩個 VM 執行個體都已啟動,nw-ha-vm-1 是處於活動狀態的主要執行個體:

    nw-ha-vm-1:~ # pcs status
    Cluster name: pr1-cluster
    Cluster Summary:
    * Stack: corosync
    * Current DC: nw-ha-vm-1 (version 2.0.5-9.el8_4.5-ba59be7122) - partition with quorum
    * Last updated: Mon Aug 29 18:03:22 2022
    * Last change:  Mon Aug 29 17:58:21 2022 by root via cibadmin on nw-ha-vm-1
    * 2 nodes configured
    * 8 resource instances configured
    Node List:
    * Online: [ nw-ha-vm-1 nw-ha-vm-2 ]
    Full List of Resources:
    * fence-PR1-nw-ha-vm-1    (stonith:fence_gce):     Started nw-ha-vm-2
    * fence-PR1-nw-ha-vm-2    (stonith:fence_gce):     Started nw-ha-vm-1
    * file-system-PR1-ASCS00    (ocf::heartbeat:Filesystem):     Started nw-ha-vm-1
    * file-system-PR1-ERS10    (ocf::heartbeat:Filesystem):     Started nw-ha-vm-2
    * health-check-PR1-ASCS00    (service:haproxy@PR1ASCS):     Started nw-ha-vm-1
    * health-check-PR1-ERS10    (service:haproxy@PR1ERS):     Started nw-ha-vm-2
    * vip-PR1-ASCS00    (ocf::heartbeat:IPaddr2):     Started nw-ha-vm-1
    * vip-PR1-ERS10    (ocf::heartbeat:IPaddr2):     Started nw-ha-vm-2
    Daemon Status:
    corosync: active/enabled
    pacemaker: active/enabled
    pcsd: active/enabled

  5. 使用 socat 公用程式測試 ASCS 和 ERS 負載平衡器設定:

    1. 在每個 VM 執行個體上,暫時啟動 socat 程序,以便傳回自己的主機名稱:

      socat TCP-LISTEN:80,bind=0.0.0.0,fork,reuseaddr,crlf SYSTEM:"echo HTTP/1.0 200; echo Content-Type\: text/plain; echo; echo $(hostname)" & 
    2. 在每個節點上使用 curl,並嘗試存取下列 IP 位址和主機名稱。您可以在 /etc/hosts 中找到 IP 位址和主機名稱。

      • 127.0.0.1
      • localhost
      • ASCS_VIRTUAL_HOST_NAME
      • ASCS_IP_ADDRESS
      • ERS_VIRTUAL_HOST_NAME
      • ERS_IP_ADDRESS
      • 為參數 scs_vip_name 指定的 SCS VIP 名稱
      • SCS VIP IP 位址,這是針對參數 scs_vip_address 指定的
      • ERS VIP 名稱,這是 ers_vip_name 參數的指定值
      • ERS VIP IP 位址,這是 ers_vip_address 參數指定的項目

    以下是這類測試的輸出範例:

    example-nw1:~ # cat /etc/hosts
    ...
    10.128.1.182 example-nw1.c.myproject.internal example-nw1
    10.128.1.169 example-nw2.c.myproject.internal example-nw2
    10.128.1.46 pr1-scs-vip.c.myproject.internal pr1-scs-vip
    10.128.0.75 pr1-ers-vip.c.myproject.internal pr1-ers-vip
    example-nw1:~ # curl 127.0.0.1
    example-nw1
    example-nw1:~ # curl localhost
    example-nw1
    example-nw1:~ # curl example-nw1
    example-nw1
    example-nw1:~ # curl 10.128.1.182
    example-nw1
    example-nw1:~ # curl example-nw2
    example-nw2
    example-nw1:~ # curl 10.128.1.169
    example-nw2
    example-nw1:~ # curl pr1-scs-vip
    example-nw1
    example-nw1:~ # curl 10.128.1.46
    example-nw1
    example-nw1:~ # curl pr1-ers-vip
    example-nw2
    example-nw1:~ # curl 10.128.0.75
    example-nw2
  6. 如果您使用的是 RHEL for SAP 9.0 以上版本,請務必在 VM 執行個體上安裝 chkconfigcompat-openssl11 套件。

    如需 SAP 的更多資訊,請參閱 SAP 附註 3108316 - Red Hat Enterprise Linux 9.x:安裝和設定

如有任何驗證步驟指出安裝失敗,請採取以下步驟:

  1. 解決錯誤。

  2. 開啟 Cloud Shell。

    前往 Cloud Shell

  3. 前往包含 Terraform 設定檔的目錄。

  4. 刪除部署作業:

    terraform destroy

    出現是否核准該動作的提示時,請輸入 yes

  5. 重新執行部署。

驗證 Google Cloud的 Agent for SAP 安裝狀態

部署 VM 並安裝 SAP 系統後,請確認Google Cloud的 SAP 代理程式是否正常運作。

確認 Google Cloud的 Agent for SAP 是否正在執行

如要確認代理程式是否正在執行,請按照下列步驟操作:

  1. 建立與 Compute Engine 執行個體的 SSH 連線。

  2. 執行下列指令:

    systemctl status google-cloud-sap-agent

    如果代理程式運作正常,輸出內容就會包含 active (running)。例如:

    google-cloud-sap-agent.service - Google Cloud Agent for SAP
    Loaded: loaded (/usr/lib/systemd/system/google-cloud-sap-agent.service; enabled; vendor preset: disabled)
    Active:  active (running)  since Fri 2022-12-02 07:21:42 UTC; 4 days ago
    Main PID: 1337673 (google-cloud-sa)
    Tasks: 9 (limit: 100427)
    Memory: 22.4 M (max: 1.0G limit: 1.0G)
    CGroup: /system.slice/google-cloud-sap-agent.service
           └─1337673 /usr/bin/google-cloud-sap-agent
    

如果代理程式未執行,請重新啟動代理程式

確認 SAP Host Agent 正在接收指標

如要確認Google Cloud的 Agent for SAP 是否收集基礎架構指標,並正確傳送至 SAP Host Agent,請按照下列步驟操作:

  1. 在 SAP 系統中輸入交易 ST06
  2. 在「Overview」(總覽) 窗格中,查看以下欄位的可用性和內容,確認 SAP 和 Google 監控基礎架構已做好正確的端對端設定:

    • 雲端服務供應商Google Cloud Platform
    • Enhanced Monitoring Access (強化版監控功能存取權)TRUE
    • Enhanced Monitoring Details (強化版監控功能詳細資料)ACTIVE

安裝 ASCS 和 ERS

以下部分僅涵蓋在 Google Cloud上安裝 SAP NetWeaver 的相關規定和建議。

如需完整安裝操作說明,請參閱 SAP NetWeaver 說明文件

準備安裝

為確保叢集中的一致性並簡化安裝作業,請在安裝 SAP NetWeaver ASCS 和 ERS 元件前,定義使用者、群組和權限,並將次要伺服器設為待機模式。

  1. 將叢集移出維護模式:

    # sudo pcs property set maintenance-mode="false"

  2. 在兩部伺服器上以超級使用者身分輸入下列指令,指定適合您環境的使用者和群組 ID:

    # groupadd -g GID_SAPINST sapinst
    # groupadd -g GID_SAPSYS sapsys
    # useradd -u UID_SIDADM SID_LCadm -g sapsys
    # usermod -a -G sapinst SID_LCadm
    # useradd -u UID_SAPADM sapadm -g sapinst
    
    # chown SID_LCadm:sapsys /usr/sap/SID/SYS
    # chown SID_LCadm:sapsys /sapmnt/SID -R
    # chown SID_LCadm:sapsys /usr/sap/trans -R
    # chown SID_LCadm:sapsys /usr/sap/SID/SYS -R
    # chown SID_LCadm:sapsys /usr/sap/SID -R

    如果您使用的是簡易掛載設定,請改為以 root 身分在兩部伺服器上執行下列指令。指定適合您環境的使用者和群組 ID。

    # groupadd -g GID_SAPINST sapinst
    # groupadd -g GID_SAPSYS sapsys
    # useradd -u UID_SIDADM SID_LCadm -g sapsys
    # usermod -a -G sapinst SID_LCadm
    # useradd -u UID_SAPADM sapadm -g sapinst
    
    # chown SID_LCadm:sapsys /usr/sap/SID
    # chown SID_LCadm:sapsys /sapmnt/SID -R
    # chown SID_LCadm:sapsys /usr/sap/trans -R
    # chown SID_LCadm:sapsys /usr/sap/SID -R
    # chown SID_LCadm:sapsys /usr/sap/SID/SYS

    更改下列內容:

    • GID_SAPINST:指定 SAP 佈建工具的 Linux 群組 ID。
    • GID_SAPSYS:指定 SAPSYS 使用者的 Linux 群組 ID。
    • UID_SIDADM:指定 SAP 系統 (SID) 管理員的 Linux 使用者 ID。
    • SID_LC:指定系統 ID (SID)。請使用小寫字母。
    • UID_SAPADM:指定 SAP 主機代理程式的使用者 ID。
    • SID:指定系統 ID (SID)。所有字母都使用大寫。

    舉例來說,以下是實際的 GID 和 UID 編號配置:

    Group sapinst      1001
    Group sapsys       1002
    Group dbhshm       1003
    
    User  en2adm       2001
    User  sapadm       2002
    User  dbhadm       2003

安裝 ASCS 元件

  1. 在次要伺服器上輸入下列指令,將次要伺服器置於待命模式:

    # pcs node standby

    將次要伺服器設為待命模式,即可將主要伺服器上的所有叢集資源整合,簡化安裝作業。

  2. 確認次要伺服器處於待命模式:

    # pcs status

    輸出結果會與下列範例相似:

    Cluster name: nwha
       Cluster Summary:
         * Stack: corosync
         * Current DC: nw-ha-vm-1 (version 2.0.5-9.el8_4.3-ba59be7122) - partition with quorum
         * 2 nodes configured
         * 8 resource instances configured
    
       Node List:
         * Online: [ nw-ha-vm-1 nw-ha-vm-2 ]
    
       Full List of Resources:
         * fence-nw-ha-vm-2  (stonith:fence_gce):     Started nw-ha-vm-1
         * fence-nw-ha-vm-1  (stonith:fence_gce):     Stopped
         * Resource Group: nw8_ascs00_group:
           * nw8_vip_ascs00  (ocf::heartbeat:IPaddr2):    Started nw-ha-vm-1
           * nw8_healthcheck_scs (service:haproxy@nw8scs):    Started nw-ha-vm-1
           * nw8_fs_ascs00   (ocf::heartbeat:Filesystem):     Started nw-ha-vm-1
         * Resource Group: nw8_ers10_group:
           * nw8_vip_ers10   (ocf::heartbeat:IPaddr2):    Started nw-ha-vm-1
           * nw8_healthcheck_ers (service:haproxy@nw8ers):    Started nw-ha-vm-1
           * nw8_fs_ers10    (ocf::heartbeat:Filesystem):     Started nw-ha-vm-1
    
       Daemon Status:
         corosync: active/enabled
    
  3. 在主要伺服器上以超級使用者的身分,將目錄變更為暫時安裝目錄 (例如 /tmp),藉此透過執行 SAP Software Provisioning Manager (SWPM) 安裝 ASCS 執行個體。

    • 如要存取 SWPM 的網頁介面,您必須使用 root 使用者的密碼。如果您的 IT 政策不允許 SAP 管理員存取根密碼,您可以使用 SAPINST_REMOTE_ACCESS_USER

    • 啟動 SWPM 時,請使用 SAPINST_USE_HOSTNAME 參數指定您在 /etc/hosts 檔案中為 ASCS VIP 位址定義的虛擬主機名稱。

      例如:

      cd /tmp; /mnt/nfs/install/SWPM/sapinst SAPINST_USE_HOSTNAME=vh-aha-scs
    • 在 SWPM 最終確認頁面上,確認虛擬主機名稱是否正確。

  4. 設定完成後,請將次要 VM 從待命模式中移除:

    # pcs node unstandby

安裝 ERS 元件

  1. 在主要伺服器上以超級使用者或 SID_LCadm 的身份,停止 ASCS 服務。

    # su - SID_LCadm -c "sapcontrol -nr ASCS_INSTANCE_NUMBER -function Stop"
    # su - SID_LCadm -c "sapcontrol -nr ASCS_INSTANCE_NUMBER -function StopService"
  2. 在主要伺服器上輸入下列指令,將主要伺服器置於待命模式:

    # pcs node standby

    將主要伺服器設為待命模式,可將所有叢集資源整合至次要伺服器,簡化安裝程序。

  3. 確認主要伺服器處於待命模式:

    # pcs status

  4. 在次要伺服器上以超級使用者身分,將目錄變更為 /tmp 等暫時安裝目錄,藉此透過執行 SAP Software Provisioning Manager (SWPM) 安裝 ERS 執行個體。

    • 使用安裝 ASCS 元件時使用的使用者和密碼存取 SWPM。

    • 啟動 SWPM 時,請使用 SAPINST_USE_HOSTNAME 參數指定您在 /etc/hosts 檔案中為 ERS VIP 位址定義的虛擬主機名稱。

      例如:

      cd /tmp; /mnt/nfs/install/SWPM/sapinst SAPINST_USE_HOSTNAME=vh-aha-ers
    • 在 SWPM 最終確認頁面上,確認虛擬主機名稱是否正確。

  5. 將主要 VM 從待命狀態移除,讓兩者都處於啟用狀態:

    # pcs node unstandby

設定 SAP 服務

您需要確認服務設定正確無誤、檢查 ASCS 和 ERS 設定檔中的設定,並將 SID_LCadm 使用者新增至 haclient 使用者群組。

確認 SAP 服務項目

  1. 請在兩部伺服器上確認 /usr/sap/sapservices 檔案包含 ASCS 和 ERS 服務的項目。如要執行這項操作,您可以使用 systemVsystemd 整合。

    您可以使用 sapstartsrv 指令搭配 pf=PROFILE_OF_THE_SAP_INSTANCE-reg 選項,新增任何缺少的項目。

    如要進一步瞭解這些整合功能,請參閱下列 SAP 注意事項:

    systemV

    以下範例說明使用 systemV 整合功能時,/usr/sap/sapservices 檔案中的 ASCS 和 ERS 服務項目應如何設定:

    # LD_LIBRARY_PATH=/usr/sap/hostctrl/exe:$LD_LIBRARY_PATH; export LD_LIBRARY_PATH
    /usr/sap/hostctrl/exe/sapstartsrv \
    pf=/usr/sap/SID/SYS/profile/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME \
    -D -u SID_LCadm
    /usr/sap/hostctrl/exe/sapstartsrv \
    pf=/usr/sap/SID/SYS/profile/SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME \
    -D -u SID_LCadm

    systemd

    1. 請確認 /usr/sap/sapservices 檔案包含 ASCS 和 ERS 服務的項目。以下範例說明使用 systemd 整合功能時,這些項目會如何顯示在 /usr/sap/sapservices 檔案中:

      systemctl --no-ask-password start SAPSID_ASCS_INSTANCE_NUMBER # sapstartsrv pf=/usr/sap/SID/SYS/profile/SID_ASCSASCS_INSTANCE_NUMBER_SID_LCascs
      systemctl --no-ask-password start SAPSID_ERS_INSTANCE_NUMBER # sapstartsrv pf=/usr/sap/SID/SYS/profile/SID_ERSERS_INSTANCE_NUMBER_SID_LCers
    2. 在 ASCS 和 ERS 執行個體上停用 systemd 整合功能:

      # systemctl disable SAPSID_ASCS_INSTANCE_NUMBER.service
      # systemctl stop SAPSID_ASCS_INSTANCE_NUMBER.service
      # systemctl disable SAPSID_ERS_INSTANCE_NUMBER.service
      # systemctl stop SAPSID_ERS_INSTANCE_NUMBER.service
    3. 確認已停用 systemd 整合:

      # systemctl list-unit-files | grep sap

      如果輸出內容與下列範例相似,表示 systemd 整合功能已停用。請注意,系統會啟用 saphostagentsaptune 等部分服務,並停用部分服務。

      SAPSID_ASCS_INSTANCE_NUMBER.service disabled
      SAPSID_ERS_INSTANCE_NUMBER.service disabled
      saphostagent.service enabled
      sapinit.service generated
      saprouter.service disabled
      saptune.service enabled

停止 SAP 服務

  1. 在次要伺服器上停止 ERS 服務:

    # su - SID_LCadm -c "sapcontrol -nr ERS_INSTANCE_NUMBER -function Stop"
    # su - SID_LCadm -c "sapcontrol -nr ERS_INSTANCE_NUMBER -function StopService"
  2. 在每部伺服器上,確認所有服務都已停止:

    # su - SID_LCadm -c "sapcontrol -nr ASCS_INSTANCE_NUMBER -function GetSystemInstanceList"
    # su - SID_LCadm -c "sapcontrol -nr ERS_INSTANCE_NUMBER -function GetSystemInstanceList"

    您會看到類似以下範例的輸出內容:

    GetSystemInstanceList
    FAIL: NIECONN_REFUSED (Connection refused), NiRawConnect failed in plugin_fopen()

在 SAP 中停用自動服務重新啟動功能

由於叢集軟體會在備援期間管理 SAP 服務的重新啟動作業,因此為了避免發生衝突,請停用 SAP 軟體自動重新啟動服務的功能。

  1. 在兩個節點上,編輯 /usr/sap/sapservices 檔案,為 ASCS 和 ERS 元件在 sapstartsrv 指令開頭加上註解字元 #,藉此停用 SAP 軟體中的自動重新啟動功能。

    例如:

    #!/bin/sh
    
     #LD_LIBRARY_PATH=/usr/sap/SID/ASCSASCS_INSTANCE_NUMBER/exe:$LD_LIBRARY_PATH; export LD_LIBRARY_PATH; /usr/sap/SID/ASCSASCS_INSTANCE_NUMBER/exe/sapstartsrv pf=/usr/sap/SID/SYS/profile/SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME -D -u SID_LCadm
     #LD_LIBRARY_PATH=/usr/sap/SID/ERSERS_INSTANCE_NUMBER/exe:$LD_LIBRARY_PATH; export LD_LIBRARY_PATH; /usr/sap/SID/ERSERS_INSTANCE_NUMBER/exe/sapstartsrv pf=/usr/sap/SID/SYS/profile/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME -D -u SID_LCadm
     

編輯 ASCS 和 ERS 設定檔

  1. 在任一伺服器上,使用下列任一指令切換至設定檔目錄:

    # cd /usr/sap/SID/SYS/profile
    # cd /sapmnt/SID/profile
  2. 如有需要,您可以透過列出設定檔目錄中的檔案,或使用下列格式,找出 ASCS 和 ERS 設定檔的檔案名稱:

    SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME
    SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME
  3. 如果您使用的是 ENSA1,請在 ASCS 設定檔中設定下列項目,啟用保活功能:

    enque/encni/set_so_keepalive = true

    詳情請參閱 SAP 注意事項 1410736 - TCP/IP:設定保活間隔

  4. 如有需要,請編輯 ASCS 和 ERS 設定檔,變更 Enqueue 伺服器和 Enqueue 複製伺服器的啟動行為。

    ENSA1

    在 ASCS 設定檔的「啟動 SAP 排隊伺服器」部分中,如果您看到 Restart_Program_NN,請將「Restart」變更為「Start」,如以下範例所示。

    Start_Program_01 = local $(_EN) pf=$(_PF)

    在 ERS 設定檔的「啟動排隊複製伺服器」部分,如果您看到 Restart_Program_NN,請將「Restart」變更為「Start」,如以下範例所示。

    Start_Program_00 = local $(_ER) pf=$(_PFL) NR=$(SCSID)

    ENSA2

    在 ASCS 設定檔的「啟動 SAP 排隊伺服器」部分中,如果您看到 Restart_Program_NN,請將「Restart」變更為「Start」,如以下範例所示。

    Start_Program_01 = local $(_ENQ) pf=$(_PF)

    在 ERS 設定檔的「Start enqueue replicator」部分,如果您看到 Restart_Program_NN,請將「Restart」變更為「Start」,如以下範例所示。

    Start_Program_00 = local $(_ENQR) pf=$(_PF) ...

為 ASCS 和 ERS 設定叢集資源

  1. 以任一伺服器的 root 身分,將叢集置於維護模式:

    # pcs property set maintenance-mode="true"
  2. 確認叢集處於維護模式:

    # pcs status
  3. 為 ASCS 和 ERS 服務建立叢集資源:

    ENSA1

    • 為 ASCS 執行個體建立叢集資源。InstanceName 的值是 SWPM 在您安裝 ASCS 時產生的執行個體設定檔名稱。

      # pcs resource create ASCS_INSTANCE_RESOURCE SAPInstance \
          InstanceName=SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME \
          START_PROFILE=/sapmnt/SID/profile/SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME \
          AUTOMATIC_RECOVER=false meta resource-stickiness=5000 migration-threshold=1 \
          failure-timeout=60  --group ASCS_RESOURCE_GROUP \
          op monitor interval=20 on-fail=restart timeout=60 \
          op start interval=0 timeout=600 \
          op stop interval=0 timeout=600
      
      # pcs resource meta ASCS_RESOURCE_GROUP resource-stickiness=3000
      
    • 為 ERS 執行個體建立叢集資源。InstanceName 的值是 SWPM 在安裝 ERS 時產生的執行個體設定檔名稱。參數 IS_ERS=true 會指示 Pacemaker 將 runsersSID 標記設為 ERS 處於作用中的節點的 1

      # pcs resource create ERS_INSTANCE_RESOURCE SAPInstance \
          InstanceName=SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME \
          START_PROFILE=/sapmnt/SID/profile/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME \
          AUTOMATIC_RECOVER=false IS_ERS=true --group ERS_RESOURCE_GROUP \
          op monitor interval=20 on-fail=restart timeout=60 \
          op start interval=0 timeout=600 \
          op stop interval=0 timeout=600
      

    ENSA2

    • 為 ASCS 執行個體建立叢集資源。InstanceName 的值是 SWPM 在您安裝 ASCS 時產生的執行個體設定檔名稱。

      # pcs resource create ASCS_INSTANCE_RESOURCE SAPInstance \
          InstanceName=SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME \
          START_PROFILE=/sapmnt/SID/profile/SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME \
          AUTOMATIC_RECOVER=false meta resource-stickiness=5000 \
          --group ASCS_RESOURCE_GROUP \
          op monitor interval=20 on-fail=restart timeout=60 \
          op start interval=0 timeout=600 \
          op stop interval=0 timeout=600
      
      # pcs resource meta ASCS_RESOURCE_GROUP resource-stickiness=3000
      
    • 為 ERS 執行個體建立叢集資源。InstanceName 的值是 SWPM 在安裝 ERS 時產生的執行個體設定檔名稱。

      # pcs resource create ERS_INSTANCE_RESOURCE SAPInstance \
          InstanceName=SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME \
          START_PROFILE=/sapmnt/SID/profile/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME \
          AUTOMATIC_RECOVER=false IS_ERS=true --group ERS_RESOURCE_GROUP \
          op monitor interval=20 on-fail=restart timeout=60 \
          op start interval=0 timeout=600 \
          op stop interval=0 timeout=600
      

設定位置和排序限制

您可以建立限制,定義哪些服務需要先啟動,以及哪些服務需要在同一主機上一起執行。舉例來說,IP 位址必須與主要 SAP Central Services 執行個體位於相同主機上。

  1. 定義開始順序限制:

ENSA1

  1. 建立並置限制,避免 ASCS 資源與 ERS 資源在同一台伺服器上執行:

    # pcs constraint colocation add ERS_RESOURCE_GROUP with \
        ASCS_RESOURCE_GROUP -5000
    
  2. 設定 ASCS 以備援至 ERS 執行的伺服器,這由標記 runsersSID 是否等於 1 決定:

    # pcs constraint location ASCS_INSTANCE \
        rule score=2000 runs_ers_SID eq 1
  3. 在容錯移轉後,先啟動 ASCS,再將 ERS 移轉至其他伺服器:

    # pcs constraint order start ASCS_RESOURCE_GROUP then \
        stop ERS_RESOURCE_GROUP symmetrical=false kind=Optional
    

ENSA2

  1. 建立並置限制,避免 ASCS 資源與 ERS 資源在同一台伺服器上執行:

    # pcs constraint colocation add ERS_RESOURCE_GROUP  with \
        ASCS_RESOURCE_GROUP -5000
    
  2. 在容錯移轉後,先啟動 ASCS,再將 ERS 移轉至其他伺服器:

    # pcs constraint order start ASCS_RESOURCE_GROUP then \
        stop ERS_RESOURCE_GROUP symmetrical=false kind=Optional
    
  1. 檢查限制:

    # pcs constraint

    畫面會顯示類似以下的輸出:

    Location Constraints:
      Resource: ascs-aha-instance
        Constraint: location-ascs-instance
          Rule: score=2000
            Expression: runs_ers_HKN eq 1
      Resource: fence-nw-ha-vm-1
        Disabled on: nw-ha-vm-1 (score:-INFINITY)
      Resource: fence-nw-ha-vm-2
        Disabled on: nw-ha-vm-2 (score:-INFINITY)
    Ordering Constraints:
      start ascs-group then stop ers-group (kind:Optional) (non-symmetrical)
    Colocation Constraints:
      ascs-group with ers-group (score:-5000)
    Ticket Constraints:
  2. 以任一伺服器的 root 身分,停用叢集維護模式:

    # pcs property set maintenance-mode="false"

設定 SAP 專用的 Red Hat 叢集連接器

在叢集中的每個主機上,設定 SAP Start Service sapstartsrv,以便透過 HA 介面與 Pacemaker 叢集軟體通訊。

  1. 將 SAP 管理員使用者新增至 haclient 群組:

    usermod -a -G haclient SID_LCadm
  2. 在每個設定檔的結尾處加入下列幾行,即可編輯 SAP 例項設定檔。您可以在 /sapmnt/SID/profiles 目錄中找到設定檔。

    service/halib = $(DIR_CT_RUN)/saphascriptco.so
    service/halib_cluster_connector = /usr/bin/sap_cluster_connector
  3. 如果 ASCS 和 ERS 執行個體資源目前在叢集中執行,請停用這些資源:

    pcs resource disable ERS_INSTANCE_RESOURCE
    pcs resource disable ASCS_INSTANCE_RESOURCE
  4. 停止 ASCS 主機上的服務:

    sapcontrol -nr ASCS_INSTANCE_NUMBER -function StopService
  5. 停止 ERS 主機上的服務:

    sapcontrol -nr ERS_INSTANCE_NUMBER -function StopService
  6. 啟用資源:

    pcs resource enable ERS_INSTANCE_RESOURCE
    pcs resource enable ASCS_INSTANCE_RESOURCE
  7. 針對叢集中的每個主機重複執行上述步驟。

如要進一步瞭解 Red Hat 的相關資訊,請參閱「如何在 RHEL 7 和 8 上為 SAPInstance 資源設定 SAP halib」。

在叢集外的主機上安裝資料庫和應用程式伺服器

在高可用性設定中,建議您在不同的主機上安裝資料庫和應用程式伺服器,而非分群中的 ASCS 和 ERS 主機。

為每部伺服器使用不同的主機,可降低複雜度、減少失敗影響多部伺服器的風險,並可依各伺服器類型調整每個 Compute Engine 的大小。

這樣一來,您就能選擇最合適的認證機器大小、避免失敗,並降低複雜度。

本指南未涵蓋資料庫和應用程式伺服器的安裝作業。

如要瞭解如何安裝資料庫伺服器,請參閱:

驗證及測試叢集

本節說明如何執行下列測試:

  • 檢查設定錯誤
  • 確認 ASCS 和 ERS 資源在備援期間正確切換伺服器
  • 確認鎖定功能是否保留
  • 模擬 Compute Engine 維護事件,確保即時遷移不會觸發備援

檢查叢集設定

  1. 以任一伺服器的 root 身分,檢查資源正在哪些節點上執行:

    # pcs status

    在下列範例中,ASCS 資源會在 nw-ha-vm-2 伺服器上執行,而 ERS 資源會在 nw-ha-vm-1 伺服器上執行。

    Stack: corosync
      Current DC: nw-ha-vm-1 (version 1.1.23-1.el7_9.1-9acf116022) - partition with quorum
      Last updated: Wed Apr 13 05:21:21 2022
      Last change: Wed Apr 13 05:21:18 2022 by hacluster via crmd on nw-ha-vm-2
    
      2 nodes configured
      10 resource instances configured
    
      Online: [ nw-ha-vm-1 nw-ha-vm-2 ]
    
      Full list of resources:
    
      fence-nw-ha-vm-1     (stonith:fence_gce):    Started nw-ha-vm-2
      fence-nw-ha-vm-2     (stonith:fence_gce):    Started nw-ha-vm-1
       Resource Group: ascs-group
           ascs-file-system   (ocf::heartbeat:Filesystem):    Started nw-ha-vm-2
           ascs-vip   (ocf::heartbeat:IPaddr2):       Started nw-ha-vm-2
           ascs-healthcheck   (service:haproxy@AHAascs):      Started nw-ha-vm-2
           ascs-aha-instance      (ocf::heartbeat:SAPInstance):   Started nw-ha-vm-2
       Resource Group: ers-group
           ers-file-system    (ocf::heartbeat:Filesystem):    Started nw-ha-vm-1
           ers-vip    (ocf::heartbeat:IPaddr2):       Started nw-ha-vm-1
           ers-healthcheck    (service:haproxy@AHAers):       Started nw-ha-vm-1
           ers-aha-instance       (ocf::heartbeat:SAPInstance):   Started nw-ha-vm-1
    
      Migration Summary:
      * Node nw-ha-vm-1:
      * Node nw-ha-vm-2:
  2. 切換至 SID_LCadm 使用者:

    # su - SID_LCadm
  3. 檢查叢集設定。針對 INSTANCE_NUMBER,請指定在您輸入指令的伺服器上,處於活動狀態的 ASCS 或 ERS 執行個體編號:

    > sapcontrol -nr INSTANCE_NUMBER -function HAGetFailoverConfig

    HAActive 應為 TRUE,如以下範例所示:

    HAGetFailoverConfig
    
    14.04.2022 17:25:45
    HAGetFailoverConfig
    OK
    HAActive: TRUE
    HAProductVersion: Pacemaker
    HASAPInterfaceVersion: sap_cluster_connector
    HADocumentation: https://github.com/ClusterLabs/sap_cluster_connector
    HAActiveNode:
    HANodes:

  4. SID_LCadm 身分檢查設定中的錯誤:

    > sapcontrol -nr INSTANCE_NUMBER -function HACheckConfig

    您會看到類似以下範例的輸出內容:

    14.04.2022 21:43:39
    HACheckConfig
    OK
    state, category, description, comment
    SUCCESS, SAP CONFIGURATION, Redundant ABAP instance configuration, 0 ABAP instances detected
    SUCCESS, SAP CONFIGURATION, Enqueue separation, All Enqueue server separated from application server
    SUCCESS, SAP CONFIGURATION, MessageServer separation, All MessageServer separated from application server
    SUCCESS, SAP STATE, SCS instance running, SCS instance status ok
    SUCCESS, SAP CONFIGURATION, SAPInstance RA sufficient version (vip-ascs_NWT_00), SAPInstance includes is-ers patch
    SUCCESS, SAP CONFIGURATION, Enqueue replication (vip-ascs_NWT_00), Enqueue replication enabled
    SUCCESS, SAP STATE, Enqueue replication state (vip-ascs_NWT_00), Enqueue replication active
    SUCCESS, SAP CONFIGURATION, SAPInstance RA sufficient version (vip-ers_NWT_10), SAPInstance includes is-ers patch

  5. 在 ASCS 處於作用中的伺服器上,以 SID_LCadm 模擬備援:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function HAFailoverToNode ""
  6. 以 root 身分,如果您使用 crm_mon 追蹤備援,應會看到 ASCS 移至其他伺服器、ERS 在該伺服器上停止,然後 ERS 移至 ASCS 原本執行的伺服器。

模擬容錯移轉

模擬主要主機的失敗情況,測試叢集。在發布系統供使用前,請使用測試系統或在正式版系統上執行測試。

您可以透過多種方式模擬失敗,包括:

  • ip link set eth0 down
  • echo c > /proc/sysrq-trigger

這些操作說明會使用 ip link set eth0 down 將網路介面移至離線狀態,因為它會驗證容錯移轉和圍欄。

  1. 備份系統。

  2. 以主機上的有效 SCS 例項的 root 身分,將網路介面設為離線:

    $ ip link set eth0 down
  3. 使用 SSH 重新連線至任一主機,並切換到超級使用者。

  4. 輸入 pcs status 以確認主要主機已在包含次要主機的 VM 中啟用。自動重新啟動功能會在叢集中啟用,因此已停止的主機會重新啟動,並假設為次要主機的角色,如以下範例所示。

     Stack: corosync
      Current DC: nw-ha-vm-1 (version 1.1.23-1.el7_9.1-9acf116022) - partition with quorum
      Last updated: Wed Apr 13 05:21:21 2022
      Last change: Wed Apr 13 05:21:18 2022 by hacluster via crmd on nw-ha-vm-2
    
      2 nodes configured
      10 resource instances configured
    
      Online: [ nw-ha-vm-1 nw-ha-vm-2 ]
    
      Full list of resources:
    
      fence-nw-ha-vm-1     (stonith:fence_gce):    Started nw-ha-vm-2
      fence-nw-ha-vm-2     (stonith:fence_gce):    Started nw-ha-vm-1
       Resource Group: ascs-group
           ascs-file-system   (ocf::heartbeat:Filesystem):    Started nw-ha-vm-1
           ascs-vip   (ocf::heartbeat:IPaddr2):       Started nw-ha-vm-1
           ascs-healthcheck   (service:haproxy@AHAascs):      Started nw-ha-vm-1
           ascs-aha-instance      (ocf::heartbeat:SAPInstance):   Started nw-ha-vm-1
       Resource Group: ers-group
           ers-file-system    (ocf::heartbeat:Filesystem):    Started nw-ha-vm-2
           ers-vip    (ocf::heartbeat:IPaddr2):       Started nw-ha-vm-2
           ers-healthcheck    (service:haproxy@AHAers):       Started nw-ha-vm-2
           ers-aha-instance       (ocf::heartbeat:SAPInstance):   Started nw-ha-vm-2
    
      Migration Summary:
      * Node nw-ha-vm-1:
      * Node nw-ha-vm-2:

確認鎖定項目是否保留

如要確認鎖定項目在備援期間保留,請先選取 Enqueue Server 的版本分頁,然後按照程序產生鎖定項目、模擬備援,並確認 ASCS 再次啟用後鎖定項目是否保留。

ENSA1

  1. SID_LCadm 身分,在 ERS 處於啟用狀態的伺服器上,使用 enqt 程式產生鎖定項目:

    > enqt pf=/PATH_TO_PROFILE/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME 11 NUMBER_OF_LOCKS
  2. SID_LCadm 身分,在啟用 ASCS 的伺服器上,確認鎖定項目是否已註冊:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now

    如果您建立了 10 個鎖,畫面上應會顯示類似以下範例的輸出內容:

    locks_now: 10
  3. SID_LCadm 身分,在 ERS 處於啟用狀態的伺服器上,啟動 enqt 程式的監控函式 OpCode=20

    > enqt pf=/PATH_TO_PROFILE/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME 20 1 1 9999

    例如:

    > enqt pf=/sapmnt/AHA/profile/AHA_ERS10_vh-ers-aha 20 1 1 9999
  4. 如果 ASCS 處於啟用狀態,請重新啟動伺服器。

    在監控伺服器上,當 Pacemaker 停止 ERS 並將其移至其他伺服器時,您應該會看到類似以下的輸出內容。

    Number of selected entries: 10
    Number of selected entries: 10
    Number of selected entries: 10
    Number of selected entries: 10
    Number of selected entries: 10
  5. enqt 監控器停止時,請輸入 Ctrl + c 退出監控器。

  6. 您也可以在任一伺服器上以 root 身分監控叢集容錯移轉:

    # crm_mon
  7. 如同 SID_LCadm,確認鎖定後,請釋放鎖定:

    > enqt pf=/PATH_TO_PROFILE/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME 12 NUMBER_OF_LOCKS
  8. SID_LCadm 身分,在啟用 ASCS 的伺服器上,確認鎖定項目是否已移除:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now

ENSA2

  1. SID_LCadm 身分,在啟用 ASCS 的伺服器上,使用 enq_adm 程式產生鎖定項目:

    > enq_admin --set_locks=NUMBER_OF_LOCKS:X:DIAG::TAB:%u pf=/PATH_TO_PROFILE/SID_ASCSASCS_INSTANCE_NUMBER_ASCS_VIRTUAL_HOST_NAME
  2. SID_LCadm 身分,在啟用 ASCS 的伺服器上,確認鎖定項目是否已註冊:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now

    如果您建立了 10 個鎖,畫面上應會顯示類似以下範例的輸出內容:

    locks_now: 10
  3. 如果 ERS 已啟用,請確認鎖定項目是否已複製:

    > sapcontrol -nr ERS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now

    傳回的鎖定數量應與 ASCS 例項相同。

  4. 如果 ASCS 處於啟用狀態,請重新啟動伺服器。

  5. 您也可以在任一伺服器上以 root 身分監控叢集容錯移轉:

    # crm_mon
  6. SID_LCadm 身分,在重新啟動 ASCS 的伺服器上,確認鎖定項目是否已保留:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now
  7. SID_LCadm 身分,在啟用 ERS 的伺服器上,確認已保留鎖定後,釋放鎖定:

    > enq_admin --release_locks=NUMBER_OF_LOCKS:X:DIAG::TAB:%u pf=/PATH_TO_PROFILE/SID_ERSERS_INSTANCE_NUMBER_ERS_VIRTUAL_HOST_NAME
  8. SID_LCadm 身分,在啟用 ASCS 的伺服器上,確認鎖定項目是否已移除:

    > sapcontrol -nr ASCS_INSTANCE_NUMBER -function EnqGetStatistic | grep locks_now

    您應該會看到類似以下範例的輸出內容:

    locks_now: 0

模擬 Compute Engine 維護作業

模擬 Compute Engine 維護事件,確保即時遷移不會觸發備援作業。

這些指令中使用的逾時和間隔值會計算即時遷移的時間長度。如果在叢集設定中使用較短的值,即時遷移可能會觸發備援機制,風險也會隨之增加。

如要測試叢集的即時遷移容錯值,請按照下列步驟操作:

  1. 在主要節點上,使用下列 gcloud CLI 指令觸發模擬維護作業事件:

    $ gcloud compute instances simulate-maintenance-event PRIMARY_VM_NAME
  2. 確認主要節點不會變更:

    $ pcs status

評估 SAP NetWeaver 工作負載

如要自動為在 Google Cloud上執行的 SAP NetWeaver 高可用性工作負載進行持續驗證檢查,您可以使用Workload Manager

您可以使用 Workload Manager,根據 SAP、 Google Cloud和作業系統供應商的最佳做法,自動掃描及評估 SAP NetWeaver 高可用性工作負載。這有助於改善工作負載的品質、效能和可靠性。

如要瞭解 Workload Manager 支援的最佳做法,以便評估在 Google Cloud上執行的 SAP NetWeaver 高可用性工作負載,請參閱「Workload Manager 適用於 SAP 的最佳做法」。如要瞭解如何使用 Workload Manager 建立及執行評估作業,請參閱「建立並執行評估作業」。

疑難排解

如要排解 SAP NetWeaver 高可用性設定的問題,請參閱「排解 SAP 高可用性設定問題」。

收集 SAP NetWeaver 高可用性叢集的診斷資訊

如需協助解決 SAP NetWeaver 高可用性叢集的問題,請收集必要的診斷資訊,然後與 Cloud Customer Care 團隊聯絡。

如要收集診斷資訊,請參閱「RHEL 高可用性叢集的診斷資訊」。

支援

如果是基礎架構或服務相關問題,請與客戶服務團隊聯絡。 Google Cloud 您可以在 Google Cloud 控制台的「支援總覽」頁面中找到聯絡資訊。如果客戶服務團隊判定問題出在 SAP 系統,就會將您轉介給 SAP 支援團隊。

如要進一步瞭解 SAP 產品相關問題,請使用 SAP 支援登錄您的支援要求。SAP 會評估支援票證,如確定為 Google Cloud基礎架構方面的問題,就會將票證轉移至系統中的適當Google Cloud 元件:BC-OP-LNX-GOOGLEBC-OP-NT-GOOGLE

支援相關規定

您必須符合支援方案的最低需求,才能獲得 SAP 系統和Google Cloud基礎架構和服務的支援服務。

如要進一步瞭解Google Cloud上 SAP 的最低支援需求,請參閱:

執行部署後工作

使用 SAP NetWeaver 系統前,建議您備份新的 SAP NetWeaver HA 系統。

詳情請參閱 SAP NetWeaver 作業指南

後續步驟

如要進一步瞭解高可用性、SAP NetWeaver 和 Google Cloud,請參閱下列資源: