Transfer Appliance 支援下列方法,可將資料複製到設備:
- 適用於 Microsoft Windows、Linux 和 macOS 的 SCP 或 SFTP。
- Linux 和 macOS 的 NFS 共用區。
- Microsoft Windows 和 Linux 的 SMB 共用區。
- 在裝置上掛接 NFS 和 CIFS。
將資料複製到 Transfer Appliance 後,請先確認資料已轉移到 Cloud Storage 值區,再刪除來源資料。
檔案大小和命名規定
上傳至裝置的檔案必須符合 Cloud Storage 檔案大小限制和命名規範:
Transfer Appliance 不會驗證檔案大小或名稱。如果裝置含有不符合這些規則的檔案,Google 可能無法轉移這些檔案。
使用 SCP 或 SFTP 複製資料
如要使用 SCP 或 SFTP 將資料複製到設備,請按照下列步驟操作:
Microsoft Windows
下載支援 UTF-8 檔案名稱的 SCP 或 SFTP 用戶端,例如 WinSCP。
使用 SCP 工具,透過下列設定連線至設備:
- 檔案通訊協定:安全檔案傳輸通訊協定
- 主機名稱:裝置的 IP 位址。
- 通訊埠編號:22
- 使用者名稱:Transfer Appliance 團隊提供的設備使用者名稱。
- 密碼:Transfer Appliance 團隊提供的設備密碼。
Transfer Appliance 上的目的地目錄必須為
/mnt/ta_data
。
Linux
執行下列指令:
scp PATH_TO_FILES USERNAME@IP_ADDRESS:/mnt/ta_data
更改下列內容:
PATH_TO_FILES
:要複製的檔案路徑。USERNAME
:Transfer Appliance 團隊提供的設備使用者名稱。IP_ADDRESS
:設備的 IP 位址。
系統提示時,請輸入 Transfer Appliance 團隊提供的設備密碼。
Apple macOS
執行下列指令:
scp PATH_TO_FILES USERNAME@IP_ADDRESS:/mnt/ta_data
更改下列內容:
PATH_TO_FILES
:要複製的檔案路徑。USERNAME
:Transfer Appliance 團隊提供的設備使用者名稱。IP_ADDRESS
:設備的 IP 位址。
系統提示時,請輸入 Transfer Appliance 團隊提供的設備密碼。
使用 NFS 共用區複製資料
如要使用 NFS 共用將資料複製到設備,請按照下列步驟操作:
如要掛接 Transfer Appliance,請在資料來源上執行下列指令:
Linux
sudo mkdir /mnt/data
sudo mount -o vers=4 IP_ADDRESS:/mnt/ta_data /mnt/data
將
IP_ADDRESS
替換為設備的 IP 位址。
Apple macOS
cd ~
mkdir ta_data
sudo mount -t nfs -o vers=4,resvport IP_ADDRESS:/mnt/ta_data ~/ta_data
將
IP_ADDRESS
替換為設備的 IP 位址。
如要將資料複製到設備,請使用您選擇的複製公用程式。
複製資料是長時間執行的作業。在 Apple macOS 或 Linux 上,我們建議使用
tmux
或screen
,確保複製程序在登出或網路中斷後仍能繼續執行。
儲存 SSH 金鑰
儲存 SSH 金鑰,即可快速登入 Transfer Appliance。 儲存 SSH 金鑰也能提升傳輸速度。
在工作站上,使用下列指令產生金鑰組:
posix-terminal ssh-keygen -t rsa
在設備上建立
/tmp/ssh_key
檔案。將工作站的公開金鑰檔案內容複製到設備的
/tmp/ssh_key
。工作站上的公開金鑰檔案位於下列位置:- Linux:
~/.ssh/id_rsa.pub
- Windows:
C:Users/
USERNAME
/.ssh
如要授權多個金鑰,請在
/tmp/ssh_key
中逐行新增每個金鑰。- Linux:
在設備上執行下列指令。系統會覆寫所有現有金鑰。
ta copy_ssh_keys
登入設備。
如果私密金鑰位於工作站的預設位置,請使用下列指令登入設備:
ssh ta_customer@IP_ADDRESS
如果私密金鑰不在預設位置,請使用下列指令登入設備:
ssh -i PRIVATE_KEY_PATH ta_customer@IP_ADDRESS
使用 SMB 傳輸資料
如要啟用 SMB 檔案共用功能,請按照下列步驟操作:
使用下列檔案共用通訊協定標記,將設備設定為使用 SMB:
ta config --data_port=PORT --ip=IP_ADDRESS --fileshare=smb
系統會共用
ta_data
目錄,並建立下列使用者:- 使用者名稱:
ta_customer
- 密碼:
ta_customer
- 使用者名稱:
根據主機類型連線至 SMB 檔案共用區:
Microsoft Windows
檔案管理員
開啟檔案管理員,然後將檔案路徑編輯為
\\IP_ADDRESS\ta_data
。系統出現提示時,輸入使用者名稱和密碼。
指令列
在 Windows 命令提示字元中輸入以下內容:
net use X: \\IP_ADDRESS\ta_data
系統出現提示時,輸入使用者名稱和密碼。
Linux
檔案管理員
開啟預設檔案管理員,然後按一下「連線到伺服器」。
輸入
smb://IP_ADDRESS/ta_data
。系統出現提示時,輸入使用者名稱和密碼。
指令列
安裝 SMB 用戶端:
sudo apt-get install smbclient
。連線至 SMB 檔案共用區:
smbclient //IP_ADDRESS/ta_data -U USERNAME
畫面上會顯示
smb:\>
提示。
在設備上使用自己的檔案共用
裝置會使用包裝好的 Linux 掛接指令,在裝置上掛接共用區:
執行下列指令:
NFS
在代管 NFS 伺服器的裝置上更新 /etc/exports 檔案,授予伺服器 IP_ADDRESS 存取權。
在設備上執行下列指令:
mkdir /mnt/ta_data_base/ta_mounts/MOUNT_POINT
ta mount --types=nfs --source=NFS_SERVER_IP:/NFS_DIRECTORY --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT --options=OPTIONS
更改下列內容:
IP_ADDRESS
:設備的 IP 位址。MOUNT_POINT
:這個共用項目的掛接點名稱。NFS_SERVER_IP
:主機的 IP 位址,該主機代管 NFS 伺服器NFS_DIRECTORY
:NFS 共用區的路徑。OPTIONS
:以半形逗號分隔的選項清單。 這些選項是 Linux 的 mount 指令允許的選項。
CIFS
在設備上執行下列指令:
mkdir /mnt/ta_data_base/ta_mounts/MOUNT_POINT
ta mount --types=cifs --source=//CIFS_SERVER_IP/CIFS_NAME --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT --options=OPTIONS
更改下列內容:
MOUNT_POINT
:這個共用項目的掛接點名稱。CIFS_SERVER_IP
:主機裝置的 IP 位址,該裝置會代管 CIFS 伺服器。CIFS_NAME
:CIFS 共用名稱。OPTIONS
:以逗號分隔的選項清單,包括 CIFS 共用的密碼和使用者名稱。這些選項是 Linux 的 mount 指令允許的選項。
除非掛接選項另有指定,否則掛接點會在重新啟動時重新掛接,直到您使用「ta unmount」指令移除為止。
如要卸載設備上的任何掛接點,請執行下列指令:
ta unmount --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT
如要將資料複製到設備,請使用您選擇的複製公用程式。
RClone
如要在設備上使用 RClone 執行複製指令,請執行下列指令:
rclone copy /mnt/ta_data_base/ta_mounts/MOUNT_POINT /mnt/ta_data
更改下列內容:
MOUNT_POINT
:包含要轉移資料的目錄。
封存提取
如要在轉移期間將資料封存為 tar 檔案,請執行下列指令:
ta pull --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT --size=ARCHIVE_SIZE_BYTES --destination=/mnt/ta_data --count=THREAD_COUNT
更改下列內容:
MOUNT_POINT
:包含要轉移資料的目錄。ARCHIVE_SIZE_BYTES
:要在目的地產生的 tar 球目標大小。預設為 1 GB,預期介於 5 MB 至 20 GB 之間 (含 5 MB 和 20 GB)。THREAD_COUNT
:同時建立封存檔的執行緒數量。預設為 20,預期介於 1 到 10000 之間 (含首尾)。
封存提取作業會在背景執行,因此您可以放心退出終端機。提取作業開始時,會先列出資料,然後才能開始轉移。
開始提取時會傳回 ID,這個值可用於與提取作業互動:
如要檢查提取作業的狀態,請執行下列指令:
ta pull --id=ID --status
如要暫停提取作業,請執行下列指令:
ta pull --id=ID --pause
如要繼續已暫停或中斷的提取作業,請執行下列指令:
ta pull --id=ID --resume
更改下列內容:
ID
:提取 ID。
提取完成後,您可以在
/mnt/ta_data/TA_ARCHIVE_ID/
目錄下找到 tar ball。系統會產生資訊清單檔案,並儲存到/mnt/ta_data/manifest_ID.tsv
。這個檔案會包含所轉移檔案的資訊,詳細說明哪些檔案位於哪些 tar ball 檔案中。同樣地,系統也會在/mnt/ta_data/manifest_ID_ERROR.tsv
儲存錯誤資訊清單檔案,詳細列出提取期間發生的所有錯誤。
建議一次執行一個提取指令。
我們在 TA7 上對 100 GB 的資料集進行速度測試。提供這些值是為了協助您選擇兩種可用的複製公用程式。傳輸速度可能因裝置類型和網路連線而異。
方法 檔案大小 封存大小 (位元組) (僅限封存提取) 費率 (NFS) 費率 (中小企業) RClone 100 MB 不適用 600 MB/秒 620 MB/秒 封存提取 100 MB 10 GB 750 MB/秒 850 MB/秒 RClone 1 MB 不適用 280 MB/秒 270 MB/秒 封存提取 1 MB 500 MB 630 MB/秒 380 MB/秒 RClone 100 KB 不適用 150 MB/秒 150 MB/秒 封存提取 100 KB 5 MB 270 MB/秒 90 MB/秒
資料移轉基準
這些資料傳輸速度代表使用標準複製工具時,Transfer Appliance 的最高寫入效能。為隔離寫入效能並消除資料來源可能造成的讀取瓶頸,資料直接在設備掛接的 NFS 共用資料夾中產生。設備 (TA40) 是透過 10 Gb 連接埠連線至資料來源,並測量下列檔案大小的速度:
- 10 GB、1 GB 和 100 MB 的檔案 (5 TB 資料集)
- 10 MB 和 1 MB 的檔案 (1 TB 資料集)
檔案大小 | 平均複製速度(NFS) | 預估 40 TB 資料的移轉時間 | 預估 300 TB 資料的移轉時間 |
---|---|---|---|
10 GB | 560 MBps | 21 小時 | 6 天 12 小時 |
1 GB | 400 MBps | 1 天 5 小時 | 9 天 |
100 MB | 300 MBps | 1 天 15 小時 | 12 天 |
10 MB | 130 MBps | 3 天 18 小時 | 28 天 |
1 MB | 30 MBps | 16 天 | 120 天 |