本頁面說明 App Engine 應用程式如何使用網址擷取服務,發出 HTTP 和 HTTPS 要求並接收回應。請參閱「發出 HTTP(S) 要求」,查看程式碼範例示範如何從 App Engine 應用程式發出 HTTP 和 HTTPS 要求。
如果您已設定無伺服器虛擬私有雲端存取,或使用Sockets API,則需要停止網址擷取處理要求。URL Fetch 會導致對 VPC 網路或 Sockets API 的請求失敗。停用網址擷取後,標準 Python 程式庫會處理 HTTP 要求。如果您需要 URL Fetch 為特定要求提供的功能,可以直接使用 urlfetch
程式庫來處理這些特定要求。
要求
App Engine 會使用網址擷取服務發出傳出要求。在 Python 中,您可以使用httplib
、urllib
和 urllib2
程式庫發出 HTTP 要求;而在 App Engine 應用程式中,每個程式庫都會使用網址擷取服務來執行這些要求。您也可以直接使用 urlfetch
程式庫。
要求通訊協定
應用程式可使用 HTTP 或 HTTPS 擷取網址。您可查看目標網址中的通訊協定,藉此推測應使用的通訊協定。
待擷取網址可使用下列範圍的任何連接埠號:
80
至90
440
至450
1024
-65535
如果網址中沒有連接埠,則由通訊協定默許連接埠。HTTP 要求發生於連接埠 80
,HTTPS 要求則發生於連接埠 443
。
要求方法
如果您是透過網址擷取服務發出要求,則可使用下列任何 HTTP 方法:
GET
POST
PUT
HEAD
DELETE
PATCH
要求可包括 HTTP 標頭;若為 POST
、PUT
和 PATCH
要求,則可包括酬載。
要求 Proxy
請注意,網址擷取服務使用符合 HTTP/1.1 的 Proxy 來擷取結果。
為了防止應用程式造成要求的無限遞迴,要求處理常式無法擷取本身的網址。但是其他方法仍可能造成無限遞迴,因此如果您的應用程式能夠擷取使用者所提供網址的要求,請務必謹慎作業。
要求標頭
應用程式可針對傳出要求設定 HTTP 標頭。
傳送 HTTP POST
要求時,如果 Content-Type
標頭並未明確設定,則標頭會設為 x-www-form-urlencoded
。這是網頁表單使用的內容型別。
基於安全理由,應用程式無法修改下列標頭:
Content-Length
Host
Vary
Via
X-Appengine-Inbound-Appid
X-Forwarded-For
X-ProxyUser-IP
App Engine 會視情況將這些標頭設為正確的值。舉例來說,App Engine 會計算來自要求資料的 Content-Length
標頭,並且先將該標頭新增至要求中,接著再傳送要求。
下列標頭代表發出要求應用程式的應用程式 ID:
User-Agent
。此標頭可修改,但 App Engine 會附加識別碼字串,讓伺服器能識別 App Engine 的要求。附加的字串格式為"AppEngine-Google; (+http://code.google.com/appengine; appid: APPID)"
,其中APPID
是應用程式的識別碼。X-Appengine-Inbound-Appid
。此標頭不可修改;當下列重新導向參數設為False
時,如果透過網址擷取服務傳送要求,系統就會自動新增此標頭。
要求逾時
您可以為要求設定期限或逾時時間。要求的預設逾時時間為 10 秒。
您可以傳送同步要求和非同步要求。下列行為會套用至 URL Fetch API:
- 「同步要求」:擷取呼叫會等到遠端主機傳回結果,然後再將控制權交還應用程式。如果時間超過擷取呼叫的等待時間上限,該呼叫會引發例外狀況。
- 「非同步要求」:網址擷取服務會開始發出要求,然後立即傳回包含物件的結果。應用程式可以在擷取網址的同時,執行其他工作。當應用程式需要結果時,會呼叫物件上的方法,如果有需要,方法會等候要求完成,然後再傳回結果。在要求處理常式結束時,如果有任何網址擷取要求處於擱置狀態,應用程式伺服器會等到所有其餘要求皆傳回或達到期限,才會將回應傳回給使用者。
安全連線和 HTTPS
您的應用程式可透過 HTTPS 連線到安全的伺服器,以安全的方式擷取網址。要求與回應資料會以加密的形式透過網路傳輸。
在 Python API 中,網址擷取 Proxy 依預設不會驗證聯絡的主機。您可以加入選用的 validate_certificate
引數到 fetch()
方法,啟用主機驗證程序。
回應
如果您是使用 URL Fetch API,請注意網址擷取服務會傳回包括回應、程式碼、標頭與內文在內的所有回應資料。
根據預設,網址擷取服務如果收到含有重新導向代碼的回應,網址擷取服務將追蹤這個重新導向。該服務會追蹤最多五個重新導向回應,然後傳回最終資源。您可以指示網址擷取服務不要追蹤重新導向連結,而是將重新導向的回應傳回應用程式。
在開發伺服器使用網址擷取
在電腦的 App Engine 開發伺服器執行應用程式時,系統會在本機處理網址擷取服務的呼叫。開發伺服器將直接從您的電腦連線至遠端主機以擷取網址,而網路設定則是您的電腦存取網際網路時所使用的任何網路設定。
在測試應用程式用於擷取網址的功能時,請確認您的電腦能夠存取遠端主機。
網址擷取的配額和限制
如要進一步瞭解網址擷取服務的配額,請參閱配額。如要查看應用程式目前的配額使用量,請前往Google Cloud 主控台的「配額詳細資料」頁面。
此外,以下為使用網址擷取服務的限制:
限制 | 上限 |
---|---|
要求大小 | 10 MB |
要求標頭大小 | 16 KB (請注意,這會限制在標頭中所能指定的最大網址長度) |
回應大小 | 32 MB |
相關資源
執行程式碼範例,並在發出 HTTP(S) 要求一文中取得指引,瞭解如何從應用程式發出要求。