Skip to content

Latest commit

 

History

History
540 lines (385 loc) · 28.9 KB

README.md

File metadata and controls

540 lines (385 loc) · 28.9 KB

CORSハンズオン

0. 読者へ

このハンズオンでは、ブラウザにおけるCORSの挙動をサーバとなるPythonコードをいじりながら理解していくことを目的としています。 CORSについてざっくりとした説明しかしないため、より詳細を知りたい方はMDNのオリジン間リソース共有 (CORS)を参照することをお奨めします。 また、CORSの存在意義については、徳丸浩氏のCORSの原理を知って正しく使おうを参照することをお勧めします。

このハンズオンではブラウザがGoogle Chromeであることを想定します。

このハンズオンではPython3 をローカルサーバの起動、 ngrok をサーバのListenポートをパブリックなアドレス空間で公開するために使用します。 事前にインストールしておきましょう。

誤植や追記、内容の訂正など、どんなPRも歓迎しています。

1. CORSの種類

まずは、手を動かす前にCORSの種類についてみてみます。

Cross-Origin Resource Sharing (CORS) とは、ブラウザ上で動作するスクリプトが、異なるオリジンのリソースをやり取りできるようにするためのプロトコルです。 オリジンというのは、URL構造のうち、スキーム+ホスト+ポートのことを指します。 詳しくはOrigin (オリジン)を参照してください。

https://example.com:8080/index.html
|------||---------||---||---------|
 Scheme     Host   Port    Path
|----------------------|
        Origin

CORSは、リクエストの条件によって次のどちらかの動作をします。

  • 単純リクエスト(Simple Requests)
  • プリフライトリクエスト(Preflight Requests)

以下の条件を全て満たすと単純リクエストとなり、満たさないとプリフライトリクエストとなります。

条件 項目
メソッドが以下の中に含まれる
  • GET
  • HEAD
  • POST
独自で設定するヘッダーが以下の中に含まれる
  • Accept
  • Accept-Language
  • Content-Length
  • Content-Type(以下の値のみ)
    • application/x-www-form-urlencoded
    • multipart/form-data
    • text/plain
宛先アドレスが以下のアドレスレンジに含まれない
  • 127.0.0.0/8
  • 10.0.0.0/8
  • 172.16.0.0/12
  • 192.168.0.0/16
  • 169.254.0.0/16

さて、説明はここまでにして手を動かしてみましょう。

2. 単純リクエストハンズオン

単純リクエスト(Simple Request)では、ブラウザから外部のオリジンへのリクエストを呼び出すことでデータのやり取りが行われます。

sequenceDiagram
    participant c as Browser
    participant a as a.example.com
    participant b as b.example.com

    rect rgb(64, 64, 64)
        Note left of c: Page Load Request
        c->>a: GET / HTTP/1.1
        a-->>c: HTTP/1.1 200 OK
    end

    rect rgb(64, 64, 64)
        Note left of c: Simple Request
        c->>b: GET / HTTP/1.1
        Note over a: Origin: https://a.example.com
        b-->>c: HTTP/1.1 200 OK
        Note over a: Access-Contro-Allow-Origin: https://a.example.com
    end
Loading

このリクエストがどうなっているかを、ローカルでサーバを立てつつブラウザからリクエストを送信して調べてみましょう。

まず、以下のコードをsrv.pyとして保存します。

from http.server import HTTPServer, SimpleHTTPRequestHandler

class CORSRequestHandler(SimpleHTTPRequestHandler):
    def do_GET(self):
        self.send_response(200)
        self.end_headers()
        self.wfile.write(b'Hello CORS!')
        return

httpd = HTTPServer(('localhost', 8003), CORSRequestHandler)
httpd.serve_forever()

保存したら、コンソールから以下を実行してHTTPサーバを起動します。

$ python3 srv.py

次に、 別の端末から ngrok でパブリックなアドレス空間にサーバのListenポートをフォワーディングしましょう。

$ ngrok http 8003

https://e294-223-218-175-212.jp.ngrok.io -> http://localhost:8003 とフォワーディングされています。 ngrok のドメインはコマンドの実行毎に違います。以降は、 <ngrok_url> と記述しますので適宜読み替えていってください。

まずは動作確認として、<ngrok_url>をそのままブラウザでを開いてみましょう。 Hello CORS!が表示されれば動作確認完了です。

次に、ブラウザでhttps://example.com(httpでなくhttpsなことに注意)を開き、デベロッパーツールを開きます。 そのまま以下のコードを、デベロッパーツールに入れて実行しましょう。

let url = '<ngrok_url>'
await fetch(url)

このハンズオンでは、Fetch APIを利用してローカルのHTTPサーバへアクセスします。

いよいよ初めてのCORSリクエストです。結果はどうなるでしょうか?

なんと!初めてのリクエストは失敗に終わってしまいました!落ち着いてエラーメッセージを読んでみましょう。

オリジン 'https://example.com' からの 'https://e294-223-218-175-212.jp.ngrok.io/' でのfetchへのアクセスは、CORS ポリシーによってブロックされました。要求されたリソースに 'Access-Control-Allow-Origin' ヘッダーが存在しません。opaque responseが必要な場合は、リクエストのmodeに'no-cors'を設定して、CORSを無効にしてリソースをフェッチしてください。

何やらレスポンスにAccess-Control-Allow-Originヘッダーがないためfetchへのアクセスがブロックされたとあります。


NOTE

fetchメソッドにおいて'no-cors'を設定したopaque responseは、リクエストが失敗したときに空のレスポンスを返すことを意味します。 詳しくはMDNのFetch APIを参照してください。


サーバのログを見ると、サーバ側では正常にリクエストが処理されたことが分かります。

127.0.0.1 - - [10/Aug/2022 11:45:14] "GET / HTTP/1.1" 200 -

デベロッパーツールのNetworkタブを見るとリクエスト・レスポンスにどのようなヘッダーがあったかを見ることができます。

確かに、レスポンスにはAccess-Control-Allow-Originがありません。 MDNではAccess-Control-Allow-Originが、以下のように説明されます。

Access-Control-Allow-Originレスポンスヘッダーは、指定されたオリジンからのリクエストを行うコードでレスポンスが共有できるかどうかを示します。

指定されたオリジンというのは、Originリクエストヘッダーの値のことです。 通常ブラウザは、オリジンaのページを開いた状態で外部のオリジンbに対してHTTPリクエストを行う場合、リクエストヘッダーにOrigin: aを設定します。

画像の例ではhttps://example.comページを開き、外部オリジンのhttps://e294-223-218-175-212.jp.ngrok.ioにリクエストを送信しているため、リクエストヘッダーにOrigin: https://example.comが設定されています。 しかし、それに対応するレスポンスにAccess-Control-Allow-Originヘッダーがなかったため、ブラウザのCORS検査でリクエストが失敗したのでした。

それでは、サーバにAccess-Control-Allow-Originヘッダーを追加する処理を記述してみましょう。

     def do_GET(self):
         self.send_response(200)
+        self.send_header('Access-Control-Allow-Origin', '*')
         self.end_headers()
         self.wfile.write(b'Hello CORS!')
         return

*(ワイルドカード)というのはOriginリクエストヘッダーがどのような値であったとしても、ブラウザ側でブロックしなくて良いことを示しています。

修正が完了してサーバを再起動したら、先ほどと同様にfetchメソッドを呼び出してみましょう。

let url = '<ngrok_url>'
await fetch(url)

初めてのCORSに成功しました!以下のコードで再度実行すれば中身を取り出すこともできます。

await (await fetch(url)).text()

3. アクセスを許可するオリジン

前の章では、Access-Control-Allow-Originレスポンスヘッダーに*を設定し、任意のオリジンからのリクエストを許可していました。 この章では、ブラウザが送信してくるオリジンによってアクセスの許可を出し分けてみましょう。

サーバ側で許可するオリジンであった場合には、Originリクエストヘッダーの値をAccess-Control-Allow-Originに設定して返します。

では、サーバ側で許可しないオリジンであった場合はどうすると良いでしょうか? 実は、この時のサーバ側の動作はCross-Origin Resource Sharing W3C Recommendation 16 January 2014 supserseded 2 June 2020及びThe Web Origin Conceptで定義されません。

What is the expected response to an invalid CORS request?にあるように、動作には2つの派閥があるようです。

  • サーバ側でCORSヘッダーを検査し、レスポンスにエラー(4xx)を返す
  • レスポンスは正常に返し、クライアントにCORSヘッダーを検査させる

このハンズオンでは、後者の方針で進めます。 そして、サーバ側で許可しないオリジンであった場合には、Access-Control-Allow-Originヘッダーに許可されるオリジンのリスト(スペース区切り)を設定し、レスポンスを返すこととします。 この実装は実際にデバッグの際に役立ちますが、副作用を伴うリクエストのレスポンスには向いていません。 また、なんらかの理由で正しいオリジンを公開したくない場合にも使えません。 その場合には、単にAccess-Control-Allow-Originレスポンスヘッダーを設定しないべきでしょう。

想定する動作は次のようになります。

flowchart

A["Origin が設定されており、\n許可されるオリジンである"]
B[Access-Control-Allow-Origin に Origin の値を\n設定してレスポンスヘッダーに追加する]
C[Access-Control-Allow-Origin に 許可される Origin のリストを\n設定してレスポンスヘッダーに追加する]
D[2xxレスポンスを返す]

A -- Yes --> B --> D
A -- No --> C --> D
Loading

想定する動作に従ってsrv.pyに変更を加えます。

class CORSRequestHandler(SimpleHTTPRequestHandler):
+    valid_origins = ['https://example.com', 'https://exmaple.net']
+
+    def is_valid_origin(self, origin):
+        return origin in self.valid_origins
+
     def do_GET(self):
         self.send_response(200)
-        self.send_header('Access-Control-Allow-Origin', '*')
+        origin = self.headers['Origin']
+        acao = origin if self.is_valid_origin(origin) else ' '.join(self.valid_origins)
+        self.send_header('Access-Control-Allow-Origin', acao)
         self.end_headers()
         self.wfile.write(b'Hello CORS!')
         return

Originリクエストヘッダーの値がvalid_originsリストに入っている場合、Access-Control-Allow-Originレスポンスヘッダーにその値を設定します。 入っていない場合は、Access-Control-Allow-Originレスポンスヘッダーにvalid_originsの要素を (スペース)区切りで連結した値を設定します。

修正が完了してサーバを再起動したら、https://example.comを開いて、コンソールから以下を実行します。

let url = '<ngrok_url>'
await fetch(url)

fetchメソッドの実行は成功します。

Networkタブを見てみるとOriginリクエストヘッダーの値とAccess-Control-Allow-Originレスポンスヘッダーの値が一致していることが確認できます。

次に、許可されてないオリジンからリクエストを送信してみます。https://example.orgを開いて、同じようにコンソールで以下のコードを実行します。

let url = '<ngrok_url>'
await fetch(url)

オリジン 'https://example.org' からの 'https://3bb3-103-115-217-50.jp.ngrok.io/' での fetch へのアクセスは、CORS ポリシーによってブロックされました。Access-Control-Allow-Origin ヘッダーに複数の値 'https://example.com https://exmaple.net' が含まれていますが、許可されるのは1つだけです。サーバーに有効な値のヘッダーを送信させるか、不透明な応答が必要な場合は、要求のモードを 'no-cors' に設定して、CORSを無効にしてリソースをフェッチしてください。

fetchメソッドの実行は失敗します。 エラーメッセージには、Access-Control-Allow-Originレスポンスヘッダーに複数のオリジンが含まれているとあります。

実際に、NetworkタブをみるとAccess-Control-Allow-Originレスポンスヘッダーには複数のオリジンhttps://example.com https://exmaple.netが含まれていることが確認できます。

Cross-Origin Resource Sharing - 5.1 Access-Control-Allow-Origin Response Header では origin-list-or-nullが定義されていますが、Noteに以下のような記述があります。

実際には、origin-list-or-null実装はより制約されています。スペースで区切られたオリジンのリストを許可するのではなく、単一のオリジンまたは文字列 "null" のどちらかを指定します。

多くのブラウザでは単一のオリジンしか許容しないようになっています。

3.a 不正な単一オリジン

このハンズオンでは、不正なオリジンを伴うリクエストがきた時に、Access-Control-Allow-Originヘッダーで複数の正しいオリジンのリストを返すよう実装しました。 補足として、単一の正しいオリジンを返すようにした場合の結果を以下に示します。

オリジン 'https://example.org' からの 'https://e294-223-218-175-212.jp.ngrok.io/' でのフェッチへのアクセスは、CORS ポリシーによってブロックされました。'Access-Control-Allow-Origin' ヘッダーの値 'https://example.com' は指定されたオリジンと同じではありません。サーバーに有効な値のヘッダーを送信させるか、不透明な応答が必要な場合は、要求のモードを 'no-cors' に設定して、CORS を無効にしてリソースをフェッチしてください。

また、Access-Control-Allow-Originヘッダーを返さないケースは、2. 単純リクエストハンズオンの最初のリクエストの結果を参照してください。

4. プリフライトリクエストハンズオン

これまでは、単純リクエストでの例を試してきました。 本章では、プリフライトリクエストでの例を試してみましょう。

sequenceDiagram
    participant c as Browser
    participant a as a.example.com
    participant b as b.example.com

    rect rgb(64, 64, 64)
        Note left of c: Page Load Request
        c->>a: GET / HTTP/1.1
        a-->>c: HTTP/1.1 200 OK
    end

    rect rgb(64, 64, 64)
        Note left of c: Preflight Request
        c->>b: OPTIONS / HTTP/1.1
        Note over a: Origin: https://a.example.com<br>Access-Control-Request-Method: POST<br>Access-Control-Request-Headers: Content-Type
        b-->>c: HTTP/1.1 200 OK
        Note over a: Access-Contro-Allow-Origin: https://a.example.com
    end

    rect rgb(64, 64, 64)
        Note left of c: Main Request
        c->>b: POST / HTTP/1.1
        Note over a: Origin: https://a.example.com<br>Content-Type: application/json
        b-->>c: HTTP/1.1 200 OK
        Note over a: Access-Contro-Allow-Origin: https://a.example.com
    end
Loading

CORSをプリフライトリクエストとして実行するために、JSONをPOSTで送信する例を考えます。

まずは、サーバ側でPOSTによる送信を受け付けられるようにし、重複した処理を関数に切り出します。

     def is_valid_origin(self, origin):
         return origin in self.valid_origins

-    def do_GET(self):
+    def send_acao(self):
         origin = self.headers['Origin']
         acao = origin if self.is_valid_origin(origin) else ' '.join(self.valid_origins)
         self.send_header('Access-Control-Allow-Origin', acao)
+        return
+
+    def do_GET(self):
+        self.send_response(200)
+        self.send_acao()
         self.end_headers()
         self.wfile.write(b'Hello CORS!')
         return

+    def do_POST(self):
+        self.send_response(201)
+        self.send_acao()
+        self.end_headers()
+        self.wfile.write(b'Nice POST!')
+        return
+

修正が完了したら、ひとまずサーバを再起動しておきます。

POSTメソッドによるJSONの送信では、Content-Type: application/json ヘッダーを設定することで、単純リクエストになる条件から外れ、プリフライトリクエストになります。

単純リクエストとプリフライトリクエストの条件については、1. CORSの種類の表を参照してください。

https://example.comを開いて、プリフライトリクエストとなるように、以下のfetchメソッドをコンソールから実行します。

let url = '<ngrok_url>'
await fetch(url, {method: 'POST', headers: {'Content-Type': 'application/json'}})

結果は次のようになりました。

オリジン 'https://example.com' からの 'https://3bb3-103-115-217-50.jp.ngrok.io/' でのfetchへのアクセスは、CORS ポリシーによってブロックされました。プリフライトリクエストへのレスポンスがアクセス制御チェックを通過しません。要求されたリソースに 'Access-Control-Allow-Origin' ヘッダーが存在しません。不透明な応答が必要な場合は、要求のモードを'no-cors'に設定して、CORS を無効にしてリソースをフェッチします。

プリフライトリクエストのアクセス制御チェックを通過できなかったとあります。 また、NetworkタブやサーバのログからOPTIONSメソッドによるリクエストが送信され、ステータスコード501(Not Implemented Error)が返っていることが確認できます。 POSTメソッドのリクエストは発生せずに、OPTIONSメソッドのリクエストが発生しています。どういうことでしょうか?

$ python3 srv.py
127.0.0.1 - - [10/Aug/2022 11:45:14] code 501, message Unsupported method ('OPTIONS')
127.0.0.1 - - [10/Aug/2022 11:45:14] "OPTIONS / HTTP/1.1" 501 -

プリフライトリクエストの場合、実際のPOSTリクエストなどが発生する前に、OPTIONSメソッドによるリクエスト/レスポンスが発生し、CORSポリシーの検査が行われます。 この検査に通った場合のみ、ブラウザは実際のPOSTリクエストを実行します。

それでは、サーバにOPTIONSメソッドを受け付けるコードを追加しましょう。

     def do_POST(self):
         self.send_response(201)
         self.send_acao()
         self.end_headers()
         self.wfile.write(b'Nice POST!')
         return

+     def do_OPTIONS(self):
+        self.send_response(200)
+        self.send_acao()
+        self.end_headers()
+        return
+

修正が完了してサーバを再起動したら、https://example.comを開いて、コンソールから以下を実行します。

let url = '<ngrok_url>'
await fetch(url, {method: 'POST', headers: {'Content-Type': 'application/json'}})

オリジン 'https://example.com' からの 'https://3bb3-103-115-217-50.jp.ngrok.io/' での fetch へのアクセスは、CORS ポリシーによってブロックされました。リクエストヘッダーフィールドの content-type は、プリフライトレスポンスの Access-Control-Allow-Headers によって許可されていません。

またもやリクエストは失敗してしまいました。 エラーメッセージにはcontent-typeリクエストヘッダーが Access-Control-Allow-Headersによって許可されていないとあります(HTTPヘッダーはcase-insensitive(大文字・小文字を区別しない)なので、Contnet-Typecontent-type表記のどちらでもよい)。 MDNではAccess-Control-Allow-Headersが、以下のように説明されます。

Access-Control-Allow-Headers レスポンスヘッダーは、 Access-Control-Request-Headers を含むプリフライトリクエストへのレスポンスで、実際のリクエストの間に使用できる HTTP ヘッダーを示すために使用されます。

プリフライトリクエストでは、以下の図のようなOPTIONSメソッドのリクエストが発生します。

sequenceDiagram
    participant c as Browser
    participant a as Server

    c->>a: OPTIONS / HTTP/1.1
    Note over c, a: Origin: https://a.example.com<br>Access-Control-Request-Headers: Content-Type
    a-->>c: HTTP/1.1 200 OK
    Note over c, a: Access-Control-Allow-Origin: https://a.example.com<br>Access-Control-Allow-Headers: Content-Type

Loading

OPTIONSメソッドのリクエストのAccess-Control-Request-Headersヘッダーの値に、実際のリクエストで指定したヘッダー名が入ります。 NetworkタブからOPTIONSメソッドによるリクエストの内容を確認することができます。

リクエストのAccess-Control-Request-Headerscontent-typeとなっていますが、対応するレスポンスでAccess-Control-Allow-Headersがないため、CORSが失敗していました。 それでは、srv.pyAccess-Control-Allow-HeadersContent-Typeを入れて返すように修正しましょう。

@@ -2,6 +2,7 @@ from http.server import HTTPServer, SimpleHTTPRequestHandler

 class CORSRequestHandler(SimpleHTTPRequestHandler):
     valid_origins = ['https://example.com', 'https://exmaple.net']
+    valid_headers = ['Content-Type']

     def is_valid_origin(self, origin):
         return origin in self.valid_origins
+
+    def is_valid_header(self, header):
+        return header.upper() in [h.upper() for h in self.valid_headers]

@@ -12,6 +13,11 @@ class CORSRequestHandler(SimpleHTTPRequestHandler):
         self.send_header('Access-Control-Allow-Origin', acao)
         return

+    def send_acah(self):
+        acrh = self.headers['Access-Control-Request-Headers'].split(',')
+        acah = ','.join([h for h in acrh if self.is_valid_header(h)])
+        self.send_header('Access-Control-Allow-Headers', acah)
+
     def do_GET(self):
         self.send_response(200)
         self.send_acao()
@@ -29,6 +35,7 @@ class CORSRequestHandler(SimpleHTTPRequestHandler):
     def do_OPTIONS(self):
         self.send_response(200)
         self.send_acao()
+        self.send_acah()
         self.end_headers()
         return

CORSで許可されるヘッダーのリストをvalid_headers変数としてを定義します。 send_acah関数では、リクエストのAccess-Control-Request-HeadersヘッダーからCORSで実際に使われるヘッダーを取り出し、その中からvalid_headersに入っている値のみを,区切りで連結してAccess-Control-Allow-Headersに設定し、レスポンスを返しています。 is_valid_header関数では、HTTPヘッダーがcase insensitiveであることから文字列を全て大文字にして比較をしています。

再度、実行してみましょう。

let url = '<ngrok_url>'
await fetch(url, {method: 'POST', headers: {'Content-Type': 'application/json'}})

とうとうプリフライトリクエストによるCORSに成功しました。

Networkタブから、Access-Control-Request-HeadersAccess-Control-Allow-Headersヘッダにcontent-typeが設定されていることが確認できます。

5. その他のヘッダー

CORSには、上記で紹介した以外にも大事なヘッダーが多くあります。 CORSに関する主要なヘッダーについてまとめておきます。

ヘッダー名 リクエスト/レスポンス 対応するヘッダー名 説明
Origin リクエスト Access-Control-Allow-Origin 実際のリクエストの送信元のオリジンを示す
Access-Control-Request-Headers リクエスト Access-Control-Allow-Headers 実際のリクエストで指定されるヘッダーを示す
Access-Control-Request-Method リクエスト Access-Control-Allow-Method 実際のリクエストが行われた際にどの HTTPメソッドが使われるかを示す
Access-Control-Request-Private-Network リクエスト Access-Control-Allow-Private-Network リクエストがプライベートネットワークリクエストであることを示します。
Access-Control-Allow-Origin レスポンス Origin 実際のリクエストのレスポンスで共有を許可するオリジンを示す
Access-Control-Allow-Headers レスポンス Access-Control-Request-Headers 実際のリクエストで指定が許可されるヘッダーを示す
Access-Control-Allow-Method レスポンス Access-Control-Request-Method 実際のリクエストでリソースへのアクセスが許可されるHTTPメソッドを示す
Access-Control-Max-Age レスポンス - Access-Control-Allow-Methodsおよび Access-Control-Allow-Headersヘッダーの情報をキャッシュすることができる時間(秒)の長さを示す
Access-Control-Allow-Private-Network レスポンス Access-Control-Request-Private-Network リソースを外部ネットワークと安全に共有できることを示す

参考