CleanFeedの仕組み

   このエントリをはてなブックマークに登録    2011/8/23-2

イギリスのBritish Telecom(BT)で行われているブロッキングの仕組みを調べてみました。 参考にしたのは2005年にケンブリッジ大学で発行されたテクニカルレポートです。

このテクニカルレポートによると、Cleanfeedの仕組みは負荷を軽減するために2段階構成になっているという特徴があります。

まず、最初の段階で「疑いのある宛先IPアドレス+ポート番号」の組でチェックを行い、マッチするパケットは2段階目へと転送されます。 2段階目はWeb Proxyで、ブロック対象となっているURLであれば404などのエラーを返します。

全てのユーザの手前にIPアドレスとポート番号をチェックする機能が必要となりますが、このように2段階構成になることで、疑わしいURLリクエストをチェックする回数が減らせるので、Web Proxyの設置数は減らせます。

ブロック対象に関するリストはIWF(Internet Watch Foundation)から提供されたものが利用されますが、人間が解読可能な形でブロック対象リストが保持されないように、URLのハッシュ値として記録されています。 そのため、Web ProxyでのURLチェックはハッシュ値を用いて行われます。

以下、図を作ってみました。

通常の場合


2段階目に進むがブロック対象ではない場合


ブロック対象URLの場合


過去に書いたブロッキング関連記事

   このエントリをはてなブックマークに登録