「51%のボットトラフィック」とは何を意味しますか?

2025年に業界が行った独立した計測は、ボット(自動化されたuser-agent)が初めてインターネット全トラフィックの51%を超えたことを記録しました。この閾値が重要なのは、人間が主要なユーザーであるという長年の前提を覆すからです。いまやトラフィックの大半は人間以外であり、セキュリティ上の問いはもはや「このユーザーはボットか」(イエスと想定)ではなく、「このボットは何をしようとしているか」です。

なぜCAPTCHAはもはや有効でないのですか?

CAPTCHAは、人間は解けるがボットは解けないという前提に基づいていました。2026年時点で、この前提の両方の半分が弱まっています。AIのvisionモデルは画像CAPTCHAを人間並みの精度で解きます。CAPTCHA解決サービスはresidential proxy上で有料の人間ソルバーを使い、1件あたり1セント未満の料金で動作しています。摩擦は正当なユーザーにとって高く、バイパスコストは攻撃者にとって低い — 有効なセキュリティコントロールが見せるべき姿とは正反対です。

行動フィンガープリントとは何ですか?

行動フィンガープリントは、セッションがアプリケーションとどのように対話するかのパターン — マウス移動の曲率、タイピングのリズム、スクロール速度、ナビゲーションのタイミング、クリックの分布 — を分析し、そのアクターが妥当に人間と言えるかどうかを判定します。これらのシグナルを大規模に説得力をもって偽装することは困難です: 人間のマウス移動を完璧に模倣するボットは、もはや安価なボットではありません。行動フィンガープリントはCAPTCHAなし、クッキーなし、クライアント側にPIIを保存することなく動作します。TR7のボット管理は、行動パターン分析を11の重み付き検出要因の一つとして使用します。

residential proxyボットネットはどのようにIPレピュテーションをバイパスするのですか?

residential proxyネットワークは、ボットトラフィックを乗っ取られた家庭のインターネット接続経由でルーティングします — 正当に貸し出された場合(有料のVPN型サービス)もあれば、多くはマルウェアに感染した消費者デバイスを通じた場合もあります。ボットのトラフィックはデータセンターからではなく、典型的な家庭のIPから来ているように見え、これがデータセンターのレンジに基づくIPレピュテーションリストを無効化します。防御には層状のシグナルが必要です: 行動フィンガープリントはIPがresidentialに見えてもボットの挙動を捉え、モダンなボット管理は複数の弱いシグナルを強力な統合判断へと組み合わせます。

正当なAIエージェントや良いボットはどうですか?

すべてのボットが悪いわけではありません。Googlebot、Bingbot、その他の検索クローラーはコンテンツをインデックスします。AI検索クローラー(GPTBot、ClaudeBot、PerplexityBot)はトラフィックを誘導する回答に情報を供給します。認可された顧客のエージェント(Skyvernクラス)は正当なユーザーのワークフローを実行します。良いボット管理はこれらを悪意あるボットから区別します: 良いものには許可を与え、悪いものはブロックし、不確かなものには摩擦(ブロックではなく)を適用します。TR7のアプローチは意図ベースのフィルタリングを使用します — ボットかどうかだけでなく、ボットの見かけ上の目的を分類します。

どの指標を追跡すべきですか?

6つの実践的な指標があります。(1) エンドポイントごとのボット対人間のトラフィック比率 — 最も多く自動化を引き寄せるアプリケーション経路を浮き彫りにします。(2) ボットのカテゴリ分布 — 検索クローラー、スクレイパー、credential stuffer、AIエージェント。それぞれ異なるポリシーを必要とします。(3) 検出のレイテンシ — セッションがどれだけ速く分類されるか。正当なユーザーが影響を受けないよう、理想的には5ミリ秒未満。(4) 既知の良いユーザー母集団に対する誤検知率 — サポート問い合わせやファネルの離脱で計測され、内部推定だけによるものではありません。(5) バイパス率の傾向 — 保護されたアクションに到達するボットの割合が時間とともにどう変化するか。軍拡競争の状況を反映します。(6) ブロックあたりのコスト — 一部の防御はブロックする対象の価値より高くつきます。防御は能力ではなく判断あたりのコストに基づいて層状にしてください。

TR7 Bot管理は実際に何をしますか?

TR7 Bot管理は、11の重み付き検出要因を適応的な行動分析と組み合わせます。要因には次が含まれます: 複数のデータソースからのIPレピュテーション、行動パターン分析(マウス、タイピング、スクロール)、TLSフィンガープリント(JA4)、HTTP/2フィンガープリント、ヘッダーの一貫性、ナビゲーションのタイミング、その他いくつか。判断は5ミリ秒未満で下されます。システムは新しいボットのパターンが現れるたびに適応します — 敵対者は戦術を変え、静的なルールは古びるからです。結果は51%問題に対するアーキテクチャ的な答えです: 問いはもはや「人間かボットか」ではなく、「どのカテゴリで、それに対して何をすべきか」です。

ボット管理 2026: 51%時代の行動ベース検出

ボットトラフィックが多数派になると、問いが変わる

Webセキュリティは長らく、ある静かな前提に依拠してきました: 受信リクエストの背後には、たいてい人間がいる。この前提の上に、セッション管理、不正対策、レート制限、ログインセキュリティ、コンテンツ保護、WAFポリシーが築かれました。ボットは存在していましたが、ほとんどのシステムはそれらを例外として扱っていました。人間のトラフィックは正常とみなされ、ボットのトラフィックは切り分けるべき逸脱として見られていました。

2026年に入るにあたり、このバランスは変わりました。ボットトラフィックはもはやWebトラフィックの端にある小さな問題ではありません。検索エンジンのクローラー、SEOツール、価格スクレイパー、credential stuffingボット、click fraudネットワーク、residential proxyインフラ、AIエージェントが、同じアプリケーションの対象領域に異なる意図でアクセスしています。

だからこそ、モダンなボット管理における問いはもはや次だけではありません: このリクエストはボットか? より重要な問いはこうです: これはどの種類のボットで、何をしようとしているのか?

なぜなら、すべてのボットが敵ではないからです。Googlebotはあなたのサイトにアクセスする必要があります。認可された監視ツールはあなたのサービスをチェックする必要があります。顧客に代わって取引を行うAIエージェントは、まったく新しいアクセスモデルを生み出すかもしれません。一方で、credential stuffingを行い、価格データを盗み、在庫を消費し、コンテンツをスクレイピングするボットは止める必要があります。この区別をせずに構築された防御は、2つの悪い結果を生みます: 良いボットをブロックし、悪いボットを取り逃がします。

そのため、モダンなボット管理は単一のブロック判断にとどまりません。行動シグナル、プロトコルのフィンガープリント、セッションフロー、IPおよびASNのコンテキスト、リクエスト件数、意図の指標を併せて評価します。そのうえで、各カテゴリに異なるポリシーを適用します。

Imperva — 2025 Bad Bot Report OWASP Automated Threats to Web Applications

51%時代を数字で

51%

インターネットトラフィックに占めるボットの割合

ボットは2025年に初めて人間/人間以外の閾値を超えた

Imperva Bad Bot Report 2025

重み付き検出要因

TR7 Bot管理は行動、プロトコル、アイデンティティ、レピュテーションのシグナルを併せて使用する

TR7 製品

<5ms

判断レイテンシ目標

検出は正当なユーザーに影響を与えずにリクエストフローの中で動作しなければならない

TR7 エンジニアリング

ポリシーカテゴリ

必要(許可)、許容可能(制限)、敵対的(ブロック) — 単一の判断では足りない

OWASP OAT

CAPTCHAの時代はなぜ終わったのか?

CAPTCHAは長らくボット防御のデフォルトコントロールでした。基本的な考え方は単純です: 人間は簡単に解けるが、ボットは解けないタスクを作る。この考え方はもはや以前の力を失いました。モダンなビジュアルAIモデルは画像CAPTCHAを高い精度で解くことができます。Speech-to-textシステムは音声CAPTCHAを無力化します。単純な数学や論理の問題はLLMにとって障害になりません。ドラッグ&ドロップやパズル型の行動CAPTCHAは、人間の動作を模倣する自動化ライブラリによって突破できます。さらに重要なことに、ボットがCAPTCHAを自分で解く必要すらなくなりました。CAPTCHA解決サービスはグローバルなサプライチェーンのように動作します — ボットがチャレンジを受け取り、低コストの解決サービスに転送し、その回答をリアルタイムで使用します。その間、正当なユーザーは数秒を失い、アクセシビリティの問題を経験し、あるいはセッションから離脱します。コストのバランスは逆転しました: CAPTCHAは正当なユーザーに摩擦を加える一方で、動機づけられた攻撃者を止められません。より適切なアプローチは、ユーザーに自らを証明させることなく、バックグラウンドでシグナルを収集することです — 行動フィンガープリント、プロトコル分析、意図分類が、だからこそモダンなボット管理の中心に位置づけられます。

モダンなボット管理は単一のシグナルに依拠しない

ボット検出において単一のシグナルで十分だった時代は過ぎ去りました。IPレピュテーションだけでは足りません。residential proxyネットワークは実際の家庭のインターネット接続からトラフィックを送り出せます。user-agentは信頼できません。headlessブラウザのチェックは単体では弱いものです。CAPTCHAの解決は信頼できません。有効なボット管理は多くの弱いシグナルを併せて評価します — それぞれは単体で突破できますが、攻撃者がそのすべてを同時に、一貫して、低コストで模倣するのは困難です。

行動フィンガープリント

実際のユーザーはアプリケーションと不規則に、文脈依存で、生物学的に一貫性のない形で対話します — マウスの動きは完璧な曲線を描かず、タイピングのリズムは一定ではなく、スクロール速度はコンテンツによって変わり、フォーカスイベント、待機時間、戻る操作、わずかなためらいがセッションの中で自然なパターンを形成します。ボットは両極のどちらかに陥ります: 過度に規則的(完璧なタイミング、直線的な動き、等間隔のリクエスト)か、一貫性のない人間模倣か。行動フィンガープリントはこれらのマイクロシグナルを併せて評価します — 正当なユーザーに見えるチャレンジは表示されません。

TLSフィンガープリント(JA4)

ボットは多くの場合、自らをモダンなブラウザのように見せようとします — user-agentはChromeに設定でき、ヘッダーは整えられ、JS環境は部分的に模倣できます。しかし下位の層には、クライアントライブラリの真の痕跡が残ります。TLS Client Hello内のcipher suiteリスト、拡張の順序、サポートされるグループ、ハンドシェイクの詳細が、クライアントのアイデンティティについて強力なシグナルを生みます。Python requests、本物のChrome、headlessブラウザ、独自の自動化ツールが同じに見せようとしても、TLSレベルでは異なる痕跡を残します。

HTTP/2フィンガープリント

HTTP/2も同様に価値あるシグナルを生みます — フレーム設定、pseudo-headerの順序、HPACKエンコーディングの挙動、優先度の設定、接続管理の詳細が、クライアントライブラリの真の性質を反映します。本物のブラウザのHTTP/2挙動と自動化ライブラリの挙動は、多くの場合まったく同じではありません。上位の層でヘッダーが模倣されても、プロトコルの詳細は異なったままです — この差は、本物のブラウザに非常に近く見える高度なボットの検出において価値があります。

セッションフロー分析

最も価値あるシグナルの一つはセッションの形状です。個々のリクエストはクリーンに見えることがあります — ヘッダーは正しく、IPは疑わしくなく、TLSプロファイルは受け入れ可能。しかしセッション全体を調べると意図が浮かび上がります。実際のユーザーの行動はジャーニーをたどります: トップページに来て、コンテンツを閲覧し、カテゴリに移り、商品を見て、待ちます。ボットは探索の段階を飛ばします — 直接ターゲットのエンドポイントに向かい、同じ操作を繰り返し、ログインフォームに異なるクレデンシャルで殺到し、価格ページを一定間隔で取得し、商品を見ることなく決済フローを実行します。

IPおよびASNレピュテーション

residential proxyネットワークはIPレピュテーションに基づく防御を著しく弱めました。攻撃者はもはやデータセンターのIPからだけ来るのではありません。それでもIPおよびASNのレピュテーションがまったく無価値というわけではありません。あるresidential IPから1分間に数千のリクエストが来ているなら、それは依然として疑わしいです。短時間に多数のアカウント試行を行うASNは依然として重要です。以前に悪用で観測されたネットワークはリスクスコアに寄与すべきです。正しいアプローチはこうです: IPは単体で判断を下すべきではない — しかし判断に重みを加えるべきです。

意図分類

本当の転換点は意図分類です。「自動トラフィック」は単体では十分なカテゴリではありません — 検索エンジンも自動化されており、credential stuffingボットも同様です。意図分類は次の問いを見ます: どのエンドポイントが標的にされているか、リクエストはどの順序で来ているか、ペイロードはどう変化しているか、ログイン試行でクレデンシャルがどう変種化しているか、価格や在庫のページがどのリズムで取得されているか。credential stufferと価格スクレイパーは同じように扱われません。ボット管理は「ブロック/許可」の判断から離れ、カテゴリに応じてポリシーを適用するシステムへと変わります。

3つのカテゴリ: 許可、制限、ブロック

モダンなボット管理における目標は、すべてのボットを排除することではありません。それは可能でもなく、望ましいことでもありません。一部のボットはあなたのビジネスに必要です。一部は許容可能です。一部は直接ブロックすべきです。実践的には、ボットトラフィックを3つの主要なカテゴリに分ける必要があります。

必要なボット — 許可

そのアクセスはあなたのビジネスにとって価値があるか、運用上必要です。検索エンジンのクローラーはページをインデックスし、オーガニックトラフィックをもたらします。ソーシャルメディアのプレビューボットはリンクが正しく見えるようにします。認可された監視ツールはサービスの可用性をチェックします。自前の合成テストはアプリケーションの健全性を計測します。AIエージェント — 認証され、認可され、ユーザーに代わって取引を行うもの — はここに位置します。匿名の悪意あるボットのように扱うべきではありません。正しいポリシーはブロックではなく、検証と制御された許可です。

許容可能なボット — 制限

直接必要ではありませんが、いかなる場合でもブロックすべきというものでもありません。遅いスクレイパー、RSSリーダー、アーカイブツール、ソーシャルメディアのプレビュー生成器、中程度の分析クローラーがこのグループに入ります。一定の制限の中では許容できます — ただしアプリケーションリソースを消費したり、データを攻撃的に取得したり、ユーザー体験に影響を与えたりすることは許すべきではありません。正しいポリシーは: レート制限、低優先度、チャレンジの適用、特定のエンドポイントへの限定です。不確かなセッションもこのカテゴリに入れることができます — 低コストの摩擦でテストします。

敵対的なボット — ブロック

目的が直接的に害を与えることであるボット。credential stuffingボットは流出したパスワードをログインエンドポイントで試します。アカウント乗っ取り攻撃はアカウントを乗っ取ろうとします。競合のスクレイパーは価格や在庫のデータを盗みます。click fraudボットは広告予算を消費します。在庫ボットは在庫を人為的に消費します。無許可のコンテンツスクレイパーは、あなたのデータを別のモデル、競合、データブローカーのために取得します。正しいポリシーは明確です: ブロックし、ログに記録し、アラートを生成し、必要なら追加のセキュリティプロセスをトリガーします。成功した各リクエストはコストを生みます — ここでは摩擦ではなく、直接的な停止が必要です。

ポリシー層: 検出とアクションを切り離す

ボット管理でよくある誤りは、検出とポリシーを同じものとして扱うことです。

検出は次の問いに答えます: このトラフィックは何か?

ポリシーは別の問いに答えます: このトラフィックに対して何をするか?

この2つの判断が切り離されていないと、システムは脆くなります。「ボットならブロック」のような単純なルールは、Googlebot、RSSリーダー、AIエージェント、credential stufferを同じ籠に入れてしまいます。これは誤検知を増やし、ビジネス上価値あるトラフィックを切り捨てます。

よりレジリエントなアプローチはこうです: 検出層はボットの種類と意図を特定し、ポリシー層はカテゴリに応じてアクションを適用します。

例えば、Googlebotには許可、uptimeモニターには許可、RSSリーダーにはレート制限、不確かな自動化には低コストのチャレンジ、価格スクレイパーには制限またはブロック、credential stuffingにはブロックとアラート生成、click fraudにはブロックとレポート。

この区別は運用上の柔軟性をもたらします。新しいAIエージェントのカテゴリが現れたとき、検出エンジンを書き直すことなくポリシーを更新できます。検出の感度を上げても、検索エンジンが誤ってブロックされることはありません。異なるボットのカテゴリを異なるスピードで管理できます。

ボット管理が機能しているかをどう計測するか?

ボット管理は一度きりのセットアップではありません。攻撃者が変化するにつれ、シグナルも変化します。だからこそ、システムの成功は6つの実践的な指標を通じて継続的に計測すべきです。

エンドポイントごとのボット対人間の比率

サイト全体の平均だけでは十分ではありません。ログイン、登録、決済、検索、価格、在庫、API、コンテンツの各エンドポイントを個別に監視すべきです。ボットの問題はたいてい特定のエンドポイントに集中します。決済エンドポイントのボット比率とブログページのボット比率は、同じリスクレベルではありません。エンドポイント単位のビューは、問題を正しい場所で見ることを可能にします。

ボットのカテゴリ分布

「X%のボットトラフィックがある」という情報だけではアクションを生みません。重要なのは分布です: どれだけが検索エンジンか、どれだけが監視ツールか、どれだけがスクレイパーか、どれだけがcredential stuffingか、どれだけがAIエージェントか、どれだけが不確かな自動化か。ボットトラフィックの大部分が検索エンジンから来ているなら一つのセキュリティ問題、credential stuffingのトラフィックから来ているならまったく別のセキュリティ問題があることになります。

検出レイテンシ

ボット検出の判断は速く下されなければなりません。ユーザーはログイン、決済、検索のような重要なフローで、システムが判断を下すのを待つべきではありません。ミリ秒単位の遅延でさえ、高トラフィックのアプリケーションではユーザー体験に影響を与えることがあります。実践的な目標は、判断機構がユーザーに感じられないほど速く動作することです。TR7 Bot管理は、この判断を5ミリ秒未満のレイテンシで下すよう設計されています。

誤検知のシグナル

誤検知はセキュリティパネルからだけでは分かりません。実際のシグナルは多くの場合、サポート問い合わせ、ユーザーの苦情、コンバージョンファネルの離脱、ログイン失敗の増加、決済の放棄率に現れます。誤検知の追跡を検出エンジンの内部スコアだけに委ねるべきではありません — ユーザー体験とビジネス指標と併せて監視すべきです。あるボット防御が攻撃者を止めながら本物の顧客も止めているなら、それは成功していません。

バイパス率

システムの長期的な健全性を示す最も重要な指標の一つ。保護されたアクションに到達した、確認済みの敵対的なボットセッションの割合を監視すべきです — ログイン試行、アカウント作成、購入、機密性の高いAPI呼び出し、コンテンツのダウンロード。絶対数よりも傾向が重要です。バイパス率が一定であれば、防御は攻撃者のペースに追いついているのかもしれません。増加しているなら、攻撃者が既存のシグナルを突破し始めたということです — 新しいシグナル、ポリシーの調整、またはより強力なコントロールが必要です。

ブロックあたりのコスト

すべての防御が同じコストではありません。シグネチャベースのコントロールとIP/ASNシグナルは低コストで広い件数を処理できます。行動分析はより多くのコンテキストを必要とします。重いML推論や深いセッション分析は、すべてのリクエストではなく、価値の高い判断ポイントに使うべきです。ボット防御は層状に構築すべきです — 安価なシグナルを広いトラフィックに、より高コストの分析をログイン、決済、アカウント作成、機密性の高いAPI、高リスクのアクションに。正しい指標は「何件のボットをブロックしたか?」だけではありません。より良い問いはこうです: ブロックした攻撃の価値は、防御コストより高いか?

AIエージェントが新しいボットのカテゴリを生み出している

2026年にボット管理を難しくしている新しい項目の一つがAIエージェントです。従来のボットの区別は、たいてい良いボットと悪いボットの間で行われていました。検索エンジンは良く、credential stufferは悪い。しかしAIエージェントはこの線を曖昧にします。AIエージェントはユーザーに代わってフォームに入力し、商品を調べ、予約を行い、価格を比較し、あるいは企業のワークフローを完了させることができます。この場合、自動トラフィックであること自体は悪意を意味しません。ここで重要なのはアイデンティティと権限です。認可されたAIエージェントは、匿名のボットとしてではなく、ユーザーに代わって行動するクライアントとして扱うべきです。これはボット管理をアクセス制御と結びつけます。誰に代わって取引を行っているか、どの権限を持っているか、どのアクションを実行できるか、どのレート制限に従うかが明確に定められるべきです。AIエージェントゆえに、ボット管理はもはや単なるセキュリティ層ではありません — アイデンティティ、ポリシー、アプリケーション体験と併せて考えるべきアクセスモデルとなります。

結論: CAPTCHAの代わりにシグナル、ブロックの代わりに分類

2026年、ボット管理は古い反射神経では遂行できません。

CAPTCHAは主要なコントロールとしての効力を失いました。residential proxyネットワークはIPレピュテーションを単体では不十分なものにしました。headlessブラウザは単純なフィンガープリントのチェックを突破できます。そしてAIエージェントは、自動トラフィックを悪意あるボットのカテゴリだけで説明することを不可能にしています。

この環境で正しいアプローチは3つの部分から成ります: 行動およびプロトコルベースのシグナルによる検出、セッションフローとペイロード分析による意図分類、そしてボットのカテゴリに応じて切り分けられたポリシー。

こうして、正当なユーザーにCAPTCHAは表示されません。必要なボットには許可が与えられます。許容可能なボットは制限されます。敵対的なボットはブロックされます。そしてAIエージェントはアイデンティティと権限の文脈で管理されます。

モダンなボット管理の目的は「すべてのボットを撲滅すること」ではありません。目的は、すべての自動トラフィックに正しい対応を適用することです。

参考文献・資料

2025年にボットの割合が51%を超えたことを記録した年次の業界計測。https://www.imperva.com/resources/resource-library/reports/bad-bot-report/

credential stuffing (OAT-008)、scraping (OAT-011)、アカウント作成の悪用 (OAT-019) を含む自動化された脅威の包括的なカタログ。https://owasp.org/www-project-automated-threats-to-web-applications/

旧来のJA3に取って代わる、より強力なエンコーディング機能を備えたFoxIOのモダンなTLSフィンガープリントスイート。https://github.com/FoxIO-LLC/ja4

ボットトラフィックのパターンと検出の傾向に関する四半期ごとの脅威インテリジェンスレポート。https://www.akamai.com/security-research/the-state-of-the-internet

residential proxyの検出、行動分析、フィンガープリント技術に関する技術記事。https://blog.cloudflare.com/tag/bots/

行動フィンガープリントはCAPTCHAより強力

TR7 Bot管理は、行動パターン分析、TLSおよびHTTP/2フィンガープリント、IP/ASNコンテキスト、セッションフロー、意図分類を含む11の重み付き検出要因を併せて使用します。判断は5ミリ秒未満で下されるよう設計されています。正当なユーザーにはCAPTCHAの摩擦を生みません。一方で敵対的なボットに対しては、コストを高め、検出を強化し、ポリシーベースの対応を可能にします。

TR7 Bot管理を見る

2026年のボット管理: ボットトラフィックが51%を超えたとき、人間と機械をどう見分けるか?