機能

HAクラスタリング

2つのノードを単一の論理ADCとして動作させる — VIPフェイルオーバー、状態レプリケーション、制御されたメンテナンスを1つのクラスターモデルに。

TR7 ADC HAクラスタリングは2つのノードを単一の論理アプリケーション配信層として動作させます。1つのノードがダウンすると、VIPが別のノードに移動し、ユーザートラフィックは同一のサービスアドレス上で継続します。クラスタリングはパッシブなスタンバイデバイスモデル以上のものです。Active-PassiveとActive-Activeの両方のトポロジーがサポートされています。設定、ログ、統計、スティックテーブル、関連する実行時状態がピアノードと同期されます。異なるVIPが異なるノードでアクティブになれます；ノードが障害を起こすと、もう一方が影響を受けたVIPの所有権を取得します。 TR7はクラシックなVRRP動作を超え、VIPフェイルオーバーの決定をピアの生存状態のみに委ねません。インターフェースレベルでリンク状態、ゲートウェイ到達可能性、またはリンク+ゲートウェイの組み合わせシグナルに基づいてフェイルオーバー決定を行えます。これにより稼働しているように見えるが外部ネットワークまたはゲートウェイに到達できないノードが不必要にVIPを保持するのを防ぎます。結果として：TR7 ADCはローカル高可用性を統合します — VRRPベースのVIPフェイルオーバー、TR7制御のリンク/ゲートウェイ監視、設定同期、ハードウェア検証、制御されたメンテナンスワークフロー — を単一の管理モデルに。

インターフェースごとのVRRPスロット — Active-ActiveのためにMASTER+BACKUPペアが自動生成

254

最大クラスターID — それぞれ241.0.1.0/24範囲の専用管理IPにマッピング

ハードウェアマッチチェック — CPUコアセット、インターフェース名、RAMはすべて一致が必要

高可用性は2台目のデバイスを追加するだけではありません — 正しいVIPが正しいノードに留まることを確認することです。

ADC層に2台目のデバイスがあるだけでは高可用性を意味しません。重要な質問は、障害時にどのノードがVIPを所有するか、両ノードが同一の設定を共有しているか、スティックテーブルとセキュリティカウンターがフェイルオーバーを生き残るかどうかです。これらのピースが連携しないと、フェイルオーバーは発生しますが、ユーザーエクスペリエンスとセキュリティ動作が壊れます。

クラシックなVRRPはほとんどのシナリオには十分ですが、すべての問題を解決するわけではありません。ノードは動作しているように見え、VRRPピアはまだ生存しているかもしれませんが、関連するインターフェースがリンクを失っていたり、ゲートウェイが到達不能になっているかもしれません。その状態でデバイスがVIPを保持し続けると、外の世界に到達できないように見えるが生存しているノードにトラフィックが流れます。

手動管理のデプロイメントでは、設定同期も別のリスクです。1つのノードで行われた変更がもう一方に伝播されたかどうか、証明書とルールセットが等しいかどうか、どのデバイスにログが残ったか — これらはすべて継続的なチェックを必要とします。「2つのノードは本当に同一か？」という質問に明確な答えがない場合、クラスターは信頼できる構成ではなく、延期された障害ポイントになります。

ハードウェアの不一致は最も危険なサイレント障害の1つです。異なるネットワークインターフェース名、異なるCPUコアセット、異なるメモリ容量を持つ新しいノードは、最悪のタイミングでクラスター動作を壊す可能性があります。これらの違いはフェイルオーバーイベント中ではなく、クラスター参加時に捕捉される必要があります。

TR7 HAクラスタリングはこれらのリスクを一緒に対処します：VIPフェイルオーバー、TR7制御のリンク/ゲートウェイ決定、同期、制御されたメンテナンスワークフロー、ハードウェア互換性チェック — すべてを1つのモデルで管理します。

私たちのアプローチ

TR7はVIPプレーン、アクティブ監視、同期、ハードウェア検証、制御された変更管理が連携した2ノードクラスタリングを実装します。

2つのノードが単一の論理ADCとして管理される

クラスター設定は両ノード間の共有トポロジーで定義されます。管理インターフェースはこのノードとピアノードを同一モデルで表示します；ルール、証明書、サービスの変更はクラスター動作を念頭に置いて管理されます。

VIPフェイルオーバーはVRRPとTR7監視オプションで決定される

VIPの所有権はクラシックなVRRPで管理できるか、TR7のリンク、ゲートウェイ、またはリンク+ゲートウェイ監視決定で補強できます。これによりピアの生存状態だけでなく、実際のネットワーク到達可能性に基づくフェイルオーバーが可能になります。

ハードウェア互換性はクラスター参加時に検証される

CPUコアリスト、ネットワークインターフェース名、メモリサイズが両ノード間で比較されます。ハードウェアの不一致はノードがクラスターに参加するときに捕捉されます — フェイルオーバーイベント中に表面化するまで残りません。

手動同期モードが制御されたメンテナンス変更を可能にする

自動同期を一時的に停止できます。オペレーターは1つのノードで変更を行い、結果をテストし、確認後に意図的にすべての変更をピアノードにプッシュします。

機能

HAクラスタリングはVIP所有権から状態レプリケーションまで、ローカル高可用性動作を単一インターフェースで管理します。

VRRPベースのVIPフェイルオーバーがサービスアドレスを安定に保つ

TR7はVRRPモデルを使用して各VIPアドレスを保持するノードを管理します。関連するすべてのインターフェースに対してMASTERとBACKUP動作が自動的に生成されます。アクティブノードがオフラインになると、VIPはピアに移動し、ユーザートラフィックは同一アドレス上で継続します。このモデルは実証されたLinuxインフラをTR7管理モデルを通じて利用可能にします。

リンクとゲートウェイ監視がVRRPのブラインドスポットを閉じる

TR7はクラスターIPフェイルオーバーをVRRPのみに制限しません；リンク、ゲートウェイ、またはリンク+ゲートウェイメソッドも利用可能です。リンクモードではインターフェースキャリア状態が評価され、ゲートウェイモードではアップストリームの到達可能性がチェックされます。リンク+ゲートウェイモードでは両方のシグナルが一緒に評価され、より強いフェイルオーバー決定が行われます。これにより稼働しているように見えるがネットワークパスが壊れているノードにVIPが残るのを防ぐのに役立ちます。

Active-PassiveとActive-Activeトポロジーが同一クラスターモデルで動作する

Active-Passiveでは1つのノードがサービスVIPを担いながら、もう一方がスタンバイで待機します。Active-Activeでは異なるVIPが両ノードに分散でき、両デバイスがライブトラフィックを担います。ノードが障害を起こすと、もう一方がそのVIPの所有権を取得します。このアプローチによりフェイルオーバー戦略とデバイス容量の利用をアーキテクチャ上の選好で形成できます。

設定とデータの変更がピアに自動的に伝播される

自動同期が有効な場合、すべてのinsert、update、delete操作がピアノードに送信されます。オペレーターは別のオートメーションを書いたり、手動でファイルをコピーしたり、同期ジョブをスケジュールする必要はありません。両ノードでルール、証明書、サービス設定の一貫性を保つことが簡単になります。これによりフェイルオーバー時の「ピアは本当に同一か？」という曖昧さが軽減されます。

スティックテーブルとカウンターがピアレプリケーションを通じて保持される

スティックテーブル、レート制限カウンター、ソースIPの状態をピアノードにレプリケートできます。フェイルオーバーが発生すると、ユーザー動作はゼロから再開しません。Captcha、レート制限、セッションルーティングの決定が障害イベント後もより一貫して継続します。この機能はVIPの引き渡しだけでなく、決定状態の保持を目指します。

ハードウェアの不一致が参加時に早期に検出される

クラスターに参加するノードのCPUコアセット、ネットワークインターフェース、RAMが比較されます。異なるインターフェース名、欠落したNIC、またはメモリの不一致は最初からエラーとして扱われます。これによりサイレントなハードウェアの違いがフェイルオーバー時に表面化するのを防ぐのに役立ちます。特にハードウェアリフレッシュとスペアノード交換サイクル中の運用リスクを軽減します。

手動同期モードが計画されたメンテナンスのための安全なテストスペースを開く

手動同期が有効になると、自動的な変更の伝播が停止します。オペレーターは1つのノードで新しいルール、証明書、またはサービス動作をテストできます。検証が完了したら、syncAllまたはrequestSyncAllフローを通じて変更をピアにプッシュします。このモデルにより誤った変更がクラスター全体に即座に広がるのを防ぎます。

クラスター管理IPがユーザートラフィックから分離されている

各クラスターIDに対して241.0.1.0/24管理ネットワークからIPが割り当てられます。クラスター内通信はユーザーサービストラフィックと概念的に分離されます。クラスターID値は1-254の範囲で使用され、各IDが専用の管理IPに対応します。この分離により同期とピア通信トラフィックの管理がより予測可能になります。

運用の深度

HAクラスタリングはVRRPスロット、ユニキャスト通信、管理IPペア、設定差分、フェイルバック動作、GTM統合とともに計画されます。

VRRPスロット管理

Active-Activeシナリオでは、インターフェースごとにMASTERとBACKUP動作を表す2つのVRRPスロットを生成できます。virtual_router_idとpriorityの値はクラスターロールに応じて設定されます。この構造により同一サブネット内のVIP所有権を衝突なく管理できます。

ユニキャストVRRP

モダンなデータセンターネットワークでは、マルチキャストVRRPトラフィックが特定のスイッチポリシーによってフィルタリングされる場合があります。TR7はユニキャストピアアプローチを通じてピアノード情報を管理することでこのリスクを軽減します。VRRPトラフィックは期待されるピアノードIPを通じて制御された方法で流れます。

リンクとゲートウェイの決定モード

クラスターIPメソッドはvrrp、link、gw、またはlink+gwに設定できます。linkメソッドはインターフェース状態に基づいて決定し、gwはゲートウェイ到達可能性に基づき、link+gwは両方のシグナルの組み合わせに基づきます。これらのオプションはさまざまなネットワーク設計でVIP動作をより現実的にします。

管理IPペア

クラスター同期は各インターフェースに定義されたIPペアを通じて実行されます。これらのIPは本番VIPとは別に扱われます。これにより同期トラフィックとユーザートラフィックが運用上分離されます。

制御されたフェイルバック動作

nopreemptモードにより、古いマスターがオンラインに戻ったときにVIPが自動的に元に戻るのを防ぎます。これにより一時的な回復後に再び障害が発生するシナリオでのping-pongフェイルオーバーが回避されます。フェイルバックの決定はオペレーターによって意図的に行われます。

ローカルクラスターとGTM統合

ローカルクラスターは同一データセンター内でのVIPフェイルオーバーを提供します。データセンター全体がオフラインになると、GTM層がDNSをリモートデータセンターにリダイレクトできます。これによりローカルノードの障害とデータセンターの障害が2つの異なるレベルで処理されます。

使用場面

金融アプリケーションでの途切れないVIP所有権

金融機関はモバイルおよびインターネットバンキングのVIPを2つのTR7 ADCノード間で高可用性構成で実行できます。ノードがメンテナンスまたは障害でオフラインになると、もう一方のノードがVIPの所有権を取得し、同一アドレス上でサービスアクセスが継続します。

ゲートウェイ喪失時のインテリジェントなVIP引き渡し

ネットワークチームは、ノード自体がまだ動作していてもゲートウェイアクセスが失われたときにVIPがもう一方のノードに移動するようにできます。このシナリオでは、フェイルオーバーはデバイスの生存状態だけでなく、実際のアップストリームの到達可能性に基づいて行われます。

手動同期を使った計画メンテナンスでの安全な変更

政府機関やビジネスクリティカルなオペレーターは手動同期モードを有効にして、まず1つのノードで変更をテストできます。検証後、変更はピアにプッシュされ、制御されないクラスター全体への伝播が防止されます。

ハードウェアリフレッシュ中の互換性チェック

運用チームは古いノードを取り外して新しいハードウェアをクラスターに追加するときに、参加時にCPU、インターフェース、メモリの違いを確認できます。誤ったスペックのサーバーがクラスターに入る前に警告が生成され、フェイルオーバーリスクが軽減されます。

よくある質問

Active-ActiveとActive-Passiveトポロジーの違いは何ですか？

Active-Passiveでは1つのノードがすべてのサービスVIPを担いながら、もう一方がスタンバイで待機します。Active-Activeでは異なるVIPが両ノードに分散され、両デバイスがライブトラフィックを担います；ノードが障害を起こすと、もう一方がそのVIPの所有権を取得します。両トポロジーは同一のクラスターモデル内でサポートされます。

VRRPだけでは不十分な場合、何を使用できますか？

TR7はクラスターIPフェイルオーバーをVRRPプロトコルに制限しません。リンク、ゲートウェイ、またはリンク+ゲートウェイメソッドも利用可能です。ゲートウェイモードはノード自体が稼働しているように見えてもアップストリームアクセスが失われたときにVIPがもう一方のノードに移動することを確保します。これらのオプションはTR7管理インターフェースから直接設定されます。

設定同期はどのように機能しますか？

自動同期が有効な場合、ルール、証明書、サービス設定へのすべてのinsert、update、deleteがピアノードに自動的に送信されます。手動同期モードが有効になると、その伝播が停止します；オペレーターはテスト後にsyncAllまたはrequestSyncAllフローを通じて変更をピアに送信します。

フェイルオーバー時にセッションとレート制限の状態は保持されますか？

はい。スティックテーブル、レート制限カウンター、ソースIPの状態をピアノードにレプリケートできます。フェイルオーバー後、ユーザーはcaptchaの再チャレンジ、レート制限のリセット、またはセッションの切断に直面しません。

クラスターに新しいハードウェアノードを追加するとどうなりますか？

新しいノードがクラスターに参加すると、そのCPUコアセット、ネットワークインターフェース名、RAMが既存のノードと自動的に比較されます。不一致が検出されると、ノードの参加がブロックされ、オペレーターに警告が発生します。このチェックにより、ハードウェアリフレッシュのリスクが最初から排除されます。

GTMと一緒に使用する場合、フェイルオーバーはどのように機能しますか？

ローカルクラスターは同一データセンター内でVRRPベースのVIPフェイルオーバーを提供します。データセンター全体がオフラインになると、GTM（グローバルトラフィックマネージャー）がDNSをリモートデータセンターにリダイレクトします。これによりローカルノードの障害とデータセンターの障害が2つの別々のレイヤーで処理されます。

ADCクラスターを単一の管理モデルで運用

VRRPによるVIPフェイルオーバー、設定同期、ハードウェア検証、制御されたメンテナンスワークフロー — ライブセットアップですべてをご案内します。