ADC層に2台目のデバイスがあるだけでは高可用性を意味しません。重要な質問は、障害時にどのノードがVIPを所有するか、両ノードが同一の設定を共有しているか、スティックテーブルとセキュリティカウンターがフェイルオーバーを生き残るかどうかです。これらのピースが連携しないと、フェイルオーバーは発生しますが、ユーザーエクスペリエンスとセキュリティ動作が壊れます。
クラシックなVRRPはほとんどのシナリオには十分ですが、すべての問題を解決するわけではありません。ノードは動作しているように見え、VRRPピアはまだ生存しているかもしれませんが、関連するインターフェースがリンクを失っていたり、ゲートウェイが到達不能になっているかもしれません。その状態でデバイスがVIPを保持し続けると、外の世界に到達できないように見えるが生存しているノードにトラフィックが流れます。
手動管理のデプロイメントでは、設定同期も別のリスクです。1つのノードで行われた変更がもう一方に伝播されたかどうか、証明書とルールセットが等しいかどうか、どのデバイスにログが残ったか — これらはすべて継続的なチェックを必要とします。「2つのノードは本当に同一か?」という質問に明確な答えがない場合、クラスターは信頼できる構成ではなく、延期された障害ポイントになります。
ハードウェアの不一致は最も危険なサイレント障害の1つです。異なるネットワークインターフェース名、異なるCPUコアセット、異なるメモリ容量を持つ新しいノードは、最悪のタイミングでクラスター動作を壊す可能性があります。これらの違いはフェイルオーバーイベント中ではなく、クラスター参加時に捕捉される必要があります。
TR7 HAクラスタリングはこれらのリスクを一緒に対処します:VIPフェイルオーバー、TR7制御のリンク/ゲートウェイ決定、同期、制御されたメンテナンスワークフロー、ハードウェア互換性チェック — すべてを1つのモデルで管理します。
TR7はVIPプレーン、アクティブ監視、同期、ハードウェア検証、制御された変更管理が連携した2ノードクラスタリングを実装します。
クラスター設定は両ノード間の共有トポロジーで定義されます。管理インターフェースはこのノードとピアノードを同一モデルで表示します;ルール、証明書、サービスの変更はクラスター動作を念頭に置いて管理されます。
VIPの所有権はクラシックなVRRPで管理できるか、TR7のリンク、ゲートウェイ、またはリンク+ゲートウェイ監視決定で補強できます。これによりピアの生存状態だけでなく、実際のネットワーク到達可能性に基づくフェイルオーバーが可能になります。
CPUコアリスト、ネットワークインターフェース名、メモリサイズが両ノード間で比較されます。ハードウェアの不一致はノードがクラスターに参加するときに捕捉されます — フェイルオーバーイベント中に表面化するまで残りません。
自動同期を一時的に停止できます。オペレーターは1つのノードで変更を行い、結果をテストし、確認後に意図的にすべての変更をピアノードにプッシュします。
HAクラスタリングはVIP所有権から状態レプリケーションまで、ローカル高可用性動作を単一インターフェースで管理します。
TR7はVRRPモデルを使用して各VIPアドレスを保持するノードを管理します。関連するすべてのインターフェースに対してMASTERとBACKUP動作が自動的に生成されます。アクティブノードがオフラインになると、VIPはピアに移動し、ユーザートラフィックは同一アドレス上で継続します。このモデルは実証されたLinuxインフラをTR7管理モデルを通じて利用可能にします。
TR7はクラスターIPフェイルオーバーをVRRPのみに制限しません;リンク、ゲートウェイ、またはリンク+ゲートウェイメソッドも利用可能です。リンクモードではインターフェースキャリア状態が評価され、ゲートウェイモードではアップストリームの到達可能性がチェックされます。リンク+ゲートウェイモードでは両方のシグナルが一緒に評価され、より強いフェイルオーバー決定が行われます。これにより稼働しているように見えるがネットワークパスが壊れているノードにVIPが残るのを防ぐのに役立ちます。
Active-Passiveでは1つのノードがサービスVIPを担いながら、もう一方がスタンバイで待機します。Active-Activeでは異なるVIPが両ノードに分散でき、両デバイスがライブトラフィックを担います。ノードが障害を起こすと、もう一方がそのVIPの所有権を取得します。このアプローチによりフェイルオーバー戦略とデバイス容量の利用をアーキテクチャ上の選好で形成できます。
自動同期が有効な場合、すべてのinsert、update、delete操作がピアノードに送信されます。オペレーターは別のオートメーションを書いたり、手動でファイルをコピーしたり、同期ジョブをスケジュールする必要はありません。両ノードでルール、証明書、サービス設定の一貫性を保つことが簡単になります。これによりフェイルオーバー時の「ピアは本当に同一か?」という曖昧さが軽減されます。
スティックテーブル、レート制限カウンター、ソースIPの状態をピアノードにレプリケートできます。フェイルオーバーが発生すると、ユーザー動作はゼロから再開しません。Captcha、レート制限、セッションルーティングの決定が障害イベント後もより一貫して継続します。この機能はVIPの引き渡しだけでなく、決定状態の保持を目指します。
クラスターに参加するノードのCPUコアセット、ネットワークインターフェース、RAMが比較されます。異なるインターフェース名、欠落したNIC、またはメモリの不一致は最初からエラーとして扱われます。これによりサイレントなハードウェアの違いがフェイルオーバー時に表面化するのを防ぐのに役立ちます。特にハードウェアリフレッシュとスペアノード交換サイクル中の運用リスクを軽減します。
手動同期が有効になると、自動的な変更の伝播が停止します。オペレーターは1つのノードで新しいルール、証明書、またはサービス動作をテストできます。検証が完了したら、syncAllまたはrequestSyncAllフローを通じて変更をピアにプッシュします。このモデルにより誤った変更がクラスター全体に即座に広がるのを防ぎます。
各クラスターIDに対して241.0.1.0/24管理ネットワークからIPが割り当てられます。クラスター内通信はユーザーサービストラフィックと概念的に分離されます。クラスターID値は1-254の範囲で使用され、各IDが専用の管理IPに対応します。この分離により同期とピア通信トラフィックの管理がより予測可能になります。
HAクラスタリングはVRRPスロット、ユニキャスト通信、管理IPペア、設定差分、フェイルバック動作、GTM統合とともに計画されます。
Active-Activeシナリオでは、インターフェースごとにMASTERとBACKUP動作を表す2つのVRRPスロットを生成できます。virtual_router_idとpriorityの値はクラスターロールに応じて設定されます。この構造により同一サブネット内のVIP所有権を衝突なく管理できます。
モダンなデータセンターネットワークでは、マルチキャストVRRPトラフィックが特定のスイッチポリシーによってフィルタリングされる場合があります。TR7はユニキャストピアアプローチを通じてピアノード情報を管理することでこのリスクを軽減します。VRRPトラフィックは期待されるピアノードIPを通じて制御された方法で流れます。
クラスターIPメソッドはvrrp、link、gw、またはlink+gwに設定できます。linkメソッドはインターフェース状態に基づいて決定し、gwはゲートウェイ到達可能性に基づき、link+gwは両方のシグナルの組み合わせに基づきます。これらのオプションはさまざまなネットワーク設計でVIP動作をより現実的にします。
クラスター同期は各インターフェースに定義されたIPペアを通じて実行されます。これらのIPは本番VIPとは別に扱われます。これにより同期トラフィックとユーザートラフィックが運用上分離されます。
nopreemptモードにより、古いマスターがオンラインに戻ったときにVIPが自動的に元に戻るのを防ぎます。これにより一時的な回復後に再び障害が発生するシナリオでのping-pongフェイルオーバーが回避されます。フェイルバックの決定はオペレーターによって意図的に行われます。
ローカルクラスターは同一データセンター内でのVIPフェイルオーバーを提供します。データセンター全体がオフラインになると、GTM層がDNSをリモートデータセンターにリダイレクトできます。これによりローカルノードの障害とデータセンターの障害が2つの異なるレベルで処理されます。
金融機関はモバイルおよびインターネットバンキングのVIPを2つのTR7 ADCノード間で高可用性構成で実行できます。ノードがメンテナンスまたは障害でオフラインになると、もう一方のノードがVIPの所有権を取得し、同一アドレス上でサービスアクセスが継続します。
ネットワークチームは、ノード自体がまだ動作していてもゲートウェイアクセスが失われたときにVIPがもう一方のノードに移動するようにできます。このシナリオでは、フェイルオーバーはデバイスの生存状態だけでなく、実際のアップストリームの到達可能性に基づいて行われます。
政府機関やビジネスクリティカルなオペレーターは手動同期モードを有効にして、まず1つのノードで変更をテストできます。検証後、変更はピアにプッシュされ、制御されないクラスター全体への伝播が防止されます。
運用チームは古いノードを取り外して新しいハードウェアをクラスターに追加するときに、参加時にCPU、インターフェース、メモリの違いを確認できます。誤ったスペックのサーバーがクラスターに入る前に警告が生成され、フェイルオーバーリスクが軽減されます。
VRRPによるVIPフェイルオーバー、設定同期、ハードウェア検証、制御されたメンテナンスワークフロー — ライブセットアップですべてをご案内します。