O modelo clássico de GSLB trata cada data center como uma entidade única com um estado único de alcançabilidade. Ou o DC está up, ou está down. A maioria das redes empresariais é construída de forma diferente: links externos de internet, links MPLS ou VPN privados, peering dedicado entre DCs, conexões com redes de parceiros — cada um carrega seus próprios padrões de interrupção e sua própria política de roteamento.
Quando um provedor de trânsito externo falha mas o MPLS privado permanece up, a visão binária diz "DC está down" — mas o tráfego interno entre DCs ainda deveria fluir. Quando o link privado está congestionado mas o link público está saudável, a visão binária diz "DC está up" — mas serviços internos sensíveis a latência estão degradando. Health checks de link único não conseguem distinguir esses estados, e os operadores são forçados a escolher entre falsos positivos e falsos negativos.
A resposta certa é alcançabilidade multi-caminho: monitorar os pontos de entrada de cada rede independentemente e deixar a política consumir os sinais separados. As definições de data center do TR7 GTM são nativamente em duplo caminho: pontos de acesso WAN e pontos de acesso LAN são listas independentes, cada uma monitorada separadamente, cada uma contribuindo com flags distintas às decisões de failover.
Cada data center do TR7 GTM é definido com duas listas de acesso independentes — uma para endpoints WAN, outra para endpoints LAN. Cada lista contém múltiplos endereços com contexto de rede completo.
Cada entrada de acesso WAN carrega IP, porta, atribuição de V-Device e route table. Múltiplas entradas WAN por DC capturam caminhos externos redundantes (trânsito primário, trânsito secundário, peering de parceiro).
Cada entrada de acesso LAN espelha a estrutura WAN com contexto de rede privada. Múltiplas entradas LAN capturam links MPLS, túneis VPN, fibra dedicada entre DCs e outros caminhos privados.
Quando algumas entradas WAN estão inalcançáveis mas as entradas LAN estão saudáveis (ou vice-versa), o DC está em estado parcial. Cenários definidos pelo operador consomem o estado parcial como sinal distinto — a política de failover não é forçada a um binário up/down.
Cada entrada de acesso é vinculada a um V-Device específico e a uma route table. Isso permite que uma única implantação TR7 monitore DCs em múltiplos segmentos de rede — DCs apenas internos, DCs em DMZ, DCs conectados a parceiros — sem colapsá-los em um único contexto de roteamento.
O monitoramento em duplo caminho está integrado ao modelo de data center e é consumido em toda a lógica de decisão de cenário, gatilho e registro DNS.
wanAccess é um array — cada entrada é um endereço de rede completo (IP, porta, V-Device, route table). Um DC com dois provedores de trânsito externos tem duas entradas WAN; se um falha, o DC está parcialmente alcançável pela WAN, mas não completamente fora pela WAN.
lanAccess espelha a lista WAN com entradas de rede privada. Um DC com MPLS mais um link dedicado de peering tem duas entradas LAN. O tráfego interno entre DCs usa o caminho LAN; a alcançabilidade LAN é monitorada independentemente da WAN.
Cada endpoint WAN e LAN é monitorado independentemente. O status do DC é o composto de todos os estados de saúde por endpoint, expostos como sinais separados (any-WAN-up, all-WAN-up, any-LAN-up, all-LAN-up, internet-reachable).
Quando o TR7 GTM auto-gera cenários de failover para um par de DCs, as expressões de condição geradas combinam sinais de alcançabilidade WAN, LAN e internet. Os operadores não escrevem a lógica; a plataforma a compõe a partir das entradas em duplo caminho.
Cenários customizados referenciam as flags de alcançabilidade por DC pelo ID. Uma expressão como "WAN do DC-B está down AND LAN do DC-B está up" seleciona o estado parcial exato em que o operador quer agir.
Cada DC carrega parâmetros de health check ajustáveis pelo operador: com que frequência sondar cada ponto de acesso, quantos sucessos consecutivos são exigidos para marcar como up e quantas falhas para marcar como down. Os mesmos valores de limiar se aplicam a WAN e LAN; a customização por endpoint acontece via as atribuições de V-Device e route table.
Endpoints WAN e LAN podem ficar em V-Devices diferentes e em route tables diferentes. Isso previne vazamento acidental de sondas entre redes — o monitoramento apenas interno nunca atravessa trânsito externo e o monitoramento externo nunca atravessa o MPLS interno.
Os operadores enxergam separadamente os endpoints WAN e LAN de cada DC no dashboard. A alcançabilidade parcial aparece como "3 de 4 endpoints WAN saudáveis" — não como uma única flag up/down.
Quando um cenário dispara gatilhos, o payload do gatilho inclui o estado atual de alcançabilidade de cada endpoint WAN e LAN. Sistemas downstream (SIEM, gerenciamento de incidentes) recebem contexto estruturado de topologia para o evento de failover.
Os operadores definem cenários separados para quedas apenas de WAN e apenas de LAN. Uma falha WAN pode disparar failover externo no nível DNS; uma falha LAN pode disparar mudanças de route table internas via o sistema de gatilhos. Dois caminhos de resposta distintos a partir de duas classes distintas de sinal.
O monitoramento em duplo caminho trabalha com V-Devices, route tables, expressões de condição de cenário e composição do payload de gatilho.
A saúde de cada endpoint de acesso é determinada por uma sonda configurável (TCP, HTTP, HTTPS, ICMP, DNS, etc.). A flag composta WAN-reachable para o DC é true se algum (ou todos, conforme a política do operador) endpoints WAN estão saudáveis. A mesma composição se aplica à LAN.
Uma flag separada de alcançabilidade à internet é computada a partir dos resultados de sondas externas. Essa flag é independente de qualquer endpoint WAN específico e é usada em cenários auto-gerados para detectar isolamento externo total.
A atribuição V-Device + route table de cada entrada de acesso determina em qual contexto de rede a sonda roda. Sondas para endpoints LAN atravessam a infraestrutura interna; sondas para endpoints WAN atravessam a infraestrutura externa. A plataforma reforça essa separação.
accessPeriod, requiredSuccess, requiredFailure são definidos por DC. Um DC de alta importância pode usar uma sonda de 30 segundos com limiares 2-sucessos/1-falha para failover rápido; um DC menos crítico pode usar sondas de 5 minutos com 3-sucessos/3-falhas para estabilidade.
As condições referenciam sinais de alcançabilidade pelo ID: `
Quando um cenário dispara gatilhos, o payload carrega o estado atual de alcançabilidade de cada DC: contagem de endpoints WAN, contagem de endpoints LAN, contagens de endpoints saudáveis, horários da última sonda. Sistemas de gerenciamento de incidentes recebem contexto estruturado para o evento de failover.
O provedor de trânsito externo falha. A flag WAN-reachable do DC afetado cai; LAN-reachable permanece up. Os usuários externos fazem failover via DNS; o tráfego interno entre DCs continua sobre MPLS sem interrupção.
O link MPLS para o DC falha. LAN-reachable cai; WAN-reachable permanece up. Os usuários externos continuam alcançando o DC; os serviços internos roteiam ao redor do DC via caminhos alternativos disparados pelo cenário de falha de LAN.
Ambientes regulados (governo, defesa, financeiro) frequentemente exigem separação estrita entre caminhos de rede pública e privada. O monitoramento em duplo caminho do TR7 expressa essa separação nativamente — cada caminho tem suas próprias sondas, seus próprios limiares e sua própria resposta de política.
DCs com dois ou três provedores de trânsito veem a alcançabilidade de cada provedor separadamente. Um único trânsito caindo não marca o DC como WAN-down — apenas seu endpoint específico se torna inalcançável, e os operadores veem exatamente qual trânsito falhou.
Percorra o monitoramento de DC em duplo caminho na sua própria topologia: quedas de trânsito WAN, DCs apenas MPLS, alcançabilidade parcial — todos como estados reconhecidos, não casos extremos.