El modelo GSLB clásico trata a cada centro de datos como una única entidad con un único estado de alcanzabilidad. O el DC está arriba o está abajo. La mayoría de las redes empresariales se construyen de forma diferente: enlaces de internet externos, enlaces MPLS o VPN privados, peering cross-DC dedicado, conexiones a redes de partner — cada uno lleva sus propios patrones de caída y su propia política de routing.
Cuando un proveedor de tránsito externo falla pero el MPLS privado sigue arriba, la vista binaria dice "DC caído" — pero el tráfico interno cross-DC debería seguir fluyendo. Cuando el enlace privado está congestionado pero el enlace público está sano, la vista binaria dice "DC arriba" — pero los servicios internos sensibles a la latencia se están degradando. Los health checks de enlace único no pueden distinguir estos estados, y los operadores se ven forzados a elegir entre falsos positivos y falsos negativos.
La respuesta correcta es la alcanzabilidad multi-camino: monitorizar los puntos de entrada de cada red de forma independiente y dejar que la política consuma las señales separadas. Las definiciones de centro de datos de TR7 GTM son dual-path de forma nativa: los puntos de acceso WAN y los puntos de acceso LAN son listas independientes, cada una monitorizada por separado, cada una contribuyendo flags distintos a las decisiones de failover.
Cada centro de datos de TR7 GTM se define con dos listas de acceso independientes — una para endpoints WAN, otra para endpoints LAN. Cada lista mantiene múltiples direcciones con contexto de red completo.
Cada entrada de acceso WAN lleva IP, puerto, asignación de V-Device y route table. Múltiples entradas WAN por DC capturan caminos externos redundantes (tránsito primario, tránsito secundario, peering de partner).
Cada entrada de acceso LAN refleja la estructura WAN con contexto de red privada. Múltiples entradas LAN capturan enlaces MPLS, túneles VPN, fibra cross-DC dedicada y otros caminos privados.
Cuando algunas entradas WAN son inalcanzables pero las entradas LAN están sanas (o viceversa), el DC está en estado parcial. Los escenarios definidos por el operador consumen el estado parcial como una señal distinta — la política de failover no se ve forzada a un binario up/down.
Cada entrada de acceso está vinculada a un V-Device y una route table específicos. Esto permite a un único despliegue de TR7 monitorizar DCs en múltiples segmentos de red — DCs solo internos, DCs en DMZ, DCs conectados a partner — sin colapsarlos en un único contexto de routing.
La monitorización dual-path está integrada en el modelo de centro de datos y se consume a lo largo de la lógica de decisión de escenarios, triggers y registros DNS.
wanAccess es un array — cada entrada es una dirección de red completa (IP, puerto, V-Device, route table). Un DC con dos proveedores de tránsito externos tiene dos entradas WAN; si una falla, el DC es parcialmente alcanzable por WAN pero no está completamente caído en WAN.
lanAccess refleja la lista WAN con entradas de red privada. Un DC con MPLS más un enlace dedicado de peering tiene dos entradas LAN. El tráfico interno cross-DC usa el camino LAN; la alcanzabilidad LAN se monitoriza de forma independiente de la WAN.
Cada endpoint WAN y LAN se monitoriza de forma independiente. El estado del DC es la composición de todos los estados de salud por endpoint, expuesto como señales separadas (any-WAN-up, all-WAN-up, any-LAN-up, all-LAN-up, internet-reachable).
Cuando TR7 GTM autogenera escenarios de failover para un par de DCs, las expresiones de condición generadas combinan señales de alcanzabilidad WAN, alcanzabilidad LAN y alcanzabilidad de internet. Los operadores no escriben la lógica; la plataforma la compone a partir de las entradas dual-path.
Los escenarios personalizados referencian los flags de alcanzabilidad por DC por ID. Una expresión como "DC-B WAN está caído AND DC-B LAN está arriba" selecciona el estado parcial exacto sobre el que el operador quiere actuar.
Cada DC lleva parámetros de health-check ajustables por el operador: con qué frecuencia sondear cada punto de acceso, cuántos éxitos sucesivos se requieren para marcarlo como up y cuántos fallos para marcarlo como down. Los mismos valores de umbral se aplican a WAN y LAN; la personalización por endpoint ocurre a través de las asignaciones de V-Device y route table.
Los endpoints WAN y LAN pueden estar en V-Devices distintos y en route tables distintas. Esto evita la fuga accidental de sondas entre redes — la monitorización solo interna nunca atraviesa el tránsito externo, y la monitorización externa nunca atraviesa el MPLS interno.
Los operadores ven los endpoints WAN y los endpoints LAN de cada DC por separado en el cuadro de mandos. La alcanzabilidad parcial aparece como "3 de 4 endpoints WAN sanos" — no como un único flag up/down.
Cuando un escenario dispara triggers, la carga útil incluye el estado actual de alcanzabilidad de cada endpoint WAN y LAN. Los sistemas downstream (SIEM, gestión de incidentes) reciben contexto de topología estructurado para el evento de failover.
Los operadores definen escenarios separados para caídas solo de WAN y caídas solo de LAN. Un fallo de WAN puede disparar failover externo a nivel DNS; un fallo de LAN puede disparar cambios internos de route table vía el sistema de triggers. Dos caminos de respuesta distintos a partir de dos clases de señal distintas.
La monitorización dual-path trabaja con V-Devices, route tables, expresiones de condición de escenario y composición de carga útil de triggers.
La salud de cada endpoint de acceso se determina mediante una sonda configurable (TCP, HTTP, HTTPS, ICMP, DNS, etc.). El flag compuesto WAN-alcanzable del DC es verdadero si cualquiera (o todos, según la política del operador) de los endpoints WAN están sanos. La misma composición se aplica a LAN.
Un flag separado de alcanzabilidad de internet se computa a partir de resultados de sonda externos. Este flag es independiente de cualquier endpoint WAN específico y se usa en escenarios autogenerados para detectar aislamiento externo total.
La asignación V-Device + route table de cada entrada de acceso determina en qué contexto de red se ejecuta la sonda. Las sondas para endpoints LAN atraviesan infraestructura interna; las sondas para endpoints WAN atraviesan infraestructura externa. La plataforma impone esta separación.
accessPeriod, requiredSuccess, requiredFailure se definen por DC. Un DC crítico puede usar una sonda de 30 segundos con umbrales 2-éxito/1-fallo para failover rápido; un DC menos crítico puede usar sondas de 5 minutos con 3-éxito/3-fallo por estabilidad.
Las condiciones referencian señales de alcanzabilidad por ID: `
Cuando un escenario dispara triggers, la carga útil lleva el estado actual de alcanzabilidad de cada DC: número de endpoints WAN, número de endpoints LAN, conteos de endpoints sanos, últimos tiempos de sondeo. Los sistemas de gestión de incidentes reciben contexto estructurado para el evento de failover.
El proveedor de tránsito externo falla. El flag WAN-alcanzable del DC afectado cae; el LAN-alcanzable sigue arriba. Los usuarios externos hacen failover vía DNS; el tráfico interno cross-DC continúa sobre MPLS sin disrupción.
El enlace MPLS al DC falla. LAN-alcanzable cae; WAN-alcanzable sigue arriba. Los usuarios externos siguen alcanzando el DC; los servicios internos enrutan alrededor del DC vía caminos alternativos disparados por el escenario de fallo de LAN.
Los entornos regulados (gobierno, defensa, finanzas) suelen exigir una separación estricta entre los caminos de red públicos y privados. La monitorización dual-path de TR7 expresa esta separación de forma nativa — cada camino tiene sus propias sondas, sus propios umbrales y su propia respuesta de política.
Los DCs con dos o tres proveedores de tránsito ven la alcanzabilidad de cada proveedor por separado. La caída de un único tránsito no marca el DC como WAN-caído — solo su endpoint específico se vuelve inalcanzable, y los operadores ven exactamente qué tránsito falló.
Recorra la monitorización dual-path de DC sobre su propia topología: caídas de tránsito WAN, DCs solo con MPLS, alcanzabilidad parcial — todo como estados reconocidos, no como casos límite.