Capacidad

Monitorización Dual-Path WAN/LAN de DC

Los caminos de red externos e internos de cada DC monitorizados de forma independiente — la alcanzabilidad parcial es un estado reconocido, no un binario.

El GSLB clásico pregunta: "¿Es alcanzable el centro de datos?". Una respuesta. TR7 GTM pregunta dos: "¿Es alcanzable desde la WAN?" y "¿Es alcanzable desde la LAN?" — y permite que la política de failover use ambas respuestas de forma independiente. Las redes de producción hacen que esto importe constantemente. El enlace externo de internet de un DC cae pero su enlace MPLS privado a otros DCs sigue arriba: los usuarios externos deberían hacer failover, pero los servicios cross-DC internos deberían continuar. La LAN/red privada de un DC está caída pero su WAN está arriba: el tráfico externo debería seguir fluyendo mientras el failover interno se dispara. El enlace WAN de un DC está arriba pero solo alcanza un peering parcial: el DC es alcanzable, pero no desde todas las direcciones. Las definiciones de centro de datos de TR7 GTM llevan dos listas de acceso independientes: `wanAccess[]` para caminos de red externos y `lanAccess[]` para caminos de red internos/privados. Cada lista mantiene múltiples endpoints (IP, puerto, V-Device, route table) de modo que un DC tiene múltiples puntos de entrada WAN y múltiples puntos de entrada LAN. Cada endpoint se monitoriza de forma independiente. Los escenarios de failover consumen los flags de alcanzabilidad resultantes como señales separadas. El resultado: la política de failover refleja la topología real. Fallo solo de WAN, fallo solo de LAN, alcanzabilidad parcial y caída total son cuatro estados distintos con cuatro respuestas de política distintas — no colapsadas en un único binario.

2 caminos

Listas de acceso WAN y LAN por DC, monitorizadas de forma independiente

N endpoints

Cada camino mantiene múltiples endpoints — tránsito redundante capturado de forma nativa

4 estados

Full-up, solo-WAN, solo-LAN, full-down — cada uno una entrada de política distinta

Por DC

Umbrales de salud ajustados de forma independiente por centro de datos

La alcanzabilidad de enlace único oculta los fallos asimétricos que producen las redes reales.

El modelo GSLB clásico trata a cada centro de datos como una única entidad con un único estado de alcanzabilidad. O el DC está arriba o está abajo. La mayoría de las redes empresariales se construyen de forma diferente: enlaces de internet externos, enlaces MPLS o VPN privados, peering cross-DC dedicado, conexiones a redes de partner — cada uno lleva sus propios patrones de caída y su propia política de routing.

Cuando un proveedor de tránsito externo falla pero el MPLS privado sigue arriba, la vista binaria dice "DC caído" — pero el tráfico interno cross-DC debería seguir fluyendo. Cuando el enlace privado está congestionado pero el enlace público está sano, la vista binaria dice "DC arriba" — pero los servicios internos sensibles a la latencia se están degradando. Los health checks de enlace único no pueden distinguir estos estados, y los operadores se ven forzados a elegir entre falsos positivos y falsos negativos.

La respuesta correcta es la alcanzabilidad multi-camino: monitorizar los puntos de entrada de cada red de forma independiente y dejar que la política consuma las señales separadas. Las definiciones de centro de datos de TR7 GTM son dual-path de forma nativa: los puntos de acceso WAN y los puntos de acceso LAN son listas independientes, cada una monitorizada por separado, cada una contribuyendo flags distintos a las decisiones de failover.

Nuestro enfoque

Cada centro de datos de TR7 GTM se define con dos listas de acceso independientes — una para endpoints WAN, otra para endpoints LAN. Cada lista mantiene múltiples direcciones con contexto de red completo.

Lista wanAccess — alcanzabilidad de red externa

Cada entrada de acceso WAN lleva IP, puerto, asignación de V-Device y route table. Múltiples entradas WAN por DC capturan caminos externos redundantes (tránsito primario, tránsito secundario, peering de partner).

Lista lanAccess — alcanzabilidad de red interna/privada

Cada entrada de acceso LAN refleja la estructura WAN con contexto de red privada. Múltiples entradas LAN capturan enlaces MPLS, túneles VPN, fibra cross-DC dedicada y otros caminos privados.

Alcanzabilidad parcial como estado reconocido

Cuando algunas entradas WAN son inalcanzables pero las entradas LAN están sanas (o viceversa), el DC está en estado parcial. Los escenarios definidos por el operador consumen el estado parcial como una señal distinta — la política de failover no se ve forzada a un binario up/down.

Contexto de V-Device y route table por entrada

Cada entrada de acceso está vinculada a un V-Device y una route table específicos. Esto permite a un único despliegue de TR7 monitorizar DCs en múltiples segmentos de red — DCs solo internos, DCs en DMZ, DCs conectados a partner — sin colapsarlos en un único contexto de routing.

Capacidades

La monitorización dual-path está integrada en el modelo de centro de datos y se consume a lo largo de la lógica de decisión de escenarios, triggers y registros DNS.

Múltiples endpoints de acceso WAN por DC

wanAccess es un array — cada entrada es una dirección de red completa (IP, puerto, V-Device, route table). Un DC con dos proveedores de tránsito externos tiene dos entradas WAN; si una falla, el DC es parcialmente alcanzable por WAN pero no está completamente caído en WAN.

Múltiples endpoints de acceso LAN por DC

lanAccess refleja la lista WAN con entradas de red privada. Un DC con MPLS más un enlace dedicado de peering tiene dos entradas LAN. El tráfico interno cross-DC usa el camino LAN; la alcanzabilidad LAN se monitoriza de forma independiente de la WAN.

Sondeo de salud por endpoint

Cada endpoint WAN y LAN se monitoriza de forma independiente. El estado del DC es la composición de todos los estados de salud por endpoint, expuesto como señales separadas (any-WAN-up, all-WAN-up, any-LAN-up, all-LAN-up, internet-reachable).

Los escenarios autogenerados de pares DC usan ambos caminos

Cuando TR7 GTM autogenera escenarios de failover para un par de DCs, las expresiones de condición generadas combinan señales de alcanzabilidad WAN, alcanzabilidad LAN y alcanzabilidad de internet. Los operadores no escriben la lógica; la plataforma la compone a partir de las entradas dual-path.

Los escenarios manuales pueden referenciar directamente los flags WAN/LAN

Los escenarios personalizados referencian los flags de alcanzabilidad por DC por ID. Una expresión como "DC-B WAN está caído AND DC-B LAN está arriba" selecciona el estado parcial exacto sobre el que el operador quiere actuar.

Periodo de acceso y umbrales de éxito/fallo requeridos

Cada DC lleva parámetros de health-check ajustables por el operador: con qué frecuencia sondear cada punto de acceso, cuántos éxitos sucesivos se requieren para marcarlo como up y cuántos fallos para marcarlo como down. Los mismos valores de umbral se aplican a WAN y LAN; la personalización por endpoint ocurre a través de las asignaciones de V-Device y route table.

La segmentación por V-Device impone separación

Los endpoints WAN y LAN pueden estar en V-Devices distintos y en route tables distintas. Esto evita la fuga accidental de sondas entre redes — la monitorización solo interna nunca atraviesa el tránsito externo, y la monitorización externa nunca atraviesa el MPLS interno.

El cuadro de mandos muestra los estados parciales explícitamente

Los operadores ven los endpoints WAN y los endpoints LAN de cada DC por separado en el cuadro de mandos. La alcanzabilidad parcial aparece como "3 de 4 endpoints WAN sanos" — no como un único flag up/down.

Los triggers de escenario reciben carga útil dual-path

Cuando un escenario dispara triggers, la carga útil incluye el estado actual de alcanzabilidad de cada endpoint WAN y LAN. Los sistemas downstream (SIEM, gestión de incidentes) reciben contexto de topología estructurado para el evento de failover.

Umbrales de failover independientes para caídas solo de WAN vs solo de LAN

Los operadores definen escenarios separados para caídas solo de WAN y caídas solo de LAN. Un fallo de WAN puede disparar failover externo a nivel DNS; un fallo de LAN puede disparar cambios internos de route table vía el sistema de triggers. Dos caminos de respuesta distintos a partir de dos clases de señal distintas.

Profundidad operativa

La monitorización dual-path trabaja con V-Devices, route tables, expresiones de condición de escenario y composición de carga útil de triggers.

Composición de salud por endpoint

La salud de cada endpoint de acceso se determina mediante una sonda configurable (TCP, HTTP, HTTPS, ICMP, DNS, etc.). El flag compuesto WAN-alcanzable del DC es verdadero si cualquiera (o todos, según la política del operador) de los endpoints WAN están sanos. La misma composición se aplica a LAN.

Señal de alcanzabilidad de internet

Un flag separado de alcanzabilidad de internet se computa a partir de resultados de sonda externos. Este flag es independiente de cualquier endpoint WAN específico y se usa en escenarios autogenerados para detectar aislamiento externo total.

Vinculación a V-Device y route table

La asignación V-Device + route table de cada entrada de acceso determina en qué contexto de red se ejecuta la sonda. Las sondas para endpoints LAN atraviesan infraestructura interna; las sondas para endpoints WAN atraviesan infraestructura externa. La plataforma impone esta separación.

Ajuste de umbrales por DC

accessPeriod, requiredSuccess, requiredFailure se definen por DC. Un DC crítico puede usar una sonda de 30 segundos con umbrales 2-éxito/1-fallo para failover rápido; un DC menos crítico puede usar sondas de 5 minutos con 3-éxito/3-fallo por estabilidad.

Sintaxis de condición compuesta en escenarios

Las condiciones referencian señales de alcanzabilidad por ID: `|wanAccess`, `|lanAccess`, `|access`, `|internet`. El sufijo `!` niega. Los grupos de condición combinados se unen con AND/OR para lógica multi-camino expresiva.

Estructura de la carga útil del trigger

Cuando un escenario dispara triggers, la carga útil lleva el estado actual de alcanzabilidad de cada DC: número de endpoints WAN, número de endpoints LAN, conteos de endpoints sanos, últimos tiempos de sondeo. Los sistemas de gestión de incidentes reciben contexto estructurado para el evento de failover.

Cuándo utilizarlo

Caída del tránsito externo con MPLS interno intacto

El proveedor de tránsito externo falla. El flag WAN-alcanzable del DC afectado cae; el LAN-alcanzable sigue arriba. Los usuarios externos hacen failover vía DNS; el tráfico interno cross-DC continúa sobre MPLS sin disrupción.

Caída de red interna/privada con enlace externo sano

El enlace MPLS al DC falla. LAN-alcanzable cae; WAN-alcanzable sigue arriba. Los usuarios externos siguen alcanzando el DC; los servicios internos enrutan alrededor del DC vía caminos alternativos disparados por el escenario de fallo de LAN.

Redes gubernamentales / reguladas con estricta separación de caminos

Los entornos regulados (gobierno, defensa, finanzas) suelen exigir una separación estricta entre los caminos de red públicos y privados. La monitorización dual-path de TR7 expresa esta separación de forma nativa — cada camino tiene sus propias sondas, sus propios umbrales y su propia respuesta de política.

Redundancia multi-tránsito con visibilidad por enlace

Los DCs con dos o tres proveedores de tránsito ven la alcanzabilidad de cada proveedor por separado. La caída de un único tránsito no marca el DC como WAN-caído — solo su endpoint específico se vuelve inalcanzable, y los operadores ven exactamente qué tránsito falló.

Preguntas frecuentes

¿En qué se diferencia esto de ejecutar dos health checks separados?

Dos health checks separados le dan dos señales separadas, pero no están acopladas a una identidad de DC. La monitorización dual-path vincula ambas señales a la misma entidad de DC, de modo que los escenarios de failover referencian "la WAN del DC-A está caída" en lugar de "el check-37 está caído". El mapeo semántico al centro de datos, al V-Device y a la route table se preserva, y el cuadro de mandos muestra la imagen completa de caminos del DC en una vista.

¿Puede un DC tener solo acceso WAN o solo acceso LAN?

Sí. Un DC orientado a internet sin MPLS interno tendría una lista lanAccess vacía; un DC solo interno sin tránsito externo tendría una lista wanAccess vacía. El modelo dual-path acomoda DCs con conectividad asimétrica sin forzar a los operadores a inventar endpoints sintéticos.

¿Cómo interactúa esto con DNS split-horizon?

La monitorización dual-path es independiente del DNS split-horizon pero compone bien con él. Split-horizon sirve respuestas DNS distintas a clientes internos frente a externos; la monitorización dual-path decide si el DC es alcanzable desde cada lado. Juntos, los clientes internos pueden ser dirigidos a DCs alcanzables por LAN mientras los externos son dirigidos a DCs alcanzables por WAN.

¿Qué pasa si la WAN y la LAN tienen latencias distintas?

La latencia la capturan las señales de fuente de cliente en la selección multi-fuente de DC. La alcanzabilidad WAN/LAN es una dimensión separada: le dice qué caminos están disponibles, no cuál es el más rápido. Combine alcanzabilidad WAN/LAN (elegibilidad) con latencia de fuente de cliente (preferencia) para una selección completa consciente del camino.

¿Son iguales los calendarios de sondeo de WAN y LAN?

Por defecto, sí — ambos heredan los umbrales accessPeriod, requiredSuccess y requiredFailure del DC. Los operadores pueden sobreescribirlos por V-Device y route table si el camino WAN requiere un sondeo más rápido que el camino LAN (o viceversa).

Deje de colapsar la topología real de red en un único flag up/down.

Recorra la monitorización dual-path de DC sobre su propia topología: caídas de tránsito WAN, DCs solo con MPLS, alcanzabilidad parcial — todo como estados reconocidos, no como casos límite.