Capacidad

Selección Multi-Fuente de DC

Elija el centro de datos adecuado por consulta usando señales de host, servicio y del lado del cliente — no solo "¿es alcanzable?".

El GSLB clásico elige un centro de datos haciendo una única pregunta: ¿es alcanzable? TR7 GTM hace tres: ¿cómo está el propio nodo de DC?, ¿cómo está la aplicación que corre encima?, y ¿cómo es realmente la experiencia del cliente hasta él? Cada fuente aporta un conjunto distinto de señales. La fuente de host del DC aporta CPU, memoria, ancho de banda y pérdida de paquetes medidos a nivel de plataforma. La fuente de servicio aporta tasa de peticiones, conteo de conexiones, tasa de nuevas sesiones, CPU/memoria/ancho de banda asociados a un servicio de aplicación concreto más el número de backends sanos detrás de ese servicio. La fuente de cliente aporta número de saltos, pérdida de paquetes, MOS (Mean Opinion Score, una métrica de calidad para tráfico tipo VoIP) y TTL — medidos frente al resolver o la red del cliente que está consultando. Los operadores eligen una fuente o las combinan. Los criterios de selección son concretos ("mayor número de healthyBackends", "menor pérdida de paquetes hacia el cliente", "CPU por debajo del 70%") en lugar de jerga de fabricante. Pueden devolverse múltiples DCs (`pickDcCount`) para que la distribución ponderada entre varias regiones sanas siga siendo expresiva. El resultado: una decisión GSLB que refleja simultáneamente la aplicación, la plataforma y el camino de red — más cercana a la experiencia real del usuario que cualquier modelo de señal única.

3 fuentes
Host, servicio, cliente — entradas de señal independientes
17 métricas
Combinadas entre las tres fuentes
9 algoritmos
Distribución de registros tras la selección de DC
Por registro
Cada registro DNS elige su propia fuente y criterio

La selección de DC basada en una sola señal pierde la pregunta que realmente importa.

La mayoría de las implementaciones GSLB toman las decisiones de selección de centro de datos a partir de una sola clase de señal. La distancia geográfica es una elección común; el tiempo de ida y vuelta desde los puntos de medida de la plataforma es otra; las búsquedas de topología estática son una tercera. Cada una captura una dimensión útil y pierde las demás.

La geografía ignora la carga — el centro de datos más cercano puede ser también el que esté actualmente bajo presión de capacidad. La latencia desde las sondas del GSLB ignora al usuario — el camino real de red del usuario no es el camino que recorrió la sonda. La topología estática asume que la red no ha cambiado desde que se escribió la configuración.

Las decisiones de producción necesitan las tres vistas a la vez: ¿está la plataforma del DC sana? ¿La aplicación en el DC está actualmente rindiendo? ¿La red desde el usuario hasta el DC es realmente buena en este momento? Cada vista tiene señales que las otras no pueden sustituir.

TR7 GTM expone las tres clases de señales — host, servicio, cliente — como entradas independientes a la selección de DC, permitiendo a los operadores describir la política que de verdad se ajusta a su carga de trabajo.

Nuestro enfoque

La selección de DC se configura por registro DNS. Los operadores eligen qué fuente de señal usar, qué métrica concreta dentro de esa fuente, cuántos DCs seleccionar y cómo distribuir entre los seleccionados.

Fuente de host del DC — salud a nivel de plataforma

Cinco métricas medidas en la plataforma del DC: CPU, memoria, ancho de banda, estado (composite up/down) y pérdida de paquetes. Útil cuando la presión sobre la plataforma del DC es la señal dominante para las decisiones de routing.

Fuente de servicio — rendimiento de la aplicación

Ocho métricas medidas por servicio: CPU, memoria, ancho de banda, tasa de peticiones, conteo de conexiones, tasa de nuevas sesiones, estado y healthyBackends. Dirige el tráfico según lo que la aplicación está haciendo realmente, no solo según si el host está up.

Fuente de cliente — camino de red hasta el solicitante

Cuatro métricas medidas desde el camino de red hasta el cliente que solicita: saltos, MOS (Mean Opinion Score), pérdida de paquetes y TTL. Captura la experiencia del lado del usuario que las sondas en el lado del DC no pueden ver.

Selección Pick-N con algoritmo de distribución

`pickDcCount` elige cuántos DCs devolver. `balanceAlgorithm` distribuye entre los seleccionados — all, top-N, round-robin, weighted round-robin, random, weighted random o closest.

Capacidades

Cada registro DNS en modo DC selecciona de forma independiente su fuente de señal, su criterio y su comportamiento de distribución.

DC host: cinco métricas a nivel de plataforma

La fuente de host del DC expone cpu, mem, bw, status y packetLoss. Status es el estado compuesto de alcanzabilidad/salud calculado a partir de los puntos de acceso WAN y LAN del DC. Útil cuando la capacidad a nivel de host es la señal dominante de routing.

Servicio: ocho métricas a nivel de aplicación

La fuente de servicio expone cpu, mem, bw, request, connection, session_new, status y healthyBackends. El contador de healthyBackends es especialmente relevante — dirige el tráfico al DC donde la aplicación tiene ahora mismo la mayor capacidad operativa, no solo al DC cuya plataforma está up.

Cliente: cuatro medidas del camino de red

La fuente de cliente expone hops (longitud del camino), mos (Mean Opinion Score para calidad de tráfico VoIP/tiempo real), packetLoss y ttl. Estas señales se miden frente a la red del cliente, capturando la experiencia de usuario que las sondas del lado del DC no ven.

Selección estática de DC para casos heredados o simples

El modo estático omite la selección multi-fuente y asigna DCs según reglas definidas por el operador. Útil para registros DNS heredados, routing por cumplimiento (DCs concretos para clientes concretos) y pruebas.

Expresión de criterio definida por el operador

El criterio de selección lo controla el operador: gana el valor más bajo, gana el más alto, el valor iguala al objetivo o el valor difiere en cierto margen. El mismo DSL gobierna la evaluación de criterio en las tres fuentes de señal.

Conteo Pick-N para respuestas multi-DC

`pickDcCount` está por defecto en 1 pero puede ajustarse a más para devolver varios DCs en la respuesta DNS. Esto habilita verdadero balanceo de carga multi-DC en lugar del routing pick-one — los clientes DNS reciben varias respuestas y el resolver o stub del lado del cliente elige entre ellas.

Nueve algoritmos de distribución de registros

Una vez seleccionados los DCs, los registros dentro de cada DC se distribuyen según `balanceAlgorithm`: all (devolver cada registro), top-1/2/3 (devolver los N primeros), round-robin, weighted round-robin, random, weighted random o closest (proximidad al solicitante). El algoritmo correcto depende de si se busca distribución amplia, concentración en top-N o pegajosidad.

Routing por nombre de servicio para DCs específicos de aplicación

Al usar la fuente de servicio, los operadores especifican el nombre del servicio — aplicaciones distintas corriendo en la misma flota de DCs pueden tener reglas de routing distintas. El conteo de healthyBackends para el servicio A y el servicio B puede gobernar elecciones de DC independientes.

Combinado con registros fail-safe

Si la selección no devuelve ningún DC sano, la lista fail-safe del registro proporciona respuestas de último recurso — IPs definidas por el operador que siempre se devuelven cuando todas las señales multi-fuente fallan. Evita que la respuesta final sea NXDOMAIN.

Selección por registro — distintos registros, distintas fuentes

La selección de DC se configura por registro DNS. El mismo dominio puede tener un registro A enrutado por service.healthyBackends, un registro MX enrutado por host.status y un CNAME enrutado por client.packetLoss. Los operadores ajustan cada registro a su carga de trabajo.

Profundidad operativa

La selección multi-fuente trabaja junto con las definiciones de DC, los escenarios de health-check, los algoritmos DNS ponderados y los registros fail-safe.

01

Cadencia de recolección de señales

Cada fuente de señal tiene su propia cadencia de medida. Las métricas de host y servicio se refrescan en el ciclo de recolección de métricas del GTM (típicamente cada 30-60 segundos). Las métricas de cliente se actualizan por sesión de resolver. Los operadores ajustan la cadencia por fuente según la topología de DC.

02

Prioridad de fuentes cuando los criterios entran en conflicto

La selección usa una fuente por registro a la vez. Cuando los operadores quieren que las señales de host condicionen a las de servicio ("solo considerar métricas de servicio si el host está sano"), vinculan un escenario basado en host a un registro de fuente de servicio. La estratificación es explícita.

03

Fuente de verdad para healthyBackends

El conteo healthyBackends se lee directamente del nivel de balanceo de carga de la aplicación en cada DC, no se aproxima con sondas externas. El número refleja el pool real de backends sanos detrás del servicio en ese momento.

04

Cómputo de MOS

MOS se calcula a partir de medidas de calidad de red (jitter, pérdida de paquetes, latencia) frente a la red del cliente que solicita. Es más preciso para sesiones de cliente en curso y converge en pocas ventanas de medida para clientes nuevos.

05

Pick-N cuando hay menos DCs disponibles

Si `pickDcCount` es mayor que el número de DCs sanos disponibles, se devuelven todos los DCs sanos disponibles. La plataforma nunca inventa DCs ficticios para alcanzar el objetivo — los operadores ven exactamente qué DCs reales eran elegibles.

06

Interacción entre algoritmos y selección

Selección y distribución se componen: la selección elige los DCs elegibles por criterio; la distribución determina cómo se devuelven los registros dentro de cada DC. Un registro puede elegir 3 DCs por service.healthyBackends y luego devolver los registros dentro de cada DC mediante weighted random.

Cuándo utilizarlo

Enrutar por capacidad de aplicación, no solo por alcanzabilidad del DC

La fuente de servicio con criterio healthyBackends dirige el tráfico al DC donde la aplicación tiene la mayor capacidad operativa. Evita sobrecargar un DC cuyo host está up pero cuyos backends de aplicación están degradados.

Enrutar por experiencia de red del cliente

La fuente de cliente con criterio packetLoss dirige a cada usuario al DC con el camino de red más limpio desde su red. Útil para VoIP, vídeo, gaming y aplicaciones en tiempo real donde la calidad del camino importa más que la proximidad geográfica.

Equilibrar carga entre múltiples DCs sanos

Combine pick-N (por ejemplo, devolver los 3 mejores DCs) con distribución weighted random para repartir tráfico entre varias regiones sanas. Cada cliente DNS recibe varias opciones; los resolvers y stubs distribuyen de forma natural entre ellas.

Selección por capas para cargas críticas

Use un escenario basado en host como filtro ("el DC tiene plataforma sana") y un criterio basado en servicio como selector ("el DC tiene el mayor healthyBackends entre los DCs filtrados"). Las cargas críticas obtienen una selección en dos capas sin scripting.

Preguntas frecuentes

¿En qué se diferencia esto de los registros de topología de F5?
Los registros de topología de F5 mapean tuplas (región del cliente, región del servidor) a preferencias ordenadas de DC — una tabla de topología estática. La selección multi-fuente en TR7 es dinámica: cada selección de DC considera métricas en vivo de una de las tres fuentes. Los dos enfoques se complementan: la topología estática responde a "¿quién es preferido?" y la selección multi-fuente responde a "del conjunto preferido, ¿quién está rindiendo realmente ahora mismo?".
¿Puedo combinar señales de múltiples fuentes?
La selección usa una fuente por registro a la vez. Para estratificar señales (por ejemplo, "solo enrutar a DCs con host sano, luego elegir por métricas de servicio"), los operadores usan un escenario basado en host como filtro y configuran la selección del registro para usar la fuente de servicio. La plataforma compone política por capas a través de la configuración, no mediante una sintaxis de expresión multi-fuente.
¿Qué ocurre si no hay métrica disponible para un DC?
Los DCs con métricas ausentes u obsoletas se tratan como no elegibles para la comparación de criterio. Caen al camino fail-safe. Los operadores ven la obsolescencia en el cuadro de mandos — un DC que no aporta métricas es un problema operativo visible, no un fallo silencioso.
¿Cómo se cuentan los healthyBackends entre servicios?
La métrica healthyBackends es por servicio. Cuando un registro selecciona por service.healthyBackends, la métrica usada es el conteo de backends sanos detrás del servicio nombrado en cada DC. Servicios distintos tienen conteos distintos en el mismo DC, por lo que múltiples registros pueden enrutar usando métricas de servicio distintas.
¿La selección por fuente de cliente requiere infraestructura especial de cliente?
No se requiere ningún agente especial de cliente. Las métricas de cliente se miden frente al resolver que solicita — el mismo camino por el que viajará de vuelta la respuesta DNS. Saltos, pérdida de paquetes y TTL se infieren del propio camino de respuesta. El cálculo de MOS usa análisis estadístico de patrones de jitter y pérdida a lo largo del tiempo.

Elija el centro de datos usando las señales que realmente importan.

Pruebe la selección multi-fuente de DC sobre su propia topología: métricas de host, métricas de servicio y medidas de red del lado del cliente impulsando la misma decisión de routing.