Funktion

Multi-Source-DC-Auswahl

Wählen Sie pro Abfrage das richtige Rechenzentrum anhand von Host-, Service- und clientseitigen Signalen — nicht nur "ist es erreichbar".

Klassisches GSLB wählt ein Rechenzentrum durch eine einzige Frage: Ist es erreichbar? TR7 GTM stellt drei Fragen: Wie geht es dem DC-Node selbst, wie läuft die darauf betriebene Anwendung, und wie ist die Client-Erfahrung dazu tatsächlich? Jede Quelle liefert einen eigenen Signalsatz. Die DC-Host-Quelle liefert CPU, Speicher, Bandbreite und Paketverlust auf Plattformebene. Die Service-Quelle liefert Requestrate, Verbindungsanzahl, neue Session-Rate, CPU/Speicher/Bandbreite gebunden an einen bestimmten Anwendungsdienst sowie die Anzahl der gesunden Backends hinter diesem Service. Die Client-Quelle liefert Hop-Anzahl, Paketverlust, MOS (Mean Opinion Score für VoIP-Traffic-Qualität) und TTL — gemessen gegenüber dem anfragenden Resolver oder Client-Netzwerk. Operatoren wählen eine Quelle oder kombinieren sie. Die Auswahlkriterien sind konkret ("höchste healthyBackends-Anzahl", "niedrigster Paketverlust zum Client", "CPU unter 70%") statt Anbieter-Jargon. Mehrere DCs können zurückgegeben werden (`pickDcCount`), sodass eine gewichtete Verteilung über mehrere gesunde Regionen ausdrucksstark bleibt. Das Ergebnis: eine GSLB-Entscheidung, die Anwendung, Plattform und Netzwerkpfad gleichzeitig widerspiegelt — näher an der tatsächlichen Benutzererfahrung als jedes Einzelsignalmodell.

3 Quellen

Host, Service, Client — unabhängige Signal-Eingaben

17 Metriken

Über die drei Quellen hinweg kombiniert

9 Algorithmen

Record-Verteilung nach DC-Auswahl

Pro Record

Jeder DNS-Record wählt seine eigene Quelle und sein Kriterium

Eine DC-Auswahl mit nur einem Signal verfehlt die eigentlich entscheidende Frage.

Die meisten GSLB-Implementierungen treffen Entscheidungen zur Rechenzentrumsauswahl anhand einer einzigen Signalklasse. Die geografische Entfernung ist eine gängige Wahl; die Round-Trip-Zeit von den Messpunkten der Plattform eine weitere; statische Topologie-Lookups sind eine dritte. Jede erfasst eine nützliche Dimension und verfehlt die anderen.

Geografie ignoriert die Last — das nächstgelegene Rechenzentrum kann gleichzeitig dasjenige sein, das gerade unter Kapazitätsdruck steht. Latenz von den GSLB-Sonden ignoriert den Benutzer — der tatsächliche Netzwerkpfad des Benutzers ist nicht der Pfad, den die Sonde genommen hat. Statische Topologie geht davon aus, dass sich das Netzwerk seit der Konfiguration nicht verändert hat.

Produktive Entscheidungen brauchen alle drei Sichten zugleich: Ist die DC-Plattform gesund? Liefert die Anwendung auf dem DC aktuell Performance? Ist das Netzwerk vom Benutzer zum DC im Moment tatsächlich gut? Jede Sicht hat Signale, die die anderen nicht ersetzen können.

TR7 GTM stellt die drei Signalklassen — Host, Service, Client — als unabhängige Eingaben zur DC-Auswahl bereit, sodass Operatoren die Richtlinie beschreiben können, die tatsächlich zu ihrer Workload passt.

Unser Ansatz

Die DC-Auswahl wird pro DNS-Record konfiguriert. Operatoren wählen, welche Signalquelle verwendet wird, welche konkrete Metrik innerhalb dieser Quelle, wie viele DCs ausgewählt werden und wie über die Auswahl verteilt wird.

DC-Host-Quelle — Health auf Plattformebene

Fünf auf der DC-Plattform gemessene Metriken: CPU, Speicher, Bandbreite, Status (Up/Down-Komposit) und Paketverlust. Nützlich, wenn der Druck auf der DC-Plattform das dominante Signal für Routing-Entscheidungen ist.

Service-Quelle — Anwendungsperformance

Acht pro Service gemessene Metriken: CPU, Speicher, Bandbreite, Requestrate, Verbindungsanzahl, neue Session-Rate, Status und healthyBackends. Leitet den Datenverkehr nach dem, was die Anwendung tatsächlich tut, nicht nur danach, ob der Host läuft.

Client-Quelle — Netzwerkpfad zum Anfrager

Vier vom Netzwerkpfad zum anfragenden Client gemessene Metriken: Hops, MOS (Mean Opinion Score), Paketverlust und TTL. Erfasst die Benutzererfahrung, die DC-seitige Sonden nicht sehen können.

Pick-N-Auswahl mit Verteilungsalgorithmus

`pickDcCount` legt fest, wie viele DCs zurückgegeben werden. `balanceAlgorithm` verteilt über die Auswahl — alle, Top-N, Round Robin, gewichtetes Round Robin, Random, gewichtetes Random oder Closest.

Funktionen

Jeder DNS-Record im DC-Modus wählt unabhängig seine Signalquelle, sein Kriterium und sein Verteilungsverhalten.

DC-Host: fünf Metriken auf Plattformebene

Die DC-Host-Quelle stellt cpu, mem, bw, status und packetLoss bereit. Der Status ist der zusammengesetzte Erreichbarkeits-/Health-Zustand, berechnet aus den WAN- und LAN-Zugriffspunkten des DC. Nützlich, wenn die Kapazität auf Host-Ebene das dominante Routing-Signal ist.

Service: acht Metriken auf Anwendungsebene

Die Service-Quelle stellt cpu, mem, bw, request, connection, session_new, status und healthyBackends bereit. Die healthyBackends-Anzahl ist besonders tragend — sie leitet den Datenverkehr zum DC, an dem die Anwendung gerade die größte funktionierende Kapazität hat, nicht nur zum DC, dessen Plattform läuft.

Client: vier Messungen am Netzwerkpfad

Die Client-Quelle stellt hops (Pfadlänge), mos (Mean Opinion Score für VoIP/Echtzeit-Traffic-Qualität), packetLoss und ttl bereit. Diese Signale werden gegenüber dem Client-Netzwerk gemessen und erfassen die Benutzererfahrung, die DC-seitige Health-Sonden nicht sehen.

Statische DC-Auswahl für Legacy- oder einfache Fälle

Der statische Modus umgeht die Multi-Source-Auswahl und weist DCs basierend auf vom Operator definierten Regeln zu. Nützlich für Legacy-DNS-Records, Compliance-getriebenes Routing (bestimmte DCs für bestimmte Clients) und Tests.

Vom Operator definierter Kriteriumsausdruck

Das Auswahlkriterium wird vom Operator gesteuert: niedrigster Wert gewinnt, höchster Wert gewinnt, Wert gleich Zielwert oder Wert weicht um eine Marge ab. Dieselbe DSL steuert die Kriteriumsauswertung über alle drei Signalquellen hinweg.

Pick-N-Zählung für Multi-DC-Antworten

`pickDcCount` ist standardmäßig 1, kann aber höher gesetzt werden, um in der DNS-Antwort mehrere DCs zurückzugeben. Das ermöglicht echtes Multi-DC-Load-Balancing statt eines Always-Pick-One-Routings — DNS-Clients erhalten mehrere Antworten und der clientseitige Resolver oder Stub wählt zwischen ihnen.

Neun Record-Verteilungsalgorithmen

Sobald DCs ausgewählt sind, werden die Records innerhalb jedes DC gemäß `balanceAlgorithm` verteilt: all (jeden Record zurückgeben), top-1/2/3 (Top-N zurückgeben), Round Robin, gewichtetes Round Robin, Random, gewichtetes Random oder Closest (Nähe zum Anfrager). Der richtige Algorithmus hängt davon ab, ob Sie breite Verteilung, Top-N-Konzentration oder Stickiness wünschen.

Servicename-Routing für anwendungsspezifische DCs

Bei Verwendung der Service-Quelle geben Operatoren den Servicenamen an — verschiedene Anwendungen, die auf derselben DC-Flotte laufen, können unterschiedliche Routing-Regeln haben. Die healthyBackends-Anzahl für Service A und Service B kann separate DC-Auswahlen treiben.

Kombiniert mit Fail-Safe-Records

Liefert die Auswahl kein gesundes DC, stellt die Fail-Safe-Liste des Records Last-Resort-Antworten bereit — vom Operator definierte IPs, die immer dann zurückgegeben werden, wenn alle Multi-Source-Signale ausfallen. Verhindert NXDOMAIN als letzte Antwort.

Auswahl pro Record — unterschiedliche Records, unterschiedliche Quellen

Die DC-Auswahl wird pro DNS-Record konfiguriert. Dieselbe Domain kann einen A-Record geroutet nach service.healthyBackends, einen MX-Record geroutet nach host.status und einen CNAME geroutet nach client.packetLoss haben. Operatoren stimmen jeden Record auf seine Workload ab.

Betriebliche Tiefe

Die Multi-Source-Auswahl arbeitet zusammen mit DC-Definitionen, Health-Check-Szenarien, gewichteten DNS-Algorithmen und Fail-Safe-Records.

Signalerfassungsfrequenz

Jede Signalquelle hat ihre eigene Messfrequenz. Host- und Service-Metriken werden im Metrik-Sammelzyklus des GTM aktualisiert (typischerweise alle 30–60 Sekunden). Client-Metriken werden pro Resolver-Session aktualisiert. Operatoren stimmen die Frequenz pro Quelle an die DC-Topologie an.

Quellenpriorität bei Kriterienkonflikten

Die Auswahl verwendet pro Record jeweils eine Quelle. Wenn Operatoren möchten, dass Host-Signale Service-Signale gaten ("nur Service-Metriken berücksichtigen, wenn der Host gesund ist"), binden sie ein Host-basiertes Szenario an den Service-Source-Record. Das Layering ist explizit.

healthyBackends-Datenquelle

Die healthyBackends-Anzahl wird direkt aus der Load-Balancing-Schicht der Anwendung auf jedem DC gelesen, nicht aus externen Sonden geschätzt. Die Zahl spiegelt den tatsächlichen Pool gesunder Backends hinter dem Service in diesem Moment wider.

MOS-Berechnung

MOS wird aus Netzwerkqualitätsmessungen (Jitter, Paketverlust, Latenz) gegenüber dem anfragenden Client-Netzwerk berechnet. Er ist am genauesten für laufende Client-Sessions und konvergiert bei Erstanfragen innerhalb weniger Messfenster.

Pick-N bei weniger verfügbaren DCs

Ist `pickDcCount` größer als die Anzahl verfügbarer gesunder DCs, werden alle verfügbaren gesunden DCs zurückgegeben. Die Plattform erfindet niemals fiktive DCs, um die Zielanzahl zu erreichen — Operatoren sehen genau, welche realen DCs in Frage kamen.

Wechselwirkung von Algorithmus und Auswahl

Auswahl- und Verteilungsalgorithmen lassen sich zusammensetzen: Die Auswahl bestimmt die infrage kommenden DCs nach Kriterium; die Verteilung bestimmt, wie Records innerhalb jedes DC zurückgegeben werden. Ein Record kann 3 DCs nach service.healthyBackends auswählen und dann Records innerhalb jedes DC per weighted random zurückgeben.

Wann einsetzen

Routing nach Anwendungskapazität, nicht nur nach DC-Erreichbarkeit

Die Service-Quelle mit dem Kriterium healthyBackends leitet den Datenverkehr zum DC, an dem die Anwendung die größte funktionierende Kapazität hat. Vermeidet Hot-Spotting eines DC, dessen Host läuft, dessen Anwendungs-Backends jedoch degradiert sind.

Routing nach Client-Netzwerkerfahrung

Die Client-Quelle mit dem Kriterium packetLoss leitet jeden Benutzer zum DC mit dem saubersten Netzwerkpfad aus seinem Netzwerk. Nützlich für VoIP, Video, Gaming und Echtzeitanwendungen, bei denen Pfadqualität wichtiger ist als geografische Nähe.

Lastverteilung über mehrere gesunde DCs

Kombinieren Sie Pick-N (z. B. Top-3-DCs zurückgeben) mit weighted random distribution, um Traffic über mehrere gesunde Regionen zu teilen. Jeder DNS-Client erhält mehrere Optionen; Resolver und Stubs verteilen natürlich darauf.

Mehrschichtige Auswahl für unternehmenskritische Workloads

Verwenden Sie ein Host-basiertes Szenario als Gate ("DC ist plattformgesund") und ein Service-basiertes Kriterium als Picker ("DC hat die höchste healthyBackends-Anzahl unter den freigegebenen DCs"). Kritische Workloads erhalten eine zweischichtige Auswahl ohne Skripting.

Häufig gestellte Fragen

Wie unterscheidet sich das von F5 Topology Records?

F5 Topology Records ordnen (Client-Region, Server-Region)-Tupel geordneten DC-Präferenzen zu — eine statische Topologietabelle. Die Multi-Source-Auswahl in TR7 ist dynamisch: Jede DC-Auswahl berücksichtigt Live-Metriken aus einer von drei Quellen. Die beiden Ansätze ergänzen sich: Die statische Topologie beantwortet "wer wird bevorzugt?" und die Multi-Source-Auswahl beantwortet "wer aus der bevorzugten Menge liefert gerade tatsächlich Performance?"

Kann ich Signale aus mehreren Quellen kombinieren?

Die Auswahl verwendet pro Record jeweils eine Quelle. Um Signale zu schichten (z. B. "nur zu host-gesunden DCs routen, dann nach Service-Metriken auswählen"), verwenden Operatoren ein Host-basiertes Szenario als Gate und konfigurieren die Auswahl des Records mit der Service-Quelle. Die Plattform setzt schichtweise Richtlinien per Konfiguration zusammen, nicht über eine Multi-Source-Ausdruckssyntax.

Was passiert, wenn für ein DC keine Metrik verfügbar ist?

DCs mit fehlenden oder veralteten Metriken gelten für den Kriteriumsvergleich als nicht zulässig. Sie fallen auf den Fail-Safe-Pfad. Operatoren sehen die Veraltung im Dashboard — ein DC, das keine Metriken liefert, ist ein sichtbares Betriebsproblem, kein stiller Fehler.

Wie werden healthyBackends über Services hinweg gezählt?

Die healthyBackends-Metrik ist pro Service. Wählt ein Record nach service.healthyBackends, ist die verwendete Metrik die Anzahl gesunder Backends hinter dem benannten Service auf jedem DC. Verschiedene Services haben auf demselben DC unterschiedliche Zahlen, sodass mehrere Records auf unterschiedlichen Service-Metriken routen können.

Erfordert die clientquellbasierte Auswahl eine spezielle Client-Infrastruktur?

Es ist kein spezieller Client-Agent erforderlich. Client-Metriken werden gegenüber dem anfragenden Resolver gemessen — demselben Pfad, den die DNS-Antwort zurücknimmt. Hops, Paketverlust und TTL werden aus dem Antwortpfad selbst abgeleitet. Die MOS-Berechnung nutzt statistische Analyse von Jitter- und Verlustmustern über die Zeit.

Wählen Sie das Rechenzentrum anhand der Signale, die tatsächlich zählen.

Testen Sie die Multi-Source-DC-Auswahl auf Ihrer eigenen Topologie: Host-Metriken, Service-Metriken und clientseitige Netzwerkmessungen, die dieselbe Routing-Entscheidung treiben.