Fähigkeit

Hot Config Reload (Zero-Downtime)

Konfiguration ändern. Verbindungen behalten. Wo möglich, wird jede Änderung per Soft-Reload angewendet; wo unvermeidlich, übernimmt ein kontrollierter Hard-Restart-Fallback.

TR7 Hot Config Reload zielt darauf ab, Konfigurationsänderungen an traffic-bedienenden Services anzuwenden, ohne aktive Sitzungen zu unterbrechen. Regeln, Zertifikate, Backend-Pools, Health-Checks, WAAP-Profile, Rate-Limit-Richtlinien und Cache-Einstellungen gehören zu den Änderungen, die aktiviert werden können, während Live-Traffic weiterläuft. TR7 wendet Soft-Reload über einen unabhängigen Management-Kanal pro Pool an. Jede Änderung wird zunächst analysiert: Felder, die zur Laufzeit angewendet werden können, gehen durch Soft-Reload, während creationConfig-Felder — Service-Typ, VIP, Port, CPU, Speicher oder Namespace — einen kontrollierten Hard-Restart auslösen. Die Reload-Sequenz folgt einem Soft → Hard Fallback-Modell. Wenn Soft-Reload fehlschlägt, erholt sich das System über Hard-Restart. Operatoren können sehen, warum eine gegebene Änderung einen Reload oder Neustart erfordert hat, durch die restartReasons-Ausgabe. Das Ergebnis: TR7 nimmt Konfigurationsänderungen aus dem "Service neu starten und Benutzer trennen"-Modell heraus und macht sie zu einem pool-abgegrenzten, grund-transparenten, kontrollierten und operations-freundlichen Reload-Fluss.

Während eines Soft-Reloads unterbrochene Sitzungen

5 min

Maximaler Job-Timeout für eine Pool-Bearbeitungsoperation

~12

Konfigurationsfeld-Kategorien, die per Soft-Reload anwendbar sind

Wenn eine Konfigurationsänderung Live-Traffic unterbricht, wird jede Regelaktualisierung zu einem Wartungsfenster.

Konfigurationsänderungen in der Load-Balancing- und Sicherheitsschicht sind unvermeidlich. Neue Backends werden hinzugefügt, WAAP-Regeln werden aktualisiert, Zertifikate werden erneuert, Health-Checks werden angepasst, Rate-Limit-Richtlinien werden verschärft, oder neue Blockierungsregeln werden mitten in einem Angriff geschrieben. Wenn jede Änderung einen Service-Neustart erfordert, werden selbst kleine operative Aufgaben zu Unterbrechungen von Benutzersitzungen.

Das klassische Neustart-Modell ist besonders problematisch für TCP und langlebige Verbindungen. Aktive Benutzersitzungen können unterbrochen werden, Dateiübertragungen können unvollständig bleiben, API-Clients können Fehler erhalten, und eine Firewall-Regeländerung kann zu einem momentanen Zugriffsausfall führen. Als Ergebnis beginnen Teams, notwendige Änderungen aufzuschieben, und Sicherheits- und operative Agilität leiden.

Das Problem ist am schärfsten bei WAAP- und Sicherheitsregelsets. Auf ein Wartungsfenster zu warten, um eine Regelaktualisierung anzuwenden, während ein neues Angriffsmuster aktiv beobachtet wird, ist keine akzeptable Position. Ebenso sollten Routineoperationen wie Zertifikatserneuerung oder Backend-Pool-Erweiterung den Live-Traffic nicht unnötig beeinträchtigen.

Das richtige Modell besteht darin, zwischen Änderungstypen zu unterscheiden. Änderungen, die zur Laufzeit angewendet werden können — Regeln, Zertifikate, Health-Checks, Backend-Listen und Sicherheitsprofile — sollten durch Soft-Reload gehen. Nur Änderungen, die Service-Erstellungsparameter betreffen — VIP, Port, Namespace, Ressourcenlimits oder Service-Typ — sollten einen kontrollierten Neustart erfordern.

TR7 Hot Config Reload trifft diese Unterscheidung: pool-spezifischer Soft-Reload, automatischer Hard-Fallback, Neustart-Grund-Sichtbarkeit und paralleler Operationsfluss wenden Konfigurationsänderungen an, während die Auswirkungen auf den Live-Traffic minimiert werden.

Unser Ansatz

TR7 entwirft Konfigurationsreload nicht als eine einzelne einheitliche Neustart-Operation, sondern als einen geschichteten Operationsfluss, der auf Basis des Änderungstyps entscheidet.

Der Pool-Management-Kanal wendet Live-Reload-Befehle unabhängig an

Jeder Pool kann über seinen eigenen Management-Kanal einen Reload empfangen. Dieses Modell stellt sicher, dass eine Änderung in einem Pool angewendet wird, ohne andere Pools zu beeinflussen.

Soft-Reload wird zuerst versucht; Neustart-Fallback läuft, wenn er fehlschlägt

TR7 verwendet standardmäßig den Soft-Reload-Pfad, der Live-Verbindungen bewahrt. Wenn Soft-Reload fehlschlägt oder die Änderung einen Hard-Restart erfordert, wechselt das System zu einem kontrollierten Neustart-Pfad.

Neustart-Grund-Parsing gibt dem Operator Sichtbarkeit in das Warum

Config-Diff-Analyse bestimmt, welche Felder einen Reload und welche einen Neustart erfordern. Operatoren können im Voraus sehen, ob eine Änderung live angewendet werden kann oder eine creationConfig-Modifikation beinhaltet, die einen Neustart erfordert.

ADC- und Log-Operationen laufen parallel, um die Gesamtbearbeitungszeit zu reduzieren

Load-Balancing- und Log-Container-Operationen können parallel laufen, wenn sie unabhängig sind. Dies verhindert, dass die Pool-Bearbeitungszeit durch unnötige sequenzielle Wartezeiten verlängert wird.

Fähigkeiten

Hot Config Reload kombiniert pool-spezifischen Reload, Änderungstyp-Analyse, Fallback, Connection-Drain und parallele Operationen in einem einzigen Verwaltungsfluss.

Soft-Reload wendet Konfigurationsänderungen an, während Live-Verbindungen erhalten bleiben

Soft-Reload aktiviert die neue Konfiguration für berechtigte Änderungen, während bestehende Verbindungen auf natürliche Weise abgeschlossen werden können. Der alte Worker tritt in den Drain-Modus ein und bedient weiterhin aktive Sitzungen, bis sie geschlossen werden. Neue Verbindungen werden von der aktualisierten Konfiguration behandelt. Dieser Ansatz beseitigt die Notwendigkeit, Regel- und Zertifikatsänderungen an ein Wartungsfenster zu binden.

Smart-Reload versucht zuerst den Soft-Pfad und fällt bei Fehler auf Hard-Restart zurück

TR7 verwendet standardmäßig den Soft-Reload-Pfad. Wenn beim Soft-Reload ein Fehler auftritt, erholt sich das System über Hard-Restart-Fallback. Dieses Modell bietet Operatoren einen einzigen sicheren Fluss: Reload ohne Downtime, wo möglich, Neustart auf kontrollierte Weise, wo notwendig. Fehlgeschlagene Reload-Versuche führen nicht zu einem unbestimmten, halb-angewendeten Konfigurationszustand.

Die forceHard-Option bietet expliziten Neustart für Creation-Config-Änderungen

Einige Änderungen können nicht per Live-Reload angewendet werden, da sie Service-Erstellungsparameter modifizieren. Felder wie Service-Typ, CPU-Limit, Speicherlimit, VIP, Port, Netzwerk-Namespace, Image oder Binärversion erfordern einen Hard-Restart. In diesen Fällen macht das forceHard-Verhalten den Neustart explizit und absichtlich. Operatoren können die Auswirkungen der Änderung im Voraus planen.

Neustart-Grund-Aufzeichnungen machen die Auswirkungen von Konfigurationsänderungen sichtbar

Für jedes Konfigurationsfeld kann der Grund, warum eine Änderung einen Reload oder Neustart erfordert, in der restartReasons-Liste gehalten werden. Diese Sichtbarkeit beantwortet die Frage "Warum erfordert diese Änderung einen Neustart?" für das Betriebsteam. Sie macht Entscheidungsfindung klarer, besonders während Change-Management- und Wartungsgenehmigungsprozessen. Die Auswirkung von Änderungen hört auf, eine Black Box zu sein.

Pool-spezifischer unabhängiger Reload läuft, ohne andere Services zu beeinflussen

Jeder Pool wird mit seiner eigenen Laufzeitstruktur und seinem eigenen Management-Kanal behandelt. Während sich ein WAAP-Profil, ein Zertifikat oder eine Backend-Liste in einem Pool ändert, laufen andere Pools ohne Unterbrechung weiter. Diese Isolation reduziert den Auswirkungsradius von Änderungen auf großen Plattformen. Das Betriebsteam lädt nur den relevanten Service neu, nicht das gesamte Gerät.

Log-Container-Operationen werden unabhängig von der Load-Balancing-Schicht verwaltet

Log-Transport- oder Log-Container-Konfigurationen können getrennt von der Load-Balancing-Container behandelt werden. Änderungen auf der Log-Seite beeinflussen daher nicht unnötigerweise die Traffic-Routing-Schicht. Ebenso zwingt ein Reload auf der Traffic-Seite nicht die Log-Pipeline zur Unterbrechung. Diese Trennung bietet kontrollierteres Change-Management über die gesamte Plattform.

Parallele Ausführung reduziert die Gesamtbearbeitungszeit

Wenn eine Änderung sowohl die Load-Balancing- als auch die Log-Seite betrifft, können berechtigte Operationen parallel laufen. Sequenzielles Warten wird reduziert und die Gesamt-Jobzeit verkürzt. Dies ist besonders bei großen Konfigurationen oder Aktualisierungen wichtig, die mehrere Unterkomponenten betreffen. Das Operationsfenster wird effizienter genutzt.

Connection-Drain während des Soft-Reloads reduziert das Risiko von Sitzungsabbrüchen

Wenn ein Soft-Reload angewendet wird, wird der alte Worker nicht sofort beendet — bestehende Verbindungen dürfen natürlich schließen. Neuer Traffic wird an die aktualisierte Konfiguration geleitet, während bestehender Traffic seinen natürlichen Abschluss abschließt. Dies ist kritisch für langlebige TCP-Verbindungen und aktive Benutzersitzungen. Das Ziel ist, keine TCP-Resets oder abrupte Trennungen im Moment der Änderung zu erzeugen.

Fehleranzahl-basierter automatischer Reload bietet Selbstheilung

Wenn ein bestimmter Fehlerschwellenwert in Pool-Statistiken überschritten wird, kann ein automatischer Reload ausgelöst werden. Dieses Verhalten hilft transiente Laufzeitprobleme zu beheben, ohne auf manuelle Intervention zu warten. Für Operatoren bedeutet dies ein automatisches Gesundheitsverbesserungssignal für den Service. Wiederkehrende Reload-Ursachen sollten dennoch durch Monitoring und Root-Cause-Analyse bewertet werden.

WAAP- und Lua-Änderungen können in den Soft-Reload-Umfang eingeschlossen werden

WAAP-Profil-, Whitelist-, Regelset- und Lua-Script-Aktualisierungen können als live-neu-ladbare Änderungen behandelt werden. Dies ermöglicht schnelle Sicherheitsrichtlinien-Aktualisierungen während eines Angriffs und aktiviert neue Logik, ohne Anwendungs-Traffic zu unterbrechen. Regelset-Änderungen sind nicht an einen vollständigen Plattform-Neustart gebunden. Dieser Ansatz erhöht die Agilität des Sicherheitsbetriebs.

Operative Tiefe

Hot-Config-Reload operiert zusammen mit dem Pool-Management-Pfad, Befehlsverhalten, Timeout, Retry-Logik und der Klassifizierung, welche Felder als Soft- oder Hard-Änderungen gelten.

Pool-Management-Socket

Jeder Pool hat einen dedizierten Management-Socket. Der Reload-Befehl wird an den Management-Kanal des relevanten Pools gesendet. Diese Struktur ist die Grundlage des pool-spezifischen unabhängigen Reload-Verhaltens.

Reload-Befehl

Soft-Reload wird durch einen Reload-Befehl ausgelöst, der an den Management-Kanal gesendet wird. Wenn der Befehl erfolgreich ist, wird die neue Konfiguration aktiviert und bestehende Verbindungen werden durch Drain-Verhalten geschützt. Bei Fehler kann Smart-Reload einen Hard-Restart-Fallback anwenden.

Container-Namensmodell

Pool-Container-Namen folgen einem konsistenten Muster, das mit der poolId verknüpft ist. Diese Struktur stellt sicher, dass Reload-, Neustart-, Log-Bereinigungs- und Health-Check-Operationen auf den korrekten Container angewendet werden. Operations-Automatisierung profitiert von dieser deterministischen Benennung.

Soft-Retry-Verhalten

Im Standardmodell wird Soft-Reload einmal versucht. Wenn eine Ausnahme oder ein Reload-Fehler auftritt, wechselt das System zum Hard-Restart-Pfad. Dieser Ansatz vermeidet es, die Operationszeit durch wiederholte Versuche eines fehlschlagenden Reloads zu verlängern.

Job-Timeout-Limit

Der Gesamt-Timeout für einen Pool-Bearbeitungs-Job kann bei 5 Minuten gehalten werden. Dies deckt den gesamten Umfang von Log-Bereinigung, Reload und Neustart bei Bedarf ab. Langandauernde Jobs bleiben nicht in einem unbestimmten Zustand auf dem Operationsbildschirm offen.

Wartezeiten

Standard-waitBefore- und waitAfter-Werte können optimiert auf 0 ausgeführt werden. Dies entfernt unnötige feste Wartezeiten. Die tatsächliche Wartezeit wird durch den Status der Operation und die Systemantwort bestimmt.

Wann zu verwenden

Neue WAAP-Regelversion einbringen, ohne Live-Traffic zu unterbrechen

Ein neues WAAP-Regelset oder ein OWASP-basiertes Update kann in den Soft-Reload-Umfang eingeschlossen werden. Bestehende Benutzersitzungen bleiben erhalten, während die neue Sicherheitslogik für eingehende Anfragen wirksam wird. Es ist nicht nötig, während eines aktiven Angriffs auf ein Wartungsfenster zu warten.

Zertifikat erneuern, ohne bestehende Verbindungen zu unterbrechen

Wenn ein sich dem Ablauf näherndes Zertifikat aktualisiert wird, kann die lbCertificates-Änderung per Soft-Reload angewendet werden. Neue TLS-Verbindungen verwenden das aktualisierte Zertifikat. Bestehende Verbindungen schließen auf natürliche Weise durch Drain-Verhalten.

Backend-Pool nach Autoscaling erweitern

Neue Backend-Knoten können zur lbBackends-Liste hinzugefügt werden. Nach dem Soft-Reload profitieren neue Verbindungen vom erweiterten Pool. Kapazität wird erhöht, ohne andere Pools oder bestehende Verbindungen zu beeinflussen.

Rate-Limit-Richtlinie schnell während eines Angriffs verschärfen

Ein neues DDoS- oder Rate-Limit-Profil kann als Live-Konfigurationsänderung angewendet werden. Die Richtlinie wirkt sich in kurzer Zeit auf eingehende Anfragen aus. Das Betriebsteam reagiert auf den Angriff, ohne durch einen Neustart zusätzliche Downtime zu erzeugen.

Häufig gestellte Fragen

Welche Konfigurationsänderungen gehen durch Soft-Reload und welche erfordern einen Neustart?

Laufzeit-Felder — Regeln (lbRules), Backend-Listen (lbBackends), Health-Checks (lbHealthChecks), Zertifikate (lbCertificates), Rate-Limit/DDoS-Profile, WAAP-Profile und Whitelists, Cache-, Komprimierungs-, Sitzungs- und Timeout-Einstellungen — fallen in den Soft-Reload-Umfang. Felder, die Service-Erstellungsparameter betreffen — Service-Typ, CPU/Speicher-Limits, VIP/Port, Netzwerk-Namespace oder Binärversion — werden als creationConfig-Änderungen klassifiziert und lösen einen kontrollierten Hard-Restart aus.

Was passiert, wenn Soft-Reload fehlschlägt?

Die Smart-Reload-Logik greift: Wenn Soft-Reload fehlschlägt, nimmt das System automatisch den Hard-Restart-Fallback-Pfad. Dieses Modell verhindert, dass ein fehlgeschlagener Reload-Versuch den Service in einem unbestimmten oder halb-angewendeten Konfigurationszustand hinterlässt. Operatoren arbeiten durchgehend mit einem einzigen sicheren Fluss.

Was passiert mit aktiven Sitzungen während eines Soft-Reloads?

Der alte Worker wird nicht sofort beendet. Connection-Drain-Verhalten erlaubt bestehenden Verbindungen, auf natürliche Weise zu schließen. Neue Verbindungen werden an die aktualisierte Konfiguration geleitet, während bestehende Verbindungen ihren natürlichen Abschluss abschließen. Dies ist wichtig für langlebige TCP-Verbindungen und aktive Benutzersitzungen.

Beeinflusst das Neu-Laden eines Pools andere Pools?

Nein. Jeder Pool wird unabhängig mit seinem eigenen Management-Kanal und seiner eigenen Laufzeitstruktur behandelt. Eine Änderung in einem Pool betrifft nur diesen Pool. Diese Isolation reduziert den Auswirkungsradius von Änderungen auf großen Plattformen und ermöglicht dem Betriebsteam, gezielt zu arbeiten.

Wie kann ein Operator sehen, warum eine Änderung einen Neustart erfordert?

Config-Diff-Analyse zeichnet auf, welche Felder per Soft-Reload angewendet werden können und welche aufgrund einer creationConfig-Änderung einen Hard-Restart erfordern, in der restartReasons-Liste. Operatoren können diese Liste überprüfen, um die Auswirkungen und den Grund einer Änderung zu verstehen, bevor sie angewendet wird. Die Auswirkung von Änderungen hört auf, eine Black Box zu sein.

Erfordert eine WAAP-Regelset-Änderung ein Wartungsfenster?

Nein. WAAP-Profil-, Whitelist- und Regelset-Aktualisierungen fallen in den Soft-Reload-Umfang. Bestehende Benutzersitzungen bleiben erhalten, während die neue Sicherheitslogik auf eingehende Anfragen angewendet wird. Selbst während eines aktiven Angriffs muss eine Regelaktualisierung nicht auf ein Wartungsfenster warten.

Konfigurationsänderungen sollten kein Wartungsfenster erfordern

WAAP-Regeln, Zertifikate, Backend-Pools und Rate-Limit-Richtlinien anwenden, ohne aktive Sitzungen zu unterbrechen. Lassen Sie uns ein Live-Setup in Ihrer eigenen Umgebung durchgehen.