Cloud Native

Es begann alles mit einer gut durchdachten Überprüfung

Die Getback-Plattform von adfocus ist eine Onsite-Technologie, die dir hilft, deinen Umwandlungssatz durch spezifische, auf deine E-Commerce-Lösung zugeschnittene Maßnahmen zu erhöhen. Sie ermöglicht es dir, das Verhalten deiner Website-Besucher/innen zu verfolgen und ihnen zum richtigen Zeitpunkt den richtigen Hinweis, unterstützenden Service und die passende Aktion zu bieten. Außerdem kannst du mit Getback Web- und anderen Push-Benachrichtigungen jederzeit direkt mit deinen Besuchern in Kontakt treten und ihnen eine Browsernachricht schicken.

Die Cloud-Experten von Swisscom hatten die Gelegenheit, adfocus bei der Überprüfung des Getback-Workloads durch Anwendung des Well-Architected Frameworks zu unterstützen. Während einer halbtägigen Überprüfung konnten wir mehrere verbesserungswürdige Bereiche identifizieren. Wir konnten adfocus dabei helfen, das Multi-Account-Framework mit AWS Organisation einzuführen, die Entwicklung von der Produktion zu trennen und Bastion Host und Encryption Advancement durch den System Manager zu ersetzen. Am Ende der gut durchdachten Sanierung ist der Getback-Workload in hervorragender Verfassung, mit Ausnahme eines zentralen Teils des Systems: der Hauptdatenbank. Im Laufe der Jahre hat sich bei Getback ein enormer Betrag an Daten angesammelt. Einige der Tabellen umfassen fast eine Milliarde Zeilen, was zeigt, dass die Datenbank über ihre Architektur hinausgewachsen ist. Das macht sich vor allem im Bereich der Ausfallsicherung und Hochverfügbarkeit bemerkbar.

Wir unterstützen dich bei der Migration zur AWS Aurora Datenbank

Jede Datenbankmigration muss die Standardphasen der Datenmigration durchlaufen, wie z. B. die Analyse der Kompatibilität, die Schema-Validierung usw. Zwei erwähnenswerte Herausforderungen sind die Geschwindigkeit, mit der wir in der Lage sein werden, über eine Milliarde Zeilen (fast 1 TB) zu dumpen und neu zu laden, und die Planung einer Migration, die es uns ermöglicht, auf unerwartete Situationen zu reagieren, indem wir in eine sichere Umgebung mit minimaler Ausfallzeit und ohne Datenverlust wechseln.

Wir haben einige Zeit damit verbracht, herauszufinden, wie wir Daten schneller in Aurora laden können. Der übliche Engpass ist der Datenexport/-import. Jetzt wissen wir, dass der Datenimport abgeschlossen sein muss, bevor das Binlog rotiert wird. Nachdem wir verschiedene Optionen auf eigene Faust ausprobiert hatten, wandten wir uns an den AWS-Support, um eine zweite Meinung einzuholen. Indem wir die Elastizität von AWS und insbesondere von RDS Aurora nutzten, konnten wir die Datenlast innerhalb von Stunden statt Tagen hochskalieren und abschließen und sie dann wieder auf die normale Nutzung zurückführen.

Die zweite Herausforderung der Live-Migration und des Rollforwards im Falle einer Katastrophe ist eine ziemlich komplizierte Aufgabe. Zunächst mussten wir unsere neue Aurora-Datenbank als Replikat der aktuellen Datenbank erstellen. Sobald die Replikation abgeschlossen war, erstellten wir eine weitere Datenbank mit der alten DB-Engine als Replikat der neuen Aurora-Datenbank. Schau, wie das Diagramm aussieht. Auf PowerPoint sieht es einfach aus, aber in Wirklichkeit sind es Bits & Bytes und etwas dunkle Magie. Dank ausgiebiger Tests und Planung konnten wir die Live-Migration ohne Hindernisse durchführen, und nach ein paar Tagen war auch der Rollforward entfernt.

Ist Aurora besser? Um wie viel?

Was die Leistung angeht, so sank die Antwortzeit der P95-Anfrage von 50 ms auf 9 ms. Das ist eine Verbesserung von 450%. Frühere Abfragen, die 9 Stunden dauerten, brauchen jetzt nur noch 31 Minuten, um abgeschlossen zu werden.

Die Kosten bleiben in etwa gleich, da Aurora die Kosten für CPU (Maschine) und IO separat berechnet.

Die Verlässlichkeit ist deutlich höher. Wir verwenden einen Schreiber- und einen Leserknoten, wobei letzterer bei Bedarf einspringen kann. Das verbessert die Betriebszeit dramatisch.

Auch die Sicherheit wurde durch Verschlüsselung und IAM-Authentifizierung deutlich verbessert. Dadurch kann adfocus keine Anmeldedaten mehr verwenden, die versehentlich weitergegeben werden könnten.

Darüber hinaus wurde auch der Betrieb durch Managed Backup und Leistungseinblicke gestärkt. Wir können jetzt Probleme mit DB-Abfragen sofort erkennen, sie klonen und unsere Verbesserungen in der Testumgebung überprüfen.

Hol dir deinen Nordstern

Das Well-Architected Framework mit seinen Überprüfungen und Sanierungsmaßnahmen kann als dein Nordstern dienen. Bei dieser Migrationsarbeit verlassen wir uns weiterhin auf die Prinzipien des Well-Architected Frameworks, wie z. B. den Kapazitätsbedarf nicht mehr zu schätzen, den Produktionsumfang zu testen und evolutionäre Architekturen zu ermöglichen. Wir sind stolz auf unsere Kundenreferenzen.

"Die gut durchdachte Überprüfung und Datenbankmigration mit Swisscom hat viele Aspekte verbessert, insbesondere die Leistung und Zuverlässigkeit. Wir haben die Ausfallsicherheit durch Hochverfügbarkeit und Disaster Recovery deutlich erhöht und die Leistung für unsere Nutzerinnen und Nutzer deutlich verbessert!"

Marc Dätwyler (CTO adfocus)

Möchtest du mehr über den Well-Architected Review erfahren?
Nimm Kontakt mit Swisscom auf und plane deine Überprüfung jetzt!

www.swisscom.com/wellarchitected

Unser Webinar ansehen: Optimiere deine Cloud mit einer gut durchdachten Überprüfung(öffnet ein neues Fenster)

Wuming Zhang

Wuming Zhang

Cloud Architect

Mehr getIT-Beiträge

Bereit für Swisscom

Finde deinen Job oder die Karrierewelt, die zu dir passt. In der du mitgestalten und dich weiterentwickeln willst.

Was du draus machst, ist was uns ausmacht.

Zu den Karrierewelten

Zu den offenen Security Stellen