Nicht Erreichbarkeit einiger Projekte nach Wartung

Teilweise eingeschränkt Cloud-Systeme Projekte Datenbankserver SSH-Server
11.04.2024 08:39 CEST · 9 Stunden, 50 Minuten, 46 Sekunden

Update

Gelöst

Bis auf wenige Einzelfälle sind wieder alle Projekte erreichbar. Diese Einzelfälle werden derzeit von unseren Technikern individuell bearbeitet. Morgen werden wir in einem Post Mortem detailliert auf die Ursachen der Störung eingehen. Wir bedanken uns noch einmal für das uns entgegengebrachte Verständnis und Vertrauen!

April 11, 2024 · 18:29 CEST
Untersuchung

Die meisten Projekte sind wieder online. Wir verzeichnen weiterhin positive Fortschritte bei der Wiederherstellung unserer Dienste.

April 11, 2024 · 18:03 CEST
Untersuchung

Ein Großteil der Projekte ist bereits wieder erreichbar.
Wir bitten jedoch noch um etwas Geduld, während wir die verbleibenden Anpassungen vornehmen, um sicherzustellen, dass alle Dienste reibungslos funktionieren.

April 11, 2024 · 17:34 CEST
Untersuchung

Wir konnten den Vorgang deutlich beschleunigen, so dass wir aktuell davon ausgehen, dass in ca. einer Stunde auch die letzten Projekte wieder erreichbar sind.

April 11, 2024 · 17:01 CEST
Untersuchung

Unsere Systeme erholen sich zunehmend. Immer mehr Projekte gehen online und wir beobachten eine stetige Verbesserung der Gesamtsituation. Die Maßnahmen, die wir ergriffen haben, zeigen positive Ergebnisse. Unsere Techniker arbeiten daran, den Prozess zu beschleunigen, um die volle Funktionalität für alle Projekte so schnell wie möglich wiederherzustellen.

April 11, 2024 · 16:35 CEST
Untersuchung

Wir freuen uns, mitteilen zu können, dass sich die Konnektivitätsprobleme langsam auflösen. Einzelne Webseiten sind bereits wieder erreichbar, und wir arbeiten kontinuierlich daran, die volle Erreichbarkeit für alle Projekte wiederherzustellen.

April 11, 2024 · 16:02 CEST
Untersuchung

Wir machen weitere Fortschritte. Wir gehen davon aus, im Zuge des nächsten Updates eine konkrete zeitliche Einschätzung nennen zu können.

April 11, 2024 · 15:39 CEST
Untersuchung

Wir kommen der Lösung weiterhin näher. Aktuell beobachten wir Unstimmigkeiten im Scheduling einzelner relevanter Nodes, die wir als Ursache für die Konnektivitätsprobleme identifiziert haben. Wir arbeiten daran, dieses Problem zu lösen.

April 11, 2024 · 15:04 CEST
Untersuchung

Wir machen Fortschritte. Auch wenn wir noch keine konkrete zeitliche Einschätzung zur Entstörung nennen können, kommen unsere Techniker einer Lösung schrittweise näher. Wir bitten noch um etwas Geduld und teilen hier regelmäßig neue Erkenntnisse.

April 11, 2024 · 14:40 CEST
Untersuchung

Aktuell sind wir dabei das Routing zwischen den Cluster-Knoten wieder herzustellen.

April 11, 2024 · 14:13 CEST
Untersuchung

Nachdem die Latenzen weiterhin stabilisiert sind, ist unser nächster Schritt, die netzwerkseitige Konnektiviät wieder herzustellen. Dieser Schritt ist komplex und erfordert noch etwas Zeit.

April 11, 2024 · 13:49 CEST
Untersuchung

Der Hardwaretausch hat zu einer Normalisierung der Latenzen geführt, Wir arbeiten weiterhin daran, die durchgängige netzwerkseitige Konnektivität wieder herzustellen.

April 11, 2024 · 13:19 CEST
Untersuchung

Ein nächstes Update, in dem wir euch ein bisschen Hintergrund geben: Die cluster-interne netzwerkseitige Kommunikation ist aktuell stark eingeschränkt. Dies führt zu hohen Latenzen und zur Nicht-Erreichbarkeit der betroffenen Projekte. Wir haben präventiv bereits Hardwarekomponenten im entsprechenden Cluster ausgetauscht und analysieren das Problem weiterhin auf Layer-3-Ebene. Wir halten euch weiterhin darüber auf dem Laufenden.

April 11, 2024 · 12:45 CEST
Untersuchung

Wie versprochen, hier das nächste Update. Leider können wir weiterhin nichts Neues sagen. Wir haben das Problem identifiziert und unsere Kollegen der Infrastruktur arbeiten weiterhin daran, zu entstören. Wir wissen, dass wir eure Geduld heute enorm strapazieren. Das tut uns leid und wir setzen alles daran, eure Projekte wieder verfügbar zu machen.

April 11, 2024 · 12:16 CEST
Untersuchung

Zum jetzigen Zeitpunkt liegt uns noch kein neuer Status vor. Wir arbeiten weiterhin mit Hochdruck an der Entstörung. Wir halten euch regelmäßig auf dem Laufenden.

April 11, 2024 · 11:37 CEST
Untersuchung

Wir haben das Problem auf einen Fehler im cluster-internen Netzwerk eingegrenzt und arbeiten an der Lösung. 
Zudem entsteht natürlich im Nachgang ein post mortem.

April 11, 2024 · 11:04 CEST
Untersuchung

Die Entstörungs-Arbeiten dauern weiter an. Noch können wir inhaltlich kein weiteres Update geben.

April 11, 2024 · 10:41 CEST
Untersuchung

Update 10:10 Uhr

Die Arbeiten dauern an.

Wir haben den Fehler weiter eingegrenzt. Unsere Systeme sind bis auf ein Cloud-Hosting Cluster erreichbar.

Die Erreichbarkeit der Application-Pods in diesem Cluster ist gerade nicht gegeben. Daher sind die dort gehostet Projekte von außen weiterhin nicht erreichbar.

April 11, 2024 · 10:07 CEST
Vorfall

Aufgrund der Wartung in der vergangenen Nacht, sind in Teilen unserer Cloud Infrastruktur noch Nacharbeiten erforderlich. Einige Projekte sind daher aktuell noch nicht erreichbar. Wir arbeiten mit Hochdruck daran, die Projekte wieder zur Verfügung zu stellen.

April 11, 2024 · 08:39 CEST

← Zurück