All systems are operational

Stickied Incidents

Friday 29th May 2026

Public 02 Squeeze UI ⚠️ Störung – Performance in Cloud-Infrastruktur | Incident – Performance in Cloud-Infrastructure

Deutsch

⚠️ Störung – Performance | Cloud-Infrastruktur

Aktuell werden erhöhte Performance-Probleme innerhalb der Cloud-Infrastruktur festgestellt. Ursache ist eine hohe I/O-Last auf dem Dateisystem, die sich auf die Reaktionszeiten der Infrastruktur auswirkt. Infolgedessen kann es beim Verbindungsaufbau sowie beim Laden der Benutzeroberfläche (UI) aktuell zu spürbaren Verzögerungen kommen.

Wir bitten darum, mögliche Ladezeiten beim Öffnen der Anwendung zu berücksichtigen und danken für Ihr Verständnis.

Das DevOps-Team hat die Analyse aufgenommen und arbeitet aktiv an der Behebung der Störung. Weitere Updates werden zeitnah auf diesem Dashboard bereitgestellt.

English

⚠️ Incident – Performance | Cloud Infrastructure

We are currently experiencing performance degradation within our cloud infrastructure. The issue is caused by elevated I/O load on the file system, which is impacting overall infrastructure response times. As a result, users may notice increased latency when establishing connections or loading the user interface (UI).

We kindly ask you to account for potential loading delays when opening the application and thank you for your patience.

The DevOps team has begun investigating the issue and is actively working towards a resolution. Further updates will be provided on this dashboard as the situation develops.

  • Post-Mortem: Performance-Störung Cloud-Infrastruktur

    Datum des Vorfalls: 29.05.2026 Status: Behoben · Ursachenanalyse läuft

    Zusammenfassung

    Am Morgen des 29.05.2026 kam es zu einer spürbaren Performance-Beeinträchtigung in der Cloud-Infrastruktur. Nutzerinnen und Nutzer bemerkten verlängerte Ladezeiten beim Verbindungsaufbau und beim Laden der Benutzeroberfläche. Die Störung wurde noch am selben Tag behoben; die Systeme arbeiten wieder im normalen Rahmen.

    Zeitlicher Ablauf

    Gegen 05:15 Uhr traf ein ungewöhnlich hohes Aufkommen an zu verarbeitenden Belegen im System ein – mehr, als zeitgleich verarbeitet werden konnte. Die Verarbeitungs-Worker arbeiteten die Last regulär ab, wodurch die Systemauslastung über das übliche Maß anstieg. Während die Grundauslastung im normalen Tagesbetrieb bei rund 45 % liegt, lag sie an diesem Morgen bereits erhöht vor.

    Im Zuge der Gegenmaßnahmen wurde manuell zusätzliche Verarbeitungskapazität ergänzt. Dies führte vorübergehend zu einer Überlastung einer zentralen Komponente, die daraufhin neu gestartet wurde. Nach Stabilisierung normalisierten sich die Reaktionszeiten.

    Ursache

    Auslöser war eine erhöhte I/O- und Verarbeitungslast infolge des hohen Belegaufkommens. Zusätzlich wird derzeit geprüft, ob infrastrukturseitige Faktoren auf Ebene des Rechenzentrums zur Beeinträchtigung beigetragen haben. Diese Analyse ist noch nicht abgeschlossen.

    Maßnahmen

    Die unmittelbare Störung wurde durch Stabilisierung der betroffenen Komponenten behoben. Zur Vermeidung künftiger Vorfälle prüfen wir derzeit eine robustere Skalierung der Verarbeitungskapazität, eine bessere Glättung von Lastspitzen sowie ein erweitertes Monitoring relevanter Last- und Latenzkennzahlen. Das Rechenzentrum wurde über den Vorfall informiert; eine etwaige infrastrukturseitige Beteiligung wird weiter abgeklärt.

    Auswirkung auf Nutzer

    Während des Vorfalls kam es zu verlängerten Ladezeiten und verzögertem Verbindungsaufbau. Es gingen keine Daten verloren.


    Post-Mortem: Performance Incident – Cloud Infrastructure

    Incident date: 2026-05-29 Status: Resolved · Root cause analysis ongoing

    Summary

    On the morning of 2026-05-29, our cloud infrastructure experienced noticeable performance degradation. Users encountered increased loading times when establishing connections and loading the user interface. The incident was resolved the same day, and systems are operating within normal parameters again.

    Timeline

    At around 05:15, an unusually high volume of documents entered the system for processing — more than could be handled simultaneously. The processing workers handled the load as designed, which pushed system utilization above normal levels. While baseline utilization during regular operations sits at roughly 45 %, it was already elevated that morning.

    As part of mitigation, additional processing capacity was added manually. This temporarily overloaded a central component, which was subsequently restarted. Once stabilized, response times returned to normal.

    Cause

    The trigger was elevated I/O and processing load resulting from the high document volume. We are additionally investigating whether infrastructure-level factors at the data center contributed to the degradation. This analysis is still ongoing.

    Actions

    The immediate incident was resolved by stabilizing the affected components. To prevent future occurrences, we are evaluating more resilient scaling of processing capacity, improved smoothing of load spikes, and expanded monitoring of relevant load and latency metrics. The data center has been informed of the incident, and any potential infrastructure-side involvement is being clarified.

    User impact

    During the incident, users experienced longer loading times and delayed connections. No data was lost.

  • Deutsch

    ✅ Behoben – Performance | Cloud-Infrastruktur

    Die Performance-Probleme innerhalb der Cloud-Infrastruktur wurden behoben. Die Systeme arbeiten wieder im normalen Rahmen, und die Benutzeroberfläche sollte ohne merkliche Verzögerungen erreichbar sein.

    Unser DevOps-Team analysiert weiterhin den Ursprung der erhöhten I/O-Last, um die Ursache vollständig zu verstehen und einer Wiederholung vorzubeugen. Wir werden Sie bei weiteren Erkenntnissen informieren.

    Wir danken Ihnen für Ihr Verständnis und Ihre Geduld während der Störung.

    English

    ✅ Resolved – Performance | Cloud Infrastructure

    The performance issues affecting the cloud infrastructure have been resolved. Systems are operating within normal parameters again, and the user interface should be accessible without noticeable delays.

    Our DevOps team continues to analyse the root cause of the elevated I/O load in order to fully understand the origin of the incident and prevent future occurrences. We will provide further updates should new findings arise.

    Thank you for your understanding and patience throughout this incident.

  • Past Incidents

    Wednesday 10th June 2026

    No incidents reported

    Tuesday 9th June 2026

    No incidents reported

    Monday 8th June 2026

    No incidents reported

    Sunday 7th June 2026

    No incidents reported

    Saturday 6th June 2026

    No incidents reported

    Friday 5th June 2026

    No incidents reported

    Thursday 4th June 2026

    No incidents reported