ed.Detect – Interaktive Anomalie Erkennung zur aktuellen Impflage

Unser Tool ed.Detect bietet mittels Anomalie Erkennung (Anomaly Detection) die Möglichkeit die Daten der aktuellen Covid-19 Impflage auf ungewöhnliche Verläufe zu überprüfen. Dazu werden die drei Zeitreihen der Erstimpfungen, Zweitimpfungen und der verabreichten Dosen insgesamt pro Tag betrachtet.

Die Ansprüche und Erwartungen einer Anomalie Erkennung sind je nach Anwendungsfall und Kontext unterschiedlich. Zum Vergleich der verschiedenen Methoden kann daher zwischen verschiedenen Algorithmen und Einstellungen ausgewählt werden. Mit diesem Beispiel wird veranschaulicht, wie sehr die Anomalie-Erkennung durch geeignetes Fach- und Vorwissen beeinflusst werden kann.

Zur reinen Überwachung von Datenströmen wird die hier gezeigte Visualisierung der Anomalie Erkennung eher selten Anwendung finden, da meist die zeitnahe und automatisierte Benachrichtigung (Alerting) und ein daraus resultierender Handlungsbedarf im Vordergrund stehen. Für diesen Anwendungsfall stellen wir als Bestandteil von ed.Detect ein individuell einstellbares Alerting System bereit.

Dennoch eignet sich die hier gezeigte Darstellung, um einen Überblick über die Anomalie-Verteilung und den generellen Datenverlauf zu schaffen.

Erläuterungen zu Anomaly Detection

Data plot:

Darstellung aller Datenpunkte der ausgewählten Metrik im ausgewählten Zeitraum. Ein Datenpunkt wird orange markiert, falls er vom verwendeten Algorithmus als Anomalie identifiziert wurde.

Data Table:

Tabellarischer Überblick aller gefundenen Anomalien. Die Tabelle enthält das Datum und den Datenwert der gefundenen Anomalie.

Filter Options:

Select metric variable:

Hier kann zwischen den drei Metriken „Verabreichte Dosen pro Tag“, „Erstimpfungen pro Tag“ und „Zweitimpfungen pro Tag“ ausgewählt werden.

Date range:

Auswahl des Beobachtungszeitraums.

Anomaly Detection algorithm:

Standard:

Gängige Methode zum Auswerten einer univariaten Zeitreihe bzgl. Ausreißern. Keine Berücksichtigung von sich veränderten Trendstrukturen oder Schwankungen der saisonalen Komponente. Keine Berücksichtigung von Feiertagen oder speziellen bekannten Events. Schnelle und robuste Berechnung, bei stark schwankenden Verläufen werden in der Regel jedoch keine oder zu viele Anomalien erkannt.

Advanced:

Fortschrittliche Methode zur Identifizierung von Anomalien einer univariaten Zeitreihe. Veränderungen der Trend- und Saisonkomponente über den Beobachtungszeitraum werden berücksichtigt. Feiertage, spezielle bekannte Events sowie weitere äußere Einflüsse können zur Berechnung hinzugenommen werden. Berechnung zeitintensiver, Verbesserungen benötigen Vor- und Fachwissen über die Daten.

Data transformation:

Vorherige Datentransformation, damit die Datenpunkte der Zeitreihe annähernd einer Normalverteilung entsprechen und großen Schwankungen nicht zu viel Einfluss beigemessen wird. Die Transformation kann je nach Gestalt des ursprünglichen Datensatz besser oder schlechter funktionieren.

Consider holidays and special events:

Falls zur Auswertung der Advanced Algorithm ausgewählt wurde, können optional Feiertage und spezielle bekannte Events hinzugezogen werden. Dazu wird vom Anwender eine Liste über die entsprechenden Tage angefertigt (s. Abb.). An diesen speziellen Tagen wird der Algorithmus darüber informiert, dass sich das Verhalten der Daten grundsätzlich von der restlichen Struktur unterscheiden kann und das Auffinden einer Anomalie an diesem Tag wird unwahrscheinlicher. Überschreitet der Datenwert auch mit der zusätzlichen Toleranz einen Schwellenwert, wird dennoch eine Anomalie erkannt. Das Ausmaß der Toleranz wird umso genauer berechnet, je mehr Feiertage vom gleichen Typ in der Zeitreihe existieren.

holiday

ds

lower_window

upper_window

Neujahr 01.01.21 0 0
Drei Koenige 06.01.21 0 0
Zulassung Moderna 06.01.21 0 0
Zeitfenster Zweitimpfung Biontech Erweitert 31.01.21 0 0
Hausarzt Impfung 06.02.21 0 0
Impfpriorisierung 09.02.21 0 0
Zulassung Astra Zeneca 28.02.21 0 0
Astra Zeneca Ueber 65 04.03.21 0 0
Frauentag 08.03.21 0 0
Zulassung Johnson 11.03.21 0 0
Johnson Start 12.03.21 0 0
Stopp Astra Zeneca 15.03.21 0 3
Sieben Dosen Biontech 15.03.21 0 0
Lagerung Biontech 29.03.21 0 0
Astra Zeneca Ueber 60 31.03.21 0 0
Karfreitag 02.04.21 0 0
Ostersonntag 04.04.21 0 1
Biontech Zweitimpfung Fuer Astra 05.04.21 0 0
Stopp Johnson 13.04.21 0 0
Bayern Astra Zeneca Freigabe 22.04.21 0 0
Freistellung Geimpfter 28.04.21 0 1
Tag Arbeit 01.05.21 0 0
Deutschland Astra Zeneca Freigabe Fuer Alle 06.05.21 0 1
Deutschland Johnson Freigabe Fuer Alle 10.05.21 0 1
Himmelfahrt 13.05.21 0 0
Pfingsten 23.05.21 0 1
Fronleichnam 03.06.21 0 0
Deutsche Einheit 03.10.21 0 0
Allerheiligen 01.11.21 0 0
Heilig Abend 24.12.21 0 2

Data-driven parameter adjustment:

Der Advanced Algorithm besitzt zur Optimierung eine Vielzahl an Parameter, welchen die Erkennung der Anomalien positiv beeinflussen kann. Obwohl die Standardeinstellungen in vielen Fällen bereits aussagekräftige Ergebnisse liefern, besteht die Möglichkeit den Algorithmus selbstständig die optimalen Parameter zu bestimmen, sodass Strukturwechsel innerhalb der Zeitreihe besser erkannt werden. Die Berechnung der Parameter muss vor der Anomalie Erkennung durchgeführt werden und nimmt sehr viel Zeit in Anspruch, ist jedoch leicht durch automatisierbare Prozesse durchführbar, was die Bestimmung der Parameter bei einer sehr großen Anzahl an zu prüfenden Datenreihen vereinfacht.

Was ist eigentlich Anomaly Detection? Welche Tools gibt es auf dem Markt und wie funktioniert es genau?

Mehr dazu im » ed.Detect Artikel«

Ist dieses Thema interessant oder gibt es weitere Fragen zu dem Thema „Anomalie Detection“? Dann melde Dich gerne direkt bei uns.