ed.Detect – Interaktive Anomalie Erkennung zur aktuellen Impflage
Unser Tool ed.Detect bietet mittels Anomalie Erkennung (Anomaly Detection) die Möglichkeit die Daten der aktuellen Covid-19 Impflage auf ungewöhnliche Verläufe zu überprüfen. Dazu werden die drei Zeitreihen der Erstimpfungen, Zweitimpfungen und der verabreichten Dosen insgesamt pro Tag betrachtet.
Die Ansprüche und Erwartungen einer Anomalie Erkennung sind je nach Anwendungsfall und Kontext unterschiedlich. Zum Vergleich der verschiedenen Methoden kann daher zwischen verschiedenen Algorithmen und Einstellungen ausgewählt werden. Mit diesem Beispiel wird veranschaulicht, wie sehr die Anomalie-Erkennung durch geeignetes Fach- und Vorwissen beeinflusst werden kann.
Zur reinen Überwachung von Datenströmen wird die hier gezeigte Visualisierung der Anomalie Erkennung eher selten Anwendung finden, da meist die zeitnahe und automatisierte Benachrichtigung (Alerting) und ein daraus resultierender Handlungsbedarf im Vordergrund stehen. Für diesen Anwendungsfall stellen wir als Bestandteil von ed.Detect ein individuell einstellbares Alerting System bereit.
Dennoch eignet sich die hier gezeigte Darstellung, um einen Überblick über die Anomalie-Verteilung und den generellen Datenverlauf zu schaffen.
Erläuterungen zu Anomaly Detection
Data plot:
Darstellung aller Datenpunkte der ausgewählten Metrik im ausgewählten Zeitraum. Ein Datenpunkt wird orange markiert, falls er vom verwendeten Algorithmus als Anomalie identifiziert wurde.
Data Table:
Tabellarischer Überblick aller gefundenen Anomalien. Die Tabelle enthält das Datum und den Datenwert der gefundenen Anomalie.
Filter Options:
Select metric variable:
Hier kann zwischen den drei Metriken „Verabreichte Dosen pro Tag“, „Erstimpfungen pro Tag“ und „Zweitimpfungen pro Tag“ ausgewählt werden.
Date range:
Auswahl des Beobachtungszeitraums.
Anomaly Detection algorithm:
Standard:
Gängige Methode zum Auswerten einer univariaten Zeitreihe bzgl. Ausreißern. Keine Berücksichtigung von sich veränderten Trendstrukturen oder Schwankungen der saisonalen Komponente. Keine Berücksichtigung von Feiertagen oder speziellen bekannten Events. Schnelle und robuste Berechnung, bei stark schwankenden Verläufen werden in der Regel jedoch keine oder zu viele Anomalien erkannt.
Advanced:
Fortschrittliche Methode zur Identifizierung von Anomalien einer univariaten Zeitreihe. Veränderungen der Trend- und Saisonkomponente über den Beobachtungszeitraum werden berücksichtigt. Feiertage, spezielle bekannte Events sowie weitere äußere Einflüsse können zur Berechnung hinzugenommen werden. Berechnung zeitintensiver, Verbesserungen benötigen Vor- und Fachwissen über die Daten.
Data transformation:
Vorherige Datentransformation, damit die Datenpunkte der Zeitreihe annähernd einer Normalverteilung entsprechen und großen Schwankungen nicht zu viel Einfluss beigemessen wird. Die Transformation kann je nach Gestalt des ursprünglichen Datensatz besser oder schlechter funktionieren.
Consider holidays and special events:
Falls zur Auswertung der Advanced Algorithm ausgewählt wurde, können optional Feiertage und spezielle bekannte Events hinzugezogen werden. Dazu wird vom Anwender eine Liste über die entsprechenden Tage angefertigt (s. Abb.). An diesen speziellen Tagen wird der Algorithmus darüber informiert, dass sich das Verhalten der Daten grundsätzlich von der restlichen Struktur unterscheiden kann und das Auffinden einer Anomalie an diesem Tag wird unwahrscheinlicher. Überschreitet der Datenwert auch mit der zusätzlichen Toleranz einen Schwellenwert, wird dennoch eine Anomalie erkannt. Das Ausmaß der Toleranz wird umso genauer berechnet, je mehr Feiertage vom gleichen Typ in der Zeitreihe existieren.
holiday |
ds |
lower_window |
upper_window |
Neujahr | 01.01.21 | 0 | 0 |
Drei Koenige | 06.01.21 | 0 | 0 |
Zulassung Moderna | 06.01.21 | 0 | 0 |
Zeitfenster Zweitimpfung Biontech Erweitert | 31.01.21 | 0 | 0 |
Hausarzt Impfung | 06.02.21 | 0 | 0 |
Impfpriorisierung | 09.02.21 | 0 | 0 |
Zulassung Astra Zeneca | 28.02.21 | 0 | 0 |
Astra Zeneca Ueber 65 | 04.03.21 | 0 | 0 |
Frauentag | 08.03.21 | 0 | 0 |
Zulassung Johnson | 11.03.21 | 0 | 0 |
Johnson Start | 12.03.21 | 0 | 0 |
Stopp Astra Zeneca | 15.03.21 | 0 | 3 |
Sieben Dosen Biontech | 15.03.21 | 0 | 0 |
Lagerung Biontech | 29.03.21 | 0 | 0 |
Astra Zeneca Ueber 60 | 31.03.21 | 0 | 0 |
Karfreitag | 02.04.21 | 0 | 0 |
Ostersonntag | 04.04.21 | 0 | 1 |
Biontech Zweitimpfung Fuer Astra | 05.04.21 | 0 | 0 |
Stopp Johnson | 13.04.21 | 0 | 0 |
Bayern Astra Zeneca Freigabe | 22.04.21 | 0 | 0 |
Freistellung Geimpfter | 28.04.21 | 0 | 1 |
Tag Arbeit | 01.05.21 | 0 | 0 |
Deutschland Astra Zeneca Freigabe Fuer Alle | 06.05.21 | 0 | 1 |
Deutschland Johnson Freigabe Fuer Alle | 10.05.21 | 0 | 1 |
Himmelfahrt | 13.05.21 | 0 | 0 |
Pfingsten | 23.05.21 | 0 | 1 |
Fronleichnam | 03.06.21 | 0 | 0 |
Deutsche Einheit | 03.10.21 | 0 | 0 |
Allerheiligen | 01.11.21 | 0 | 0 |
Heilig Abend | 24.12.21 | 0 | 2 |
Data-driven parameter adjustment:
Der Advanced Algorithm besitzt zur Optimierung eine Vielzahl an Parameter, welchen die Erkennung der Anomalien positiv beeinflussen kann. Obwohl die Standardeinstellungen in vielen Fällen bereits aussagekräftige Ergebnisse liefern, besteht die Möglichkeit den Algorithmus selbstständig die optimalen Parameter zu bestimmen, sodass Strukturwechsel innerhalb der Zeitreihe besser erkannt werden. Die Berechnung der Parameter muss vor der Anomalie Erkennung durchgeführt werden und nimmt sehr viel Zeit in Anspruch, ist jedoch leicht durch automatisierbare Prozesse durchführbar, was die Bestimmung der Parameter bei einer sehr großen Anzahl an zu prüfenden Datenreihen vereinfacht.
Was ist eigentlich Anomaly Detection? Welche Tools gibt es auf dem Markt und wie funktioniert es genau?
Mehr dazu im » ed.Detect Artikel«
Ist dieses Thema interessant oder gibt es weitere Fragen zu dem Thema „Anomalie Detection“? Dann melde Dich gerne direkt bei uns.