Smart Data

Corona: Wie präzise sind Vorhersagen mit Hilfe von Datenmodellen?

Unser Kolumnist und Digitalenthusiast Markus Sekulla ist seit Beginn der Pandemie davon fasziniert, wie digitale Lösungen die Auswirkungen der Krise minimieren könnten. Heute geht es um die technischen Möglichkeiten, akkurate Annahmen zur künftigen Entwicklung der Pandemie zu machen.

Warum sollen wir Menschen Tätigkeiten übernehmen, die Maschinen deutlich besser können? Sicher schwingt ein wenig Nostalgie mit. Ich habe schließlich schon immer meine Einkaufsliste selbst von Hand gemacht. Dass jetzt eine KI meinen Kühlschrank analysiert und weiß, was ich schon immer im Juni gegessen habe und dementsprechend meinen Kauf bestellt und liefern lässt, alles natürlich zu einer Zeit, an der ich meistens zuhause bin, klingt alles ein wenig spooky, aber auch ziemlich praktisch.

Natürlich kann die Maschine nicht wissen, wann ich vielleicht mal einen Jieper auf Yogurette habe. Das System kennt einfach gewisse Parameter nicht… und irgendwie macht dies das Leben ja auch kreativ, schön und lebenswert. Wir wollen unsere Entscheidungen gerne selber treffen, auch aus dem Grund, dass wir uns selbst überschätzen. Eine KI würde mir nämlich sagen, dass viel Zucker meinem Lebensentwurf eher im Wege steht. Mein menschliches ich sieht da eher nicht das Problem. Aber, große Mengen an Daten lügen sehr selten.

Man könnte den Michael Holm Klassiker direkt als Remake „Daten lügen nicht“ umdichten. Nur lesen muss man diese Daten richtig und das ist nicht immer leicht. Dass Daten der Vergangenheit auch oft Entwicklungen in der Zukunft voraussagen können, haben wir in den letzten 18 Monaten auch in der Corona Pandemie gesehen. Viele Datenmodelle hätten sich in etwa bewahrheitet – so die Auslastung von Krankenhausbetten in einigen Regionen –, wenn keine Gegenmaßnahmen getroffen worden wären.


Das Problem ist häufig, die richtigen Daten zu haben, zu nehmen und zu lesen, vor allem beim Voraussagen von Krankheitsentwicklungen. Ein recht bekannter Fall ist das Projekt Google Flu Trends, dass zwischen 2009 und 2015 anhand von Sucheingaben bei Google versucht hat, Grippewellen vorauszusagen. Anfangs durchaus mit gutem Erfolg. Jedoch stellte man sich zu wenig auf das sich verändernde Suchverhalten der Menschen ein - ab 2011 wurden die Grippewellen überschätzt. Rückschlüsse anhand des Suchverhaltens würden beim Coronavirus sicherlich ähnlich schwierig sein, da die Netzaktivitäten bei Google oder auf Twitter sich seit dem Beginn der Pandemie sehr schwankend verhalten. Würde man Google Trends als Grundlage für eine erste Einschätzung nehmen, hätte es in Deutschland keine zweite oder dritte Welle gegeben. 

Auch auf Twitter gibt es immer mal wieder auf Corona bezogene Trending Topics, die international relevant sind, aber in einzelnen Ländern keine Bedeutung haben. Relevantere Daten müssen also her, um vermehrte Ausbrüche von Covid-19 vorhersagen zu können. Beim Nowcasting kann man beispielsweise recht genau von vergangenen Daten auf das Heute schließen, obwohl noch gar keine Erkrankungen gemeldet wurden.

Um darüber hinaus in die Zukunft zu kalkulieren, braucht es schwerere „Geschütze“. Eine Studie aus Taiwan hat für Voraussagen beispielsweise gleich vier statistische und deep learning Systeme einbezogen:

  • Autoregressive integrated moving average (ARIMA)
  • Feedforward neural network (FNN)
  • Multilayer perceptron (MLP) neural network
  • Long short-term memory (LSTM)

Akkurat waren die Ergebnisse leider auch hier nur zum Teil und die Systeme haben unterschiedlich gute Ergebnisse für spezielle Rahmenbedingungen (i.e. verschiedene Länder) geliefert. Wer hier tiefer eintauchen möchte, dem sei die Studie (A COVID-19 Pandemic Artificial Intelligence-Based System With Deep Learning Forecasting and Automatic Statistical Data Acquisition: Development and Implementation Study) empfohlen. Eine simple Google Suche liegert darüber hinaus ähnliche Studien.

Perfekte Datensätze fehlen häufig

Eine künstliche Intelligenz ist (heute) so gut wie die Menschen, die sie erstellen und/oder füttern. Für den ewigen Traum der Menschheit – dem Voraussagen der Zukunft – fehlen oft die perfekten Datensätze, wenn es sie überhaupt gibt. Daher haben wir heute die Unterstützung von KI im Kampf gegen Corona, diese ist aber zumindest im Voraussagen von Ausbrüchen noch nicht sicher genug.

Im Zusammenhang mit KI und Covid-19 könnten euch auch folgende Links interessieren:

Test ohne Test? Künstliche Intelligenz erkennt Covid19 bereits am Husten

https://next.ergo.com/de/KI-Robotics/2020/KI-Test-Covid19-Husten

Frühe Covid19-Diagnose mit Hilfe von KI

https://next.ergo.com/de/KI-Robotics/2021/Covid19-Diagnose-mit-KI-Kuenstliche-Intelligenz

Text: Markus Sekulla