Essay Datenerhebung Covid im Arbeitsleben PDF

Title Essay Datenerhebung Covid im Arbeitsleben
Author Leyla Han
Course Datenerhebung & Statistik
Institution FOM Hochschule
Pages 14
File Size 384.3 KB
File Type PDF
Total Downloads 3
Total Views 130

Summary

Statistik Datenerhebung Essay Auswertung mit R Studio...


Description

a

INHALTSVERZEICHNIS 1.

Einleitung.............................................................................................................................................. 1

2.

Theorethischer Rahmen........................................................................................................................ 2 2.1 Der Reproduktionswert....................................................................................................................... 2 2.2 Zielwerte für die Hygienemaßnahmen................................................................................................ 3 2.3 Beschreibung der Zeiträume............................................................................................................... 3 2.4 Das Robert-Koch-Institut..................................................................................................................... 4

3.Statistische Auswertung............................................................................................................................. 5 3.1 Mittelwertvergleichstest mit dem Bootstrapverfahren.......................................................................5 3.2 Lineare Regression.............................................................................................................................. 6 3.3 Ergebnisse und Analyse....................................................................................................................... 7 3.3.1 Bootstrap..................................................................................................................................... 7 3.3.2 Lineare Regression....................................................................................................................... 8 4. Fazit........................................................................................................................................................ 11 Literaturverzeichnis.................................................................................................................................... 12

1.

EINLEITUNG

Die SARS-CoV-2 Pandemie (Ghebreyesus T., 2020), allgemein bekannt als das Coronavirus, gilt derzeit als allgegenwärtig, wodurch weltweit Lösungen zur Pandemiebekämpfung gesucht werden (WHO, 2020). Neben der Suche nach einem Impfstoff oder Heilmittel liegt ein Fokus auf der Verlangsamung der Verbreitung des Viruses durch die Anwendung präventiver Hygienemaßnahmen (Merkel A., 2020). Auch in Deutschland hat sich das Coronavirus ausgebreitet, welches 1139 kumulierte Coronafälle sowie 2 Corona bedingte Todesfälle zur Folge hatte (Stand 09.03.2020) (RKI, 2020b). Dies führte zur Notwendigkeit von präventiven Maßnahmen zur Eindämmung der Ausbreitung von SARS-CoV-2, welche sich bis zu einem bundesweiten Kontaktverbot (23.03.2020) (an der Heiden M, 2020) ausweiteten und nach erfolgreicher Eindämmungen des Viruses zum Teil wieder gelockert wurden (ab dem 06.05.2020) (Bundesregierung, 2020a). Aufgrund der Lockerungen konnten die Auswirkungen auf die Wirtschaf eingedämmt werden (Feld L et al., 2020), wodurch jedoch das potentielle Risiko einer zweiten Welle gestiegen ist (Oxford University, 2020). In Anbetracht der Signifikanz und Aktualität des Themas für die Gesellschaf muss nun die Frage gestellt werden, inwiefern die Maßnahmen zur Gewährleistung der Eindämmung des Viruses als ausreichend betrachtet werden können und ob die Lockerungen eine zweite Welle der epidemischen Ausbreitung verursachen können. Im Rahmen dieser Hausarbeit wurde untersucht, inwiefern die Lockerungen und die später eingeführte Maskenpflicht, dieselbe Wirksamkeit wie die vorherigen Kontaktbeschränkungen hinsichtlich des Schutzes der Bevölkerung vor SARS-CoV-2 hatten. Die Untersuchung wird mit Hilfe der Mittelwerte der vom Robert-Koch-Institut (RKI) errechneten Reproduktionszahl (RWert) (RKI, 2020c) für die in Abschnitt 2.3 näher beschriebenen Zeiträume des Lockdowns (23.03.2020-06.05.2020) und nach den Lockerungen (06.05.2020-20.06.2020) durchgeführt. Anhand eines Mittelwerttestes in R auf signifikante Unterschiede wurde getestet. Da ein signifikanter Unterschied noch keine vollständige Aussagekraf hinsichtlich der Wirksamkeit der Maßnahmen ergibt, wurden zudem Aussagen zur Größe des Mittelwertes getroffen sowie mittels einer linearen Regression in R ein Trend innerhalb der Zeiträume ermittelt, um eine Einschätzung über zukünfige Entwicklungen ohne weitere Änderungen zu treffen. 1

Die Ergebnisse zeigen auf, dass in den beiden Zeiträumen ein signifikanter Unterschied zu einander besteht. Außerdem steigt von Zeitraum 1, mit einem R-Mittelwert von ≈0,85, zu Zeitraum 2 der Mittelwert an und liegt letztendlich bei nur knapp R < 1. Des Weiteren ergibt die lineare Regression von Zeitraum 2 einen klaren Aufwärtstrend, woraus gefolgert werden kann, dass die gelockerten Maßnahmen nicht mehr ausreichend sind. Der Trend von Zeitraum 1 hingegen war negativ, woraus sich schließen lässt, dass die Lockdown Maßnahmen ausreichend sind um die Verbreitung des Viruses einzudämmen. Allerdings lässt sich das Ergebnis auch so interpretieren, dass leichte Lockerungen der Maßnahmen möglich sein sollten. Zunächst wird in dieser Hausarbeit der theoretische Hintergrund, insbesondere der des RWertes, aufgrund einer Literaturrecherche beschrieben. Darauf folgen die Analyse und Interpretation des Mittelwertvergleichstests und der linearen Regression sowie eine Zusammenfassung der Ergebnisse. Abschließend werden die Ergebnisse in Form eines Fazits veranschaulicht.

2.

THEORETHISCHER RAHMEN

2.1 Der Reproduktionswert Der Reproduktionswert R beschreibt die durchschnittliche Anzahl von neu verursachten Fällen durch eine erkrankte Person (Cori A. et al., 2013). Hierbei werden im Falle des vom RKI bereitgestellten R-Wertes die Summen der neuinfizierten Personen zweier Zeiträume, die sogenannte Generationszeit, von jeweils 4 Tagen betrachtet und der Quotient von diesen beiden Summen gebildet. Somit folgt aus einem R-Wert von R = 2, dass es im 2. Zeitraum doppelt so viele Neuinfektionen wie im 1. Zeitraum gab. Dieser Wert wird nun dem letzten der insgesamt acht Tage zugeordnet. Der so errechnete Wert wird 7-Tage-R-Wert genannt (an der Heiden M et al., 2020). Zusätzlich verwendet das RKI neben den offiziell gemeldeten Fallzahlen das sogenannte Nowcasting (Lawless J., 1994) um einen tagesaktuellen R-Wert wiedergeben zu können, da zum Beispiel aufgrund von Meldeverzögerungen, zum Zeitpunkt D noch nicht alle Neuinfektionen vom Zeitpunkt D-1 bekannt sind und somit ohne Nowcasting ein verfälschter R-Wert wiedergegeben wird (an der Heiden M. et al., 2020). 2

2.2 Zielwerte für die Hygienemaßnahmen Da im Rahmen dieser Arbeit eine Bewertung der Wirksamkeit von den Hygienemaßnahmen vorgenommen werden soll, müssen im Voraus Bedingungen festgelegt werden, welche zu einer positiven Bewertung der Hygienemaßnahme führen würden. Einerseits ist dabei der RWert zu betrachten, der im Mittel in dem Zeitraum der jeweiligen Maßnahme bei R < 1 liegen sollte, da nur in diesem Fall die Zahl der Neuinfizierten kontinuierlich sinkt (an der Heiden M et al,2020). Außerdem sollte auch der Trend der jeweiligen Maßnahme nicht zu einem Wert von R > 1 führen, sodass eine Maßnahme nicht als gut zu bewerten ist, wenn ihr Mittelwert zwar bei R < 1 liegt, dies allerdings nur aufgrund von niedrigen R-Werten zu Beginn der Fall ist. Andererseits sollte eine Maßnahme unter Umständen als positiv bewertet werden, wenn ihr Mittelwert R > 1 ist, jedoch in der Prognose erkennbar ist, dass dieser auf R < 1 sinken wird. Daraus folgt, dass nur bei einem R-Wert < 1 und einem negativen Trend die Maßnahme definitiv positiv bewertet werden kann und bei einem R-Wert > 1 und einem positiven Trend abgelehnt werden muss. In anderen Fällen bedarf es einer genaueren Untersuchung.

2.3 Beschreibung der Zeiträume Im Laufe der vergangenen Monate wurden auf Länder- und Bundesebene verschiedenste Maßnahmen zur Eindämmung des Coronaviruses verabschiedet, deren Bewertung auf ihre Wirksamkeit den Umfang dieser Hausarbeit weit übersteigen würden. Stattdessen werden hier nur zwei verschiedene Zeiträume betrachtet. Die zwei Zeiträume sind: 1. Der Lockdown, der von der Bundesregierung verhängt wurde. Dieser ging vom 23.03.2020 bis zum 06.05.2020. Im Detail bestanden diese Maßnahme aus einem Verbot in der Öffentlichkeit mehr als eine Person, welche nicht aus dem eigenen Haushalt stammt, zu treffen und dem Gebot einen Mindestabstand von 1,50m zu anderen Personen einzuhalten. Des Weiteren wurden, bis auf Lieferung und Abholung der Speisen, alle Gastronomiebetriebe geschlossen sowie alle Dienstleistungen, welche medizinisch nicht notwendig aber physische Nähe erfordern (zum Beispiel Friseure). Zusätzlich waren Sportanlagen und Spielplätze geschlossen. Außerdem waren die BürgerInnen dazu angehalten ihr Haus nur für das Nötigste zu verlassen, wie zum Beispiel Einkaufe, aber auch Bewegung an der frischen Luf (Bundesregierung, 2020b). Darüber hinaus wurde gegen Ende des 3

Lockdownzeitraumes, ausgehend von den einzelnen Bundesländern, eine Maskenpflicht im öffentlichen Nahverkehr sowie beim Einkaufen verhängt. (Stadt Hamburg, 2020) Auch wurde die Aus- sowie Einreise beschränkt, so dass nur noch der geschäfliche Reiseverkehr geduldet wurde (Tagesschau, 2020a).

2. Es werden bundesweit, auf Verantwortung der Länder, wieder Maßnahmen gelockert, wie beispielsweise die Öffnung der Bildungsstätten, von Einrichtungen des Dienstleistungssektors (Friseure, Kinos etcetera) mit der Pflicht des Tragens einer Maske und der Einhaltung des Mindestabstands von 1,50m. Zusätzlich wurde auch der Breitensport, sowohl im Inneren als auch an der frischen Luf, wieder zugelassen (Tagesschau, 2020b). Außerdem waren Urlaubsreisen, zumindest in einige Gebiete Europas, wieder zulässig. (Auswärtiges Amt, 2020). Dieser Zeitraum ging vom 06.05.2020 bis heute, die Daten wurden jedoch nur bis zum 15.08.2020 erhoben, da dies der aktuellste Stand des R-Wertes zu Beginn dieser Arbeit war. Aufgrund der Beschaffenheit des 7-Tage-R-Wertes werden von diesen Zeiträumen die RWerte der ersten vier Tage allerdings nicht berücksichtigt, da erst nach vier Tagen alle für den 7-Tage-R-Wert relevanten Neuinfektionen nach Beginn der jeweiligen Maßnahme liegen. Folglich stammen die R-Werte aus den Zeiträumen 1. 27.03-06.05.2020 und 2. 11.05. -15.08.2020.

2.4 Das Robert-Koch-Institut Das Robert-Koch-Institut (RKI) ist eine dem Bundesgesundheitsministerium unterstellte Einrichtung. Das Bestreben des RKI besteht in der Krankheitsüberwachung und -prävention. Dabei sind seine Aufgaben die Erkennung, Verhütung und Bekämpfung aller Krankheiten und insbesondere die Erarbeitung von wissenschaflichen Erkenntnissen als Basis für politische Entscheidungen mit Schwerpunkt auf gesundheitspolitischen Maßnahmen. Außerdem fungiert das RKI als Frühwarnsystem im Hinblick auf die Erkennung von gesundheitlichen Gefährdungen und Risiken. Die Grundfinanzierung erfolgt aus dem Haushalt der Bundesregierung, wodurch das RKI weitgehend unabhängig von wirtschaflichen Interessen arbeiten kann. (RKI, 2020a).

4

3.STATISTISCHE AUSWERTUNG 3.1 Mittelwertvergleichstest mit dem Bootstrapverfahren Für einen Mittelwertvergleichstest gibt es mehrere Möglichkeiten, die je nach Beschaffenheit der vorliegenden Stichproben auszuwählen sind. Dabei ist vor Allem auf die Verteilungsart, die Skalierung der Stichproben und die Anzahl an Stichproben entscheidend. Da im vorliegenden Fall keine Normalverteilung vorliegt, ist eine Testung mit dem T-Test nicht möglich. Aus diesem Grund fiel die Wahl auf das Bootstrapverfahren, dessen Testschema in Tab. 1 ersichtlich ist. Bei diesem Test werden mit Hilfe von wiederholten, zufälligen und unabhängigen Ziehungen Mittelwertsdifferenzen generiert, welche im vorliegenden Fall normalverteilt sind (Abb.1). Hierbei ist diffmean die Differenz der Mittelpunkte einer Ziehung. Der Test wurde mit folgendem Output implementiert. > Differenzen cdata(~diffmean, data = Differenzen, p = 0.95)

Tab. 1: Testschema des Bootstrapverfahrens.

Hypothesen

i) H0 : µx-µy = 0 ; H1 : µx-µy ≠ 0 ii) H0 : µx-µy ≥ 0 ; H1 : µx-µy < 0 ii) H0 : µx-µy ≤ 0 ; H1 : µx-µy > 0

H0 ablehnen, falls

Sich der Wert 0 nicht im ´ α/2 ; △ ´ 1-α/2 ] [△ i) ii)

´ 0% ;△ ´ 1−α ] [△

iii)

´ α ;△ ´ 100 % ] [△

5

Abb. 1: Verteilung der Mittelwertsdifferenzen von Zeitraum 1 und 2.

3.2 Lineare Regression Die lineare Regression wird angewendet, um einen Trend über den zu untersuchenden Zeitraum zu ermitteln. Zusätzlich wird zur Überprüfung der Regression noch ein t- und ein FTest durchgeführt, deren Testschemata in Tabelle 2 und Tabelle 3 aufgeführt sind. Die lineare Regression des ersten Zeitraumes wurde mit folgendem Output implementiert. Die Implementierung des zweiten Zeitraumes erfolgt analog hierzu mit geänderten variablen Namen. > model1 summary (model1)

6

Tab. 2: Testschema des F-Test. Hypothesen H0: b1 = b2 =…= bj = 0 H1 : bj ≠ für mindestens ein j=1,…,j 2 n - J -1 R * Femp = J 1-R 2 Femp > F1-α (J,n-J-1)

Prüfgröße H0 ablehnen, falls

Tab. 3: Testschema des t-Test. Hypothese

H0 : bj = 0 H1 : bj ≠ 0 b t bj = j s^ bj |tbj| > t1-α/2 (n-J-1)

Prüfgröße H0 ablehnen, falls

3.3 Ergebnisse und Analyse 3.3.1 BOOTSTRAP Der Output nach Ausführung des oben angegebenen Codes war folgende: lower

upper central.p

2.5% 0.1505774 0.2215163

0.95

Diese lässt sich so interpretieren, dass die Nullhypothese H 0 abgelehnt werden kann, da sich die Null nicht im (1-α) (α=5%) Konfidenzintervall der Mittelwertsdifferenzen befindet. Dies geschieht mit einer Irrtumswahrscheinlichkeit von höchstens 5%. Damit lässt sich ein signifikanter Unterschied der beiden Mittelwerte der Stichproben feststellen, welcher Anlass zu einer weiteren Untersuchung der Zeiträume bezüglich ihres Mittelwertes gibt. Hierbei gilt es noch festzustellen, welcher der Mittelwerte der Größere ist. Dies lässt sich unter zu Hilfenahme der mean Funktion in Rstudio bewerkstelligen, der für den Zeitraum 1 einen Mittelwert von 0.8490244 und für den Zeitraum 2 einen Mittelwert von 1.0346392 ermittelt. Durch diese Mittelwerte lässt sich sagen, dass die Hygienemaßnahmen des 1. Zeitraumes 7

vermutlich ausreichend sind um das Coronavirus einzudämmen, die des 2. Zeitraumes allerdings nicht. Jedoch sollte, insbesondere beim 2. Zeitraum, vor einer endgültigen Aussage nochmals der Trend des R-Wertes ermittelt werden.

3.3.2 LINEARE REGRESSION Die lineare Regression des 1. Zeitraumes ergibt, wie in Abb. 2 zu sehen, einen negativen Trend des R-Wertes. Das heißt, dass über den gesamten Zeitraum gesehen der R-Wert im Durschnitt sinkt. Außerdem liegt in dem betrachteten Zeitraum der R-Wert in keinem Fall über eins. Das Ergebnis des F-Testes in R ist: F-statistic: 10.65 on 1 and 39 DF, p-value: 0.002294. Damit kann die Nullhypothese H 0 (Tabelle 2), dass das Model nicht signifikant ist, mit einer Irrtumswahrscheinlichkeit von < 5% abgelehnt werden. Somit liefert die lineare Regression laut F-Test einen Erklärungsbeitrag zu den Werten des 1. Zeitraumes. Das Ergebnis des t-Testes in R ist im vorliegenden Fall dasselbe wie das des t-Testes, da es sich bei der linearen Regression um eine einfache lineare Regression handelt. Somit kann auch die Nullhypothese H0, dass der Regressionskoeffizient nicht signifikant für die abhängige Variable ist, des t-Testes abgelehnt werden. Damit ist der Regressionskoeffizient signifikant. Zusätzlich gibt R auch ein Ergebnis für die Bestimmtheit der Regression wieder. Dieses ist Multiple R-squared: 0.2145 und sagt damit aus, dass 21,45% der abhängigen Variable durch die erklärende Variable erklärt werden kann.

8

Abb.2: Plot der linearen Regression für den ersten Zeitraum.

Die lineare Regression des 2. Zeitraumes hingegen ergibt einen positiven Trend (Abb.2), somit steigt der R-Wert über den gesamten Zeitraum um Durchschnitt an. Außerdem liegt ungefähr die Hälfe alle R-Werte über eins, insbesondere die R-Werte am Ende des betrachteten Zeitraumes Wie schon bei der linearen Regression des 1. Zeitraumes ist auch in diesem Zeitraum das Ergebnis des F- beziehungsweise t-Testes unter 0.05, in diesem Fall sogar deutlich mit: F-statistic: 39.39 on 1 and 95 DF, p-value: 1.029e-08 Somit lassen sich die Nullhypothesen H 0, dass erstens das Model nicht signifikant ist und zweitens der Regressionskoeffiezient keinen Einfluss hat, ablehnen. Die Bestimmtheit des Regressionskoeffizienten liegt im 2. Zeitraum bei Multiple R-squared: 0.2931, womit dieser Wert zwar höher ist als der des 1. Zeitraumes, jedoch trotzdem vergleichsweise gering bleibt.

9

Abb. 3: Plot der linearen Regression für den zweiten Zeitraum.

Aus diesen Ergebnissen und den gesetzten Zielen folgt somit, dass die Hygienemaßnahmen im Lockdown ausreichend waren, um die Verbreitung von SARS-CoV-2 einzudämmen, da sowohl der Mittelwert 1, aber der Trend ist eindeutig positiv. Dennoch sollten vor allem die R-Werte gegen Ende des 2. Zeitraumes als besorgniserregend betrachtet werden, da diese den Wert von R = 1 gar nicht mehr unterschreiten.

10

4. FAZIT Ziel dieser Hausarbeit war es die Hygienemaßnahmen zweier Zeiträume auf ihre Wirksamkeit zu überprüfen, um somit eine Handlungsempfehlung auszusprechen. Hierbei wurde der Reproduktionswert des Coronaviruses über die beiden Zeiträume untersucht. Mithilfe eines Bootstrapverfahrens der Mittelwerte der Zeiträume wurde dabei zu allererst ein signifikanter Unterschied zwischen den Mittelwerten festgestellt. Danach wurde über die jeweiligen Zeiträume eine lineare Regression durchgeführt, welche ergab, dass der Trend des R-Wertes im 1. Zeitraum negativ ist, der des 2. Zeitraumes positiv. Zusammen mit den Mittelwerten des 1. Zeitraumes (0.85) und des 2. Zeitraumes (1.03) wurde somit, unter zu Hilfenahme der vorher festgelegten Ziele, nämlich eines R-Wertes...


Similar Free PDFs