Courtesy of pxhere

Simulation und Poweranalyse - Aufgaben

Aufgabe 1

Lineare Beziehungen zwischen Variablen: Korrelationstest unter \(H_1\)

Wir wollen uns ebenfalls die Power für den Korrelationstest ansehen. Dazu müssen wir allerdings korrelierte Variablen generieren. Um das hinzubekommen, müssen wir einige Eigenschaften der Normalverteilung ausnutzen: bspw. dass die Summe zweier normalverteilter Zufallsvariablen wieder normalverteilt ist. Für zwei unabhängige (unkorrelierte) standard-normalverteilte Zufallsvariablen \(X\) und \(Z\), ist die Zufallsvariable \(Y\), die folgendermaßen gebildet wird:

\[Y:= \rho X + \sqrt{1-\rho^2}Z,\]

wieder standard-normalverteilt und um den Korrelationskoeffizienten \(\rho\) korreliert mit \(X\). Wir können also relativ einfach zwei korrelierte Variablen generieren. Wie in der Sitzung verwenden wir \(N=20\):

N <- 20

set.seed(12345)
X <- rnorm(N)
Z <- rnorm(N)
Y <- 0.5*X + sqrt(1 - 0.5^2)*Z
cor(X, Y) # empirische Korrelation
## [1] 0.579799
sd(X) 
## [1] 0.8339354
sd(Y)
## [1] 1.232089

Falls Sie die oben genutzte Formel zur Generierung korrelierter Zufallsvariablen überprüfen wollen, dann setzen Sie doch einmal N = 10^6 (also eine Stichprobe von 1 Mio). Dann sollte die empirische Korrelation sehr nah an der theoretischen liegen. Auch sollten dann die empirischen Standardabweichungen sehr nah an der 1 liegen.

Verwenden Sie für diese Aufgabe stets den Seed 12345 (set.seed(12345)).

  • Betrachten Sie das Modell für eine Stichprobe von N = 10^6. Berichten Sie die empirische Korrelation sowie die empirischen Standardabweichungen.
  • Untersuchen Sie die Power des Korrelationstests für eine Korrelation von \(\rho=0.5\) und \(N = 20\). Führen Sie eine Simulationsstudie durch. Wie groß ist die Power?
  • Stellen Sie die Verteilung der empirischen Korrelationen (für \(\rho=0.5\) und \(N=20\)) unter der \(H_1\) dar.

Aufgabe 2

Lineare Beziehungen zwischen Variablen: Korrelationstest unter \(H_1\) für ungleiche Varianzen

Wiederholen Sie die Analyse. Verändern Sie diesmal die Varianz der beiden Variablen Xund Y. X soll eine Varianz von 9 haben (multiplizieren Sie dazu X mit 3, nachdem Sie Y mithilfe von X und Z generiert haben), und Y soll eine Varianz von 0.25 haben (multiplizieren Sie dazu Y mit 0.5, nachdem Sie Y mit Hilfe von X und Z generiert haben).

  • Betrachten Sie das Modell für eine Stichprobe von N = 10^6. Berichten Sie die empirische Korrelation sowie die empirischen Standardabweichungen.
  • Führen Sie eine Simulationsstudie durch (für \(\rho=0.5\) und \(N=20\)). Wie verändert sich die Power des Tests durch die veränderten Varianzen?

Aufgabe 3

Type I-Error und Power zu einem \(\alpha\)-Niveau von \(0.1\%\) des \(t\)-Test

Wir wollen nun die Power des \(t\)-Tests für ein anderes \(\alpha\)-Fehlerniveau bestimmen. Wiederholen Sie also die Poweranalysen aus der Sitzung für den \(\alpha\)-Fehler und die Power für ein \(\alpha\)-Fehlerniveau von \(0.1\%\).

Nutzen Sie den Seed 12345 (set.seed(12345)).

  • Führen Sie eine Simulation durch, um das empirische \(\alpha\)-Niveau des \(t\)-Tests zu bestimmen für \(N=20\). Vergleichen Sie das Ergebnis mit dem Ergebnis aus der Sitzung.
  • Führen Sie eine Simulation durch, um die empirische Power des \(t\)-Tests zu bestimmen für \(N=20\), \(d = 0.5\) und \(\alpha = 0.1\%\). Vergleichen Sie das Ergebnis mit dem Ergebnis aus der Sitzung. Was bedeutet dies für die Wahl der Irrtumswahrscheinlichkeit?

Aufgabe 4

Power-Plots für den \(t\)-Test

Wir wollen nun die Power des \(t\)-Tests für unterschiedliche Effektgrößen untersuchen. In den beiden Gruppen soll jeweils eine Varianz von 1 herrschen. Verändern Sie also den Code der Sitzung nur hinsichtlich der Effektgröße. Das \(\alpha\)-Fehlerniveau soll wieder bei \(5\%\) liegen.

Nutzen Sie den Seed 12345 (set.seed(12345)).

  • Erstellen Sie einen Power-Plot für die folgenden Effekte \(d = 0, 0.25, 0.5, 0.75, 1,\) und \(1.25\) bei einer Stichprobengröße von \(N = 20\). Stellen Sie die Effektgröße auf der x-Achse dar.

Aufgabe 5

Powervergleich: \(t\)-Test vs. Wilcoxon-Test

Wir wollen nun die Power des \(t\)-Tests mit der Power des Wilcoxon-Tests vergleichen. Der Wilcoxon-Test ist flexibler anzuwenden, da er weniger Annahmen aufweist. Untersuchen Sie, wie sich dies auf die Power auswirkt. Das \(\alpha\)-Fehlerniveau soll wieder bei \(5\%\) liegen.

Nutzen Sie den Seed 12345 (set.seed(12345)).

  • Verwenden Sie das gleiche Setting wie aus der Sitzung und bestimmen Sie die Power des Wilcoxon-Tests für \(N=20\), \(d = 0.5\) und \(\alpha = 5\%\). Vergleichen Sie das Ergebnis mit dem Ergebnis aus der Sitzung.

Ähnliches