BSc2 | pandaR

Tests für abhängige Stichproben - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Tests für unabhängige Stichproben - Aufgaben

Untersuchen Sie folgende Fragestellungen anhand des fb22-Datensatzes Denken Sie dabei an Folgendes: Deskriptivstatistische Beantwortung der Fragestellung Voraussetzungsprüfungen (Normalverteilung bitte optisch überprüfen und den Test dementsprechend wählen - auch wenn n > 30 gegeben ist) Spezifikation der Hypothesen und des Signifikanzniveaus Ggf. Berechnung der Effektstärke Formales Berichten des Ergebnisses Aufgabe 1 Unterscheiden sich Studierende, die sich für Allgemeine Psychologie (Variable “fach”) interessieren, im Persönlichkeitsmerkmal Intellekt (auch: Offenheit für neue Erfahrungen, “intel”) von Studierenden, die sich für Klinische Psychologie interessieren?

Tests für abhängige Stichproben

Nachdem wir uns mit unabhängige Stichproben in der (letzten Sitzung) beschäftigt haben wollen wir diesmal mit abhängigen Stichproben beschäftigen. Anwendungen dafür in der Praxis sind beispielsweise Zwillinge, Paare oder auch Messwiederholungen. Kernfragen der Lehreinheiten über Gruppenvergleiche Wie fertige ich Deskriptivstatistiken (Grafiken, Kennwerte) zur Veranschaulichung des Unterschieds zwischen zwei Gruppen an? Was sind Voraussetzungen des abhängigen t-Tests und wie prüfe ich sie? Wie führe ich einen abhängigen t-Test in R durch?

Tests für unabhängige Stichproben

Kernfragen der Lehreinheiten über Gruppenvergleiche Wie fertige ich Deskriptivstatistiken (Grafiken, Kennwerte) zur Veranschaulichung des Unterschieds zwischen zwei Gruppen an? Was sind Voraussetzungen des t-Tests und wie prüfe ich sie? Wie führe ich einen t-Test in R durch? Wie berechne ich die Effektstärke Cohen’s d? Wie führe ich den Wilcoxon-Test (auch “Mann-Whitney-Test”, “U-Test”, “Mann-Whitney-U-Test”, “Wilcoxon-Rangsummentest”) in R durch? Wie führe ich den Vierfelder-Chi-Quadrat-Test in R durch? Was erwartet Sie? Nachdem wir uns zuletzt mit dem Unterschied zwischen dem Mittelwert einer Stichprobe und dem Mittelwert der dazugehörigen Population, aus der die Stichprobe stammt, auseinandergesetzt haben, fokussieren wir uns nun auf Unterschiede zwischen zwei Gruppen (also zwei Stichproben).

Datensätze

Auf der folgenden Seite werden alle Datensätze aufgeführt, mit denen in den verschiedenen Tutorials auf pandaR gearbeitet wird. Die Datensätze sind alphabetisch sortiert und können teilweise direkt über diese Seite heruntergeladen werden. Hier eine Übersicht: Beschreibung Direkter Download Achtsamkeit und Depression OSF Alkoholkonsum von Jugendlichen alc Arbeitsstress bei Call-Center-Mitarbeiter:innen StressAtWork Vergleich von Behandlungsformen Behandlungsform Die Big Five Persönlichkeitsdimensionen Big5 Interozeptive Aufmerksamkeit und Genauigkeit OSF Bildungsinvestitionen auf der Welt edu_exp Bullyingprävention bei Jugendlichen fairplayer Quasi-Experimentelle Therapiestudie CBTdata Depressivität Depression Effektivität der CBT bei Depression Teil des Pakets metafor Entwicklung der Weltbevölkerung WorldPopulation Fragebogendaten aus dem ersten Semester fb22 Gender, Drug, and Depression OSF Skalenwerte der Generic Conspiracist Beliefs Scale conspiracy Items der Generic Conspiracist Beliefs Scale) conspiracy_cfa Gewissenhaftigkeit und Medikamenteneinnahme Teil des Pakets metafor Internetintervention für psychische Störungen OSF Kooperationsbereitschaft von Geschwistern via Syntax erstellt Machiavellismus-Fragebogen mach Major Depression OSF Mehrdimensionaler Befindlichkeitsfragebogen mdbf Mental Health and Social Contact During the COVID-19 Pandemic OSF Naturverbundenheit nature Lesekompetenz in der PISA-Erhebung PISA2009 Parental Burnout OSF Hauptkomponentenanalyse PCA Psychisches Wohlbefinden von Individuen während des Lockdowns in Frankreich OSF Kulturelle Unterschiede in Korruptionsbestrafung OSF Schulleistungen Schulleistungen Therapieerfolg Therapy Titanic Titanic Traumatische Erlebnisse und psychische Störungen OSF Achtsamkeit und Depression (raw_data) Beschreibung Beim Datensatz stammt von Rubin (2020) und ist auf dem Open Science Framework zu finden.

formr - FAQ

In diesem Tutorial soll gezeigt werden, wie ihr mit Hilfe von formr Umfragen erstellen können. Das Tutorial soll Sie dabei speziell auf die Anforderungen vorbereiten, die sich Ihnen im Rahmen eurer Gruppenarbeit in PsyBSc2 stellen werden. Das bedeutet, dass ihr lernt, wie ihr euren Fragebögen für formr erstellen könnte. Weiterhin wird gezeigt, wie diese Umfrage mit dem von uns bereit gestellten Teil zu Versuchspersonenminuten-Abfrage verbunden werden kann. Auch die Einwilligung in Teilnahmebedinungen und Datenschutz sowie die Auswirkungen deren Ablehnung sind essentielle Bestandteile der Beschreibung.

Zusatz - Aufgaben

Wie angekündigt finden Sie im Folgenden nun nochmal Aufgaben, die sich auf die Tutorials 1 bis 3 beziehen. Zunächst wollen wir nochmal Übungen mit einem kleinen, ausgedachten Datensatz durchführen. Stellen Sie sich dafür vor, dass Sie im Rahmen Ihres Studiums haben eine Untersuchung mit 10 Studierenden durchgeführt. Dabei haben Sie das Alter (in ganzen Zahlen), das Geschlecht (weiblich, männlich, divers), die deutsche Lieblingsstadt (Berlin, Hamburg, München, Frankfurt, Dresden), sowie die generelle Lebenszufriedenheit, gemessen mit 5 Items, erhoben.

Zusatz - Lösungen

Hier finden Sie die Lösungen zu den Zusatzaufgaben! Zunächst wollen wir nochmal Übungen mit einem kleinen, ausgedachten Datensatz durchführen. Stellen Sie sich dafür vor, dass Sie im Rahmen Ihres Studiums haben eine Untersuchung mit 10 Studierenden durchgeführt. Dabei haben Sie das Alter (in ganzen Zahlen), das Geschlecht (weiblich, männlich, divers), die deutsche Lieblingsstadt (Berlin, Hamburg, München, Frankfurt, Dresden), sowie die generelle Lebenszufriedenheit, gemessen mit 5 Items, erhoben. Aufgabe 1 Laden Sie die folgenden 3 Vektoren und den Datensatz in Ihr Environment.

Korrelation - Aufgaben

Regression

Kernfragen dieser Lehreinheit Wie kann ein Modell für den Zusammenhang von zwei Variablen erstellt werden? Wie können Streudiagramme in R erstellt werden? Wie kann die Regressionsgerade in den Plot eingefügt werden? Wie können standardisierte Regressionsgewichte geschätzt werden? Was ist der Unterschied zu nicht-standardisierten Regressionsgewichten? Wie wird der Determinationskoeffizient

R^{2}

berechnet und was sagt er aus? Wie werden der Determinationskoeffizient

R^{2}

und der Regressionsparameter b inferenzstatistisch überprüft? Vorbereitende Schritte Zu Beginn laden wir wie gewohnt den Datensatz und verteilen die relevanten Labels.

Simulation und Poweranalyse

Kernfragen dieser Lehreinheit Wie können Variablen und ganze Modelle simuliert werden? Wie lassen sich der

α

-Fehler (Type I-Error, Fehler erster Art) und die Power (Testmacht, Teststärke) empirisch bestimmen? Welche anderen Möglichkeiten, den

α

-Fehler und die Power zu bestimmen, gibt es? Wie lassen sich Power-Plots erstellen und was bedeuten sie? Einleitung In den vergangenen Sitzungen haben wir verschiedene Tests für unterschiedliche Fragestellungen kennengelernt:

t

-Test und Wilcoxon-Test für Mittelwertsvergleiche zweier Gruppen sowie den Korrelationstest, um die Beziehung zweier Variablen zu untersuchen.

Simulation und Poweranalyse - Aufgaben

Aufgabe 1 Lineare Beziehungen zwischen Variablen: Korrelationstest unter

H_{1}

Wir wollen uns ebenfalls die Power für den Korrelationstest ansehen. Dazu müssen wir allerdings korrelierte Variablen generieren. Um das hinzubekommen, müssen wir einige Eigenschaften der Normalverteilung ausnutzen: bspw. dass die Summe zweier normalverteilter Zufallsvariablen wieder normalverteilt ist. Für zwei unabhängige (unkorrelierte) standard-normalverteilte Zufallsvariablen

X

und

Z

, ist die Zufallsvariable

Y

, die folgendermaßen gebildet wird:

Y := ρ X + \sqrt{1 - ρ^{2}} Z,

wieder standard-normalverteilt und um den Korrelationskoeffizienten

ρ

korreliert mit

X

Hinweise zum Ergebnisbericht

Allgemeine Hinweise Pro Gruppe Abgabe eines Berichts über die eigene empirische Untersuchung Umfang: ca. 5 Seiten (entscheidend ist aber, dass der Inhalt vollständig ist) Zeilenabstand: 1,5 cm, Seitenabstand an allen Rändern: mindestens 2,6 cm Schriftart: Times New Roman Abgabe des Berichts (PDF-Dokument), des Arbeitsdatensatzes (.rda) und des Auswertungsskripts (.R) Abgabe bis zum 06.02.2023 23:59 Uhr Aufbau des Berichts Kursive Teile sind üblicherweise Teil eines Berichts, werden aber im Rahmen dieses Praktikums nicht erwartet.

Korrelation

Kernfragen dieser Lehreinheit Wie können Kreuztabellen in R erstellt werden? Welche Varianten gibt es, relative Häufigkeitstabellen zu erstellen? Wie kann ein gemeinsames Balkendiagramm für zwei Variablen erstellt werden? Welche zwei Varianten gibt es, Varianzen und Kovarianzen zu bestimmen? Wie kann die Produkt-Moment-Korrelation, die Rang-Korrelation nach Spearman und Kendalls

τ

bestimmt werden? Wie wird bei der Berechnung von Korrelationen mit fehlenden Werten umgegangen? Vorbereitende Schritte Zu Beginn laden wir wie gewohnt den Datensatz und verteilen die relevanten Labels.

Regression - Aufgaben

Tests und Konfidenzintervalle

Kernfragen dieser Lehreinheit Wie berechne ich, ob es einen Unterschied zwischen einer Stichprobe und der dazugehörigen Population gibt? Wann und wie rechne ich einen z-Test (Einstichproben-Gauss-Test)? Wie interpretiere ich die Ergebnisse? Wie bestimme ich das Konfidenzintervall des wahren Werts

μ

? Wann und wie rechne ich einen t-Test? Welche Voraussetzungen hat dieser? Wie interpretiere ich die Ergebnisse? Wie gehe ich mit gerichteten vs. ungerichteten Hypothesen um? Was ist Cohen’s d und wie berechne ich es?

Tests und Konfidenzintervalle - Aufgaben

Verteilungen

Kernfragen dieser Lehreinheit Wie können Zufallsexperimente und Bernoulli-Experimente simuliert werden? Wie lässt sich die Binomialverteilung darstellen? Wie können Wahrscheinlichkeitsverteilung und Verteilungsfunktion erstellt werden? Welchem Muster folgt die Arbeit mit Verteilungen in R? Mit welchen Befehlen erstellt man die Dichte- und Verteilungsfunktion? Wie kann eine empirisch erhobene Variable gegen die Normalverteilung abgetragen werden? Vorbereitende Schritte Der Datensatz ist in diesem Tutorial nicht zentral und kommt erst im letzten Abschnitt zum Tragen.

Verteilungen - Aufgaben

Aufgabe 1 Bei einem Gewinnspiel auf dem Jahrmarkt wird aus zwei Töpfen eine Kugel gezogen. In beiden Töpfen gibt es jeweils eine Kugel der Farben rot, grün, blau und gelb. Wie viele Kombinationsmöglichkeiten an Ziehungen gibt es, wenn jeweils eine Kugel gezogen wird. Lassen Sie sich diese ausgeben. Wenn mindestens eine der beiden gezogenen Kugeln grün ist, gewinnen Sie das Spiel. Lassen Sie sich von R ausgeben, wie viele mögliche Ziehungskombinationen einen Gewinn beinhalten.

Gruppenprojekt

Wie wir bereits im Praktikum besprochen haben, sollen Sie im Rahmen dieses empirischen Projekts eine erste eigene Befragung (Fragebogenstudie) konzipieren, diese durchführen und auswerten. Hier sollen die Grundlagen für die Generierung von Hypothesen sowie die Operationalisierung der Hypothesen (unter Beachtung der Skalenniveaus der erhobenen Daten) besprochen werden. Wir haben alle wichtigen Informationen nochmals für Sie zusammengefasst. Sollten in der Zusammenarbeit in Ihrer Kleingruppe noch Fragen auftreten, wenden Sie sich bitte an Ihre/n Dozent:in.

R Crash-Kurs - Aufgaben

R als Taschenrechner Bestimmen Sie das Ergebnis von

3 + 7 \cdot 12

Prüfen Sie mit logischen Operatoren, ob das Ergebnis aus der letzten Aufgabe das Selbe ist, wie

3 \cdot 29

Bestimmen Sie

\sqrt{115}

und legen Sie das (ganzzahlig) gerundete Ergebnis in einem Objekt namens zahl ab. Folgende Syntax verursacht einen Fehler: 6 * 1,56. Wodurch kommt dieser Fehler zustande? Daten erstellen In folgender Tabelle sind die fünf schnellsten Zeiten im Finale des 100m Sprint der Frauen bei den Olympischen Spiele in Tokyo dargestellt:

Deskriptivstatistik für Intervallskalen

Kernfragen dieser Lehreinheit Was ist der Befehl um den Mittelwert zu bestimmen? Wie kann die empirische Varianz bestimmt werden? Wie unterscheidet sich diese von der mit var() bestimmten Varianz? Wie können Variablen zentriert und standardisiert werden? Welche Möglichkeiten gibt es, negativ formulierte Items zu rekodieren? Mit welchen Befehlen können in R Skalenwerte für Fragebögenitems erstellt werden? Wiederholung aus der Vorlesung: Skalenniveaus Skala Aussage Transformation Zentrale Lage Dispersion Nominal Äquivalenz eineindeutig Modus Relativer Informationsgehalt Ordinal Ordnung monoton Median Interquartilsbereich Intervall Verhältnis von Differenzen positiv linear Mittelwert Standardabweichung, Varianz Verhältnis Verhältnisse Ähnlichkeit … … Absolut absoluter Wert Identität … … Vorbereitende Schritte Den Datensatz haben wir bereits über diesen Link heruntergeladen und können ihn über den lokalen Speicherort einladen oder Sie können Ihn direkt mittels des folgenden Befehls aus dem Internet in das Environment bekommen.

Deskriptivstatistik für Intervallskalen - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Aufgabe 1 Erstellen Sie im Datensatz fb22 die Skalenwerte für die Naturverbundenheit, die mit den Items nr1 bis nr6 gemessen wurde. Keines der Items ist invertiert.

Deskriptivstatistik für Nominal- und Ordinalskalen

Kernfragen dieser Lehreinheit Wie werden Häufigkeitstabellen erstellt? Wie können aus absoluten Häufigkeitstabellen relative Häufigkeitstabellen gemacht werden? Wie kann der Modus bestimmt werden? Auf welche Weise lässt sich der relative Informationsgehalt bestimmen, obwohl es dafür in R keine Funktion gibt? Wie bestimmt man den Median und Interquartilsbereich unter Beachtung von fehlenden Werten in den Daten? Welche Befehle können genutzt werden, um Balken-, Kuchendiagramme und Histogramme zu erzeugen? Welche Möglichkeiten gibt es, um Grafiken anzupassen?

Deskriptivstatistik für Nominal- und Ordinalskalen - Aufgaben

Vorbereitung Laden Sie die Daten aus fb22.rda oder direkt von der Website über die gelernten Befehle. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.pdf entnehmen. Aufgabe 1 Untersuchen Sie, welche Arbeitsbranche Sie und Ihre Kommiliton:innen nach dem Studium anstreben! Vergeben Sie zunächst die korrekten Wertelabels an die Ausprägungen der Variable. Lassen Sie sich absolute und relative Häufigkeiten ausgeben. Untersuchen Sie mit den geeigneten Maßen die zentrale Tendenz und Dispersion dieser Variable.