Datensätze
Übersicht über alle verwendeten Datensätze auf pandaR
Auf der folgenden Seite werden alle Datensätze aufgeführt, mit denen in den verschiedenen Tutorials auf pandaR
gearbeitet wird. Die Datensätze sind alphabetisch sortiert und können teilweise direkt über diese Seite heruntergeladen werden. Hier eine Übersicht:
Achtsamkeit und Depression (raw_data
)
Beschreibung
Beim Datensatz stammt von Rubin (2020) und ist auf dem Open Science Framework
zu finden. Er beschäftigt sich mit der Untersuchung von Variablen, die den Zusammenhang zwischen Achtsamkeit und Depression mithilfe einer Netzwerkanalyse untersuchen wollen.
Auf pandaR
wird der Datensatz in dem Tutorial Netzwerkanalyse im Querschnitt für PsyMSc5a verwendet.
Datensatz laden
raw_data <- readRDS(url("https://osf.io/awz3d/download"))
names(raw_data) <- c("observe", "describe", "awaren.", "nonjudg.",
"nonreact.", "interest", "emotions", "sleep",
"tired", "appetite", "selfim.",
"concentr.", "speed")
Größe
Der Datensatz besteht aus 384 Beobachtungen auf 13 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
observe | Wahrnehmen | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
describe | Beschreiben | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
awaren. | Bewusst handeln | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
nonjudg. | Nichturteilen | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
nonreact. | Nichtreagieren | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
interest | Interessensverlust | standardisierter Skalenwert |
emotions | anhaltende gedrückte Stimmung | standardisierter Skalenwert |
sleep | Schlaflosigkeit | standardisierter Skalenwert |
tired | Müdigkeit | standardisierter Skalenwert |
appetite | Appetitstörung | standardisierter Skalenwert |
selfim. | negatives Selbstbild | standardisierter Skalenwert |
concentr. | Konzentrationsschwierigkeiten | standardisierter Skalenwert |
speed | Hemmung von Antrieb und Denken | standardisierter Skalenwert |
Die Variablen observe, describe, awareness, nonjudging und nonreactivity bezeichnen die fünf Facetten der Achtsamkeit von Baer et al. (2006). Die 8 weiteren Variablen beschreiben eine dysfunktionale, meist negative Veränderung in dem bezeichneten Lebensaspekt im Zuge einer Depression.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Alkoholkonsum von Jugendlichen (alc
)
Beschreibung
Der Datensatz stammt aus einer Erhebung von Curran, Stice und Chassin (1997) in der der Alkoholkonsum von Jugendlichen längsschnittlich untersucht wurde. Dazu wurde der Selbstbericht über den eigenen Alkoholkonsum mit 14, 15 und 16 Jahren, sowie die Trinkgewohnheiten der Eltern und Peers erfragt. Zusätzlich wurden demografische Variablen erhoben.
Auf pandaR
wird der Datensatz in dem Tutorial ANOVA III und Quiz 6 für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/alc.rda"))
Größe
Der Datensatz besteht aus 82 Beobachtungen auf 7 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
id | Personenidentifikator | Nummer |
male | Geschlecht | 0 = weiblich, 1 = männlich |
peer | berichtetes Ausmaß, in dem Peers Alkohol konsumieren | 0 = keine, 5 = alle |
coa | Kind eines/einer Alkoholiker:in (“child of alcoholic”) | 0 = nein, 1 = ja |
alcuse.14 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 14 Jahren konsumiert wird | 0 = nie, 7 = täglich |
alcuse.15 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 15 Jahren konsumiert wird | 0 = nie, 7 = täglich |
alcuse.16 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 16 Jahren konsumiert wird | 0 = nie, 7 = täglich |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Erweiterung
Für das Quiz ANOVA III in PsyBSc7 wurde der Datensatz nochmal in zwei getrennten Formaten erweitert. Die erweiterten Daten sind simulationsbasiert. Die Daten können mit folgendem Befehl eingeladen werden:
load(url("https://pandar.netlify.app/post/alc_extended.rda"))
Im Environment erscheinen zwei Datensätze. Der Datensatz alc17
hat eine Variable mehr (alcuse.17
), während alc18
nochmal 2 weitere zusätzliche Variablen (treat
und alcuse.18
) hat.
Hier folgt nochmal eine genauere Aufstellung der simulierten Variablen.
Variable | Bedeutung | Kodierung |
---|---|---|
alcuse.17 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 17 Jahren konsumiert wird | 0 = nie, 7 = täglich |
treat | Behandlung | 0 = nein, 1 = ja |
alcuse.18 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 18 Jahren konsumiert wird | 0 = nie, 7 = täglich |
Arbeitsstress bei Call-Center-Mitarbeiter:innen (StressAtWork
)
Beschreibung
Der Datensatz ist eine Zusammenstellung aus mehreren Studien der Arbeits- und Organisationspsychologie-Abteilung der Goethe-Universität, in welchem Call-Center-Mitarbeiter:innen untersucht wurden. Der Datensatz enthält das Geschlecht der Proband:innen, sowie ausgewählte Messungen der Variablen Zeitdruck und Arbeitsorganisationale Probleme aus dem Instrument zur stressbezogenen Tätigkeitsanalyse (ISTA) von Semmer, Zapf und Dunckel (1999), Psychosomatische Beschwerden (auch “Befindlichkeit”) aus der Psychosomatischen Beschwerdenliste von Mohr (1986), sowie Messungen zu Subskalen von Burnout: Emotionale Erschöpfung und Leistungserfüllung aus Maslachs Burnout-Inventar (Maslach & Jackson, 1986) in der deutschen Übersetzung von Büssing und Perrar (1992).
Auf pandaR
wird der Datensatz in den Tutorials Pfadanalysen und Strukturgleichungsmodelle und Modelle für Gruppenvergleiche für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/StressAtWork.rda"))
Größe
Der Datensatz besteht aus 305 Beobachtungen auf 34 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
sex | Geschlecht der Proband:innen | 1 = weiblich, 2 = männlich |
zd1 , zd2 & zd6 | Zeitdruck | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
aop3 , aop4 & aop8 | Arbeitsorganisationale Probleme | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
bf1 -bf20 | Psychosomatische Beschwerden | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
bo1 , bo6 , b19 & b12 | Emotionale Erschöpfung | 1 = Trifft nicht zu, 7 = Trifft voll und ganz zu |
bo7 , bo8 & bo21 | Leistungserfüllung | 1 = Trifft nicht zu, 7 = Trifft voll und ganz zu |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Vergleich von Behandlungsformen Behandlungsform
Beschreibung
Der Datensatz enthält Ausprägungen von Patient:innen auf verschiedenen psychotherapeutischen Variablen sowie demografische Informationen. Dabei gibt es zwei kategoriale Variablen: Auf Geschlecht gibt es hier die Ausprägungen männlich und weiblich, während die Therapieform zwischen Kontrollgruppe, KVT und einer Kombination auf KVT und Blended Care unterscheidet. Alle anderen Variablen können als intervallskaliert angenommen werden.
Auf pandaR
wird der Datensatz in dem Quiz 5 für PsyBsc7 und in Block 1 der Quizze für PsyMSc5a verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Behandlungsform.rda"))
Größe
Der Datensatz besteht aus 100 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Kodierung |
---|---|
Depression | Skalenwert |
Therapeutische_Allianz | Skalenwert |
Gesundheitszustand | Skalenwert |
Interpersonelle_Probleme | Skalenwert |
Therapieform | 1 = Kontrolle, 2 = KVT, 3 = blended Care KVT |
Geschlecht | 1 = männlich, 2 = weiblich |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Die Big Five Persönlichkeitsdimensionen Big5
Beschreibung
Der Originaldatensatz ist ein Onlinedatensatz, wird seit 2012 erfasst und ist auf openpsychometrics.org als .zip downloadbar. Bisher haben über 19700 Probanden aus der ganzen Welt teilgenommen. Zu jeder der fünf Facetten gibt es 10 Fragen. Der Fragebogen ist auf personality-testing.info einzusehen. Um das Ganze etwas übersichtlicher zu gestalten, betrachten wir einen gekürzten Datensatz. Im Datensatz Big5_EFA.rda befinden sich 15 Items aus dem Big-5 Persönlichkeitsfragebogen. Hier werden von den 10 Items pro Facette jeweils die ersten drei verwendet.
Auf pandaR
wird der Datensatz in dem Tutorial Exploratorische Faktorenanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Big5_EFA.rda"))
Größe
Der Datensatz besteht aus 19711 Beobachtungen auf 19 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen. Die jeweiligen Items sind von 1 bis 5 skaliert.
Variable | Itemwortlaut |
---|---|
E1 | “I am the life of the party.” |
E2 | “I don’t talk a lot.” |
E3 | “I feel comfortable around people.” |
N1 | “I get stressed out easily.” |
N2 | “I am relaxed most of the time.” |
N3 | “I worry about things.” |
A1 | “I feel little concern for others.” |
A2 | “I am interested in people.” |
A3 | “I insult people.” |
C1 | “I am always prepared.” |
C2 | “I leave my belongings around.” |
C3 | “I pay attention to details.” |
O1 | “I have a rich vocabulary.” |
O2 | “I have difficulty understanding abstract ideas.” |
O3 | “I have a vivid imagination.” |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Interozeptive Aufmerksamkeit und Genauigkeit body
Beschreibung
Der Datensatz liegt auf dem Open Science Framework
und stammt aus einer Untersuchung von Campos, Barbosa Rocha und Barbosa (2022), in der es um die Abgrenzung von interozeptiver (die Wahrnehmung der vegetativen Prozesse des eigenen Körpers) Aufmerksamkeit und Genauigkeit geht.
Auf pandaR
wird der Datensatz in dem Tutorial Regression mit nominalskalierten Prädiktoren für PsyBSc7 verwendet.
Datensatz laden
Der Datensatz liegt im OSF im .sav
Dateiformat (dem Datenformat in dem SPSS seine Daten abspeichert) vor. Daher müssen die Daten mithilfe einer der vielen verschiedenen Import-Funktionen eingelesen werden. Hier nutzen wir dafür die Funktion read_sav
aus dem Paket haven
, welches R-Studio primär nutzt, um Daten zu importieren und daher bereits installiert sein sollte.
library(haven)
body <- haven::read_sav(file = url('https://osf.io/43xv5/download'))
Der Datensatz enthält neben den zusammengefassten Skalenwerten auch die einzelnen Items der beiden zentralen Skalen (IAS und BPQ), welche wir für diese Anwendung entfernen, um die Daten etwas übersichtlicher zu gestalten. Wir beschränken uns also auf die ersten 27 Variablen im Datensatz:
body <- body[, 1:27]
Größe
Der eingeschränkte Datensatz besteht aus 134 Beobachtungen auf 27 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
id | Probanden-ID | |
Age | Alter | Alter in Jahren |
Sex | Geschlecht | 0 = weiblich, 1 = männlich |
Nationality | Nationalität | 0 = andere, 1 = Portugiesisch |
PortugueseFirstLanguage | Muttersprache | 0 = andere, 1 = Portugiesisch |
EducationCategorical | Höchster Bildungsabschluss | 0 = kein Abschluss, 1 = Grundschule, 2 = mittlere Reife, 3 = Abitur/High School, 4 = Bachelor, 5 = Master, 6 = Doktorgrad |
EducationYears | Jahre im Bildungssystem | |
Student | Schüler*in oder Student*in? | 0 = nein, 1 = ja |
Employed | Angestelltenverhältnis? | 0 = nein, 1 = ja |
Unemployed | Arbeitslos? | 0 = nein, 1 = ja |
StayAtHome | Hausfrau/-mann? | 0 = nein, 1 = ja |
Retired | Im Ruhestand? | 0 = nein, 1 = ja |
OccupationalStatusOther | Anderes Beschäftigungsverhältnis? | 0 = nein, 1 = ja |
UniversityStudent | Student*in? | 0 = nein, 1 = ja ( fehlerhafte Kopie der Variable Student ) |
PsychiatricHistory | Psychische Störung in der Vergangenheit? | 0 = nein, 1 = ja |
NeurologicalHistory | Neurologische Störung in der Vergangenheit? | 0 = nein, 1 = ja |
ChronicCondition | Chronische Krankheiten? | 0 = nein, 1 = ja |
Medication | Aktuell Medikamenteneinnahme? | 0 = nein, 1 = ja |
Device | Gerät an dem Fragebogen ausgefüllt wird | 0 = Computer, 1 = Smartphone, 2 = Tablet, 3 = anderes |
IAS_TotalScore | Interoceptive Accuracy Scale | Skalenwert |
IAS_TotalScore_Retest | Interoceptive Accuracy Scale, 2. Erhebung | Skalenwert |
BPQ_BodyAwareness | Body Perception Questionnaire, Aufmerksamkeits-Dimension | Skalenwert |
BPQ_BodyAwareness_Retest | Body Perception Questionnaire, Aufmerksamkeits-Dimension, 2. Erhebung | Skalenwert |
BPQ_AutonomicReactivity | Body Perception Questionnaire, Reaktivitäts-Dimension | Skalenwert |
BPQ_AutonomicReactivity_Retest | Body Perception Questionnaire, Reaktivitäts-Dimension, 2. Erhebung | Skalenwert |
BPQ_Time_Retest | Zeit um BPQ auszufüllen, 2. Erhebung | in Sekunden |
IAS_Time_Retest | Zeit um IAS auszufüllen, 2. Erhebung | in Sekunden |
Fehlende Werte
In dem Datensatz liegen 92 fehlende Werte vor. Diese sind allesamt auf der fehlerhaft kodierten Variablen UniversityStudent
zu finden.
Bildungsinvestitionen auf der Welt (edu_exp
)
Beschreibung
Wir benutzen für unsere Interaktion mit ggplot2
öffentlich zugängliche Daten aus verschiedenen Quellen, die dankenswerterweise von Gapminder zusammengetragen werden. Für diesen Abschnitt gucken wir uns dafür mal an, wie viele verschiedene Länder in die Bildung investieren - diese Daten stammen ursprünglich von der Weltbank.
Auf pandaR
wird der Datensatz für den DigiGEBF Workshop ggplotting und in dem Tutorial Grafiken mit ggplot2 für PsyBSc7 verwendet.
Datensatz laden
load(url('https://pandar.netlify.com/post/edu_exp.rda'))
Größe
Der Datensatz besteht aus 4137 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt |
---|---|
geo | Länderkürzel, das zur Identifikation der Länder über verschiedene Datenquellen hinweg genutzt wird |
Country | der Ländername im Englischen |
Wealth | Wohlstandseinschätzung des Landes, unterteilt in fünf Gruppen |
Region | Einteilung der Länder in die vier groben Regionen africa , americas , asia und europe |
Year | Jahreszahl |
Population | Bevölkerung |
Expectancy | Lebenserwartung eines Neugeborenen, sollten die Lebensumstände stabil bleiben |
Income | Stetiger Wohlstandsindikator für das Land (GDP pro Person) |
Primary | Staatliche Ausgaben pro Schüler:in in der primären Bildung als Prozent des income (GDP pro Person) |
Secondary | Staatliche Ausgaben pro Schüler:in in der sekundären Bildung als Prozent des income (GDP pro Person) |
Tertiary | Staatliche Ausgaben pro Schüler:in oder Student:in in der tertiären Bildung als Prozent des income (GDP pro Person) |
Index | Education Index des United Nations Development Programme |
Fehlende Werte
Insgesamt liegen im Datensatz 8714 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
geo
Country
Wealth
Region
Year
Population
Bullyingprävention bei Jugendlichen (fairplayer
)
Beschreibung
Der Datensatz stammt aus einer Studie von Bull, Schultze & Scheithauer (2009), in der die Effektivität eines Interventionsprogramms zur Bullyingprävention bei Jugendlichen untersucht wurde.
Auf pandaR
wird der Datensatz in dem Tutorial Einführung in lavaan für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/fairplayer.rda"))
Größe
Der Datensatz besteht aus 155 Beobachtungen auf 31 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
id | Personenidentifikator | Nummerierung |
class | Klasse | Zahl |
grp | Interventionsgruppe | 1 = CG, 2 = IGS, 3 = IGL |
sex | Geschlecht | 1 = weiblich, 2 = männlich |
ra1t1 -ra1t3 | 1. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
ra2t1 -ra2t3 | 2. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
ra3t1 -ra3t3 | 3. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em1t1 -em1t3 | 1. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em2t1 -em2t3 | 2. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em3t1 -em3t3 | 3. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si1t1 -si1t3 | 1. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si2t1 -si2t3 | 2. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si3t1 -si3t3 | 3. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
Fehlende Werte
In dem Datensatz liegen 830 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
id
Quasi-Experimentelle Therapiestudie CBTdata
Beschreibung
Beim Datensatz handelt es sich um ein fiktives Datenbeispiel, bei dem Patient:innen, die an einer Depression oder einer Angststörung leiden, entweder mit einer kognitiven Verhaltenstherapie (CBT) behandelt oder in einer Wartekontrollgruppe belassen wurden. Eine zufällige Zuordnung war nicht vollständig möglich, da die Zuordnung von überweisenden Hausarzt-Praxen der Patient:innen mit beeinflusst werden konnte (z.B. durch Geltendmachung einer besonderen Dringlichkeit der Therapie).
Auf pandaR
wird der Datensatz in dem Tutorial Schätzung von Kausaleffekten 1 und Schätzung von Kausaleffekten 2 für PsyMSc5a verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/CBTdata.rda"))
Größe
Der Datensatz besteht aus 326 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
Age | Alter | Alter |
Gender | Geschlecht | female = weiblich, male = männlich |
Treatment | Behandlungsgruppenzugehörigkeit | CBT = kognitive Verhaltenstherapie, WL = Wartekontrolle |
Disorder | psychische Störung | ANX = Angststörung, DEP = Depression |
BDI_pre | Depressionswert gemessen mit Beck Depressions-Inventar vor Therapie | 0 - 63 |
SWL_pre | Lebenszufriedenheit gemessen mit Satisfaction With Life Screening vor Therapie | 5 - 35 |
BDI_post | Depressionswert gemessen mit Beck Depressions-Inventar nach Therapie | 0 - 63 |
SWL_post | Lebenszufriedenheit gemessen mit Satisfaction With Life Screening nach Therapie | 5 - 35 |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Depressivität Depression
Beschreibung
Beim Datensatz handelt es sich um fiktive Daten bezüglich Depressionswerten in Beziehung zu einigen weiteren Variablen.
Auf pandaR
wird der Datensatz in den Tutorials Einleitung und Wiederholung KliPPs und Multiple Regression und Ausreißerdiagnostik für PsyMSc5a verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Depression.rda"))
Größe
Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Kodierung |
---|---|
Lebenszufriedenheit | 1 - 10 |
Episodenanzahl | 1 - 10 |
Depressivitaet | 1 - 10 |
Neurotizismus | 1 - 10 |
Intervention | 1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung |
Geschlecht | 0 = männlich, 1 = weiblich |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Effektivität der CBT bei Depression (F2F_CBT
)
Beschreibung
Der Datensatz ist R
-eigenen Paket metafor
von Viechtbauer (2010) enthalten und stammt von einer Studie von López-López et al. (2019). Die Autor:innen haben die Effektivität der CBT (cognitive behavioural therapy [kognitive Verhaltenstherapie]) bei Depression untersucht und diese mit verschiedenen Kontrollbedingungen und unterschiedlichen Arten der CBT verglichen.
Auf pandaR
wird der Datensatz in dem Tutorial Metaanalysen in R für PsyMSc5a verwendet.
Datensatz laden
library(metafor)
## Loading required package: Matrix
## Loading required package: metadat
##
## Loading the 'metafor' package (version 3.8-1). For an
## introduction to the package please type: help(metafor)
F2F_CBT <- dat.lopez2019[dat.lopez2019$treatment == "F2F CBT",] # wähle nur Fälle mit F2F CBT
Größe
Der Datensatz besteht aus 71 Beobachtungen auf 23 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
study | verwendete Studie | Autor:innen |
treatment | verwendete Therapieart oder Kontrollgruppe | “F2F CBT” = “Angesicht zu Angesicht”-CBT, “Multimedia CBT” = Online-CBT, “Placebo” = Placebo-Kontrollgruppe, “Wait list” = Wartelistenkontrollgruppe, “Hybrid CBT” = Mischung aus F2F und Multimedia, “No treatment” = klassische Kontrollgruppw, “TAU” = Treatment as Usual [Standardtherapie] |
scale | Messinstrument Depression | BDI = Beck’s Depressionsinventar, HAM-24 = Hamilton Rating Scale for Depression-24, PHQ-9 = Patient Health Questionnaire-9, HAM-17 = Hamilton Rating Scale for Depression-17, CES-D = Center for Epidemiologic Studies Depression Scale, BSI = Brief Symptom Inventory, SDS = Sheehan Disability Scale |
n | Stichprobengröße | n |
diff | standardisierte Differenz zwischen vor und nach der Intervention | Cohen’s d |
se | Standardfehler von diff | se |
group | Dummy-Variable | 0 = Einzeltherapie, 1 = Gruppentherapie |
tailored | gibt an, ob die Therapie individuell auf Patient:in zugeschnitten wurde | 0 = nein, 1 = ja |
sessions | Anzahl der Therapiesitzungen | Anzahl |
length | durchschnittliche Sitzungslänge | Länge |
intensity | Intensität der Therapie | Produkt aus session und length |
multi | Intervention enthielt Multimedia-Elemente | 0 = nein, 1 = ja |
cog | Intervention enthielt kognitive Techniken | 0 = nein, 1 = ja |
ba | Intervention enthielt behaviorale Aktivierung | 0 = nein, 1 = ja |
psed | Intervention enthielt Psychoedukation | 0 = nein, 1 = ja |
home | Intervention enthielt Hausaufgaben | 0 = nein, 1 = ja |
prob | Intervention enthielt Problemlösen | 0 = nein, 1 = ja |
soc | Intervention enthielt Training sozialer Kompetenzen | 0 = nein, 1 = ja |
relax | Intervention enthielt Entspannungstechniken | 0 = nein, 1 = ja |
goal | Intervention enthielt Zielsetzung | 0 = nein, 1 = ja |
final | Intervention enthielt Abschlussgespräch | 0 = nein, 1 = ja |
mind | Intervention enthielt Achtsamkeit | 0 = nein, 1 = ja |
act | Intervention enthielt Acceptance and Commitment Therapy | 0 = nein, 1 = ja |
Fehlende Werte
Im Datensatz liegen 20 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
authors
year
ni
ri
controls
design
a_measure
c_measure
meanage
quality
Entwicklung der Weltbevölkerung (WorldPopulation
)
Beschreibung
Der Datensatz stammt von Gapminder
und enthält Daten zur Entwicklung der Weltbevölkerung. Die Dokumentation des Datensatzes sowie seine Datenquellen sind hier einzusehen: gapminder.org-Dokumentationen.
Auf pandaR
wird der Datensatz in dem Tutorial Regression V und dem Zusatzquiz für nichtlineare Regression für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/WorldPopulation.rda"))
Größe
Der Datensatz besteht aus 221 Beobachtungen auf 2 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung |
---|---|
Year | Jahreszahl |
Population | Weltbevölkerung |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Fragebogendaten aus dem ersten Semester fb22
Beschreibung
Der Datensatz fb22
besteht aus Daten, die von den Studierenden selbst in den ersten Wochen der Veranstaltung PsyBSc2 erhoben wurden. Hierbei wurden eine Reihe von Variablen via eines Fragebogens auf formr.org
erfragt und anschließend zu einem Datensatz zusammengefügt. Die Daten basieren somit auf wahren - anonymisierten - Werten der Studierenden. Der Fragebogen erfasst Daten zur Prokastinationstendenz, Naturverbundenheit, Persönlichkeit (gemessen an den Big5), dem Studium sowie demografische Daten.
Auf pandaR
wird der Datensatz in fast allen Tutorials von PsyBsc2 verwendet.
Datensatz laden
load(url('https://pandar.netlify.app/post/fb22.rda'))
Größe
Der Datensatz besteht aus 159 Beobachtungen auf 36 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
prok1 - prok10 | Items zur Prokrastinationstendenz (Items 2,3,5,7 & 8 sind invertiert) | 1 = “stimmt nicht”, 4 = “stimmt genau” |
nr1 - nr6 | Items zur Naturverbundenheit | 1 = “stimme nicht zu”, 5 = “stimme zu” |
lz | Lebenszufriedenheit | Skalenwert |
extra | Extraversion | Skalenwert |
vertr | Verträglichkeit | Skalenwert |
gewis | Gewissenhaftigkeit | Skalenwert |
neuro | Neurotizismus | Skalenwert |
intel | Intellekt | Skalenwert |
nerd | Nerdiness Personality Attributes | Skalenwert |
grund | Gründe für das Psychologiestudium | Freitext |
fach | Interessenfach | 1 = Allgemeine, 2 = Biologische, 3 = Entwicklung, 4 = Klinische, 5 = Diag./Meth. |
ziel | Arbeitsbranche nach Abschluss | 1 = Wirtschaft, 2 = Therapie, 3 = Forschung, 4 = Andere |
lerntyp | Lerntyp | 1 = alleine, 2 = Gruppe, 3 = Mischtyp |
geschl | Geschlecht | 1 = weiblich, 2 = männlich, 3 = anderes |
job | Nebentätigkeit | 1 = nein, 2 = ja |
ort | Derzeitiger Wohnort | 1 = Frankfurt, 2 = anderer |
ort12 | Wohnort vor 12 Monaten | 1 = Hessen, 2 = Deutschland, 3 = Ausland |
wohnen | Aktuelle Wohnsituation | 1 = WG, 2 = bei Eltern, 3 = alleine, 4 = sonstiges |
uni1 - uni4 | In Anspruch genommene Uni-Angebote | 0 = nein, 1 = ja |
Fehlende Werte
Insgesamt liegen im Datensatz 102 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
prok1
prok2
prok3
prok5
prok6
prok7
prok8
prok9
prok10
nr1
nr2
nr4
nr5
nr6
vertr
extra
gewis
neuro
intel
nerd
uni1
uni2
uni3
uni4
Gender, Drug, and Depression (osf
)
Beschreibung
Der Datensatz liegt auf dem Open Science Framework
und stammt aus einer Untersuchung von Jing, Page-Gould & Iankilevitch (2019), die den Effekt einer Drogenabhängigkeit auf das individuelle Depressionslevel einer Person untersucht haben.
Auf pandaR
wird der Datensatz in dem Tutorial Logistische Regression für PsyMSc5a verwendet.
Datensatz laden
library(haven)
osf <- read_sav(file = url("https://osf.io/prc92/download"))
Größe
Der Datensatz besteht aus 55602 Beobachtungen auf 38 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
ANYDUMMY | Drogenabhängigkeit | 0 = nicht vorhanden, 1 = vorhanden |
GENDER_R | Geschlecht | 0 = weiblich, 1 = männlich |
Depression_lvl | Depressionswert | 0 - 9 |
Fehlende Werte
In dem Datensatz liegen 184784 fehlende Werte vor. Auf folgenden der für die Untersuchungen relevanten Variablen liegen keine fehlenden Werte vor:
GENDER_R
Skalenwerte der Generic Conspiracist Beliefs Scale (conspiracy
)
Beschreibung
Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen. Bei dieser Version des Datensatzes wurden die verschiedenen Items bereits zu Skalenwerten zusammengerechnet.
Auf pandaR
wird der Datensatz in den Tutorials ANOVA I und ANOVA II für PsyBSc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/conspiracy.rda"))
Größe
Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
edu | höchster Bildungsabschluss | 1 = not highschool, 2 = highschool, 3 = college |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
gender | Geschlecht | 1 = male, 2 = female, 3 = other |
age | Alter | Freitext |
GM | Government malfeasance | Skalenwert |
MG | Malevolent global conspiracies | Skalenwert |
ET | Extraterrestrial cover-up | Skalenwert |
PW | Personal well-being | Skalenwert |
CI | Control of information | Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Items der Generic Conspiracist Beliefs Scale (conspiracy
)
Beschreibung
Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen.
Auf pandaR
wird der Datensatz in dem Tutorial Konfirmatorische Faktorenanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/conspiracy_cfa.rda"))
Größe
Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
edu | höchster Bildungsabschluss | 1 = not highschool, 2 = highschool, 3 = college |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
gender | Geschlecht | 1 = male, 2 = female, 3 = other |
age | Alter | Freitext |
Variable | Facette | Itemwortlaut |
---|---|---|
Q1 | GM | The government is involved in the murder of innocent citizens and/or well-known public figures, and keeps this a secret |
Q2 | GC | The power held by heads of state is second to that of small unknown groups who really control world politics |
Q3 | EC | Secret organizations communicate with extraterrestrials, but keep this fact from the public |
Q4 | PW | The spread of certain viruses and/or diseases is the result of the deliberate, concealed efforts of some organization |
Q5 | CI | Groups of scientists manipulate, fabricate, or suppress evidence in order to deceive the public |
Q6 | GM | The government permits or perpetrates acts of terrorism on its own soil, disguising its involvement |
Q7 | GC | A small, secret group of people is responsible for making all major world decisions, such as going to war |
Q8 | EC | Evidence of alien contact is being concealed from the public |
Q9 | PW | Technology with mind-control capacities is used on people without their knowledge |
Q10 | CI | New and advanced technology which would harm current industry is being suppressed |
Q11 | GM | The government uses people as patsies to hide its involvement in criminal activity |
Q12 | GC | Certain significant events have been the result of the activity of a small group who secretly manipulate world events |
Q13 | EC | Some UFO sightings and rumors are planned or staged in order to distract the public from real alien contact |
Q14 | PW | Experiments involving new drugs or technologies are routinely carried out on the public without their knowledge or consent |
Q15 | CI | A lot of important information is deliberately concealed from the public out of self-interest |
Fehlende Werte
Im Datensatz liegen 186 fehlende Werte vor. Die folgenden Variablen enthalten keine fehlenden Werte:
edu
age
Q10
Gewissenhaftigkeit und Medikamenteneinnahme (data_combined
)
Beschreibung
Der Datensatz stammt aus dem R
-eigenen Paket metafor
von Viechtbauer (2010) und beinhaltet Variablen, die im Zusammenhang mit Gewissenhaftigkeit und der Einnahme von Medikamenten stehen. Es handelt sich hierbei um eine Meta-Analyse mehrerer Studien:
Molloy, G. J., O’Carroll, R. E., & Ferguson, E. (2014). Conscientiousness and medication adherence: A meta-analysis. Annals of Behavioral Medicine, 47(1), 92–101. https://doi.org/10.1007/s12160-013-9524-4
Auf pandaR
wird der Datensatz in dem Tutorial Metaanalysen in R und Block 4 der Quizze für PsyMSc5a verwendet.
Datensatz laden
library(metafor)
load(url('https://pandar.netlify.app/post/preprocessing/reliabilites.molloy2014.rda'))
Im nächsten Schritt sollte der Datensatz mit den Reliabilitäten und der ursprüngliche Datensatz zusammen gefasst werden. Dafür gibt es einige Möglichkeiten. Hier ist ein Beispiel aufgeführt:
data_combined <- dat.molloy2014
data_combined$rel1 <- reliabilites.molloy2014$RelGewissenhaftigkeit
data_combined$rel2 <- reliabilites.molloy2014$RelCondition
head(data_combined)
Größe
Der Datensatz besteht aus 16 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
authors | Autor:innen der Studie | Skalenwert |
year | Jahr der Veröffentlichung | Jahreszahl |
ni | Stichprobengröße | n |
ri | Korrelationskoeffizient | r |
controls | Kontrollgruppe | none = nicht vorhanden, multiple = mehrere Gruppen vorhanden |
design | Studiendesign | prospective = Prospektive Studie, cross-sectional = Querschnittstudie |
a_measure | Methodik zur Messung der medication adherence (Medikamenteneinnahme) | self-report = Selbstbericht, other = andere |
c_measure | Methodik zur Messung der conscientiousness (Gewissenhaftigkeit) | NEO = NEO-Persönlichkeits-Inventar, other = andere |
meanage | Altersmittelwert der Stichprobe | Arithmetisches Mittel |
quality | Qualitätsindex der Studie | 0 - 4 |
rel1 | Reliabilität Gewissenhaftigkeit | Reliabilitätskoeffizient |
rel2 | Reliabilität Condition | Reliabilitätskoeffizient |
Fehlende Werte
Im Datensatz liegen 4 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
study
treatment
scale
n
diff
se
group
tailored
cog
ba
psed
home
prob
soc
relax
goal
final
mind
act
Internetintervention für psychische Störungen (osf
)
Beschreibung
Der Datensatz liegt auf dem Open Science Framework
und stammt aus einer Untersuchung von Schaeuffele et al. (2020), die den Effekt des Unified Protocol (UP) als Internetintervention für bestimmte psychische Störungen untersucht haben. In der Untersuchung wurden psychopathologische Symptome und therapiebezogene Variablen über einen Zeitraum von 6 Monaten erhoben.
Auf pandaR
wird der Datensatz in den Tutorials ANOVA vs. Regression und ANCOVA und moderierte Regression für PsyMSc5a verwendet.
Datensatz laden
osf <- read.csv(file = url("https://osf.io/zc8ut/download"))
osf <- osf[, c("ID", "group", "stratum", "bsi_post", "swls_post", "pas_post")]
Größe
Der Datensatz besteht aus 129 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
ID | Personenidentifikator | Nummer |
group | Gruppenzugehörigkeit | Treatment = Treatmentgruppe, Waitlist = Wartelistenkontrollgruppe |
stratum | Krankheitsbild | ANX = Angststörung, DEP = Depression, SOM = somatische Belastungsstörung |
bsi_post | Symptomschwere | 0 - 212 |
swls_post | Satisfaction with Life Scale (Lebenszufriedenheit) | 5 - 35 |
pas_post | Panic and Agoraphobia Screening (Panikstörung & Agoraphobie) | 0 - 52 |
Fehlende Werte
In dem Datensatz liegen 96 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
ID
group
stratum
Kooperationsbereitschaft von Geschwistern (dataKooperation
)
Beschreibung
Der Datensatz stammt aus Eid, Gollwitzer & Schmitt: “Statistik und Forschungsmethoden” (4. Auflage, S.370). Es wurde die Kooperationsbereitschaft von verschiedenen Geschwisterteilen innerhalb einer Familie erhoben. Die Paare bestehen hierbei aus beiden Geschwisterteilen, von denen jeweils die Kooperationsbereitschaft gemessen wurde.
Auf pandaR
wird der Datensatz in dem Tutorial Tests für abhängige Stichproben für PsyBsc2 verwendet.
Datensatz laden
dataKooperation <- data.frame(Paar = 1:10, Juenger = c(0.49,0.25,0.51,0.55,0.35,0.54,0.24,0.49,0.38,0.50), Aelter = c(0.4,0.25,0.31,0.44,0.25,0.33,0.26,0.38,0.23,0.35))
Größe
Der Datensatz besteht aus 10 Beobachtungen auf 3 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt |
---|---|
Paar | Nummer des Geschwisterpaares |
Juenger | Kooperationsbereitschaft des jüngeren Geschwisterteils |
Aelter | Kooperationsbereitschaft des älteren Geschwisterteils |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Machiavellismus-Fragebogen (mach
)
Beschreibung
Die hier verwendeten Daten stammen aus dem “Open-Source Psychometrics Project”, einer Online-Plattform, die eine Sammlung an Daten aus verschiedensten Persönlichkeitstests zur Verfügung stellt. Wir haben bereits eine kleine Aufbereitung der Daten durchgeführt, damit wir leichter in die Analysen starten können. Auf der genannten Seite kann man Fragebögen selbst ausfüllen, und so zum Datenpool beitragen. Der hier verwendete Datensatz enthält Items aus einem Machiavellismus-Fragebogen, den Sie bei Interesse hier selbst ausfüllen können. Der Datensatz erhält viele Angaben zur Persönlichkeit und demografischen Daten. Kern ist aber der 20 Items umfassende Machiavellismusfragebogen von Christie und Geis (1970) und daraus ableitbare 4-faktorielle Struktur des Konzepts (Corral & Calvete, 2000). Die Skalenwerte dieser vier Faktoren haben wir bereits im Datensatz angelegt.
Auf pandaR
wird der Datensatz in dem Tutorial Wiederholung von Grundlagen in R und Quiz 1 für PsyBSc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/mach.rda"))
Größe
Der Datensatz besteht aus 65151 Beobachtungen auf 26 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
TIPI1 - TIPI10 | Persönlichkeitseigenschaften | 1 = “Stimme gar nicht zu”, 7 = “Stimme voll und ganz zu” |
education | How much education have you completed? | 1 = Less than High School, 2 = High School, 3 = University degree, 4 = Graduate degree |
urban | What type of area did you live when you were a child? | 1 = Rural (country side), 2 = Suburban, 3 = Urban (city, town) |
gender | What is your gender? | 1 = Male, 2 = Female, 3 = Other |
engnat | Is English your native language? | 1 = Yes, 2 = No |
age | How many years old are you? | Freitext |
hand | What hand do you use to write with? | 1 = Left, 2 = Right, 3 = Both |
religion | What is your religion? | 1 = Agnostic, 2 = Atheist, 3 = Buddhist, 4 = Christian(Catholic), 5 = Christian(Mormon), 6 = Christian(Protestant), 7 = Christian(Other), 8 = Hindu, 9 = Jewish, 10 = Muslim, 11 = Sikh, 12 = Other |
orientation | What is your sexual orientation? | 1 = Heterosexual, 2 = Bisexual, 3 = Homosexual, 4 = Asexual, 5 = Other |
race | What is your race? | 1 = Asian, 2 = Arab, 3 = Black, 4 = Indigenous Australian, 5 = Native American, 6 = White/European, 7 = Other |
voted | Have you voted in a national election in the past year? | 1 = Yes, 2 = No |
married | What is your marital status? | 1 = Never married, 2 = Currently married, 3 = Previously married |
familysize | Including you, how many children did your mother have? | Freitext |
nit | Negative interpersonal tactics | Skalenwert |
pit | Positive interpersonal tactics | Skalenwert |
cvhn | Cynical view of human nature | Skalenwert |
pvhn | Positive view of human nature | Skalenwert |
Fehlende Werte
Insgesamt liegen im Datensatz 19 fehlende Werte vor. Diese liegen ausschließlich auf der Variable familysize
vor. Alle restlichen Variablen enthalten keine fehlenden Werte.
Major Depression (data
)
Beschreibung
Der Datensatz stammt aus einer Erhebung von Epskamp et al. (2018a), welche auf dem Open Science Framework
zu finden ist. Die Daten befassen sich mit einer einzelnen Person. Dabei handelt es sich laut der Autor:innen um eine Person, die sich nach einer Major-Depression-Diagnose in der Behandlung befand. Die Fragen wurden von der teilnehmenden Person 5 Mal am Tag über 14 Tage hinweg ausgefüllt. Es wurden psychopathologische Symptome erfasst und untersucht, wie diese miteinander in Verbindung stehen könnten. Publiziert wurden die Ergebnisse der Studie in folgendem Paper:
Epskamp, S., van Borkulo, C. D., van der Veen, D. C., Servaas, M., Isvoranu, A.-M., Riese, H., & Cramer, A. O. J. (2020, September 21). Personalized Network Modeling in Psychopathology: The Importance of Contemporaneous and Temporal Connections. https://doi.org/10.17605/OSF.IO/C8WJZ
Auf pandaR
wird der Datensatz in dem Tutorial Dynamische Netzwerkanalyse für PsyMSc5a verwendet.
Datensatz laden
data <- read.csv(url("https://osf.io/g6ya4/download"))
Größe
Der Datensatz besteht aus 70 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen. Die untersuchte Person sollte bei jeder der folgenden Symptome angeben, inwiefern sie auf sie zutreffen.
Variable | Inhalt | Kodierung |
---|---|---|
relaxed | entspannt | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
sad | traurig | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
nervous | nervös | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
concentration | konzentriert | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
tired | müde | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
rumination | ruminierend | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
bodily.discomfort | körperlich wohl | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
time | Zeitpunkt der Erfassung | Datum & Uhrzeit |
Fehlende Werte
In dem Datensatz liegen 35 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
time
Mehrdimensionaler Befindlichkeitsfragebogen (mdbf
)
Beschreibung
Beim Datensatz handelt es sich um eine Erhebung, die 2017 an der Freien Universität Berlin durchgeführt wurde. Die Items stammten dabei aus dem Mehrdimensionalen Befindlichkeitsfragebogen von Steyer et al. (1997). In diesem Fragebogen werden Adjektive zur Beschreibung der aktuellen Stimmung genutzt, um die drei Dimensionen der Stimmung - Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig - zu erheben.
Auf pandaR
wird der Datensatz in dem Tutorial Loops und Funktionen für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/mdbf.rda"))
Größe
Der Datensatz besteht aus 98 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Adjektiv | Richtung | Dimension |
---|---|---|---|
stim1 | zufrieden | positiv | Gut vs. Schlecht |
stim2 | ausgeruht | positiv | Wach vs. Müde |
stim3 | ruhelos | negativ | Ruhig vs. Unruhig |
stim4 | schlecht | negativ | Gut vs. Schlecht |
stim5 | schlapp | negativ | Wach vs. Müde |
stim6 | gelassen | positiv | Ruhig vs. Unruhig |
stim7 | müde | negativ | Wach vs. Müde |
stim8 | gut | positiv | Gut vs. Schlecht |
stim9 | unruhig | negativ | Ruhig vs. Unruhig |
stim10 | munter | positiv | Wach vs. Müde |
stim11 | unwohl | negativ | Gut vs. Schlecht |
stim12 | entspannt | positiv | Ruhig vs. Unruhig |
In der Spalte Dimension sehen wir, dass die Items 3 verschiedene Dimensionen abbilden: Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig. Die Items sind dabei unterschiedlich gepolt - die Adjektive “ausgeruht” und “schlapp” erfasst beide die Dimension Wach vs. Müde, jedoch in unterschiedlicher Ausrichtung.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Naturverbundenheit (nature
)
Beschreibung
Der Datensatz behandelt die Naturverbundenheit, welche anhand von 6 Items gemessen wurde. Weiterhin sind Informationen hinsichtlich des Wohnortes vorhanden.
Auf pandaR
wird der Datensatz in dem Quiz 5 für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/nature.rda"))
Größe
Der Datensatz besteht aus 490 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
Q1A - Q6A | Items zur Naturverbundenheit | Skalenwert |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
continent | Kontinent des Wohnortes | 1 = Americas, 2 = Europe |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Lesekompetenz in der PISA-Erhebung (PISA2009
)
Beschreibung
Der Beispieldatensatz enthält Daten zur Lesekompetenz aus der deutschen Stichprobe der PISA-Erhebung in Deutschland 2009. Im Datensatz sind viele Variablen der pädagogischen Forschung enthalten, die im Folgenden erklärt werden.
Auf pandaR
wird der Datensatz in dem Tutorial Regression IV: quadratische und moderierte Regression, Quiz 2 und Quiz 3 für PsyBSc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/PISA2009.rda"))
Größe
Der Datensatz besteht aus 150 Beobachtungen auf 15 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung |
---|---|
Grade | Klassenstufe |
Age | Alter in Jahren |
Female | Geschlecht (0 = m, 1 = w) |
Reading | Lesekompetenz |
JoyRead | Lesefreude |
LearnMins | Lernzeit in Minuten für Deutsch |
HISEI | Sozialstatus (Highest International Socio-Economic Index of occupational status) |
CultPoss | Fragebogen-Score für kulturelle Besitztümer zu Hause (z. B. klassische Literatur, Kunstwerke) |
Books | Anzahl Bücher zu Hause |
TVs | Anzahl Fernseher zu Hause |
Computers | Anzahl Computer zu Hause |
Cars | Anzahl Autos zu Hause |
MigHintergrund | Migrationshintergrund (0 = beide Eltern in D geboren, 1 = min. 1 Elternteil im Ausland geboren) |
FatherEdu | Bildungsabschluss des Vaters (International Standard Classification of Education) |
MotherEdu | Bildungsabschluss der Mutter (International Standard Classification of Education) |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Parental Burnout (burnout
)
Beschreibung
Die Daten stammen vom Open Science Framework
und wurden im Rahmen dieses Papers erhoben:
Blanchard, M. A., Roskam, I., Mikolajczak, M., & Heeren, A. (2021). A network approach to parental burnout. Child Abuse & Neglect, 111, 104826. https://doi.org/10.1016/j.chiabu.2020.104826
In der Untersuchung wurden charakteristische Merkmale von Parental Burnout untersucht und anhand einer Netzwerkanalyse ihre Zusammenhänge untersucht.
Auf pandaR
wird der Datensatz in Block 5b der Quizze für PsyMSc5a verwendet.
Datensatz laden
burnout <- read.csv(file = url("https://osf.io/qev5n/download"))
burnout <- burnout[2:8]
Größe
Der Datensatz besteht aus 1551 Beobachtungen auf 7 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
Exhaust | Emotional exhaustion | 0 - 48 |
Distan | Emotional distancing | 0 - 48 |
Ineffic | Parental accomplishment and efficacy | 0 - 36 |
Neglect | Neglectful behaviors toward children | 17 - 136 |
Violence | Violent behaviors toward children | 15 - 120 |
PartEstrang | Partner Estrangement | 5 - 40 |
PartConfl | Conflicts with partner | 2 - 14 |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Hauptkomponentenanalyse (PCA
)
Beschreibung
Der Beispieldatensatz enthält simulierte Daten zu unbekannten Variablen. Eine abhängige und sechs unabhängige Variablen liegen vor.
Auf pandaR
wird der Datensatz in dem Tutorial Hauptkomponentenanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/PCA.RData"))
Größe
Der Datensatz besteht aus 36 Beobachtungen auf 7 Variablen.
Variablen
Die Namen der Variablen sind nichtssagend, um Untersuchereffekte bei der Analyse auszuschließen.
Variable | Kodierung |
---|---|
x1 | Standardisierter Skalenwert |
x2 | Standardisierter Skalenwert |
x3 | Standardisierter Skalenwert |
x4 | Standardisierter Skalenwert |
x5 | Standardisierter Skalenwert |
x6 | Standardisierter Skalenwert |
y | Standardisierter Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Psychisches Wohlbefinden von Individuen während des Lockdowns in Frankreich (lockdown
)
Beschreibung
Die Daten stammen aus einer Studie zum psychischen Wohlbefinden von Individuen während des pandemie-bedingten Lockdowns in Frankreich. Es handelt sich um hierarchische Daten mit Messzeitpunkten auf Ebene 1 und Individuen auf Ebene 2.
Auf pandaR
wird der Datensatz in dem Tutorial Hierarchische Regression sowie in Block 3 der Quizze für PsyMSc5a verwendet.
Datensatz laden
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ICC)
library(lme4)
library(interactions)
# Daten einlesen und vorbereiten ----
lockdown <- read.csv(url("https://osf.io/dc6me/download"))
# Entfernen der Personen, für die weniger als zwei Messpunkte vorhanden sind
# (Auschluss von Fällen, deren ID nur einmal vorkommt)
lockdown <- lockdown[-which(lockdown$ID %in% names(which(table(lockdown$ID)==1))),]
# Daten aufbereiten, Variablen auswählen extrahieren und in Nummern umwandeln
# Entfernen von Minderjährigen & unbestimmtes Gender mit den Funktionen filter() & select () aus dplyr.
lockdown <- lockdown %>%
filter(Age > 18 & Gender == 1 | Gender == 2) %>%
select(c("ID", "Wave", "Age", "Gender", "Income", "EWB","PWB","SWB",
"IWB","E.threat","H.threat", "Optimism",
"Self.efficacy","Hope","P.Wisdom","ST.Wisdom","Grat.being",
"Grat.world","PD","Acc","Time","EWB.baseline","PWB.baseline",
"SWB.baseline","IWB.baseline"))
# Standardisieren der AVs
lockdown[,c("EWB", "PWB", "SWB", "IWB")] <- scale(lockdown[,c("EWB", "PWB", "SWB", "IWB")])
# Standardisieren möglicher Prädiktoren
lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom",
"ST.Wisdom", "Grat.being", "Grat.world")] <-
scale(lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom",
"ST.Wisdom", "Grat.being", "Grat.world")])
Größe
Der Datensatz besteht aus 2192 Beobachtungen auf 25 Variablen.
Variablen
In diesem Datensatz stehen die Daten eines Messzeitpunktes in je einer Zeile, d.h. die Daten einer Person stehen in mehreren Zeilen (diese Struktur wird oft auch als long format bezeichtet - im Kontrast zum wide format, bei dem die Daten jeder Person in einer Zeile in verschiedenen Variablen stehen). In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
ID | Personenidentifikator | ID |
Wave | Erhebungswelle, zu der die Befragung erfolgt ist | 0 - 5 |
Gender | Geschlecht | 1 = männlich, 2 = weiblich |
Income | Jährliches Einkommen | |
EWB | Emotional Well-Being | standardisierter Skalenwert |
PWB | Psychological Well-Being | standardisierter Skalenwert |
SWB | Social Well-Being | standardisierter Skalenwert |
E.threat | Economic threat | standardisierter Skalenwert |
H.threat | Health threat | standardisierter Skalenwert |
Optimism | Optimismus | standardisierter Skalenwert |
Self.efficacy | Selbstwirksamkeit | standardisierter Skalenwert |
Hope | Hoffnung | standardisierter Skalenwert |
P.Wisdom | Personal Wisdom | standardisierter Skalenwert |
ST.Wisdom | Self-transcendent Wisdom | standardisierter Skalenwert |
Grat.being | Gratitude of Being | standardisierter Skalenwert |
Grat.world | Gratitude toward the World | standardisierter Skalenwert |
PD | Peaceful disengagement | standardisierter Skalenwert |
Acc | Akzeptanz | standardisierter Skalenwert |
Time | Dauer, die sich eine Person zum jeweiligen Zeitpunkt bereits im Lockdown befindet | Zeit in Wochen |
EWB.baseline | Baseline Emotional Well-Being | standardisierter Skalenwert |
PWB.baseline | Baseline Psychological Well-Being | standardisierter Skalenwert |
SWB.baseline | Baseline Social Well-Being | standardisierter Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Kulturelle Unterschiede in Korruptionsbestrafung punish
Beschreibung
Die Daten stammen aus einer kuturellen Unterschieden in der Einschätzung von verschiedenen Aspekten der Bestechung. Die hier genutzten Daten sind ein Auszug aus den im Artikel von Hong-Zhi et al., 2021 für Studie 1 genutzten Daten.
Auf pandaR
wird der Datensatz in dem Tutorial Regression mit nominalskalierten Prädiktoren für PsyBSc7 verwendet.
Datensatz laden
Die Daten können direkt vom OSF heruntergeladen werden. Allerdings werden einige Schritte durchlaufe, um die Daten auf die nötigen Variablen zu reduzieren, welche mit
source("https://pandar.netlify.app/post/Preprocessing/Data_Processing_punish.R")
direkt durchgeführt werden können. Zur Nachvollziehbarkeit, hier noch einmal der Inhalt dieses Skripts:
#### Data preparation file for punishment severity evaluation ----
# for the paper see: https://onlinelibrary.wiley.com/doi/10.1111/ajsp.12509
punish <- foreign::read.spss('https://osf.io/4wypx/download', use.value.labels = TRUE,
to.data.frame = TRUE)
punish <- punish[, c('culture_group', 'bribery_type', 'age', 'gender',
'gains_everage', 'difficulties_everage', 'noticed_probability_everage',
'punishment_probability_everage', 'punishment_severity_everage')]
names(punish) <- c('country', 'bribe', 'age', 'gender', 'gains', 'difficult',
'notice', 'probable', 'severe')
levels(punish$age) <- c(levels(punish$age), 'over 50')
punish$age[punish$age %in% c('51-60', '61-70', 'over 70')] <- 'over 50'
punish$age <- droplevels(punish$age)
Größe
Der Datensatz besteht aus 174 Beobachtungen auf 9 Variablen.
Variablen
Der Datensatz enthält (in reduzierter Fassung) folgende Variablen:
Variable | Inhalt | Kodierung |
---|---|---|
country | Land | 1 = China, 2 = U.S |
bribe | Ebene der beurteilten Bestechungssituation (experimentelle Kondition) | |
age | Alter in vier Kategorien | 1 = 21 - 30, 2 = 31 - 40, 3 = 41 - 50, 4 = over 50 |
gender | Geschlecht | 1 = female, 2 = male |
gains | Gewinn durch Bestechung | Mittelwert über fünf Situationen (1 bis 10) |
difficult | Schwierigkeit in der Umsetzung der Handlung, die durch Bestechung erwirkt werden soll | Mittelwert über fünf Situationen (1 bis 10) |
notice | Wahrscheinlichkeit mit der Bestechung entdeckt wird | Mittelwert über fünf Situationen (1 bis 10) |
probable | Wahrscheinlichkeit mit der es zur Bestrafung kommt | Mittelwert über fünf Situationen (1 bis 10) |
severe | Schweregrad der erwarteten Bestrafung | Mittelwert über fünf Situationen (1 bis 10) |
Bei den Variablen gains
bis severe
handelt es sich um individuelle Einschätzungen, die für fünf verschiedene schriftlich dargestellte Situationen eingeschätzt werden sollten. Hier werden die Mittelwerte über die fünf Situationen genutzt.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Schulleistungen
Beschreibung
Auf pandaR
wird der Datensatz in den Tutorials Partial- & Semipartialkorrelation, Regressionsanalyse I, Regressionsanalyse II und Regressionsanalyse III für PsyBSc7 sowie in den Tutorials Einleitung und Wiederholung und Regression und Ausreißerdiagnostik für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Schulleistungen.rda"))
Größe
Der Datensatz besteht aus 100 Beobachtungen auf 4 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt | Kodierung |
---|---|---|
female | Geschlecht | 0 = Männlich (Nein), 1 = Weiblich (Ja) |
IQ | Intelligenzquotient | IQ-Wert |
reading | Leseleistung | Skalenwert |
math | Matheleistung | Skalenwert |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Therapieerfolg (Therapy
)
Beschreibung
Beim Datensatz handelt es sich um ein fiktives Datenbeispiel mit simulierten Daten, in welchem der Therapieerfolg auf mehreren abhängigen Variablen untersucht werden sollen.
Auf pandaR
wird der Datensatz in den Tutorials Multivariate Varianzanalyse und Diskriminanzanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Therapy.rda"))
Größe
Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt |
---|---|
Lebenszufriedenheit | Skalenwert |
Arbeitsbeanspruchung | Skalenwert |
Depressivität | Skalenwert |
Arbeitszufriedenheit | Skalenwert |
Intervention | 1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung |
Geschlecht | 0 = männlich, 1 = weiblich |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Titanic
Beschreibung
Bei dem Datensatz handelt es sich um ein reales Beispiel des Titanicunglücks, in welchem demografische Variablen der Personen erfasst wurden, die sich 1912 an Bord der Titanic befanden. Er ist öffentlich zugänglich auf Open-Daten-Soft zu finden. Der vollständige Datensatz kann hier angesehen werden.
Auf pandaR
wird der Datensatz in dem Tutorial Logistische Regressionsanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Titanic.rda"))
Größe
Der Datensatz besteht aus 714 Beobachtungen auf 4 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Inhalt |
---|---|
survived | gibt an, ob eine Person das Unglück überlebt hat |
pclass | Klasse, in der die Person reiste (1. bis 3. Klasse) |
sex | Geschlecht der Person (1 = weiblich, 2 = männlich) |
age | Alter der Person |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Traumatische Erlebnisse und psychische Störungen (trauma
)
Beschreibung
Die Daten stammen aus einer echten Untersuchung, deren Datensatz hier im Open Science Framework
abgelegt ist. In dem Datensatz wurde bspw. erhoben, was für potenziell traumatischen Erlebnissen eine Person ausgesetzt war und zu welchem Grad mittels der Live Event Checklist (LEC). Weiterhin wurden die Depressionswerte anhand des Becks-Depression-Inventar (BDI) und die Anxiety-Werte durch die Zung Self-Rating Anxiety Scale (SAS) erhoben. Für unsere Berechnungen brauchen wir nur einen Ausschnitt der Vielzahl an Variablen. Diesen extrahieren wir aus dem originalen Datensatz und erstellen damit einen neuen. Da das Processing in diesem Fall sehr komplex ist, haben wir das für Sie übernommen.
Auf pandaR
wird der Datensatz in Block 2 der Quizze für PsyMSc5a verwendet.
Datensatz laden
source(url("https://pandar.netlify.app/post/Preprocessing/Data_Processing_Quiz1.R"))
Größe
Der Datensatz besteht aus 470 Beobachtungen auf 11 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
Variable | Bedeutung | Kodierung |
---|---|---|
gender | Geschlecht | w = weiblich, m = männlich |
bdi | Depressions-Werte | kumulierte Werte aus BDI |
bdi_group | Gruppierung der BDI-Scores | 1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome |
sas | Anxiety-Werte | kumulierte Werte aus SAS |
sas_group | Gruppierung der SAS-Scores | 1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome |
future | Einstellung gegenüber der Zukunft | Skalenwert: 5-Punkt-Likert-Skala |
past_neg | Skala Past Negative des ZTPI | Skalenwert: 5-Punkt-Likert-Skala |
dissociation | Gesamtwert der Dissociative Experiences Scale | Skalenwert: 11-Punkt-Likert-Skala |
sexual_assault | Erfahrungen mit sexueller Gewalt | 0 = vorhanden, 1 = nicht vorhanden |
trauma_exp_kind | Art des Traumaerlebnisses | 1 = keine Art eines Traumas erlebt, 2 = schwere Krankheiten, 3 = sexuelle Gewalt, 4 = schwere Unfälle, 5 = körperliche Gewalt, 6 = Krieg/Naturkatastrophen |
trauma_exp_form | Form des Traumaerlebnisses | direct experience = als Opfer, indirect experience = als Zeug:in |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.