Courtesy of pxhere

Datensätze

Übersicht über alle verwendeten Datensätze auf pandaR

Auf der folgenden Seite werden alle Datensätze aufgeführt, mit denen in den verschiedenen Tutorials auf pandaR gearbeitet wird. Die Datensätze sind alphabetisch sortiert und können teilweise direkt über diese Seite heruntergeladen werden. Hier eine Übersicht:

BeschreibungDirekter Download
Achtsamkeit und DepressionOSF
Alkoholkonsum von Jugendlichenalc
Arbeitsstress bei Call-Center-Mitarbeiter:innenStressAtWork
Vergleich von BehandlungsformenBehandlungsform
Die Big Five PersönlichkeitsdimensionenBig5
Interozeptive Aufmerksamkeit und GenauigkeitOSF
Bildungsinvestitionen auf der Weltedu_exp
Bullyingprävention bei Jugendlichenfairplayer
Quasi-Experimentelle TherapiestudieCBTdata
DepressivitätDepression
Effektivität der CBT bei DepressionTeil des Pakets metafor
Entwicklung der WeltbevölkerungWorldPopulation
Fragebogendaten aus dem ersten Semesterfb22
Gender, Drug, and DepressionOSF
Skalenwerte der Generic Conspiracist Beliefs Scaleconspiracy
Items der Generic Conspiracist Beliefs Scale)conspiracy_cfa
Gewissenhaftigkeit und MedikamenteneinnahmeTeil des Pakets metafor
Internetintervention für psychische StörungenOSF
Kooperationsbereitschaft von Geschwisternvia Syntax erstellt
Machiavellismus-Fragebogenmach
Major DepressionOSF
Mehrdimensionaler Befindlichkeitsfragebogenmdbf
Mental Health and Social Contact During the COVID-19 PandemicOSF
Naturverbundenheitnature
Lesekompetenz in der PISA-ErhebungPISA2009
Parental BurnoutOSF
HauptkomponentenanalysePCA
Psychisches Wohlbefinden von Individuen während des Lockdowns in FrankreichOSF
Kulturelle Unterschiede in KorruptionsbestrafungOSF
SchulleistungenSchulleistungen
TherapieerfolgTherapy
TitanicTitanic
Traumatische Erlebnisse und psychische StörungenOSF

Achtsamkeit und Depression (raw_data)

Beschreibung

Beim Datensatz stammt von Rubin (2020) und ist auf dem Open Science Framework zu finden. Er beschäftigt sich mit der Untersuchung von Variablen, die den Zusammenhang zwischen Achtsamkeit und Depression mithilfe einer Netzwerkanalyse untersuchen wollen.

Auf pandaR wird der Datensatz in dem Tutorial Netzwerkanalyse im Querschnitt für PsyMSc5a verwendet.

Datensatz laden

raw_data <- readRDS(url("https://osf.io/awz3d/download"))
names(raw_data) <- c("observe", "describe", "awaren.", "nonjudg.",
                     "nonreact.", "interest",  "emotions",  "sleep",
                     "tired",  "appetite", "selfim.",
                     "concentr.", "speed")

Größe

Der Datensatz besteht aus 384 Beobachtungen auf 13 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.

VariableInhaltKodierung
observeWahrnehmen1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend
describeBeschreiben1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend
awaren.Bewusst handeln1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend
nonjudg.Nichturteilen1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend
nonreact.Nichtreagieren1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend
interestInteressensverluststandardisierter Skalenwert
emotionsanhaltende gedrückte Stimmungstandardisierter Skalenwert
sleepSchlaflosigkeitstandardisierter Skalenwert
tiredMüdigkeitstandardisierter Skalenwert
appetiteAppetitstörungstandardisierter Skalenwert
selfim.negatives Selbstbildstandardisierter Skalenwert
concentr.Konzentrationsschwierigkeitenstandardisierter Skalenwert
speedHemmung von Antrieb und Denkenstandardisierter Skalenwert

Die Variablen observe, describe, awareness, nonjudging und nonreactivity bezeichnen die fünf Facetten der Achtsamkeit von Baer et al. (2006). Die 8 weiteren Variablen beschreiben eine dysfunktionale, meist negative Veränderung in dem bezeichneten Lebensaspekt im Zuge einer Depression.

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Alkoholkonsum von Jugendlichen (alc)

Beschreibung

Der Datensatz stammt aus einer Erhebung von Curran, Stice und Chassin (1997) in der der Alkoholkonsum von Jugendlichen längsschnittlich untersucht wurde. Dazu wurde der Selbstbericht über den eigenen Alkoholkonsum mit 14, 15 und 16 Jahren, sowie die Trinkgewohnheiten der Eltern und Peers erfragt. Zusätzlich wurden demografische Variablen erhoben.

Auf pandaR wird der Datensatz in dem Tutorial ANOVA III und Quiz 6 für PsyBsc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/alc.rda"))

Größe

Der Datensatz besteht aus 82 Beobachtungen auf 7 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
idPersonenidentifikatorNummer
maleGeschlecht0 = weiblich, 1 = männlich
peerberichtetes Ausmaß, in dem Peers Alkohol konsumieren0 = keine, 5 = alle
coaKind eines/einer Alkoholiker:in (“child of alcoholic”)0 = nein, 1 = ja
alcuse.14selbstberichtete Häufigkeit, mit der Alkohol im Alter von 14 Jahren konsumiert wird0 = nie, 7 = täglich
alcuse.15selbstberichtete Häufigkeit, mit der Alkohol im Alter von 15 Jahren konsumiert wird0 = nie, 7 = täglich
alcuse.16selbstberichtete Häufigkeit, mit der Alkohol im Alter von 16 Jahren konsumiert wird0 = nie, 7 = täglich

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.

Erweiterung

Für das Quiz ANOVA III in PsyBSc7 wurde der Datensatz nochmal in zwei getrennten Formaten erweitert. Die erweiterten Daten sind simulationsbasiert. Die Daten können mit folgendem Befehl eingeladen werden:

load(url("https://pandar.netlify.app/post/alc_extended.rda"))

Im Environment erscheinen zwei Datensätze. Der Datensatz alc17 hat eine Variable mehr (alcuse.17), während alc18 nochmal 2 weitere zusätzliche Variablen (treat und alcuse.18) hat.

Hier folgt nochmal eine genauere Aufstellung der simulierten Variablen.

VariableBedeutungKodierung
alcuse.17selbstberichtete Häufigkeit, mit der Alkohol im Alter von 17 Jahren konsumiert wird0 = nie, 7 = täglich
treatBehandlung0 = nein, 1 = ja
alcuse.18selbstberichtete Häufigkeit, mit der Alkohol im Alter von 18 Jahren konsumiert wird0 = nie, 7 = täglich

Arbeitsstress bei Call-Center-Mitarbeiter:innen (StressAtWork)

Beschreibung

Der Datensatz ist eine Zusammenstellung aus mehreren Studien der Arbeits- und Organisationspsychologie-Abteilung der Goethe-Universität, in welchem Call-Center-Mitarbeiter:innen untersucht wurden. Der Datensatz enthält das Geschlecht der Proband:innen, sowie ausgewählte Messungen der Variablen Zeitdruck und Arbeitsorganisationale Probleme aus dem Instrument zur stressbezogenen Tätigkeitsanalyse (ISTA) von Semmer, Zapf und Dunckel (1999), Psychosomatische Beschwerden (auch “Befindlichkeit”) aus der Psychosomatischen Beschwerdenliste von Mohr (1986), sowie Messungen zu Subskalen von Burnout: Emotionale Erschöpfung und Leistungserfüllung aus Maslachs Burnout-Inventar (Maslach & Jackson, 1986) in der deutschen Übersetzung von Büssing und Perrar (1992).

Auf pandaR wird der Datensatz in den Tutorials Pfadanalysen und Strukturgleichungsmodelle und Modelle für Gruppenvergleiche für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/StressAtWork.rda"))

Größe

Der Datensatz besteht aus 305 Beobachtungen auf 34 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
sexGeschlecht der Proband:innen1 = weiblich, 2 = männlich
zd1, zd2 & zd6Zeitdruck1 = Trifft nicht zu, 5 = Trifft voll und ganz zu
aop3, aop4 & aop8Arbeitsorganisationale Probleme1 = Trifft nicht zu, 5 = Trifft voll und ganz zu
bf1-bf20Psychosomatische Beschwerden1 = Trifft nicht zu, 5 = Trifft voll und ganz zu
bo1, bo6, b19 & b12Emotionale Erschöpfung1 = Trifft nicht zu, 7 = Trifft voll und ganz zu
bo7, bo8& bo21Leistungserfüllung1 = Trifft nicht zu, 7 = Trifft voll und ganz zu

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Vergleich von Behandlungsformen Behandlungsform

Beschreibung

Der Datensatz enthält Ausprägungen von Patient:innen auf verschiedenen psychotherapeutischen Variablen sowie demografische Informationen. Dabei gibt es zwei kategoriale Variablen: Auf Geschlecht gibt es hier die Ausprägungen männlich und weiblich, während die Therapieform zwischen Kontrollgruppe, KVT und einer Kombination auf KVT und Blended Care unterscheidet. Alle anderen Variablen können als intervallskaliert angenommen werden.

Auf pandaR wird der Datensatz in dem Quiz 5 für PsyBsc7 und in Block 1 der Quizze für PsyMSc5a verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Behandlungsform.rda"))

Größe

Der Datensatz besteht aus 100 Beobachtungen auf 6 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableKodierung
DepressionSkalenwert
Therapeutische_AllianzSkalenwert
GesundheitszustandSkalenwert
Interpersonelle_ProblemeSkalenwert
Therapieform1 = Kontrolle, 2 = KVT, 3 = blended Care KVT
Geschlecht1 = männlich, 2 = weiblich

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Die Big Five Persönlichkeitsdimensionen Big5

Beschreibung

Der Originaldatensatz ist ein Onlinedatensatz, wird seit 2012 erfasst und ist auf openpsychometrics.org als .zip downloadbar. Bisher haben über 19700 Probanden aus der ganzen Welt teilgenommen. Zu jeder der fünf Facetten gibt es 10 Fragen. Der Fragebogen ist auf personality-testing.info einzusehen. Um das Ganze etwas übersichtlicher zu gestalten, betrachten wir einen gekürzten Datensatz. Im Datensatz Big5_EFA.rda befinden sich 15 Items aus dem Big-5 Persönlichkeitsfragebogen. Hier werden von den 10 Items pro Facette jeweils die ersten drei verwendet.

Auf pandaR wird der Datensatz in dem Tutorial Exploratorische Faktorenanalyse für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Big5_EFA.rda"))

Größe

Der Datensatz besteht aus 19711 Beobachtungen auf 19 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen. Die jeweiligen Items sind von 1 bis 5 skaliert.

VariableItemwortlaut
E1“I am the life of the party.”
E2“I don’t talk a lot.”
E3“I feel comfortable around people.”
N1“I get stressed out easily.”
N2“I am relaxed most of the time.”
N3“I worry about things.”
A1“I feel little concern for others.”
A2“I am interested in people.”
A3“I insult people.”
C1“I am always prepared.”
C2“I leave my belongings around.”
C3“I pay attention to details.”
O1“I have a rich vocabulary.”
O2“I have difficulty understanding abstract ideas.”
O3“I have a vivid imagination.”

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Interozeptive Aufmerksamkeit und Genauigkeit body

Beschreibung

Der Datensatz liegt auf dem Open Science Framework und stammt aus einer Untersuchung von Campos, Barbosa Rocha und Barbosa (2022), in der es um die Abgrenzung von interozeptiver (die Wahrnehmung der vegetativen Prozesse des eigenen Körpers) Aufmerksamkeit und Genauigkeit geht.

Auf pandaR wird der Datensatz in dem Tutorial Regression mit nominalskalierten Prädiktoren für PsyBSc7 verwendet.

Datensatz laden

Der Datensatz liegt im OSF im .sav Dateiformat (dem Datenformat in dem SPSS seine Daten abspeichert) vor. Daher müssen die Daten mithilfe einer der vielen verschiedenen Import-Funktionen eingelesen werden. Hier nutzen wir dafür die Funktion read_sav aus dem Paket haven, welches R-Studio primär nutzt, um Daten zu importieren und daher bereits installiert sein sollte.

library(haven)
body <- haven::read_sav(file = url('https://osf.io/43xv5/download'))

Der Datensatz enthält neben den zusammengefassten Skalenwerten auch die einzelnen Items der beiden zentralen Skalen (IAS und BPQ), welche wir für diese Anwendung entfernen, um die Daten etwas übersichtlicher zu gestalten. Wir beschränken uns also auf die ersten 27 Variablen im Datensatz:

body <- body[, 1:27]

Größe

Der eingeschränkte Datensatz besteht aus 134 Beobachtungen auf 27 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
idProbanden-ID
AgeAlterAlter in Jahren
SexGeschlecht0 = weiblich, 1 = männlich
NationalityNationalität0 = andere, 1 = Portugiesisch
PortugueseFirstLanguageMuttersprache0 = andere, 1 = Portugiesisch
EducationCategoricalHöchster Bildungsabschluss0 = kein Abschluss, 1 = Grundschule, 2 = mittlere Reife, 3 = Abitur/High School, 4 = Bachelor, 5 = Master, 6 = Doktorgrad
EducationYearsJahre im Bildungssystem
StudentSchüler*in oder Student*in?0 = nein, 1 = ja
EmployedAngestelltenverhältnis?0 = nein, 1 = ja
UnemployedArbeitslos?0 = nein, 1 = ja
StayAtHomeHausfrau/-mann?0 = nein, 1 = ja
RetiredIm Ruhestand?0 = nein, 1 = ja
OccupationalStatusOtherAnderes Beschäftigungsverhältnis?0 = nein, 1 = ja
UniversityStudentStudent*in?0 = nein, 1 = ja ( fehlerhafte Kopie der Variable Student )
PsychiatricHistoryPsychische Störung in der Vergangenheit?0 = nein, 1 = ja
NeurologicalHistoryNeurologische Störung in der Vergangenheit?0 = nein, 1 = ja
ChronicConditionChronische Krankheiten?0 = nein, 1 = ja
MedicationAktuell Medikamenteneinnahme?0 = nein, 1 = ja
DeviceGerät an dem Fragebogen ausgefüllt wird0 = Computer, 1 = Smartphone, 2 = Tablet, 3 = anderes
IAS_TotalScoreInteroceptive Accuracy ScaleSkalenwert
IAS_TotalScore_RetestInteroceptive Accuracy Scale, 2. ErhebungSkalenwert
BPQ_BodyAwarenessBody Perception Questionnaire, Aufmerksamkeits-DimensionSkalenwert
BPQ_BodyAwareness_RetestBody Perception Questionnaire, Aufmerksamkeits-Dimension, 2. ErhebungSkalenwert
BPQ_AutonomicReactivityBody Perception Questionnaire, Reaktivitäts-DimensionSkalenwert
BPQ_AutonomicReactivity_RetestBody Perception Questionnaire, Reaktivitäts-Dimension, 2. ErhebungSkalenwert
BPQ_Time_RetestZeit um BPQ auszufüllen, 2. Erhebungin Sekunden
IAS_Time_RetestZeit um IAS auszufüllen, 2. Erhebungin Sekunden

Fehlende Werte

In dem Datensatz liegen 92 fehlende Werte vor. Diese sind allesamt auf der fehlerhaft kodierten Variablen UniversityStudent zu finden.


Bildungsinvestitionen auf der Welt (edu_exp)

Beschreibung

Wir benutzen für unsere Interaktion mit ggplot2 öffentlich zugängliche Daten aus verschiedenen Quellen, die dankenswerterweise von Gapminder zusammengetragen werden. Für diesen Abschnitt gucken wir uns dafür mal an, wie viele verschiedene Länder in die Bildung investieren - diese Daten stammen ursprünglich von der Weltbank.

Auf pandaR wird der Datensatz für den DigiGEBF Workshop ggplotting und in dem Tutorial Grafiken mit ggplot2 für PsyBSc7 verwendet.

Datensatz laden

load(url('https://pandar.netlify.com/post/edu_exp.rda'))

Größe

Der Datensatz besteht aus 4137 Beobachtungen auf 12 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhalt
geoLänderkürzel, das zur Identifikation der Länder über verschiedene Datenquellen hinweg genutzt wird
Countryder Ländername im Englischen
WealthWohlstandseinschätzung des Landes, unterteilt in fünf Gruppen
RegionEinteilung der Länder in die vier groben Regionen africa, americas, asia und europe
YearJahreszahl
PopulationBevölkerung
ExpectancyLebenserwartung eines Neugeborenen, sollten die Lebensumstände stabil bleiben
IncomeStetiger Wohlstandsindikator für das Land (GDP pro Person)
PrimaryStaatliche Ausgaben pro Schüler:in in der primären Bildung als Prozent des income (GDP pro Person)
SecondaryStaatliche Ausgaben pro Schüler:in in der sekundären Bildung als Prozent des income (GDP pro Person)
TertiaryStaatliche Ausgaben pro Schüler:in oder Student:in in der tertiären Bildung als Prozent des income (GDP pro Person)
IndexEducation Index des United Nations Development Programme

Fehlende Werte

Insgesamt liegen im Datensatz 8714 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:

  • geo
  • Country
  • Wealth
  • Region
  • Year
  • Population

Bullyingprävention bei Jugendlichen (fairplayer)

Beschreibung

Der Datensatz stammt aus einer Studie von Bull, Schultze & Scheithauer (2009), in der die Effektivität eines Interventionsprogramms zur Bullyingprävention bei Jugendlichen untersucht wurde.

Auf pandaR wird der Datensatz in dem Tutorial Einführung in lavaan für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/fairplayer.rda"))

Größe

Der Datensatz besteht aus 155 Beobachtungen auf 31 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
idPersonenidentifikatorNummerierung
classKlasseZahl
grpInterventionsgruppe1 = CG, 2 = IGS, 3 = IGL
sexGeschlecht1 = weiblich, 2 = männlich
ra1t1-ra1t31. Item zur relationalen Aggression zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
ra2t1-ra2t32. Item zur relationalen Aggression zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
ra3t1-ra3t33. Item zur relationalen Aggression zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
em1t1-em1t31. Item zur Empathie zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
em2t1-em2t32. Item zur Empathie zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
em3t1-em3t33. Item zur Empathie zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
si1t1-si1t31. Item zur Sozialen Intelligenz zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
si2t1-si2t32. Item zur Sozialen Intelligenz zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu
si3t1-si3t33. Item zur Sozialen Intelligenz zu drei Messzeitpunkten1 = trifft nicht zu, 5 = trifft voll und ganz zu

Fehlende Werte

In dem Datensatz liegen 830 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:

  • id

Quasi-Experimentelle Therapiestudie CBTdata

Beschreibung

Beim Datensatz handelt es sich um ein fiktives Datenbeispiel, bei dem Patient:innen, die an einer Depression oder einer Angststörung leiden, entweder mit einer kognitiven Verhaltenstherapie (CBT) behandelt oder in einer Wartekontrollgruppe belassen wurden. Eine zufällige Zuordnung war nicht vollständig möglich, da die Zuordnung von überweisenden Hausarzt-Praxen der Patient:innen mit beeinflusst werden konnte (z.B. durch Geltendmachung einer besonderen Dringlichkeit der Therapie).

Auf pandaR wird der Datensatz in dem Tutorial Schätzung von Kausaleffekten 1 und Schätzung von Kausaleffekten 2 für PsyMSc5a verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/CBTdata.rda"))

Größe

Der Datensatz besteht aus 326 Beobachtungen auf 8 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.

VariableInhaltKodierung
AgeAlterAlter
GenderGeschlechtfemale = weiblich, male = männlich
TreatmentBehandlungsgruppenzugehörigkeitCBT = kognitive Verhaltenstherapie, WL = Wartekontrolle
Disorderpsychische StörungANX = Angststörung, DEP = Depression
BDI_preDepressionswert gemessen mit Beck Depressions-Inventar vor Therapie0 - 63
SWL_preLebenszufriedenheit gemessen mit Satisfaction With Life Screening vor Therapie5 - 35
BDI_postDepressionswert gemessen mit Beck Depressions-Inventar nach Therapie0 - 63
SWL_postLebenszufriedenheit gemessen mit Satisfaction With Life Screening nach Therapie5 - 35

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Depressivität Depression

Beschreibung

Beim Datensatz handelt es sich um fiktive Daten bezüglich Depressionswerten in Beziehung zu einigen weiteren Variablen.

Auf pandaR wird der Datensatz in den Tutorials Einleitung und Wiederholung KliPPs und Multiple Regression und Ausreißerdiagnostik für PsyMSc5a verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Depression.rda"))

Größe

Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableKodierung
Lebenszufriedenheit1 - 10
Episodenanzahl1 - 10
Depressivitaet1 - 10
Neurotizismus1 - 10
Intervention1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung
Geschlecht0 = männlich, 1 = weiblich

Fehlende Werte

In dem Datensatz liegen keine fehlenden Werte vor.


Effektivität der CBT bei Depression (F2F_CBT)

Beschreibung

Der Datensatz ist R-eigenen Paket metafor von Viechtbauer (2010) enthalten und stammt von einer Studie von López-López et al. (2019). Die Autor:innen haben die Effektivität der CBT (cognitive behavioural therapy [kognitive Verhaltenstherapie]) bei Depression untersucht und diese mit verschiedenen Kontrollbedingungen und unterschiedlichen Arten der CBT verglichen.

Auf pandaR wird der Datensatz in dem Tutorial Metaanalysen in R für PsyMSc5a verwendet.

Datensatz laden

library(metafor)
## Loading required package: Matrix
## Loading required package: metadat
## 
## Loading the 'metafor' package (version 3.8-1). For an
## introduction to the package please type: help(metafor)
F2F_CBT <- dat.lopez2019[dat.lopez2019$treatment == "F2F CBT",] # wähle nur Fälle mit F2F CBT

Größe

Der Datensatz besteht aus 71 Beobachtungen auf 23 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
studyverwendete StudieAutor:innen
treatmentverwendete Therapieart oder Kontrollgruppe“F2F CBT” = “Angesicht zu Angesicht”-CBT, “Multimedia CBT” = Online-CBT, “Placebo” = Placebo-Kontrollgruppe, “Wait list” = Wartelistenkontrollgruppe, “Hybrid CBT” = Mischung aus F2F und Multimedia, “No treatment” = klassische Kontrollgruppw, “TAU” = Treatment as Usual [Standardtherapie]
scaleMessinstrument DepressionBDI = Beck’s Depressionsinventar, HAM-24 = Hamilton Rating Scale for Depression-24, PHQ-9 = Patient Health Questionnaire-9, HAM-17 = Hamilton Rating Scale for Depression-17, CES-D = Center for Epidemiologic Studies Depression Scale, BSI = Brief Symptom Inventory, SDS = Sheehan Disability Scale
nStichprobengrößen
diffstandardisierte Differenz zwischen vor und nach der InterventionCohen’s d
seStandardfehler von diffse
groupDummy-Variable0 = Einzeltherapie, 1 = Gruppentherapie
tailoredgibt an, ob die Therapie individuell auf Patient:in zugeschnitten wurde0 = nein, 1 = ja
sessionsAnzahl der TherapiesitzungenAnzahl
lengthdurchschnittliche SitzungslängeLänge
intensityIntensität der TherapieProdukt aus session und length
multiIntervention enthielt Multimedia-Elemente0 = nein, 1 = ja
cogIntervention enthielt kognitive Techniken0 = nein, 1 = ja
baIntervention enthielt behaviorale Aktivierung0 = nein, 1 = ja
psedIntervention enthielt Psychoedukation0 = nein, 1 = ja
homeIntervention enthielt Hausaufgaben0 = nein, 1 = ja
probIntervention enthielt Problemlösen0 = nein, 1 = ja
socIntervention enthielt Training sozialer Kompetenzen0 = nein, 1 = ja
relaxIntervention enthielt Entspannungstechniken0 = nein, 1 = ja
goalIntervention enthielt Zielsetzung0 = nein, 1 = ja
finalIntervention enthielt Abschlussgespräch0 = nein, 1 = ja
mindIntervention enthielt Achtsamkeit0 = nein, 1 = ja
actIntervention enthielt Acceptance and Commitment Therapy0 = nein, 1 = ja

Fehlende Werte

Im Datensatz liegen 20 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:

  • authors
  • year
  • ni
  • ri
  • controls
  • design
  • a_measure
  • c_measure
  • meanage
  • quality

Entwicklung der Weltbevölkerung (WorldPopulation)

Beschreibung

Der Datensatz stammt von Gapminder und enthält Daten zur Entwicklung der Weltbevölkerung. Die Dokumentation des Datensatzes sowie seine Datenquellen sind hier einzusehen: gapminder.org-Dokumentationen.

Auf pandaR wird der Datensatz in dem Tutorial Regression V und dem Zusatzquiz für nichtlineare Regression für PsyBsc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/WorldPopulation.rda"))

Größe

Der Datensatz besteht aus 221 Beobachtungen auf 2 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutung
YearJahreszahl
PopulationWeltbevölkerung

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Fragebogendaten aus dem ersten Semester fb22

Beschreibung

Der Datensatz fb22 besteht aus Daten, die von den Studierenden selbst in den ersten Wochen der Veranstaltung PsyBSc2 erhoben wurden. Hierbei wurden eine Reihe von Variablen via eines Fragebogens auf formr.org erfragt und anschließend zu einem Datensatz zusammengefügt. Die Daten basieren somit auf wahren - anonymisierten - Werten der Studierenden. Der Fragebogen erfasst Daten zur Prokastinationstendenz, Naturverbundenheit, Persönlichkeit (gemessen an den Big5), dem Studium sowie demografische Daten.

Auf pandaR wird der Datensatz in fast allen Tutorials von PsyBsc2 verwendet.

Datensatz laden

load(url('https://pandar.netlify.app/post/fb22.rda'))

Größe

Der Datensatz besteht aus 159 Beobachtungen auf 36 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
prok1 - prok10Items zur Prokrastinationstendenz (Items 2,3,5,7 & 8 sind invertiert)1 = “stimmt nicht”, 4 = “stimmt genau”
nr1 - nr6Items zur Naturverbundenheit1 = “stimme nicht zu”, 5 = “stimme zu”
lzLebenszufriedenheitSkalenwert
extraExtraversionSkalenwert
vertrVerträglichkeitSkalenwert
gewisGewissenhaftigkeitSkalenwert
neuroNeurotizismusSkalenwert
intelIntellektSkalenwert
nerdNerdiness Personality AttributesSkalenwert
grundGründe für das PsychologiestudiumFreitext
fachInteressenfach1 = Allgemeine, 2 = Biologische, 3 = Entwicklung, 4 = Klinische, 5 = Diag./Meth.
zielArbeitsbranche nach Abschluss1 = Wirtschaft, 2 = Therapie, 3 = Forschung, 4 = Andere
lerntypLerntyp1 = alleine, 2 = Gruppe, 3 = Mischtyp
geschlGeschlecht1 = weiblich, 2 = männlich, 3 = anderes
jobNebentätigkeit1 = nein, 2 = ja
ortDerzeitiger Wohnort1 = Frankfurt, 2 = anderer
ort12Wohnort vor 12 Monaten1 = Hessen, 2 = Deutschland, 3 = Ausland
wohnenAktuelle Wohnsituation1 = WG, 2 = bei Eltern, 3 = alleine, 4 = sonstiges
uni1 - uni4In Anspruch genommene Uni-Angebote0 = nein, 1 = ja

Fehlende Werte

Insgesamt liegen im Datensatz 102 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:

  • prok1
  • prok2
  • prok3
  • prok5
  • prok6
  • prok7
  • prok8
  • prok9
  • prok10
  • nr1
  • nr2
  • nr4
  • nr5
  • nr6
  • vertr
  • extra
  • gewis
  • neuro
  • intel
  • nerd
  • uni1
  • uni2
  • uni3
  • uni4

Gender, Drug, and Depression (osf)

Beschreibung

Der Datensatz liegt auf dem Open Science Framework und stammt aus einer Untersuchung von Jing, Page-Gould & Iankilevitch (2019), die den Effekt einer Drogenabhängigkeit auf das individuelle Depressionslevel einer Person untersucht haben.

Auf pandaR wird der Datensatz in dem Tutorial Logistische Regression für PsyMSc5a verwendet.

Datensatz laden

library(haven)
osf <- read_sav(file = url("https://osf.io/prc92/download"))

Größe

Der Datensatz besteht aus 55602 Beobachtungen auf 38 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
ANYDUMMYDrogenabhängigkeit0 = nicht vorhanden, 1 = vorhanden
GENDER_RGeschlecht0 = weiblich, 1 = männlich
Depression_lvlDepressionswert0 - 9

Fehlende Werte

In dem Datensatz liegen 184784 fehlende Werte vor. Auf folgenden der für die Untersuchungen relevanten Variablen liegen keine fehlenden Werte vor:

  • GENDER_R

Skalenwerte der Generic Conspiracist Beliefs Scale (conspiracy)

Beschreibung

Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen. Bei dieser Version des Datensatzes wurden die verschiedenen Items bereits zu Skalenwerten zusammengerechnet.

Auf pandaR wird der Datensatz in den Tutorials ANOVA I und ANOVA II für PsyBSc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/conspiracy.rda"))

Größe

Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
eduhöchster Bildungsabschluss1 = not highschool, 2 = highschool, 3 = college
urbanTyp des Wohnortes1 = rural, 2 = suburban, 3 = urban
genderGeschlecht1 = male, 2 = female, 3 = other
ageAlterFreitext
GMGovernment malfeasanceSkalenwert
MGMalevolent global conspiraciesSkalenwert
ETExtraterrestrial cover-upSkalenwert
PWPersonal well-beingSkalenwert
CIControl of informationSkalenwert

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Items der Generic Conspiracist Beliefs Scale (conspiracy)

Beschreibung

Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen.

Auf pandaR wird der Datensatz in dem Tutorial Konfirmatorische Faktorenanalyse für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/conspiracy_cfa.rda"))

Größe

Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
eduhöchster Bildungsabschluss1 = not highschool, 2 = highschool, 3 = college
urbanTyp des Wohnortes1 = rural, 2 = suburban, 3 = urban
genderGeschlecht1 = male, 2 = female, 3 = other
ageAlterFreitext
VariableFacetteItemwortlaut
Q1GMThe government is involved in the murder of innocent citizens and/or well-known public figures, and keeps this a secret
Q2GCThe power held by heads of state is second to that of small unknown groups who really control world politics
Q3ECSecret organizations communicate with extraterrestrials, but keep this fact from the public
Q4PWThe spread of certain viruses and/or diseases is the result of the deliberate, concealed efforts of some organization
Q5CIGroups of scientists manipulate, fabricate, or suppress evidence in order to deceive the public
Q6GMThe government permits or perpetrates acts of terrorism on its own soil, disguising its involvement
Q7GCA small, secret group of people is responsible for making all major world decisions, such as going to war
Q8ECEvidence of alien contact is being concealed from the public
Q9PWTechnology with mind-control capacities is used on people without their knowledge
Q10CINew and advanced technology which would harm current industry is being suppressed
Q11GMThe government uses people as patsies to hide its involvement in criminal activity
Q12GCCertain significant events have been the result of the activity of a small group who secretly manipulate world events
Q13ECSome UFO sightings and rumors are planned or staged in order to distract the public from real alien contact
Q14PWExperiments involving new drugs or technologies are routinely carried out on the public without their knowledge or consent
Q15CIA lot of important information is deliberately concealed from the public out of self-interest

Fehlende Werte

Im Datensatz liegen 186 fehlende Werte vor. Die folgenden Variablen enthalten keine fehlenden Werte:

  • edu
  • age
  • Q10

Gewissenhaftigkeit und Medikamenteneinnahme (data_combined)

Beschreibung

Der Datensatz stammt aus dem R-eigenen Paket metafor von Viechtbauer (2010) und beinhaltet Variablen, die im Zusammenhang mit Gewissenhaftigkeit und der Einnahme von Medikamenten stehen. Es handelt sich hierbei um eine Meta-Analyse mehrerer Studien:

Molloy, G. J., O’Carroll, R. E., & Ferguson, E. (2014). Conscientiousness and medication adherence: A meta-analysis. Annals of Behavioral Medicine, 47(1), 92–101. https://doi.org/10.1007/s12160-013-9524-4

Auf pandaR wird der Datensatz in dem Tutorial Metaanalysen in R und Block 4 der Quizze für PsyMSc5a verwendet.

Datensatz laden

library(metafor)
load(url('https://pandar.netlify.app/post/preprocessing/reliabilites.molloy2014.rda'))

Im nächsten Schritt sollte der Datensatz mit den Reliabilitäten und der ursprüngliche Datensatz zusammen gefasst werden. Dafür gibt es einige Möglichkeiten. Hier ist ein Beispiel aufgeführt:

data_combined <- dat.molloy2014
data_combined$rel1 <- reliabilites.molloy2014$RelGewissenhaftigkeit
data_combined$rel2 <- reliabilites.molloy2014$RelCondition
head(data_combined)

Größe

Der Datensatz besteht aus 16 Beobachtungen auf 12 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
authorsAutor:innen der StudieSkalenwert
yearJahr der VeröffentlichungJahreszahl
niStichprobengrößen
riKorrelationskoeffizientr
controlsKontrollgruppenone = nicht vorhanden, multiple = mehrere Gruppen vorhanden
designStudiendesignprospective = Prospektive Studie, cross-sectional = Querschnittstudie
a_measureMethodik zur Messung der medication adherence (Medikamenteneinnahme)self-report = Selbstbericht, other = andere
c_measureMethodik zur Messung der conscientiousness (Gewissenhaftigkeit)NEO = NEO-Persönlichkeits-Inventar, other = andere
meanageAltersmittelwert der StichprobeArithmetisches Mittel
qualityQualitätsindex der Studie0 - 4
rel1Reliabilität GewissenhaftigkeitReliabilitätskoeffizient
rel2Reliabilität ConditionReliabilitätskoeffizient

Fehlende Werte

Im Datensatz liegen 4 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:

  • study
  • treatment
  • scale
  • n
  • diff
  • se
  • group
  • tailored
  • cog
  • ba
  • psed
  • home
  • prob
  • soc
  • relax
  • goal
  • final
  • mind
  • act

Internetintervention für psychische Störungen (osf)

Beschreibung

Der Datensatz liegt auf dem Open Science Framework und stammt aus einer Untersuchung von Schaeuffele et al. (2020), die den Effekt des Unified Protocol (UP) als Internetintervention für bestimmte psychische Störungen untersucht haben. In der Untersuchung wurden psychopathologische Symptome und therapiebezogene Variablen über einen Zeitraum von 6 Monaten erhoben.

Auf pandaR wird der Datensatz in den Tutorials ANOVA vs. Regression und ANCOVA und moderierte Regression für PsyMSc5a verwendet.

Datensatz laden

osf <- read.csv(file = url("https://osf.io/zc8ut/download"))
osf <- osf[, c("ID", "group", "stratum", "bsi_post", "swls_post", "pas_post")]

Größe

Der Datensatz besteht aus 129 Beobachtungen auf 6 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
IDPersonenidentifikatorNummer
groupGruppenzugehörigkeitTreatment = Treatmentgruppe, Waitlist = Wartelistenkontrollgruppe
stratumKrankheitsbildANX = Angststörung, DEP = Depression, SOM = somatische Belastungsstörung
bsi_postSymptomschwere0 - 212
swls_postSatisfaction with Life Scale (Lebenszufriedenheit)5 - 35
pas_postPanic and Agoraphobia Screening (Panikstörung & Agoraphobie)0 - 52

Fehlende Werte

In dem Datensatz liegen 96 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:

  • ID
  • group
  • stratum

Kooperationsbereitschaft von Geschwistern (dataKooperation)

Beschreibung

Der Datensatz stammt aus Eid, Gollwitzer & Schmitt: “Statistik und Forschungsmethoden” (4. Auflage, S.370). Es wurde die Kooperationsbereitschaft von verschiedenen Geschwisterteilen innerhalb einer Familie erhoben. Die Paare bestehen hierbei aus beiden Geschwisterteilen, von denen jeweils die Kooperationsbereitschaft gemessen wurde.

Auf pandaR wird der Datensatz in dem Tutorial Tests für abhängige Stichproben für PsyBsc2 verwendet.

Datensatz laden

dataKooperation <- data.frame(Paar = 1:10, Juenger = c(0.49,0.25,0.51,0.55,0.35,0.54,0.24,0.49,0.38,0.50), Aelter = c(0.4,0.25,0.31,0.44,0.25,0.33,0.26,0.38,0.23,0.35))

Größe

Der Datensatz besteht aus 10 Beobachtungen auf 3 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhalt
PaarNummer des Geschwisterpaares
JuengerKooperationsbereitschaft des jüngeren Geschwisterteils
AelterKooperationsbereitschaft des älteren Geschwisterteils

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Machiavellismus-Fragebogen (mach)

Beschreibung

Die hier verwendeten Daten stammen aus dem “Open-Source Psychometrics Project”, einer Online-Plattform, die eine Sammlung an Daten aus verschiedensten Persönlichkeitstests zur Verfügung stellt. Wir haben bereits eine kleine Aufbereitung der Daten durchgeführt, damit wir leichter in die Analysen starten können. Auf der genannten Seite kann man Fragebögen selbst ausfüllen, und so zum Datenpool beitragen. Der hier verwendete Datensatz enthält Items aus einem Machiavellismus-Fragebogen, den Sie bei Interesse hier selbst ausfüllen können. Der Datensatz erhält viele Angaben zur Persönlichkeit und demografischen Daten. Kern ist aber der 20 Items umfassende Machiavellismusfragebogen von Christie und Geis (1970) und daraus ableitbare 4-faktorielle Struktur des Konzepts (Corral & Calvete, 2000). Die Skalenwerte dieser vier Faktoren haben wir bereits im Datensatz angelegt.

Auf pandaR wird der Datensatz in dem Tutorial Wiederholung von Grundlagen in R und Quiz 1 für PsyBSc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/mach.rda"))

Größe

Der Datensatz besteht aus 65151 Beobachtungen auf 26 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
TIPI1 - TIPI10Persönlichkeitseigenschaften1 = “Stimme gar nicht zu”, 7 = “Stimme voll und ganz zu”
educationHow much education have you completed?1 = Less than High School, 2 = High School, 3 = University degree, 4 = Graduate degree
urbanWhat type of area did you live when you were a child?1 = Rural (country side), 2 = Suburban, 3 = Urban (city, town)
genderWhat is your gender?1 = Male, 2 = Female, 3 = Other
engnatIs English your native language?1 = Yes, 2 = No
ageHow many years old are you?Freitext
handWhat hand do you use to write with?1 = Left, 2 = Right, 3 = Both
religionWhat is your religion?1 = Agnostic, 2 = Atheist, 3 = Buddhist, 4 = Christian(Catholic), 5 = Christian(Mormon), 6 = Christian(Protestant), 7 = Christian(Other), 8 = Hindu, 9 = Jewish, 10 = Muslim, 11 = Sikh, 12 = Other
orientationWhat is your sexual orientation?1 = Heterosexual, 2 = Bisexual, 3 = Homosexual, 4 = Asexual, 5 = Other
raceWhat is your race?1 = Asian, 2 = Arab, 3 = Black, 4 = Indigenous Australian, 5 = Native American, 6 = White/European, 7 = Other
votedHave you voted in a national election in the past year?1 = Yes, 2 = No
marriedWhat is your marital status?1 = Never married, 2 = Currently married, 3 = Previously married
familysizeIncluding you, how many children did your mother have?Freitext
nitNegative interpersonal tacticsSkalenwert
pitPositive interpersonal tacticsSkalenwert
cvhnCynical view of human natureSkalenwert
pvhnPositive view of human natureSkalenwert

Fehlende Werte

Insgesamt liegen im Datensatz 19 fehlende Werte vor. Diese liegen ausschließlich auf der Variable familysize vor. Alle restlichen Variablen enthalten keine fehlenden Werte.


Major Depression (data)

Beschreibung

Der Datensatz stammt aus einer Erhebung von Epskamp et al. (2018a), welche auf dem Open Science Framework zu finden ist. Die Daten befassen sich mit einer einzelnen Person. Dabei handelt es sich laut der Autor:innen um eine Person, die sich nach einer Major-Depression-Diagnose in der Behandlung befand. Die Fragen wurden von der teilnehmenden Person 5 Mal am Tag über 14 Tage hinweg ausgefüllt. Es wurden psychopathologische Symptome erfasst und untersucht, wie diese miteinander in Verbindung stehen könnten. Publiziert wurden die Ergebnisse der Studie in folgendem Paper:

Epskamp, S., van Borkulo, C. D., van der Veen, D. C., Servaas, M., Isvoranu, A.-M., Riese, H., & Cramer, A. O. J. (2020, September 21). Personalized Network Modeling in Psychopathology: The Importance of Contemporaneous and Temporal Connections. https://doi.org/10.17605/OSF.IO/C8WJZ

Auf pandaR wird der Datensatz in dem Tutorial Dynamische Netzwerkanalyse für PsyMSc5a verwendet.

Datensatz laden

data <- read.csv(url("https://osf.io/g6ya4/download"))

Größe

Der Datensatz besteht aus 70 Beobachtungen auf 8 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen. Die untersuchte Person sollte bei jeder der folgenden Symptome angeben, inwiefern sie auf sie zutreffen.

VariableInhaltKodierung
relaxedentspannt1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
sadtraurig1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
nervousnervös1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
concentrationkonzentriert1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
tiredmüde1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
ruminationruminierend1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
bodily.discomfortkörperlich wohl1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu
timeZeitpunkt der ErfassungDatum & Uhrzeit

Fehlende Werte

In dem Datensatz liegen 35 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:

  • time

Mehrdimensionaler Befindlichkeitsfragebogen (mdbf)

Beschreibung

Beim Datensatz handelt es sich um eine Erhebung, die 2017 an der Freien Universität Berlin durchgeführt wurde. Die Items stammten dabei aus dem Mehrdimensionalen Befindlichkeitsfragebogen von Steyer et al. (1997). In diesem Fragebogen werden Adjektive zur Beschreibung der aktuellen Stimmung genutzt, um die drei Dimensionen der Stimmung - Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig - zu erheben.

Auf pandaR wird der Datensatz in dem Tutorial Loops und Funktionen für PsyBsc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/mdbf.rda"))

Größe

Der Datensatz besteht aus 98 Beobachtungen auf 12 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableAdjektivRichtungDimension
stim1zufriedenpositivGut vs. Schlecht
stim2ausgeruhtpositivWach vs. Müde
stim3ruhelosnegativRuhig vs. Unruhig
stim4schlechtnegativGut vs. Schlecht
stim5schlappnegativWach vs. Müde
stim6gelassenpositivRuhig vs. Unruhig
stim7müdenegativWach vs. Müde
stim8gutpositivGut vs. Schlecht
stim9unruhignegativRuhig vs. Unruhig
stim10munterpositivWach vs. Müde
stim11unwohlnegativGut vs. Schlecht
stim12entspanntpositivRuhig vs. Unruhig

In der Spalte Dimension sehen wir, dass die Items 3 verschiedene Dimensionen abbilden: Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig. Die Items sind dabei unterschiedlich gepolt - die Adjektive “ausgeruht” und “schlapp” erfasst beide die Dimension Wach vs. Müde, jedoch in unterschiedlicher Ausrichtung.

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Mental Health and Social Contact During the COVID-19 Pandemic (data)

Beschreibung

Beim Datensatz handelt es sich um längsschnittliche Daten bezüglich psychischer Gesundheit und sozialer Kontakte während der COVID-19-Pandemie. Die Datensatzaufbereitung (Fallreduktion, Detrending, Variablenauswahl, etc.) haben wir bereits für Sie erledigt. Die Daten wurden ursprünglich im Rahmen folgenden Papers erhoben und sind auf dem Open Science Framework zu finden:

Fried, E. I., Papanikolaou, F., & Epskamp, S. (2021). Mental Health and Social Contact During the COVID-19 Pandemic: An Ecological Momentary Assessment Study. Clinical Psychological Science. https://doi.org/10.1177/21677026211017839

Auf pandaR wird der Datensatz Block 5b der Quizze für PsyMSc5a verwendet.

Datensatz laden

source(url("https://pandar.netlify.app/post/Preprocessing/Data_Processing_Quiz4b.R"))

Sie erhalten einmal den Datensatz data und eine Aufzählung aller Variablen, die Knoten im Netzwerk sein sollen, mit rel_vars.

Größe

Der Datensatz besteht aus 70 Beobachtungen auf 8 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
idPersonenidentifikator10
RelaxI found it difficult to relax1 - 5
IrritableI felt (very) irritable1 - 5
WorryI was worried about different things1 - 5
NervousI felt nervours, anxious, or on edge1 - 5
FutureI felt that I had nothing to look forward1 - 5
AnhedoniaI couldn’t seem to experience any positive feeling at all1 - 5
TiredI felt tired1 - 5
AloneI felt like I lack companionship, or that I am not close to people1 - 5
Social_offlineI spent __ on meaningful, offline, social interaction1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
Social_onlineI spent __ using social media to kill/pass the time1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
OutdoorsI spent __ outside (outdoors)1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
C19_occupiedI spent __ occupied with the coronavirus (e.g. watching news, thinking about it, talking to friends about it)1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
C19_worryI spent __ thinking about my own health or that of my close friends and family members regarding the coronavirus1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
HomeI spent __ at home (including the home of parents/partner)1 = 0 min, 2 = 1-15 min, 3 = 15-60 min, 4 = 1-2 hr, 5 = >2 hr
dayI was worried about different thingsTageszahl
beepBenachrichtigung am jeweiligen Tag0 - 3

Fehlende Werte

Im Datensatz liegen 42 fehlende Werte vor. Die folgenden Variablen enthalten keine fehlenden Werte:

  • id
  • day
  • beep
  • conc

Naturverbundenheit (nature)

Beschreibung

Der Datensatz behandelt die Naturverbundenheit, welche anhand von 6 Items gemessen wurde. Weiterhin sind Informationen hinsichtlich des Wohnortes vorhanden.

Auf pandaR wird der Datensatz in dem Quiz 5 für PsyBsc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/nature.rda"))

Größe

Der Datensatz besteht aus 490 Beobachtungen auf 8 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
Q1A - Q6AItems zur NaturverbundenheitSkalenwert
urbanTyp des Wohnortes1 = rural, 2 = suburban, 3 = urban
continentKontinent des Wohnortes1 = Americas, 2 = Europe

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Lesekompetenz in der PISA-Erhebung (PISA2009)

Beschreibung

Der Beispieldatensatz enthält Daten zur Lesekompetenz aus der deutschen Stichprobe der PISA-Erhebung in Deutschland 2009. Im Datensatz sind viele Variablen der pädagogischen Forschung enthalten, die im Folgenden erklärt werden.

Auf pandaR wird der Datensatz in dem Tutorial Regression IV: quadratische und moderierte Regression, Quiz 2 und Quiz 3 für PsyBSc7 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/PISA2009.rda"))

Größe

Der Datensatz besteht aus 150 Beobachtungen auf 15 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutung
GradeKlassenstufe
AgeAlter in Jahren
FemaleGeschlecht (0 = m, 1 = w)
ReadingLesekompetenz
JoyReadLesefreude
LearnMinsLernzeit in Minuten für Deutsch
HISEISozialstatus (Highest International Socio-Economic Index of occupational status)
CultPossFragebogen-Score für kulturelle Besitztümer zu Hause (z. B. klassische Literatur, Kunstwerke)
BooksAnzahl Bücher zu Hause
TVsAnzahl Fernseher zu Hause
ComputersAnzahl Computer zu Hause
CarsAnzahl Autos zu Hause
MigHintergrundMigrationshintergrund (0 = beide Eltern in D geboren, 1 = min. 1 Elternteil im Ausland geboren)
FatherEduBildungsabschluss des Vaters (International Standard Classification of Education)
MotherEduBildungsabschluss der Mutter (International Standard Classification of Education)

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Parental Burnout (burnout)

Beschreibung

Die Daten stammen vom Open Science Framework und wurden im Rahmen dieses Papers erhoben:

Blanchard, M. A., Roskam, I., Mikolajczak, M., & Heeren, A. (2021). A network approach to parental burnout. Child Abuse & Neglect, 111, 104826. https://doi.org/10.1016/j.chiabu.2020.104826

In der Untersuchung wurden charakteristische Merkmale von Parental Burnout untersucht und anhand einer Netzwerkanalyse ihre Zusammenhänge untersucht.

Auf pandaR wird der Datensatz in Block 5b der Quizze für PsyMSc5a verwendet.

Datensatz laden

burnout <- read.csv(file = url("https://osf.io/qev5n/download"))
burnout <- burnout[2:8]

Größe

Der Datensatz besteht aus 1551 Beobachtungen auf 7 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
ExhaustEmotional exhaustion0 - 48
DistanEmotional distancing0 - 48
InefficParental accomplishment and efficacy0 - 36
NeglectNeglectful behaviors toward children17 - 136
ViolenceViolent behaviors toward children15 - 120
PartEstrangPartner Estrangement5 - 40
PartConflConflicts with partner2 - 14

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Hauptkomponentenanalyse (PCA)

Beschreibung

Der Beispieldatensatz enthält simulierte Daten zu unbekannten Variablen. Eine abhängige und sechs unabhängige Variablen liegen vor.

Auf pandaR wird der Datensatz in dem Tutorial Hauptkomponentenanalyse für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/PCA.RData"))

Größe

Der Datensatz besteht aus 36 Beobachtungen auf 7 Variablen.

Variablen

Die Namen der Variablen sind nichtssagend, um Untersuchereffekte bei der Analyse auszuschließen.

VariableKodierung
x1Standardisierter Skalenwert
x2Standardisierter Skalenwert
x3Standardisierter Skalenwert
x4Standardisierter Skalenwert
x5Standardisierter Skalenwert
x6Standardisierter Skalenwert
yStandardisierter Skalenwert

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Psychisches Wohlbefinden von Individuen während des Lockdowns in Frankreich (lockdown)

Beschreibung

Die Daten stammen aus einer Studie zum psychischen Wohlbefinden von Individuen während des pandemie-bedingten Lockdowns in Frankreich. Es handelt sich um hierarchische Daten mit Messzeitpunkten auf Ebene 1 und Individuen auf Ebene 2.

Auf pandaR wird der Datensatz in dem Tutorial Hierarchische Regression sowie in Block 3 der Quizze für PsyMSc5a verwendet.

Datensatz laden

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ICC)
library(lme4)
library(interactions)
# Daten einlesen und vorbereiten ----
lockdown <- read.csv(url("https://osf.io/dc6me/download"))

# Entfernen der Personen, für die weniger als zwei Messpunkte vorhanden sind
# (Auschluss von Fällen, deren ID nur einmal vorkommt)
lockdown <- lockdown[-which(lockdown$ID %in% names(which(table(lockdown$ID)==1))),] 

# Daten aufbereiten, Variablen auswählen extrahieren und in Nummern umwandeln
# Entfernen von Minderjährigen & unbestimmtes Gender mit den Funktionen filter() & select () aus dplyr.
lockdown <- lockdown %>%
  filter(Age > 18 & Gender == 1 | Gender == 2) %>%
  select(c("ID", "Wave", "Age", "Gender", "Income", "EWB","PWB","SWB",
           "IWB","E.threat","H.threat", "Optimism",
           "Self.efficacy","Hope","P.Wisdom","ST.Wisdom","Grat.being",
           "Grat.world","PD","Acc","Time","EWB.baseline","PWB.baseline",
           "SWB.baseline","IWB.baseline"))

# Standardisieren der AVs
lockdown[,c("EWB", "PWB", "SWB", "IWB")] <- scale(lockdown[,c("EWB", "PWB", "SWB", "IWB")])
# Standardisieren möglicher Prädiktoren
lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom", 
            "ST.Wisdom", "Grat.being", "Grat.world")] <-
  scale(lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom", 
            "ST.Wisdom", "Grat.being", "Grat.world")])

Größe

Der Datensatz besteht aus 2192 Beobachtungen auf 25 Variablen.

Variablen

In diesem Datensatz stehen die Daten eines Messzeitpunktes in je einer Zeile, d.h. die Daten einer Person stehen in mehreren Zeilen (diese Struktur wird oft auch als long format bezeichtet - im Kontrast zum wide format, bei dem die Daten jeder Person in einer Zeile in verschiedenen Variablen stehen). In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
IDPersonenidentifikatorID
WaveErhebungswelle, zu der die Befragung erfolgt ist0 - 5
GenderGeschlecht1 = männlich, 2 = weiblich
IncomeJährliches Einkommen
EWBEmotional Well-Beingstandardisierter Skalenwert
PWBPsychological Well-Beingstandardisierter Skalenwert
SWBSocial Well-Beingstandardisierter Skalenwert
E.threatEconomic threatstandardisierter Skalenwert
H.threatHealth threatstandardisierter Skalenwert
OptimismOptimismusstandardisierter Skalenwert
Self.efficacySelbstwirksamkeitstandardisierter Skalenwert
HopeHoffnungstandardisierter Skalenwert
P.WisdomPersonal Wisdomstandardisierter Skalenwert
ST.WisdomSelf-transcendent Wisdomstandardisierter Skalenwert
Grat.beingGratitude of Beingstandardisierter Skalenwert
Grat.worldGratitude toward the Worldstandardisierter Skalenwert
PDPeaceful disengagementstandardisierter Skalenwert
AccAkzeptanzstandardisierter Skalenwert
TimeDauer, die sich eine Person zum jeweiligen Zeitpunkt bereits im Lockdown befindetZeit in Wochen
EWB.baselineBaseline Emotional Well-Beingstandardisierter Skalenwert
PWB.baselineBaseline Psychological Well-Beingstandardisierter Skalenwert
SWB.baselineBaseline Social Well-Beingstandardisierter Skalenwert

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Kulturelle Unterschiede in Korruptionsbestrafung punish

Beschreibung

Die Daten stammen aus einer kuturellen Unterschieden in der Einschätzung von verschiedenen Aspekten der Bestechung. Die hier genutzten Daten sind ein Auszug aus den im Artikel von Hong-Zhi et al., 2021 für Studie 1 genutzten Daten.

Auf pandaR wird der Datensatz in dem Tutorial Regression mit nominalskalierten Prädiktoren für PsyBSc7 verwendet.

Datensatz laden

Die Daten können direkt vom OSF heruntergeladen werden. Allerdings werden einige Schritte durchlaufe, um die Daten auf die nötigen Variablen zu reduzieren, welche mit

source("https://pandar.netlify.app/post/Preprocessing/Data_Processing_punish.R")

direkt durchgeführt werden können. Zur Nachvollziehbarkeit, hier noch einmal der Inhalt dieses Skripts:

#### Data preparation file for punishment severity evaluation ----
# for the paper see: https://onlinelibrary.wiley.com/doi/10.1111/ajsp.12509

punish <- foreign::read.spss('https://osf.io/4wypx/download', use.value.labels = TRUE,
  to.data.frame = TRUE)

punish <- punish[, c('culture_group', 'bribery_type', 'age', 'gender',
  'gains_everage', 'difficulties_everage', 'noticed_probability_everage',
  'punishment_probability_everage', 'punishment_severity_everage')]
names(punish) <- c('country', 'bribe', 'age', 'gender', 'gains', 'difficult', 
  'notice', 'probable', 'severe')

levels(punish$age) <- c(levels(punish$age), 'over 50')
punish$age[punish$age %in% c('51-60', '61-70', 'over 70')] <- 'over 50'
punish$age <- droplevels(punish$age)

Größe

Der Datensatz besteht aus 174 Beobachtungen auf 9 Variablen.

Variablen

Der Datensatz enthält (in reduzierter Fassung) folgende Variablen:

VariableInhaltKodierung
countryLand1 = China, 2 = U.S
bribeEbene der beurteilten Bestechungssituation (experimentelle Kondition)
ageAlter in vier Kategorien1 = 21 - 30, 2 = 31 - 40, 3 = 41 - 50, 4 = over 50
genderGeschlecht1 = female, 2 = male
gainsGewinn durch BestechungMittelwert über fünf Situationen (1 bis 10)
difficultSchwierigkeit in der Umsetzung der Handlung, die durch Bestechung erwirkt werden sollMittelwert über fünf Situationen (1 bis 10)
noticeWahrscheinlichkeit mit der Bestechung entdeckt wirdMittelwert über fünf Situationen (1 bis 10)
probableWahrscheinlichkeit mit der es zur Bestrafung kommtMittelwert über fünf Situationen (1 bis 10)
severeSchweregrad der erwarteten BestrafungMittelwert über fünf Situationen (1 bis 10)

Bei den Variablen gains bis severe handelt es sich um individuelle Einschätzungen, die für fünf verschiedene schriftlich dargestellte Situationen eingeschätzt werden sollten. Hier werden die Mittelwerte über die fünf Situationen genutzt.

Fehlende Werte

Im Datensatz liegen keine fehlenden Werte vor.


Schulleistungen

Beschreibung

Auf pandaR wird der Datensatz in den Tutorials Partial- & Semipartialkorrelation, Regressionsanalyse I, Regressionsanalyse II und Regressionsanalyse III für PsyBSc7 sowie in den Tutorials Einleitung und Wiederholung und Regression und Ausreißerdiagnostik für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Schulleistungen.rda"))

Größe

Der Datensatz besteht aus 100 Beobachtungen auf 4 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhaltKodierung
femaleGeschlecht0 = Männlich (Nein), 1 = Weiblich (Ja)
IQIntelligenzquotientIQ-Wert
readingLeseleistungSkalenwert
mathMatheleistungSkalenwert

Fehlende Werte

In dem Datensatz liegen keine fehlenden Werte vor.


Therapieerfolg (Therapy)

Beschreibung

Beim Datensatz handelt es sich um ein fiktives Datenbeispiel mit simulierten Daten, in welchem der Therapieerfolg auf mehreren abhängigen Variablen untersucht werden sollen.

Auf pandaR wird der Datensatz in den Tutorials Multivariate Varianzanalyse und Diskriminanzanalyse für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Therapy.rda"))

Größe

Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhalt
LebenszufriedenheitSkalenwert
ArbeitsbeanspruchungSkalenwert
DepressivitätSkalenwert
ArbeitszufriedenheitSkalenwert
Intervention1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung
Geschlecht0 = männlich, 1 = weiblich

Fehlende Werte

In dem Datensatz liegen keine fehlenden Werte vor.


Titanic

Beschreibung

Bei dem Datensatz handelt es sich um ein reales Beispiel des Titanicunglücks, in welchem demografische Variablen der Personen erfasst wurden, die sich 1912 an Bord der Titanic befanden. Er ist öffentlich zugänglich auf Open-Daten-Soft zu finden. Der vollständige Datensatz kann hier angesehen werden.

Auf pandaR wird der Datensatz in dem Tutorial Logistische Regressionsanalyse für PsyMSc1 verwendet.

Datensatz laden

load(url("https://pandar.netlify.app/post/Titanic.rda"))

Größe

Der Datensatz besteht aus 714 Beobachtungen auf 4 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableInhalt
survivedgibt an, ob eine Person das Unglück überlebt hat
pclassKlasse, in der die Person reiste (1. bis 3. Klasse)
sexGeschlecht der Person (1 = weiblich, 2 = männlich)
ageAlter der Person

Fehlende Werte

In dem Datensatz liegen keine fehlenden Werte vor.


Traumatische Erlebnisse und psychische Störungen (trauma)

Beschreibung

Die Daten stammen aus einer echten Untersuchung, deren Datensatz hier im Open Science Framework abgelegt ist. In dem Datensatz wurde bspw. erhoben, was für potenziell traumatischen Erlebnissen eine Person ausgesetzt war und zu welchem Grad mittels der Live Event Checklist (LEC). Weiterhin wurden die Depressionswerte anhand des Becks-Depression-Inventar (BDI) und die Anxiety-Werte durch die Zung Self-Rating Anxiety Scale (SAS) erhoben. Für unsere Berechnungen brauchen wir nur einen Ausschnitt der Vielzahl an Variablen. Diesen extrahieren wir aus dem originalen Datensatz und erstellen damit einen neuen. Da das Processing in diesem Fall sehr komplex ist, haben wir das für Sie übernommen.

Auf pandaR wird der Datensatz in Block 2 der Quizze für PsyMSc5a verwendet.

Datensatz laden

source(url("https://pandar.netlify.app/post/Preprocessing/Data_Processing_Quiz1.R"))

Größe

Der Datensatz besteht aus 470 Beobachtungen auf 11 Variablen.

Variablen

In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.

VariableBedeutungKodierung
genderGeschlechtw = weiblich, m = männlich
bdiDepressions-Wertekumulierte Werte aus BDI
bdi_groupGruppierung der BDI-Scores1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome
sasAnxiety-Wertekumulierte Werte aus SAS
sas_groupGruppierung der SAS-Scores1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome
futureEinstellung gegenüber der ZukunftSkalenwert: 5-Punkt-Likert-Skala
past_negSkala Past Negative des ZTPISkalenwert: 5-Punkt-Likert-Skala
dissociationGesamtwert der Dissociative Experiences ScaleSkalenwert: 11-Punkt-Likert-Skala
sexual_assaultErfahrungen mit sexueller Gewalt0 = vorhanden, 1 = nicht vorhanden
trauma_exp_kindArt des Traumaerlebnisses1 = keine Art eines Traumas erlebt, 2 = schwere Krankheiten, 3 = sexuelle Gewalt, 4 = schwere Unfälle, 5 = körperliche Gewalt, 6 = Krieg/Naturkatastrophen
trauma_exp_formForm des Traumaerlebnissesdirect experience = als Opfer, indirect experience = als Zeug:in

Fehlende Werte

In dem Datensatz liegen keine fehlenden Werte vor.

Hasti Rouchi
Projekte

Ähnliches