Regression - Aufgaben
Vorbereitung
Laden Sie zunächst den Datensatz fb22
von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen.
Prüfen Sie zur Sicherheit, ob alles funktioniert hat:
dim(fb22)
## [1] 159 47
str(fb22)
## 'data.frame': 159 obs. of 47 variables:
## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 ...
## $ prok2 : int 3 3 3 3 1 4 2 1 3 3 ...
## $ prok3 : int 4 2 2 4 4 2 3 2 2 2 ...
## $ prok4 : int 2 4 4 NA 3 2 2 3 3 4 ...
## $ prok5 : int 3 1 2 4 2 3 3 3 4 2 ...
## $ prok6 : int 4 4 4 3 1 2 2 3 2 4 ...
## $ prok7 : int 3 2 2 4 2 3 3 3 3 3 ...
## $ prok8 : int 3 4 3 4 4 2 3 3 4 2 ...
## $ prok9 : int 1 4 4 2 1 1 2 2 3 4 ...
## $ prok10 : int 3 4 3 2 1 3 1 4 1 4 ...
## $ nr1 : int 1 1 4 2 1 1 1 5 2 1 ...
## $ nr2 : int 3 2 5 4 5 4 3 5 4 4 ...
## $ nr3 : int 5 1 5 4 1 3 3 5 5 4 ...
## $ nr4 : int 4 2 5 4 2 4 4 5 3 5 ...
## $ nr5 : int 4 2 5 4 2 3 4 5 4 4 ...
## $ nr6 : int 3 1 5 3 2 1 1 5 2 4 ...
## $ lz : num 5.4 6 3 6 3.2 5.8 4.2 NA 5.4 4.6 ...
## $ extra : num 2.75 3.75 4.25 4 2.5 3 2.75 3.5 4.75 5 ...
## $ vertr : num 3.75 4.75 4.5 4.75 4.75 3 3.25 5 4.5 4.5 ...
## $ gewis : num 4.25 2.75 3.75 4.25 5 4.25 4 4.75 4.5 3 ...
## $ neuro : num 4.25 5 4 2.25 3.75 3.25 3 3.5 4 4.5 ...
## $ intel : num 4.75 4 5 4.75 3.5 3 4 4 5 4.25 ...
## $ nerd : num 2.67 4 4.33 3.17 4.17 ...
## $ grund : chr "Interesse" "Allgemeines Interesse schon seit der Kindheit" "menschliche Kognition wichtig und rätselhaft; Interesse für Psychoanalyse; Schnittstelle zur Linguistik" "Psychoanalyse, Hilfsbereitschaft, Lebenserfahrung" ...
## $ fach : Factor w/ 5 levels "Allgemeine","Biologische",..: 5 4 1 4 2 NA 1 4 3 4 ...
## $ ziel : Factor w/ 4 levels "Wirtschaft","Therapie",..: 2 2 3 2 2 NA 1 2 2 2 ...
## $ lerntyp : num 1 1 1 1 1 NA 3 2 3 1 ...
## $ geschl : int 1 2 2 2 1 NA 2 1 1 1 ...
## $ job : int 1 2 1 1 1 NA 2 1 1 1 ...
## $ ort : int 1 1 1 2 2 NA 2 1 1 1 ...
## $ ort12 : int 1 1 1 1 1 NA 1 1 1 1 ...
## $ wohnen : Factor w/ 4 levels "WG","bei Eltern",..: 2 2 3 4 2 NA 2 1 1 3 ...
## $ uni1 : num 0 0 0 0 0 0 0 1 1 1 ...
## $ uni2 : num 1 1 0 1 1 0 0 1 1 1 ...
## $ uni3 : num 0 0 0 0 0 0 0 1 1 1 ...
## $ uni4 : num 0 0 1 0 0 0 0 0 0 0 ...
## $ geschl_faktor: Factor w/ 3 levels "weiblich","männlich",..: 1 2 2 2 1 NA 2 1 1 1 ...
## $ prok2_r : num 2 2 2 2 4 1 3 4 2 2 ...
## $ prok3_r : num 1 3 3 1 1 3 2 3 3 3 ...
## $ prok5_r : num 2 4 3 1 3 2 2 2 1 3 ...
## $ prok7_r : num 2 3 3 1 3 2 2 2 2 2 ...
## $ prok8_r : num 2 1 2 1 1 3 2 2 1 3 ...
## $ prok_ges : num 2 3.3 3.1 NA 2 2.1 2 2.8 2 3.3 ...
## $ nr_ges : num 3.33 1.5 4.83 3.5 2.17 ...
## $ nr_ges_z : num [1:159, 1] 0.0964 -2.1534 1.9372 0.3009 -1.3353 ...
## ..- attr(*, "scaled:center")= num 3.25
## ..- attr(*, "scaled:scale")= num 0.815
## $ nerd_std : num [1:159, 1] -0.7059 1.3395 1.8509 0.0611 1.5952 ...
## ..- attr(*, "scaled:center")= num 3.13
## ..- attr(*, "scaled:scale")= num 0.652
## $ neuro_std : num [1:159, 1] 0.869 1.912 0.521 -1.914 0.173 ...
## ..- attr(*, "scaled:center")= num 3.63
## ..- attr(*, "scaled:scale")= num 0.719
Der Datensatz besteht aus 159 Zeilen (Beobachtungen) und 47 Spalten (Variablen). Falls Sie bereits eigene Variablen erstellt haben, kann die Spaltenzahl natürlich abweichen.
Aufgabe 1
Welche der fünf Persönlichkeitsdimensionen Extraversion (extra
), Verträglichkeit (vertr
), Gewissenhaftigkeit (gewis
), Neurotizsimus (neuro
) und Intellekt (intel
) zeigt den höchsten linearen Zusammenhang mit der Lebenszufriedenheit (lz
)?
- Erstellen Sie für jeden Zusammenhang je ein Streudiagramm.
- Schätzen Sie für jeden Zusammenhang je ein Modell.
- Prüfen Sie die Voraussetzungen und interpretieren Sie den standardisierten Koeffizienten des linearen Zusammenhangs zwischen Intellekt und Lebenszufriedenheit. Wie verändert sich
lz
, wenn sichintel
um eine Standardabweichung erhöht?
Aufgabe 2
Betrachten Sie nun den Zusammenhang von Neurotizismus und Lebenszufriedenheit etwas genauer:
- Erstellen Sie ein Streu-Punkt-Diagramm mit Regressionsgerade für den linearen Zusammenhang zwischen Neurotizismus und Lebenszufriedenheit.
- Wie viel Prozent der Varianz werden durch das Modell erklärt?
- Ein paar Studierende wurden nachträglich zum Studiengang Psychologie zugelassen und befinden sich daher nicht im Datensatz. Die neuen Studierenden wurden nachträglich befragt und weisen auf der Skala Neurotizismus folgende Werte auf: 1.25; 2.75; 3.5; 4.25; 3.75; 2.15. Machen Sie eine Vorhersage für die Lebenszufriedenheit für die neuen Studierenden.