Courtesy of pxhere

Übersicht

Fragestellung

Als Psychologe wird man oft von anderen Menschen mit Laienpsychologie konfrontiert. Psychologische Weisheiten und angebliche psychologische Tests verbreiten sich heutzutage überall im Netz. Wir wollen uns nun anschauen, wie so ein angeblich psychologischer Test entwickelt wird. Der Test, den wir erstellen möchten, beschäftigt sich mit der Frage: „Wer sind deine wahren Freunde?“, indem er die WhatsApp-Chats mit deinen Freunden analysiert und dir zeigt, wem du am wichtigsten zu sein scheinst.

Zielsetzung

In dieser Aufgabe sollst du lernen, Texte zu analysieren; und zwar nicht mehr wie im Deutschunterricht auf Stilmittel, sondern z.B. auf Stimmungen. R kann dir dabei helfen, auffällige Häufigkeiten von Wörtern, Uhrzeiten und auch Stimmungen zu entdecken. Dafür wirst du weiterführende Kenntnisse zur Textanalyse mithilfe von Udpipe lernen. Außerdem wirst du deine neuerlernten Fähigkeiten für ggplot aus Aufgabe 1 und für Loops aus Aufgabe 2 anwenden können.

Vorbereitung

Für diese Aufgabe benötigst du die Handyapplikation WhatsApp und einen Gruppenchat mit Freunden oder Bekannten von dir. Diesen kannst du exportieren, indem du an deinem Handy auf deinen Gruppenchat drückst. Oben rechts siehst du drei vertikale Punkte und unter „Mehr“ findest du „Chat exportieren“. Den Chat solltest du zunächst ohne Medien exportieren.

Es sollte sich ein Fenster öffnen, in dem verschiedene Möglichkeiten zum Versenden der Datei angezeigt werden. Du kannst dir den Text am besten per E-Mail schicken, um auch von deinem Computer auf die Datei zugreifen zu können. Lade die Textdatei auf deinen Computer und speichere sie im gleichen Ordner, in dem du auch deine R-Datei speichern möchtest. Nun hast du eine Textdatei (.txt), in der jede Nachricht mit Name, Datum und Uhrzeit festgehalten ist.

Um den Chat in R einzulesen, brauchst du den folgenden Befehl:

install.packages('rwhatsapp')
library(rwhatsapp)
raw <- rwa_read('MeineGruppe.txt')

Dafür wird ein zusätzliches Paket für das Einlesen von Whatsappchats verwendet. Die Textdatei wird direkt in verschiedene Spalten zerlegt, in denen Uhrzeit, Absender, Nachricht und Emojis stehen.

Zur Analyse werden wir das R-Paket Udpipe verwenden. Hier sind ein paar Links, die du dir zu Udpipe anschauen kannst. Dort findest du hilfreiche Befehle aus dem Paket. Vielleicht helfen sie dir auch, wenn du in der Aufgabe später nicht weiterkommst.

Hier findest du die Aufbereitung eines Datensatzes mit Udpipe und ein paar Visualisierungen der Daten. Eine Übersicht zu Befehlen, die du mit Udpipe verwenden kannst, findest du direkt in der Dokumentation des Pakets. Auf dieser Seite findest du eine sehr umfangreiche Besprechung von Sprachverarbeitung in R - was auch andere Dinge, außer Udpipe, betrifft.

Bevor du Udpipe verwenden kannst, musst du es installieren und laden:

install.packages(udpipe)
library(udpipe)
model <- udpipe_download_model(language = "german")
udpipe_german <-udpipe_load_model(file = dir(pattern = 'udpipe'))

Und jetzt kann es losgehen - viel Spaß beim Bearbeiten dieses Projekts.