Courtesy of pxhere

Übersicht

Fragestellung

Dieses Projekt befasst sich mit folgender Frage: “Welche politischen Parteien stehen im Zentrum des öffentlichen Interesses?”. Dazu wollen wir uns anschauen, wie sich die Anzahl von Google-Suchanfragen bezogen auf 9 deutsche Parteien seit 2004 entwickelt hat und diese Entwicklung in einer Grafik darstellen. Hat sich das Interesse an den Grünen in Folge der Nuklearkatastrophe in Fukushima im Jahr 2011 gesteigert? Sinkt das Such-Interesse an der SPD parallel zu ihren Umfragwerten in den letzten Jahren? Wie groß ist das Interesse an einer Spartenpartei wie der Tierschutzpartei im Netz? Das sind Fragen, die wir mithilfe der auf Google Trends öffentlich zugänglich gemachten Daten über Suchanfragen in Deutschland untersuchen können.

Zielsetzung

In diesem ersten Projekt geht es um das Verarbeiten von Datensätzen und die anschließende Darstellung von Daten mit dem R-Paket ggplot2. Ziel ist es also, dass du dich damit auseinandersetzt, wie Daten gut in R eingepflegt werden können, wie sie aufbereitet werden müssen um gut darstellbar zu sein und wie sie abschließend in Grafiken dargestellt werden können. Es geht schlussendlich darum eine gute und übersichtliche Aufbereitung der Daten für verschiedene Kontexte zu haben.

Vorbereitung

Zunächst müsstest du in einem neuen Tab deines Browsers Google Trends aufrufen.

Auf der Seite befindet sich ein Suchfeld, wo du den ersten Begriff eingeben und dir eine Statistik dazu anschauen kannst (bitte gebe als Beispiel einmal Affe ein). Nun kannst du andere Begriffe mit dem Beispiel vergleichen (gebe in das Feld “+Vergleichen” Giraffe ein). Du kannst bis zu vier Begriffe vergleichen.

Die Skala ist bei jeder Statistik sehr wichtig und kann fehlinterpretiert werden. Daher ist es sehr wichtig, dass du dich mit der Skala dieses Datensatzes befasst. Über jeder Abbildung befindet sich ein , wo die Skala erklärt wird. Hier wird jeder Punkt im Bezug zum höchsten Punkt dargestellt. Als wir diese Seite erstellt haben, sah das Ergebnis der Suche unseres Beispiels so aus:

.

Das heißt also, dass bei uns der Suchbegriff Affe in der Woche vom 23. zum 29. Dezember den Maximalwert erreicht hat, und der Begriff Giraffe nur auf 48% dieser Menge von Suchanfragen gekommen ist. Je nach Bezugspunkt ändern sich also die Werte. Das ist sehr wichtig, wenn man verschiedene dieser Datensätze vergleichen will.

Die verschiedenen Datensätze kannst du über das Downloadzeichen oben rechts an jeder Abbildung herunterladen und in Excel öffnen. Speichere sie bitte immer in dem Ordner, in dem sich auch dein R-Skript befindet.

Zur grafischen Darstellung empfehlen wir, dass du mit ggplot2 arbeitest. Falls du noch nicht mit dem Paket gearbeitet hast oder eine Auffrischung haben möchtest, kannst du dir unseren Crash-Kurs dazu durchlesen. Einen deutschsprachigen Überblick über die Befehle von ggplot2 findest du in diesem PDF oder auf dieser Website der Allgemeinen Psychologie von der Uni Basel. Eine englischsprachige Einführung vom Autor und Erfinder von ggplot2 - Hadley Wickham - findest du in seinem Online-Buch “R for Data Science”.

Um ggplot benutzen zu können, musst du dir das passende Paket (ggplot2) herunterladen und es in deine R Sitzung laden:

install.packages('ggplot2')
library(ggplot2)

Und jetzt kann es losgehen - viel Spaß beim Bearbeiten dieses Projekts.