Problemstellung
Datensammlung
Im ersten Schritt müssen die richtigen Daten beschafft werden. Wie schon beschrieben finden wir diese auf der Google Trends Seite. Wir werden neun Begriffe miteinander vergleichen. Dies bedeutet, dass wir sie nicht alle auf einmal herunterladen können, sondern in zwei verschiedenen Datensätzen. Dabei ist es wichtig den Bezugspunkt zu beachten, weil die Skala auf der die Daten ausgegeben werden immer in Bezug zum meistgesuchten Begriff gesetzt wird. Hier geht es uns darum, die Suchanfragen von neun deutschen Parteien zu vergleichen: SPD, CDU, Bündnis 90/Die Grünen, Die Linke, AfD, FDP, MLPD, Die Tierschutzpartei und NPD. Wenn du möchtest kannst du auch eigene Begriffe benutzen. Diese sollten jedoch vergleichbar sein (ähnliches Thema beinhalten) und es sollten auch neun Begriffe sein.
Bei jedem Vergleich solltest du die Einstellung ‘Deutschland’ und ‘2004-heute’ wählen, um vergleichbare Ergebnisse zu erhalten. Wenn du eine Partei suchst, erscheint außerdem eine automatische Ergänzung mit der Unterschrift “Politische Partei”, die du nutzen solltest, um potentielle Zweideutigkeiten der Abkürzungen zu vermeiden.
Den Datensatz kannst du wie beschrieben herunterladen. Dann solltest du zwei csv Dateien haben, die du jeweils in R einlesen kannst.
Datenaufbereitung
Im Anschluss müssen wir beide Datensätze zusammenfügen, um sie in einer Abbildung darstellen zu können. Falls du den Befehl dafür nicht kennst, versuche ihn über die interne Hilfefunktion in R zu finden. Ansonsten kannst du es auch im Internet versuchen. Schaue dir den Datensatz anschließend ein wenig an - um ein Gefühl für Inhalt und Struktur der Daten zu bekommen. Dazu kannst du generelle Informationen, wie die Anzahl von Zeilen und Spalten, nutzen oder dir auch direkt die Rohdaten ansehen und durchscrollen. Wenn dir in diesem Schritt Dinge am Datensatz auffallen, die verändert werden sollten, veändere sie!
Abbildungen erstellen
Zu guter Letzt fehlt noch das eigentliche Diagramm. Denk daran, dass du zunächst einen Befehl brauchst, der den Hintergrund erstellt und mit ‘+’ immer neue Ebenen hinzufügen kannst - wenn du es noch nicht getan hast, kannst du dafür auf unserem ggplot
Crash-Kurs nachschauen. Gestalte das Diagramm so, dass es für jeden verständlich ist. Hierfür benötigst du unter Anderem
- verschiedene Farben,
- eine eingängige Achsenbeschriftung,
- einen aussagekräftigen Titel und
- eine Legende.
Es gibt noch viele weitere Dinge, mit denen du dein Diagramm verschönern kannst. Lass deiner Fantasie freien Lauf…
Verfeinerung der Abbildung
Beim Anblick des Diagramms wirst du erkennen, dass R die Monate nicht richtig darstellen kann. Es gibt Möglichkeiten diese Spalte zu formatieren, dass R sie als Datum erkennt und nicht als Faktor. Die Variable Monat sollte nach dieser Umformung die Klasse POSIXct
haben.
Die meisten Parteien werden immer mit einer spezifischen Farbe dargestellt. Um die Grafik schnell verständlich zu machen, kann jeder Partei ihre “typische” Farbe zugewiesen werden.
Eine weitere Möglichkeit den Graphen zu verbessern ist das Verhältnis zwischen dem höchsten Wert und den niedrigeren Werten durch Transformation der Variable zu verringern oder extreme (z.B. sehr hohe) Werte aus der Grafik auszuschließen. Das kann man machen, um Unterschiede zwischen den nicht so häufig gesuchten Parteien zu finden.
Hilfe und Lösungen
Falls du nicht weiterkommst, kannst du dir kleine Denkanstöße bei unseren Tipps holen. Wir bitten dich aber, dass du wirklich erst selbst probierst, das Problem zu lösen! Wenn du fertig bist, kannst du deine Lösung mit unseren Lösungen vergleichen. Du musst auch nicht immer das gleiche haben, da es oft viele Wege zum Ziel gibt.