Geodaten sichtbar machen: Gehversuche mit R

Kenntnisse der Statistik-Programmiersprache R stehen jedem Datenjournalisten gut an. Ausprobieren zeigt: R eignet sich nicht nur zur Datenanalyse, sondern auch für Grafiken und Karten.

Zurzeit belege ich zwei Kurse an der Online-Uni Coursera, die dieser Tage in Startup-Kreisen viel Beachtung findet. Beide Kurse drehen sich um statistische Methoden, mit Fokus auf die Programmiersprache RComputing for Data Analysis und Data Analysis. Gegeben werden sie vom Personal von Simply Statistics.

Meine Erfahrung bislang: 

Das Zurechtfinden in R ist schnell erlernt. Und für ein bisschen Büffeln erhält man ein praktisches Werkzeug in die Hand. Mit R lassen sich statistische Operationen mit wenigen Handgriffen umsetzen und das im Datenalltag den Ton angebende Tabellenformat ist mit den eingebauten Data Frames leicht zu beherrschen. R kann so mit vielen Daten von Haus aus umgehen, ohne vorheriges Gebastel. So auch mit der Schweizer Gebäude- und Wohnungsstatistik, die ich hier für eine Testfahrt mit R verwende. Die Datei im CSV-Format liefert die Anzahl (Wohn-)Gebäude in einem Hektar-Koordinatensystem.

Fasst man die Angaben einfach als Achsenwerte auf, ist keine Umrechnerei der Geodaten nötig. Bereits ein simpler Plot liefert eine gute Visualisierung. Sie lässt erahnen, wo die Siedlungsdichte in der Schweiz am dramatischsten ist.

library(lattice) 
# Im Datenset enthält die Spalte G11TOT die Anzahl Wohngebäude 
data <- read.csv("GWS2011_GEBaeude.csv", sep = ";", header = T) 
ggplot(data, aes(x=X_KOORD, y=Y_KOORD, size=G11TOT, colour=G11TOT)) + geom_point(alpha=.5) + scale_size_area() + scale_colour_continuous()

Wohnhaus-Dichte Schweiz

Das Vergrössern einzelner Teilbereiche ist keine Hexerei. Unten eine leicht anders eingefärbte Ansicht des Kantons Genf.

# Kartenausschnitt für Genf 
d2 < - subset(data,(X_KOORD < 5.25e+05) & (X_KOORD > 4.75e+05) & (Y_KOORD > 100000) & (Y_KOORD < 140000)) 
ggplot(d2, aes(x=X_KOORD, y=Y_KOORD, size=G11TOT, colour=G11TOT)) + geom_point(alpha=.5) + scale_size_area() + scale_colour_gradient(low="#0072B2",high="#D00500")

genf

R-Karten mit richtigen Geodaten nimmt ein Tutorial von Kim Gilbert in Angriff.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.