Auf der Regionaldatenbank Deutschland kann man sich Tabellen erstellen lassen. Als Thema habe ich mir "Umwelt" mit der weiteren Eingrenzung "Abfallwirtschaft" gewählt. Anschließend habe ich mir unter dem Punkt "Erhebung der Abfallentsorgung" die Tabelle "500-52-4" als CSV Datei heruntergeladen.
In der Tabelle wird die Art der Abfallentsorgung im Jahr 2011 je Bundesland dargestellt. Bevor ich die Datei in R einlesen konnte musste ich sie noch etwas anpassen. Hierbei habe ich alle unnötigen Beschriftungen mit Excel in der CSV-Datei entfernt. Zum Schluss stand dann nur noch eine Tabelle mit den Bundesländern in der Y-Spalte und den Zahlen zu den jeweiligen Entsorgungsarten in der X-Achse.
Zusätzlich habe ich hinter jede Überschrift ein Semikolon als Trennzeichen gesetzt (Später in R wichtig).
Im nächsten Schritt habe ich das Programm R geöffnet und zu aller erst unter dem Menüpunkt "Verschiedenes" das richtige Arbeitsverzeichnis, in welchem die CSV-Datei liegt, ausgewählt. Die Datei habe ich in "abfall.csv" umbenannt. (Erleichtert das spätere Arbeiten damit).
Anschließend habe ich in R folgende Zeile eingegeben:
"abfall <- read.csv("abfall.csv", sep=";", header=TRUE)"
Zur Erklärung: Mit dem Wort "abfall" setze ich die Variable, welche die Daten zugewiesen werden. "read.csv" ist der Befehl die CSV-Datei auszulesen. "abfall.csv" ist die zuvor erstellte Datei, von welche ich die Daten auslesen lasse. Als Seperator/Trennzeichen ("sep") habe ich das Semikolon ausgewählt. Somit ist für R klar, dass nach einem ";" ein neues Merkmal beginnt. "header=TRUE" bedeutet, dass die erste Zeile, als Überschrift gesetzt wird.
Und das kommt dabei heraus:
Als nächstes habe ich m ein Balkendiagramm zu erstellen, folgenden Befehlt erteilt:
barplot(abfall$Anlagen.gesamt, col = "green", xlab = "Land", ylab = "Anzahl", border = "black", names.arg = abfall$Bundesland)
Zur Erklärung: Von der Spalte "Anlagen.gesamt" aus der Datei "abfall" wird ein Balkendiagramm ("barplot" erstellt. Die Farbe ist grün, die Beschriftung der X-Achse ist "Land" und die der Y-Achse ist "Anzahl". Die Boderfarbe ist schwarz und die Werte sind der Spalte "Bundesland" zugeordnet.
Da es sich um eine Vektorgrafik handelt, sind nicht alle Bundesländer in dieser Ansicht angezeigt.
Die einzelnen Parameter zur Einstellung der Anzeige bei barplots findet man im Programm R unter "Hilfe" --> "R Hilfe". Dort einfach den Begriff "barplot" eingeben.
Weitere nützliche Infos dazu gibt es online unter diesem Wiki.