Kastengrafiken mit Excel (auch Box Plots oder Box-Whisker-Plot)
Kastengrafiken werden üblicherweise für statistische Analysen eingesetzt. Microsoft Excel bietet keine integrierte Funktion zur Erstellung dieses Diagrammtyps, Sie können sich Ihre Kastengrafik aber selbst zusammensetzen, indem Sie ein Diagramm mit gestapelten Säulen und Fehlerindikatoren verwenden. Das folgende Tutorial zeigt Ihnen, wie Sie in allen neueren Excel-Versionen Ihre eigenen Kastengrafiken erstellen können. Sie können mit diesem Verfahren horizontale und auch vertikale Kastengrafiken erstellen.
In seiner einfachsten Form weist eine Kastengrafik ein Rechteck (Box) auf, das durch das erste und dritte Quartil begrenzt wird. Die Länge der Box entspricht also dem Interquartilsabstand. Die Box wird wiederum durch den Median in zwei Bereiche geteilt, die das zweite und das dritte Quartil repräsentieren. Die Antennen (Whiskers) überspannen das erste und vierte Quartil. Sie reichen vom Minimum bis an die Außengrenze des zweiten Quartil und von der Außengrenze des dritten Quartil bis zum Maximum.
Berechnungen aus den Daten der Stichprobe
Für unser Tutorial soll ein einfacher und anschaulicher Datensatz zur Anwendung kommen. Es wurde eine statistische Erhebung unter einer Bevölkerungsgruppe durchgeführt. Für die Gruppe liegt eine Normalverteilung vor, der Erwartungswert liegt bei 10 und die Standardabweichung bei 5. Es liegen vier Datenreihen mit jeweils 20 Werten vor.
Alle vorliegenden Werte sind positiv. Datenreihen mit gemischten positiven und negativen Werten lassen sich nur mit einer grundsätzlich verschiedenen Abwandlung der vorliegenden Methode verarbeiten.
Für Ihre Berechnungen benötigen Sie einen leeren Bereich von 5 Spalten auf 15 Zeilen. Eine der Wertereihen, die Hilfsachse, benötigen Sie dabei an sich nur für die Erstellung horizontal ausgerichteter Kastengrafiken. Sie können sie also auch nach eigenem Ermessen weglassen.
Zuerst werden einige grundlegende statistische Kennwerte berechnet. Die statistischen Berechnungen lassen sich mit Excel sehr effizient durchführen. Neben allgemeinen Funktionen wie MIN und MAX bietet Excel auch spezifische Formeln wie STABW für die Standardabweichung und QUARTILE für die Berechnung eines bestimmten Quartils. Ein grundlegender Bezugswert ist die Anzahl der Werte pro Datenreihe. Nutzen Sie diesen Ausgabewert, um eine Vorlage für zukünftige Auswertungen zu erstellen, für die die Anzahl der Werte pro Datenreihe variiert. Die Werte für die Hilfsachse sind leicht zu finden, Sie benötigen dafür keine Formel. Dieser Punkt wird später noch behandelt.
Praktischerweise wurden in dieser Anordnung die Werte, die als Datenquelle für unser Diagramm dienen sollen, bereits in einem Block zusammengefasst. Zu einer Kastengrafik gehört zunächst ein Rechteck, Box genannt, das sich wiederum in zwei Teilabschnitte untergliedert. Das Breitenmaß der Box spielt keine Rolle, die Längenmaße der einzelnen Abschnitte dagegen schon. Die Außenkanten der Box werden durch das erste und das dritte Quartil definiert. Der erste Teilabschnitt (Quartil 2 Box), reicht vom ersten Quartil bis zum Median. Der zweite Teilabschnitt (Quartil 3 Box) reicht vom Median bis zum dritten Quartil. Die Box wird folglich durch den Median in die zwei Teilabschnitte unterteilt.
Eine vollständige Kastengrafik erhalten wir, wenn wir die Box durch zwei Antennen (Whiskers) ergänzen. Die untere Antenne reicht vom Minimum bis zum ersten Quartil, die obere Antenne vom dritten Quartil bis zum Maximum.
Alle Längenmaße der Abschnitte auf der Kastengrafik lassen sich als Subtraktionen der zuvor ermittelten statistischen Auswertungen berechnen.
Jetzt werden die Hilfsachsen-Werte berechnet. Im Beispiel liegen vier Datenreihen vor, von A bis D. Die Wertereihe Hilfsachse wird zu einem späteren Zeitpunkt wichtige Stützwerte liefern (zumindest, wenn Sie mit horizontalen Kastengrafiken arbeiten). Nehmen Sie zunächst die Anzahl Ihrer Datenreihen, im Beispiel 4. Es kann sich hier nur um eine ganze Zahl handeln. Die 4 ist auch das Ende einer Zahlenreihe: 0; 1; 2; 3; 4. Ermitteln Sie nun jeweils die Mittelwerte, die zwischen diesen ganzen Zahlen liegen: 0,5; 1,5; 2,5; 3,5. Diese Werte können Sie als Ergebnisse in die Zeile Hilfsachse eintragen, sie werden später einer Sekundärachse mit der Skalierung 0 bis 4 zugeordnet. Für eine größere Anzahl an Datenreihen verwenden Sie einfach Autovervollständigen, um die Mittelwerte von Excel erzeugen zu lassen.
Konstruktion des Diagramms
Wählen Sie nun in dem Bereich, in dem die Berechnungsergebnisse gelistet sind, die drei Zeilen, die die Ergebnisse für die Berechnungen Fußsäule, Quartil 2 Box und Quartil 3 Box enthalten. Erfassen Sie dabei alle 4 Spalten der Datenreihen A bis D. Markieren Sie außerdem noch die Namen der Datenreihe Reihe A bis Reihe D. Verwenden Sie die Strg-Taste, um mehrere Bereiche gleichzeitig zu markieren. Der untenstehende Screenshot zeigt den Auswahlbereich noch einmal mit orangener Markierung.
Aus dem Auswahlbereich wird jetzt ein Diagramm mit gestapelten Säulen oder Balken erstellt. Achten Sie aber darauf, jeweils nicht den 100 % gestapelten Typus zu verwenden, denn bei dieser Diagrammform skaliert Excel die Säulen und Balken immer auf den einheitlichen Gesamtwert aller Kategorien von 100 %, was wir hier nicht gebrauchen können.
Im Balkendiagramm (rechts) werden die Datenreihen von unten nach oben hin angeordnet. Sie können die Reihenfolge auch umkehren, indem Sie die vertikale Achse wählen und aus dem Rechtsklick-Menü die Aktion Achse formatieren wählen. Aktivieren Sie dann das Kontrollkästchen Kategorien in umgekehrter Reihenfolge und aktivieren Sie unter Horizontale Achse schneidet die Option Bei größter Rubrik.
Jetzt wird die untere Antenne angefügt. Wählen Sie die Datenreihe Fußsäule an (im Bild blau). Gehen Sie nun in die Registerkarte Diagrammtools/Entwurf. Dort finden Sie das Drop-Down-Menü Diagrammelement hinzufügen. Navigieren Sie zu den Fehlerindikatoren und rufen Sie Weitere Fehlerindikatorenoptionen auf. Dort legen Sie als Richtung Minus fest, wählen ein Linienende Mit Abschluss und setzen den Fehlerbetrag auf Benutzerdefiniert. Wählen Sie anschließend Ihren benutzerdefinierten Fehlerwert. Dazu öffnen Sie den Auswahldialog und markieren Ihre Rechenergebnisse für Antenne negativ (H13:K13). In diesem Fall wählen Sie natürlich Daten für das Argument Negativer Fehlerwert aus. Im Eingabefeld Positiver Fehlerwert lassen Sie einfach den Platzhalter ={1} stehen. Bestätigen Sie mit OK. Im Diagramm erscheinen jetzt die negativen Antennen. Sie reichen vom der Unterkante des Box-Teilbereichs Quantil 2 Box in den Bereich der Fußsäulen hinein.
Wählen Sie jetzt die Datenreihe Quantil 3 Box (im Bild grau) an, um die obere Antenne einzufügen. Rufen Sie erneut über den oben bereits beschriebenen Pfad die erweiterten Optionen für Fehlerindikatoren auf. Diesmal legen Sie als Richtung Plus fest. Auch hier sollen die Linienenden Mit Abschluss erstellt werden. Den benutzerdefinierten Fehlerbetrag ordnen Sie diesmal dem Argument Positiver Fehlerwert zu. Wählen Sie die Rechenergebnisse für Antenne + (H14:K14). Für das Argument Negativer Fehlerwert lassen Sie den voreingestellten Platzhalter ={1} bestehen. Die so erstellten Antennen reichen diesmal von der Außenkante des Box-Teilbereichs Quantil 3 Box ins Leere.
Um letztendlich das tatsächliche Aussehen einer Kastengrafik zu erreichen, werden die vorliegenden Diagramme noch formatiert. Blenden Sie zuerst die Fußsäulen aus, indem Sie über einen Rechtsklick die Aktion Datenreihe formatieren aufrufen und die Attribute Keine Linie und Keine Füllung festlegen. Formatieren Sie danach auch die Box-Teilbereiche Quartil 2 Box und Quartil 3 Box. Wählen Sie dazu eine schwarze Randlinie mit gut erkennbarer Linienstärke und eine unauffällige Füllung mit hohem Transparenzwert.
Erwartungswerte einzeichnen
Sie können nun auch noch die Erwartungswerte im Diagramm markieren lassen. Wählen Sie dazu zunächst im Bereich Ihrer statistischen Berechnungsergebnisse die Zeile, die die Ergebnisse für den Erwartungswert enthält. Kopieren Sie den ausgewählten Bereich. Wählen Sie dann Ihr Diagramm an und lassen Sie die Werte über die Einfügen-Option hinzufügen. Die neue Datenreihe wird als gestapelte Säule oder gestapelter Balken am oberen Ende der bereits existierenden Elemente angetragen.
Wählen Sie jetzt diese neue Datenreihe an, rufen Sie mit einem Rechtsklick das Kontextmenü auf und wählen Sie die Aktion Datenreihen-Diagrammtyp ändern (in älteren Excel-Versionen auch Diagrammtyp). Wenn Sie an vertikal ausgerichteten Kastengrafiken arbeiten, ist der Diagrammtyp Linie zutreffend. Für horizontal ausgerichtete Kastengrafiken entscheiden Sie sich für den Diagrammstil Punkt (X,Y).
Für horizontale Kastengrafiken müssen Sie jetzt noch eine weitere wichtige Anpassung annehmen. (Höchstwahrscheinlich haben Sie schon die seltsame Formatierung Ihres Balkendiagramms bemerkt, die sich durch die letzte Änderung ergeben hat). Wählen Sie dazu die Erwartungswert-Datenreihe an und rufen Sie im Kontextmenü die Aktion Daten auswählen auf. Beginnen Sie mit der Bearbeitung der Datenquellen für die Erwartungswert-Datenreihe. Der X-Achse werden die Rechenergebnisse aus der Zeile Erwartungswert zugeordnet. Der Y-Achse werden Stützwerte der Zeile Hilfsachse zugeordnet.
Achtung: Im horizontalen Balkendiagramm trägt Excel die Erwartungswert-Datenreihe in Standard-Anordnung an, also von unten nach oben. Wenn Sie zuvor die Anordnung der Balken invertiert haben, müssen Sie jetzt auch die Anordnung der Erwartungswerte invertieren. Andernfalls erhalten Sie eine vertauschte Zuordnung und damit ein falsches Diagramm. Rufen Sie also per Rechtsklick die Aktion Achse formatieren für die Sekundärachse auf, die Excel zusammen mit der neuen Datenreihe angelegt hat (rechte Diagrammseite, im Bild skaliert von 0 bis 4). Aktivieren Sie hier die Optionen Werte in umgekehrter Reihenfolge und Horizontale Achse schneidet bei Maximaler Achsenwert.
Excel 2003: Bei der Erstellung einer Kastengrafik in Excel 2003 gestaltet sich dieser letzte Schritt noch etwas anders. Excel 2003 erstellt zwar Sekundärachsen für die Erwartungswert-Datenreihe, allerdings wird die vertikale Sekundärachse von der bisherigen Primärachse verdeckt (im Beispiel die Achse mit der Beschriftung: Reihe A, Reihe B, Reihe C …). Klicken Sie also am oberen Ende des Diagramms auf die Sekundärachse, öffnen Sie den Dialog Achse formatieren und aktivieren Sie die Option Achse schneidet bei Maximaler Achsenwert.
Die vertikale Sekundärachse erscheint jetzt auf der rechten Seite des Diagramms. Rufen Sie jetzt wieder die Achsenoptionen auf und invertieren Sie Anordnung über die Option Werte in umgekehrter Reihenfolge (falls Sie vorher auch die Reihenfolge der Kastengrafiken invertiert haben).
Zum Abschluss können Sie noch einige allgemeine Formatierungen vornehmen, die der besseren Darstellung dienen. Für die Erwartungswerte empfiehlt sich eine kontrastreiche Farbgebung. Außerdem kann die vertikale Sekundärachse (am rechten Ende des Diagramms) verborgen werden, die schließlich nur mit Hilfswerten beschriftet ist. Rufen Sie dazu per Rechtsklick den Dialog Achse formatieren auf und legen Sie für Teilstriche und Beschriftungen (ggf. Linie) den Wert Keine fest.
Fertig! Ein einfacher und schneller Weg, um Kastengrafiken zu erzeugen.
Vielen Dank für die gute Anleitung!!! Es gibt leider ein Problem, wenn es sowohl positive als auch negative Daten gibt. Dann funktioniert Eure Darstellungsmethode nämlich nicht richtig: Die ganze Box wird dann fälschlich nach oben geschoben und es gibt eine Lücke zwischen der unteren Antenne und der Box.
Du kannst die deine Daten einfach per Addition ins positive verschieben, die Beschriftung entfernen und mit Hilfe einer extra Data series + Data labels basierend auf bestimmten Zellen (in diesen die korrekten Werte für negativ bis positiv hinterlegen) erstellen.