Wie Graphen können Statistiken Verzerren

Eine statistische Grafik kann man ein falsches Bild von der Statistik geben, auf denen sie beruht. Zum Beispiel kann es durch seine Wahl der Skala auf der Frequenz / relativen Frequenzachse irreführend sein (das heißt, die Achse, wobei die Beträge in jeder Gruppe ausgewiesen werden), und / oder ihren Startwert.

Durch die Verwendung von (repräsentieren zum Beispiel, von denen jeder halben Zoll von einer Bar 10 Einheiten im Vergleich zu 50 Einheiten), um eine "ausgestreckt" Mensur, kann man die Wahrheit strecken, machen Unterschiede aussehen dramatischer oder Werte übertreiben. Truth-Strecken kann auch auftreten, wenn die Frequenzachse beginnt bei einer Reihe aus, die ganz in der Nähe ist, wo die Unterschiede in den Höhen der Balken Anfahren Sie sind im Wesentlichen die Unterseite der Stäbe Abhacken (die weniger spannende Teil) und nur zeigen ihre Spitzen, (in irreführend) betont, wo die Action ist. Nicht jede Frequenzachse bei Null zu beginnen, aber achten Sie auf Situationen, die die Unterschiede erhöhen.

Hier ist ein gutes Beispiel für ein Diagramm mit einer ausgestreckten Skala:

Die Kansas Lottery routinemäßig zeigt seine jüngsten Ergebnisse aus dem 3-Lotterie-Pick. Einer der gemeldeten Statistiken ist die Anzahl, wie oft jede Zahl (0 bis 9) unter den drei Gewinnzahlen gezogen wird. Die Tabelle zeigt ein Diagramm der Anzahl, wie oft jede Zahl während 1613 insgesamt Pick 3 Spiele (4839 einzelne Zahlen gezogen) gezogen wurde. Er berichtet auch den Prozentsatz der Zeit, die jede Zahl gezogen wurde. Je nachdem, wie Sie sich entscheiden zu diesen Ergebnissen zu suchen, können Sie die Statistiken erscheinen sehr unterschiedliche Geschichten zu erzählen.

Zahlen gezogen in der Pick 3 Lotterie
Anzahl GezeichnetAnzahl der Wiederholungen von 4839 GezeichnetProzentsatz der Zeiten Gezeichnet (Anzahl der Wiederholungen Gezeichnet Division-4839)
0485100%
14689,7%
251310,6%
349110,1%
4484100%
54809,9%
648710,1%
7482100%
84759,8%
94749,8%

Die Art und Weise Lotterien der Regel zeigen Ergebnisse, wie sie in der Tabelle im oberen Diagramm in der folgenden Abbildung dargestellt.

Balkendiagramme zeigen: a) Anzahl, wie oft jede Zahl war Zieh- und b) Prozentsatz, wie oft jede Zahl
Balkendiagramme a) Anzahl, wie oft jede Zahl war Zieh- zeigt und b) Prozentsatz, wie oft jede Zahl wurde gezogen.

Beachten Sie, dass in dieser Tabelle, so scheint es, dass die Zahl 1 nicht annähernd so oft gezogen bekommen (nur 468-mal) als Nummer 2 hat (513-mal). Der Unterschied in der Höhe dieser beiden Balken erscheint sehr groß zu sein, den Unterschied in der Anzahl von Malen übertrieben diese beiden Zahlen gezogen wurden. Doch in der Perspektive, dies zu setzen, ist die tatsächliche Unterschied hier ist, 513-468 = 45 von insgesamt 4839 Zahlen gezogen. In Bezug auf die Prozentsätze, die Differenz zwischen der Anzahl, wie oft die Zahl 1 und die Zahl 2 gezogen werden, ist 45 # 247- 4,839 = 0,009 oder nur neun Zehntel von einem Prozent (0,009 x 100% = 0,9%).

Warum wurde die obere Grafik in das Bild auf diese Weise gemacht? Es könnte Menschen dazu bringen, zu denken, dass sie eine innere Kante haben, wenn sie die Nummer 2, weil es "an einem heißen Streifen" wählen - ". Grund kommen" oder sie könnte führte zu wählen die Nummer 1, weil es Beide Theorien sind falsch, durch die Weg-, weil die Zahlen nach dem Zufallsprinzip ausgewählt werden, was in der Vergangenheit passiert ist spielt keine Rolle. Die untere Kurve in der Figur wurde korrekt gemacht.

Menü