Wie Predictive Analysis 'Raw Daten zu visualisieren

Ein Bild sagt mehr als tausend Worte - vor allem, wenn Sie versuchen, einen guten Griff auf Ihre prädiktive Analysedaten zu erhalten. An der Vorverarbeitungsschritt, während Sie Ihre Daten sind vorbereitet, dann ist es eine gängige Praxis zu visualisieren, was Sie in der Hand haben, bevor Sie mit dem nächsten Schritt fortfahren.

Sie beginnen, indem Sie eine Tabelle wie Microsoft Excel unter Verwendung einer Datenmatrix zu schaffen - die von Kandidatendaten besteht Eigenschaften (Auch bezeichnet als Attribute). Mehrere Business-Intelligence-Software-Pakete (wie Tableau) können Sie einen ersten Überblick über die Daten geben, auf die Sie im Begriff sind Analytik anzuwenden.

Wie man tabellarische Visualisierungen für die prädiktive Analyse verwenden

Tabellen sind die einfachste, grundlegende bildliche Darstellung von Daten. Tabellen (auch bekannt als Tabellen) Aus Zeilen und Spalten, - die jeweils mit den Objekten und deren Attribute, wie zuvor erwähnt bilden die Daten entsprechen. Betrachten wir zum Beispiel soziale Online-Netzwerk-Daten. Ein Datenobjekt kann einen Benutzer darstellen. Attribute eines Benutzers (Datenobjekt) können Überschriften der Spalten sein: Geschlecht, Postleitzahl oder Geburtsdatum.

Die Zellen in einer Tabelle darstellen Werte. Visualisierung in Tabellen können Sie leicht erkennen fehlende Attributwerte von Datenobjekten helfen.

bild0.jpg

Tabellen stellen auch die Flexibilität, neue Attribute hinzufügen, die Kombinationen von anderen Attributen sind. Zum Beispiel in sozialen Netzwerken Daten, können Sie eine weitere Spalte namens Alter, fügen die leicht berechnet werden kann - als eine abgeleitete Attribut - aus dem bestehenden Geburtsdatum Attribut. Die tabellarische sozialen Netzwerk-Daten zeigt eine neue Spalte, Alter, von einer anderen vorhandenen Spalte (Geburtsdatum) erstellt.

image1.jpg

Balkendiagramme verwenden in prädiktive Analyse

Balkendiagramme können verwendet werden, um Spitzen oder Anomalien in den Daten zu erkennen. Sie können für jedes Attribut es Minimal- und Maximalwerte schnell Bild zu. Balkendiagramme können auch eine Diskussion zu starten verwendet werden, wie die Daten zu normalisieren.

Normalisierung ist die Einstellung von einigen - oder alle - Attributwerte auf einer Skala, die Daten besser nutzbar macht. siehe zum Beispiel, können Sie einfach, dass es ein Fehler in der Daten: The Age Bar auf einen Datensatz ist negativ. Diese Anomalie wird leichter durch ein Balkendiagramm dargestellt als durch eine Tabelle von Daten.

image2.jpg

Grundlagen der Tortendiagramme für die prädiktive Analyse

Kreisdiagramme werden vor allem Prozente zu zeigen. Sie können leicht die Verteilung mehrerer Elemente darzustellen, und markieren Sie die meisten dominant. Die Rohdaten des sozialen Netzwerks wird entsprechend dem Alter Attribut dargestellt. Beachten Sie, dass das Diagramm nicht nur eine klare Verteilung von Männern im Vergleich zu Frauen zeigt, sondern auch einen wahrscheinlichen Fehler: R als ein Wert für Gender type möglicherweise erstellt, wenn die Daten erfasst wurden.

image3.jpg

Wie Diagrammscheiben für die prädiktive Analyse zu verwenden,

Graphentheorie liefert eine Reihe von leistungsfähigen Algorithmen, die Daten strukturiert und dargestellt als Graph analysieren können. In der Informatik ein Graph Datenstruktur ist, eine Möglichkeit, Daten zu organisieren, dass die Beziehungen zwischen Paaren von Datenobjekten darstellt. Ein Graph besteht aus zwei Hauptteilen:

  • Vertices, auch bekannt als Knoten

  • Kanten, die Paare von Knoten verbinden,

Kanten können gerichtet werden (als Pfeile eingezeichnet) und Gewichte haben. Sie können entscheiden, eine Kante (Pfeil) zwischen zwei Knoten (Kreise) zu platzieren - in diesem Fall die Mitglieder des sozialen Netzwerks, die an andere Mitglieder als Freunde verbunden sind:

image4.jpg

Die Richtung der Pfeil zeigt die "Freunde", die erste oder die Wechselwirkungen die meiste Zeit initiiert.

Grundlagen der Wortwolken für die prädiktive Analyse

Betrachten Sie eine Liste von Wörtern oder angeordnet Konzepte als Wortwolke - eine grafische Darstellung aller Wörter auf der Liste, die Größe jedes Wort als proportional zu einer Metrik angezeigt, die Sie angeben. Zum Beispiel, wenn Sie eine Tabelle von Wörtern und Ereignisse haben und Sie möchten, dass die wichtigsten Wörter zu identifizieren, zu versuchen, eine Wort-Wolke.

Word-Wolken arbeiten, weil die meisten Organisationen Daten text- ein gängiges Beispiel ist hinsichtlich Nutzung des Twitter von Trending. Jeder Begriff in dieser Darstellung hat ein Gewicht, das seine Größe als Indikator ihrer relativen Bedeutung auswirkt.

Eine Möglichkeit, dieses Gewicht zu definieren, könnte durch die Anzahl der Zeiten, ein Wort in Ihrer Datensammlung angezeigt. Je häufiger ein Wort vorkommt, das "schwerer" sein Gewicht - und je größer es erscheint in der Cloud.

image5.jpg

Wie zu verwenden Beflockung Vögel Darstellung für die prädiktive Analyse

Natürliche Beflockung Verhalten im Allgemeinen ist ein selbstorganisierendes System, in dem (insbesondere Lebewesen) Objekte sind in der Regel nach (a) die Umwelt zu verhalten, sie gehören und (b) ihre Reaktionen auf andere bestehende Objekte. Die Beflockung Verhalten von natürlichen Gesellschaften wie die von Bienen, Fliegen, Vögel, Fische und Ameisen - oder, für diese Angelegenheit, die Menschen - ist auch bekannt als Schwarmintelligenz.

image6.jpg

Vögel folgen natürlich Regeln, wenn sie wie eine Herde verhalten. Flock Kollegen mit einem gewissen Abstand von jeweils Vögel diese Vögel gelten ähnliche Andere- entfernt. Jeder Vogel bewegt sich nach den drei wichtigsten Regeln, die Beflockung Verhalten organisieren.

  • Trennung: Flock Kollegen nicht miteinander kollidieren müssen.

  • Ausrichtung: Flock Kollegen in der gleichen durchschnittlichen Richtung wie ihre Nachbarn zu bewegen.

  • Zusammenhalt: Flock Kollegen entsprechend der durchschnittlichen Position oder Lage ihrer Herde Kollegen bewegen.

diese drei Regeln Modellierung kann ein Analysesystem ermöglichen, Beflockung Verhalten simulieren. Mit Hilfe der selbstorganisierten natürliche Verhalten der Beflockung Vögel, können Sie eine einfache Tabelle in eine Visualisierung konvertieren. Der Schlüssel ist, den Begriff der Ähnlichkeit als Teil Ihrer Daten zu definieren. Beginnen Sie mit ein paar Fragen:

  • Was macht zwei Datenobjekte in Ihrer Daten ähnlich?

  • Welche Attribute am besten die Ähnlichkeit zwischen zwei Datensätzen fahren kann?

    image7.jpg

Zum Beispiel in sozialen Netzwerken Daten stellen die Datensätze einzelne Nutzer- die Attribute, die sie beschreiben Alter sind, Postleitzahl, Beziehungsstatus, Freundesliste, Anzahl der Freunde, Gewohnheiten, Veranstaltungen

Menü