Assoziationen zwischen Binärgrößen

Sehr oft in Customer Analytics, begegnen Sie binäre Daten, die die Form von ja / nein nimmt, Kauf / nicht kaufen, stimmen / nicht einverstanden sind, und so weiter. Sie müssen die Zuordnung zwischen Binärgrößen zu verstehen, wie Sie den Zusammenhang zwischen kontinuierlichen Variablen zu verstehen müssen. Während das Prinzip der Korrelation der gleiche mit binären Daten ist, jedoch sind die Berechnungen unterschiedlich.

Einer der bekanntesten und sichtbare Beispiele für Predictive Analytics mit binären Daten ist die Amazon Recommendation Engine.

bild0.jpg

Während der genaue Algorithmus verwendet Amazon proprietär ist, ist es bekannt, dass ein Großteil davon auf einer Vereinigung beruht, dass die eine Person zeigt, die ein Buch kauft auch ein anderes Buch kauft. Die Empfehlungen basieren auf Binärgrößen. Um eine Empfehlung erzeugen, berechnet Amazon den Anteil der Kunden, die ein Buch und den Anteil an den gleichen Kunden kaufen, die eine beliebige Anzahl von anderen Bücher kaufen.

Bücher mit der höchsten Vereinigung zunächst die nächsthöhere Verbände nächstes empfohlen, und so weiter. Die folgende Abbildung zeigt Transaktionen von 15 Kunden in vier Bücher. Diese könnten ebenso wahrscheinlich sein Software, Lebensmittel, Songs in einer Playlist, TV-Shows oder irgendwelche Produkte oder Dienstleistungen, die Kunden auswählen können.

image1.jpg

Wenn der Kunde das Buch gekauft, ein 1 in der Reihe- ist, wenn sie nicht getan hat, gibt es eine 0. Beispiel Kunde 1 gekauft Buch A und B Buch, aber nicht mehr als 2 C oder D. Kunde gekauft nur Buch B.

Zur Untersuchung der Assoziation zwischen zwei Buchkäufen zu berechnen, gehen Sie folgendermaßen vor:

  1. Zählen Sie die Anzahl der Kunden, die jede dieser Kombinationen der Bücher gekauft:

  2. Weder Buch

  3. Beide Bücher

  4. Nur Buch A

  5. Nur Buch B

  6. Setzen Sie die Summen in einer Tabelle wie folgt aus:

    buchen B
    Buche einYN
    Y62
    N34

    Zum Beispiel kaufte sechs Kunden sowohl Bücher A und B.

  7. Beschriften Sie die Tabellenzellen A bis D, wie folgt aus:

    buchen B
    Buche einYN
    Yeinb
    Ncd
  8. Verwenden Sie die Formel für die Korrelation zwischen Binärgrößen:

    image2.jpg
  9. Geben Sie die Werte für die Bücher, die die Korrelation zwischen Binärgrößen zu finden, wie folgt aus:

    image3.jpg

    In diesem Fall ist die Korrelation zwischen Kunden, die Buch A und B Buch kaufen 0,327.

    Eine Korrelation zwischen Binärgrößen wird phi genannt und wird mit dem griechischen Symbol dargestellt

    image4.jpg

Sie können die Zuordnung zwischen binären Zahlen auf die gleiche Weise wie die Pearson-Korrelation interpretieren r. In der Tat ist eine Abkürzung phi Verfahren zum Berechnen r. Sie erhalten die gleichen Ergebnisse durch die Excel-Pearson-Formel und die Korrelation für alle Arten von Daten zu berechnen.

Die folgende Abbildung zeigt die Setup-Daten in Excel. Die Korrelation zwischen allen Paaren von Bücher wurde unter Verwendung der berechneten = PEARSON () Excel-Funktion.

image5.jpg

Dann wird eine Matrix der Korrelationen wurden für jedes Paar von Bücher erstellt, wie hier gezeigt:

image6.jpg

Bestätigung der früheren Ergebnis ist die Korrelation zwischen Buch A und B .33. Die zweithöchste Korrelation zwischen Buch A und Buch D bei 0,25.

Die Korrelation zwischen Buch B und C Buch ist -.48. Diese negative Korrelation bedeutet, dass Kunden, die Buch B kaufen weniger wahrscheinlich Buch C. kaufen

Also, wenn ein Kunde die Anzeige und unter Berücksichtigung Buch Ein Kauf, wäre es sinnvoll (und möglicherweise, dass der Kunde einen Anreiz bieten) zu empfehlen, auch Buch B und D, aber nicht buchen C. kaufen

Sie können die Begriffe hören Korbanalyse oder Affinity Analyse. Beide sind nur andere Namen für die Suche nach Assoziationen und Korrelationen zwischen Variablen. Es ist wie Kunden Einkaufskörbe in einem Lebensmittelgeschäft untersuchen, um zu sehen, welche Elemente zusammen gekauft werden.

Menü