Grundlagen der User-basierte Collaborative Filter in Predictive Analysis

Mit einer benutzerbasierten Ansatz zur Collaborative Filtering in prädiktive Analyse kann das System Ähnlichkeit zwischen Paaren von Benutzern berechnen, indem die Kosinusähnlichkeit Formel, eine Technik, ähnlich wie die Artikel-basierten Ansatz. Normalerweise sind solche Berechnungen länger dauern zu tun, und müssen möglicherweise berechnet häufiger werden, als diejenigen, die in dem Element-basierten Ansatz. Das ist, weil

  • Sie würden viel mehr Nutzer als Elemente haben (im Idealfall sowieso).

  • Sie würden erwarten, dass Gegenstände weniger häufig als Benutzer zu ändern.

  • Mit mehr Nutzer und weniger Änderung der Artikel angeboten werden, können Sie viele weitere Attribute verwenden, als nur Geschichte kaufen, wenn der Benutzer Ähnlichkeit zu berechnen.

Ein benutzerbasierte System kann auch Maschinenlernalgorithmen Gruppe alle Benutzer verwenden, die gezeigt haben, dass sie den gleichen Geschmack haben. Das System baut Nachbarschaften von Benutzern, die ähnliche Profile haben, Kaufverhalten oder Rating-Muster. Wenn eine Person in einer Nachbarschaft kauft und mag ein Element, kann das Empfehlungssystem das Element für alle anderen in der Nachbarschaft empfehlen.

Wie bei Punkt-basierte Collaborative Filtering, die benutzerbasierte Ansatz erfordert ausreichende Daten über jeden Benutzer wirksam zu sein. Bevor das System Empfehlungen machen kann, muss er ein Benutzerprofil erstellen - so bedarf es auch, dass der Benutzer ein Konto erstellen und in (über Cookies oder speichern Sitzungsinformationen im Browser) angemeldet werden, während eine Webseite angezeigt wird.

Zunächst kann das System den Benutzer auffordern, explizit ein Profil zu erstellen, das Profil, indem sie Fragen konkretisieren, und dann seine Vorschläge optimieren nach dem Kauf Daten des Benutzers angesammelt hat.

Netflix ist ein Beispiel für ein Profil schnell für jeden Kunden zu bauen. Hier ist das allgemeine Verfahren:

  1. Netflix lädt seine Kunden Warteschlangen der Filme einrichten, die sie zu sehen möchten.

  2. Die ausgewählten Filme werden analysiert, um den Kunden Geschmack in Filmen zu lernen.

  3. Das Vorhersagemodell empfiehlt mehr Filme für den Kunden zu sehen, basierend auf den Filmen bereits in der Warteschlange.

Eine Probenmatrix von Kunden und deren Kaufsache - ist ein Beispiel für benutzerbasierte Collaborative Filtering. Der Einfachheit halber verwenden eine Regel, die ein Benutzer Nachbarschaft von anderen Nutzern, die mindestens zwei Dinge gemeinsam gekauft.

KundeGegenstand 1Punkt 2Punkt 3Punkt 4Punkt 5Punkt 6
A - N1XXX
B - N1XX
C - N2 X X
D - N2 XXX
E - N1 XX
F - N1XX XX
G - N1X X
H - N3X
I - N3 X

Es gibt drei Benutzer Nachbarschaften gebildet: N1, N2 und N3. Jeder Benutzer in der Nachbarschaft N1 und N2 hat mindestens 2 Artikel gemeinsam mit einer anderen Person in der gleichen Nachbarschaft gekauft. N3 sind Benutzer, die noch nicht die Kriterien erfüllt sind und werden nicht Empfehlungen erhalten, bis sie andere Gegenstände kaufen, um die Kriterien zu erfüllen.

Hier ist ein Beispiel dafür, wie Sie das Empfehlungssystem verwenden:

Offline über eine E-Mail-Marketing-Kampagne oder wenn der Benutzer auf der Website ist, während angemeldet Das System Marketing-Anzeigen oder Empfehlungen auf der Website schicken könnte wie folgt.:

  • Punkt 3 zu Kunde B

  • Artikel 4 bis Kunde C

  • Artikel 1 bis Kunde E

  • Punkt 3 an den Kunden F

  • Artikel 2 an den Kunden G

  • Nicht bestimmt Artikel zu den Kunden A und D

    Im Idealfall sollten Sie viel mehr Elemente als sechs haben. Und es sollte immer einige Elemente in einem Kunden Nachbarschaft sein, dass der Kunde noch nicht erworben hat.

  • Nicht bestimmt Artikel an Kunden, H und I

    In diesem Fall ist es nicht genügend Daten als Grundlage einer Empfehlung zu dienen.

Ein sehr wichtiger Unterschied ist, dass da jeder Kunde zu einer Gruppe gehört, werden alle zukünftigen Käufen, der ein Mitglied macht, wird zu den anderen Mitgliedern der Gruppe empfohlen werden, bis der Filter umgeschult wird. So Kunde A und D werden Empfehlungen anfangen, sehr schnell, da sie bereits zu einem Viertel gehören, und sicherlich die anderen Nachbarn bald etwas zu kaufen.

Zum Beispiel: Wenn der Kunde B Artikel 6 kauft, dann wird das Empfehlungssystem Punkt 6 an alle in N1 (Kunde A, B, E, F und G) empfehlen.

Kunde F kann potenziell gehören zu jeder Nachbarschaft N1 oder N2 je nachdem, wie die kollaborative Filteralgorithmus implementiert ist.

Kunden, H und I sind Beispiele für die Kaltstart-Problem: Der Kunde hat einfach nicht genug Daten erzeugt in einem Benutzer Nachbarschaft gruppiert werden. In Ermangelung eines Benutzerprofils, einen neuen Kunden mit sehr wenig oder gar keine Kaufhistorie - oder wer kauft nur obskure Gegenstände - stellen wird immer die Kaltstartproblem auf das System, unabhängig davon, welche Collaborative Filtering Ansatz ist im Einsatz.

Kunden I zeigt einen Aspekt der Kaltstartproblem, die dem Benutzer-basierten Ansatz einzigartig ist. Der Artikel basierten Ansatz würde andere Gegenstände ähnlich dem Element beginnen zu finden, die der Kunde kaufter dann, wenn andere Benutzer den Kauf Punkt 6 zu starten, kann das System die Abgabe von Empfehlungen zu starten.

Keine weiteren Käufen muss durch die vom Benutzer der item-basierten Ansatz zu empfehlen beginnen gemacht werden. In einem benutzerbasierten System jedoch Kunde hat ich zusätzliche Käufe, um zu einer Umgebung von Nutzer- das System alle Empfehlungen abgeben kann noch nicht gehören zu machen.

Okay, es ist eine Annahme, bei der Arbeit in diesen einfachen Beispielen - nämlich, dass der Kunde nicht nur das Produkt gekauft, aber mochte es genug ähnliche Einkäufe zu machen. Was ist, wenn der Kunde den Artikel nicht gefallen hat? Das System benötigt, hier zumindest eine bessere Präzision in seinen Empfehlungen zu erzeugen.

Sie können ein Kriterium auf die Empfehlungssystem zu einer Gruppe Personen hinzufügen, die ähnliche Bewertungen zu den Punkten gaben sie gekauft haben. Wenn das System den Kunden findet, die gerne und mögen die gleichen Gegenstände, dann ist die Annahme von hoher Präzision gilt. Mit anderen Worten, es besteht eine hohe Wahrscheinlichkeit, dass die Kunden den gleichen Geschmack teilen.

Menü