Grundlagen der inhaltsbasierten Predictive Analytics-Filter

Inhaltsbasierte

Predictive Analytics Recommender Systeme meist passen Eigenschaften (Getaggt Schlüsselwörter) unter ähnlichen Produkten und das Profil des Benutzers Empfehlungen zu machen. Wenn ein Benutzer einen Artikel kauft, die empfohlen werden Funktionen markiert, Gegenstände mit Eigenschaften, die denen des Originals Artikel entsprechen hat. Je mehr Funktionen entsprechen, desto höher ist die Wahrscheinlichkeit, dass die Benutzer die Empfehlung mögen. Dieser Grad der Wahrscheinlichkeit wird aufgerufen Präzision.

Grundlagen der Tags Elemente zu beschreiben

Im Allgemeinen hat das Unternehmen den Verkauf (oder der Hersteller) zu tun in der Regel Tags seine Artikel mit Keywords. In der Website von Amazon, jedoch ist es ziemlich typisch nie die Tags für alle Elemente zu sehen, gekauft oder gelesen - und nicht einmal gefragt zu werden, um einen Punkt zu markieren. Kunden können die Produkte überprüfen sie gekauft haben, aber das ist nicht das gleiche wie Tagging.

Tagging lassen sich eine Skala Herausforderung für ein Geschäft wie Amazon darstellen, die so viele Elemente hat. Darüber hinaus können einige Attribute subjektiv sein und falsch markiert werden können, je nachdem, wer es Tags. Eine Lösung, die die Skalierung Problem löst, ist Kunden oder der Öffentlichkeit zu ermöglichen, um die Elemente zu markieren.

Damit Tags überschaubar und präzise, ​​ein akzeptabler Satz von Tags können von der Website zur Verfügung gestellt werden. Nur wenn eine entsprechende Anzahl von Benutzer stimmen (dh, verwenden das gleiche Tag, ein Element zu beschreiben), wird der vereinbarte Tag verwendet werden, um den Artikel zu beschreiben.

Benutzerbasierte Tagging, jedoch taucht andere Probleme für einen inhaltsbasierten Filtersystem (und Collaborative Filtering):

  • Glaubwürdigkeit: Nicht alle Kunden die Wahrheit zu sagen (vor allem online), und Benutzer, die nur eine geringe Bewertung der Geschichte haben die Daten verzerren. Darüber hinaus geben einige Anbieter können (oder andere zu ermutigen, zu geben) positiv bewertet, um ihre eigenen Produkte während negative Bewertungen geben zu den Produkten der Wettbewerber.

  • sparsity: Nicht alle Produkte bewertet werden oder genügend Bewertungen haben, um nützliche Daten zu erzeugen.

  • Inkonsistenz: Nicht alle Benutzer die gleichen Keywords verwenden, um ein Element markieren, obwohl die dieselbe Bedeutung sein kann. Darüber hinaus können einige Attribute subjektiv sein. Zum Beispiel kann ein Betrachter eines Films halten es für kurze Zeit ein anderer sagt, es ist zu lang.

Attribute müssen klare Definitionen. Ein Attribut, mit zu wenig Grenzen ist schwer zu viele Regeln auf ein Attribut zu evaluate- vorschreiben, können Benutzer fragen, zu viel Arbeit zu tun, die sie von Tagging Elemente entmutigen.

Tagging die meisten Artikel in einem Produktkatalog kann helfen, das Kaltstartproblem lösen, das Collaborative Filtering plagt. Für eine Weile werden jedoch die Genauigkeit der Empfehlungen des Systems niedrig, bis es schafft oder erhält ein Benutzerprofil.

Hier ist eine Probenmatrix von Kunden und ihre gekauften Gegenstände, zeigt ein Beispiel für inhaltsbasierte Filterung.

ArtikelFeature 1Merkmal 2Merkmal 3Merkmal 4Funktion 5
Gegenstand 1XX
Punkt 2 XX
Punkt 3X XX
Punkt 4 X XX
Punkt 5X X X

Hier wird, wenn ein Benutzer mag Feature 2 - und das in ihr Profil aufgezeichnet wird - das System alle Artikel empfehlen, die Funktion 2 in ihnen haben: Punkt 1, Punkt 2 und Punkt 4.

Dieser Ansatz funktioniert auch, wenn der Benutzer ein Element nie gekauft oder überprüft hat. Das System wird sich nur in der Produktdatenbank für jedes Element, das mit Feature 2. markiert wurde Wenn (zum Beispiel) ein Benutzer, der für Filme mit Audrey Hepburn suchen ist - und das bevorzugt in dem Profil des Benutzers zeigt sich - das System alle empfehlen die Filme, die Audrey Hepburn an diesen Benutzer verfügen.

In diesem Beispiel wird jedoch macht schnell eine Begrenzung der inhaltsbasierten Filtertechnik: Der Benutzer wahrscheinlich schon weiß über alle Filme, die Audrey Hepburn in gewesen ist, oder leicht herausfinden kann - so aus, dass Benutzer-Sicht, wobei das System hat nichts neues oder Wert empfohlen.

Wie zur Verbesserung der Präzision mit konstantem Feedback

Eine Möglichkeit, die Präzision des Systems der Empfehlungen zu verbessern ist, den Kunden um Feedback zu fragen, wann immer möglich. Sammeln Kunden-Feedback kann auf viele verschiedene Arten erfolgen, über mehrere Kanäle. Einige Unternehmen stellen den Kunden ein Produkt oder eine Dienstleistung nach dem Kauf zu bewerten. Andere Systeme bieten Social-Media-Stil-Links, so dass Kunden können # 147-like # 148- oder # 147-Abneigung # 148- ein Produkt. Ständige Interaktion zwischen

Wie die Wirksamkeit von Systemempfehlungen zu messen

Der Erfolg eines Empfehlungen des Systems hängt davon ab, wie gut er erfüllt zwei Kriterien: Präzision (Man denke an sie als eine Reihe von perfekten Spiele - in der Regel eine kleine Gruppe) und erinnern (Man denke an sie als eine Reihe von möglichen Übereinstimmungen - in der Regel eine größere Menge). Hier ist ein genauerer Blick:

  • Präzision misst, wie genau war die Empfehlung des Systems. Präzision ist schwierig zu messen, weil es subjektiv und schwer zu quantifizieren. Zum Beispiel, wenn ein Benutzer zum ersten Mal die Amazon-Website besucht, kann Amazon sicher wissen, ob seine Empfehlungen am Ziel?

    Einige Empfehlungen können die Interessen des Kunden verbinden, aber der Kunde kann immer noch nicht zu kaufen. Das höchste Vertrauen, dass eine Empfehlung präzise kommt aus klarer Beweis: Der Kunde das Produkt kauft. Alternativ kann das System explizit den Benutzer auffordern, ihre Empfehlungen zu bewerten.

  • Erinnern misst die Menge der möglichen guten Empfehlungen Ihr System mit aufkommt. Denken Sie an Rückruf als eine Bestandsaufnahme der möglichen Empfehlungen, aber alle von ihnen sind nicht perfekt Empfehlungen. Im Allgemeinen gibt es eine inverse Beziehung zu Precision und Recall. Das heißt, als Rückruf nach oben geht, Präzision geht nach unten und umgekehrt.

Das ideale System würde sowohl eine hohe Präzision und hohe Rückruf haben. Aber realistisch gesehen, ist das beste Ergebnis ein empfindliches Gleichgewicht zwischen den beiden zu schlagen. Betonend, Präzision oder erinnern hängt wirklich von dem Problem zu lösen Sie versuchen.

Menü