Wie zu entscheiden, ob Ausreißer zu halten in Predictive Analytics

Die Entscheidung, Ausreißer in die Analyse einzubeziehen - oder sie auszuschließen - wird Auswirkungen auf Ihre Predictive Analytics-Modell haben. Ausreißer als Teil der Daten in Ihrer Analyse halten kann zu einem Modell führen, die nicht anwendbar ist - entweder zu den Ausreißern oder auf den Rest der Daten.

Wenn Sie sich entscheiden, einen Ausreißer zu halten, müssen Sie Techniken und statistische Methoden zu wählen, ohne Beeinflussung der Analyse im Umgang mit Ausreißern treffen. Eine solche Technik ist mathematische Funktionen wie natürliche Algorithmen und Quadratwurzel verwenden, um die Lücke zwischen den Ausreißern und dem Rest der Daten zu reduzieren.

Diese Funktionen, jedoch nur für numerische Daten arbeiten, die größer als Null ist, - und andere Probleme entstehen können. Zum Beispiel kann die Transformation der Daten erfordern Interpretationen der Beziehung zwischen den Variablen in den neu transformierten Daten, die aus der Interpretation unterscheiden, die diese Variablen in den ursprünglichen Daten regelt.

Das bloße Vorhandensein von Ausreißern in den Daten können Einblicke in Ihr Unternehmen bieten, die bei der Erzeugung eines robusten Modells sehr hilfreich sein kann. Ausreißer kann die Aufmerksamkeit auf einen gültigen Business Case ziehen, dass eine ungewöhnliche Bit bedeutendes Ereignis darstellt.

Suche nach Ausreißern, zu identifizieren sie und ihre Auswirkungen sollten Teil der Datenanalyse und Vorverarbeitung sein. Business-Domain-Experten Einblick und helfen Sie entscheiden, was mit ungewöhnlichen Fällen in Ihrer Analyse zu tun. Obwohl es manchmal den gesunden Menschenverstand alles, was Sie mit Ausreißern umgehen müssen, ist, oft ist es hilfreich, jemanden zu fragen, wer der sich damit auskennt.

Wenn Sie in einem Geschäft sind, die von seltenen Ereignissen profitiert - sagen wir, ein astronomisches Observatorium mit einem Zuschuss Erde-Orbit-Kreuzung Asteroiden zu studieren - Sie sind mehr daran interessiert, in den Ausreißern als im Großteil der Daten.

Ausreißer kann eine große Quelle von Informationen sein. Abweichend von der Norm könnte ein Signal verdächtiger Aktivitäten sein, aktuelle Nachrichten, oder eine opportunistische oder katastrophales Ereignis. Unter Umständen müssen Sie Modelle zu entwickeln, die Ihnen helfen, Ausreißer und Esel identifizieren die Risiken, die sie bedeuten.

Es ist ratsam, zwei Analysen durchzuführen: eine, die Ausreißer enthält, und eine andere, die sie unterlässt. Dann die Unterschiede untersuchen, versuchen, die Auswirkungen der einzelnen Methoden zu verstehen und zu beurteilen, wie ein Verfahren über die andere Annahme würde Ihre Geschäftsziele zu beeinflussen.

Menü