10 Common Data Mining-Fehler (die Sie nicht machen)

Data Mining wird durch Versuch und Irrtum gemacht, und so, für Data-Mining, Fehler zu machen, ist nur natürlich. Fehler können in anderen Worten wertvoll sein, zumindest unter bestimmten Bedingungen. Nicht alle Fehler sind gleich, jedoch. Einige sind einfach besser vermieden. Die folgende Liste bietet zehn solcher Fehler. Wenn Sie sie lesen Sie sorgfältig, und verpflichten sich, diese Speicher, können Sie nur ein paar Beulen auf der Lernkurve zu vermeiden:

  • Auslassen von Datenqualitätsprüfungen: Die meisten Data-Mining denken Entwicklung prädiktiver Modelle mehr Spaß als Daten für die Qualitätsprobleme zu überprüfen. Aber wenn Sie sich nicht zu erkennen und zu korrigieren Datenqualitätsprobleme, könnten Sie mit wertlos Prognosen beenden.

  • Fehlt den Punkt: Sie haben etwas Faszinierendes entdeckt! Das ist schön, aber wenn es nicht auch relevant für das Geschäft Problem ist, setzen Sie heraus zu lösen, gut, es ist überhaupt nicht relevant. Holen Sie auf dem richtigen Weg zurück.

  • Im Glauben, dass ein Muster in den Daten belegen eine Ursache-Wirkungs-Beziehung: Sie erforschen einen Datensatz, und beachten Sie, dass, wenn Variable A zunimmt, Variable B erhöht sich auch. Dies könnte auftreten, weil Variable Eine Variable B beeinflusst, oder weil Variable B Einflüsse Variable A. Auf der anderen Seite könnte es sein, dass beide von einer anderen Variablen beeinflusst werden, die Sie nicht in Betracht gezogen. Oder es könnte eine einmalige Zufall sein. Wer kann das schon sagen?

  • Stretching zu weit Schlussfolgerungen: Nicht davon ausgehen, dass die Beziehungen, die Sie in der Daten beobachten unter anderen Umständen wieder auftreten wird. Wenn Sie Ihre Daten in einer kühlen Umgebung gesammelt wurden, nicht davon ausgehen, dass die Dinge auf die gleiche Weise in einem heißen Werkseinstellung arbeiten.

  • Wetten auf die Ergebnisse, die keinen Sinn machen: Data-Mining-Methoden sind informell und nicht die in der Regel durch wissenschaftliche Methode und Theorie gesichert, so dass Ihre Ergebnisse waren besser zumindest wirtschaftlich sinnvoll. Wenn es für die Ergebnisse nicht den gesunden Menschenverstand Erklärung ist Ihnen präsentieren, Ihr wahrscheinlich Geschäftsleitung wird es nicht ernst zu nehmen, und sie sollten nicht.

  • Verlieben mit einer bestimmten Modellierungsmethode: Es gibt keine einzige Art von Data-Mining-Modell, das in jeder Situation passt.

  • Putting ein Modell in die Produktion ohne ausreichende Prüfung: Sie Ihr Unternehmen nicht auf einem Vorhersagemodell setzen, bis Sie es mit holdout Daten und in geringem Umfang auf dem Gebiet getestet haben.

  • Das Ignorieren Ergebnisse, die Sie nicht mögen: Wenn Sie Ihre Daten jetzt ignorieren, wird es eines Tages zurückkommen und sagen: "Ich habe es dir gesagt."

  • Mit Data Mining zu jedem Datenanalyse notwendig Adresse: Data Mining hat einen enormen Wert, aber einige Anwendungen erfordern immer noch für rigorose Methoden der Datenerhebung, formale statistische Analysen und wissenschaftlichen Methode.

  • Vorausgesetzt, dass die traditionelle Datenanalysetechniken keine Rolle mehr: Siehe den vorherigen Punkt.

Menü