Data Mining

Das Unterscheidungsmerkmal über Data Mining, wie mit Abfrage- verglichen, Reporting oder sogar OLAP, ist, dass man Informationen, ohne bekommen können spezifische Fragen zu stellen.

Data Mining dient zwei Hauptrollen in der Business-Intelligence-Mission:

  • Das # 147-Sag mir, was # 148- Rolle passieren könnte: Die erste Rolle des Data Mining ist prädiktive, in denen man im Grunde sagen, # 147-Sag mir, was passieren könnte. # 148- verborgenes Wissen Verwendung gesperrt in Data Warehouse, Wahrscheinlichkeiten weg und die Wahrscheinlichkeit künftiger Trends und Ereignisse werden aufgespürt und Ihnen präsentiert.

  • Das # 147-Sag mir etwas interessantes # 148- Rolle: Neben möglichen zukünftigen Ereignisse und Vorkommnisse, Data Mining versucht auch interessante Informationen zu ziehen, die Sie wahrscheinlich über, wie eine besonders ungewöhnliche Beziehung zwischen Vertrieb von zwei verschiedenen Produkten und wie diese Beziehung ist je nach Platzierung in Ihrem Einzelhandelsgeschäften wissen sollten.

    Obwohl viele dieser interessanten Leckerbissen wahrscheinlich existieren sind, welche Fragen bitte Sie, wenn Sie eine Abfrage oder OLAP-Tool verwendet haben, und wie würden Sie die Ergebnisse zu interpretieren? Data Mining hilft Ihnen bei dieser schwierigen Aufgabe, herauszufinden, was Fragen für Sie viel von der Routinearbeit tun zu fragen.

Data-Mining in bestimmten Wirtschaftsmissionen

Data Mining ist besonders für diese speziellen Arten von Business-Missionen geeignet:

  • Aufdeckung von Betrug

  • Die Ermittlung Marketing-Programm Wirksamkeit

  • wem, von einem großen Kundenstamm oder der allgemeinen Bevölkerung auswählen, sollten Sie im Rahmen eines Marketing-Programm zielen

  • Verwalten von Kundenlebenszyklus, einschließlich der Kundenbindung Mission

  • Durchführen von erweiterten Geschäftsprozessmodellierung und Was-wäre-wenn-Szenarien

Denken Sie darüber nach, was in der vorhergehenden Liste hinter jedem der Wirtschaftsmissionen ist:

  • Eine große Menge an Daten,

  • Eine noch größere Anzahl von Kombinationen von verschiedenen Stücken von Daten,

  • Intensive Ergebnisse Set-Analyse, in der Regel komplexe Algorithmen und fortgeschrittene statistische Methoden,

Nun, darüber nachzudenken, was Sie zu tun haben würde, wenn Sie eine Meldung oder OLAP-Tool, um diese Aufgaben zu erfüllen wurden. Sie würden finden es praktisch unmöglich, einem der vorangegangenen Missionen gründlich durchführen, wenn Sie eine Frage stellen musste und ein Ergebnis bekommen, eine andere Frage stellen und ein anderes Ergebnis zu bekommen, und dann diese Schritte immer wiederholen.

Data Mining und künstliche Intelligenz

Wenn Sie für mindestens ein Jahrzehnt in der Informationstechnologie (IT) Feld waren, klingen einige der vorstehenden Bedingungen könnte vage bekannt. Entsperren verborgenes Wissen? Predictive Funktionalität? Warten Sie eine Minute - das ist künstliche Intelligenz!

Von den frühesten Tagen der kommerziellen Computing, hat es eine enorme Interesse an der Entwicklung # 147-Denkmaschinen # 148-, die große Datenmengen verarbeiten und Entscheidungen auf dieser Analyse basieren.

Das Interesse an der künstlichen Intelligenz (KI) traf ihren Höhepunkt in der Mitte der 1980er Jahre. Zu diesem Zeitpunkt Datenbank-Anbieter auf die Herstellung von Wissensdatenbank-Management-Systeme gearbeitet (KBMSs) - andere Anbieter kam mit Expertensystem-Schalen, oder AI-basierte Anwendungsentwicklung Frameworks, die Techniken verwendet, wie Vorwärtsverkettungs und Rückwärtsverkettungs Nutzern über decisions- und neuronale Netze beraten wurden als das nächste große AI Entwicklung positioniert.

Das Interesse an AI schwand in den frühen 1990er Jahren, als die Erwartungen verfügbaren Fähigkeiten und andere frenzies, wie Client / Server-Migration überschritten und (natürlich) Data Warehousing, standen im Mittelpunkt.

Nun AI ist wieder da!

Die höchste-Profil AI Technik in Data Mining ist neuronale Netze. Neuronale Netze wurden ursprünglich als Verarbeitungsmodell in Betracht gezogen, dass die Art und Weise das menschliche Gehirn löst Probleme nachahmen würde, Neuronen verwenden und hochparallelen Verarbeitungsmuster Lösung zu tun.

Anwenden von neuronalen Netzwerk-Algorithmen auf die Bereiche Business Intelligence, die Data-Mining-Griffe (wieder, prädiktive und # 147-sagen Sie mir etwas interessantes # 148- Missionen) scheint ein natürliches Spiel zu sein.

Obwohl die Data-Mining / Spiel neuronales Netz auf jeden Fall einen Besuch wert in ist, sollten Sie es sorgfältig tun. Sie können viele interessante und spannende Technologien, die in den Händen derer finden, die die Algorithmen nicht verstehen, wird wahrscheinlich scheitern.

Doch mit der richtigen Wissen und Bildung, können Sie eine umfassende Engagement machen diese Art der Verarbeitung in Ihrer Business Intelligence-Framework als technisch-Analyse-Paarung für die OLAP-fokussierte Business-Analyse zu bringen.

Data Mining und Statistik

Die reiferen Bereich des Data Mining ist die Anwendung fortgeschrittener statistischer Verfahren gegen die großen Datenmengen in Ihrem Data Warehouse. Verschiedene Werkzeuge verwenden verschiedene Arten von statistischen Techniken, abgestimmt auf den jeweiligen Bereichen zu adressieren, sie versuchen.

Ohne einen statistischen Hintergrund, könnten Sie viel von Data-Mining verwirrend finden. Sie müssen eine Menge Arbeit zu tun, um die Algorithmen und bauen die Regeln zu trainieren richtigen Ergebnisse mit größeren Datenmengen zu gewährleisten. Jedoch unter der Annahme, dass Sie mit diesem Konzept vertraut sind, oder einen Kollegen haben, die helfen können, sind hier einige der weit Leveraged Algorithmen:

  • Klassifikationsalgorithmen: Predict einer oder mehreren diskreten Variablen, basierend auf den anderen Attribute der Datenmenge. Durch die Verwendung von Ihnen Klassifikationsalgorithmen können die Data-Mining-Tool Blick auf große Mengen von Daten und dann informieren, dass zum Beispiel, # 147-Kunden, die über mindestens zwei Generationen von Produktkäufen zurückgehalten werden, neigen dazu, diese Eigenschaften haben: Sie haben ein Einkommen von mindestens $ 75.000, und sie besitzen ihre eigenen Häuser # 148;.

  • Regressionsalgorithmen: Predict eine oder mehrere kontinuierliche Variablen, wie Gewinn oder Verlust, basierend auf anderen Attribute der Datenmenge. Regression Algorithmen werden durch historische Informationen präsentiert die Data-Mining-Werkzeug angetrieben # 147-im Laufe der Zeit, # 148- besser bekannt als Zeitfolgen Information.

  • Segmentierungsalgorithmen: Teilen Sie Daten in Gruppen oder Cluster von Elementen, die ähnliche Eigenschaften aufweisen.

  • Verband Algorithmen: Finden Korrelationen zwischen verschiedenen Attributen in einem Datensatz. Die häufigste Anwendung dieser Art von Algorithmus erzeugt Assoziationsregeln, die Sie in einem Korbanalyse verwenden können. Beachten Sie, dass, zum Beispiel, wenn ein Kunde ein bestimmtes Software-Paket kauft, kann er oder sie hat eine 65-prozentige Chance, mindestens zwei produktspezifischen Add-On-Packs innerhalb von zwei Wochen den Kauf.

  • Die Sequenzanalyse-Algorithmen: Zusammenfassend häufigen Sequenzen oder Folgen in Daten, wie beispielsweise ein Web-Pfadströmungs.

Viele weitere Verfahren existieren. Staub aus dem alten Statistiken Buch und dem Lesen beginnen.

Menü