So identifizieren Sie Daten für Predictive Analytics

Für Ihre Predictive Analytics-Projekt, müssen Sie die entsprechenden Datenquellen, Pool-Daten aus diesen Quellen zu identifizieren, und legen Sie sie in einem strukturierten und gut organisierten Format. Diese Aufgaben können sehr schwierig sein und wird wahrscheinlich eine sorgfältige Koordination zwischen den verschiedenen Datenverwaltern in Ihrem Unternehmen benötigen.

Sie werden auch die Variablen auswählen müssen Sie analysieren gehst. Dieser Prozess muss Datenbeschränkungen, Projekt Zwänge nehmen und Geschäftsziele in Betracht.

Die Variablen, die Sie auswählen müssen, Vorhersagekraft haben. Außerdem müssen Sie Variablen zu berücksichtigen, die sowohl wertvolle und machbar für Ihr Projekt innerhalb des Budgets und Zeitrahmen sind. Zum Beispiel, wenn Sie Bankgeschäfte in einer strafrechtlichen Untersuchung sind die Analyse, Telefonaufzeichnungen für alle Beteiligten kann auf die Analyse relevant sein, aber den Analysten nicht zugänglich.

Erwarten Sie auf dieser Phase des Projekts viel Zeit zu verbringen. Die Datensammlung, Datenanalyse und der Prozess Dateninhalt der Adressierung, Qualität und Struktur kann zu einer zeitaufwendigen To-do-Liste addieren.

Während des Prozesses der Datenidentifikation, hilft es, Ihre Daten und deren Eigenschaften- dieses Wissen zu verstehen, hilft Ihnen dabei, welcher Algorithmus zu verwenden, das Modell zu erstellen. Beispielsweise können Zeitreihendaten durch Regressions algorithms- Klassifikationsalgorithmen analysiert werden, können verwendet werden, um diskrete Daten zu analysieren.

Variable Auswahl wird davon beeinflusst, wie gut Sie die Daten zu verstehen. Seien Sie nicht überrascht sein, wenn man sich zu suchen und Hunderte von Variablen evaluieren, zumindest auf den ersten. Zum Glück, wie Sie mit diesen Variablen arbeiten und wichtige Erkenntnisse beginnen zu gewinnen, beginnen Sie sie bis auf ein paar Dutzend kleiner. Auch erwarten variable Auswahl als Ihr Verständnis für die Datenänderungen während des gesamten Projekts zu ändern.

Sie finden es vielleicht von Vorteil, einen Datenbestand aufzubauen, die Sie verwenden können, zu verfolgen, was Sie wissen, was Sie nicht wissen, und was fehlt könnte. Der Datenbestand sollte eine Auflistung der verschiedenen Datenelemente und alle Attribute enthalten, die in den nachfolgenden Schritten des Verfahrens von Bedeutung sind.

Zum Beispiel können Sie dokumentieren, ob Segmente Postleitzahlen fehlen oder Datensätze für einen bestimmten Zeitraum fehlt.

Ihre Go-to-Leute für betriebswirtschaftliche Kenntnisse (auch bekannt als Domänenwissen Experten) Hilft Ihnen, die Schlüsselvariablen auswählen, die sich positiv auf die Ergebnisse Ihres Projekts beeinflussen können. Sie können die Bedeutung dieser Variablen zu Ihnen helfen, zu erklären, als auch, wo und wie sie zu bekommen, unter anderem einen wertvollen Beitrag.

Menü