Datenbanken und Data Mining

Daten von großen Organisationen im Laufe des Tagesgeschäfts gesammelt wird in der Regel in Datenbanken gespeichert. Aber Datenbank-Administratoren möglicherweise nicht bereit sein, Data Miner direkten Zugriff auf diese Datenquellen ermöglichen und einen direkten Zugang möglicherweise nicht die beste Option aus Ihrer Sicht auch nicht. Direkter Zugriff auf betriebliche (für Routinegeschäftsbetrieb) Datenbanken kann eine schlechte Idee sein, weil

  • Data Miner verwenden eine Menge Daten. Sie könnten unbeabsichtigt Ressourcen binden und stören gewöhnlichen Geschäftstätigkeit.

  • Gesetzliche und andere geschäftliche Verpflichtungen Rolle. Sie könnten unabsichtlich ein Datenschutzgesetz oder andere Datenverwaltungsbedarf, wenn Ihre Datenzugriff ist nicht richtig gesteuert.

  • Operative Datenbanken sind nicht für Data Mining organisiert. kämpfen Sie könnten eine Menge Zeit damit verbringen, die Daten, die Sie benötigen, zu erhalten und nicht noch sicher sein, es richtig hinzubekommen.

Wenn Sie Daten aus einer operativen Datenbank benötigen (und Sie haben die entsprechende Genehmigung zur Nutzung der Daten), sollten Sie Ihre Bedürfnisse mit dem zuständigen Administrator für diese Daten zu besprechen. Sie müssen genau zu erklären, welche Daten Sie benötigen, das Format, das Sie für Data Mining benötigen und ob Sie die Daten müssen nur einmal oder auf kontinuierlicher Basis.

Der beste Ansatz für die einmalige Anfragen ist oft für den Administrator die Daten für Sie zu extrahieren und in eine Textdatei oder ein anderes akzeptables Format liefern.

Laufende Datenzugriff ist eine andere Sache. Der Administrator kann nicht wollen, Datenextrakte über zur Verfügung zu stellen und über, und Sie direkten Zugriff auf Business-Systeme gibt, ist riskant. Eine übliche Lösung ist ein zu erstellen analytischen Datenbank. Dies ist eine gewöhnliche relationale Datenbank, die von der herkömmlichen Business-Systemen getrennt ist. Die Daten werden routinemäßig (und automatisch) übertragen von Business-Systemen auf der analytischen Datenbank und Data-Mining sie jederzeit zugreifen können.

Wenn Sie eine analytische Datenbank verwenden, stellen Sie sicher, dass es richtig Bergbau zu unterstützen Daten organisiert ist. Helfen Sie Ihren Datenbankadministrator, indem ein Diagramm wie das Skizzieren gezeigt zu zeigen, wie die Daten organisiert werden müssen.

bild0.jpg

Wenn der Datenbankadministrator besteht darauf, dass die Daten nicht auf diese Weise gespeichert werden, fragen, ob es möglich ist, eine zu schaffen Aussicht (Eine gespeicherte Abfrage, die abgefragt werden kann, als ob es sich um eine herkömmliche Datentabelle waren) mit der Organisation, die Sie benötigen.

Viele Data-Mining-Produkte sind in der Lage Daten aus Datenbanken zu lesen. Die Schritte, die erforderlich variieren je nach der

  • Aufbau des Data-Mining-Anwendung

  • Struktur der Quelldatenbank

  • Middleware, die so genannte Regel ein Treiber (ODBC-Treiber, JDBC-Treiber), Eine spezielle Software, die zwischen der Datenbank- und Anwendungssoftware vermittelt

Die Dokumentation für Ihre Data-Mining-Anwendung sollten Sie sagen, ob es Daten aus einer Datenbank lesen können, und wenn ja, welches Werkzeug oder eine Funktion zu verwenden, und wie. Der Administrator, der die Analysedatenbank einrichtet Einzelheiten erfahren über die Datenbank zugreifen.

Wenn Sie bereits vertraut sind Arbeiten mit Datenbanken und anderen Anwendungen, werden Sie nicht überraschend die gleichen Dinge tun mit einer Data-Mining-Anwendung finden. Wenn Datenbanken neu für Sie sind, erhalten eine sachkundige Person aus Ihrer Organisation, die Sie durch den Prozess mit einer eigenen Datenbank und Data-Mining-Anwendung zu gehen.

Menü