Wie Irgendwelche Colony-Clustern in Predictive Analysis bewerben

Ein natürliches Beispiel für selbstorganisierende Gruppe, die Sie in prädiktive Analyse Verhalten anwenden kann, ist eine Kolonie von Ameisen Jagd nach Nahrung. Die Ameisen gemeinsam ihre Spur zu optimieren, so dass sie immer den kürzesten Weg möglich auf ein Lebensmittel Ziel nimmt.

Auch wenn Sie versuchen, eine Marsch Kolonie von Ameisen zu stören und verhindern, dass sie immer auf das Essen Ziel sie wieder auf die Strecke schnell und (wieder) finden den kürzesten Weg möglich auf das Essen Ziel, alle von ihnen die gleichen Hindernisse zu vermeiden, während auf der Suche nach Lebensmittel. Diese Gleichförmigkeit des Verhaltens ist möglich, weil jede Ameise Ablagerungen eine Spur von Pheromonen auf dem Boden.

Betrachten wir eine Armee von Ameisen untätig in ihrem Nest. Als sie nach Nahrung suchen beginnen, haben sie überhaupt keine Informationen darüber, wo es zu finden. Sie marschieren zufällig, bis eine einzelne Ameise Food- nun der glückliche Ameise findet (nennen wir es Ant X) hat seine Entdeckung für den Rest der Ameisen zu kommunizieren - und das zu tun, muss er seinen Weg zurück zum Nest zu finden.

Glücklicherweise wurde Ant X seine eigene Pheromone die ganze Zeit produzieren sie suchte Food- es seine eigene Spur von Pheromonen zurück ins Nest zu folgen. Auf dem Weg zurück zum Nest, nach ihrer eigenen Pheromon Spur, stellt Ant X mehr Pheromone auf dem gleichen Weg.

Als Ergebnis wird der Duft auf Ant X auf der Spur sein, die stärkste unter allen anderen Routen "Ameisen. Der stärkste Spur der Pheromone werden alle anderen Ameisen anziehen, die nach Nahrung suchen immer noch. Sie werden den stärksten Duft folgen. Da immer mehr Ameisen Ant X-Trail verbinden, fügen sie mehr Pheromone der Duft stärker wird zu it-. Schon bald alle anderen Ameisen haben einen starken Duft zu folgen.

Wenn mehrere Ameisen die gleiche Nahrungsquelle entdeckt haben, die Ameisen, die den kürzesten Weg genommen hat, will mehr Reisen im Vergleich zu Ameisen tun, die längeren Pfaden folgen - also mehr Pheromone auf dem kürzesten Weg hergestellt werden. Die Beziehung zwischen individuellen und kollektiven Verhaltens ist eine aufschlussreiche Natur Beispiel.

Jeder Punkt steht für ein Dokument. Nehmen wir an, die schwarzen Punkte sind Dokumente über Predictive Analytics und die weißen Punkte sind Dokumente über Anthropologie. Punkte, die verschiedenen Arten von Dokumenten darstellen, werden in dem Gitter von fünf Zellen zufällig verteilt.

# 147-Ameisen # 148- zufällig im Netz zu suchen, nach ähnlichen Dokumenten eingesetzt. Jede Zelle mit einem Wert in sie repräsentiert eine Instanz eines # 147-Pheromon. # 148- Dokument-Matrix, wobei jede Zelle # 147-Pheromon # 148- Wert wird aus dem entsprechenden Dokument berechnet.

bild0.jpg

Okay, wie funktioniert eine Ameisenkolonie kollektiven Intelligenz ein Modell erzeugen für die effektive Daten Clustering? Die Antwort liegt in einer einfachen Analogie: Ameisen für Lebensmittel in ihrer Umgebung suchen, so wie wir für Cluster in einem Datensatz Willkommen - Suche nach ähnlichen Dokumenten in einem großen Satz von Dokumenten.

Betrachten wir ein Datensatz von Dokumenten, die Sie mit dem Thema zu organisieren möchten. Ähnliche Dokumente werden in demselben Cluster gruppiert werden. Hier ist, wo die Ameisenkolonie Hinweise, wie zu einer Gruppe ähnliche Dokumente zur Verfügung stellen kann.

Stellen Sie sich eine zweidimensionale (2D) Gitter in dem Sie Dokumente als Punkte darstellen kann. Das 2D-Gitter ist in Zellen unterteilt. Jede Zelle hat einen # 147-Pheromon # 148- (Wert) zugeordnet. Kurz gesagt, die # 147-Pheromon # 148- Wert unterscheidet jedes Dokument in einer bestimmten Zelle.

Die Punkte werden zunächst zufällig verteilt - und jeder Punkt im Netz stellt ein einzigartiges Dokument. Der nächste Schritt ist, andere Punkte zufällig auf dem 2D-Gitter zu implementieren, für Lebensmittel in seiner Umgebung die Ameisenkolonie der Suche zu simulieren. Diese Punkte werden anfänglich in derselben 2D-Gitter mit den Dokumenten verstreut.

Jeder neue Punkt ans Netz stellt eine Ameise. Jene # 147-Ameisen, # 148- oft in der Ameisenkolonie Algorithmus bezeichnet als Agenten, in dem 2D-Gitter bewegen. Jeder # 147-ant # 148- entweder abholen oder die anderen Punkte (Dokumente) abfallen, je nachdem, wo die Dokumente am besten gehören. In dieser Analogie die # 147-Food # 148- nimmt die Form von Dokumenten hinreichend ähnlich, dass sie geclustert werden können.

Ein # 147-ant # 148- geht zufällig in der Gitter-, wenn sie ein Dokument entdeckt, kann eine von zwei Aktionen ausführen: auswählen oder löschen. Jede Zelle hat einen # 147-Pheromon Intensität # 148-, der angibt, wie ähnlich das Dokument zu den anderen Dokumenten (Punkte) in der Nähe des betreffenden Dokument mit Wohnsitz - das eine ein # 147-ant # 148- ist im Begriff, entweder abholen oder fallen lassen.

Beachten Sie, dass die # 147-ant # 148- in Zelle 3 wird das schwarz-gepunkteten Dokument, weil die weiße abholen # 147-Pheromon # 148- Wert ist dominating- und in eine Zelle zu bewegen, wo der Wert in der Nähe ist (ähnlich) zu dem, was in Zelle 4 (mehrere schwarze Punkte). Die Suche hält iteriert, bis die Cluster bilden.

image1.jpg

Tatsächlich wird die # 147-ant # 148- Dokumente von einer Zelle zur anderen bewegt Cluster zu bilden, indem entweder eine von nur zwei Aktionen: ein Dokument Aufnehmen oder ein Dokument ablegen.

Wenn das # 147-Ameisen # 148- begann zufällig auf dem Gitter bewegt, wird ein Punkt (Dokument) Ergebnisse in der Begegnung # 147-Ameise # 148- Kommissionierung ein Dokument aus der aktuellen Zelle nach oben, bewegt sich mit ihm, und es in eine Zelle fallen, in dem sie eine ausreichende Ähnlichkeit musste passen.

Wie würde sich ein # 147-ant # 148- bestimmen die beste Zelle, in der ein Dokument zu fallen? Die Antwort ist, dass die Werte in den Zellen wirken wie # 147-Pheromone # 148- - und jede Zelle in der 2D-Gitter enthält einen numerischen Wert, der in einer Art und Weise berechnet werden kann, die ein Dokument in der Zelle darstellt.

Denken Sie daran, dass jedes Dokument als eine Reihe von Zahlen oder einen Vektor von numerischen Werten dargestellt wird. Das # 147-Intensität des Pheromons # 148- (der numerische Wert) erhöht, wenn mehrere Dokumente in die Zelle verworfen werden - und dieser Wert nimmt ab, wenn die Zahlen, die Dokumente darstellen, werden aus der Zelle bewegt wird.

Menü