Das Seltsamste, was ich beim Nachlesen der Chaostheorie zur Beantwortung dieser Frage entdeckt habe, war ein erstaunlicher Mangel an veröffentlichten Forschungsergebnissen, in denen Data Mining und seine Verwandten die Chaostheorie wirksam einsetzen. Dies geschah trotz der konzertierten Bemühungen, sie zu finden, indem Quellen wie AB Ҫambels Applied Chaos Theory: Ein Paradigma für Komplexität und Alligood und das Chaos von al.: Eine Einführung in dynamische Systeme herangezogen wurden (letzteres ist unglaublich nützlich als Quellenbuch für dieses Thema) und ihre Bibliographien durchsuchen. Nach all dem sollte ich nur eine einzige Studie entwickeln, die sich qualifizieren könnte, und ich musste die Grenzen des „Data Mining“ erweitern, um nur diesen Randfall zu berücksichtigen: Ein Team an der Universität von Texas forschte an Belousov-Zhabotinsky (BZ) -Reaktionen (von denen bereits bekannt war, dass sie zu Aperiodizität neigen) und entdeckte versehentlich Unstimmigkeiten in der Malonsäure, die in ihren Experimenten aufgrund chaotischer Muster verwendet wurde Lieferant. [1] Es gibt wahrscheinlich noch andere - ich bin kein Spezialist für Chaostheorie und kann die Literatur kaum erschöpfend bewerten -, aber das starke Missverhältnis zu gewöhnlichen wissenschaftlichen Verwendungen wie dem Drei-Körper-Problem aus der Physik würde nicht viel ändern, wenn wir sie alle aufzählen würden. In der Tat, in der Zwischenzeit, als diese Frage geschlossen wurde, Ich überlegte, es unter dem Titel "Warum gibt es so wenige Implementierungen der Chaostheorie in Data Mining und verwandten Bereichen?" Neu zu schreiben. Dies steht nicht im Einklang mit der unklaren, aber weit verbreiteten Meinung, dass es eine Vielzahl von Anwendungen in Data Mining und verwandten Bereichen geben sollte Felder wie neuronale Netze, Mustererkennung, Unsicherheitsmanagement, Fuzzy-Mengen usw .; Schließlich ist die Chaostheorie auch ein aktuelles Thema mit vielen nützlichen Anwendungen. Ich musste lange überlegen, wo genau die Grenzen zwischen diesen Feldern liegen, um zu verstehen, warum meine Suche erfolglos und mein Eindruck falsch war.
Die Antwort
Die kurze Erklärung für dieses starke Ungleichgewicht in der Anzahl der Studien und die Abweichung von den Erwartungen kann der Tatsache zugeschrieben werden, dass Chaostheorie und Data Mining usw. zwei sauber getrennte Fragenklassen beantworten; Die scharfe Zweiteilung zwischen ihnen ist offensichtlich, obwohl sie so grundlegend ist, dass sie unbemerkt bleibt, ähnlich wie das Betrachten der eigenen Nase. Es mag eine Rechtfertigung für die Annahme geben, dass die relative Neuheit der Chaostheorie und Felder wie Data Mining den Mangel an Implementierungen erklären, aber wir können davon ausgehen, dass das relative Ungleichgewicht auch dann anhält, wenn diese Felder ausgereift sind, weil sie sich einfach auf ganz unterschiedliche Seiten von beziehen die gleiche Münze. Bisher wurden fast alle Implementierungen in Studien bekannter Funktionen mit genau definierten Ergebnissen durchgeführt, die einige verwirrende chaotische Aberrationen aufwiesen. Während Data Mining und einzelne Techniken wie neuronale Netze und Entscheidungsbäume die Bestimmung einer unbekannten oder schlecht definierten Funktion beinhalten. Verwandte Felder wie Mustererkennung und Fuzzy-Mengen können ebenfalls als Organisation der Ergebnisse von Funktionen angesehen werden, die ebenfalls häufig unbekannt oder schlecht definiert sind, wenn die Mittel dieser Organisation ebenfalls nicht ohne weiteres ersichtlich sind. Dies schafft eine praktisch unüberwindliche Kluft, die nur unter bestimmten seltenen Umständen überwunden werden kann - aber auch diese können unter der Überschrift eines einzelnen Anwendungsfalls zusammengefasst werden: Verhindern aperiodischer Interferenzen mit Data Mining-Algorithmen. Verwandte Felder wie Mustererkennung und Fuzzy-Mengen können ebenfalls als Organisation der Ergebnisse von Funktionen angesehen werden, die ebenfalls häufig unbekannt oder schlecht definiert sind, wenn die Mittel dieser Organisation ebenfalls nicht ohne weiteres ersichtlich sind. Dies schafft eine praktisch unüberwindliche Kluft, die nur unter bestimmten seltenen Umständen überwunden werden kann - aber auch diese können unter der Überschrift eines einzelnen Anwendungsfalls zusammengefasst werden: Verhindern aperiodischer Interferenzen mit Data Mining-Algorithmen. Verwandte Felder wie Mustererkennung und Fuzzy-Mengen können ebenfalls als Organisation der Ergebnisse von Funktionen angesehen werden, die ebenfalls häufig unbekannt oder schlecht definiert sind, wenn die Mittel dieser Organisation ebenfalls nicht ohne weiteres ersichtlich sind. Dies schafft eine praktisch unüberwindliche Kluft, die nur unter bestimmten seltenen Umständen überwunden werden kann - aber auch diese können unter der Überschrift eines einzelnen Anwendungsfalls zusammengefasst werden: Verhindern aperiodischer Interferenzen mit Data Mining-Algorithmen.
Inkompatibilität mit dem Chaos Science Workflow
Der typische Arbeitsablauf in der „Chaoswissenschaft“ besteht darin, eine rechnerische Analyse der Ergebnisse einer bekannten Funktion durchzuführen, häufig zusammen mit visuellen Hilfsmitteln des Phasenraums, wie Bifurkationsdiagrammen, Hénon-Karten, Poincaré-Schnitten, Phasendiagrammen und Phasenverläufen. Die Tatsache, dass Forscher sich auf Computerexperimente verlassen, zeigt, wie schwer chaotische Effekte zu finden sind. Das kann man normalerweise nicht mit Stift und Papier feststellen. Sie treten auch ausschließlich in nichtlinearen Funktionen auf. Dieser Workflow ist nur durchführbar, wenn wir über eine bekannte Funktion verfügen, mit der wir arbeiten können. Data Mining liefert möglicherweise Regressionsgleichungen, Fuzzy-Funktionen und dergleichen, aber alle haben dieselbe Einschränkung: Sie sind nur allgemeine Näherungswerte mit einem viel größeren Fehlerfenster. Demgegenüber sind die bekannten chaotischen Funktionen relativ selten. Ebenso wie die Eingabebereiche, die chaotische Muster ergeben, ist ein hohes Maß an Spezifität erforderlich, um auch chaotische Effekte zu testen. Irgendwelche seltsamen Attraktoren, die im Phasenraum unbekannter Funktionen vorhanden sind, würden sich sicherlich verschieben oder ganz verschwinden, wenn sich ihre Definitionen und Eingaben ändern, was die von Autoren wie Alligood et al.
Chaos als Kontaminant in Data Mining-Ergebnissen
Tatsächlich ist das Verhältnis von Data Mining und seinen Verwandten zur Chaostheorie praktisch widersprüchlich. Dies ist im wahrsten Sinne des Wortes der Fall, wenn wir die Kryptoanalyse allgemein als eine bestimmte Form des Data Mining betrachten, da ich auf mindestens ein Forschungspapier zur Nutzung des Chaos in Verschlüsselungsschemata gestoßen bin (ich kann das Zitat derzeit nicht finden, aber ich kann jagen) auf Anfrage). Für einen Data Miner ist das Vorhandensein von Chaos normalerweise eine schlechte Sache, da die scheinbar unsinnigen Wertebereiche, die er ausgibt, den ohnehin mühsamen Prozess der Annäherung an eine unbekannte Funktion erheblich erschweren können. Das Chaos in Data Mining und verwandten Bereichen wird am häufigsten verwendet, um es auszuschließen, was keine leichte Aufgabe ist. Wenn chaotische Effekte vorhanden, aber nicht entdeckt sind, sind ihre Auswirkungen auf ein Data-Mining-Unternehmen möglicherweise schwer zu bewältigen. Stellen Sie sich vor, wie leicht ein gewöhnliches neuronales Netz oder ein gewöhnlicher Entscheidungsbaum die unsinnig erscheinenden Ausgaben eines chaotischen Attraktors überdecken kann oder wie plötzliche Spitzen in den Eingabewerten die Regressionsanalyse sicherlich verwirren und schlechten Stichproben oder anderen Fehlerquellen zugeschrieben werden können. Die Seltenheit chaotischer Effekte unter allen Funktionen und Eingabebereichen bedeutet, dass die Untersuchung durch die Experimentatoren stark beeinträchtigt würde.
Methoden zur Erkennung von Chaos in Data Mining-Ergebnissen
Bestimmte mit der Chaostheorie verbundene Maßnahmen sind nützlich, um aperiodische Effekte zu identifizieren, wie die Kolmogorov-Entropie und die Anforderung, dass der Phasenraum einen positiven Lyapunov-Exponenten aufweist. Diese sind beide auf der Checkliste für die Chaoserkennung [2] in AB Ҫambels Applied Chaos Theory, aber die meisten sind für approximierte Funktionen, wie den Lyapunov-Exponenten, der bestimmte Funktionen mit bekannten Grenzen erfordert, nicht nützlich. Die allgemeine Vorgehensweise, die er umreißt, kann jedoch in Data-Mining-Situationen nützlich sein. Ҫambels Ziel ist letztendlich ein Programm der „Chaoskontrolle“, dh der Beseitigung der störenden aperiodischen Effekte. [3] Andere Methoden wie die Berechnung der Box-Counting- und Korrelationsdimensionen zur Ermittlung der Bruchdimensionen, die zu Chaos führen, sind in Data-Mining-Anwendungen möglicherweise praktischer als die von Lyapunov und anderen auf seiner Liste. Ein weiteres verräterisches Zeichen für chaotische Effekte ist das Vorhandensein von Periodenverdopplungs- (oder Verdreifachungs- und darüber hinausgehenden) Mustern in Funktionsausgaben, die in Phasendiagrammen häufig einem aperiodischen (dh „chaotischen“) Verhalten vorausgehen.
Differenzierung tangentialer Anwendungen
Dieser primäre Anwendungsfall muss von einer separaten Klasse von Anwendungen unterschieden werden, die sich nur tangential auf die Chaostheorie beziehen. Bei näherer Betrachtung bestand die Liste der „potenziellen Anwendungen“, die ich in meiner Frage angegeben habe, tatsächlich fast ausschließlich aus Ideen zur Nutzung von Konzepten, von denen die Chaostheorie abhängt, die jedoch unabhängig angewendet werden können, wenn kein aperiodisches Verhalten vorliegt (mit Ausnahme der Periodenverdopplung). Ich dachte kürzlich an eine neuartige potenzielle Nischenverwendung, die ein aperiodisches Verhalten erzeugt, um neuronale Netze aus lokalen Minima herauszuholen, aber auch dies würde auf die Liste der tangentialen Anwendungen gehören. Viele von ihnen wurden als Ergebnis der Erforschung der Chaoswissenschaften entdeckt oder ausgearbeitet, können aber auch auf andere Gebiete übertragen werden. Diese „tangentialen Anwendungen“ haben nur Fuzzy-Verbindungen, bilden jedoch eine eigene Klasse. durch eine harte Grenze vom Hauptanwendungsfall der Chaostheorie im Data Mining getrennt; Die erste Methode nutzt bestimmte Aspekte der Chaostheorie ohne die aperiodischen Muster, während die letztere ausschließlich darauf abzielt, das Chaos als komplizierenden Faktor für Data-Mining-Ergebnisse auszuschließen, möglicherweise unter Verwendung von Voraussetzungen wie der Positivität des Lyapunov-Exponenten und der Erkennung der Periodenverdopplung . Wenn wir zwischen der Chaostheorie und anderen Begriffen, die sie korrekt verwendet, unterscheiden, ist leicht zu erkennen, dass die Anwendungen der ersteren von Natur aus auf bekannte Funktionen in gewöhnlichen wissenschaftlichen Studien beschränkt sind. Es gibt wirklich guten Grund, sich über die möglichen Anwendungen dieser sekundären Konzepte in Abwesenheit von Chaos zu freuen. aber auch Grund zur Besorgnis über die kontaminierenden Auswirkungen unerwarteten aperiodischen Verhaltens auf das Data Mining, wenn es vorhanden ist. Solche Gelegenheiten werden selten sein, aber diese Seltenheit wird wahrscheinlich auch bedeuten, dass sie unentdeckt bleiben. Die Methode von Ҫambel könnte jedoch hilfreich sein, um solche Probleme zu vermeiden.
[1] S. 143-147, Alligood, Kathleen T .; Sauer, Tim D. und Yorke, James A., 2010, Chaos: Eine Einführung in dynamische Systeme, Springer: New York. [2] S. 208-213, ,ambel, AB, 1993, Applied Chaos Theory: Ein Paradigma für Komplexität, Academic Press, Inc .: Boston. [3] p. 215, Ҫambel.