Ist ein ausgeprägter mathematischer Hintergrund eine Grundvoraussetzung für ML? - eine Antwort und einige Spekulationen für ML, die als Statistik konzipiert wurden ;-)
Um 1990 hatte ich die Hoffnung, dass die Computeralgebra hilfreich sein könnte. Ich denke, das ist es, aber es ist ziemlich begrenzt. Aber es hilft auf jeden Fall dabei, das Erlernen von Mathematik zu beschleunigen (weniger Notwendigkeit, Manipulationsfähigkeiten durch Übung zu entwickeln oder zu versuchen, mit den einfachen Übungen auszukommen). Ich fand Fred Szabos lineare Algebra mit Mathematica ein hervorragendes Beispiel dafür (aber ich hatte bereits einen Kurs für lineare Algebra auf fortgeschrittenem theoretischem Niveau belegt.)
Ich arbeite seit 1988 (mit computerintensiven Methoden Theoreme und Prinzipien aus der Statistik "konkretisieren" - genau), um die Antwort nein oder zumindest nicht notwendig zu machen (für die Statistik). Mit zusätzlichen mathematischen Fähigkeiten und Kenntnissen wird man immer schneller und allgemeiner verstehen können. Ich glaube, ich fange an, näher heranzukommen, aber man braucht eine manipulierbare Darstellung von Wahrscheinlichkeitsmodellen und Folgerungen, die für mehr als nur Spielzeugprobleme gültig und nützlich ist.
Sollte ich versuchen, die Lücken meiner Mathematik auszufüllen, bevor ich mit ML fortfahre?
Das ist ein hartes Unterfangen - in MHO kamen fast alle, die Statistiken verstehen, dorthin, indem sie den Standard und insbesondere die nicht so standardmäßigen mathematischen Darstellungen von Wahrscheinlichkeitsmodellen und mathematischen Charakterisierungen von Folgerungen sehr bequem manipulierten (die höchsten x% der Phds für mathematische Statistiken). Es geht also nicht nur darum, die Grundlagen zu erlernen, sondern sich mit der Mathematik wirklich vertraut zu machen. (Abgesehen davon war für mich die Fouriertheorie von wesentlicher Bedeutung.)
Warum sind diese Darstellungen schwierig (auch mit viel Mathe)?
Gerd Gigerenzer hat so gut wie festgestellt, dass es mit der einfachen Krankheit Positiv / Negativ bei einem positiven / negativen Testproblem mit natürlichen Frequenzen keine Herausforderung gibt. “ Ein Verweis aus der verknüpften Frage scheint diese http://www.autonlab.org/tutorials/prob18.pdf gut zu nutzen
Warum ist das schwer zu verallgemeinern?
Für k Tests (wiederholt und oder anders) - 2 ^ k
Für Tests, die v Werte annehmen - v ^ k
Also für binäre Unbekannte - 2 * v ^ k Abtastpfadwahrscheinlichkeiten
Für p multiple binäre Unbekannte 2 ^ p * v ^ k
Für p multiple rationale Unbekannte gilt Q ^ p * v ^ k
Man begibt sich schnell in die Mathematik mit zählbaren und unzählbaren Unendlichkeiten, um damit umzugehen, was selbst mit mathematischem Fachwissen zu vielen Missverständnissen und scheinbaren Paradoxien führt (zB Borels Paradoxon?)
Darüber hinaus gibt es lineare bis nichtlineare gefährliche Missverständnisse (z. B. versteckte Gefahren bei der Angabe nicht informativer Prioritäten von Winbugs und anderen MCMCs ohne Informationen für die vorherige Verteilung ) sowie Wechselwirkungen und zufällige Effekte usw.