Für lange Zeit habe ich nicht verstanden , warum die „Summe“ von zwei Zufallsvariablen ist ihre Faltung , während eine Mischung Dichtefunktion Summe von und istf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); die arithmetische Summe und nicht ihre Faltung. Der genaue Ausdruck "die Summe von zwei Zufallsvariablen" erscheint in Google 146.000 mal und ist wie folgt …
Ich sehe häufig sowohl die Schreibweisen "heteroskedastisch" als auch "heteroskedastisch" und in ähnlicher Weise "homoskedastisch" und "homoskedastisch". Es scheint keinen Unterschied in der Bedeutung zwischen der "c" - und der "k" -Variante zu geben, sondern lediglich einen orthografischen Unterschied in Bezug auf die griechische Etymologie des Wortes. Woher stammen die …
Ich habe LSTMs für eine Weile studiert. Ich verstehe auf hohem Niveau, wie alles funktioniert. Als ich sie jedoch mit Tensorflow implementieren wollte, bemerkte ich, dass BasicLSTMCell eine Reihe von Einheiten (dh num_units) benötigt. Aus dieser sehr gründlichen Erklärung von LSTMs habe ich herausgefunden, dass eine einzelne LSTM-Einheit eine der …
Ich verstehe, wie wir 3,5 als den erwarteten Wert für das Werfen eines fairen 6-seitigen Würfels erhalten. Aber intuitiv kann ich jedes Gesicht mit der gleichen Chance von 1/6 erwarten. Sollte der erwartete Wert eines Würfels nicht einer der Werte zwischen 1 und 6 mit gleicher Wahrscheinlichkeit sein? Mit anderen …
Was sind die Unterschiede zwischen "Inferenz" und "Schätzung" im Kontext des maschinellen Lernens ? Als Neuling, ich glaube , dass wir folgern Zufallsvariablen und schätzen die Modellparameter. Ist mein Verständnis richtig? Wenn nicht, was genau sind die Unterschiede und wann soll ich welche verwenden? Und welches ist das Synonym für …
Ich habe erfahren, dass eine Statistik ein Attribut ist, das Sie aus Stichproben erhalten können. Wenn Sie viele Stichproben gleicher Größe nehmen, dieses Attribut für alle berechnen und das PDF-Dokument zeichnen, erhalten Sie die Verteilung des entsprechenden Attributs oder die Verteilung der entsprechenden Statistiken. Ich habe auch gehört, dass Statistiken …
Ich habe die Abhandlung ImageNet Classification with Deep Convolutional Neural Networks gelesen und in Abschnitt 3 wurde die Architektur ihres Convolutional Neural Network erläutert, wie sie es vorzogen: nicht sättigende Nichtlinearitätf(x)=max(0,x).f(x)=max(0,x).f(x) = max(0, x). weil es schneller war zu trainieren. In dieser Arbeit scheinen sie sich auf gesättigte Nichtlinearitäten als …
Was ist der Unterschied zwischen Extrapolation und Interpolation und wie werden diese Begriffe am genauesten verwendet? Zum Beispiel habe ich eine Aussage in einer Arbeit gesehen, in der Interpolation verwendet wurde als: Die Prozedur interpoliert die Form der geschätzten Funktion zwischen den Bin-Punkten. Ein Satz, der sowohl Extrapolation als auch …
In Dimensionalitätsreduktionstechniken wie Hauptkomponentenanalyse, LDA usw. wird häufig der Begriff Mannigfaltigkeit verwendet. Was ist eine Mannigfaltigkeit in nicht-technischer Hinsicht? Wenn ein Punkt zu einer Kugel gehört, deren Abmessung ich reduzieren möchte, und wenn es ein Rauschen gibt, und und nicht korreliert sind, dann würden die tatsächlichen Punkte aufgrund des Rauschens …
Ich suche nach einer guten Terminologie, um zu beschreiben, was ich versuche, um die Suche nach Ressourcen zu vereinfachen. Angenommen, ich habe zwei Cluster von Punkten A und B, die jeweils zwei Werten X und Y zugeordnet sind, und ich möchte den "Abstand" zwischen A und B messen, dh wie …
Die auf Wikipedia definierten Antworten (Definitionen) sind für diejenigen, die mit höherer Mathematik / Statistik nicht vertraut sind, wohl etwas kryptisch. In mathematischen Begriffen wird ein statistisches Modell normalerweise als Paar ( S, PS,PS, \mathcal{P} ) betrachtet, wobei SSS die Menge möglicher Beobachtungen ist, dh der Probenraum, und PP\mathcal{P} eine …
Wenn ich meinen Schülern Konzepte vorstelle, finde ich es oft lustig, ihnen zu sagen, woher die Terminologie stammt ("Regression" ist beispielsweise ein Begriff mit einer interessanten Herkunft). Ich konnte die Geschichte / den Hintergrund des Begriffs "Regularisierung" im statistischen / maschinellen Lernen nicht aufdecken. Woher stammt also der Begriff Regularisierung …
Ich lese oft über eine Funktion, die "hochgradig nicht linear" ist. Meines Erachtens gibt es "linear" und "nichtlinear". Worum geht es also bei diesem "Hoch"? Gibt es einen formalen Unterschied zu nichtlinearen? Wie ist es definiert?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.