Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

6
Kann die Hauptkomponentenanalyse auf Datensätze angewendet werden, die eine Mischung aus kontinuierlichen und kategorialen Variablen enthalten?
Ich habe einen Datensatz, der sowohl kontinuierliche als auch kategoriale Daten enthält. Ich analysiere mit PCA und frage mich, ob es in Ordnung ist, die kategorialen Variablen in die Analyse einzubeziehen. Meines Wissens kann PCA nur auf kontinuierliche Variablen angewendet werden. Ist das korrekt? Welche Alternativen für ihre Analyse gibt …

5
Was soll ich tun, wenn mein neuronales Netzwerk nicht lernt?
Ich trainiere ein neuronales Netzwerk, aber der Trainingsverlust nimmt nicht ab. Wie kann ich das beheben? Ich frage nicht nach Überanpassung oder Regularisierung. Ich frage, wie ich das Problem lösen soll, bei dem sich die Leistung meines Netzwerks im Trainingssatz nicht verbessert . Diese Frage ist absichtlich allgemein gehalten, so …



6
Was sind die Vorteile von ReLU gegenüber der Sigmoidfunktion in tiefen neuronalen Netzen?
Der Stand der Technik der Nichtlinearität ist die Verwendung von gleichgerichteten Lineareinheiten (ReLU) anstelle der Sigmoidfunktion in einem tiefen neuronalen Netzwerk. Was sind die Vorteile? Ich weiß, dass das Trainieren eines Netzwerks bei Verwendung von ReLU schneller wäre, und es ist biologisch inspirierter. Was sind die anderen Vorteile? (Das heißt, …




8
Geht Facebook zu Ende?
In letzter Zeit hat dieses Papier viel Aufmerksamkeit erhalten (z . B. von WSJ ). Grundsätzlich schließen die Autoren, dass Facebook bis 2017 80% seiner Mitglieder verlieren wird. Sie stützen ihre Behauptungen auf eine Extrapolation des SIR-Modells , eines in der Epidemiologie häufig verwendeten Kompartimentmodells. Ihre Daten stammen aus Google-Suchen …



7
Welchen Einfluss hat C in SVMs mit linearem Kernel?
Ich verwende derzeit eine SVM mit einem linearen Kernel, um meine Daten zu klassifizieren. Es liegt kein Fehler im Trainingssatz vor. Ich habe verschiedene Werte für den Parameter ausprobiert ( ). Dies hat den Fehler im Test-Set nicht verändert.10 - 5 , … , 10 2CCC10- 5, … , 10210−5,…,10210^{-5}, …

2
Eine Liste von Kostenfunktionen, die in neuronalen Netzen neben Anwendungen verwendet werden
Welche allgemeinen Kostenfunktionen werden bei der Bewertung der Leistung neuronaler Netze verwendet? Einzelheiten (Fühlen Sie sich frei, den Rest dieser Frage zu überspringen. Ich beabsichtige hier lediglich, Klarheit über die Notation zu schaffen, die Antworten verwenden können, um sie für den allgemeinen Leser verständlicher zu machen.) Ich denke, es wäre …

2
Wie bestimme ich, welche Distribution am besten zu meinen Daten passt?
Ich habe einen Datensatz und möchte herausfinden, welche Verteilung am besten zu meinen Daten passt. Ich habe die fitdistr()Funktion verwendet, um die notwendigen Parameter zur Beschreibung der angenommenen Verteilung abzuschätzen (z. B. Weibull, Cauchy, Normal). Mit diesen Parametern kann ich einen Kolmogorov-Smirnov-Test durchführen, um abzuschätzen, ob meine Probendaten aus derselben …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.