Als «machine-learning» getaggte Fragen

Methoden und Prinzipien zum Aufbau von "Computersystemen, die sich mit der Erfahrung automatisch verbessern".


6
Erklärung der entropieübergreifenden Verluste
Angenommen, ich erstelle eine NN für die Klassifizierung. Die letzte Schicht ist eine dichte Schicht mit Softmax-Aktivierung. Ich habe fünf verschiedene Klassen zu klassifizieren. Angenommen, für ein einzelnes Trainingsbeispiel true labelist das, [1 0 0 0 0]während die Vorhersagen sind [0.1 0.5 0.1 0.1 0.2]. Wie würde ich den Kreuzentropieverlust …

1
Der Unterschied zwischen `Dense` und` TimeDistributedDense` von `Keras`
Ich bin immer noch über den Unterschied zwischen verwirrt Denseund TimeDistributedDensevon Kerasobwohl es schon einige ähnliche Fragen hier und hier . Die Leute diskutieren viel, aber keine gemeinsamen Schlussfolgerungen. Und obwohl @fchollet hier folgendes feststellte: TimeDistributedDenseDenseWendet auf jeden Zeitschritt eines 3D-Tensors dieselbe (vollständig verbundene) Operation an. Ich brauche noch eine …




3
Warum sollten Sie im Softmax-Klassifikator die Funktion exp verwenden, um eine Normalisierung durchzuführen?
Warum Softmax im Gegensatz zur Standardnormalisierung verwenden? Im Kommentarbereich der oberen Antwort auf diese Frage hat @Kilian Batzner zwei Fragen aufgeworfen, die mich ebenfalls sehr verwirren. Es scheint, dass niemand eine Erklärung abgesehen von numerischen Vorteilen gibt. Ich habe die Gründe für die Verwendung von Cross-Entropy Loss herausgefunden, aber wie …


1
Warum ist xgboost so viel schneller als sklearn GradientBoostingClassifier?
Ich versuche, ein Steigungsverstärkungsmodell mit über 50.000 Beispielen und 100 numerischen Merkmalen zu trainieren. XGBClassifierBewältigt 500 Bäume innerhalb von 43 Sekunden auf meiner Maschine, während GradientBoostingClassifiernur 10 Bäume (!) in 1 Minute und 2 Sekunden bearbeitet werden :( Ich habe nicht versucht, 500 Bäume zu züchten, da dies Stunden dauern …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
Kurzanleitung zum Trainieren stark unausgeglichener Datensätze
Ich habe ein Klassifizierungsproblem mit ungefähr 1000 positiven und 10000 negativen Proben im Trainingssatz. Dieser Datensatz ist also ziemlich unausgeglichen. Normaler Zufallswald versucht nur, alle Testproben als Mehrheitsklasse zu markieren. Hier finden Sie einige gute Antworten zu Unterabtastungen und gewichteten Zufallsforsten: Was bedeutet es, ein Tree Ensemble mit stark voreingenommenen …

2
Was ist Grundwahrheit?
Im Kontext des maschinellen Lernens habe ich gesehen, dass der Begriff " Grundwahrheit" häufig verwendet wird. Ich habe viel gesucht und folgende Definition in Wikipedia gefunden : Beim maschinellen Lernen bezieht sich der Begriff "Grundwahrheit" auf die Genauigkeit der Klassifizierung des Trainingssatzes für überwachte Lerntechniken. Dies wird in statistischen Modellen …


4
Welche Algorithmen sollte ich verwenden, um eine Jobklassifizierung basierend auf Lebenslaufdaten durchzuführen?
Beachten Sie, dass ich alles in R mache. Das Problem lautet wie folgt: Grundsätzlich habe ich eine Liste von Lebensläufen. Einige Kandidaten haben bereits Berufserfahrung und andere nicht. Das Ziel dabei ist: Ich möchte sie auf der Grundlage des Texts in ihren Lebensläufen in verschiedene Berufsbereiche einteilen. Ich bin besonders …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.