Als «machine-learning» getaggte Fragen

Algorithmen für maschinelles Lernen erstellen ein Modell der Trainingsdaten. Der Begriff "maschinelles Lernen" ist vage definiert; Es umfasst das, was auch als statistisches Lernen, Bestärkungslernen, unbeaufsichtigtes Lernen usw. bezeichnet wird. Fügen Sie immer einen spezifischeren Tag hinzu.

1
Klassifizierung von Gesprächen anhand von Inhalten
Ich möchte in der Lage sein, einen Klassifikator zu entwerfen, der zwischen verschiedenen Arten von Gesprächen unterscheiden kann (nicht unbedingt etwas über Stimmung, Aufrichtigkeit oder Ergebnis aussagen, das ist etwas zu weit hergeholt). Zu wissen, dass unter 50 Stichproben von Gesprächen 10 beide Parteien einbeziehen, die Informationen über ein zukünftiges …

3
Wie werden Klassifikationen in einem Ensemble-Klassifikator zusammengeführt?
Wie verschmilzt ein Ensemble-Klassifikator die Vorhersagen seiner konstituierenden Klassifikatoren? Ich habe Schwierigkeiten, eine klare Beschreibung zu finden. In einigen Codebeispielen, die ich gefunden habe, mittelt das Ensemble nur die Vorhersagen, aber ich sehe nicht, wie dies zu einer "besseren" Gesamtgenauigkeit führen könnte. Betrachten Sie den folgenden Fall. Ein Ensemble-Klassifikator besteht …



2
Warum der seltene Einsatz von Techniken des maschinellen Lernens in der translationalen Biomedizin?
Dies folgt auf eine frühere Frage. Hier : Neuronales Netzwerkmodell zur Vorhersage des Behandlungsergebnisses und könnte als Hinweis auf einen anderen Aspekt dieser Frage angesehen werden: Anwendung maschineller Lerntechniken in klinischen Studien mit kleinen Stichproben Vielen Dank an Zach, der vorgeschlagen hat, neu zu posten. Ich habe jetzt ziemlich ernsthaft …


3
Feature-Konstruktion in R.
Ich frage mich, ob es in R Algorithmen (möglicherweise genetische Algorithmen) für die Merkmalskonstruktion gibt (Ableiten von Prädiktorkandidaten von vorhandenen Prädiktoren). Ich denke an eine Routine zum Testen von Potenzen höherer Ordnung, Wechselwirkungen, Verhältnissen und linearen Kombinationen sowie nichtlinearen Funktionen vorhandener Variablen (sin, cos, atan usw.). Dies kann eine Filter- …

1
Zufällige Generierung von Scores ähnlich denen eines Klassifizierungsmodells
Hallo Zahlenkollegen Ich möchte n zufällige Bewertungen (zusammen mit einer Klassenbezeichnung) generieren, als ob sie von einem binären Klassifizierungsmodell erzeugt worden wären. Im Detail sind folgende Eigenschaften erforderlich: Jede Punktzahl liegt zwischen 0 und 1 Jede Punktzahl ist mit einer binären Bezeichnung mit den Werten "0" oder "1" verknüpft (letztere …


2
Kreuzvalidierung in sehr hohen Dimensionen (um die Anzahl der verwendeten Variablen in sehr hohen Dimensionen auszuwählen)
Meine Frage betrifft die Kreuzvalidierung, wenn es viel mehr Variablen als Beobachtungen gibt. Um Ideen zu fixieren, schlage ich vor, mich auf den Klassifizierungsrahmen in sehr hohen Dimensionen zu beschränken (mehr Merkmale als Beobachtung). Problem: Angenommen, Sie haben für jede Variable ein Maß für die Wichtigkeit als das Interesse des …

2
Warum möchten viele Menschen verzerrte Daten in normalverteilte Daten für maschinelle Lernanwendungen umwandeln?
Bei Bild- und Tabellendaten wandeln viele Personen die verzerrten Daten während der Vorverarbeitung in normalverteilte Daten um. Was bedeutet die Normalverteilung beim maschinellen Lernen? Ist es eine wesentliche Annahme von Algorithmen für maschinelles Lernen? Sogar bei den Bilddaten habe ich eine Quantiltransformation gesehen, die die gesamten Pixel eines Bildes transformiert, …


2
Auswählen der Anzahl der Cluster - Kriterien für die Clustervalidierung im Vergleich zu domänentheoretischen Überlegungen
Ich stehe oft vor dem Problem, eine bestimmte Anzahl von Clustern auswählen zu müssen. Die Partition, die ich am Ende wähle, basiert häufiger auf visuellen und theoretischen Bedenken als auf Qualitätskriterien. Ich habe zwei Hauptfragen. Der erste betrifft die allgemeine Idee der Clusterqualität. Soweit ich weiß, schlagen Kriterien wie der …

2
Verständnis des frühen Stopps in neuronalen Netzen und seiner Auswirkungen bei der Verwendung der Kreuzvalidierung
Ich bin ein bisschen beunruhigt und verwirrt über die Idee, wie die Technik des frühen Stoppens definiert wird. Wenn Sie sich Wikipedia ansehen , ist es wie folgt definiert: Teilen Sie die Trainingsdaten in einen Trainingssatz und einen Validierungssatz auf, z. B. im Verhältnis 2 zu 1. Trainieren Sie nur …

2
Was ist der Unterschied zwischen Ökonometrie und maschinellem Lernen?
Nach meinem Verständnis schätzt die Ökonometrie partielle ( ceteris paribus ) Korrelationen mit dem Ziel, primär kausale Zusammenhänge abzuschätzen . Dafür wird normalerweise der gesamte verfügbare Datensatz verwendet . Ökonometrie kann parametrisch und nicht parametrisch sein. In der Zwischenzeit interessiert sich maschinelles Lernen nicht für Kausalität, sondern für "Fit" mit …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.