Ich las Hintons neues Papier "Dynamisches Routing zwischen Kapseln" und verstand den Begriff "Aktivitätsvektor" in der Zusammenfassung nicht.
Eine Kapsel ist eine Gruppe von Neuronen, deren Aktivitätsvektor die Instanziierungsparameter eines bestimmten Entitätstyps wie eines Objekts oder eines Objektteils darstellt. Wir verwenden die Länge des Aktivitätsvektors, um die Wahrscheinlichkeit darzustellen, dass die Entität existiert, und ihre Ausrichtung, um die Instanziierungsparameter darzustellen. Aktive Kapseln auf einer Ebene machen über Transformationsmatrizen Vorhersagen über die Instanziierungsparameter von Kapseln höherer Ebene. Wenn mehrere Vorhersagen übereinstimmen, wird eine Kapsel höherer Ebene aktiv. Wir zeigen, dass ein diskriminierend trainiertes mehrschichtiges Kapselsystem auf MNIST eine Leistung auf dem neuesten Stand der Technik erzielt und bei der Erkennung stark überlappender Ziffern erheblich besser ist als ein Faltungsnetz. Um diese Ergebnisse zu erzielen, verwenden wir einen iterativen Routing-by-Agreement-Mechanismus:
https://arxiv.org/pdf/1710.09829.pdf
Ich dachte, ein Vektor ist wie ein Array von Daten, die Sie durch das Netzwerk laufen lassen.
Ich habe angefangen, Andrew Ngs Deep-Learning-Kurs durchzuarbeiten, aber es ist alles neu und Begriffe gehen mir über den Kopf.