Wie ich verstehe, ist ein Perzeptron / einschichtiges künstliches neuronales Netzwerk mit einer logistischen Sigmoid-Aktivierungsfunktion dasselbe Modell wie eine logistische Regression. Beide Modelle ergeben sich aus der Gleichung:
Der Perzeptron-Lernalgorithmus ist online und fehlergesteuert, während die Parameter für die logistische Regression mithilfe verschiedener Batch-Algorithmen wie Gradientenabstieg und BFGS mit begrenztem Speicher oder eines Online-Algorithmus wie stochastischer Gradientenabstieg gelernt werden können. Gibt es weitere Unterschiede zwischen der logistischen Regression und einem Sigma-Perzeptron? Sollten die Ergebnisse eines mit stochastischer Gradientenabnahme trainierten logistischen Regressors mit denen des Perzeptrons vergleichbar sein?