Maxout-Netzwerke waren eine einfache, aber brillante Idee von Goodfellow et al. von 2013 bis max Feature Maps, um einen universellen Approximator für konvexe Aktivierungen zu erhalten. Das Design wurde für die Verwendung in Verbindung mit Dropout (damals erst kürzlich eingeführt) zugeschnitten und führte natürlich zu hochmodernen Ergebnissen bei Benchmarks wie CIFAR-10 und SVHN.
Fünf Jahre später ist Dropout definitiv noch im Spiel, aber was ist mit Maxout? Das Papier wird laut Google Scholar in neueren Veröffentlichungen immer noch häufig zitiert, aber es scheint, dass kaum jemand die Technik tatsächlich verwendet.
Ist Maxout also Vergangenheit, und wenn ja, warum - was hat es 2013 zu einem Top-Performer gemacht, aber nicht 2018?