Zunächst müssen wir über Transferlernen sprechen. Stellen Sie sich vor, Sie haben ein neuronales Netzwerk über einen Datensatz von Bildern trainiert, um Katzen zu erkennen. Sie können einen Teil des Trainings verwenden, das Sie durchgeführt haben, um über ein anderes zu arbeiten, um etwas anderes zu erkennen. Das ist als Transferlernen bekannt.
Um das Transferlernen durchzuführen, entfernen Sie die letzte vollständig verbundene Ebene aus dem Modell und schließen dort Ihre Ebenen an. Die "abgeschnittene" Modellausgabe wird die Funktionen sein, die Ihr "Modell" füllen. Das sind die Engpassmerkmale.
VGG16 ist ein Pretrain-Modell über den ImageNet-Katalog, das eine sehr gute Genauigkeit aufweist. In dem Beitrag, den Sie geteilt haben, wird dieses Modell als Basis verwendet, um Katzen und Hunde mit einer höheren Genauigkeit zu erkennen.
Die Engpassfunktionen hängen vom Modell ab. In diesem Fall verwenden wir VGG16. Es gibt andere vorgefertigte Modelle wie VGG19, ResNet-50
Es ist, als würden Sie ein Modell schneiden und Ihre eigenen Ebenen hinzufügen. Hauptsächlich die Ausgabeebene, um zu entscheiden, was Sie erkennen möchten, die endgültige Ausgabe.