Können maschinelle Lernalgorithmen (CNNs?) Verwendet / trainiert werden, um zwischen kleinen Detailunterschieden zwischen Bildern zu unterscheiden?


8

Ich habe mich gefragt, ob Algorithmen für maschinelles Lernen (CNNs?) Verwendet / trainiert werden können, um zwischen kleinen Detailunterschieden zwischen Bildern (wie geringfügigen Unterschieden in Rottönen oder anderen Farben oder dem Vorhandensein kleiner Objekte zwischen ansonsten sehr ähnlichen Bildern) zu unterscheiden. )? Und dann Bilder anhand dieser Unterschiede klassifizieren? Wenn dies mit unseren aktuellen Algorithmen für maschinelles Lernen ein schwieriges Unterfangen ist, wie kann es gelöst werden? Würde es helfen, mehr Daten (mehr Bilder) zu verwenden?

Ich würde es auch begrüßen, wenn die Leute bitte Hinweise auf Forschungsergebnisse geben könnten, die sich darauf konzentriert haben, wenn möglich.

Ich habe gerade erst angefangen, maschinelles Lernen zu lernen, und das habe ich mir aus meiner Forschung gefragt.

Vielen Dank.

Antworten:


4

Attentive Recurrent Comparators (2017, Pranav Shyam, Shubham Gupta, Ambedkar Dukkipati) ist ein interessantes Papier, das hilft, die Frage zu beantworten, die Sie sich fragen, zusammen mit einem Blog-Beitrag , der hilft, sie einfacher zu beschreiben.

Die Art und Weise, wie es implementiert wird, ist eigentlich ziemlich intuitiv. Wenn Sie jemals ein "Was ist anders" -Spiel mit zwei Bildern gespielt haben, schauen Sie normalerweise zwischen den Bildern hin und her, um den Unterschied zu erkennen. Das Netzwerk, das die Forscher geschaffen haben, macht genau das! Es betrachtet ein Bild und merkt sich dann wichtige Merkmale dieser Bilder und betrachtet das andere Bild und geht hin und her.


2

Es gibt Netzwerke, die aufgebaut sind, um zu lernen, wie man zwischen Klassen unterscheidet, auch wenn sie ziemlich gleich aussehen. Normalerweise wird in diesen Netzwerken ein Triplettverlust verwendet, um den Unterschied zwischen dem Ziel, einer positiven und einer negativen Stichprobe zu ermitteln.

Beispielsweise werden diese Netzwerke verwendet, um eine Identitätsprüfung mit Gesichtsbildern durchzuführen. Der Algorithmus lernt die Unterschiede zwischen verschiedenen Personen, anstatt Personen zu erkennen.

Schlüsselwörter: Unterscheidungsfunktion, Triplettverlust, siamesisches Netzwerk, einmaliges Lernen.

Diese Arbeiten sind interessant:

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.