Bilderkennung


11

Auf der Suche nach einem Open-Source-System, das die kommerzielle Verwendung der Bilderkennung für eine umfangreiche und organisch wachsende Sammlung von 2D-Bildern ermöglicht, wobei die einzigen bekannten Variationen Folgendes sind:

  • Skalierung der Bildgröße,
  • Der Winkel, den das Bild des Bildes einnimmt,
  • Farbsynchronisations-Offsets, was bedeutet, dass aufgrund von Unregelmäßigkeiten bei der Erfassung und Wiedergabe einer Quellbildfarbe die Farbe von Instanz zu Instanz variiert.
  • Zuschneiden des Fotos,
  • Hinzufügen eines Wasserzeichens oder Textes,
  • Mögliche Fokusvariationen, dh die Aufnahme war nicht scharf, nicht dass ein Bildmanipulationsfilter angewendet wurde.

Ich bin damit einverstanden, dass ich die Anwendung trainieren muss, solange sich die Rendite auszahlt - langfristig erwarte ich jedoch, dass die Anzahl der 2D-Instanzen über die ersten paar Tausend bis Hundert hinaus ansteigt von Tausenden; Aber das ist langfristig und ich würde mich freuen, eine Lösung zu haben, die mit einem Trainingssatz von 1000 Instanzen und 10 Beispielen pro Instanz gut funktioniert.

UPDATE: Die Lizenz muss für die kommerzielle interne Verteilung ohne Veröffentlichung des Quellcodes verwendet werden können, auch intern für alle, die über die Binärdatei verfügen. Der Code wird niemals verkauft, sondern nur intern verwendet, aber nicht jeder Benutzer hat Zugriff auf den Quellcode, nur auf die Benutzeroberfläche.


2
Haben Sie OpenCV in Betracht gezogen?

+1 @pwny: Danke - also nein, ich habe noch nie ein Computer Vision (CV) -System ausprobiert, nur um eine Vorstellung davon zu bekommen, ob die Art und Weise, wie ich über das Problem denke, richtig ist. Ich würde angeben, von was die Bilder sind, aber da es sich um ein Geschäftsunternehmen handelt und das CV-System nur für den internen Gebrauch bestimmt ist, versuche ich nicht anzugeben, was das System verarbeiten wird, sondern welche Herausforderungen es bewältigen wird. Wenn OpenCV die aktuellen Anforderungen erfüllt, senden Sie es bitte als Antwort und versuchen Sie, nach Möglichkeit auf verwandte Dokumente zu verlinken, die die bereitgestellten funktionalen Anforderungen abdecken. Noch einmal Danke!

1
Laut Urheberrecht gibt es keine "interne Verbreitung". Daher stören sich die meisten Lizenzen (alles, was mir bekannt ist) nicht an diesbezüglichen Einschränkungen.
MSalters

+1 @MSalters: Danke, haben Sie einen Link zum "gemäß Urheberrecht" - was bedeutet, dass Sie sagen, dass dies im US-amerikanischen Urheberrecht angegeben ist, obwohl ich vielleicht nur in Ihren Kommentar lese.

1
@blunders: Technisch gesehen stammt es von TRIPS (Artikel 1.3), der festlegt, dass eine juristische Person (z. B. eine Gesellschaft) wie eine natürliche Person behandelt werden soll.
MSalters

Antworten:


10

Es mag ein wenig niedrig sein, aber OpenCV bietet Ihnen möglicherweise die Tools, die Sie zum Erstellen einer solchen Bilderkennungssoftware benötigen. Natürlich bietet OpenCV nicht sofort alles, was Sie brauchen (ich glaube, ich bin kein Profi), aber es zielt darauf ab, das zu liefern, was für Echtzeit-Computer-Vision benötigt wird.

Sie können auf die Dokumentation zu lesen beginnen hier . Auf dieser Seite sind auch einige gute Bücher aufgeführt.

Hoffe das hilft, viel Glück!


Bedeutet die GPLV2-Lizenz von OpenCV, dass sie nicht intern in einem Closed-Source-System verteilt werden kann? Vielen Dank!

Wo sehen Sie die GPLV2-Lizenz? Im ersten Absatz der Homepage wird es als BSD-Lizenz aufgeführt.

@deterb: In der Fußzeile ganz unten auf der Seite.

@deterb: Anscheinend ist der GPL-Link für die MoinMoin Wiki Engine, die für das Wiki für OpenCV verwendet wird, nicht für OpenCV - danke, dass Sie auf meinen Fehler hingewiesen haben!

+1 @pwny: Wie bereits erwähnt, steht OpenCV unter einer BSD-Lizenz, die auf der Homepage der Website angegeben ist (die GPLV2-Fußzeilenlizenz gilt anscheinend nicht für OpenCV). Sie haben ebenfalls versucht, dies durch Herunterladen von OpenCV und Suchlizenz zu bestätigen alle seine Dateien; die unter anderen Lizenzen von Drittanbietern eine Lizenz zurückgeben, die anscheinend für OpenCV in Form einer BSD-Lizenz gilt, obwohl sie nicht angibt, dass es sich um eine BSD-Lizenz handelt. Wenn Sie fortfahren, ist Ihre Antwort eine große Hilfe und scheint gut genug zu sein, um vorwärts zu kommen. Vielen Dank!


2

Um die Diskussion zu erweitern, arbeite ich derzeit an der Bildanpassung und habe festgestellt, dass der ORB von OpenCV kostenlos ist. jedoch SURF und SIFT ist es nicht. Sie können dieses Beispiel als möglichen Ausgangspunkt betrachten.


1

Pastec http://www.pastec.io sollte die Anforderungen der ersten Frage erfüllen.

Es ist eine Open-Source- Index- und Suchmaschine für die Bilderkennung, die unter der LGPL veröffentlicht wurde. Mithilfe einer einfachen HTTP-API können auf einfache Weise übereinstimmende Bilder im Index hinzugefügt, entfernt und gesucht werden. Es basiert auf OpenCV und verwendet den ORB-Deskriptor, der im Gegensatz zu SURF und SIFT patentfrei ist.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.