Wie viele „MegaPixel“ kann das menschliche Auge sehen?


28

Es gibt offensichtlich eine Grenze für die Verarbeitung durch den menschlichen Körper, z. B. Frames pro Sekunde. Meine Frage ist, wie viele Megapixel würde es dauern, bis das menschliche Auge es nicht mehr vom Leben unterscheiden kann?

Bonus für die Aufnahme einer Antwort für andere Arten.


5
Die 'Grenzen', die Sie für offensichtlich halten, sind nicht einmal aus der Ferne offensichtlich. Zum einen haben unsere Augen und unser Gehirn keine Bilder pro Sekunde. Zweitens sehen wir letztendlich mit unserem Gehirn und nicht mit unseren Augen, was das Problem noch komplizierter macht.
Whatsisname

1
Manchmal muss eine Analogie zu einer bekannten quantifizierbaren Quelle angegeben werden, um die Frage vollständig zu verstehen.
Spechal

1
@whatsisname Wir sehen mit unserem Gehirn? Sicherlich läuft es darauf hinaus, dass OP wissen will, ob er eine Linse auf ein Auge und das Auge auf einen Computer gehackt hat, was die Obergrenze der Information ist, die er bekommen könnte.
James

1
Es gibt Macken des menschlichen Gehirns, die diese Frage wie falsche Farben und Dinge knifflig machen.
James

Antworten:


28

Fragen zu Framerate, Auflösung oder Dynamik des menschlichen Auges und deren Vergleich mit Kameras haben immer die gleichen Probleme:

  1. Das "Bild", das Sie sehen, ist keine "Einzelbelichtung", das Auge bewegt sich ständig und passt sich an.

  2. Der Teil des Gehirns, der mit dem Sehen umgeht, ist wirklich gut (und ziemlich groß), er kombiniert ständig die "Rahmen", die vom Auge abgenommen werden und füllt die Lücken aus.

Grundsätzlich ist jedes Bild, das Sie mit Ihren Augen sehen, ein HDR-Panorama, das mit inhaltsbewusster Füllung fixiert wurde (und genau wie bei einer Kamera können Sie HDR-Panoramen mit beliebig hoher Auflösung und DR erstellen).

Außerdem funktioniert das Auge / Gehirn nur in dem Teil der Szene, auf den Sie sich konzentrieren. Sie erhalten eine erstaunlich hohe Auflösung für den winzigen Teil der Welt, über den Sie gerade nachdenken - für den Rest der Szene tun Sie das nicht wirklich "sieh" es überhaupt, du musst die Dinge nur wirklich bemerken, wenn etwas gefährliches auf dich zukommt (deshalb lenkt die Bewegung an den Seiten so ab).


Das ist der Grund, warum das, was wir sehen, in einer viel höheren Auflösung vorliegt, als die physikalischen Eigenschaften unserer Augen es uns ermöglichen, uns wirklich zu registrieren. Der schärfste Teil befindet sich ebenfalls genau in der Mitte unseres Sichtfeldes, näher an den Kanten verschlechtert sich die Auflösung schnell.
Emiel

2
@Emiel - nicht genau das Zentrum - um das genaue Zentrum, in genau dem Zentrum haben wir einen günstig gelegenen toten Winkel
Nir

3
Weder die Fovea noch der tote Winkel liegen genau auf der optischen Achse, aber die Fovea ist näher als der tote Winkel.
Coneslayer

Noch etwas zu beachten: Die Augen sind ziemlich locker. Wenn Sie ein Auge betrachten, das sich in Zeitlupe bewegt, können Sie bemerken, dass es zittert. Mit diesem Jitter interpoliert unser Gehirn die Bilder, um die Auflösung zu erhöhen.
SinisterMJ

13

Wenn Sie die technischen Daten des menschlichen Auges betrachten, als wäre es eine Kamera, werden Sie feststellen, dass sie ziemlich leise ist.

  • Sehr niedrige Auflösung in Bezug auf Pixel - sehr wenige Megapixel - wobei sich die meisten Pixel auf einen sehr kleinen Bereich in der Mitte konzentrieren. Praktisch keine Möglichkeit, feine Details außerhalb eines kleinen Bereichs in der Mitte des Rahmens zu erkennen.

  • Schreckliche extreme chromatische Aberration, sphärische Aberration und Rauschen.

  • Die minimale und maximale Fokussierentfernung verschlechtert sich mit dem Alter, und viele Modelle weisen ab Werk Mängel auf.

Der Grund, warum dies nicht zählt, ist, dass das Messen des Auges als ob es eine Kamera wäre, keinen Sinn ergibt: Das Bild, das wir sehen, wird von unserem Gehirn erzeugt, das unzählige von unseren Augen aufgenommene Bilder fehlerfrei und kontinuierlich zusammenfügt und verarbeitet.

Während das Auge im Zentrum unseres Sehens nur einen sehr kleinen Bereich hat, der wirklich Details erkennen kann, verfügt das Gehirn über einen motorischen Mechanismus, der das Auge herumwirbelt, um Hunderte von schnellen Bildproben nacheinander aufzunehmen , fügt dies dann zu einem großen Bild zusammen (mit drei Dimensionen und Bewegung!).

Sie würden Hunderte von Megapixeln Auflösung und ein nahezu makelloses Objektiv benötigen, um das zusammengesetzte Bild, das das Gehirn zusammensetzt, zu reproduzieren, obwohl das Auge für sich allein bei weitem nicht in der Lage ist, etwas so Gutes zu tun.


Woher hast du <1MP?
James

Nur eine Vermutung - ich habe hauptsächlich versucht, einen Punkt zu veranschaulichen, bei dem unser Auge wirklich nur in einem winzigen Bereich in der Mitte seines Blickfelds viel Detail sehen kann.
Thomasrutter

2
Unser Auge hat ungefähr 6-7 Millionen Zapfen in seinen Augen, das wäre also die absolute maximale Auflösung. Da die äußeren Regionen eher spärlich sind (siehe hyperphysics.phy-astr.gsu.edu/hbase/vision/rodcone.html ), würde ich davon ausgehen, dass etwa 6 Millionen Kegel -> Megapixel sind. Die Pixel auf dem Kamerasensor werden von einem Bayer-Filter maskiert, so wie die Zapfen unserer Augen nur für bestimmte Farben sichtbar sind. Ich denke, die <1M ist zu wenig.
SinisterMJ

1
einwandfrei könnte zu stark sein. Es scheint einwandfrei zu sein, weil das Gehirn auch die Geschichte erzählen kann.
Caleb

5

Wie viele "Pixel" das menschliche Auge erfasst, beantwortet die Frage nicht wirklich. Dies ist nur dann der Fall, wenn beispielsweise das mit einer Kamera aufgenommene Bild so vergrößert wird, dass es das gesamte Sichtfeld des Betrachters einnimmt. Bei dieser Größe hätte das Originalfoto ungefähr 576 Mp betragen müssen.

Details für ein Bild werden normalerweise in DPI (Punkte pro Zoll) gemessen, und selbst dann müssen die Größe und der Abstand zum Betrachter festgelegt werden, um zu bestimmen, wie dicht die Punkte sein müssen, damit das menschliche Auge nicht länger sein kann in der Lage zu sagen, dass sie Punkte sind.

Hochwertiger Druck für den durchschnittlichen Leseabstand (18-24 Zoll) liegt in der Größenordnung von 5-10 K DPI. Für ein 1-Zoll-Quadratbild (@ 10K) sind das 100 Mp genau dort ... für ein 1-Zoll-Bild.

Das Problem ist, dass, obwohl eine allgemeine Szene möglicherweise nur 576 Mp benötigt, wenn das Auge tatsächlich auf eine bestimmte Region fokussiert, die gesamte Schärfe auf diese Region wirkt. Daher muss ein 1 x 1-Zoll-Bild eine viel höhere Dichte aufweisen, um das Auge "täuschen" zu können.

Damit ein Bild groß genug und dennoch so detailliert ist, dass es fokussiert werden kann, ist die Anzahl der Megapixel enorm. Deshalb sieht man Brillen, die benutzt werden. Der Bildschirm ist viel näher am Auge, wodurch das Bild dichter und dennoch größer erscheint.

Angenommen, Sie haben eine 5-MP-Kamera. Das sind ungefähr 2.200 x 2.200 Pixel. Wenn der Sensor (CCD) ungefähr 1 Zoll x 1 Zoll groß ist, haben Sie es auf 2.200 DPI geschätzt.

Jetzt blasen Sie das auf ein 8 in x 8 in Foto, und es ist nur 275 DPI. Bei weitem nicht die 5000 DPI, die Sie für einen qualitativ hochwertigen Druck benötigen. (Allerdings, wenn Sie es aus 8-facher Entfernung betrachten ...)

Um ehrlich zu sein, sind 2K DPI für einen Standarddruck (bei Leseabstand) zulässig, und wenn ein Foto auf einem kleinen Bildschirm (oder Ausdruck) angezeigt wird, sieht es viel "echter" aus.

Um ein 4x5 @ 5K DPI zu erhalten, benötigen Sie 500 Mp. @ 2K würdest du noch 80 Mp brauchen. Grob gesagt entspricht eine 24-Mp-Kamera (CCD) einer 35-mm-Filmqualität.

Natürlich gibt es viele Verbesserungstechniken, mit denen Sie die fehlende Dichte "ausfüllen" können, wenn Sie ein digitales Bild haben.

Wenn Sie jedoch große Bilder benötigen, können Sie Old-Fashion-Filme in viel größeren Formaten erstellen als CCDs (z. B. 8-Zoll-X-10-Zoll-Filme: http://answers.yahoo.com/question ).


6
Quelle auf dieser 576 mp Nummer?
Fake Name

In solchen Situationen muss ich die Verwendung von DPI wirklich unterbinden. DPI steht für DOTS per inch. Ein Punkt ist ein willkürliches Maß ... und es bedeutet verschiedene Dinge in verschiedenen Kontexten. Der einzig zutreffende Begriff ist PPI (Pixel pro Zoll), da dies das kleinste vollständige Element des BILDES ist, mit dem Sie als Fotograf arbeiten können.
jrista

Ich muss auch darum bitten, dass auf die Postulationen in dieser Antwort verwiesen wird. Ich weiß, woher die 576mp-Nummer kommt, aber es ist eine nicht referenzierte Nummer für jeden Gelegenheitsleser. Einige Ihrer Zahlen sind absolut falsch, es sei denn, Sie verwenden gemischte Bedeutungen für den Begriff "DPI" (der in diesem Zusammenhang bereits als schrecklicher Begriff erwähnt wurde). Die minimal erforderliche räumliche Druckauflösung VERRINGERT sich. Unter der Annahme , etwas höher als der Durchschnitt der Sehschärfe (sagen 20/18), ein Druck auf 18" würde 230PPI nur brauchen jemanden Unter der Annahme , mit hoher Sehschärfe ....
jrista

1
... wie 20/10 würde man 280ppi brauchen. Bei 24 "sinkt diese Zahl auf 210ppi! (Bei den meisten Tintenstrahldruckern ist DPI ein fester Faktor. Die Standardeinstellung für Punkte pro Zoll bei einer Canon ist immer 4800 x 2400, bei einer Epson 5760 x 1440 ... unabhängig davon Die tatsächliche Auflösung des gedruckten Bildes.) Tut mir leid, aber Ihre Fakten sind verzerrt, verwirrt und in einigen Fällen einfach falsch. Bitte sehen Sie meine Antwort hier .
jrista

4

Die Nummer 576MP, die hier von Roger Clark abgeleitet wird , ist eine EXTREM ROHE NÄHERUNG. Zum einen handelt es sich um eine konservative Schätzung bei einem 120 ° -FOV, wenn das menschliche Sehen näher bei 180 ° liegt (was tatsächlich 1,3 GIGAPIXEL ergibt !!!). Außerdem wird die Tatsache ignoriert, dass wir einen 2 ° -Fovealpunkt in der Nähe des Zentrums von haben Unsere Augen, in denen unsere Sehschärfe am höchsten ist, und ein größerer Bereich von 10 °, in dem unsere Sicht anständig ist, aber nicht wirklich "gut" und mit Sicherheit nicht ausgezeichnet (als schneller Test ... sehen Sie, wie viel Text in dieser Antwort tatsächlich vollständig klar ist , und wie viel ist tatsächlich undeutlich und unlesbar, wenn Sie für einen bestimmten Zeitraum genau die gleiche Stelle betrachten ... Sie könnten überrascht sein, wie viel Ihres Bildschirms Sie nicht in wirklich aussagekräftigen Details analysieren können.) An der Peripherie unserer Sehvermögen, Schärfe ist ziemlich niedrig, Farbtreue fehlt usw.

Meiner Meinung nach ist es nicht gültig, menschliches Sehen in Megapixeln zu beschreiben. Ich habe großen Respekt vor Roger Clark, aber sein Artikel muss ins richtige Licht gerückt werden: Er setzt maximale Sehschärfe über das gesamte Sichtfeld voraus! Entscheidend dabei ist, dass unsere maximale Sehschärfe nur einen kleinen Bereich des zentralen Teils unseres Sehvermögens betrifft. Ein Bereich, der wahrscheinlich nicht einmal einen einzigen 8 x 10 "-Druck abdeckt, der einen Fuß entfernt angezeigt wird ... für den Druck sind weniger als 9 Megapixel (3330 x 2664 Pixel) mit 333 ppi erforderlich ( die erforderliche Auflösung für einen Betrachtungsabstand von einem Fuß ).

Theoretisch würde man immer weniger Megapixel benötigen, um weiterhin Ringe mit einer Größe von 8 x 10 "zu drucken, die einen zentralen Kreis bilden, um das gesamte Sichtfeld des Menschen auszufüllen. Unter dem Gesichtspunkt der realen Schärfe benötigt man wahrscheinlich 1/3 weniger Megapixel pro" Ring "von Drucke (grobe Vermutung) und möglicherweise vier Ringe von Drucken, um das Sichtfeld "von Ecke zu Ecke" vollständig auszufüllen. Dies entspricht insgesamt weniger als 85 Megapixeln!

Das heißt ... Ich glaube immer noch nicht, dass es richtig oder nützlich ist, die menschliche Sehschärfe in Megapixeln zu beschreiben. Wir haben eine unterschiedliche Sehschärfe von der Mitte bis zum Rand unseres Sichtfelds, mit einem raschen Abfall außerhalb einer zentralen Region mit hoher Sehschärfe von 4 bis 5 °.


4

Überblick.

Eine sehr schwierige, aber interessante Frage. Es gibt eine wichtige Sache, bevor wir anfangen. Das Gehirn löscht sofort nicht benötigte Informationen und konzentriert sich auf Dinge, an die es sich zu erinnern lohnt. Was Sie "sehen", stimmt nicht mit den technischen Fähigkeiten des Auges überein. Aber für seine technischen Fähigkeiten; Es gibt eine Reihe von Schätzungen von 5 bis über 500 Megapixeln.

Hinweis: Keine dieser Berechnungen wird wissenschaftlich akzeptiert.

Menschliche Augen.

Ein Mensch mit 20/20 Sehvermögen ist in der Lage, das Äquivalent einer 52-Megapixel-Kamera aufzulösen (unter der Annahme eines Blickwinkels von 60 °). Dies basiert darauf, dass jede Stab- und Kegelzelle ein Megapixel darstellen kann. Es gibt ungefähr 7 Millionen Zapfen (die viel Licht benötigen und Farbe liefern) und 120 Millionen Stäbchen (bei schlechten Lichtverhältnissen arbeiten, keine Farbe ausgeben, nicht immer aktiviert). Zusammen schaffen diese irgendwo zwischen 50-500MP . (Wirklich ungefähr!). Weniger konservative Schätzungen gehen von über 500 Millionen Megapixeln aus.

Keiner dieser Artikel wurde einer Peer-Review unterzogen, so dass für keine dieser Ideen eine wissenschaftliche Durchführbarkeit besteht. Bei der Schätzung von 567 MP wird kein Standbild vorausgesetzt. Dabei werden winzige Winkelschwingungen berücksichtigt, mit denen die Augen mehr Informationen sammeln. Die Schätzung berücksichtigt auch ein breiteres Sichtfeld (120˚) (daher hat es mehr MP als es Photorezeptoren gibt).

Dieser Artikel bestreitet diese hohen Schätzungen und sagt "solche Berechnungen sind irreführend". Unter anderem bei schlechten Lichtverhältnissen und ohne Verschlusszeit ergibt sich der bemerkenswerteste Unterschied zwischen einem Bild und Ihrem Sehvermögen aus der Art und Weise, wie sich Ihre Augen auf etwas konzentrieren.

Nur die zentrale Vision ist 20/20. Das Gesamtbild ist hübsche Hosen von der Mitte entfernt. Nur 20 ° außermittig lösen unsere Augen nur ein Zehntel der Detailgenauigkeit auf. An der Peripherie erkennen wir nur großflächigen Kontrast und minimale Farbe. Auf dieser Grundlage kann ein einziger Blick der Augen daher nur Details wahrnehmen, die mit einer 5-15-Megapixel- Kamera vergleichbar sind (je nach Sehvermögen). Das Auge muss deshalb mehrmals hinschauen und auch dann bleiben nur die einprägsamen Texturen, Farben und Formen in Erinnerung.

Andere Tiere.

Falke. Dies ist wahrscheinlich das, was die meisten Menschen als Raubvogel mit Adleraugen kennen. Sie haben etwa die fünffache Dichte von Fotorezeptoren als wir. Nehmen wir also an, sie haben ein Viertel eines Gigapixels ( 250 MP-5,5 GP ). Was ist besser an diesen Jungs als wir, dass sie viel mehr Nerven haben als wir? Es gibt keine sichere Aussage, die auf eine bessere Auflösung hinweist, aber sie weist darauf hin, dass mehr Informationen von ihren Augen an das Gehirn weitergeleitet werden.

http://en.wikipedia.org/wiki/Hawk#Eyesight

Mantis Shrimp. Wir haben 3 Arten von Farbphotorezeptoren (Kegelzellen). Wissenschaftler haben 16 Farbrezeptoren in Mantis-Garnelen identifiziert . Offensichtlich ist dies für uns unverständlich. Darüber hinaus hat dies nichts mit der Auflösung zu tun, aber die Farbtiefe dieser Typen ist phänomenal.



2

Nach allem, was ich lese, muss man bei der Erörterung des endgültigen Auflösungsvermögens des Auges bedenken, dass Fovea der einzige Teil der Netzhaut ist, der in der Lage ist, feine Details zu erkennen. Die Größe dieser Region auf unserer Netzhaut ist recht klein, sodass wir unsere Augen ständig anpassen müssen, damit das „Motiv“ auf diesen Bereich fallen kann. Tatsächlich ist es so klein, dass selbst wenn wir uns auf ein kleines Objekt konzentrieren, wir es überfliegen müssen, wir nicht einmal die Details eines kleinen Objekts auf einmal auflösen können. Wie groß kann ein Bereich mit maximaler Klarheit aufgelöst werden, ohne die Augen zu verzerren? Dieser Bereich hat einen Durchmesser von ungefähr dem Abstand zwischen den beiden Punkten eines Doppelpunkts, der bei einem normalen Ableseabstand abgelesen wird.

In Bezug auf Bilder pro Sekunde glaube ich, dass die Äquivalenz für Menschen 1/10 Sekunde beträgt. Probieren Sie ein Experiment aus - während Sie an einer Ampel stehen, bemerken Sie, dass die Details der Leichtmetallräder auf den Autos, die Ihren Weg kreuzen, unscharf sind. Während Sie einem mit Ihren Augen folgen, tippen Sie (nicht schlagen) auf die Seite Ihres Kopfes an der Schläfe. Dies wird Ihre Augen beunruhigen und manchmal werden Ihre Augen für den kürzesten Moment mit einem Teil des Rads „schwenken“, der seine Details enthüllt.


2

Eine einfache Antwort auf diese Frage wäre 2 Megapixel. Ich meine es so. Hier ist eine wissenschaftliche Erklärung für diese MindLabs .

Das menschliche Auge sieht überhaupt nicht gut. Wenn wir nah fokussieren, sind wir wirklich selektiv, dass es gleich f1 sein kann. Die 99% der Szene sind zu unscharf.

Wir haben auch einen toten Winkel, der im obigen Link erklärt wird.

Außerdem können wir keine Szene einfrieren, die nicht einmal mit einer billigsten Kamera vergleichbar ist.

Zusammenfassend kann man sagen, unser Auge saugt, aber unser Gehirn gleicht das zu gut aus, als dass wir alle glauben, dass wir besser sind als jede Kamera auf dem Markt.


2
Oder anders ausgedrückt: Wir sind aufgrund unserer hervorragenden Nachbearbeitung besser als jede andere Kamera auf dem Markt.
Mattdm

0

576 Megapixel - das geht aus einem Artikel des Wissenschaftlers und Fotografen Roger Clark hervor , der auch mehr über das menschliche Auge und seine Entsprechungen zur Digitaltechnik erzählt ...


1
Der Artikel enthält die richtige Antwort, aber bitte fassen Sie die kritischen Teile in Ihrer Antwort zusammen.
Itai

2
Die Frage stellte speziell "Wie viele Megapixel". Diese Antwort gibt eine einfache, prägnante Antwort auf diese Frage und zitiert einen Verweis. Der kritische Teil ist die Nummer - 576 MP.
Michael C

1
Ja, aber ich hätte gerne eine Erklärung, warum diese Megapixel nicht direkt mit denen eines digitalen Bildes vergleichbar sind.
Itai

0

Es gibt ungefähr 120 Millionen Stäbchen und ungefähr 6 Millionen Zapfen, daher sollte die maximale theoretische Auflösung des menschlichen Auges (unter Berücksichtigung einer perfekten optischen Lichtdurchlässigkeit in der Netzhaut) bei ungefähr 2 Megapixeln liegen (für ein RGB-Triplett sind 3 Zapfen erforderlich) Hoher Dynamikumfang in den Randbereichen (dafür sind die Stäbe da).


Schlagen Sie vor, dass die Stäbe überhaupt nicht zu unserer Auflösungskraft beitragen?
Mattdm

Und dass unser Gehirn keine Interpolation / Integration ähnlich wie beim Bayer-Demosaicing durchführt?
Mattdm

Schauen Sie sich an, wie sie verteilt sind und wofür sie bestimmt sind (in der Peripherie des Auges, monochromes Nachtsichtfeld). aber sie sind natürlich nützlich, um Raubtiere auf sich zukommen zu sehen!). Und die tatsächliche räumliche Auflösung für ein demosaikiertes Bayern-Muster ist geringer als die angegebenen MPx (fragen Sie die Foveon-Leute: p).
Fortran
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.