Wie kann ich über die Rechenleistung und die sm meiner Grafikkarte Bescheid wissen?


15

Ich weiß, dass ich die Rechenkapazität erhalten kann, indem ich nur diese offizielle Cuda-Seite oder diese Wiki-Seite besuche .
Aber ich weiß nicht, wie ich das smvon meiner Karte finden soll. Ist das kurz für shader model? oder shared memory? oder keiner von ihnen?


Wo auf einer dieser beiden Webseiten spricht man von "sm"? Kontext ist alles
carpii

Ich versuche, caffe zu kompilieren, und für den cuda-Teil werden zwei Informationen benötigt, eine ist compute und die andere sm, wie diese `<! - CUDA-Architektur passend für Ihre GPU festlegen. Das Festlegen der richtigen Architektur ist wichtig, um die Ausführungs- und Kompilierungszeit zu minimieren. -> ` <CudaArchitecture>compute_52,sm_52;compute_35,sm_35;compute_30,sm_30</CudaArchitecture>
Rika

1
Hier steht auch sm: devblogs.nvidia.com/parallelforall/… Ich weiß nicht, ob sie dasselbe sind oder sich unabhängig voneinander ändern.
Rika

2
Vielleicht hilft dies docs.nvidia.com/cuda/cuda-c-programming-guide/… Soweit ich weiß, gibt compute_ * die 'Compute Capability' vor, auf die Sie abzielen, und SM legt die minimale SM-Architektur (Hardware) fest. SM bezieht sich in diesem Fall weder auf 'Shader-Modell' noch auf 'Shared Memory', sondern auf Streaming-Multiprozessor. Ich bin nicht sicher, warum irgendjemand compute_ * anders als sm_ * einstellen würde.
Carpii

1
Hier sehen Sie auch, welche APIs für jede Version von 'Supported SM Architecture' verfügbar sind - docs.nvidia.com/cuda/cuda-samples/…
carpii

Antworten:


4

Sie sollten einfach Ihre Rechenleistung von der Seite aus nutzen, auf die Sie verlinkt haben. Wenn Ihre Rechenkapazität beispielsweise 6.1 ist, verwenden Sie sm_61 und compute_61.

SM steht für "Streaming Multiprozessor". Die Argumente werden auf diese verwirrende Weise festgelegt, da sie als Argumente für nvcc verwendet werden, wobei compute_XX die Architektur für eine virtuelle (Zwischen-) Codedarstellung und sm_XX die Architektur für die reale Darstellung festlegt. Sofern Sie keinen triftigen Grund haben, sollten Sie beide auf den gleichen Wert einstellen.


Was ist dann die GeForce RTX 2070? Es ist nicht aufgeführt.
Mathtick

0

Auf dieser Seite können Sie Ihre GPU "Compute Capability" finden: https://developer.nvidia.com/cuda-gpus Verwenden Sie sie sowohl für "compute_xy" als auch für "sm_xy".


Danke, ich weiß es zu schätzen, aber sie sind nicht unbedingt gleich, es gibt gpus, die eine relativ hohe Rechenleistung haben, aber eine sehr niedrige sm! Jemand hat einige Informationen dazu im Abschnitt cm der Frage gepostet. sm bezieht sich tatsächlich auf eine bestimmte API, die von der Grafikkarte unterstützt wird. und ich selbst bin auf dasselbe gestoßen!
Rika

0

Um mehr Informationen über Ihre Grafikkarte zu erhalten, können Sie das verwenden Geeks3D GPU Caps Viewer ( Alternative ) verwenden. Es ähnelt GPU-Z , bietet jedoch einige zusätzliche Informationen, die sich als nützlich erweisen könnten. Wie immer, wenn eine Karte CUDA / OpenCL / Vulkan-kompatibel ist.

Darüber hinaus enthält es einige detailliertere Informationen zu diesen Dingen. Für CUDA könnten die Compute Capability und Shader Clock interessant für Sie sein?


2
Können Sie Ihre Antwort etwas erweitern? Die bloße Erwähnung eines Produkts erklärt nicht wirklich, wie die Lösung erreicht werden kann. Es ist besser, einige Anweisungen zur Verwendung des Produkts zur Behebung des Problems beizufügen oder zumindest zu beschreiben, was das Produkt zu einer guten Lösung macht. Gute Anleitung zum Empfehlen von Software hier: meta.superuser.com/questions/5329/… . Vielen Dank. Aus der LQP-Überprüfungswarteschlange
fixer1234

@ fixer1234 das ist die perfekte antwort, ich spiele nicht dein herrschendes spiel. Bitte störe mich nicht. Bearbeiten oder löschen Sie alles, was Sie wollen.
Uğur Gümüşhan

4
Es ist keine perfekte Antwort.
DavidPostill

1
Bitte lesen Sie Wie empfehle ich Software für einige Tipps, wie Sie Software empfehlen sollten. Sie sollten mindestens einen Link, einige zusätzliche Informationen zur Software selbst und Informationen zur Behebung des Problems in der Frage bereitstellen.
DavidPostill

@ ِ DavidPostill: Es ist nicht so, ein Treffer wurde in den Kommentaren vermerkt, und dies liefert im Gegensatz zu gpuz mehr Informationen über das Problem. Allerdings hat das mein Problem nicht gelöst, aber ich dachte, es ist besser als nichts. es gibt zumindest einige Hinweise auf das Problem.
Rika
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.