Als «cpu-architecture» getaggte Fragen

Die Hardware-Mikroarchitektur (x86, x86_64, ARM, ...) einer CPU oder eines Mikrocontrollers.

3
atomare Betriebskosten
Was kostet die atomare Operation (Vergleich und Austausch oder atomares Addieren / Dekrementieren)? Wie viel Zyklen verbraucht es? Wird es andere Prozessoren auf SMP oder NUMA anhalten oder Speicherzugriffe blockieren? Wird der Nachbestellungspuffer in einer außer Betrieb befindlichen CPU geleert? Welche Auswirkungen werden auf den Cache haben? Ich interessiere mich …

4
Was sind Stalled-Cycles-Frontend und Stalled-Cycles-Backend im Ergebnis 'Perf Stat'?
Weiß jemand, was die Bedeutung von Blocked-Cycle-Frontend und Stalled-Cycle-Backend im Perf-Stat-Ergebnis bedeutet? Ich habe im Internet gesucht, aber keine Antwort gefunden. Vielen Dank $ sudo perf stat ls Performance counter stats for 'ls': 0.602144 task-clock # 0.762 CPUs utilized 0 context-switches # 0.000 K/sec 0 CPU-migrations # 0.000 K/sec 236 …

6
Erkennen der Kompilierungszeit der CPU-Architektur
Was ist der zuverlässigste Weg, um die CPU-Architektur beim Kompilieren von C- oder C ++ - Code herauszufinden? Soweit ich das _M_X86beurteilen kann, haben verschiedene Compiler ihre eigenen nicht standardmäßigen Präprozessordefinitionen ( in MSVS __i386__, __arm__in GCC usw.). Gibt es eine Standardmethode zum Erkennen der Architektur, für die ich baue? …

5
Warum ist ein bedingter Umzug nicht anfällig für Branch Prediction Failure?
Nachdem ich diesen Beitrag gelesen hatte (Antwort auf StackOverflow) (im Optimierungsabschnitt), habe ich mich gefragt, warum bedingte Verschiebungen nicht für Branch Prediction Failure anfällig sind. Ich habe hier einen Artikel über Cond Moves gefunden (PDF von AMD) . Auch dort beanspruchen sie den Leistungsvorteil von cond. bewegt sich. Aber warum …

4
Zeilengröße der L1- und L2-Caches
Aus einer früheren Frage in diesem Forum habe ich erfahren, dass in den meisten Speichersystemen der L1-Cache eine Teilmenge des L2-Cache ist, dh jeder aus L2 entfernte Eintrag wird auch aus L1 entfernt. Meine Frage ist nun, wie ich einen entsprechenden Eintrag im L1-Cache für einen Eintrag im L2-Cache ermitteln …

8
Wie berechnet sich die CPU-Auslastung?
Auf meinem Desktop befindet sich ein kleines Widget, das mir meine aktuelle CPU-Auslastung anzeigt. Es zeigt auch die Verwendung für jeden meiner beiden Kerne. Ich habe mich immer gefragt, wie die CPU berechnet, wie viel Rechenleistung verbraucht wird. Wenn die CPU bei intensiven Berechnungen aufgehängt ist, wie kann sie (oder …


2
Was verursacht diese hohe Variabilität in Zyklen für eine einfache enge Schleife mit -O0, aber nicht -O3 auf einem Cortex-A72?
Ich führe einige Experimente durch, um hochkonsistente Laufzeiten für einen Code zu erhalten. Der Code, den ich gerade zeitlich festlege, ist eine ziemlich willkürliche CPU-gebundene Arbeitslast: int cpu_workload_external_O3(){ int x = 0; for(int ind = 0; ind < 12349560; ind++){ x = ((x ^ 0x123) + x * 3) % …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.