Als «blas» getaggte Fragen

Grundlegende lineare Algebra-Unterprogramme - Eine Standard-API-Bibliothek mit Vektorvektor-, Matrixvektor- und Matrixmatrixoperationen.

6
Wie viel besser sind Fortran-Compiler wirklich?
Diese Frage ist eine Erweiterung von zwei Diskussionen, die kürzlich in den Antworten zu " C ++ vs Fortran for HPC " aufgetaucht sind . Und es ist eher eine Herausforderung als eine Frage ... Eines der am häufigsten gehörten Argumente für Fortran ist, dass die Compiler einfach besser sind. …
74 fortran  c  blas  benchmarking 



3

3
Warum wird meine Matrix-Vektor-Multiplikationsskalierung nicht durchgeführt?
Entschuldigung für den langen Beitrag, aber ich wollte alles, was ich für relevant hielt, gleich mit einbeziehen. Was ich möchte Ich implementiere eine parallele Version der Krylov-Subraummethoden für dichte Matrizen. Hauptsächlich GMRES, QMR und CG. Mir wurde (nach der Profilerstellung) klar, dass meine DGEMV-Routine erbärmlich war. Also beschloss ich, mich …

2
Wie nützlich ist PETSc für dichte Matrizen?
Wo immer ich es gesehen habe, sagen PETSc-Tutorials / -Dokumente usw., dass es für die lineare Algebra nützlich ist und normalerweise angibt, dass spärliche Systeme davon profitieren. Was ist mit dichten Matrizen? Ich mache mir Sorgen, für dichtes A zu lösen .Ax=bAx=bAx=bAAA Ich habe meinen eigenen Code für CG und …

2
Gefahr komplexer Arithmetik im wissenschaftlichen Rechnen
Das komplexe innere Produkt hat zwei verschiedene Definitionen, die durch Konventionen festgelegt werden: oder . In BLAS habe ich die Routinen cdotu, zdotu und cdotc, zdotc gefunden. Die beiden ersteren Routinen berechnen tatsächlich (ein falsches inneres Produkt!) Und die letzten beiden Routinen konjugieren den ersten Vektor im inneren Produkt. Nach …

6
Gibt es eine Implementierung von BLAS auf Referenzniveau in C / C ++?
Die Implementierung von netlib BLAS ist eine hervorragende Referenz, da sie größtenteils nicht optimiert und gut dokumentiert ist (z . B. zgemm ). Es befindet sich jedoch in Fortran 77, was es für Personen mit einer moderneren Programmierausbildung etwas unzugänglich macht. Gibt es eine Referenzimplementierung von BLAS wie netlib in …
11 blas  education 



1
Plötzlicher Abfall der Matrixmultiplikationsleistung
Ich habe über die Implementierung einer dichten Matrixmultiplikation gelesen, wenn die Matrix nicht in den Cache passt. Eine der Grafiken, die ich gesehen habe (Folie 9 von diesen Folien ), zeigt plötzliche Leistungseinbußen unter Verwendung des naiven Algorithmus. Diese Tropfen betragen ungefähr 50% der Geschwindigkeit, treten auf, während die Matrix …

4
Sind DAXPY, DCOPY, DSCAL Overkills?
Ich habe CG in FORTRAN implementiert, indem ich es mit Intel MKL verknüpft habe. Wenn es Aussagen gibt wie: ( Siehe Wikipedia ) p=r; x=x+alpha*p r=r-alpha*Ap; oder ähnliche in QMR (in viel größerer Menge) v_tld = r; y = v_tld; rho = norm( y ); w_tld = r; z = …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.