Mit Debian 9 "strecken" mit einer älteren GPU (GT 720) sind zusätzliche Schritte erforderlich. Ich sehe, dass jemand oben (@celavek) dies hatte, also werde ich ausfüllen, was für mich funktioniert hat. Die akzeptierte Antwort deckt fast alles ab, was benötigt wird. Dies zu erkennen ist ein hübsches Nischenbeispiel, aber hoffentlich gibt es hier einige nützliche Dinge, die den Leuten ein paar Google-Suchen ersparen.
Klicken Sie für CUDA 8.0 in Schritt 1 auf "Legacy Releases" und wählen Sie "CUDA Toolkit 8.0 GA 2" aus. Dann Linux, x86_64, Ubuntu, 16.04, Runfile (lokal).
Ich habe den mitgelieferten Treiber nicht akzeptiert und stattdessen meine zuvor installierten 384.130-Treiber für meine GPU verwendet. Mehr Infos dazu hier: Debian Wiki . Ihr Kilometerstand kann variieren, ich kann nicht für andere Karten als eine GT 720 sprechen. Dies war der von mir gewählte Weg, den ich (noch) nicht bereut habe.
Wenn die Installation fehlschlägt, weil in Schritt 12 nicht die lokale Datei InstallUtils.pm installiert werden kann, müssen Sie die Datei cuda_8.0.61_375.26_linux.run entpacken, sie jedoch mit dem Flag --tar mxvf ausführen. Dann kopiere (als root) InstallUtils.pm nach / usr / lib / x86_64-linux-gnu / pearl-base:
./cuda_8.0.61_375.26_linux.run --tar mxvf
sudo cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base
Nun sollte der Befehl von Schritt 12 erfolgreich sein.
Ihr Debian 9.0 kommt mit g ++, Version 6+, das geht nicht. Die Kompilierung von vectorAdd in Schritt 15 schlägt fehl. Ich folgte diesem Whitepaper: Installieren mehrerer Versionen von GCC , um Version 5.5.0 zu installieren. Für 5.5.0 benötigen Sie diese Datei
wget http://mirrors.concertpass.com/gcc/releases/gcc-5.5.0/gcc-5.5.0.tar.xz
und packe den tarball so aus:
tar -xJf gcc-5.5.0.tar.xz
Ich musste einige Dinge aktualisieren (Bibliotheken und 32-Bit-Kompilierung hinzufügen), damit dies für mich funktioniert:
sudo apt-get install libgmp3-dev libmpfr-dev libmpc-dev
sudo dpkg --add-architecture i386
sudo apt-get update
sudo apt-get install build-essential gcc-multilib rpm libstdc++6:i386 libgcc1:i386 zlib1g:i386 libncurses5:i386
Jetzt können Sie den Compiler konfigurieren, erstellen und installieren.
Denken Sie daran, configure mit dem prefix = / usr / local / gcc / 5.5.0 Flagge
Jetzt können Sie das vectorAdd-Beispiel in Schritt 15 folgendermaßen kompilieren:
make HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
Oder dieses:
export HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
make
Es ist nicht erforderlich, das Makefile zu ändern, es behandelt die Compiler-Überschreibung korrekt.
Sie sollten jetzt eine funktionierende CUDA 8.0-Installation auf stretch haben.