Es gibt einige Unterschiede, die jedoch nicht unbedingt in Bezug auf Hardware oder Spezifikationen bestehen. Beachten Sie, dass dies alles Informationen sind, die ich aus Foren oder Pressemitteilungen erhalten habe. Nehmen Sie also alles mit einem Körnchen Salz.
Die erste ist die "Skalierbarkeit und Zuverlässigkeit" ( Quelle ). Der K20 wurde entwickelt, um in einem Clustersystem zu sitzen und rund um die Uhr mit voller Neigung zu laufen. Der Titan ist eher für Spiele konzipiert, daher läuft er in diesem Arbeitszyklus. Bei dieser Verwendung kann es jedoch zu Problemen mit der Langzeitlebensdauer kommen.
Die Fahrer sind auch unterschiedlich, aber ich bin mir der großen Unterschiede nicht sicher. Der Unterschied im Fokus des Kartendesigns führt wahrscheinlich zu relativ geringen Leistungssteigerungen für die Tesla-Karten auf dieser Vorderseite.
"Einige Tesla-exklusive Funktionen umfassen:
- NVIDIA GPUDirect RDMA für InfiniBand-Leistung
- Hyper-Q für MPI (Hyper-Q für CUDA-Streams wird von GeForce GTX TITAN unterstützt)
- ECC-Schutz für alle internen und externen Register und Speicher
- Unterstützte Tools für die GPU- und Clusterverwaltung, wie Bright Computing, Ganglia. "( Quelle )
Dies weist auf die Tatsache hin, dass der Hauptunterschied ihre Skalierbarkeit ist. Wenn Sie auf einem Desktop in Ihrem Büro arbeiten möchten, ist es schwierig, gegen einen Titan über den K20 wegen des Preisunterschieds zu argumentieren. Wenn Sie die zusätzliche Leistung mehrerer K20 benötigen, suchen Sie sich ein HPC-Center und kaufen Sie Zeit mit ihren Servern.
Bearbeiten:
Nachdem ich mich etwas eingehender mit ECC befasst habe, aktualisiere ich diese Antwort, um auf die Auswirkungen hinzuweisen, die sich auf die K20 und nicht auf die Titan auswirken. Die folgenden Informationen sind eine Umschreibung von Informationen, die hier zu finden sind .
ECC ist eine Fehlerprüfung im DRAM und registriert sich für die GPU. Weiche Fehler treten auf, wenn ein Bit falsch übertragen / gespeichert wird. Je schneller und näher die Schaltungen beieinander liegen, desto höher ist die Wahrscheinlichkeit eines weichen Fehlers. Wenn Sie einen Satz gekoppelter ODEs lösen oder ein lineares System lösen, kann eine einzelne Zahl, die um ein Bit abweicht, die Ergebnisse auf nicht reproduzierbare Weise erheblich verändern. Die meisten Standard-RAMs und Caches in der CPU werden mithilfe von ECC auf Fehler überprüft.
GPUs hingegen haben im Allgemeinen keine ECC, obwohl ihr Speicherbus viel schneller ist als der auf der CPU. Dies liegt daran, dass die Qualität des Programms nicht beeinträchtigt wird, wenn ein Pixel auf dem Bildschirm für ein Bild um ein Bit versetzt ist. Diese Fehler verbreiten sich auch nicht. Daher kann durch Überspringen dieser Funktion viel Chip-Immobilien (und Kosten) eingespart werden. Diese zusätzliche Komplexität verursacht wahrscheinlich einen großen Teil der zusätzlichen Kosten der Tesla-Leitung.