Mit welchem ​​Programm soll ich 20 TB Daten über das Netzwerk übertragen?


10

Ich muss 20 TB Daten auf ein Thunderbolt-Array kopieren. Die Box, in der die Daten vorhanden sind, hat keine Blitzverbindung, daher muss ich das lokale 1-GB-Netzwerk dafür verwenden. (Ja, es wird ewig dauern).

Ich habe versucht, Filezilla / sftp zu verwenden, aber es stürzte ab, als die Warteschlange sehr groß wurde. Ist rsync oder scp der richtige Weg?


2
Können Sie das Laufwerk aus dem alten Gerät herausholen und direkt anschließen?

Stimmen Sie dem obigen Kommentar zu. Die physische Übertragung hat die größte Bandbreite.
Siyuan Ren

Ich liebe Carbon Copy Cloner, ein nettes GUI-Dienstprogramm, das auf rsync basiert. Der Entwickler gab rsync heraus und nahm viele Verbesserungen vor. Ich kann nicht mit der Geschwindigkeit gegen rsync und / oder tar oder was auch immer sprechen, aber es ist meine Anlaufstelle für jede Art von Datenübertragung, bei der ich ohne Zweifel wissen möchte, dass meine Daten gut sind, wenn alles gesagt und getan ist. Und wenn nicht, wird CCC es mir sagen.
Harv

Ich bin überrascht, dass es keine Hinweise auf Fedex gibt .
Tedder42

Antworten:


16

rsync ist ein guter Weg (scp ist mit weniger Funktionen ziemlich gleich). Möglicherweise möchten Sie die -ZOption verwenden, mit der die zlib-Komprimierung aktiviert wird. Abhängig davon, wie schnell Ihre Laufwerke / Computer sind, ist dies möglicherweise schneller als das unkomprimierte Senden, dh wenn Ihre Netzwerkverbindung überlastet ist. Möglicherweise möchten Sie auch die Option Archivierungsmodus, mit -ader Symlinks, Berechtigungen und Erstellungs- / Änderungszeiten beibehalten und Verzeichnisse rekursiv kopiert werden. Je nachdem, was Sie kopieren, möchten Sie möglicherweise -Eerweiterte Attribute und Mac-Ressourcengabeln beibehalten. Schließlich --progresswerden Ihnen Fortschrittsinformationen angezeigt.


11
rsync kann das Kopieren auch gut neu starten, wenn eine Unterbrechung auftritt.
Lee Joramo

3
Wenn Sie @LeeJoramo unterstützen, ist es äußerst wichtig, dass Sie dort weitermachen können, wo eine fehlgeschlagene Übertragung aufgehört hat. Eine so große Übertragung schlägt irgendwann fehl und Sie möchten sicherstellen, dass Sie nicht den Fortschritt verlieren, den Sie bis zu diesem Punkt gemacht haben.
Blahdiblah

6

Obwohl nicht so allgegenwärtig wie rsync, habe ich in der Vergangenheit einen Tool-Aufruf "mpscp" verwendet - http://www.sandia.gov/MPSCP/mpscp_design.htm

Von Sandia National Labs handelt es sich um ein Dateikopier-Tool, das über SSH ausgeführt wird und speziell für die Sättigung von Hochgeschwindigkeitsnetzwerken zwischen engen Systemen optimiert ist (z. B. das Kopieren von Terabytes an Daten zwischen zwei Supercomputern am selben Standort, die über 10 GB + oder Infiniband verbunden sind). Es funktioniert gut, kann aber etwas mühsam einzurichten sein. Beim Testen habe ich leicht gesehen, dass es 2x-3x schneller als rsync läuft.


3

Verwenden Sie rsync und erwägen Sie, es mit rsyncd zu verwenden. Wenn Sie rsync ohne rsyncd verwenden, stecken Sie mit ssh fest, was bedeutet, dass Sie eine Art Verschlüsselung verwenden. Sie kopieren wahrscheinlich die Daten von einem älteren Computer auf einen neueren Computer, und der ältere Computer verfügt möglicherweise nicht über das CPU-Grunzen, um die Daten für die Übertragung schnell genug zu verschlüsseln, damit eine Gigabit-Ethernet-Verbindung gesättigt bleibt. Testen Sie die Übertragung von Dateistapeln mit beiden Methoden und finden Sie heraus, welcher Weg schneller ist.

Aus dem gleichen Grund würde ich empfehlen, die Verwendung der Komprimierungsoption von rsync zu testen, bevor Sie sich zur Verwendung verpflichten. Die Komprimierung ist eine weitere CPU-intensive Aktivität, die möglicherweise nicht mit der Gigabit-Ethernet-Geschwindigkeit Schritt halten kann, wenn sie auf älterer Hardware versucht wird. rsync ist ein fünfzehn Jahre altes Programm, das zurückgeschrieben wurde, als die Mehrheit der Menschen selbst in Ländern der Ersten Welt über ein DFÜ-Modem auf das Internet zugegriffen hat. Die Kompromisse zwischen Netzwerkbandbreite und CPU waren damals sehr unterschiedlich.


Sie haben Recht, dass rsync standardmäßig ssh verwendet, aber das ist nicht die einzige Option. Sie können dafür sorgen, dass stattdessen rsh verwendet wird, indem Sie die -eOption verwenden. Mit derselben Option können Sie die Optionen von ssh ändern, um eine weniger CPU-intensive Verschlüsselung zu verwenden: -e 'ssh -c arcfour,blowfish-cbc'oder dergleichen. Ob dies bei einer modernen Maschine einen Geschwindigkeitsunterschied ausmacht, weiß ich nicht, aber ein schneller Benchmark kann sich lohnen, insbesondere bei 20 TB Dateien.
Michael DM Dryden

3

Sind diese 20 TB in einer kleinen Anzahl großer Dateien (wie Video, Monsterdatenbank) oder Millionen kleinerer Dateien verpackt?

Wenn viele kleine Dateien vorhanden sind, würde ich aus Gründen der Neustartbarkeit rsync oder aus Effizienzgründen einen Piped-Tar-Stream verwenden (eine Netzwerkverbindung für das Los, beginnen Sie erneut von vorne, wenn dies fehlschlägt).

tar -cf - * | ( cd newhome; tar -xf - )

Remote-Ordner muss gemountet sein.

Könnten Sie das neue Array direkt mit einer anderen Schnittstelle verbinden? Local rsync verwendet ssh nicht, daher entfernen Sie diesen Fehlerpunkt. Ja, Firewire 800 ist langsamer als Gigabit-Ethernet, aber Sie können Ethernet nicht zu 100% laden - es kann durch Firewire schneller sein. Zu Ihrer Information können Sie auch Firewire vernetzen, wenn die Boxen nahe genug sind. Fügen Sie die Schnittstelle in den Systemeinstellungen -> Netzwerk hinzu.


0

Eine andere Möglichkeit wäre, Bittorrent Sync ( http://www.bittorrent.com/sync ) auszuprobieren . Ich habe es verwendet, um Familienfotos und -videos zwischen Mitgliedern unserer Familie über das WAN zu synchronisieren, aber es gibt keinen Grund, warum es für ein lokales Netzwerk nicht funktioniert. Es werden Peer-to-Peer-Verbindungen verwendet, sodass die Daten nicht wie bei einem Dropbox-Vorgang über einen Server übertragen werden (ich glaube nicht, dass Sie über 20 TB Dropbox-Speicherplatz verfügen oder so lange warten möchten, um so viel hochzuladen Daten!)

Es wird auch auf mehreren Plattformen unterstützt und bietet somit mehr Flexibilität als rsync und tar.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.