Ich habe eine CSV-Datei mit 4 Millionen Kanten eines gerichteten Netzwerks, das Personen darstellt, die miteinander kommunizieren (z. B. John sendet eine Nachricht an Mary, Mary sendet eine Nachricht an Ann, John sendet eine weitere Nachricht an Mary usw.). Ich möchte zwei Dinge tun:
Finden Sie Grad-, Zwischen- und (vielleicht) Eigenvektor-Zentralitätsmaße für jede Person.
Holen Sie sich eine Visualisierung des Netzwerks.
Ich möchte dies über die Befehlszeile eines Linux-Servers tun, da mein Laptop nicht viel Strom hat. Ich habe R auf diesem Server und der Statnet-Bibliothek installiert. Ich fand diesen Beitrag von 2009 von jemandem kompetenter als ich, der versuchte, dasselbe zu tun und Probleme damit hatte. Ich habe mich also gefragt, ob jemand andere Hinweise dazu hat, vorzugsweise Schritt für Schritt, da ich nur weiß, wie man die CSV-Datei lädt und sonst nichts.
Um Ihnen eine Vorstellung zu geben, sieht meine CSV-Datei folgendermaßen aus:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv