Ich habe eine Wortliste, die Benutzername, Telefonnummer und E-Mail enthält. Es stammt aus verschiedenen Quellen und ist daher in verschiedenen Größen erhältlich. Ich muss den doppelten Benutzernamen und alle Dinge in einer Reihe filtern.
Bisher habe ich die Methode mit Notepad ++ verwendet. Die Einschränkungen sind jedoch, dass nur jeweils eine Datei ausgefüllt wird. Und es kann keine Dateien wie 500 MB verarbeiten.
Wenn eine Datei den Benutzernamen-useremail@example.com-someIntegerPhoneNumber hat, bedeutet dies, dass derselbe nicht in einer anderen Datei erscheinen sollte.
In einfacher Weise muss ich das obige Ergebnis mit Notepad ++ für mehrere Dateien erzielen, die HÖHER als 500 MB sind.
Irgendwelche Tools oder Programme? Oder ein effizientes Java- oder C # -Snippet?