Ich arbeite an einem Projekt, in dem Kommilitonen gebeten werden, ihre ursprünglichen Textdaten zur weiteren Analyse mithilfe von Data Mining-Techniken weiterzugeben. Ich halte es für angemessen, die Namen der Schüler mit ihren Einsendungen zu anonymisieren.
Abgesehen von den besseren Lösungen einer URL, bei der die Schüler ihre Arbeit einreichen und ein Backend-Skript die anonymisierte ID einfügt. Welche Art von Lösungen könnte ich den Schülern anweisen, diese selbst zu implementieren, um ihre eigenen Namen zu anonymisieren?
Ich bin immer noch ein Noob in diesem Bereich. Ich weiß nicht, was die Normen sind. Ich dachte, die Lösung könnte ein Hashing-Algorithmus sein. Das klingt nach einer besseren Lösung, als sich einen falschen Namen auszudenken, da zwei Personen denselben falschen Namen auswählen könnten. Mögliche Personen könnten denselben falschen Namen auswählen. Was sind einige der Bedenken, die ich beachten sollte?