Wir erstellen eine Website, auf der Standortinformationen (Punkte) von Benutzern gesammelt werden. Wir erforschen Techniken, um die Privatsphäre der Benutzer zu schützen (z. B. teilen Benutzer häufig ihre Privatadresse, die vertraulich ist). Eine Option, die mir in den Sinn kam, besteht darin, die Punkte zu verschleiern oder zu "hacken", bevor sie in der Datenbank gespeichert werden. Auf diese Weise müssen diese sensiblen Daten überhaupt nicht mehr gespeichert werden.
Unsere Grundvoraussetzungen sind meines Erachtens:
Bei einem einzelnen verschleierten Punkt ist es nicht möglich, den ursprünglichen Punkt innerhalb von (etwa) einem Kilometer abzuleiten, selbst wenn alle mit dem Punkt verbundenen Metadaten vorhanden sind (dh wenn die gesamte Datenbank gefährdet ist).
Bei einer willkürlich großen Menge von verschleierten Punkten, die demselben ursprünglichen Punkt entsprechen, ist es immer noch nicht möglich, den ursprünglichen Punkt abzuleiten. (Eine einfache Methode wäre beispielsweise, dem ursprünglichen Punkt einen zufälligen Vektor hinzuzufügen. Wenn Sie dies jedoch genügend oft tun, werden die verschleierten Punkte um den ursprünglichen Punkt gruppiert.)
Es wäre schön, wenn verschiedene statistische Eigenschaften erhalten blieben, obwohl ich nicht weiß, welche Eigenschaften in dieser Phase wichtig sind. Zum Beispiel wäre es mir lieber, wenn verschleierte Punkte auf "natürliche" Weise verstreut würden, anstatt sich in einem Gitter anzusammeln. Datenschutz ist jedoch wichtiger als dies.