Was bedeutet es, wenn wir sagen, dass die meisten Punkte in einem Hyperwürfel an der Grenze liegen?


12

Wenn ich einen 50-dimensionalen Hyperwürfel habe. Und ich definiere seine Grenze durch oder wobei die Dimension des Hyperwürfels ist. Die Berechnung des Punktanteils an der Grenze des Hyperwürfels dann . Was bedeutet es? Bedeutet das, dass der Rest des Raums leer ist? Wenn der Punkte an der Grenze liegen, dürfen die Punkte im Würfel nicht gleichmäßig verteilt sein?0,95 < x j < 1 x j 0,995 99 %0<xj<0.050.95<xj<1xj0.99599%


2
Nein, es bedeutet, dass die Peripherie geräumiger ist und der Effekt der Dimensionalität entspricht. Es ist etwas eingängig. Dieses Phänomen hat Konsequenzen für die Verteilung des Abstands zwischen zufälligen Knotenpaaren, die relevant werden, wenn Sie die nächsten Nachbarn in hochdimensionalen Räumen gruppieren oder berechnen möchten.
Emre

Berechnen Sie, welcher Anteil der Punkte auf einem Liniensegment nahe seiner Grenze liegt. Dann zeigt in ein Quadrat. Zeigt dann in einen Würfel. Was kannst du über sie sagen?
user253751

Antworten:


27

Von 99% der Punkte in einem Hypercube ' zu sprechen , ist etwas irreführend, da ein Hypercube unendlich viele Punkte enthält. Sprechen wir stattdessen über die Lautstärke.

Total volume=1×1××150 times=150=1.

x=(x1,x2,,x50)

0.05<x1<0.95 and 0.05<x2<0.95 and  and 0.05<x50<0.95.
0.9=0.950.05
Interior volume=0.9×0.9××0.950 times=0.9500.005.
10.9500.995.

99.5%


Follow-up: Ignatius warf eine interessante Frage auf, wie dies mit der Wahrscheinlichkeit zusammenhängt. Hier ist ein Beispiel.

01

0.050.950.050.95

10%5010.9500.995.99.5%

Faustregel: In hohen Dimensionen sind extreme Beobachtungen die Regel und nicht die Ausnahme.


7
Es lohnt sich, das Zitat des OP zu verwenden: "Bedeutet das, dass der Rest des Raums leer ist?" und antworten: Nein, das bedeutet, dass der Rest des Raums relativ klein ist . . . Oder ähnlich in deinen eigenen Worten. . .
Neil Slater

2
Wirklich schöne Erklärung des Begriffs "Fluch der Dimensionalität"
Ignatius

Fragen Sie sich, ob Folgendes richtig ist: Wenn in diesem Beispiel eine Reihe von Features in jeder der 50 Dimensionen gleichmäßig entlang [0,1] verteilt ist, beträgt (99,5% -0,5%) 99% des Volumens (Hypercube-Feature) Leerzeichen) erfasst nur die 10% -Werte jedes Features
ignatius

"Jeder Eingabeparameter ist mit einer Wahrscheinlichkeit von nur 5% extrem." Ich denke, diese Wahrscheinlichkeit beträgt 10%.
Rodvi

@ Rodvi: Du hast natürlich recht, danke! Behoben.
Elias Strehle

8

Sie können das Muster auch in niedrigeren Dimensionen deutlich sehen.

1. Dimension. Nehmen Sie eine Linie mit der Länge 10 und einer Grenze mit 1. Die Länge der Grenze beträgt 2 und das innere Verhältnis 8, 1: 4.

2. Dimension. Nehmen Sie ein Quadrat von Seite 10 und die Grenze 1 erneut. Die Fläche der Grenze beträgt 36, das innere Verhältnis 64, 9:16.

3. Dimension. Gleiche Länge und Grenze. Das Volumen der Grenze beträgt 488, das Innere 512, 61:64 - bereits nimmt die Grenze fast so viel Platz ein wie das Innere.

4. Dimension, jetzt ist die Grenze 5904 und das Innere 4096 - die Grenze ist jetzt größer.

Selbst bei immer kleineren Grenzlängen überholt das Grenzvolumen mit zunehmender Abmessung immer den Innenraum.


0

Der beste Weg, es zu "verstehen" (obwohl es für einen Menschen meiner Meinung nach unmöglich ist), besteht darin, die Volumina einer n-dimensionalen Kugel und eines n-dimensionalen Würfels zu vergleichen. Mit dem Wachstum von n (Dimensionalität) "tritt" das gesamte Volumen der Kugel aus und konzentriert sich in den Ecken des Würfels. Dies ist ein nützliches allgemeines Prinzip, an das Sie sich in der Codierungstheorie und ihren Anwendungen erinnern sollten.

Die beste Erklärung für das Lehrbuch findet sich in Richard W. Hammings Buch "Coding and Information Theory" (3.6 Geometric Approach, S. 44).

Der kurze Artikel in Wikipedia gibt Ihnen eine kurze Zusammenfassung derselben, wenn Sie bedenken, dass das Volumen eines n-dimensionalen Einheitswürfels immer 1 ^ n beträgt.

Ich hoffe es wird helfen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.