Wie kann die Anzahl der Verbindungen Gauß sein, wenn sie nicht negativ sein kann?


14

Ich analysiere soziale Netzwerke (nicht virtuelle) und beobachte die Verbindungen zwischen Menschen. Wenn eine Person eine andere Person auswählen würde, mit der zufällig eine Verbindung hergestellt werden soll, würde die Anzahl der Verbindungen innerhalb einer Gruppe von Personen normal verteilt sein - zumindest gemäß dem Buch, das ich gerade lese.

Wie können wir wissen, dass die Verteilung Gauß (normal) ist? Es gibt auch andere Distributionen wie Poisson, Reis, Rayliegh usw. Das Problem mit der Gauß - Verteilung in der Theorie ist , dass die Werte gehen von bis + (obwohl die Wahrscheinlichkeiten gegen Null gehen) und die Anzahl der Verbindungen kann nicht negativ sein.+

Weiß jemand, welche Verteilung zu erwarten ist, wenn jede Person unabhängig (zufällig) eine andere Person aufnimmt, mit der sie sich verbinden möchte?


1
Erläuterung: Handelt es sich um die Frage nach der "Gesamtzahl der Verbindungen für die gesamte Gruppe" oder um die "Gesamtzahl der Verbindungen für eine Person"? Meine Antwort geht implizit von letzterem aus.

1
Riley- Verteilung? Das ist neu für mich. Haben Sie eine Referenz oder einen Link?
am

3
"Rayleigh" vielleicht?
Whuber

Antworten:


6

Wenn es Personen und die Anzahl der Verbindungen hergestellt nach Person i , 1 i n , ist , X i , dann ist die Gesamtzahl der Verbindungen S n = Σ n i = 1 X i / 2 . Wenn wir nun das X i als Zufallsvariable annehmen, davon ausgehen, dass sie unabhängig sind und ihre Varianzen nicht "zu ungleich" sind, da immer mehr Menschen zu der Mischung hinzugefügt werden, dann gilt der zentrale Grenzwertsatz von Lindeberg-Levy . Es wird behauptet, dass die kumulative Verteilungsfunktionni,1in,XiSn=i=1nXi/2Xider standardisierten Summe konvergiert gegen den cdf der Normalverteilung. Das bedeutet ungefähr, dass ein Histogramm der Summe mit zunehmender Größe von immer mehr einem Gaußschen (einer "Glockenkurve") ähnelt.n

Lassen Sie uns überprüfen, was dies nicht sagt:

  • Es wird nicht behauptet, dass die Verteilung von jemals genau normal ist. Das kann aus den von Ihnen genannten Gründen nicht sein.Sn

  • Dies bedeutet nicht, dass die erwartete Anzahl von Verbindungen konvergiert. Tatsächlich muss es auseinander gehen (ins Unendliche gehen). Die Standardisierung ist eine Neuzentrierung und Neuskalierung der Distribution. Der Umfang der Neuskalierung nimmt unbegrenzt zu.

  • Xin


Beachten Sie, dass ich die Frage nicht dahingehend interpretiere, dass jeder genau eine andere Person auswählt , zu der er eine Verbindung herstellen möchte. Dies würde zu einer sterilen Theorie führen, da die Anzahl der Verbindungen nicht zufällig bestimmt würde. Stattdessen habe ich es so interpretiert, dass jeder, der in das Netzwerk eintritt, zufällig Verbindungen zwischen den n anderen auswählt und mit einer Summe von 0 bis n Verbindungen endet. Die Annahme der Abweichungen ist gewährleistet, wenn die Anzahl der Verbindungen, die ein Neuling herstellt, begrenzt ist und diese Anzahl eine gewisse "minimale" Zufälligkeit aufweist.
whuber

Xichund die Varianz. Bedeutet dies, dass Menschen eine intrinsische Varianz haben?
Andy W

1
@Andy Not people: Die Anzahl der hergestellten Verbindungen. Wichtig ist, dass es eine gute Chance gibt, dass die Anzahl der von Einzelpersonen hergestellten Verbindungen tatsächlich variiert und sich nicht auf eine Konstante einstellt. In diesem Fall wird die Grenzverteilung (der Anzahl der Verbindungen) durch die endliche Anzahl der anfänglichen Verbindungen bestimmt, die variieren. Daher ist es nicht möglich, eine Normalverteilung asymptotisch anzufahren.
Whuber

1

Die Antwort hängt von den Annahmen ab, zu denen Sie bereit sind. Ein soziales Netzwerk entwickelt sich im Laufe der Zeit ständig weiter und ist daher keine statische Einheit. Daher müssen Sie einige Annahmen darüber treffen, wie sich das Netzwerk im Laufe der Zeit entwickelt.

Die triviale Antwort lautet unter den angegebenen Bedingungen: Wenn die Netzwerkgröße ist n dann asymptotisch (im Sinne von "wie die Zeit ins Unendliche geht")

PrÖb(Keine Verbindungen für eine Person=n-1)=1.

Wenn eine Person zufällig eine andere Person auswählt, um eine Verbindung herzustellen, werden letztendlich alle miteinander verbunden.

Reale Netzwerke verhalten sich jedoch nicht so. Die Menschen unterscheiden sich in mehreren Aspekten.

  1. Zu jeder Zeit hat eine Person eine feste Netzwerkgröße, und die Wahrscheinlichkeit, dass eine andere Verbindung hergestellt wird, hängt von ihrer Netzwerkgröße ab (wenn Personen andere Personen vorstellen usw.).

  2. Eine Person hat ihre eigene intrinsische Tendenz, eine Verbindung herzustellen (da einige introvertiert / exterovertiert usw. sind).

Diese Wahrscheinlichkeiten ändern sich im Laufe der Zeit, im Kontext usw. Ich bin mir nicht sicher, ob es eine einfache Antwort gibt, es sei denn, wir machen einige Annahmen über die Struktur des Netzwerks (z. B. Dichte des Netzwerks, Verhalten von Personen usw.).


@Srikant Kannst du erklären, wie du die "triviale Antwort" ableitest? (Es müssen einige unausgesprochene Annahmen dahinter stehen.) Und auf welchen Satz beziehen Sie sich, wenn Sie zu dem Schluss kommen, dass "irgendwann alle miteinander verbunden sein werden"? Das ist gar nicht so offensichtlich!
whuber

@whuber Ich gehe davon aus, dass die Netzwerkgröße festgelegt ist. Die Frage lautet: Eine Person wählt zufällig eine andere Person aus, um eine Verbindung herzustellen, und dies ist vermutlich ein fortlaufender Prozess. Mit der Zeit bis ins Unendliche sollten alle miteinander verbunden sein. Kein Satz, nur Intuition. Vielleicht verwende ich eine ungenaue Sprache.

@Srikant Ich bin immer noch verwirrt, weil nach einer langen Zeit "Prob (No of connections = n)" gleich 1 ist, wenn n = 3 und ansonsten immer Null ist. Wenn "alle verbunden sein sollten", ist die Anzahl der Verbindungen schließlich gleich n (n-1) / 2. Ich vermute, Sie haben mehrere verschiedene zufällige Prozesse gleichzeitig im Auge. Es könnte hilfreich sein, die getroffenen Annahmen offenzulegen und ein wenig genauer zu sein.
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.