Sind die Ziffern von statistisch zufällig?


33

Angenommen, Sie beobachten die Reihenfolge:

7, 9, 0, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 2, 8. ..

Welche statistischen Tests würden Sie anwenden, um festzustellen, ob dies wirklich zufällig ist? Zu Ihrer Information, dies sind die ten Ziffern von . Sind also Ziffern von statistisch zufällig? Sagt dies etwas über die Konstante ?nπππ

Bildbeschreibung hier eingeben




10
Dies ist eine interessante und verrückte Frage. Jeder Student, der einen ersten Kurs in maßtheoretischer Wahrscheinlichkeit belegt hat, kann leicht beweisen, dass "fast alle" reellen Zahlen normal sind . Es sind jedoch nur sehr wenige explizite Beispiele bekannt, und meines Wissens ist die Angelegenheit für keine der "berühmten" irrationalen mathematischen Konstanten so oder so geklärt.
Kardinal

4
In (strikter) Verbindung mit dem Kommentar von @ cardinal: Normale Nummer

6
Was ist die Grafik? Es gibt zehn Balken mit ungewöhnlichem Abstand und Werten über 10%!
xan

Antworten:


15

Das US National Institute of Standard hat eine Reihe von Tests zusammengestellt, die ein (Pseudo-) Zufallszahlengenerator bestehen muss, um als angemessen zu gelten. Siehe http://csrc.nist.gov/groups/ST/toolkit/rng/stats_tests. html . Es gibt auch Tests, die als Diehard-Testsuite bekannt sind und sich etwas mit NIST-Tests überschneiden. Entwickler des Statistikpakets Stata geben ihre Diehard-Ergebnisse als Teil ihres Zertifizierungsprozesses bekannt. Ich stelle mir vor, Sie können Ziffernblöcke von , z. B. in Gruppen von 15 aufeinanderfolgenden Ziffern, verwenden, um mit der Genauigkeit des doppelten Typs vergleichbar zu sein , und diese Testbatterien mit den so erhaltenen Zahlen ausführen.π


5

Beantworten Sie nur die erste Ihrer Fragen: "Welche Tests würden Sie anwenden, um festzustellen, ob diese [Sequenz] wirklich zufällig ist?"

Wie wäre es damit, es als Zeitreihe zu behandeln und auf Autokorrelationen zu prüfen? Hier ist ein R-Code. Zuerst einige Testdaten (erste 1000 Stellen):

digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))

Überprüfen Sie die Anzahl der einzelnen Ziffern:

> table(digits)
digits
  0   1   2   3   4   5   6   7   8   9 
 93 116 103 102  93  97  94  95 101 106 

Verwandle es dann in eine Zeitreihe und führe den Box-Pierce-Test aus:

d=as.ts( digits )
Box.test(d)

was mir sagt:

X-squared = 1.2449, df = 1, p-value = 0.2645

Normalerweise sollte der p-Wert unter 0,05 liegen, um zu sagen, dass es Autokorrelationen gibt.

Führen acf(d)Sie den Befehl aus, um die Autokorrelationen anzuzeigen. Ich habe kein Bild hier eingeschlossen , da es ein dumpfes Diagramm ist, obwohl es seltsam ist , dass der größte Lags bei 11 und 22 läuft , ist acf(d,lag.max=40)zu zeigen , dass es keine Spitze bei Liegt = 33, und dass es nur Zufall!


PS Wir konnten vergleichen, wie gut diese 1000 Stellen von pi waren, indem wir dieselben Tests mit reellen Zufallszahlen durchführten.

probs=sapply(1:100,function(n){
    digits=floor(runif(1000)*10)
    bt=Box.test(ts(digits))
    bt$p.value
    })

Dies erzeugt 1000 zufällige Ziffern, führt den Test durch und wiederholt diesen 100 Mal.

> summary(probs)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900 
> sd(probs)
[1] 0.2904346

Unser Ergebnis lag also bequem innerhalb der ersten Standardabweichung, und pi quakt wie eine zufällige Ente. (Ich habe verwendet, set.seed(1)wenn Sie diese exakten Zahlen reproduzieren möchten.)


0

Das ist eine merkwürdige Frage. Zahlen sind nicht zufällig.

π

0,1212121212

πππ2222+1ππ


π

π

2
Ich folge dieser Antwort nicht wirklich. Ja, pi ist fest, aber die Ziffernfolge kann sich immer noch wie eine Reihe von Zufallszahlen verhalten. Ich verstehe nicht, wie 0,1212 ... Zufälligkeit per Definition darstellt. Und wie Sie in Ihrem Kommentar hervorheben, hat es wenig Einfluss darauf, ob pi eine beliebige Folge von Ziffern enthält oder nicht. Warum also darauf konzentrieren?
Nuclear Wang

π

@AdamO Sie können diese Vorhersage nur treffen, wenn Sie vorher wissen, dass die von Ihnen beschriebene Zahl pi ist, was wie Betrug aussieht. Die Ziffern in 3.141592 geben keinen Hinweis darauf, dass die nächste Ziffer 6 ist. Sie wissen das nur, weil wir pi speziell beschreiben. Sofern Sie nicht bereits pi bis N Ziffern berechnet haben, gibt es keinen Grund zu der Annahme, dass Ziffer N eine bestimmte Zahl ist. Sie scheinen zu implizieren, dass es keine zufällige Folge von Zahlen gibt, denn sobald Sie es aufschreiben, ist es behoben.
Nuclear Wang
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.