Ich habe ein logarithmisches Normalmodell mit R mit einem Datensatz versehen. Die resultierenden Parameter waren:
meanlog = 4.2991610
sdlog = 0.5511349
Ich möchte dieses Modell auf Scipy übertragen, das ich noch nie benutzt habe. Mit Scipy konnte ich eine Form und einen Maßstab von 1 und 3.1626716539637488e + 90 erhalten - sehr unterschiedliche Zahlen. Ich habe auch versucht, die exp von meanlog und sdlog zu verwenden, aber weiterhin bizarre Diagramme zu erhalten.
Ich habe jedes Dokument gelesen, das ich auf scipy lesen kann, und bin immer noch verwirrt darüber, was die Form- und Skalierungsparameter in diesem Fall bedeuten. Wäre es nur sinnvoll, die Funktion selbst zu codieren? Das scheint allerdings fehleranfällig zu sein, da ich neu bei scipy bin.
SCIPY Lognormal (BLAU) vs. R Lognormal (ROT):
Irgendwelche Gedanken darüber, in welche Richtung es gehen soll? Die Daten passen übrigens sehr gut zum R-Modell. Wenn es also wie etwas anderes in Python aussieht, können Sie es gerne teilen.
Vielen Dank!
Aktualisieren:
Ich verwende Scipy 0.11
Hier ist eine Teilmenge der Daten. Die tatsächliche Stichprobe beträgt 38.000 + mit einem Mittelwert von 81,53627:
Teilmenge:
x
[60, 170, 137, 138, 81, 140, 78, 46, 1, 168, 138, 148, 145, 35, 82, 126, 66, 147, 88, 106, 80, 54, 83, 13, 102, 54, 134, 34]
numpy.mean (x)
99.071428571428569
Alternative:
Ich arbeite an einer Funktion zum Erfassen des PDF:
def lognoral(x, mu, sigma):
a = 1 / (x * sigma * numpy.sqrt(2 * numpy.pi) )
b = - (numpy.log(x) - mu) ^ 2 / (2 * sigma ^ 2)
p = a * numpy.exp(b)
return p
Dies gibt mir jedoch die folgenden Zahlen (ich habe mehrere ausprobiert, falls ich die Bedeutung von sdlog und meanlog verwechselt habe):
>>> lognormal(54,4.2991610, 0.5511349)
0.6994656085799437
>>> lognormal(54,numpy.exp(4.2991610), 0.5511349)
0.9846125119455129
>>> lognormal(54,numpy.exp(4.2991610), numpy.exp(0.5511349))
0.9302407837304372
Irgendwelche Gedanken?
Aktualisieren:
Wiederholung mit "UPQuarks" Vorschlag:
Form, Ort, Maßstab (1,0, 50,03445923295007, 19,074457156766517)
Die Form des Diagramms ist jedoch sehr ähnlich, wobei der Peak um 21 herum auftritt.