In der Statistik sollte ich annehmen zu Mittelwert oder der natürliche Logarithmus ?


18

Ich studiere Statistik und finde häufig Formeln mit dem logund bin immer verwirrt, ob ich das als Standardbedeutung von log, dh Basis 10, interpretieren soll oder ob in der Statistik das Symbol log im Allgemeinen als natürliches Protokoll angenommen wird ln.

Insbesondere studiere ich als Beispiel die Schätzung der guten Frequenz , aber meine Frage ist eher allgemeiner Natur.


2
"Für viele Anwendungen ist der natürliche Logarithmus der Likelihood-Funktion, der als Log-Likelihood bezeichnet wird, praktischer." en.wikipedia.org/wiki/Likelihood_function#Log-likelihood In der Statistik wird häufig die Likelihood-Funktion lnberücksichtigt. Die beiden sind jedoch verwandt: log(x) = ln(x) / ln(10) = ln(x) / 2.303und die ln- Wahrscheinlichkeitsfunktion erreicht das Extremum an der gleichen Stelle wie die log10- Wahrscheinlichkeitsfunktion.
John_West

5
In einigen bestimmten Anwendungsbereichen, wenn erwähnt wird, ist Base 10 vorgesehen, aber wie Aksakal angibt, ist es ansonsten die in der Mathematik verwendete Konvention, dass ein schmuckloses natürliches Log bedeutet. LogLog
Glen_b -Reinstate Monica

2
Wie @John_West sagt, sind und bis zu einem Skalierungsfaktor identisch. Sie sind also nur die gleichen, die Sie in einer anderen Einheit messen. ln(x)lOGein(x)

1
@Aksakal; Was Sie sagen, bedeutet, dass die Einheit wichtig ist (siehe meinen obigen Kommentar), dem ich zustimme. Ich habe auch , um die Basis explizit anzugeben. Für (einige) Anwendungen in Statistiken wie Maximale Wahrscheinlichkeit ist dieser Skalierungsfaktor jedoch unerheblich. Das Maximum ändert sich nach dem Hinzufügen des Skalierungsfaktors nicht. In der OP-Referenz (Good Turing ...) möchten sie (oder ) gegen . Dies bedeutet, dass sich die Einheit auf beiden Achsen des Diagramms ändert, sodass sich die geplottete "Kurve" nicht ändert. lOGeinlog(Nr)log(Zr)lOG(r)

1
Selbst bei Verwendung der Log-Wahrscheinlichkeit ist normalerweise die Skalierung (Basis des Logarithmus) von Bedeutung, es sei denn, Sie schreiben eine Arbeit. In der Teststatistik für das Log Likelihood Ratio wird beispielsweise verwendet. Um die kritischen Werte zu verwenden, müssen Sie eine Anpassung von einer anderen Basis vornehmen. Wenn Sie Software schreiben, ist es wichtig, die richtige Basis zu finden, wenn Sie Log Likelihood-Funktionen von Papieren usw. verwenden. ln
Aksakal

Antworten:


20

Es ist sicher anzunehmen, dass ohne explizite base in Statistiken Base 10-Protokoll nicht sehr oft in Statistiken verwendet wird. Auf anderen Postern wird jedoch darauf dass oder andere Grundlagen in einigen anderen Bereichen, in denen Statistiken angewendet werden, üblich sein können, z. B. in der Informationstheorie. Wenn Sie also Artikel in anderen Bereichen lesen, wird es manchmal verwirrend.Log=lnLog10

Die Entropieseite von Wikipedia ist ein gutes Beispiel für die verwirrende Verwendung von . Auf derselben Seite bedeuten sie Basis 2, und eine beliebige Basis. Sie können durch den Kontext herausfinden, welcher gemeint ist, aber es erfordert das Lesen des Textes. Dies ist kein guter Weg, um das Material zu präsentieren. Vergleichen Sie es mit der Logarithmus-Seite, auf der die Basis in jeder Formel oder eindeutig angegeben ist. Ich persönlich denke, dies ist der richtige Weg: Zeigen Sie immer die Basis an, wenn das Zeichen verwendet wird. Dies wäre auch ISO-konform, da der Standard die Verwendung einer nicht spezifizierten Basis mit dem Symbol nicht definiert, wie @Henry hervorhob.LogelnLogLog

Schließlich schreibt die Norm ISO 31-11 die Zeichen und für die Logarithmen zur Basis 2 und 10 vor. Beide werden heutzutage selten verwendet. Ich erinnere mich , dass wir verwenden in der High School, aber das in einer anderen Welt in einem anderen Jahrhundert. Ich habe es seitdem noch nie in einem statistischen Kontext gesehen. Es gibt nicht einmal das Tag für in LaTeX.PfundlglgPfund


1
Logarithmen zur Basis 2 sind in einigen Bereichen ebenfalls weit verbreitet. Ein schmuckloses Protokoll ist selten Basis 10, aber es ist nicht immer Basis e .
Nuclear Wang

Hilfreich, aber ich denke "selten" ist zu stark. Es gibt inhaltliche Bereiche, in denen die Menschen möglicherweise nur über Logarithmen zur Basis 10 Bescheid wissen oder sich am besten damit vertraut fühlen. Beachten Sie, dass viele Diagramme zeigen logarithmische Skalen Potenzen von 10. Jemand lieber natürlichen Logarithmen findet keine Schwierigkeit solche Skalen Decodierung, aber die Vermutung der Basis 10
Nick Cox

@ NickCox, OP gibt speziell "Statistik" als Feld an, und ich sehe keinen Logarithmus zur Basis 10, der in der Statistik häufig verwendet wird.
Aksakal

ISO 31-11 scheint für log e zu spezifizieren und ein schmuckloses Protokoll undefiniert zu lassenlnLogeLog
Henry

1
@ NickCox, ich habe die Sprache aufgeweicht, Sie sprechen einen fairen Punkt an
Aksakal

14

Es hängt davon ab, ob.

Außerhalb einiger weniger Kontexte, wie das Konvertieren eines Werts in Dezibel, sind Logarithmen zur Basis 10 in Gleichungen ziemlich selten. Diagramme mit logarithmischem Maßstab liegen jedoch häufig in der Basis 10 vor, obwohl dies anhand der Beschriftungen auf den Achsen recht einfach zu überprüfen sein sollte.

In einem mathematischen Kontext ist ein schmuckloses wahrscheinlich das natürliche Protokoll (dh log e oder ln ). Andererseits werden in der Informatik häufig Logarithmen zur Basis 2 ( log 2 ) verwendet, und diese sind nicht immer eindeutig als solche gekennzeichnet. Die gute Nachricht ist, dass Sie trivial zwischen Basen konvertieren können und die Verwendung der "falschen" Basis Ihre Antwort nur um einen konstanten Faktor verfälscht.LogLogelnLog2

In Gales 1995er "Good-Turing Without Tears" -Papier sind die Logarithmen im Text tatsächlich (so steht es auf Seite 5), aber der R / S + -Code im Anhang verwendet die Funktion, die tatsächlich log e oder ln ist . Wie @Henry weiter unten ausführt, macht dies keinen praktischen Unterschied.Log10logLogeln

Wenn ich raten müsste, hier einige Heuristiken:

  • Wenn auch Potenzen von 2, oder 10 vorhanden sind, haben die Protokolle wahrscheinlich die entsprechende Basis.e

  • Wenn es aus der Integration von (oder allgemeiner aus der Berechnung) resultiert, handelt es sich wahrscheinlich um ein natürliches Protokoll.1/x

  • Wenn es durch wiederholtes Teilen in zwei Hälften entsteht (wie bei der binären Suche), ist es wahrscheinlich . Allgemeiner kann etwas durch n ungefähr n- mal log geteilt werden .Log2nLogn

  • Informationstheoretische Berechnungen verwenden in der Regel , insbesondere in der modernen Arbeit. Sie können die Einheiten jedoch überprüfen, um sicherzugehen: Bitslog 2 , Natsln und Banslog 10 .Log2BitsLog2natslnVerboteLog10

  • Finden des Punktes, an dem eine Funktion auf 1 fällt oder steigt (37% bzw. 63%) eines Anfangswerts deuten auf einen natürlichen Logarithmus hin.1e oder 1-1e


5
+1. Ein kleiner Tipp ist, dass, wenn Exponentiale in der Nähe gefunden werden, der natürliche Logarithmus wahrscheinlicher und umgekehrt mit Potenzen von 10 oder 2 ist. Wenn nicht klar ist, welche Basis verwendet wird, versuchen Sie, die Beispielberechnungen der Autoren zu reproduzieren. exp()
Nick Cox

2
Da die Grafiken auf den Seiten 6 und 7 von Gale die ursprünglichen Einheiten auf einer logarithmischen Skala darstellen und die Berechnungen auf die Steigung einer logarithmischen Beziehung abzielen, dh im Ausdruck log ( N r ) = a + b log ( r ) das entspricht N R = A R b , macht es keinen praktischen Unterschied in diesem FallbLog(Nr)=ein+bLog(r)Nr=EINrb
Henry

2
Ein weiteres Beispiel für ist das Plotten von Börsendaten. Bei Verwendung einer logarithmischen Preisachse ist dies immer die Basis 10.beinse10
Marcus D

3

Um Ihre Frage zu beantworten: Nein, Sie können keine allgemeine feste Schreibweise für den Logarithmus annehmen.

Log10

lnxlogexelogx10Log10

Log2Log2Loge

0

LogLogeLog10


0

eln(L^)L^k

EINichC=2(k-ln(L)).

Wenn Sie also eine andere Basis für den Logarithmus im AIC verwenden, können Sie möglicherweise die falsche Schlussfolgerung ziehen und das falsche Modell auswählen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.