Dies wurde von einigen ( z. B. John Tukey) als " gestarteter Logarithmus " bezeichnet . (Für einige Beispiele hat Google John Tukey das Protokoll "gestartet" .)
Es ist vollkommen in Ordnung zu benutzen. Es ist sogar zu erwarten, dass Sie einen Startwert ungleich Null verwenden müssen, um die Rundung der abhängigen Variablen zu berücksichtigen. Das Runden der abhängigen Variablen auf die nächste Ganzzahl führt beispielsweise dazu, dass 1/12 von der tatsächlichen Varianz abweicht, was darauf hindeutet, dass ein angemessener Startwert mindestens 1/12 betragen sollte. (Dieser Wert macht mit diesen Daten keine schlechte Arbeit. Wenn Sie andere Werte über 1 verwenden, ändert sich das Bild nicht wesentlich. Es werden nur alle Werte in der Darstellung unten rechts fast gleichmäßig angehoben.)
Es gibt tiefere Gründe, den Logarithmus (oder das gestartete Log) zur Beurteilung der Varianz zu verwenden: Beispielsweise schätzt die Steigung einer Varianzkurve gegenüber dem geschätzten Wert auf einer Log-Log-Skala einen Box-Cox-Parameter zur Stabilisierung der Varianz . Solche Potenzgesetz-Varianzanpassungen an eine verwandte Variable werden häufig beobachtet. (Dies ist eine empirische Aussage, keine theoretische.)
Wenn Ihr Zweck ist zu präsentieren die Varianzen, gehen Sie mit Vorsicht. Viele Zielgruppen (abgesehen von wissenschaftlichen) können einen Logarithmus nicht verstehen, geschweige denn einen begonnenen. Die Verwendung eines Startwerts von mindestens 1 hat den Vorteil, dass er ein wenig einfacher zu erklären und zu interpretieren ist als irgendein anderer Startwert. Überlegen Sie sich, welche Wurzeln die Standardabweichungen sind. Es würde ungefähr so aussehen:
Unabhängig davon, ob Sie die Daten untersuchen, daraus lernen, ein Modell anpassen oder ein Modell evaluieren möchten, sollten Sie nichts daran hindern, angemessene grafische Darstellungen Ihrer Daten und von Daten abgeleiteter Werte zu finden wie diese Abweichungen.