"Vorhersage" und "Schätzung" werden in der Tat manchmal synonym im nichttechnischen Schreiben verwendet und scheinen ähnlich zu funktionieren, aber es gibt einen scharfen Unterschied zwischen ihnen im Standardmodell eines statistischen Problems. Ein Schätzer verwendet Daten, um einen Parameter zu erraten, während ein Prädiktor die Daten verwendet, um einen zufälligen Wert zu erraten, der nicht Teil der Datenmenge ist. Für diejenigen, die nicht wissen, was "Parameter" und "Zufallswert" in der Statistik bedeuten, wird im Folgenden eine ausführliche Erläuterung gegeben.
In diesem Standardmodell wird angenommen, dass die Daten eine (möglicherweise multivariate) Beobachtung einer Zufallsvariablen deren Verteilung bekanntermaßen nur innerhalb eines bestimmten Satzes möglicher Verteilungen liegt, der "Naturzustände". Ein Schätzer ist eine mathematische Prozedur, die jedem möglichen Wert von eine Eigenschaft eines Naturzustands zuweist , wie beispielsweise seinen Mittelwert . Somit ist eine Schätzung eine Vermutung über den wahren Zustand der Natur. Wir können feststellen, wie gut eine Schätzung ist, indem wir mit . X t x t ( x ) θ μ ( θ ) t ( x ) μ ( θ )XX tXt ( x )θμ ( θ )t ( x )μ ( θ )
Ein Prädiktor betrifft die unabhängige Beobachtung einer anderen Zufallsvariablen deren Verteilung mit dem wahren Naturzustand zusammenhängt. Eine Vorhersage ist eine Vermutung über einen anderen zufälligen Wert. Wie gut eine bestimmte Vorhersage ist, können wir nur durch einen Vergleich von mit dem von realisierten Wert erkennen . Wir hoffen, dass die Übereinstimmung im Durchschnitt gut ist (im Sinne einer Mittelung über alle möglichen Ergebnisse und gleichzeitig über alle möglichen Werte von ).Z p ( x ) Z x Zp ( x )Zp ( x )Zx Z
Das gewöhnliche kleinste Quadrat liefert das Standardbeispiel. Die Daten bestehen aus Paaren die Werte der abhängigen Variablen den Werten der unabhängigen Variablen zuordnen. Der Zustand der Natur wird durch drei Parameter angegeben: , und : Jedes ist wie eine unabhängige Ziehung aus einer Normalverteilung mit dem Mittelwert und der Standardabweichung . , und sind Parameter (Zahlen), von denen angenommen wird, dass sie fest und unveränderlich sind. Das Interesse konzentriert sich aufy i x i α β & sgr; y i α + β x i & sgr; α(xi,yi)yixiαβσyiα+βxiσα& sgr; α β ( α , β ) α α β β α ββσα (der Achsenabschnitt) und (die Steigung). Die OLS schätzen, geschrieben , ist gut in dem Sinne , dass dicht an sein neigt und tendenziell nahe an , egal wie die wahren (aber unbekannten) Werte von und könnten .β(α^,β^)α^αβ^βαβ
Die OLS- Vorhersage besteht darin, einen neuen Wert der abhängigen Variablen zu beobachten, der einem Wert der unabhängigen Variablen zugeordnet ist. könnte oder könnte nicht zu den in der Datenmenge gehören; das ist unerheblich. Eine intuitiv gute Vorhersage ist, dass dieser neue Wert wahrscheinlich in der Nähe von . Bessere Vorhersagen geben an, wie nahe der neue Wert sein könnte (sie werden Vorhersageintervalle genannt ). Sie erklären, dass und ungewiss sind (weil sie mathematisch von den Zufallswerten abhängen)x x x iZ=Y(x)xxxi α β (yi)σY(x)σα+βxα^+β^xα^β^(yi) ), dass nicht mit Sicherheit bekannt ist (und daher geschätzt werden muss), sowie die Annahme, dass eine Normalverteilung mit Standardabweichung und Mittelwert ( Beachten Sie das Fehlen von Hüten!).σY(x)σα+βx
Man beachte insbesondere, dass diese Vorhersage zwei getrennte Unsicherheitsquellen hat: Unsicherheit in den Daten führt zu Unsicherheit in der geschätzten Steigung, dem Achsenabschnitt und der Reststandardabweichung ( ); Darüber hinaus besteht Ungewissheit darüber, welcher Wert von auftreten wird. Diese zusätzliche Unsicherheit - weil zufällig ist - kennzeichnet Vorhersagen. Eine Vorhersage kann wie eine Schätzung aussehen ( schätzt :-) und kann sogar dieselbe mathematische Formel haben ( kann manchmal dasselbe sein wieσ Y ( x ) , Y ( x ) α + β x α + β x p ( x ) t ( x )(xi,yi)σY(x)Y(x)α^+β^x α+βxp(x)t(x)), aber es wird eine größere Unsicherheit geben als die Schätzung.
Hier sehen wir also im Beispiel von OLS die Unterscheidung deutlich: Eine Schätzung schätzt die Parameter (die feste, aber unbekannte Zahlen sind), während eine Vorhersage den Wert einer Zufallsgröße schätzt . Die Ursache für mögliche Verwirrung ist, dass die Vorhersage normalerweise auf den geschätzten Parametern aufbaut und möglicherweise sogar die gleiche Formel wie ein Schätzer hat.
In der Praxis können Sie Schätzer auf zwei Arten von Prädiktoren unterscheiden:
Zweck : Ein Schätzer versucht, eine Eigenschaft des wahren Zustands der Natur zu kennen, während eine Vorhersage versucht, das Ergebnis einer Zufallsvariablen zu erraten. und
Unsicherheit : Ein Prädiktor hat normalerweise eine größere Unsicherheit als ein verwandter Schätzer, da das Ergebnis dieser Zufallsvariablen eine zusätzliche Unsicherheit aufweist. Gut dokumentierte und beschriebene Prädiktoren haben daher normalerweise Unsicherheitsbänder - Vorhersageintervalle -, die breiter sind als die Unsicherheitsbänder von Schätzern, die als Konfidenzintervalle bezeichnet werden. Ein charakteristisches Merkmal von Vorhersageintervallen ist, dass sie (hypothetisch) kleiner werden können, wenn der Datensatz größer wird, aber nicht auf die Breite Null verkleinert werden - die Unsicherheit des zufälligen Ergebnisses ist "irreduzibel" -, wohingegen die Breiten von Konfidenzintervallen dazu neigen auf Null schrumpfen, was unserer Vorstellung entspricht, dass die Genauigkeit einer Schätzung bei ausreichenden Datenmengen beliebig gut werden kann.
Berücksichtigen Sie bei der Beurteilung des potenziellen Investitionsverlusts zunächst den Zweck: Möchten Sie wissen, wie viel Sie in einem bestimmten Zeitraum bei dieser Investition (oder bei diesem bestimmten Anlagekorb) tatsächlich verlieren könnten , oder raten Sie wirklich nur, um was es sich handelt? erwarteter Verlust (über ein großes Universum von Investitionen, vielleicht)? Ersteres ist eine Vorhersage, letzteres eine Schätzung. Dann betrachten Sie die Unsicherheit. Wie würde sich Ihre Antwort ändern, wenn Sie nahezu unbegrenzte Ressourcen hätten, um Daten zu sammeln und Analysen durchzuführen? Wenn es sehr genau werden würde, schätzen Sie wahrscheinlich die erwartete Rendite der Investition, während Sie eine Prognose abgeben, wenn Sie über die Antwort äußerst unsicher bleiben.
Wenn Sie sich also immer noch nicht sicher sind, mit welchem Tier Sie es zu tun haben, fragen Sie Ihren Schätzer / Prädiktor: Wie falsch ist es wahrscheinlich und warum? Anhand der beiden Kriterien (1) und (2) wissen Sie, was Sie haben.