Konzeptionelles Verständnis des mittleren quadratischen Fehlers und der mittleren Abweichung


13

Ich möchte ein konzeptionelles Verständnis von Root Mean Squared Error (RMSE) und Mean Bias Deviation (MBD) erlangen. Nachdem ich diese Kennzahlen für meine eigenen Datenvergleiche berechnet habe, stellte ich oft verwirrt fest, dass der RMSE hoch ist (z. B. 100 kg), während der MBD niedrig ist (z. B. weniger als 1%).

Insbesondere suche ich eine Referenz (nicht online), die die Mathematik dieser Maße auflistet und diskutiert. Wie werden diese beiden Kennzahlen normalerweise berechnet, und wie soll ich sie in einem Artikel in einer Zeitschrift angeben?

Im Kontext dieses Beitrags wäre es sehr hilfreich, einen "Spielzeug" -Datensatz zu haben, mit dem die Berechnung dieser beiden Maße beschrieben werden kann.

Angenommen, ich möchte die Masse (in kg) von 200 Widgets ermitteln, die von einem Fließband erzeugt werden. Ich habe auch ein mathematisches Modell, das versucht, die Masse dieser Widgets vorherzusagen. Das Modell muss nicht empirisch sein und kann physisch basieren. Ich berechne den RMSE und den MBD zwischen den tatsächlichen Messungen und dem Modell und stelle fest, dass der RMSE 100 kg und der MBD 1% beträgt. Was bedeutet das konzeptionell und wie würde ich dieses Ergebnis interpretieren?

Nehmen wir nun an, dass ich aus dem Ergebnis dieses Experiments herausfinde, dass der RMSE 10 kg und der MBD 80% beträgt. Was bedeutet das und was kann ich zu diesem Experiment sagen?

Was bedeuten diese Maßnahmen und was bedeuten sie (zusammengenommen)? Welche zusätzlichen Informationen liefert der MBD, wenn er mit dem RMSE in Betracht gezogen wird?


2
Haben Sie sich auf unserer Website umgesehen, Nicholas? Beginnen Sie unter stats.stackexchange.com/a/17545 und untersuchen Sie dann einige der Tags, die ich Ihrer Frage hinzugefügt habe.
whuber

@whuber: Danke whuber !. Ich habe mich auf der Website umgesehen, aber für mich ist es immer noch schwierig zu verstehen, was im Kontext meiner eigenen Forschung wirklich gemeint ist.
Nicholas Kinar

Antworten:


20

Ich denke, diese Konzepte sind leicht zu erklären. Also beschreibe ich es lieber hier. Ich bin sicher, dass viele elementare Statistikbücher dies behandeln, einschließlich meines Buches "Die Grundlagen der Biostatistik für Ärzte, Krankenschwestern und Kliniker".

Denken Sie an ein Ziel mit einem Bullauge in der Mitte. Der mittlere quadratische Fehler entspricht der durchschnittlichen quadratischen Entfernung von einem Pfeil, der auf das Ziel und die Mitte geschossen wurde. Wenn Ihre Pfeile nun gleichmäßig in der Mitte verstreut sind, hat der Schütze keine Ausrichtung und der mittlere quadratische Fehler entspricht der Varianz.

Im Allgemeinen können sich die Pfeile jedoch um einen Punkt vom Ziel weg ausbreiten. Der durchschnittliche quadratische Abstand der Pfeile vom Mittelpunkt der Pfeile ist die Varianz. Dieses Zentrum könnte als Zielpunkt des Schützen angesehen werden. Die Entfernung von der Mitte oder dem Zielpunkt dieses Schützen zur Mitte des Ziels ist der absolute Wert der Abweichung.

Denken Sie an ein rechtwinkliges Dreieck, in dem das Quadrat der Hypotenuse die Summe der Quadrate der beiden Seiten ist. Ein quadratischer Abstand vom Pfeil zum Ziel ist also das Quadrat des Abstands vom Pfeil zum Zielpunkt und das Quadrat des Abstands zwischen der Mitte des Ziels und dem Zielpunkt. Wenn alle diese quadratischen Abstände gemittelt werden, ergibt sich der mittlere quadratische Fehler als Summe aus dem Biasquadrat und der Varianz.


Vielen Dank; das wird sehr geschätzt. Ich finde es immer noch ein bisschen schwierig zu verstehen, was der Unterschied zwischen RMSE und MBD ist. Wie ich es verstehe, quantifiziert RMSE, wie nah ein Modell an experimentellen Daten ist, aber welche Rolle spielt MBD? Vielleicht hängt mein Missverständnis nur mit der Terminologie zusammen.
Nicholas Kinar

1
Die mittlere Abweichung, wie Sie sie nennen, ist der von mir beschriebene Verzerrungsterm. Es misst, wie weit der Zielpunkt vom Ziel entfernt ist. Bias trägt dazu bei, dass der Schuss ungenau wird.
Michael R. Chernick

Nochmals vielen Dank, Michael. Eine hohe RMSE und eine niedrige MBD implizieren also, dass es sich um ein gutes Modell handelt?
Nicholas Kinar

Kein hoher RMSE und kein niedriger MBD besagen nur, dass das Modell aufgrund einer großen Varianz und nicht aufgrund einer großen Verzerrung schlecht ist. Der RMSE ist die Zahl, die entscheidet, wie gut das Modell ist.
Michael R. Chernick

1
@bbadyalina: Sie sind unabhängige Informationen, genauso wie Auf / Ab und Links / Rechts unabhängig sind. Ihre Frage ist wie die der Frage, ob ein Punkt vertikal zentriert und weit links davon in der Mitte liegt. , oder "Wenn ein Punkt hoch, aber horizontal in der Mitte ist, ist es in der Mitte?"
Naught101

1

RMSE ist eine Methode, um zu messen, wie gut unser Vorhersagemodell über den tatsächlichen Daten liegt. Je kleiner RMSE, desto besser verhält sich das Modell, wenn wir dies an einem neuen Datensatz getestet haben (nicht an unserem Trainingssatz) Ein RMSE von 0,37 über einen Bereich von 0 bis 1 führt zu vielen Fehlern im Vergleich zu einem RMSE von 0,01 als besseres Modell. BIAS dient der Über- oder Unterschätzung.


Könnten Sie bitte weitere Einzelheiten und ein ausgearbeitetes Beispiel nennen? Das OP sucht nach einer intuitiven Erklärung der Bedeutung eines RMSE von beispielsweise 100 gegen sein Schätzproblem.
Xi'an,

Dies scheint nicht viel Intuition zu liefern. Kannst du mehr erklären?
Glen_b

0

Soweit ich verstehen kann, gibt ein RMSE einen genaueren Wert des Fehlers zwischen Modell und beobachtetem, jedoch kann das BIAS zusätzlich zu einem Wert des Fehlers (weniger genau als das RMSE) auch bestimmen, ob das Modell ist positive oder negative Abweichung, wenn das Modell die beobachteten Werte unterschätzt oder überschätzt.


Nein. Sie können sich RMSE als die "Präzision" eines Modells vorstellen - z. B. wie viel Streuung in den Fehlern seiner Vorhersagen vorhanden ist (Hinweis: Präzision ist die Umkehrung der Varianz - hohe Varianz = niedrige Präzision). Und Sie können sich den Bias als den systematischen Fehler im Modell vorstellen - z. B. den Durchschnittswert aller Fehler. Die Arbeit "Genauigkeit" ist eine vage Kombination von beiden und verursacht daher viel Verwirrung.
Naught101
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.