Es scheint etwas in unserem menschlichen Verständnis zu geben, das es schwierig macht, die Idee der Varianz intuitiv zu erfassen. Im engeren Sinne ist die Antwort unmittelbar: Das Quadrieren wirft uns von unserem reflexiven Verständnis ab. Aber ist es nur die Varianz , die Probleme aufwirft, oder ist es die ganze Idee der Verbreitung in den Daten? Wir suchen Zuflucht in der Reichweiteoder nur das Minimum und Maximum angeben, aber vermeiden wir nur die wirklichen Schwierigkeiten? Im Mittelwert (Modus oder Median) finden wir das Zentrum, die Zusammenfassung ... eine Vereinfachung; Die Varianz verbreitet Dinge und macht sie unangenehm. Der primitive Mensch würde sicherlich den Mittelwert bei der Jagd auf Tiere nutzen, indem er zum Gebet triangulierte, aber ich nehme an, dass wir viel später das Bedürfnis verspürten, die Ausbreitung der Dinge zu quantifizieren. Tatsächlich wurde der Begriff Varianz erstmals 1918 von Ronald Fisher in der Arbeit "Die Korrelation zwischen Verwandten unter der Annahme der Mendelschen Vererbung" eingeführt.
Die meisten Leute, die den Nachrichten folgen, hätten die Geschichte von Larry Summers unglücklicher Rede über mathematische Fähigkeiten nach Geschlecht gehört , die möglicherweise mit seiner Abreise aus Harvard zusammenhängen. Kurz gesagt, er schlug eine größere Varianz in der Verteilung der Mathematikkompetenz unter Männern im Vergleich zu Frauen vor, obwohl beide Geschlechter den gleichen Mittelwert hatten. Unabhängig von der Angemessenheit oder den politischen Implikationen scheint dies in der wissenschaftlichen Literatur begründet zu sein .
Noch wichtiger ist, dass das Verständnis von Themen wie dem Klimawandel - bitte verzeihen Sie mir, dass ich Themen anspreche, die zu völlig unaufgeforderten Diskussionen führen könnten - durch die allgemeine Bevölkerung durch eine bessere Vertrautheit mit der Idee der Varianz unterstützt werden könnte.
Das Problem verschärft sich, wenn wir versuchen, die Kovarianz zu erfassen , wie in diesem Beitrag gezeigt , mit einer großartigen und farbenfrohen Antwort von @whuber hier .
Es mag verlockend sein, diese Frage als zu allgemein abzulehnen , aber es ist klar, dass wir sie indirekt diskutieren, wie in diesem Beitrag , in dem die Mathematik trivial ist, das Konzept jedoch weiterhin schwer fassbar ist und eine bequemere Akzeptanz der Reichweite als im Gegensatz zu der nuancierteren Ideenvarianz .
In einem Brief von Fisher an EBFord , der sich auf die Kontroverse über seinen Verdacht auf die Mendelschen Experimente bezieht, lesen wir: "Jetzt, wo Daten gefälscht wurden, weiß ich sehr gut, wie allgemein die Häufigkeit weitreichender Abweichungen unterschätzt wird , so dass die Die Tendenz ist immer, sie zu gut mit den Erwartungen übereinstimmen zu lassen ... die Abweichungen [in Mendels Daten] sind erschreckend gering. " Der große RA Fisher ist so scharf darauf, kleine Abweichungen in kleinen Stichproben zu vermuten, dass er schreibt : "Es bleibt unter anderem die Möglichkeit, dass Mendel von einem Assistenten getäuscht wurde, der nur zu gut wusste, was erwartet wurde."
Und es ist durchaus möglich, dass diese Tendenz, die Verbreitung zu unterschätzen oder zu missverstehen, bis heute anhält. Wenn ja, gibt es eine Erklärung dafür, warum wir mit Zentralitätskonzepten besser vertraut sind als mit Dispersion? Können wir irgendetwas tun, um die Idee zu verinnerlichen?
Einige Konzepte "sehen" wir blitzschnell, und dann tun wir es nicht, aber wir akzeptieren sie und gehen weiter. Zum Beispiel ist oder E = m c 2 , aber wir müssen nicht einmal über diese Identitäten Bescheid wissen, um Entscheidungen in unserem täglichen Leben zu treffen. Gleiches gilt nicht für die Varianz. Sollte es nicht intuitiver sein?
Nassim Taleb hat ein Vermögen gemacht, indem er seine (wirklich Benoit Mandelbrots ) Wahrnehmung eines fehlerhaften Verständnisses von Varianz auf die Ausnutzung von Krisenzeiten angewendet hat, und versucht, das Konzept mit Sätzen wie "Die Varianz der Varianz ist erkenntnistheoretisch für die Massen verständlich zu machen" , ein Maß für mangelndes Wissen über den Mangel an Wissen über den Mittelwert "- ja, dieser Schluck hat mehr Kontext ... Und zu seiner Ehre hat er es auch mit der Idee von Thanksgiving Turkey einfacher gemacht . Man kann argumentieren, dass der Schlüssel zum Investieren darin besteht, Varianz (und Kovarianz) zu verstehen.
Warum ist es so rutschig und wie kann man Abhilfe schaffen? Ohne Formeln ... nur die Intuition jahrelangen Umgangs mit Unsicherheit ... Ich kenne die Antwort nicht, aber sie ist nicht mathematisch (das heißt unbedingt): Ich frage mich zum Beispiel, ob die Idee der Kurtosis die Varianz beeinträchtigt. In der folgenden Darstellung haben wir zwei Histogramme, die sich mit praktisch derselben Varianz überlappen. Meine Knie-Ruck-Reaktion ist jedoch, dass der mit den längsten Schwänzen und dem höchsten Gipfel (höhere Kurtosis) stärker "ausgebreitet" ist: