Es kann sinnlos sein, gegen Sprachverschiebungen anzukämpfen. Aber
Parameter bedeutet nicht Variable
In der klassischen Statistik, die in diesem Fall genau mit RA Fisher beginnt, der den Begriff zuerst mit dieser Bedeutung verwendete, ist ein Parameter eine unbekannte zu schätzende Konstante, beispielsweise ein Populationsmittelwert oder eine Korrelation. In der Mathematik gibt es verwandte, aber nicht identische Bedeutungen, wie wenn eine Kurve parametrisch angegeben wird. In vielen Wissenschaften ist Parameter nur ein anderes Wort für ein Maß (selbst ein Begriff mit dichter mathematischer Bedeutung), eine Eigenschaft oder Variable, beispielsweise Länge oder Leitfähigkeit oder Porosität oder Tugend. Natürlich ist die Länge oder Tugend eines Individuums unbekannt, bevor es gemessen wird. Aber statistisch denkende Menschen können durch die Verwendung für eine Reihe solcher Messungen amüsiert werden. Im gewöhnlichen oder vulgären Sprachgebrauch Parameter(fast immer im Plural) bedeutet häufig die Grenzen von etwas, etwa eine persönliche Beziehung oder eine politische Politik, die möglicherweise aus einer ursprünglichen Verwechslung mit dem Perimeter herrührt . Mit hoher Wahrscheinlichkeit ist davon auszugehen, dass die Bayesianer für sich selbst sprechen werden (dankbares Nicken an @conjugateprior).
schief bedeutet nicht voreingenommen
Seit einem Jahrhundert oder mehr bezieht sich die Schiefe statistisch gesehen auf die Asymmetrie von Verteilungen, ob grafisch bewertet, numerisch gemessen oder theoretisch als Glaubens- oder Hoffnungssache angenommen. Man kann sich vorstellen, dass Voreingenommenheit für viel längere Zeit bedeutet, im Durchschnitt falsch zu sein, was - sofern wir die Wahrheit kennen, dh einen wahren oder korrekten Wert - als systematischer Fehler quantifiziert werden kann. In der gewöhnlichen Sprache verzerrt zu sein, hat den allgemeinen Sinn, verzerrt oder verzerrt zu sein und somit falsch, falsch und damit auch voreingenommen zu sein. Dieser Sinn hat (soweit ich bemerkt habe, erst vor kurzem) begonnen, sich wieder auf statistische Diskussionen zu beschränken, so dass die ursprüngliche Bedeutung von Schiefe in gewisser Weise in Gefahr ist, verschwommen oder untergetaucht zu sein.
Korrelation bedeutet nicht Übereinstimmung
Die Korrelation hat in der Statistik mehrere präzise Sinne angezogen, die gemeinsam die Vorstellung einer in gewissem Sinne perfekten bivariaten Beziehung haben: Die Hauptfälle sind lineare und monotone Beziehungen. Es wird oft verwässert, selbst in statistischen Diskussionen, um fast jede Art von Beziehung oder Assoziation zu bedeuten. Was Korrelation nicht unbedingt bedeutet, ist Übereinstimmung: impliziert Pearson-Korrelation von oder , solange , aber Übereinstimmung erfordert die sehr strenge Bedingung .y=a+bx1−1b≠0y=xa=0,b=1
einzigartig heißt nicht verschieden
Es ist durchaus üblich, die unterschiedlichen Werte von Daten als eindeutig zu bezeichnen , aber eindeutig ist idealerweise noch besser als einmalige Bedeutung zu erhalten. Ich vermute, dass ein Teil der Schuld auf das Unix-Dienstprogramm uniq
und seine Nachahmer zurückzuführen ist, die möglicherweise wiederholte Werte auf eine Menge reduzieren, in der jeder Wert wirklich einzigartig ist. Die Verwendung dieser Vermutung führt die Eingabe und Ausgabe eines Programms zusammen. (Wenn wir dagegen von Duplikaten in Daten sprechen , beschränken wir uns selten auf Dubletten , die genau zweimal vorkommen. Der Begriff repliziertwäre sprachlich sinnvoller, wurde jedoch für die absichtliche Replikation von Kontrollen in Experimenten vorgezogen; Die sich ergebenden Antwortwerte sind normalerweise überhaupt nicht identisch, worauf es ankommt.)
Proben werden selten wiederholt
In der Statistik enthält eine Stichprobe mehrere Werte, und die wiederholte Stichprobe ist eine hohe theoretische Tugend, die jedoch nur selten praktiziert wird, außer durch Simulation, wie wir sie für jede Art von Fälschung in Silico gebräuchlich haben . In vielen Wissenschaften ist eine Probe ein einzelnes Objekt, das aus einem Klumpen, einem Stück Wasser, Erde, Sediment, Gestein, Blut, Gewebe oder anderen Substanzen besteht, die von attraktiv über harmlos bis ekelhaft variieren. Bei weitem nicht außergewöhnlich, kann die Entnahme vieler Proben für eine ernsthafte Analyse unerlässlich sein. Hier macht die Terminologie eines jeden Fachgebiets für seine Mitarbeiter Sinn, aber manchmal ist eine Übersetzung erforderlich.
fehler bedeutet normalerweise nicht fehler; Wie Harold Jeffreys betonte, ist der primäre Sinn unberechenbar, nicht falsch.
Trotzdem sollten wir uns vor unseren eigenen Sünden oder Eigenheiten in der Terminologie hüten:
Regression geht nicht rückwärts
stationär bedeutet nicht unbeweglich oder fest
Vertrauen hat nichts mit dem mentalen oder psychischen Zustand eines Menschen zu tun
bedeutung hat nur manchmal eine alltägliche bedeutung
exact ist oft ein ehrenwerter Begriff, der sich eher auf eine bequem nachvollziehbare Lösung oder Berechnung bezieht als auf eine dem Problem entsprechende
Verteilungen, die nach rechts verschoben sind , sehen für viele nach links verschoben aus und umgekehrt
Das Lognormal wird so genannt, weil es ein potenziertes Normal ist
aber das lognormal ist normaler als das normale
Der Gaußsche wurde von De Moivre entdeckt
Poisson hat den Poisson nicht entdeckt , geschweige denn die Poisson-Regression
der bootstrap hilft dir nicht mit deinen schuhen
das jackknife schneidet nicht
Kurtosis ist keine Erkrankung
Stängel-Blatt-Parzellen beziehen sich nicht auf Pflanzen
Eine Dummy-Variable ist nützlich, nicht sinnlos oder dumm
Wer auf der Erde (oder irgendwo anders) glaubt, dass Heteroskedastizität ein besserer Begriff ist als ungleiche Variabilität ?
robust hat jetzt mindestens zwei wichtige technische Bedeutungen für verschiedene Gruppen, von denen keine seine häufige Verwendung, auch in technischen Diskussionen, hemmt, um nur etwas wie "behauptet, sich gut zu verhalten" zu bedeuten
IV hat jetzt mindestens zwei Hauptbedeutungen für verschiedene Gruppen
Faktor hat jetzt mindestens zwei Hauptbedeutungen für verschiedene Gruppen
normalisieren und standardisieren haben unzählige Bedeutungen (da müssen wir wirklich standardisieren)
gegen einen Graphen beschreibt , bedeutet vertikale variable gegen horizontalen Variable , wenn sie nicht das Gegenteil bedeuten ,
und (last but not least, um eine Phrase zu prägen) Statistik hat mindestens drei Hauptbedeutungen.
Anmerkungen:
Trotz gegenteiliger Erscheinungen halte ich dies für eine gute, ernste Frage.
Die Mode wechselt. Bis weit in das 20. Jahrhundert hinein scheinen viele Menschen (keine Namen, kein Pack-Drill, aber Karl Pearson könnte erwähnt werden) Begriffe nur erfinden zu können, indem sie nach ihren griechischen und lateinischen Wörterbüchern greifen. (Es wäre unfair, ihm keine Anerkennung für die Streudiagramme zu geben .) Aber RA Fisher hat viele vorbestehende englische Wörter entführt, einschließlich Varianz , Suffizienz , Effizienz und Wahrscheinlichkeit . In jüngerer Zeit war JW Tukey ein Meister im Umgang mit häuslichen Begriffen, aber nur wenige sollten Bedrängnis empfinden, die Sploms und Badmandments nicht erreichten.
Ein Kommentar basiert auf der Erinnerung an "Das Leben ist [...] eher multiplikativ als additiv: Die logarithmische Normalverteilung ist normaler als normal." Anon. 1962. Bloggins Arbeitsregeln. In Good, IJ (Hrsg.) Der Wissenschaftler spekuliert: eine Anthologie von teilweise gebackenen Ideen. London: Heinemann, 212-213 (Zitat auf S.213).