Wilk, MB und Gnanadesikan, R. 1968. Wahrscheinlichkeitsplotmethoden für die Analyse von Daten.
Biometrika 55: 1-17. Jstor Link, wenn Sie Zugriff haben
Dieses Papier ist zum Zeitpunkt meines Schreibens fast 50 Jahre alt, fühlt sich aber immer noch frisch und innovativ an. Anhand einer Vielzahl interessanter und aussagekräftiger Beispiele vereinen und erweitern die Autoren eine Vielzahl von Ideen zum Plotten und Vergleichen von Verteilungen im Rahmen von QQ- (Quantil-Quantil) und PP-Plots (Wahrscheinlichkeit-Wahrscheinlichkeit). Verteilungen bedeuten hier im Großen und Ganzen alle Datensätze oder Zahlen (Residuen, Kontraste usw. usw.), die bei ihren Analysen auftreten.
Bestimmte Versionen dieser Diagramme reichen mehrere Jahrzehnte zurück, ganz offensichtlich Diagramme mit normaler Wahrscheinlichkeit oder normaler Punktzahl. Hierbei handelt es sich um Quantil-Quantil-Diagramme, d. h. Diagramme von beobachteten Quantilen gegenüber erwarteten oder theoretischen Quantilen aus einer Probe gleicher Größe mit normaler (Gauß'scher) Verteilung. Die Autoren zeigen jedoch bescheiden und dennoch zuversichtlich, dass dieselben Ideen leicht - und praktisch mit modernem Computing - erweitert werden können, um andere Arten von Quantilen zu untersuchen und die Ergebnisse automatisch zu zeichnen.
Die Autoren, damals beide bei Bell Telephone Laboratories, verfügten über hochmoderne Computereinrichtungen, und selbst viele Universitäten und Forschungseinrichtungen brauchten etwa ein Jahrzehnt, um aufzuholen. Sogar jetzt verdienen die Ideen in diesem Papier eine breitere Anwendung als sie erhalten werden. Es handelt sich um einen seltenen Einführungstext oder Kurs, der eine dieser Ideen außer dem normalen QQ-Plot enthält. Histogramme und Box-Plots (von denen jedes oft sehr nützlich, aber dennoch umständlich und in verschiedener Hinsicht begrenzt ist) sind weiterhin die Hauptgrundlagen für die Einführung von Verteilungsplots.
Persönlich mag ich es, wenngleich die Hauptideen dieses Papiers den größten Teil meiner Karriere lang bekannt waren, es alle paar Jahre erneut zu lesen. Ein guter Grund ist die Freude an der Art und Weise, wie die Autoren einfache, aber wirkungsvolle Ideen mit seriösen Beispielen zum Tragen bringen. Ein weiterer guter Grund ist die Art und Weise, wie das Papier, das kurz und bombastisch geschrieben ist, auf Erweiterungen der Hauptideen hinweist. Mehr als einmal habe ich Wendungen in Bezug auf die Hauptideen entdeckt, die explizit in Hinweisen und weiteren Kommentaren behandelt werden.
Dies ist nicht nur ein Artikel für diejenigen, die sich besonders für statistische Grafiken interessieren. Meiner Meinung nach sollte dies jedoch jeden einschließen, der sich für Statistiken jeglicher Art interessiert. Es fördert das Denken über Verteilungen, die praktisch hilfreich sind, um die statistischen Fähigkeiten und Erkenntnisse eines Menschen zu entwickeln.