Der "Iris" -Datensatz ist den meisten hier wohl bekannt - er ist einer der kanonischen Testdatensätze und ein Beispieldatensatz für alles von der Datenvisualisierung bis zum maschinellen Lernen. Zum Beispiel wurde es von allen in dieser Frage für eine Diskussion der durch die Behandlung getrennten Streudiagramme verwendet.
Was macht den Iris- Datensatz so nützlich? Nur dass es zuerst da war? Welche Lehren könnten sie daraus ziehen, wenn jemand versuchen würde , ein nützliches Beispiel / einen Testdatensatz zu erstellen ?