Ich habe an einer neuen Methode zum Analysieren und Analysieren von Datensätzen gearbeitet, um Untergruppen einer Population zu identifizieren und zu isolieren, ohne vorher die Merkmale einer Untergruppe zu kennen. Während die Methode mit Stichproben künstlicher Daten (dh Datensätzen, die speziell zum Identifizieren und Trennen von Teilmengen der Bevölkerung erstellt wurden) gut genug funktioniert, möchte ich versuchen, sie mit Live-Daten zu testen.
Was ich suche, ist eine frei verfügbare (dh nicht vertrauliche, nicht geschützte) Datenquelle. Vorzugsweise eine, die bimodale oder multimodale Verteilungen enthält oder offensichtlich aus mehreren Teilmengen besteht, die mit herkömmlichen Mitteln nicht einfach auseinandergezogen werden können. Wo würde ich nach solchen Informationen suchen?