Ich habe einen Pandadatenrahmen mit mehreren Einträgen und möchte die Korrelation zwischen dem Einkommen einer Art von Geschäften berechnen. Es gibt eine Reihe von Geschäften mit Einkommensdaten, Klassifizierung des Tätigkeitsbereichs (Theater, Tuchläden, Lebensmittel ...) und anderen Daten.
Ich habe versucht, einen neuen Datenrahmen zu erstellen und eine Spalte mit den Einnahmen aller Arten von Geschäften einzufügen, die derselben Kategorie angehören. Im zurückgegebenen Datenrahmen ist nur die erste Spalte ausgefüllt, und der Rest ist mit NaNs gefüllt. Der Code, den ich müde:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Ich möchte dies tun, damit ich .corr()
die Korrelationsmatrix zwischen den Kategorien der Geschäfte angeben kann.
Danach möchte ich wissen, wie ich die Matrixwerte (-1 bis 1, da ich die Pearson-Korrelation verwenden möchte) mit Matplolib darstellen kann.