Ich versuche genau hervorzuheben, was sich zwischen zwei Datenrahmen geändert hat.
Angenommen, ich habe zwei Python Pandas-Datenrahmen:
"StudentRoster Jan-1":
id Name score isEnrolled Comment
111 Jack 2.17 True He was late to class
112 Nick 1.11 False Graduated
113 Zoe 4.12 True
"StudentRoster Jan-2":
id Name score isEnrolled Comment
111 Jack 2.17 True He was late to class
112 Nick 1.21 False Graduated
113 Zoe 4.12 False On vacation
Mein Ziel ist es, eine HTML-Tabelle auszugeben, die:
- Identifiziert geänderte Zeilen (int, float, boolean, string)
Gibt Zeilen mit denselben, ALTEN und NEUEN Werten aus (idealerweise in eine HTML-Tabelle), damit der Verbraucher klar erkennen kann, was sich zwischen zwei Datenrahmen geändert hat:
"StudentRoster Difference Jan-1 - Jan-2": id Name score isEnrolled Comment 112 Nick was 1.11| now 1.21 False Graduated 113 Zoe 4.12 was True | now False was "" | now "On vacation"
Ich nehme an, ich könnte einen zeilenweisen und einen spaltenweisen Vergleich durchführen, aber gibt es einen einfacheren Weg?
df.compare
tun - .