Der utf-8-Codefehler tritt normalerweise auf, wenn der Bereich der numerischen Werte 0 bis 127 überschreitet.
Der Grund für diese Ausnahme ist:
1) Wenn der Codepunkt <128 ist, entspricht jedes Byte dem Wert des Codepunkts. 2) Wenn der Codepunkt 128 oder höher ist, kann die Unicode-Zeichenfolge in dieser Codierung nicht dargestellt werden. (Python löst in diesem Fall eine UnicodeEncodeError-Ausnahme aus.)
Um dies zu überwinden, haben wir eine Reihe von Codierungen. Die am häufigsten verwendete ist "Latin-1, auch bekannt als ISO-8859-1".
ISO-8859-1-Unicode-Punkte 0–255 sind also mit den Latin-1-Werten identisch. Für die Konvertierung in diese Codierung müssen lediglich Codepunkte in Bytewerte konvertiert werden. Wenn ein Codepunkt größer als 255 gefunden wird, kann die Zeichenfolge nicht in Latin-1 codiert werden
Wenn diese Ausnahme auftritt, wenn Sie versuchen, einen Datensatz zu laden, versuchen Sie, dieses Format zu verwenden
df=pd.read_csv("top50.csv",encoding='ISO-8859-1')
Fügen Sie am Ende der Syntax eine Codierungstechnik hinzu, die dann das Laden des Datensatzes akzeptiert.