Ich habe eine Zeichenfolge, die so aussieht:
6Â 918Â 417Â 712
Die eindeutige Methode zum Trimmen dieser Zeichenfolge (wie ich Python verstehe) besteht einfach darin, zu sagen, dass sich die Zeichenfolge in einer Variablen namens s
befindet. Wir erhalten:
s.replace('Â ', '')
Das sollte den Trick machen. Aber natürlich beschwert es sich, dass das Nicht-ASCII-Zeichen'\xc2'
in der Datei blabla.py nicht codiert ist.
Ich konnte nie ganz verstehen, wie man zwischen verschiedenen Codierungen wechselt.
Hier ist der Code, er ist wirklich genauso wie oben, aber jetzt ist er im Kontext. Die Datei wird als UTF-8 im Editor gespeichert und hat den folgenden Header:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Der Code:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Es geht nicht weiter als s.replace
...
u