Für das Layout haben wir unseren berühmten "Lorem ipsum" -Text, um zu testen, wie er aussieht.
Was ich suche, ist eine Reihe von Dateien, die Text enthalten, der mit verschiedenen Codierungen codiert ist, die ich in meinen JUnit-Tests verwenden kann, um einige Methoden zu testen, die sich mit der Zeichencodierung beim Lesen von Textdateien befassen.
Beispiel:Eine ISO 8859-1
codierte Testdatei und eine Windows-1252
codierte Testdatei haben. Das Windows-1252 muss die Unterschiede in Region 80 16 - 9F 16 auslösen . Mit anderen Worten, es muss mindestens ein Zeichen dieser Region enthalten, um sie von ISO 8859-1 zu unterscheiden.
Der vielleicht beste Satz von Testdateien ist der, bei dem die Testdatei für jede Codierung alle Zeichen einmal enthält. Aber vielleicht ist mir etw nicht bewusst - wir alle mögen dieses Kodierungsmaterial, oder? :-)
Gibt es so eine Reihe von Testdateien für Zeichencodierungsprobleme?