Eine Methode zur Darstellung von Zeichen (z. B. A, 9,%, ழ, ♦ und nicht druckbare Steuerzeichen) zur Speicherung und Kommunikation. Der Unicode-Standard bietet einen Codepunkt (eine Nummer) für jedes von über 100.000 verschiedenen Zeichen. Der Standard wird durch Zeichencodierungen wie UTF-8 implementiert, die in Linux-Systemen weit verbreitet sind. Die ersten 128 Unicode-Codepunkte sind die ASCII-Zeichen, die UTF-8 mit 1 Byte pro Zeichen darstellt.