UTF-8 (8-Bit Unicode Transformation Format) ist eine Methode zur Codierung von Zeichen, so dass jedes beliebige Zeichen mit einer variablen Anzahl von Byte dargestellt werden kann. Unter Unix wird das Format wie jeder andere Multibyte-Zeichensatz behandelt und ist abwärtskompatibel mit dem ASCII-Zeichensatz.
Client Automation-Code wird unter Linux und UNIX in der Regel in einem UTF-8-Gebietsschema ausgeführt. Dies führt zu Problemen mit dem Betriebssystem, wenn das Betriebssystem ein Nicht-UTF-8-Gebietsschema verwendet. Sämtlicher Code, der mit dem Betriebssystem verknüpft ist, wie beispielsweise Dateinamen, Befehlszeilenparameter usw. wird zwischen dem MBCS-Gebietsschema des Systems und UTF-8 konvertiert.
Ein Multibyte-Zeichensatz (MBCS) verwendet 1 oder 2 Byte pro Zeichen und wird für Zeichensätze mit sehr vielen verschiedenen Zeichen eingesetzt (zum Beispiel asiatische Zeichensätze).
|
Copyright © 2014 CA Technologies.
Alle Rechte vorbehalten.
|
|