C ++ Zeichentypen

Der Standard verkohlen Variable in C ++ ist eine knappe 1 Byte breit und nur 255 verschiedene Zeichen verarbeiten. Das ist viel genug für europäische Sprachen, aber nicht groß genug, um symbolbasierte Sprachen wie Kanji zu handhaben.

Mehrere Standards wurden den Zeichensatz zu erweitern entstanden die Anforderungen dieser Sprachen zu behandeln. UTF-8 verwendet eine Mischung aus 8-, 16- und 32-Bit-Zeichen fast jedes Kanji zu implementieren oder Hieroglyphe Sie sich vorstellen können, bleiben aber immer noch kompatibel mit einfachen 8-Bit-ASCII. UTF-16 verwendet eine Mischung aus 16- und 32-Bit-Zeichen einen erweiterten Zeichensatz zu erreichen, und UTF-32 verwendet 32 ​​Bits für alle Zeichen.

UTF steht für Unicode Transformation Format, von dem er die gemeinsamen Spitznamen Unicode bekommt.

Die Tabelle beschreibt die verschiedenen Zeichentypen unterstützt von C ++. Zuerst versuchte C ++ mit einem vage definierten breiten Zeichentyp zu erhalten, indem, wchar_t. Diese Art sollte die große Zeichentyp stammt aus dem Anwendungsprogramm Umwelt zu sein. C ++ '11 eingeführt spezifische Typen für UTF-16 und UTF-32.

Die C ++ Zeichentypen
VariableBeispielWas es ist
verkohlen'C'ASCII oder UTF-8-Zeichenwchar_tL'c 'Charakter im Wide-Formatchar_16tU'c 'UTF-16-Zeichenchar_32tU'c 'UTF-32-Zeichen

UTF-16 ist die Standard-Kodierung für Windows-Anwendungen. Das wchar_t Typ bezieht sich auf UTF-16 im Code :: Blocks / gcc-Compiler.

Jede der Zeichentypen in der Tabelle kann auch in Strings kombiniert werden:

wchar_t * Wide = L "Dies ist eine große Zeichenfolge" -

Menü