Encoding Zeichen in C ++ Code

Alles, was in dem Computer durch ein Muster von Einsen und Nullen dargestellt - Variationen in der Spannung, die als Zahlen interpretiert werden. Somit wird das Bitmuster 0000 0001 1 die Anzahl, wenn sie als Integer interpretiert. Dies bedeutet jedoch, gleiche Bitmuster etwas ganz anderes, wenn sie als eine Anweisung von dem Prozessor interpretiert.

So sollte es nicht überraschen, dass der Computer die Zeichen des Alphabets codiert, indem jeder eine Nummer zuweisen.

Betrachten Sie das Zeichen 'A'. Man könnte es einen beliebigen Wert weisen Sie wollen, solange wir alle auf den Wert einigen. Zum Beispiel könnten Sie einen Wert von 1 bis "A" zuweisen, wenn man wollte. Logischerweise könnten Sie den Wert 2 auf 'B' dann zuweisen, 3 bis 'C', und so weiter.

In diesem Schema 'Z' würde den Wert bekommen 26. Sie könnte dann durch Zuweisung des Wertes 27 auf 'a', 28 'b', bis hin zu 52 für 'z' beginnen. Es bleibt aber die Ziffern '0' bis '9' sowie alle Sonderzeichen wie Leerzeichen, Punkt, Komma, Schrägstrich, Semikolon, und die lustigen Charaktere sehen Sie, wenn Sie mit den Zifferntasten drücken, während Umschalttaste gedrückt halten.

Hinzu kommt die nicht druckbare Zeichen wie Reiter und Newline. Wenn alles gesagt und getan ist, können Sie die gesamte englische Tastatur mit Zahlen zwischen 1 und 127 kodieren.

Irgendwann um 1963 gab es eine allgemeine Übereinstimmung darüber, wie Zeichen sollten in englischer Sprache codiert werden. Die ASCII (American Standard Coding for Information Interchange) Zeichencodierung in gezeigt recht angenommen wurde viel allgemein mit Ausnahme eines Unternehmens.

IBM veröffentlicht, wie auch im Jahr 1963 einen eigenen Standard. Die beiden Codierungsstandards duked es seit etwa zehn Jahren, aber von den frühen 1970er Jahren - als C und C ++ wurden geschaffen werden - ASCII hatte gerade über die Schlacht. Das verkohlen Typ wurde mit ASCII-Zeichencodierung im Verstand.

Der ASCII-Zeichensatz
WertVerkohlenWertVerkohlen
0NULL64@
1Beginn der Überschrift65EIN
2Textanfang66B
3Ende des Texts67C
4Ende der Übertragung68D
5Anfrage69E
6Bestätigen70F
7Glocke71G
8Rücktaste72H
9Tab73ich
10Neue Zeile74J
11Vertikal Tab75K
12New Page- Form Feed76L
13Carriage Return77M
14Umschalt Out78N
15Verschiebung in79O
16Data Link Flucht80P
17Device Control 181Q
18Device Control 282R
19Device Control 383S
20Device Control 484T
21Negative Acknowledge85U
22Synchrone Idle86V
23Ende der Übertragung87W
24Stornieren88X
25End of Medium89Y
26Ersatz90Z
27Flucht91[
28Datei Separator92
29Gruppe Separator93]
30Die Bilanz Separator94^
31Einheit Separator95_
32Raum96`
33!97ein
34# 147-98b
35#99c
36$100d
37%101e
38102f
39'103G
40(104h
41)105ich
42*106j
43+107k
44,108l
45=109m
46.110n
47/111O
480112p
491113q
502114r
513115s
524116t
535117u
546118v
557119w
568120x
579121y
58:122z
59-123
60lt;124
62>126~
63?127DEL

Das erste, was Sie ist bemerken, dass die ersten 32 Zeichen der sind # 147-unprintable # 148- Zeichen. Das bedeutet nicht, dass diese Zeichen so frech sind, dass der Zensor nicht zulassen, dass sie gedruckt werden - es bedeutet, dass sie nicht als sichtbare Symbole angezeigt werden, wenn auf dem Drucker gedruckt (oder auf der Konsole, für diese Angelegenheit). Viele dieser Zeichen werden nicht mehr verwendet oder nur in schwer nachvollziehbarer Weise verwendet.

Zum Beispiel Zeichen 25 # 147-End of Medium # 148- wurde wahrscheinlich als das letzte Zeichen vor dem Ende einer Magnetbandspule gedruckt. Das war eine große Sache im Jahr 1963, aber heute. . . Verwendung der Zeichen nicht so viel, so ist begrenzt.

Die Zeichen, beginnend mit 32 alle druckbar sind mit Ausnahme der letzten, 127, Das ist das Zeichen löschen.

Menü