Encoding Zeichen in C ++ Code
Alles, was in dem Computer durch ein Muster von Einsen und Nullen dargestellt - Variationen in der Spannung, die als Zahlen interpretiert werden. Somit wird das Bitmuster 0000 0001 1 die Anzahl, wenn sie als Integer interpretiert. Dies bedeutet jedoch, gleiche Bitmuster etwas ganz anderes, wenn sie als eine Anweisung von dem Prozessor interpretiert.
So sollte es nicht überraschen, dass der Computer die Zeichen des Alphabets codiert, indem jeder eine Nummer zuweisen.
Betrachten Sie das Zeichen 'A'. Man könnte es einen beliebigen Wert weisen Sie wollen, solange wir alle auf den Wert einigen. Zum Beispiel könnten Sie einen Wert von 1 bis "A" zuweisen, wenn man wollte. Logischerweise könnten Sie den Wert 2 auf 'B' dann zuweisen, 3 bis 'C', und so weiter.
In diesem Schema 'Z' würde den Wert bekommen 26. Sie könnte dann durch Zuweisung des Wertes 27 auf 'a', 28 'b', bis hin zu 52 für 'z' beginnen. Es bleibt aber die Ziffern '0' bis '9' sowie alle Sonderzeichen wie Leerzeichen, Punkt, Komma, Schrägstrich, Semikolon, und die lustigen Charaktere sehen Sie, wenn Sie mit den Zifferntasten drücken, während Umschalttaste gedrückt halten.
Hinzu kommt die nicht druckbare Zeichen wie Reiter und Newline. Wenn alles gesagt und getan ist, können Sie die gesamte englische Tastatur mit Zahlen zwischen 1 und 127 kodieren.
Irgendwann um 1963 gab es eine allgemeine Übereinstimmung darüber, wie Zeichen sollten in englischer Sprache codiert werden. Die ASCII (American Standard Coding for Information Interchange) Zeichencodierung in gezeigt recht angenommen wurde viel allgemein mit Ausnahme eines Unternehmens.
IBM veröffentlicht, wie auch im Jahr 1963 einen eigenen Standard. Die beiden Codierungsstandards duked es seit etwa zehn Jahren, aber von den frühen 1970er Jahren - als C und C ++ wurden geschaffen werden - ASCII hatte gerade über die Schlacht. Das verkohlen Typ wurde mit ASCII-Zeichencodierung im Verstand.
Wert | Verkohlen | Wert | Verkohlen |
---|---|---|---|
0 | NULL | 64 | @ |
1 | Beginn der Überschrift | 65 | EIN |
2 | Textanfang | 66 | B |
3 | Ende des Texts | 67 | C |
4 | Ende der Übertragung | 68 | D |
5 | Anfrage | 69 | E |
6 | Bestätigen | 70 | F |
7 | Glocke | 71 | G |
8 | Rücktaste | 72 | H |
9 | Tab | 73 | ich |
10 | Neue Zeile | 74 | J |
11 | Vertikal Tab | 75 | K |
12 | New Page- Form Feed | 76 | L |
13 | Carriage Return | 77 | M |
14 | Umschalt Out | 78 | N |
15 | Verschiebung in | 79 | O |
16 | Data Link Flucht | 80 | P |
17 | Device Control 1 | 81 | Q |
18 | Device Control 2 | 82 | R |
19 | Device Control 3 | 83 | S |
20 | Device Control 4 | 84 | T |
21 | Negative Acknowledge | 85 | U |
22 | Synchrone Idle | 86 | V |
23 | Ende der Übertragung | 87 | W |
24 | Stornieren | 88 | X |
25 | End of Medium | 89 | Y |
26 | Ersatz | 90 | Z |
27 | Flucht | 91 | [ |
28 | Datei Separator | 92 | |
29 | Gruppe Separator | 93 | ] |
30 | Die Bilanz Separator | 94 | ^ |
31 | Einheit Separator | 95 | _ |
32 | Raum | 96 | ` |
33 | ! | 97 | ein |
34 | # 147- | 98 | b |
35 | # | 99 | c |
36 | $ | 100 | d |
37 | % | 101 | e |
38 | 102 | f | |
39 | ' | 103 | G |
40 | ( | 104 | h |
41 | ) | 105 | ich |
42 | * | 106 | j |
43 | + | 107 | k |
44 | , | 108 | l |
45 | = | 109 | m |
46 | . | 110 | n |
47 | / | 111 | O |
48 | 0 | 112 | p |
49 | 1 | 113 | q |
50 | 2 | 114 | r |
51 | 3 | 115 | s |
52 | 4 | 116 | t |
53 | 5 | 117 | u |
54 | 6 | 118 | v |
55 | 7 | 119 | w |
56 | 8 | 120 | x |
57 | 9 | 121 | y |
58 | : | 122 | z |
59 | - | 123 | |
60 | lt; | 124 | |
62 | > | 126 | ~ |
63 | ? | 127 | DEL |
Das erste, was Sie ist bemerken, dass die ersten 32 Zeichen der sind # 147-unprintable # 148- Zeichen. Das bedeutet nicht, dass diese Zeichen so frech sind, dass der Zensor nicht zulassen, dass sie gedruckt werden - es bedeutet, dass sie nicht als sichtbare Symbole angezeigt werden, wenn auf dem Drucker gedruckt (oder auf der Konsole, für diese Angelegenheit). Viele dieser Zeichen werden nicht mehr verwendet oder nur in schwer nachvollziehbarer Weise verwendet.
Zum Beispiel Zeichen 25 # 147-End of Medium # 148- wurde wahrscheinlich als das letzte Zeichen vor dem Ende einer Magnetbandspule gedruckt. Das war eine große Sache im Jahr 1963, aber heute. . . Verwendung der Zeichen nicht so viel, so ist begrenzt.
Die Zeichen, beginnend mit 32 alle druckbar sind mit Ausnahme der letzten, 127, Das ist das Zeichen löschen.