Encoding Zeichen in C ++ Code

Computer & Software / Programmierung / C ++

Alles, was in dem Computer durch ein Muster von Einsen und Nullen dargestellt - Variationen in der Spannung, die als Zahlen interpretiert werden. Somit wird das Bitmuster 0000 0001 1 die Anzahl, wenn sie als Integer interpretiert. Dies bedeutet jedoch, gleiche Bitmuster etwas ganz anderes, wenn sie als eine Anweisung von dem Prozessor interpretiert.

So sollte es nicht überraschen, dass der Computer die Zeichen des Alphabets codiert, indem jeder eine Nummer zuweisen.

Betrachten Sie das Zeichen 'A'. Man könnte es einen beliebigen Wert weisen Sie wollen, solange wir alle auf den Wert einigen. Zum Beispiel könnten Sie einen Wert von 1 bis "A" zuweisen, wenn man wollte. Logischerweise könnten Sie den Wert 2 auf 'B' dann zuweisen, 3 bis 'C', und so weiter.

In diesem Schema 'Z' würde den Wert bekommen 26. Sie könnte dann durch Zuweisung des Wertes 27 auf 'a', 28 'b', bis hin zu 52 für 'z' beginnen. Es bleibt aber die Ziffern '0' bis '9' sowie alle Sonderzeichen wie Leerzeichen, Punkt, Komma, Schrägstrich, Semikolon, und die lustigen Charaktere sehen Sie, wenn Sie mit den Zifferntasten drücken, während Umschalttaste gedrückt halten.

Hinzu kommt die nicht druckbare Zeichen wie Reiter und Newline. Wenn alles gesagt und getan ist, können Sie die gesamte englische Tastatur mit Zahlen zwischen 1 und 127 kodieren.

Irgendwann um 1963 gab es eine allgemeine Übereinstimmung darüber, wie Zeichen sollten in englischer Sprache codiert werden. Die ASCII (American Standard Coding for Information Interchange) Zeichencodierung in gezeigt recht angenommen wurde viel allgemein mit Ausnahme eines Unternehmens.

IBM veröffentlicht, wie auch im Jahr 1963 einen eigenen Standard. Die beiden Codierungsstandards duked es seit etwa zehn Jahren, aber von den frühen 1970er Jahren - als C und C ++ wurden geschaffen werden - ASCII hatte gerade über die Schlacht. Das verkohlen Typ wurde mit ASCII-Zeichencodierung im Verstand.

Der ASCII-Zeichensatz
Wert	Verkohlen	Wert	Verkohlen
0	NULL	64	@
1	Beginn der Überschrift	65	EIN
2	Textanfang	66	B
3	Ende des Texts	67	C
4	Ende der Übertragung	68	D
5	Anfrage	69	E
6	Bestätigen	70	F
7	Glocke	71	G
8	Rücktaste	72	H
9	Tab	73	ich
10	Neue Zeile	74	J
11	Vertikal Tab	75	K
12	New Page- Form Feed	76	L
13	Carriage Return	77	M
14	Umschalt Out	78	N
15	Verschiebung in	79	O
16	Data Link Flucht	80	P
17	Device Control 1	81	Q
18	Device Control 2	82	R
19	Device Control 3	83	S
20	Device Control 4	84	T
21	Negative Acknowledge	85	U
22	Synchrone Idle	86	V
23	Ende der Übertragung	87	W
24	Stornieren	88	X
25	End of Medium	89	Y
26	Ersatz	90	Z
27	Flucht	91	[
28	Datei Separator	92
29	Gruppe Separator	93	]
30	Die Bilanz Separator	94	^
31	Einheit Separator	95	_
32	Raum	96	`
33	!	97	ein
34	# 147-	98	b
35	#	99	c
36	$	100	d
37	%	101	e
38		102	f
39	'	103	G
40	(	104	h
41	)	105	ich
42	*	106	j
43	+	107	k
44	,	108	l
45	=	109	m
46	.	110	n
47	/	111	O
48	0	112	p
49	1	113	q
50	2	114	r
51	3	115	s
52	4	116	t
53	5	117	u
54	6	118	v
55	7	119	w
56	8	120	x
57	9	121	y
58	:	122	z
59	-	123
60	lt;	124
62	>	126	~
63	?	127	DEL

Das erste, was Sie ist bemerken, dass die ersten 32 Zeichen der sind # 147-unprintable # 148- Zeichen. Das bedeutet nicht, dass diese Zeichen so frech sind, dass der Zensor nicht zulassen, dass sie gedruckt werden - es bedeutet, dass sie nicht als sichtbare Symbole angezeigt werden, wenn auf dem Drucker gedruckt (oder auf der Konsole, für diese Angelegenheit). Viele dieser Zeichen werden nicht mehr verwendet oder nur in schwer nachvollziehbarer Weise verwendet.

Zum Beispiel Zeichen 25 # 147-End of Medium # 148- wurde wahrscheinlich als das letzte Zeichen vor dem Ende einer Magnetbandspule gedruckt. Das war eine große Sache im Jahr 1963, aber heute. . . Verwendung der Zeichen nicht so viel, so ist begrenzt.

Die Zeichen, beginnend mit 32 alle druckbar sind mit Ausnahme der letzten, 127, Das ist das Zeichen löschen.

Encoding Zeichen in C ++ Code

Ähnliche

Menü