Единицы измерения информации
Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO… Читать ещё >
Единицы измерения информации (реферат, курсовая, диплом, контрольная)
Таким образом, единицей информации в компьютере является один бит, т. е. двоичный разряд, который может принимать значение 0 или 1. Восемь последовательных бит составляют байт. В одном байте можно закодировать значение одного символа из 256 возможных (256 = 2 в степени 8). Более крупной единицей информации является килобайт (Кбайт), равный 1024 байтам (1024 = 2 в степени 10). Еще более крупные единицы измерения данных: мегабайт, гигабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).
Целые числа кодируются двоичным кодом довольно просто (путем деления числа на два). Для кодирования нечисловой информации используется следующий алгоритм: все возможные значения кодируемой информации нумеруются и эти номера кодируются с помощью двоичного кода.
Например, для представления текстовой информации используется таблица нумерации символов или таблица кодировки символов, в которой каждому символу соответствует целое число (порядковый номер). Восемь двоичных разрядов могут закодировать 256 различных символов.
Что такое ASCII?
ASCII — American Standard Code for Information Interchange — американский стандартный код для обмена информацией. ASCII представляет собой 8-битную кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. Нижнюю половину кодовой таблицы (0 — 127) занимают символы US-ASCII, а верхнюю (128 — 255) — разные другие нужные символы. Слово ASCII чаще употребляется в женском роде.
Стандарт ISO 646 (ECMA-6) предусматривает возможность размещения национальных символов на месте @ [ ] ^ ` { | } ~. В дополнение к этому, на месте # может быть размещён Ј, а на месте $ — ¤. Такая система хорошо подходит для европейских языков, где нужны лишь несколько дополнительных символов. Вариант ASCII без национальных символов называется US-ASCII, или «International Reference Version».
Для некоторых языков с нелатинской письменностью (русского, греческого, арабского, иврита) существовали более радикальные модификации ASCII. Одним из вариантов был отказ от строчных латинских букв — на их месте размещались национальные символы (для русского и греческого — только заглавные буквы). Другой вариант — переключение между US-ASCII и национальным вариантом «на лету» с помощью символов SO (Shift Out) и SI (Shift In) — в этом случае в национальном варианте можно полностью устранить латинские буквы и занять всё пространство под свои символы. См. также КОИ-7!
Впоследствии оказалось удобнее использовать 8-битные кодировки (кодовые страницы), где нижнюю половину кодовой таблицы (0—127) занимают символы US-ASCII, а верхнюю (128—255) — дополнительные символы, включая набор национальных символов. Таким образом, верхняя половина таблицы ASCII до повсеместного внедрения Юникода активно использовалась для представления локализированных символов, букв местного языка. Отсутствие единого стандарта размещениякириллических символов в таблице ASCII доставляло множество проблем с кодировками (КОИ-8, Windows-1251 и другие). Другие языки с нелатинской письменностью тоже страдали из-за наличия нескольких разных кодировок.
В Юникоде первые 128 символов тоже совпадают с соответствующими символами US-ASCII. информация код плоскость стандарт Таблица ASCII кодов.
ASCII (American Standard Code for Information Interchange)
Dec. | Hex. | Char. | Dec. | Hex. | Char. | Dec. | Hex. | Char. | Dec. | Hex. | Char. |
NUL. | (sp). | `. | |||||||||
SOH. | ! | A. | a. | ||||||||
STX. | " . | B. | b. | ||||||||
ETX. | #. | C. | c. | ||||||||
EOT. | $. | D. | d. | ||||||||
ENQ. | %. | E. | e. | ||||||||
ACK. | &. | F. | f. | ||||||||
BEL. | '. | G. | g. | ||||||||
BS. | (. | H. | h. | ||||||||
TAB. | ). | I. | i. | ||||||||
A. | LF. | 2A. | *. | 4A. | J. | 6A. | j. | ||||
B. | VT. | 2B. | 4B. | K. | 6B. | k. | |||||
C. | FF. | 2C. | . | 4C. | L. | 6C. | l. | ||||
D. | CR. | 2D. | ; | 4D. | M. | 6D. | m. | ||||
E. | SO. | 2E. | . | 4E. | N. | 6E. | n. | ||||
F. | SI. | 2 °F. | 4 °F. | O. | 6 °F. | o. | |||||
DLE. | P. | p. | |||||||||
DC1. | Q. | q. | |||||||||
DC2. | R. | r. | |||||||||
DC3. | S. | s. | |||||||||
DC4. | T. | t. | |||||||||
NAK. | U. | u. | |||||||||
SYN. | V. | v. | |||||||||
ETB. | W. | w. | |||||||||
CAN. | X. | x. | |||||||||
EM. | Y. | y. | |||||||||
1A. | SUB. | 3A. | : | 5A. | Z. | 7A. | z. | ||||
1B. | ESC. | 3B. | ; | 5B. | [. | 7B. | {. | ||||
1C. | FS. | 3C. | < | 5C. | 7C. | |. | |||||
1D. | GS. | 3D. | =. | 5D. | ]. | 7D. | }. | ||||
1E. | RS. | 3E. | > | 5E. | ^. | 7E. | ~. | ||||
1 °F. | US. | 3 °F. | 5 °F. | _. | 7 °F. | DEL. | |||||