- Переносимый набор символов
-
Переноси́мый набо́р си́мволов (англ. Portable Character Set) — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.
На коды символов из переносимого набора накладываются следующие ограничения:
- NUL должен быть символом, где все биты установлены в 0.
- Коды десятичных цифр 0—9 должны идти в возрастающем порядке, причём коды двух соседних цифр должны отличаться на единицу.
- Коды всех символов из этого набора должны быть представимы одним байтом (т. е. не должны превышать 255 ).
- Если для представления символов в языке C используется тип char, то коды символов из этого набора обязательно должны быть неотрицательными (это значит, что при использовании EBCDIC тип char должен быть эквивалентен unsigned char).
название глиф строка
СиЮникод название в Юникоде NUL \0 U+0000 NULL (NUL) alert \a U+0007 BELL (BEL) backspace \b U+0008 BACKSPACE (BS) tab \t U+0009 CHARACTER TABULATION (HT) carriage-return \r U+000D CARRIAGE RETURN (CR) newline \n U+000A LINE FEED (LF) vertical-tab \v U+000B LINE TABULATION (VT) form-feed \f U+000C FORM FEED (FF) space U+0020 SPACE exclamation-mark ! ! U+0021 EXCLAMATION MARK quotation-mark " \" U+0022 QUOTATION MARK number-sign # # U+0023 NUMBER SIGN dollar-sign $ $ U+0024 DOLLAR SIGN percent-sign % % U+0025 PERCENT SIGN ampersand & & U+0026 AMPERSAND apostrophe ' \' U+0027 APOSTROPHE left-parenthesis ( ( U+0028 LEFT PARENTHESIS right-parenthesis ) ) U+0029 RIGHT PARENTHESIS asterisk * * U+002A ASTERISK plus-sign + + U+002B PLUS SIGN comma , , U+002C COMMA hyphen - - U+002D HYPHEN-MINUS period . . U+002E FULL STOP slash / / U+002F SOLIDUS zero 0 0 U+0030 DIGIT ZERO one 1 1 U+0031 DIGIT ONE two 2 2 U+0032 DIGIT TWO three 3 3 U+0033 DIGIT THREE four 4 4 U+0034 DIGIT FOUR five 5 5 U+0035 DIGIT FIVE six 6 6 U+0036 DIGIT SIX seven 7 7 U+0037 DIGIT SEVEN eight 8 8 U+0038 DIGIT EIGHT nine 9 9 U+0039 DIGIT NINE colon : : U+003A COLON semicolon ; ; U+003B SEMICOLON less-than-sign < < U+003C LESS-THAN SIGN equals-sign = = U+003D EQUALS SIGN greater-than-sign > > U+003E GREATER-THAN SIGN question-mark ? ? U+003F QUESTION MARK commercial-at @ @ U+0040 COMMERCIAL AT A A A U+0041 LATIN CAPITAL LETTER A B B B U+0042 LATIN CAPITAL LETTER B C C C U+0043 LATIN CAPITAL LETTER C D D D U+0044 LATIN CAPITAL LETTER D E E E U+0045 LATIN CAPITAL LETTER E F F F U+0046 LATIN CAPITAL LETTER F G G G U+0047 LATIN CAPITAL LETTER G H H H U+0048 LATIN CAPITAL LETTER H I I I U+0049 LATIN CAPITAL LETTER I J J J U+004A LATIN CAPITAL LETTER J K K K U+004B LATIN CAPITAL LETTER K L L L U+004C LATIN CAPITAL LETTER L M M M U+004D LATIN CAPITAL LETTER M N N N U+004E LATIN CAPITAL LETTER N O O O U+004F LATIN CAPITAL LETTER O P P P U+0050 LATIN CAPITAL LETTER P Q Q Q U+0051 LATIN CAPITAL LETTER Q R R R U+0052 LATIN CAPITAL LETTER R S S S U+0053 LATIN CAPITAL LETTER S T T T U+0054 LATIN CAPITAL LETTER T U U U U+0055 LATIN CAPITAL LETTER U V V V U+0056 LATIN CAPITAL LETTER V W W W U+0057 LATIN CAPITAL LETTER W X X X U+0058 LATIN CAPITAL LETTER X Y Y Y U+0059 LATIN CAPITAL LETTER Y Z Z Z U+005A LATIN CAPITAL LETTER Z left-square-bracket [ [ U+005B LEFT SQUARE BRACKET backslash \ \\ U+005C REVERSE SOLIDUS right-square-bracket ] ] U+005D RIGHT SQUARE BRACKET circumflex ^ ^ U+005E CIRCUMFLEX ACCENT underscore _ _ U+005F LOW LINE grave-accent ` ` U+0060 GRAVE ACCENT a a a U+0061 LATIN SMALL LETTER A b b b U+0062 LATIN SMALL LETTER B c c c U+0063 LATIN SMALL LETTER C d d d U+0064 LATIN SMALL LETTER D e e e U+0065 LATIN SMALL LETTER E f f f U+0066 LATIN SMALL LETTER F g g g U+0067 LATIN SMALL LETTER G h h h U+0068 LATIN SMALL LETTER H i i i U+0069 LATIN SMALL LETTER I j j j U+006A LATIN SMALL LETTER J k k k U+006B LATIN SMALL LETTER K l l l U+006C LATIN SMALL LETTER L m m m U+006D LATIN SMALL LETTER M n n n U+006E LATIN SMALL LETTER N o o o U+006F LATIN SMALL LETTER O p p p U+0070 LATIN SMALL LETTER P q q q U+0071 LATIN SMALL LETTER Q r r r U+0072 LATIN SMALL LETTER R s s s U+0073 LATIN SMALL LETTER S t t t U+0074 LATIN SMALL LETTER T u u u U+0075 LATIN SMALL LETTER U v v v U+0076 LATIN SMALL LETTER V w w w U+0077 LATIN SMALL LETTER W x x x U+0078 LATIN SMALL LETTER X y y y U+0079 LATIN SMALL LETTER Y z z z U+007A LATIN SMALL LETTER Z left-brace { { U+007B LEFT CURLY BRACKET vertical-line | | U+007C VERTICAL LINE right-brace } } U+007D RIGHT CURLY BRACKET tilde ~ ~ U+007E TILDE В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена.
Вы можете отредактировать эту статью, добавив ссылки на авторитетные источники.
Эта отметка установлена 14 мая 2011.Кодировки символов Основы → алфавит • текст ( файл • данные ) • набор символов • конверсия Исторические кодировки → Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 совре-
менное
8-битное
представ-
лениесимволы → ASCII ( управляющие • печатные ) не-ASCII ( псевдографика ) 8бит. код.стр. Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16 Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4 IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) Много-
байтныеТрадиционные → DBCS ( GB2312 ) • HTML Unicode → UTF-16 • UTF-8 • список символов ( кириллица ) Связанные
темы →интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode Категории:- Компьютерные кодировки
- POSIX
Wikimedia Foundation. 2010.