- Простой текст
-
Те́кстовые данные (также текстовый формат) — это последовательность символов в компьютере, в строгом смысле этого термина соответствующая набора символов кодируется в виде одного байта, а в случае Unicode это могут быть группы по два и более байтов.
Нередко текстовые данные понимаются в более узком смысле — как последовательности символов, имеющие осмысленное содержание, которое может быть прочитано и понято человеком (см.: текст).
Текстовому формату противопоставляются двоичные (бинарные) файлы, в которых информация организована по иным принципам.
Для большей части компьютерного оборудования и программ не важно, являются ли данные текстовыми. Однако многие сетевые протоколы рассчитаны на работу только с текстовыми данными и не могут обрабатывать произвольную последовательность байтов. Также, некоторые программы обрабатывают текстовые и двоичные данные по-разному, а некоторые предназначены для обработки именно текстовых данных. Программы для создания и редактирования текстовых данных называются текстовыми редакторами.
Содержание
Структура
Текстовыми данными как правило называются последовательности из подмножества знаков, включающего только печатные знаки (буквы, цифры, знаки препинания) и некоторые управляющие знаки (пробелы, табуляции, переводы строки). Существуют методы (например, UUENCODE), позволяющие представить в текстовом формате произвольные данные любого формата.
Требование к возможности понимания содержимого человеком вносит дополнительную избыточность в представление данных. К примеру, число 123, для кодирования которого достаточно одного 8-битного байта, в текстовом виде кодируется несколькими цифровыми символами — так, в десятичной системе счисления для этого требуется три знака («123»), в двоичной — семь знаков («1111011»), в шестнадцатеричной — два («7B»).
Разбиение на строки