|
|
|
§ 14. Кодирование текстовой информации Информационный объём текстового сообщенияМы уже касались этого вопроса, рассматривая алфавитный подход к измерению информации.
Оценим в байтах объём текстовой информации в современном словаре иностранных слов из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Будем считать, что при записи используется кодировка «один символ — один байт». Количество символов во всем словаре равно: 80 • 60 • 740 = 3 552 000. Следовательно, объём равен 3 552 000 байт = 3 468,75 Кбайт ≈ 3,39 Мбайт. Если же использовать кодировку UTF-16, то объём этой же текстовой информации в байтах возрастёт в 2 раза и составит 6,78 Мбайт.
|
|
|