|
|
|
§ 4.6. Оценка количественных параметров текстовых документов Информационный объём фрагмента текстаВам известно, что информационный объём I сообщения равен произведению количества К символов в сообщении на информационный вес i символа алфавита: I = К • i.
Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов ит.д,), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Жан-Жака Руссо: Тысячи путей ведут к заблуждению, к истине — только один. Решение. В данном тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста — 57 байтов. Ответ: 57 байтов.
Решение. Решение. I = 24 • 2 = 48 (байтов). Ответ: 48 байтов.
Решение. Информационный вес каждого символа в 16-битовой кодировке в два раза больше информационного веса символа в 8-битовой кодировке. Поэтому при перекодировании исходного блока информации из 8-битовой кодировки в 16-битовую его информационный объём должен был увеличиться вдвое, другими словами, на величину, равную исходному информационному объёму. Следовательно, информационный объём сообщения до перекодировки составлял 2048 байтов = 2 Кб. Ответ: 2 Кб.
Решение. Информационный вес символа алфавита мощностью 256 равен восьми битам (одному байту). Количество символов во всём словаре равно 740 • 80 • 60 = 3 552 000. Следовательно, объём этого текста в байтах равен 3 552 000 байтов = 3 468,75 Кбайт ≈ 3,39 Мбайт. Ответ: 3,39 Мбайт.
|
|
|