Информатика, программирование - Алгоритмы сжатия данных

Курсовая работа

Алгоритмы сжатия данных

Содержание

Введение

Общие сведения

Энтропия и количество информации

Комбинаторная, вероятностная и алгоритмическая оценка количества информации

Моделирование и кодирование

Некоторые алгоритмы сжатия данных

Алгоритм LZ77

Алгоритм LZ78-LZW84

Алгоритм PPM

BWT - преобразование и компрессор

Кодирование Хаффмана

Арифметическое кодирование

Алгоритм арифметического кодирования

Реализация алгоритма арифметического кодирования

Реализация модели

Доказательство правильности декодирования

Приращаемая передача и получение

Отрицательное переполнение

Переполнение и завершение

Адаптивная модель для арифметического кодирования

Эффективность сжатия

Заключение

Список литературы

Приложение 1. Программный код

Приложение 2. Интерфейс программы

Введение

Основоположником науки о сжатии информации принято считать Клода Шеннона. Его теорема об оптимальном кодировании показывает, к чему нужно стремиться при кодировании информации и на сколько та или иная информация при этом сожмется. Кроме того, им были проведены опыты по эмпирической оценке избыточности английского текста. Он предлагал людям угадывать следующую букву и оценивал вероятность правильного угадывания. На основе ряда опытов он пришел к выводу, что количество информации в английском тексте колеблется в пределах 0.6 — 1.3 бита на символ. Несмотря на то, что результаты исследований Шеннона были по-настоящему востребованы лишь десятилетия спустя, трудно переоценить их значение.

Первые алгоритмы сжатия были примитивными в связи с тем, что была примитивной вычислительная техника. С развитием мощностей компьютеров стали возможными все более мощные алгоритмы. Настоящим прорывом было изобретение Лемпелем и Зивом в 1977 г. словарных алгоритмов. До этого момента сжатие сводилось к примитивному кодированию символов. Словарные алгоритмы позволяли кодировать повторяющиеся строки символов, что позволило резко повысить степень сжатия. Важную роль сыграло изобретение примерно в это же время арифметического кодирования, позволившего воплотить в жизнь идею Шеннона об оптимальном кодировании. Следующим прорывом было изобретение в 1984 г. алгоритма РРМ. Следует отметить, что это изобретение долго оставалось незамеченным. Дело в том, что алгоритм сложен и требует больших ресурсов, в первую очередь больших объемов памяти, что было серьезной проблемой в то время. Изобретенный в том же 1984 г. алгоритм LZW был чрезвычайно популярен благодаря своей простоте, хорошей рекламе и нетребовательности к ресурсам, несмотря на относительно низкую степень сжатия. На сегодняшний день алгоритм РРМ является наилучшим алгоритмом для сжатия текстовой информации, a LZW давно уже не встраивается в новые приложения (однако широко используется в старых).

Будущее алгоритмов сжатия тесно связано с будущим компьютерных технологий. Современные алгоритмы уже вплотную приблизились к Шенноновской оценке 1.3 бита на символ, но ученые не видят причин, по которым компьютер не может предсказывать лучше, чем человек. ............

MaterStudiorum.ru - домашняя страничка студента.
Минимум рекламы - максимум информации.

Часть полного текста документа:

MaterStudiorum.ru - домашняя страничка студента. Минимум рекламы - максимум информации.

Часть полного текста документа:

MaterStudiorum.ru - домашняя страничка студента.
Минимум рекламы - максимум информации.