Регистрация / Вход
Прислать материал

Исследование в области кодирования аудио сигнала. Построение алгоритма компрессии звука без потери качества звучания

ФИО: Кондыбаева А. Б.

Направление: Информационные технологии

Научный руководитель: к.ф.-м.н., доц. Шихеева Валерия Владимировна

Институт: Институт информационных технологий и автоматизированных систем управления

Кафедра: Кафедра Инженерной кибернетики

Академическая группа: ММ-12-1

В данном исследовании рассматриваются алгоритмы сжатия аудиосигнала для скоростной передачи данных, экономии затрат памяти на хранение файла, а также возможности делать это без значимой потери качества.

Алгоритмы компрессии аудио используются в таких значимых сферах, как передача аудиосигнала по интернету (клиент-сервер), в хранении и передаче видео: в большинстве видеофайлах при передаче также используются алгоритмы компрессии звука (т.к. потоки видео и аудио хранятся отдельно), используются при организации передачи данных в реальном времени (онлайн-конференции и звонки по интернету). Также уделяется внимание построению корректной психоакустической модели и методам оптимизации, особенно широко применяющиеся при создании и разработке аудио форматов (такие как mp3, wma, aac, ogg vorbis).

Практическое применение построение алгоритмов находит в создании, так называемых аудиокодеков, которые впоследствии становятся стандартами для передачи и хранения аудио.

В настоящей работе ставится задача получить программное обеспечение для компрессии аудиосигнала с последующим его восстановлением, использующие вейвлет-преобразования.

Для этого требуется решить следующие задачи:

1) Выбор подходящих фильтров.

2) Реализация кодирования сигнала при помощи выбранных фильтров.

3) Прогрессивное кодирование.

4) Восстановление сигнала.

Для решения этой задачи выбран и реализован фильтр Добеши 9/7. Само вейвлет преобразование не сжимает сигнал, но позволяет без потери качества его преобразовать, отделив лишь необходимые значимые коэффициентами.

Во-первых, преобразование можно выполнить за O(n) операций. Во-вторых, оно предоставляет распределение частот во временной области.

Таким образом сигнал пропускается через низкочастотный фильтр с некоторым импульсным откликом g, h. В результате получаются детализирующие коэффициенты и коэффициенты аппроксимации:

Следующий этап процесса – прогрессивное кодирование звука, позволяющие отсортировать коэффициенты по степени значимости, – находится в процессе реализации.

В перспективе работы представление частотно-временной локализации с помощью классического алгоритма Хоффмана.