Исследование в области кодирования аудио сигнала. Построение алгоритма компрессии звука без потери качества звучания
ФИО: Кондыбаева А. Б.
Направление: Информационные технологии
Научный руководитель: к.ф.-м.н., доц. Шихеева Валерия Владимировна
Институт: Институт информационных технологий и автоматизированных систем управления
Кафедра: Кафедра Инженерной кибернетики
Академическая группа: ММ-12-1
В данном исследовании рассматриваются алгоритмы сжатия аудиосигнала для скоростной передачи данных, экономии затрат памяти на хранение файла, а также возможности делать это без значимой потери качества.
Алгоритмы компрессии аудио используются в таких значимых сферах, как передача аудиосигнала по интернету (клиент-сервер), в хранении и передаче видео: в большинстве видеофайлах при передаче также используются алгоритмы компрессии звука (т.к. потоки видео и аудио хранятся отдельно), используются при организации передачи данных в реальном времени (онлайн-конференции и звонки по интернету). Также уделяется внимание построению корректной психоакустической модели и методам оптимизации, особенно широко применяющиеся при создании и разработке аудио форматов (такие как mp3, wma, aac, ogg vorbis).
Практическое применение построение алгоритмов находит в создании, так называемых аудиокодеков, которые впоследствии становятся стандартами для передачи и хранения аудио.
В настоящей работе ставится задача получить программное обеспечение для компрессии аудиосигнала с последующим его восстановлением, использующие вейвлет-преобразования.
Для этого требуется решить следующие задачи:
1) Выбор подходящих фильтров.
2) Реализация кодирования сигнала при помощи выбранных фильтров.
3) Прогрессивное кодирование.
4) Восстановление сигнала.
Для решения этой задачи выбран и реализован фильтр Добеши 9/7. Само вейвлет преобразование не сжимает сигнал, но позволяет без потери качества его преобразовать, отделив лишь необходимые значимые коэффициентами.
Во-первых, преобразование можно выполнить за O(n) операций. Во-вторых, оно предоставляет распределение частот во временной области.
Таким образом сигнал пропускается через низкочастотный фильтр с некоторым импульсным откликом g, h. В результате получаются детализирующие коэффициенты и коэффициенты аппроксимации:
Следующий этап процесса – прогрессивное кодирование звука, позволяющие отсортировать коэффициенты по степени значимости, – находится в процессе реализации.
В перспективе работы представление частотно-временной локализации с помощью классического алгоритма Хоффмана.