Programi za obradu zvuka
Програми за обраду звука
Студент:
Даниел Петровић
256/08
МАШИНСКИ ФАКУЛТЕТ УНИВЕРЗИТЕТА У НИШУ
ОСНОВИ ИНФОРМАЦИОНО КОМУНИКАЦИОНЕ ТЕХНОЛОГИЈЕ
I Семинарски рад
Увод
1. Основе дигиталног звука
Кад говоримо о звуку потребно је рећи да заправо говоримо о
звучним таласима. Људско ухо их региструје као промјену притиска на
бубну опну у неком времену. На слици 1 приказан је синусни сигнал
константне амплитуде. Најважније својство таквог таласа у нашим
примерима је да је он континуалан и непрекинут у сваком тренутку без
обзира колико га зумирали по било којој оси. Он је дакле непрекинут и у
неком тренутку може имати само један износ амплитуде. Највећа
фреквенција сигнала коју може чути човек је око 20 kHz, док је за просечне
људе та граница на око 17 kHz. Људском уху није лако одредити фазу
звука. На пример ако црквено звоно зазвони у 12.00 h ми не бисмо могли
након једне секунде рећи да ли је управо фаза звука 0 или 90 ступњева,
или нека друга. Звукови које слушамо свакодневно нису готово никад
чисти синусни сигнали, него бесконачна сума синусоида, свака са својом
варирајућом амплитудом и фазом. Сума свих њих даће у сваком тренутку
само једну вредност тј. износ притиска на нашој бубној опни. Због тога ће
се притисак звука приказати у Sound Forge -у као континуални износ
амплитуде у неком времену. Такође ми можемо одабрати и спектрални
приказ истог. У спектралном приказу видећемо готово све фреквенције
изворног сигнала, респективно према њиховим амплитудама. Како је у
рачунару немогуће радити са бесконачним износима бројева, који би били
потребни ако бисмо жељели континуални талас приказати унутар
рачунара, потребно је проузроковати улазни сигнал. При томе сечемо
улазни сигнал на константне временске интервале и приказујемо све
вредности амплитуде у том интервалу једном константном вредношћу
(слика 1).
Даниел Петровић 256/08
Школска 2008-2009
18.7.2025
2

МАШИНСКИ ФАКУЛТЕТ УНИВЕРЗИТЕТА У НИШУ
ОСНОВИ ИНФОРМАЦИОНО КОМУНИКАЦИОНЕ ТЕХНОЛОГИЈЕ
I Семинарски рад
1.2 Репродукција сигнала
Дакле као што смо узроковањем и квантизацијом претворили аналогни
сигнал континуалне амплитуде у дигитални (А/Д претварање) потребно је код
репродукције обавити обратну трансформацију - Д/А претварање. Како Д/А
претварачи раде готово без грешака, можемо рећи да су једини губици код
такве обраде сигнала они садржани у фреквенцијама већим од половине
фреквенције узроковања и губици код квантизације, који су зависни о броју
употријебљених интервала. Ако занемаримо губитке у претпојачалима и
појачалима (који се могу свести на занемарив износ) можемо рећи да ако
сигнал претворимо у дигитални, обрадимо га у програму попут Sound Forge- а, и
претворимо натраг у аналогни , нисмо направили значајнију грешку а притом
смо се ослободили ограничења која нам намећу електронске компоненте, кутије
с специјалним ефектима и сл. Што се тиче квалитета ми можемо купити картице
са скупим и квалитетним А/Д и Д/А претварачима и нискошумним
претпојачалима, али не постоји новац који ће за 16 bitnu картицу постићи бољи
однос сигнал/шум од 96 dB. Наравно, могли бисмо повећати ширину речи и
фреквенцију узроковања, али би за незнатно већи квалитет платили то пуно
већом ценом и пуно већом количином дигиталних података. У сваком случају
говоримо о присутности шума у нашем сигналу.
Филтрирање је једна од најпопуларнијих метода у дигиталним
сигнал процесорима или програмима који врше обраду аудио сигнала.
Филтери коригирају фазу и амплитуду одређених фреквенција сигнала и
много функција Sound Forge- а базира се на њиховој примени. Тако се
например уклањање шума врши функцијом Noise Reduction која
динамички одбацује фреквенције чији износ амплитуде није изнад
заданих граница, али опет овисно о томе колико се често та фреквенција
појављује у сигналу. Деловање појединог филтера најлакше је испробати
применом појединог на тзв. бели шум, који садржи подједнаки износ свих
Даниел Петровић 256/08
Школска 2008-2009
18.7.2025
4
МАШИНСКИ ФАКУЛТЕТ УНИВЕРЗИТЕТА У НИШУ
ОСНОВИ ИНФОРМАЦИОНО КОМУНИКАЦИОНЕ ТЕХНОЛОГИЈЕ
I Семинарски рад
фреквенција. Погледом у фреквенцијски домен можемо видети које су
фреквенције пригушене а које не. Брза Фоуриер - ова трансформација
(Fast Fourier Transform (FFT)) је алгоритам који Sound Forge користи за
извођење филтерских функција, спектралних анализа и сл.
1.3 Формат дигиталног звука
Оно што сам ја нашао као највредније код програма Sound Forge је
свакако обрада .mp3 датотека, без икаквог додатног plug in -а или нечег
сличног. Ради се заправо о стандарду MPEG1 layer3. MPEG1
стандардизира три различита начина кодирања за дигитални звук, редом
Layer1, Layer2 и Layer3. Он не стандардизира енкодер већ само тип
информација које енкодер треба произвести и записати у MPEG датотеку,
као и начин на који декодер треба схватити, декомпресобати и
ресинтетизирати информацију. Кодирани звук може бити и део кодираног
вида и тада говоримо о MPEG1 system stream -у. MPEG код кодирања не
покушава направити кодирање без губитака него покушава генерисати
звук који ће слушаоцу звучати идентично. Код кодирања без губитака
редукција у аудиу се користи да би се компресовао звучни сигнал, и
декодирани се сигнал не разликује од оргинала. Са друге стране
прецепцијски аудио кодек попут MPEG -а не покушава остварити
кодирање без губитака него је циљ таквог кодирања да декодирани звук
звучи индентично људском уху. Покушавају се елиминисати све
компоненте звука које су ирелевантне људском уху, например оне које се
не чују. Дакле грубо говорећи MPEG1 енкодер трансформује звучни
сигнал у фреквенцијски домен, елиминише фреквенцијске компоненте
које су маскиране јачим фреквенцијским компонентама и пакира тај
анализирани сигнал у MPEG1 формат записа. Различити слојеви код MPEG
су били дефинирани јер сви они имају своје предности. Углавном
сложеност кодера/декодера, време потребно за обраду и ефикасност
расте од првог ка трећем слоју. Layer1 је погодан за апликације где се
Даниел Петровић 256/08
Школска 2008-2009
18.7.2025
5
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti