21.11.2014 Views

PDF вариант - Pro Audio & Lighting Magazine

PDF вариант - Pro Audio & Lighting Magazine

PDF вариант - Pro Audio & Lighting Magazine

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Òåõíèêà<br />

шен стимул се интерпретира от човешките<br />

сетива. Така че, нашите сетива не създават<br />

огледален образ на събитията от заобикалящия<br />

свят. Те по-скоро отразяват и наблягат<br />

на определени техни качества.<br />

Звукът трябва да бъде възпроизведен<br />

така, че да бъде най-добре възприет от<br />

слушателя. Според теоретиците на МР3<br />

формата, не е необходимо прецизното<br />

възпроизвеждане на всяка характеристика<br />

на вълновата форма на звука. По-важно<br />

е да се обърне внимание на това, кои<br />

качества на вълновата форма са най-важни<br />

за слушателя, и да им се даде приоритет.<br />

Това е теорията за “перцептуално кодиране”<br />

на звука. Казано по-просто: докато<br />

некомпресиращият РСМ процес се опитва<br />

да представи звука “какъвто е”, МР3 се<br />

опитва да го представи “какъвто се чува”.<br />

Съответно, трябва да се определи набор от<br />

правила, относно това, кое е от значение за<br />

слушателя. Този набор от правила се нарича<br />

“психоакустичен модел”. За да се разбере<br />

как работи този модел, трябва да се вземат<br />

предвид две важни концепции в цифровото<br />

аудио и перцептуалното кодиране:<br />

редундантност (в повече от необходимото)<br />

и ирелевантност (без връзка с качеството<br />

на звука).<br />

И двата термина описват критериите,<br />

според които известен обем информация<br />

се определя като ненужна или недостатъчно<br />

важна, така че да бъде премахната<br />

или игнорирана без неприемлива загуба<br />

на звуково качество. При аудиото със CD<br />

качество честотите над 22.05kHz се считат<br />

за повече от необходимото (редундантни),<br />

тъй като са отвъд границите на човешкия<br />

слух. Разбира се, ако някой реши (както<br />

крайните аудиофили), че честотите над<br />

22.05kHz съдържат важна информация за<br />

цвета и тона на звука, то трябва да използва<br />

по-висока семплираща честота.<br />

Ирелевантността, от друга страна, е<br />

по-радикална концепция. Теорията зад психоакустичното<br />

кодиране твърди, че заради<br />

особеностите на човешкото възприятие,<br />

някои качества на вълновите форми са без<br />

значение за слушателя. Следователно, тя<br />

няма да бъде възприета въобще. Поради<br />

факта, че една РСМ система се опитва да<br />

улови цялата вълнова форма, тя записва<br />

Някои допълнителни факти за MPEG <strong>Audio</strong> Layer-3<br />

През 1987 година Fraunhofer Institut fur Integrierte Schaltungen (IIS) започва да<br />

работи върху перцептуално (възприемано) кодиране на аудиото в рамките на проект,<br />

наречен EUREKA EU147. В сътрудничество с Университета в Ерланген (проф. Дитер<br />

Зайцер), IIS разработва мощен алгоритъм, който е стандартизиран като ISO-MPEG<br />

<strong>Audio</strong> Layer-3 (IS 11172-3 и IS 13818-3).<br />

Без използване на намаление в обема на информацията (обикновено цифровите<br />

аудио сигнали се състоят от 16-битови семпли, записани със семплираща честота,<br />

повече от два пъти по-висока от горната граница на честотната лента, напр. 44.1 kHz<br />

за компакт диск), в крайна сметка, става възможно 1400Mbit да представляват една<br />

секунда стерео музика със CD качество. С използване на MPEG аудио кодиране, първоначалната<br />

аудио информация от CD може да бъде намалена до 12 пъти - с “разумна”<br />

загуба на звуково качество. Дори 24-кратна редукция запазва звуково качество, подобро<br />

от това, което ще получим, ако намалим семплиращата честота и/или резолюцията<br />

на аудиото. Това се постига чрез техники на “перцептуално кодиране”, базирани<br />

върху възприемането на звуковите вълни от човешкото ухо.<br />

Като използват различни стерео ефекти и ограничаване на честотната лента, схемите<br />

за кодиране могат да постигнат приемливо качество на звука дори при по-ниски<br />

битрейтове. MPEG Layer-3 е най-мощен от цялото семейство MPEG кодеци. Той постига<br />

възможно най-доброто звуково качество, отнесено към дадения битрейт.<br />

1:4 Layer 1 (съответства на 384 kbps - за стерео сигнал)<br />

1:6 - 1:8 Layer 2 (съответства на 256-192 kbps - за стерео сигнал)<br />

1:10 - 1:12 Layer 3 (съответства на 128-96 kbps - за стерео сигнал)<br />

“ . . . д о к а т о н е к о м п р е с и р а щ и я т Р С М п р о ц е с<br />

се опитва да представи звука ‘какъвто е’, МР3 се<br />

опитва да го представи ‘какъвто се чува’.”<br />

голям обем информация, която е ирелевантна.<br />

Перцептуалното кодиране цели,<br />

като се основава на психоакустичния<br />

модел, да запише само информацията,<br />

която се възприема от човешкото ухо. Това<br />

дава възможност размерите на файловете<br />

да бъдат драстично намалени, като се<br />

премахне нечуваемата - съответно ирелевантна<br />

- информация, улавяна при PCM<br />

записа.<br />

Маскиране<br />

Психоакустичният модел разчита на<br />

определени особености на човешкото<br />

възприятие на звука - ефект, познат като<br />

“маскиране”. То може да бъде описано като<br />

тенденция слушателят да дава приоритет<br />

на определени звуци, за сметка на други<br />

(в зависимост от контекста, в който се появяват).<br />

Маскирането се получава, защото<br />

човешкият слух е адаптивен, и се адаптира<br />

и настройва към преобладаващите нива на<br />

звук и шум в акустичната среда. Например,<br />

внезапно пляскане с ръце в тиха стая може<br />

да прозвучи изненадващо силно. От друга<br />

страна, ако преди същото пляскане с ръце<br />

е имало изстрел, то би прозвучало значително<br />

по-тихо. Също така, в една рок група<br />

електрическата китара доминира звука,<br />

докато барабанистът не удари чинел - тогава<br />

китарата потъва за малко. Това са примери<br />

на ”времево” и “честотно” маскиране.<br />

Когато два звука съвпадат, или са много<br />

близки по време, единият частично маскира<br />

другия. Това зависи от фактори като техните<br />

относителни нива и честотно съдържание.<br />

Маскирането е това, което помага на перцептуалното<br />

кодиране да премахне голяма<br />

част от информацията в една стандартна<br />

вълнова форма, като запази относително<br />

добро качество на звука. Това не значи,<br />

че се премахва цялата информация за<br />

маскираните елементи. Перцептуалното<br />

кодиране работи като назначава по-малко<br />

битове информация на маскираните елементи,<br />

отколкото на “релевантните”. При<br />

този процес се появява известно изкривяване,<br />

но тъй като то (по спецификация) се<br />

ограничава в рамките на маскираните елементи,<br />

(по спецификация) не се улавя при<br />

просвирване. Използването на по-малко<br />

битове за представяне на маскираните<br />

елементи означава, че за целия запис ще<br />

са необходими значително по-малко битове.<br />

Това е начинът, по който МР3 кодирането<br />

успява да намали аудио файловете до една<br />

десета от първоначалния размер.<br />

Бъдещето<br />

Бъдещето за МР3 изглежда светло -<br />

поне засега. Форматът бие конкуренцията<br />

с повече от едни гърди - не защото е найдобър,<br />

а защото е най-удобен и най-масов.<br />

Много хора очакваха, с поевтиняването<br />

на дисковото пространство и масовизирането<br />

на високоскоростния интернет,<br />

интересът към некомпресираното аудио да<br />

се възвърне, и дори да се използва аудио с<br />

резолюция 24-bit/96kHz. Една от причините<br />

музиката да се слуша в компресиран МР3<br />

формат е, че тя се слуша основно на малки<br />

мултимедийни колонки, мобилни телефони<br />

или “жълти” слушалки. При тези условия<br />

потребителят не може да оцени разликата<br />

34 www.protechnica.bg • #24, ЮНИ 2009

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!