PDF вариант - Pro Audio & Lighting Magazine
PDF вариант - Pro Audio & Lighting Magazine
PDF вариант - Pro Audio & Lighting Magazine
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Òåõíèêà<br />
шен стимул се интерпретира от човешките<br />
сетива. Така че, нашите сетива не създават<br />
огледален образ на събитията от заобикалящия<br />
свят. Те по-скоро отразяват и наблягат<br />
на определени техни качества.<br />
Звукът трябва да бъде възпроизведен<br />
така, че да бъде най-добре възприет от<br />
слушателя. Според теоретиците на МР3<br />
формата, не е необходимо прецизното<br />
възпроизвеждане на всяка характеристика<br />
на вълновата форма на звука. По-важно<br />
е да се обърне внимание на това, кои<br />
качества на вълновата форма са най-важни<br />
за слушателя, и да им се даде приоритет.<br />
Това е теорията за “перцептуално кодиране”<br />
на звука. Казано по-просто: докато<br />
некомпресиращият РСМ процес се опитва<br />
да представи звука “какъвто е”, МР3 се<br />
опитва да го представи “какъвто се чува”.<br />
Съответно, трябва да се определи набор от<br />
правила, относно това, кое е от значение за<br />
слушателя. Този набор от правила се нарича<br />
“психоакустичен модел”. За да се разбере<br />
как работи този модел, трябва да се вземат<br />
предвид две важни концепции в цифровото<br />
аудио и перцептуалното кодиране:<br />
редундантност (в повече от необходимото)<br />
и ирелевантност (без връзка с качеството<br />
на звука).<br />
И двата термина описват критериите,<br />
според които известен обем информация<br />
се определя като ненужна или недостатъчно<br />
важна, така че да бъде премахната<br />
или игнорирана без неприемлива загуба<br />
на звуково качество. При аудиото със CD<br />
качество честотите над 22.05kHz се считат<br />
за повече от необходимото (редундантни),<br />
тъй като са отвъд границите на човешкия<br />
слух. Разбира се, ако някой реши (както<br />
крайните аудиофили), че честотите над<br />
22.05kHz съдържат важна информация за<br />
цвета и тона на звука, то трябва да използва<br />
по-висока семплираща честота.<br />
Ирелевантността, от друга страна, е<br />
по-радикална концепция. Теорията зад психоакустичното<br />
кодиране твърди, че заради<br />
особеностите на човешкото възприятие,<br />
някои качества на вълновите форми са без<br />
значение за слушателя. Следователно, тя<br />
няма да бъде възприета въобще. Поради<br />
факта, че една РСМ система се опитва да<br />
улови цялата вълнова форма, тя записва<br />
Някои допълнителни факти за MPEG <strong>Audio</strong> Layer-3<br />
През 1987 година Fraunhofer Institut fur Integrierte Schaltungen (IIS) започва да<br />
работи върху перцептуално (възприемано) кодиране на аудиото в рамките на проект,<br />
наречен EUREKA EU147. В сътрудничество с Университета в Ерланген (проф. Дитер<br />
Зайцер), IIS разработва мощен алгоритъм, който е стандартизиран като ISO-MPEG<br />
<strong>Audio</strong> Layer-3 (IS 11172-3 и IS 13818-3).<br />
Без използване на намаление в обема на информацията (обикновено цифровите<br />
аудио сигнали се състоят от 16-битови семпли, записани със семплираща честота,<br />
повече от два пъти по-висока от горната граница на честотната лента, напр. 44.1 kHz<br />
за компакт диск), в крайна сметка, става възможно 1400Mbit да представляват една<br />
секунда стерео музика със CD качество. С използване на MPEG аудио кодиране, първоначалната<br />
аудио информация от CD може да бъде намалена до 12 пъти - с “разумна”<br />
загуба на звуково качество. Дори 24-кратна редукция запазва звуково качество, подобро<br />
от това, което ще получим, ако намалим семплиращата честота и/или резолюцията<br />
на аудиото. Това се постига чрез техники на “перцептуално кодиране”, базирани<br />
върху възприемането на звуковите вълни от човешкото ухо.<br />
Като използват различни стерео ефекти и ограничаване на честотната лента, схемите<br />
за кодиране могат да постигнат приемливо качество на звука дори при по-ниски<br />
битрейтове. MPEG Layer-3 е най-мощен от цялото семейство MPEG кодеци. Той постига<br />
възможно най-доброто звуково качество, отнесено към дадения битрейт.<br />
1:4 Layer 1 (съответства на 384 kbps - за стерео сигнал)<br />
1:6 - 1:8 Layer 2 (съответства на 256-192 kbps - за стерео сигнал)<br />
1:10 - 1:12 Layer 3 (съответства на 128-96 kbps - за стерео сигнал)<br />
“ . . . д о к а т о н е к о м п р е с и р а щ и я т Р С М п р о ц е с<br />
се опитва да представи звука ‘какъвто е’, МР3 се<br />
опитва да го представи ‘какъвто се чува’.”<br />
голям обем информация, която е ирелевантна.<br />
Перцептуалното кодиране цели,<br />
като се основава на психоакустичния<br />
модел, да запише само информацията,<br />
която се възприема от човешкото ухо. Това<br />
дава възможност размерите на файловете<br />
да бъдат драстично намалени, като се<br />
премахне нечуваемата - съответно ирелевантна<br />
- информация, улавяна при PCM<br />
записа.<br />
Маскиране<br />
Психоакустичният модел разчита на<br />
определени особености на човешкото<br />
възприятие на звука - ефект, познат като<br />
“маскиране”. То може да бъде описано като<br />
тенденция слушателят да дава приоритет<br />
на определени звуци, за сметка на други<br />
(в зависимост от контекста, в който се появяват).<br />
Маскирането се получава, защото<br />
човешкият слух е адаптивен, и се адаптира<br />
и настройва към преобладаващите нива на<br />
звук и шум в акустичната среда. Например,<br />
внезапно пляскане с ръце в тиха стая може<br />
да прозвучи изненадващо силно. От друга<br />
страна, ако преди същото пляскане с ръце<br />
е имало изстрел, то би прозвучало значително<br />
по-тихо. Също така, в една рок група<br />
електрическата китара доминира звука,<br />
докато барабанистът не удари чинел - тогава<br />
китарата потъва за малко. Това са примери<br />
на ”времево” и “честотно” маскиране.<br />
Когато два звука съвпадат, или са много<br />
близки по време, единият частично маскира<br />
другия. Това зависи от фактори като техните<br />
относителни нива и честотно съдържание.<br />
Маскирането е това, което помага на перцептуалното<br />
кодиране да премахне голяма<br />
част от информацията в една стандартна<br />
вълнова форма, като запази относително<br />
добро качество на звука. Това не значи,<br />
че се премахва цялата информация за<br />
маскираните елементи. Перцептуалното<br />
кодиране работи като назначава по-малко<br />
битове информация на маскираните елементи,<br />
отколкото на “релевантните”. При<br />
този процес се появява известно изкривяване,<br />
но тъй като то (по спецификация) се<br />
ограничава в рамките на маскираните елементи,<br />
(по спецификация) не се улавя при<br />
просвирване. Използването на по-малко<br />
битове за представяне на маскираните<br />
елементи означава, че за целия запис ще<br />
са необходими значително по-малко битове.<br />
Това е начинът, по който МР3 кодирането<br />
успява да намали аудио файловете до една<br />
десета от първоначалния размер.<br />
Бъдещето<br />
Бъдещето за МР3 изглежда светло -<br />
поне засега. Форматът бие конкуренцията<br />
с повече от едни гърди - не защото е найдобър,<br />
а защото е най-удобен и най-масов.<br />
Много хора очакваха, с поевтиняването<br />
на дисковото пространство и масовизирането<br />
на високоскоростния интернет,<br />
интересът към некомпресираното аудио да<br />
се възвърне, и дори да се използва аудио с<br />
резолюция 24-bit/96kHz. Една от причините<br />
музиката да се слуша в компресиран МР3<br />
формат е, че тя се слуша основно на малки<br />
мултимедийни колонки, мобилни телефони<br />
или “жълти” слушалки. При тези условия<br />
потребителят не може да оцени разликата<br />
34 www.protechnica.bg • #24, ЮНИ 2009