PDF вариант - Pro Audio & Lighting Magazine

Òåõíèêà 

шен стимул се интерпретира от човешките 

сетива. Така че, нашите сетива не създават 

огледален образ на събитията от заобикалящия 

свят. Те по-скоро отразяват и наблягат 

на определени техни качества. 

Звукът трябва да бъде възпроизведен 

така, че да бъде най-добре възприет от 

слушателя. Според теоретиците на МР3 

формата, не е необходимо прецизното 

възпроизвеждане на всяка характеристика 

на вълновата форма на звука. По-важно 

е да се обърне внимание на това, кои 

качества на вълновата форма са най-важни 

за слушателя, и да им се даде приоритет. 

Това е теорията за “перцептуално кодиране” 

на звука. Казано по-просто: докато 

некомпресиращият РСМ процес се опитва 

да представи звука “какъвто е”, МР3 се 

опитва да го представи “какъвто се чува”. 

Съответно, трябва да се определи набор от 

правила, относно това, кое е от значение за 

слушателя. Този набор от правила се нарича 

“психоакустичен модел”. За да се разбере 

как работи този модел, трябва да се вземат 

предвид две важни концепции в цифровото 

аудио и перцептуалното кодиране: 

редундантност (в повече от необходимото) 

и ирелевантност (без връзка с качеството 

на звука). 

И двата термина описват критериите, 

според които известен обем информация 

се определя като ненужна или недостатъчно 

важна, така че да бъде премахната 

или игнорирана без неприемлива загуба 

на звуково качество. При аудиото със CD 

качество честотите над 22.05kHz се считат 

за повече от необходимото (редундантни), 

тъй като са отвъд границите на човешкия 

слух. Разбира се, ако някой реши (както 

крайните аудиофили), че честотите над 

22.05kHz съдържат важна информация за 

цвета и тона на звука, то трябва да използва 

по-висока семплираща честота. 

Ирелевантността, от друга страна, е 

по-радикална концепция. Теорията зад психоакустичното 

кодиране твърди, че заради 

особеностите на човешкото възприятие, 

някои качества на вълновите форми са без 

значение за слушателя. Следователно, тя 

няма да бъде възприета въобще. Поради 

факта, че една РСМ система се опитва да 

улови цялата вълнова форма, тя записва 

Някои допълнителни факти за MPEG Audio Layer-3 

През 1987 година Fraunhofer Institut fur Integrierte Schaltungen (IIS) започва да 

работи върху перцептуално (възприемано) кодиране на аудиото в рамките на проект, 

наречен EUREKA EU147. В сътрудничество с Университета в Ерланген (проф. Дитер 

Зайцер), IIS разработва мощен алгоритъм, който е стандартизиран като ISO-MPEG 

Audio Layer-3 (IS 11172-3 и IS 13818-3). 

Без използване на намаление в обема на информацията (обикновено цифровите 

аудио сигнали се състоят от 16-битови семпли, записани със семплираща честота, 

повече от два пъти по-висока от горната граница на честотната лента, напр. 44.1 kHz 

за компакт диск), в крайна сметка, става възможно 1400Mbit да представляват една 

секунда стерео музика със CD качество. С използване на MPEG аудио кодиране, първоначалната 

аудио информация от CD може да бъде намалена до 12 пъти - с “разумна” 

загуба на звуково качество. Дори 24-кратна редукция запазва звуково качество, подобро 

от това, което ще получим, ако намалим семплиращата честота и/или резолюцията 

на аудиото. Това се постига чрез техники на “перцептуално кодиране”, базирани 

върху възприемането на звуковите вълни от човешкото ухо. 

Като използват различни стерео ефекти и ограничаване на честотната лента, схемите 

за кодиране могат да постигнат приемливо качество на звука дори при по-ниски 

битрейтове. MPEG Layer-3 е най-мощен от цялото семейство MPEG кодеци. Той постига 

възможно най-доброто звуково качество, отнесено към дадения битрейт. 

1:4 Layer 1 (съответства на 384 kbps - за стерео сигнал) 

1:6 - 1:8 Layer 2 (съответства на 256-192 kbps - за стерео сигнал) 

1:10 - 1:12 Layer 3 (съответства на 128-96 kbps - за стерео сигнал) 

“ . . . д о к а т о н е к о м п р е с и р а щ и я т Р С М п р о ц е с 

се опитва да представи звука ‘какъвто е’, МР3 се 

опитва да го представи ‘какъвто се чува’.” 

голям обем информация, която е ирелевантна. 

Перцептуалното кодиране цели, 

като се основава на психоакустичния 

модел, да запише само информацията, 

която се възприема от човешкото ухо. Това 

дава възможност размерите на файловете 

да бъдат драстично намалени, като се 

премахне нечуваемата - съответно ирелевантна 

- информация, улавяна при PCM 

записа. 

Маскиране 

Психоакустичният модел разчита на 

определени особености на човешкото 

възприятие на звука - ефект, познат като 

“маскиране”. То може да бъде описано като 

тенденция слушателят да дава приоритет 

на определени звуци, за сметка на други 

(в зависимост от контекста, в който се появяват). 

Маскирането се получава, защото 

човешкият слух е адаптивен, и се адаптира 

и настройва към преобладаващите нива на 

звук и шум в акустичната среда. Например, 

внезапно пляскане с ръце в тиха стая може 

да прозвучи изненадващо силно. От друга 

страна, ако преди същото пляскане с ръце 

е имало изстрел, то би прозвучало значително 

по-тихо. Също така, в една рок група 

електрическата китара доминира звука, 

докато барабанистът не удари чинел - тогава 

китарата потъва за малко. Това са примери 

на ”времево” и “честотно” маскиране. 

Когато два звука съвпадат, или са много 

близки по време, единият частично маскира 

другия. Това зависи от фактори като техните 

относителни нива и честотно съдържание. 

Маскирането е това, което помага на перцептуалното 

кодиране да премахне голяма 

част от информацията в една стандартна 

вълнова форма, като запази относително 

добро качество на звука. Това не значи, 

че се премахва цялата информация за 

маскираните елементи. Перцептуалното 

кодиране работи като назначава по-малко 

битове информация на маскираните елементи, 

отколкото на “релевантните”. При 

този процес се появява известно изкривяване, 

но тъй като то (по спецификация) се 

ограничава в рамките на маскираните елементи, 

(по спецификация) не се улавя при 

просвирване. Използването на по-малко 

битове за представяне на маскираните 

елементи означава, че за целия запис ще 

са необходими значително по-малко битове. 

Това е начинът, по който МР3 кодирането 

успява да намали аудио файловете до една 

десета от първоначалния размер. 

Бъдещето 

Бъдещето за МР3 изглежда светло - 

поне засега. Форматът бие конкуренцията 

с повече от едни гърди - не защото е найдобър, 

а защото е най-удобен и най-масов. 

Много хора очакваха, с поевтиняването 

на дисковото пространство и масовизирането 

на високоскоростния интернет, 

интересът към некомпресираното аудио да 

се възвърне, и дори да се използва аудио с 

резолюция 24-bit/96kHz. Една от причините 

музиката да се слуша в компресиран МР3 

формат е, че тя се слуша основно на малки 

мултимедийни колонки, мобилни телефони 

или “жълти” слушалки. При тези условия 

потребителят не може да оцени разликата 

34 www.protechnica.bg • #24, ЮНИ 2009

Previous page

Next page

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

PDF вариант - Pro Audio & Lighting Magazine

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?