30.12.2014 Views

H(z,n)

H(z,n)

H(z,n)

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

前 言<br />

第 一 部 分 : 基 本 原 理<br />

第 二 部 分 : 主 流 标 准<br />

第 三 部 分 : 技 术 分 析


音 频 编 码 的 分 类<br />

按 照 编 码 的 采 样 率 分<br />

‣ 语 音 编 码 ( 小 于 8khz)<br />

‣ 音 频 编 码 ( 大 于 8khz)<br />

按 照 编 码 的 方 法 分<br />

‣ 波 形 编 码 器<br />

‣ 感 知 编 码 器<br />

‣ 参 数 编 码 器


不 同 编 码 方 法 的 应 用<br />

波 形 编 码 器<br />

ADPCM, G.721, G.722, G.726 等<br />

特 点 : 基 于 ADPCM 编 码 . 简 单 预 测 编 码 器 .<br />

感 知 编 码 器<br />

mp2, AAC, WMA, ATRAC, AC3 等<br />

特 点 : 基 于 人 耳 建 模 , 属 于 变 换 编 码 器 . 编 码 内 核 基 于 T+SQ.<br />

应 用 : 大 于 8khz 的 音 频 编 码 .<br />

参 数 编 码 器<br />

G.723.1, G.729, G.728, CELP,AMR,EVRC 等<br />

特 点 : 基 于 人 口 建 模 , 属 于 预 测 编 码 器 . 编 码 内 核 基 于 P+VQ.<br />

应 用 : 小 于 8khz 的 语 音 编 码 .


人 耳 模 型<br />

人 耳 的 听 隔<br />

‣ sound pressure level (SPL)<br />

‣ Absolute Threshold of Hearing<br />

‣ Critical Bands<br />

‣ Simultaneous Masking<br />

‣ Non-simultaneous Masking<br />

‣ Perceptual Entropy


外 耳 中 耳 内 耳<br />

组 成 耳 翼 , 外 耳 道 , 鼓 膜 听 小 骨 半 规 管 , 前 庭 窗 , 耳 蜗<br />

作 用 1. 声 源 定 位 ,<br />

2. 放 大 20db,<br />

共 振 , 头 部 衍 射<br />

作 用 :<br />

1. 放 大 声 压 .<br />

2. 保 护 内 耳 .<br />

半 规 管 , 前 庭 窗 属 于 主 体 感 受 器 . 耳 蜗<br />

是 听 觉 受 纳 器 .<br />

基 底 膜 : 带 通 特 性


Absolute Threshold of Hearing: 一 个 纯 音 在 无 声 环 境 下 可 以 被 人 听 到 的 能 量 大 小


巴 克 谱<br />

巴 克 谱 是 根 据 人 耳<br />

的 带 通 特 性 总 结 出<br />

的 公 式 .


第 一 心 理 声 学 模 型<br />

step 1:FFT Analysis<br />

step 6:Calculation of<br />

individual masking thresholds<br />

step 2:Determination of the<br />

sound pressure level<br />

step 7:Calculation of the<br />

global masking threshold LTg<br />

step 3:Considering the<br />

threshold in quiet<br />

step 8:Determination of the<br />

minimum masking threshold<br />

step 4:Finding of tonal and<br />

non-tonal components<br />

step 9:Calculation of the<br />

signal-to-mask-ratio<br />

step 5:Decimation of tonal<br />

and non-tonal masking<br />

components


Pre-echo 的 产 生


PCM<br />

时 频 变 换 模 块<br />

其 他 处 理 模 块<br />

量 化 模 块<br />

无 损 解 码 模 块<br />

Bitstream<br />

心 理 声 学 模 型<br />

Bitstream<br />

无 损 解 码 模 块 量 化 模 块 其 他 处 理 模 块<br />

时 频 变 换 模 块<br />

PCM


MPEG1/2 AUDIO<br />

MPEG2/4 AAC<br />

MPEG4 AUDIO(1) TwinVQ, BSAC<br />

MPEG4 AUDIO(2) HE-AAC,HE-AACv2,<br />

AC3/EAC3,DTS/DTS-HD<br />

AVSA,DRA<br />

Vorbis,<br />

WMA and WMA pro<br />

Qdesign, Cook


背 景 :<br />

为 了 在 1.5Mbps 码 率 对 视 频 和 伴 音 进 行 高 质 量 压 缩 ,<br />

MPEG 于 1992 年 制 订 完 成 了 MPEG-1 标 准 ,MPEG-1 音 频<br />

编 解 码 标 准 分 为 三 层 , 复 杂 度 和 音 质 逐 层 提 高 ,MP3 即<br />

为 其 中 的 第 三 层 ,MPEG-1 layer3. 层 3 的 算 法 组 要 是 靠<br />

ASPEC 算 法 和 OCF 算 法 进 行 加 强 的 .<br />

技 术 指 标 :<br />

采 样 率 :32、44.1、48 kHz<br />

码 率 :32kbps-160kbps/ 声 道<br />

声 道 : 单 声 道 、 立 体 声


编 码 器 技 术 框 架<br />

层 1/ 层 2 编 码 器<br />

层 3 编 码 器


Layer 1 and 2 技 术 特 点<br />

IS+MS<br />

PQF<br />

SQ<br />

Bit Allocation<br />

Scalefactor 解 码<br />

Huffman 解 码<br />

反 量 化<br />

• Layer 3 技 术 特 点<br />

IS+PQF<br />

PQF+MDCT<br />

SQ<br />

Huffman Coding<br />

mp3 比 特<br />

流 输 入<br />

Header 解<br />

析 与 解 码<br />

bit stream<br />

格 式 info<br />

REORDER<br />

立 体 声 解 码<br />

Alias cancellation<br />

IMDCT<br />

分 析 子 带 滤 波 器<br />

输 出 PCM 数 据


Scalefactor<br />

Part2_length<br />

576 个 频 率 线 的 huffman 码 字<br />

子 区 0 子 区 1 子 区 2 1 or 0<br />

Big value<br />

Count1<br />

Part3_length<br />

Part2_3_length<br />

0000000<br />

Zero 区<br />

无 损 解 码 模 块<br />

层 1/2 采 用 定 长 位 分 配 指 示 方<br />

法 对 残 差 谱 线 进 行 编 码 . 解 码 时 , 通<br />

过 获 得 每 个 采 样 的 编 码 位 宽 , 依 次<br />

读 取 码 流 中 码 字 . 完 成 解 码 .L2 和 L1<br />

不 同 的 是 , 层 二 对 3 个 数 据 进 行 打 包<br />

处 理 , 每 3 个 残 差 谱 线 分 成 一 组 , 统<br />

一 编 码 . 而 L3 只 对 spectral 使 用 了<br />

huffman 编 码 的 方 法 对<br />

scalefactor 使 用 定 长 码 编 码 .


• 量 化 模 块<br />

MPEG1/2 Audio 编 码 端 通 过 在 每 个 子 带 中 取 一 个 scalerfactor, 并 始 每 个<br />

谱 线 都 除 以 scalefactor 减 小 谱 线 的 动 态 幅 值 范 围 , 降 低 量 化 噪 声 , 并 且 使 用<br />

非 均 匀 量 化 进 一 步 减 小 频 率 谱 线 的 幅 值 , 便 于 进 行 huffman 编 码 时 减 小 码 表 。<br />

所 以 解 码 中 反 量 化 模 块 由 2 级 组 成 , 一 级 残 差 谱 反 量 化 , 一 级 是 sfb 反 量 化 .<br />

反 量 化<br />

Scalefactor<br />

Demux<br />

反 量 化<br />

残 差 谱 线<br />

De-scale


量 化 公 式<br />

层 1<br />

s <br />

whe re,<br />

2nb<br />

2 nb 1 * s <br />

2nb1<br />

s <br />

s <br />

nb<br />

s factor * s <br />

<br />

<br />

is the fra ctional num ber ,<br />

is the re qua ntize d value , and<br />

is the number of bits alloca te d to sa mples in the subband .<br />

s C * s D<br />

whe re,<br />

<br />

s <br />

s <br />

层 2<br />

<br />

is the fra ctional num ber , and<br />

is the re qua ntize d value .<br />

层 3<br />

(1) long block:<br />

4<br />

xr i<br />

= signis i * is 3 2 i<br />

<br />

1<br />

4<br />

global _gain[gr] - 210 - 8subblock_ gain[window][gr] <br />

scalefac _ multiplier* scalefac _ s[gr][ch ][sfb ][window]<br />

2<br />

<br />

(2) short block:<br />

4 1<br />

global _ gain[gr]- 210<br />

xr i<br />

= signis i * is 3 i<br />

*2 4<br />

<br />

<br />

<br />

scalefac _ multiplier* scalefac _ l[sfb][ch ][gr] preflag [gr]pretab[sfb]<br />

2


立 体 声 处 理 模 块<br />

MS stereo and Intensity stereo<br />

MS 和 IS 应 用 范 围


MS 立 体 在 左 右 声 道 所 传 送 的 分 别 为 middle 和 side, 要 经 过 以 下<br />

的 公 式 才 能 重 建 出 左 右 声 道 :<br />

.<br />

L i M i S i<br />

2<br />

and R i M i S i<br />

2


人 类 听 觉 系 统 一 般 对 低 频 信 号 而 言 , 其 对 信 号 的 能 量 与 相 位 皆 较<br />

敏 感 , 相 对 于 在 高 频 信 号 , 人 耳 只 对 其 能 量 较 为 敏 感 , 而 相 位 较 不<br />

敏 感 。Intensity Stereo coding 就 是 利 用 此 一 人 耳 的 特 性 , 被 使 用<br />

在 高 频 区 域 里 。<br />

其 中 is_possb 在 scale factor 中 指 定


时 频 变 换 模 块<br />

层 1/2 的 T 模 块 由 PQMF 和 WOA (window-overlapadd)<br />

组 成 . 层 3 在 进 行 PQMF 之 前 还 要 有 IMDCT 和 WOA 子<br />

模 块 .


N 1<br />

N<br />

X<br />

k<br />

xicos( ( i )(2k<br />

1))<br />

N 4<br />

i0<br />

N /21<br />

N<br />

xi<br />

X<br />

k<br />

cos( ( i )(2k<br />

1))<br />

N 4<br />

k 0<br />

<br />

<br />

MPEG1/2 Audio 都 采 用 了 一 种<br />

PQMF 变 换 进 行 时 频 分 析 . 一 帧 数<br />

据 以 12 个 样 本 为 一 组 , 层 1 有 32 个<br />

组 , 层 2,3 有 36 个 样 本 为 一 组 . 编 码<br />

时 每 帧 数 据 加 窗 和 将 采 样 后 的 数<br />

据 的 进 入 32 个 滤 波 器 , 得 到 频 域 数<br />

据 . 解 码 时<br />

Filter Bank<br />

N = 32


N-1<br />

π 1 N<br />

X<br />

k= xicos( (i+ + )(2k+1))<br />

N 2 4<br />

i=0<br />

N/2-1<br />

π 1 N<br />

x<br />

i= Xkcos( (i+ + )(2k+1))<br />

N 2 4<br />

k=0<br />

<br />

(I)MDCT<br />

层 3 在 PQMF 基 础 上 增 加 了<br />

MDCT 来 提 高 频 率 分 辨 率 . 公 式<br />

如 下 . 而 且 针 对 稳 态 帧 和 瞬 态 帧<br />

层 3 使 用 不 同 的 分 析 长 度 .<br />

N=36 长 窗<br />

12 短 窗


WOA: de-windowed<br />

<br />

层 3 使 用 正 弦 窗 . 规 定 了 4 种 窗 型 分 别 是 开 始 , 结 束 , 长 窗 和 短 窗 .<br />

层 使 用 当 前 帧 的 前 半 帧 数 据 和 前 一 帧 的 后 半 帧 数 据 叠 加 消 除 频 域 混 叠 .( 如 图 )<br />

当 使 用 短 窗 时 ,3 个 短 窗 是 在 码 流 中 是 interlace 存 储 的 . 首 先 要 进 行 解 交 织 处 理 . 处 理 方 法 如 图 .<br />

a) block_type=0 (normal window)<br />

z i x i sin <br />

i 1 36 2<br />

for i= 0 to 35<br />

d) block_type=2 (short block)<br />

j y i <br />

j xi sin<br />

<br />

12 i 1 2<br />

<br />

for i = 0 to 11, j= 0 to 2<br />

b) block_type=1 (start block)<br />

<br />

for i= 0 to 17<br />

<br />

x i sin 36 i 1 <br />

2<br />

x z i i for i=18 to 23<br />

<br />

x i sin <br />

12<br />

i 18 1 2<br />

for i= 24 to 29<br />

<br />

0 for i= 30 to 35<br />

c) block_type=3 (stop block)<br />

0 for i= 0 to 5<br />

<br />

x i sin i 6 1 12<br />

2<br />

z i<br />

for i= 6 to 11<br />

<br />

x i<br />

for i=12 to 17<br />

<br />

x i<br />

sin i 1 36<br />

2<br />

for i=18 to 35


背 景 :<br />

针 对 标 准 清 晰 度 数 字 电 视 和 高 等 清 晰 度 数 字 电 视 应 用 下 制 定 的 方<br />

案 1992 年 正 式 发 布 , 标 准 号 是 ISO/IEC13818-3. 他 能 够 提 供 CD 级 的 音<br />

质 .MPEG2 BC 是 针 对 MPEG-1 音 频 兼 容 的 多 声 道 和 低 码 率 的 扩 展 .<br />

技 术 背 景 :<br />

采 样 率<br />

: 16,22.05,24,32,44.1,48khz<br />

比 特 率 : 8~384kbps(2 声 道 )<br />

通 道<br />

: 5.1 声 道


Prediction<br />

利 用 预 测 技 术 减 少 通 道 间 冗 余 . 使 用 通 道 1 和 通 道 2 的 采 样 预 测 通 道<br />

3,4,5 的 采 样 数 据 .<br />

2<br />

<br />

T2(n) pred_ coef_ T2_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T2_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

T3(n) pred_ coef_ T3_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T3_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

T4(n) pred_ coef_ T4_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T4_1[sbgr,pci] T1(n delay_ comp pci)<br />

pci=0<br />

2<br />

<br />

pci<br />

0<br />

2<br />

<br />

pci<br />

0<br />

2<br />

<br />

pci<br />

0<br />

T2<br />

(n) = T2(n) - T2(n) <br />

T3<br />

(n) = T3(n) - T3(n) <br />

T4<br />

(n) = T4(n) - T4(n)


背 景<br />

1997 年 制 订 不 兼 容 MPEG-1 的 音 频 标 准 MPEG-2 NBC, 即 MPEG-2 AAC<br />

1999 年 MPEG-2 AAC 增 加 LTP 和 PNS 工 具 , 形 成 MPEG-4 AAC v1<br />

2002 年 MPEG-4 AAC v1 增 加 了 SBR 和 错 误 鲁 棒 性 工 具 , 形 成 MPEG-4 HE-AAC<br />

2004 年 MPEG-4 HE-AAC 引 入 PS 模 块 , 提 升 低 码 率 性 能 , 形 成 EAAC+<br />

技 术 指 标<br />

采 样 率 :8kHz - 96kHz<br />

码 率 : 8kbps - 576kbps<br />

声 道 : 最 多 支 持 48 个 主 声 道 ,16 个 低 频 增 强 声 道


MPEG2 AAC 技 术 特<br />

点<br />

IS+ MS+ Coupling<br />

MDCT<br />

SQ<br />

Huffman Coding<br />

GC, TNS, Prediction<br />

DRC<br />

• MPEG4 AAC 技 术 特 点<br />

MPEG2 AAC<br />

+LTP<br />

+PNS<br />

TwinVQ<br />

AAC<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

Bitstream deformater<br />

M/S<br />

PNS<br />

Prediction<br />

Intensity<br />

Coding<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Gain Control<br />

Unused features<br />

Optional features<br />

SSR<br />

LC/LD/LTP


无 损 解 码 模 块<br />

MPEG2/4 AAC 标 准 的 也 应 用 了 huffman 编 码 算 法 到 无 损 编 码 模 块 . 但 与<br />

mp3 不 同 的 是 .MPEG2 AAC 对 scalefactor 也 使 用 了 huffman 编 码 . 并 且 码<br />

本 更 加 合 理 .<br />

量 化 模 块<br />

MPEG2/4 AAC 标 准 中 的 量 化 部 分 也 是 用 了 非 均 匀 量 化 器 . 公 式 如 下 .<br />

mdct _ line sign( q( i) 0.4054)* abs( q( i) 0.4054)<br />

*2<br />

4 1<br />

( scalefactor common _ scalefac )<br />

3 4


时 频 转 换 模 块<br />

MPEG2/4 AAC 只 应 用 了 MDCT 算 法 把 时 域 数 据 转 换 到 频 域 数 据 , 没<br />

有 使 用 MP3 的 PQMF 模 块 . 而 且 ,AAC 中 一 帧 的 数 据 是 1024 个 采 样 , 并<br />

对 每 帧 的 信 号 类 型 进 行 分 析 , 分 为 和 mp3 相 似 的 4 个 类 型 编 码 , 长 窗 , 短<br />

窗 , 开 始 窗 和 结 束 窗 .AAC 长 窗 1024 个 数 据 , 短 窗 256 个 数 据 , 当 当 前 帧<br />

为 短 窗 时 , 每 帧 有 8 个 短 窗 数 据 . 而 且 在 AAC 中 , 标 准 提 供 了 2 中 基 本 窗<br />

函 数 , 一 种 是 和 mp3 一 样 的 正 弦 窗 , 一 种 是 KBD 窗 .<br />

其 他 模 块<br />

MPEG2 AAC 使 用 了 TNS 算 法 降 低 编 码 系 统 的 pre-echo 噪 音 , 使 用 了<br />

prediction 算 法 开 发 信 号 频 域 的 帧 间 特 性 , 提 高 编 码 效 率 .MPEG4<br />

AAC 使 用 了 LTP 代 替 MPEG2 AAC 的 prediction 算 法 , 力 图 在 获 得 同<br />

样 编 码 质 量 的 同 时 降 低 编 码 复 杂 度 .MPEG4 AAC 也 应 用 了 PNS 算 法<br />

提 高 系 统 对 高 频 部 分 信 号 编 码 的 质 量 .


Prediction<br />

Predictor Side Info<br />

RECONSTRUCTION CONTROL<br />

帧 间 预 测<br />

后 向 自 适 应 格 型 预 测<br />

LMS 自 适 应 原 理<br />

y i,q (n)<br />

Q i<br />

-1<br />

y i,rec (n)<br />

IF (PDP && PU)<br />

x i,rec (n) = y i,rec (n) + x i,est (n)<br />

ELSE<br />

x i,rec (n) = y i,rec (n)<br />

x i,rec (n)<br />

只 在 非 短 窗 内 使 用<br />

x i,est (n)<br />

x i,rec (n-1)<br />

应 用 单 位 为 sfb,<br />

P i<br />

z -1<br />

分 组 复 位<br />

Coeff 计 算 应 用 预 测 预 测 器 更 新


重 建 公 式<br />

x ( n) x ( n) e ( n)<br />

rec est q<br />

预 测 公 式<br />

x<br />

est<br />

( n)<br />

xest, 1(<br />

n)<br />

xest,<br />

2(<br />

n)<br />

x<br />

est<br />

, m( n)<br />

bkm(<br />

n)<br />

rq<br />

, m1(<br />

n1)<br />

r<br />

q,0(<br />

n)<br />

ax<br />

rec<br />

n<br />

r<br />

( n)<br />

a(<br />

rq<br />

,0(<br />

n1)<br />

bk1(<br />

n)<br />

eq,<br />

0(<br />

))<br />

q, 1<br />

n<br />

eq, m( n)<br />

eq,<br />

m1(<br />

n)<br />

xest,<br />

m(<br />

n)


自 适 应 公 式<br />

如 果 是 固 定 的 信 号 ( 指 有 规 则 的 周 期 的 信 号 ) 则 a = b = 1<br />

E eq, m1 ( n) rq , m1( n 1)<br />

<br />

km <br />

<br />

<br />

, m 1, 2, e<br />

2 2<br />

q,0 ( n) rq ,0( n) xrec<br />

( n)<br />

1<br />

2<br />

E <br />

eq, m1 ( n) <br />

E <br />

rq , m1( n 1)<br />

<br />

<br />

• 如 果 要 自 适 应 的 调 整 系 数 适 应 当 前 信 号 的 属 性 则<br />

k<br />

m<br />

COR<br />

( n1)<br />

<br />

VAR<br />

( n)<br />

( n)<br />

COR ( n) COR ( n 1) r ( n 1) e ( n)<br />

m m q, m1 q, m1<br />

VAR ( n) VAR ( n 1) 0.5 r ( n 1) e ( n)<br />

2 2<br />

m m q, m1 q, m1<br />

0.90625<br />

m<br />

m<br />

<br />

<br />

预 测 器 复 位<br />

Reset group number Predictors of reset group<br />

1 P0, P30, P60, P90,...<br />

2 P1, P31, P61, P91,...<br />

3 P2, P32, P62, P92,...<br />

...<br />

30 P29, P59, P89, P119,...


TNS<br />

Temporal Noise Shaping<br />

(TNS) 是 一 种 能 够 自 适 应 于<br />

入 信 号 特 性 来 降 低 pre-echo<br />

Spec data<br />

自 相 关 函<br />

数<br />

R0<br />

R(s)<br />

Levinson<br />

Durbin<br />

(order-12)<br />

/<br />

error<br />

gain<br />

Ref.coef<br />

量 化 反 射<br />

系 数<br />

Coef<br />

截 断 系 数<br />

Index, order<br />

计 算 LPC 系<br />

数<br />

效 应 的 新 技 术 。 它 利 用 应 用<br />

于 信 号 频 谱 的 处 理 来 实 现 时<br />

LPC 系 数<br />

TNS 滤 波<br />

(MA)<br />

域 噪 声 形 状 的 控 制 , 能 够 对<br />

Encode<br />

量 化 噪 声 的 细 微 时 域 结 构<br />

Decode<br />

( 甚 至 在 一 个 滤 波 器 组 窗 口<br />

内 ) 进 行 控 制 .<br />

Index,TNS<br />

order<br />

Truncate<br />

Coeffs<br />

TNS decode coeffs<br />

Compute<br />

LPC<br />

Coeffs<br />

LPC coeffs<br />

Spectral data<br />

TNS 滤 波<br />

(AR)


TNS 技 术 特 点<br />

帧 内 预 测<br />

任 意 窗 使 用<br />

L-D 算 法<br />

可 以 在 任 意 地 方 使 用 , 可 以 跨 越 SFB<br />

8 个 side info.<br />

Coeff 计 算 边 界 确 定 应 用 滤 波


Gain Conctrol 组 件 有 3 子 模 块 组 成 .<br />

(1) GC 数 据 解 析<br />

(2) GC 函 数 设 置<br />

(3) GC WOA 与 综 合


原 理 :<br />

‣ 类 音 调 信 号 与 类 噪 声 信 号 相 比 需<br />

要 更 高 的 编 码 精 度<br />

‣ Long Term Prediction 是 一 种 时<br />

域 帧 间 1 阶 前 相 自 适 应 IIR 滤 波 器 . 目<br />

的 在 于 减 少 信 号 的 时 域 帧 间 冗 余 .<br />

码 流 解 析<br />

预 测 计 算<br />

时 频 转 换<br />

LTP 模 块<br />

TNS 编 码<br />

LTP 采 样 更 新<br />

数 据 重 建<br />

TNS 解 码<br />

时 频 转 换


‣ 在 每 帧 有 一 个 ltp 参 数 , 用 ltp 参 数 查 表 可 以 得<br />

到 ltp 预 测 系 数 . 并 在 该 sfb 内 执 行 时 域 预 测 . 当<br />

前 帧 内 可 以 有 偏 移 参 数 .<br />

‣ 由 于 LTP 是 时 域 预 测 , 要 用 前 一 帧 的 时 域 数 据<br />

乘 以 预 测 系 数 得 到 当 前 预 测 值 . 再 经 过 时 频<br />

变 换 转 换 到 频 域 系 数 和 TNS 编 码 ( 如 果 使 用 )<br />

才 能 和 当 前 码 流 中 的 残 差 值 相 加 重 构 . ltp 从<br />

sfb 0 开 始 执 行 重 构 , 最 多 执 行 40 个 sfb.<br />

‣ LTP 和 PNS 不 可 同 时 使 用 , 如 果 码 流 中 同 时 标<br />

识 LTP 和 PNS 同 时 有 效 , 优 先 节 目 PNS, 不 解 码<br />

LTP.<br />

Pred_buf<br />

Est_buf<br />

T_Est_coef<br />

Sfb_coef<br />

X<br />

偏 移<br />

时 频 转 换<br />

F_Est_coef<br />

+<br />

F_Cur_coef<br />

F_Rec_coef<br />

Ltp_max_sfb


原 理 :<br />

Perceptual Noise Substitution (PNS)<br />

在 每 个 sfb 内 检 测 类 噪 声 信 号 .<br />

在 流 中 解 析 噪 声 替 代 标 志 和 替 代 信 号 带 宽 的 功 率 .<br />

解 码 器 按 照 功 率 谱 插 入 伪 随 机 矢 量 来 替 代 谱 线 信 号 .


背 景<br />

三 星 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方<br />

案 使 用 Bit Slice Arithmetic Coding 代 替 了 MPEG2 AAC 的 huffman 解 码<br />

单 元 . 该 方 案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该<br />

方 案 能 够 实 现 精 细 可 扩 展 编 码 . 被 应 用 于 T-DMB 和 S-DMB 系 统 .<br />

技 术 框 架<br />

Bitstream deformater<br />

TwinVQ<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

M/S<br />

Intensity<br />

Coding<br />

AAC<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

PNS<br />

Prediction<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Unused features<br />

Optional features<br />

Gain Control SBR PS<br />

SSR HE-AAC AAC++ LC/LD/LTP


技 术 特 点 :<br />

1. 比 特 率 可 分 级 :<br />

分 层 实 现 比 特 率 16( 基 本<br />

层 ),24,32,40,48,56,64kb<br />

ps.<br />

2. 带 宽 可 分 级 :<br />

对 每 层 , 仅 仅 受 限 的 频 率<br />

带 宽 才 被 编 码 . 每 层 的 可<br />

分 级 增 量 带 宽 是 3.5khz.


1. BSAC 的 调 整 步 长 :<br />

基 本 层 : 16k bps<br />

每 个 增 加 层 : 1 kbps<br />

2. 每 32 个 谱 线 数 据 形 成 一 个 处 理 单 元 , 有 相 同 的 算 法 编 码 模 型 索 引 . 被 称 为 codeband<br />

3. 4 维 比 特 片 矢 量 分 为 2 个 子 矢 量 ( 矢 量 0 和 矢 量 1).<br />

4. 立 体 声 编 码 和 PNS 使 用 不 同 的 编 码 模 型<br />

5. 差 分 编 码 的 Scale-factor 使 用 许 多 不 同 的 编 码 模 型 .<br />

6. 不 同 的 codeband 可 以 有 共 同 的 Scale-factor 但 是 有 不 同 的 算 术 模 型 .


背 景<br />

NTT 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方 案<br />

使 用 Twin-Vector Quant 代 替 了 MPEG2 AAC 的 huffman 解 码 单 元 . 该 方<br />

案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该 方 案 能 够<br />

实 现 精 细 可 扩 展 编 码 .<br />

技 术 框 架<br />

Bitstream deformater<br />

TwinVQ<br />

Spectrum<br />

normalization and<br />

interleaved VQ<br />

M/S<br />

Intensity<br />

Coding<br />

AAC<br />

Scalefactor coding<br />

Huffman coding<br />

Quantization<br />

PNS<br />

Prediction<br />

LTP<br />

TNS<br />

BSAC<br />

Scalefactor coding<br />

Arithmetic coding<br />

Quantization<br />

Filterbank<br />

Mandatory features<br />

Unused features<br />

Optional features<br />

Gain Control SBR PS<br />

SSR HE-AAC AAC++ LC/LD/LTP


IMDCT<br />

Decode<br />

LPC coefficient<br />

calculation<br />

MDCT<br />

Encode<br />

TwinVQ 解 码 框 图<br />

X<br />

LPC spectrum<br />

calculation<br />

LPC cepstrum<br />

calculation<br />

LPC coefficient<br />

to<br />

LSP coefficient<br />

÷<br />

LPC cepstrum<br />

calculation<br />

Decoder<br />

LSP VQ<br />

Bark calculation<br />

X<br />

Decoder<br />

Bark VQ<br />

Bark envelope<br />

calculation<br />

÷<br />

Power<br />

calculation<br />

X<br />

Decoder<br />

Power VQ<br />

÷<br />

De-interleave<br />

Interleave<br />

Decoder<br />

Decoder<br />

Weighted<br />

VQ<br />

Weighted<br />

VQ


背 景 :<br />

HE-AACv1/v2 是 三 种 MPEG 技 术 的 整 合 体 , 包 括 高 级 音 频 编 码 (Advanced Audio<br />

Coding, AAC), 以 及 科 玎 技 术 有 限 公 司 (Coding Technologies) 的 谱 带 复 制 (Spectral<br />

Band Replication,SBR) 和 参 量 立 体 声 (Parametric Stereo,PS) 技 术 。SBR 是 一 种 独 特 的 带<br />

宽 扩 展 技 术 , 它 能 够 仅 仅 使 用 一 半 的 比 特 速 率 带 宽 来 进 行 音 频 编 解 码 , 而 传 输 质 量 却 一 致 。PS 则<br />

能 够 使 低 比 特 速 率 的 立 体 声 信 号 , 在 编 解 码 的 效 率 上 增 加 一 倍 。HE-AACv1/v2 在 许 多 的 国 际 标 准<br />

化 组 织 中 都 已 经 被 广 泛 采 用 。<br />

性 能 :<br />

• 支 持 多 声 道 5.1,7.1 以 及 更 多 ( 总 支 持 信 道 数 可 达 48)<br />

• 以 48kbps 速 率 传 输 CD 音 质 立 体 声 , 以 32kbps 速 率 传 输 准 CD 音 质 立 体 声 , 以 24kbps 速 率 传 输<br />

准 优 质 立 体 声 . 低 至 8kbps 的 速 率 单 声 道 优 化 传 输 话 音 、 话 音 / 音 乐 混 合 音 频<br />

• 遵 从 ISO/IEC 14496-3


SBR 技 术<br />

SBR 工 具 用 于 重 建 音 频 信 号 的 高 频 区 域 成 分 , 这 种 重 建 是 基 于 对<br />

在 编 码 过 程 中 被 截 断 的 谐 波 序 列 的 复 制 而 进 行 的 。SBR 首 先 对 生 成 的<br />

高 频 成 分 的 谱 包 络 进 行 调 整 , 然 后 对 经 过 调 整 的 谱 包 络 进 行 综 合 滤<br />

波 , 再 加 上 噪 声 处 理 和 正 弦 成 分 , 从 而 重 构 出 原 始 音 频 信 号 的 谱 特<br />

征 。


SBR 技 术 由 4 个 模 块 组 成<br />

分 别 是 :<br />

谱 线 解 码 模 块 .<br />

分 析 综 合 滤 波 器 模 块 .<br />

HF 产 生 模 块 .<br />

HF 调 整 模 块 .<br />

AAC Core<br />

Decoder<br />

Bitstream<br />

Payload<br />

Deformatter<br />

HE-AACv1 比 特 流<br />

Bitstream<br />

Parser<br />

Huffman<br />

Decoding &<br />

Dequantization<br />

Analysis<br />

QMF Bank<br />

HF Generator<br />

Envelope<br />

Adjuster<br />

Synthesis<br />

QMF Bank<br />

Output<br />

PCM Samples


比 特 流 输 入<br />

码 流 解 析<br />

残 差 谱 线 解 码<br />

谱 线 分 析<br />

MPEG4 AAC 解 码 器<br />

Huffman 解 码<br />

时 频 变 换 模 块<br />

反 量 化<br />

分 析 QMF<br />

X<br />

HF generation 模 块<br />

线 性 预 测<br />

XLow<br />

XHigh<br />

HF adjustment 模 块<br />

Eorig<br />

组 装 调 整<br />

XHigh<br />

Qorig<br />

加 躁<br />

W1<br />

正 弦 调 制<br />

时 频 变 换 模 块<br />

W2<br />

Y<br />

综 合 QMF<br />

时 域 PCM 信 号


时 域<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

● ● ● ●<br />

Huffman<br />

● 解 ●码 有 ●数<br />

●<br />

● ●<br />

据 的<br />

● ●<br />

区 域<br />

● ● ● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

频 带<br />

复 制<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 1<br />

子 带 2<br />

子 带 3<br />

子 带 4<br />

子 带 5<br />

子 带 6<br />

子 带 7<br />

子 带 8<br />

子 带 9<br />

子 带 10<br />

子 带 11<br />

子 带 12<br />

子 带 15<br />

子 带 14<br />

子 带 16<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 N-1<br />

残 差 谱 线 解 码 模 块<br />

该 模 块 实 现 确 定 非 零<br />

谱 线 位 置 和 非 零 谱 线<br />

的 解 码 . 在 确 定 非 零 谱<br />

线 位 置 , 标 准 采 取 的 方<br />

法 很 灵 活 . 在 解 码 谱 线<br />

数 据 时 依 然 采 用 差 分<br />

huffman 解 码 .<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

子 带 N<br />

频 域<br />

960samples/frame 时 N=30<br />

1024samples/frame 时 N=32


反 量 化<br />

反 量 化


QMF Analysis<br />

SBR 工 具 的 第 一 个 模 块 就 是 首 先 把 解 码<br />

后 的 时 域 数 据 转 换 到 频 域 , 这 个 功 能 是<br />

通 过 复 数 分 析 滤 波 器 组 实 现 的 . 复 数 矩<br />

阵 如 下 :


• QMF Synthesis:<br />

频 带 复 制 后 的 数 据 还 要 统 一 转 换 到<br />

时 域 . 复 数 矩 阵 如 下 :


• QMF 将 采 样 综 合<br />

SBR 内 部 还 有 一 种 子 带 综 合 模 式 ,<br />

既 是 降 采 样 综 合 , 其 变 换 矩 阵 如 下 :


HF 产 生 模 块<br />

HF 生 成 器 的 目 的 是 将 一 定 数 目<br />

的 由 从 矩 阵 XLow 的 一 些 连 续 子 带<br />

通 过 合 成 滤 波 器 组 得 到 的 子 带 信<br />

号<br />

复 制 到 矩 阵 XHigh 的 一 些 连 续 子 带<br />

中 去 。<br />

输 入 参 数 和 矢 量<br />

XLow<br />

计 算 协 方 差 矩 阵<br />

Φk(i,j)<br />

计 算 chirp factors 计 算 线 性 预 测 系 数 计 算 patch 信 息<br />

bwArray a0(k),a1(k) patchStartSubband<br />

和<br />

patchNumSubbands<br />

计 算 Xhigh 预 测 值<br />

XHigh<br />

输 出 参 数 和 矢 量


HF 产 生 模 块 公 式 推 导


EOrig<br />

QOrig<br />

谱 线 和 噪 声 地 址 映 射<br />

EOrigMapped<br />

QMapped<br />

输 入 参 数 与 矢 量<br />

Step2: 附 加 HF 信 号 计 算<br />

Generate Sinusoid<br />

Harmonic<br />

SIndexMapped<br />

Map Sinusoid<br />

Harmonic<br />

SMapped<br />

计 算 HF 信 号 的 幅 值<br />

Xhigh<br />

Estimation of current envelope<br />

Step1:Mapping<br />

Step3: 谱 线 估 计<br />

HF 调 整<br />

在 预 测 了 高 频 数 据 以 后 . 预 测 出 的 数 据<br />

和 原 始 数 据 差 异 还 有 很 大 ,HF 调 整 模 块<br />

就 是 利 用 码 流 中 的 参 数 信 息 , 解 析 出 附<br />

加 激 励 信 号 , 附 加 噪 声 信 号 和 附 加 正 弦<br />

信 号 , 再 把 这 些 信 号 值 加 到 预 测 值 上 ,<br />

近 似 还 原 得 到 原 始 高 频 数 据 .<br />

ECurr<br />

QM<br />

SM<br />

增 益 计 算<br />

Step4: 增 益 计 算<br />

SMBoost<br />

QMLimBoost<br />

GLimBoost<br />

Xhigh<br />

GLimBoost<br />

GFilt<br />

计 算 HF 信 号<br />

W<br />

1<br />

QMLimBoost<br />

参 数<br />

计 算<br />

QFilt<br />

加 躁 波<br />

W<br />

2<br />

SMBoost<br />

ΨRe<br />

加 正 弦 谐 波<br />

Step5:HF 信 号 组 装<br />

Y<br />

输 出 参 数 与 矢 量


映 射<br />

正 弦 产 生<br />

频 谱 评 定<br />

噪 声 谱 正 规 化<br />

正 弦 谱 正 规 化


增 益 计 算<br />

能 量 补 偿<br />

增 益 限 制


各 种 增 益 计 算


平 滑 滤 波


加 躁


正 弦 调 制


HF 调 整 后 得 到 的 矢 量 即 可 和 源 低 频 矢 量 合 并 ,<br />

统 一 进 入 QMF 综 合 滤 波 器 组 , 进 行 频 时 转 换 , 得<br />

到 时 域 数 据 输 出 , 完 成 解 码 过 程 .


HE-AACv2 = HE-AACv1 + Parametric<br />

stereo<br />

解 码 器 结 构 如 下<br />

HE-AACv1 解 码 器<br />

Parametric stereo<br />

MPEG4 AAC<br />

解 码 器<br />

QMF Analysis<br />

(64 bands)<br />

Other SBR Tool<br />

Hybrid<br />

analysis<br />

Delay<br />

LF<br />

HF<br />

De-correlation<br />

……s(k,n)……<br />

…d(k,n)…<br />

Stereo Processing<br />

Hybrid<br />

synthesis<br />

Hybrid<br />

synthesis<br />

QMF systhesis<br />

(64 bands)<br />

QMF systhesis<br />

(64 bands)<br />

L<br />

R


• PS<br />

PS 技 术 由 4 个 模 块 组 成 . 码 流 解 析 ,<br />

混 合 QMF 分 析 与 综 合 模 块 , 立 体 声<br />

处 理 模 块 , 解 相 关 模 块 .<br />

Low frequency filtering<br />

Sk(n)<br />

Demuxer<br />

Framing<br />

eAAC+ 码 流<br />

Stereo Processing<br />

De-correlation<br />

• PS 单 元 的 码 流 解 析 相 对 简 单 , 除<br />

了 要 解 码 出 相 应 的 定 长 sideinfo<br />

数 据 以 外 , 主 要 是 解 码 参 数 立 体<br />

声 的 4 个 参 数 iid, iic, opd 和 ipd 以<br />

及 它 们 的 位 置 信 息 . 这 4 个 参 数 都<br />

是 使 用 差 分 huffman 编 码 .<br />

Mixing<br />

Phase parameters<br />

Interpolation<br />

Hi,j(k,ne)<br />

Perform transient<br />

detection<br />

Apply transient<br />

reduction to<br />

decorrelated signal<br />

dk(z)<br />

Calculate decorrelated<br />

signal<br />

Mixing<br />

lk(n),rk(n)<br />

Hybrid QMF synthesis<br />

filterbank<br />

L,R


混 合 QMF 分 析 与 综 合 模 块<br />

对 经 过 QMF 处 理 的 频 谱 ,PS 模 块 要 做 进 一 步 谱 线 分 析 , 把 1024 个 谱 线 分 成 10,20<br />

或 34 个 子 带 . 分 组 方 式 和 公 式 如 下 , 根 据 码 流 中 不 同 的 信 息 选 择 相 应 的 QMF.


Hybrid QMF analysis filterbank for the 10 and 20 stereo-bands configuration


解 相 关 模 块<br />

目 的 : 是 预 测 参 数 通 道 数 据 d(z).<br />

2. 瞬 态 信 号 检 测<br />

1. 计 算 传 输 函 数<br />

q(m)<br />

fcenter(k)<br />

3. 计 算 相 关 信 号


q(m)<br />

fcenter(k)<br />

1. 计 算 传 输 函 数


2. 瞬 态 信 号 检 测


立 体 声 处 理 模 块<br />

目 的 : 实 现 计 算 相 位 和 振 幅 参 数 , 调 整 目 标 通 道 幅 值 和 相 位 , 还 原 立 体 生 数 据 .<br />

由 立 体 声 参 数 推 导 参 数 矩 阵 的 过 程 如 下<br />

iid,iic,ipd,<br />

opd 参 数<br />

h(z) H(z,ne) H(z,n)


icc_mode=0,1,2 时 振 幅 参 数 的 计 算 icc_mode=3,4,5 时 振 幅 参 数 的 计 算


相 位 参 数 计 算 于 立 体 声 参 数 矩 阵 计 算<br />

当 IPD.OPD 有 效 时<br />

exp( j1<br />

( b( k))) 1<br />

exp( j2( b( k))) 1<br />

exp( j3( b( k))) 1<br />

exp( j<br />

( b( k))) 1<br />

4<br />

当 IPD.OPD 无 效 时<br />

exp( j1<br />

( b( k)))<br />

exp( j2( b( k)))<br />

exp( j3( b( k)))<br />

exp( j<br />

( b( k)))<br />

4


参 数 内 插<br />

立 体 声 重 建


重 建 后 的 左 右 频 带 数 据 别 再 经 过 PS 内 部 的 混<br />

合 滤 波 器 组 和 SBR 的 QMF 滤 波 器 器 组 还 原 时<br />

域 信 号 .


AAC_LC<br />

MP3


背 景 :<br />

AC3 的 前 身 还 包 括 AC1 和 AC2, 只 不 过 因 为 效 果 不 是 很 好 没 有 得<br />

到 广 泛 应 用 .1994 年 12 月 27 日 , 日 本 先 锋 公 司 宣 布 与 美 国 的 杜 比 实 验<br />

室 合 作 在 之 前 AC2 的 基 础 上 研 制 成 功 新 的 环 绕 声 制 式 , 并 命 名 为<br />

“ 杜 比 AC-3(Dolby Surround Audio Coding-3)”。1997 年 初 ,<br />

杜 比 实 验 室 已 正 式 将 杜 比 AC-3 环 绕 声 改 称 为 杜 比 数 码 环 绕 声<br />

(Dolby Surround Digital), 简 称 为 Dolby Digital.. 现 被 广 泛 应 用 于<br />

DVD 影 碟 , ATSC 数 字 地 面 电 视 , DLNA 家 庭 互 联 , 有 线 电 视 , 卫 星 电 视 .<br />

技 术 特 点 :<br />

采 样 率 : 32、44.1、48 kHz<br />

码 率 : 96Kbps-640Kbps<br />

声 道 数 : 6 声 道<br />

AC3 编 码 器


AC3 技 术 特 点<br />

MS + Coupling<br />

MDCT<br />

SQ<br />

Bit allocation<br />

DRC<br />

Encoded AC3<br />

Bitstream<br />

AC-3 frame synchronization, error detection, and frame de-formatting<br />

Encoded<br />

Spectral<br />

envelop<br />

Bit allocation<br />

Bit allocation<br />

infomation<br />

Mantissa<br />

De-quantization<br />

Quantized<br />

mantissas<br />

mantissa<br />

Spectral<br />

Envelop<br />

decoding<br />

Exponent<br />

Synthesis Filter<br />

Bank<br />

PCM time<br />

samples


Bit Allocation<br />

AC3 的 Bit Allocation 技 术 和 MPEG1/2 层 1/2 的 位 分 配 技 术 相 似 . 但 与<br />

之 不 同 的 是 AC3 算 法 通 过 传 输 编 码 参 数 , 在 解 码 端 进 行 心 理 声 学 模 型 的 逆 运<br />

算 计 算 每 个 采 样 需 要 的 分 配 位 数 . 比 特 指 派 对 音 频 信 号 从 掩 蔽 效 应 分 析 它 的<br />

频 谱 包 络 , 以 确 定 分 配 给 各 频 谱 系 数 的 尾 数 所 需 要 的 比 特 数 。<br />

指 数<br />

功 率<br />

谱 密<br />

度<br />

带 化 的<br />

功 率 谱<br />

密 度<br />

谱 包 络 变 换 频 带 划 分 扩 展 函 数 听 阈<br />

激<br />

励<br />

函<br />

数<br />

掩 蔽 曲 线<br />

掩 蔽 比 较<br />

比 特 分 配


Mantissa Decode<br />

AC3 中 mantissa 的 意 义 和 其 他 编 码 标 准 的 残 差 谱 线 意 义 是 一 样 的 . 尾 数 的 量 化 和 解 码<br />

根 据 比 特 指 派 计 算 出 的 BAP 值 将 所 有 尾 数 量 化 到 同 一 等 级 精 度 上 。 该 步 骤 先 从 码 流 中<br />

取 出 尾 数 信 息 , 再 将 尾 数 信 息 和 指 数 解 码 解 出 的 频 谱 指 数 信 息 组 合 成 频 谱 系 数 , 在 解<br />

码 时 , 将 BAP 值 作 为 索 引 在 量 化 表 格 中 查 出 尾 数 占 用 的 比 特 数 , 根 据 该 比 特 数 将 尾 数<br />

从 码 流 中 取 出 , 在 根 据 BAP 值 对 尾 数 进 行 反 量 化 . 最 后 乘 以 指 数 值 .AC3 对 尾 数 的 组 装<br />

也 是 有 分 组 解 码 的 , 一 切 都 根 据 bap 值 的 提 示 进 行 . 而 且 根 据 bap 值 的 不 同 , 量 化 器 的 选<br />

择 也 不 同 ,AC3 即 使 用 了 均 匀 量 化 器 也 是 用 了 非 均 匀 量 化 器 .


Exponent Decode<br />

AC3 的 Exponent 参 数 的 意 义 和<br />

其 他 编 码 标 准 的 scalefactor 是 一 样 的 ,<br />

都 是 起 到 按 照 bark 谱 量 化 的 目 的 . 对<br />

exponent 的 编 码 AC3 采 用 差 分 分 组<br />

的 方 式 编 码 . 而 每 个 码 字 表 示 二 进 制 表<br />

达 式 中 前 导 零 的 个 数 ,AC3 标 准 采 用<br />

了 一 些 共 享 策 略 . 指 数 信 息 在 一 个 数 据<br />

帧 内 的 各 个 音 频 块 之 间 可 以 共 享 , 即<br />

根 据 不 同 指 数 共 享 策 略 数 据 块 1 到 数 据<br />

块 5 可 以 重 复 使 用 以 前 数 据 块 的 指 数 信<br />

息 。<br />

开 始<br />

是 否 重 用 上<br />

一 块 指 数<br />

N<br />

获 得 指 数 策 略 和 指<br />

数 组 编 码 值<br />

指 数 解 码 策 略<br />

Y<br />

结 束<br />

分 解 指 数 包 , 得 到<br />

编 码 值 序 列<br />

求 指 数 差 分 值 序 列<br />

差 分 解 码 , 得 到 实<br />

际 指 数


• Stereo Process<br />

AC3 使 用 了 2 种 技 术 对 通 道 对 进 行 处 理 . 一 种 是<br />

耦 合 技 术 一 种 是 rematrixing 技 术 . 其 中 rematrixing 技<br />

术 和 其 他 标 准 中 的 ms 技 术 是 完 全 一 样 的 .coupling 技<br />

术 在 其 后 的 AAC 标 准 种 也 有 使 用 .<br />

‣ Coupling<br />

耦 合 是 对 IS 编 码 的 推 广 .<br />

Demux<br />

解 码 耦 合 系 数<br />

left left ' right<br />

'<br />

right left ' right<br />

'<br />

解 码 参 考<br />

声 道 数 据<br />

耦 合 声 道 重 建<br />

‣ Rematrixing<br />

Rematrixing 和 Coupling 有 冲 突 .<br />

应 用 频 带 范 围 有 限 制 .


注 意 AC3 和 AAC 的 在 耦 合 上 的 差 别<br />

1.AAC 可 以 在 时 域 和 频 域 2 个 方 向 上 应 用 耦 和 .ac3 只 在 频 域 上 使 用 耦<br />

合 .<br />

2.AC3 没 有 sfb 的 概 念 , 所 以 有 独 立 的 coupling sub-band 和 band。<br />

每 个<br />

耦 合 band 有 一 个 耦 合 系 数 。sub-band 是 频 带 系 数 。n 个 subband 可<br />

以 组 成 一 个 band。 码 流 中 有 一 个 标 志 位 指 示 分 组 方 式 。 这 个 标 志 位 的<br />

解 码 和 AAC 中 窗 分 组 的 方 式 是 一 样 。AAC 有 sfb 的 概 念 , 每 个 sfb 一 个<br />

耦 合 因 子 。<br />

3.AAC 的 解 耦 合 公 式 是 dst+=src*cscale<br />

AC3 的 解 耦 合 公 式 是 dst =src*cscale<br />

4.AAC 是 全 频 带 , 一 直 到 max_sfb<br />

AC3 是 部 分 频 带 , 系 数 地 址 是 37~252


MDCT<br />

AC3 的 时 频 变 换 模 块 和 AAC 的 类 似 , 解 码 时 也 是 要 经 过 3 步 处<br />

理 ,IMDCT, 加 窗 和 交 叠 加 . 只 不 过 AC3 的 MDCT 窗 长 度 分 别 是 256 和<br />

512. 而 且 窗 类 型 稍 有 差 别 .


2005 年 为 了 迎 接 即 将 到 来 的 HD/ 蓝 光 高 清 时 代 , 杜 比 公 司 推 出 了 全<br />

新 的 DOLBY DIGITAL PLUS 音 效 格 式 。 该 格 式 最 高 能 够 支 持 多 达<br />

13.1 声 道 的 环 绕 声 音 效 , 而 最 低 能 够 支 持 7.1 声 道 。 高 码 率 的 DD<br />

PLUS 音 效 将 用 于 以 HD/ 蓝 光 光 盘 为 介 质 的 电 影 中 使 用 , 而 码 律 较 低<br />

的 DD PLUS 音 效 将 用 于 电 视 台 的 电 视 信 号 传 输 .<br />

码 率 32Kbps-6Mbps<br />

声 道 数 最 高 13.1 声 道 , 最 低 7.1 声 道 .<br />

采 样 率 16khz,22.05khz,24khz,32khz,44.1khz,48khz<br />

NBC


• EAC3 技 术 特 点<br />

关 键 模 块 有<br />

AHT 模 块<br />

ECC 模 块<br />

SE 模 块<br />

TNP 模 块<br />

Exponent decode<br />

bit allocation<br />

HE-bit allocation<br />

VQ decoder<br />

GAQ decoder<br />

Mantissa decode<br />

IDCT<br />

AHT 模 块<br />

Enhanced channel<br />

coupling<br />

(ECC)<br />

Spectral Extension<br />

(SE)<br />

IMDCT<br />

瞬 态 噪 声 处 理<br />

(TNP)<br />

技 术 框 图


AHT<br />

EAC3 的 Adaptive Hybrid Transform (AHT) 模 块 只 有 当 码 流 中 的 标 识 位<br />

有 效 时 , 该 模 块 才 有 效 。 该 模 块 包 含 3 个 子 单 元 , 参 数 位 分 配 , 改 进 的 量 化<br />

单 元 和 DCT 单 元 。 当 标 识 位 指 示 使 用 AHT 模 块 时 , 比 特 流 先 进 入 参 数 比 特 分 配<br />

单 元 , 提 取 位 分 配 信 息 . 使 用 GAQ 或 是 VQ 的 方 法 反 量 化 重 构 残 差 谱 线 , 再 结 合<br />

exponent 参 数 重 构 频 域 谱 线 , 最 后 经 过 IDCT 变 换 , 产 生 低 分 辨 率 频 域 谱 线 .


参 数 位 分 配 与 量 化<br />

AHT 模 块 中 的 位 分 配 技 术 与 AC3<br />

中 的 位 分 配 技 术 类 似 但 并 不 相 同 ,<br />

只 是 对 bap 的 表 做 了 改 进 . 当 使 用<br />

AHT 模 块 时 使 用 hebap 表 .<br />

反 量 化 前 , 先 要 根 据 每 个 bap 值<br />

选 择 反 量 化 模 块 ( 如 图 ).<br />

EAC3 使 用 了 VQ 和 GAQ 的 方 法<br />

对 频 域 谱 线 进 行 量 化 . 当 使 用 VQ 进<br />

行 量 化 时 6 个 交 叉 块 的 mantissa 数<br />

据 组 成 一 个 矢 量 , 统 一 分 配 量 化 . 解<br />

码 时 从 码 流 中 获 得 vq 索 引 后 查 表<br />

可 得 6 个 频 域 谱 线 .


GAQ 原 理 :<br />

每 个 DCT 块 中 , 频 率 高 出 现 的 数 字 使 用 增 益 放 大 并 用 短 码 字 传 输 。<br />

频 率 出 现 低 的 系 数 不 使 用 增 益 放 大 , 但 用 长 码 字 传 输 。 每 个 DCT 块<br />

一 个 Gain 系 数 , 编 码 器 可 以 一 帧 一 帧 的 调 整 频 率 统 计 表 , 所 以 要 用<br />

一 个 模 式 选 择 标 识 用 定 长 码 在 码 流 中 传 输 。


Enhance Channel Coupling 模 块<br />

EAC3 改 进 了 耦 合 处 理 模 块 提 高 立 体 声 编 码 的 效 率 . 当 使 用 该 单 元 解 码 时 , 首 先 对 输 入 的<br />

源 频 域 数 据 进 行 处 理 , 计 算 耦 合 通 道 的 频 谱 数 据 , 再 计 算 振 幅 参 数 和 角 度 参 数 . 最 后 把 2<br />

个 参 数 应 用 到 生 成 的 频 谱 数 据 中 即 可 得 耦 合 通 道 的 完 整 频 谱 系 数 .ECC 模 块 也 要 对 频<br />

域 系 数 进 行 分 组 , 从 13 到 252 每 6 或 12 个 数 据 为 一 个 子 带 , 共 22 个 子 带 .<br />

码 流 信 息 与 源 通 道 数 据<br />

振 幅 参 数 处 理<br />

混 沌 参 数 处 理<br />

角 度 参 数 处 理<br />

源 声 道<br />

残 差 谱 线 处 理<br />

耦 合 声 道 生 成<br />

耦 合 通 道 残 差<br />

谱 线


源 通 道 残 差 数 据 处 理 单 元 由 4 步 组 成 :<br />

step1: 对 前 一 个 块 , 当 前 块 和 下 一 个 块 的 增<br />

强 耦 合 系 数 分 别 进 行 IMDCT 变 换 和<br />

dewindow。 如 前 一 个 块 没 有 使 用 增 强<br />

耦 合 , 则 前 一 个 块 的 系 数 为 0.<br />

step2: 执 行 交 叠 加 处 理 。 对 前 一 个 块 的 后 半<br />

块 数 据 和 下 一 个 块 的 前 半 块 数 据 和 到 一<br />

起 和 当 前 块 的 数 据 相 加 。<br />

step3: 后 处 理 , 余 弦 调 整 。 产 生 复 数 域 数 据 。<br />

step4: 在 复 数 域 上 执 行 DFT 变 换 。<br />

前 一 块<br />

+<br />

当 前 块<br />

后 一 块<br />

Step2:WOA<br />

step3<br />

Step4:DFT


参 数 计 算<br />

这 部 分 包 括 三 个 参 数 的 计 算 , 振<br />

幅 参 数 , 角 度 参 数 和 chaos 参 数 .<br />

码 流 解 析<br />

查 表 获 得<br />

振 幅 参 数<br />

查 表 解 码<br />

Chaos 参 数<br />

查 表 解 码<br />

角 度 参 数<br />

振 幅 参 数<br />

调 整<br />

内 插 调 整<br />

振 幅 参 数<br />

amp[ch][bin]<br />

随 机 数 产 生<br />

角 度 参 数<br />

调 整<br />

角 度 参 数<br />

rangle[ch][bin]


耦 合 声 道 变 换 系 数 产 生<br />

1. 重 构 频 域 数 据<br />

2. 系 数 转 换


Spectral Extension<br />

Processing<br />

EAC3 的 谱 扩 展 技 术 是 一 种<br />

类 似 HE-AAC 中 SBR 的 一 种<br />

技 术 . 作 用 都 是 通 过 从 低 频<br />

带 复 制 高 频 带 数 据 , 再 对 复<br />

制 频 带 进 行 调 中 以 在 码 流 中<br />

不 传 输 高 频 带 数 据 , 提 高 编<br />

码 效 率 .<br />

SE 模 块 把 谱 线 数 据 从 第 25 个<br />

数 据 到 第 228 个 数 据 分 成 17<br />

个 子 带 , 每 个 子 带 12 个 系 数 .<br />

对 使 用 耦 合 处 理 的 频 带 采 用<br />

坐 标 从 37 到 228 的 谱 线 范 围 .<br />

分 成 16 个 子 带 , 每 个 子 带 12<br />

个 数 据 .<br />

Transform Coefficient<br />

Translation<br />

Transform Coefficient<br />

Band Border Filtering<br />

参 数 与 低 频 数 据<br />

Banded RMS Energy<br />

Calculation<br />

Noise Scaling and<br />

Transform Coefficient<br />

Blending Calculation<br />

Blended Transform<br />

Coefficient Scaling<br />

频 带 数 据<br />

Blending Factor<br />

Calculation<br />

Spectral Extension<br />

Coordinate Format<br />

SE 技 术 分 为 谱 线 复 制 , 谱 线 调<br />

整 两 模 块 .


谱 线 复 制<br />

SE 的 谱 线 复 制 是 从 码 流 中 解 析 出 每 个 子<br />

带 的 源 复 制 开 始 位 置 , 源 复 制 结 束 位 置<br />

和 目 标 插 入 开 始 位 置 3 个 参 数 . 每 个 块<br />

内 的 所 有 子 带 这 三 个 参 数 相 同 . 然 后 按<br />

照 顺 序 把 谱 线 从 源 地 址 复 制 插 入 目 的<br />

地 址 区 .<br />

谱 线 调 整<br />

谱 线 调 整 包 括 边 界 滤 波 , 噪 声 混 合 和 振 幅<br />

调 整 .<br />

边 界 滤 波 是 针 对 复 制 边 界 或 wrap 产 生<br />

的 区 域 进 行 滤 波 . 使 用 5 阶 滤 波 器 中 间<br />

对 称 , 查 表 获 得 滤 波 器 系 数 .<br />

噪 声 混 合 在 子 带 RMS 能 量 计 算 , 噪 声 产<br />

生 和 噪 声 因 子 解 码 完 成 以 后 执 行 .<br />

振 幅 调 整 在 噪 声 调 整 之 后 计 算 出 的 频 谱<br />

系 数 乘 以 一 个 scale.<br />

fc fc* fscale nc*<br />

nscale


Pre-noise process<br />

PNP 是 一 种 减 少 pre-noise 持<br />

续 时 间 的 新 技 术 . 应 用 在 时 频<br />

变 换 之 后 , 真 的 时 域 数 据 进 行<br />

处 理 .<br />

TC1 = 256<br />

TC2 = 128


Pre-noise process


背 景 :<br />

DTS 是 “Digital Theatre System” 的 缩 写 , 是 “ 数 字 化 影 院 系 统 ” 的 意 思 ,<br />

DTS 总 公 司 位 于 美 国 加 州 的 洛 杉 矾 。DTS 采 用 CAC(Coherent Acoustics<br />

Coding, 相 干 声 学 编 码 ) 方 式 工 作 , 和 Dolby Digital 一 样 也 属 于 利 用 心 理<br />

声 学 原 理 来 对 声 轨 进 行 编 码 的 有 损 的 数 字 压 缩 技 术 。<br />

技 术 指 标 :<br />

采 样 率 :8,16,32,11.025,22.05,44.1,12,24,48khz,96khz,192khz,<br />

比 特 率 :32~3840kbps<br />

通 道 数 :6 通 道


DTS 技 术 特 点<br />

MS+IS<br />

QMF<br />

SQ/VQ<br />

Prediction<br />

Huffman Coding/Block<br />

Coding<br />

DTS 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Huffman 解 码<br />

反 量 化<br />

ADPCM<br />

Intensity<br />

<br />

DTS-HD<br />

unknown<br />

MS 解 码<br />

Filterbank<br />

输 出 PCM 数 据


比 特 解 码 与 谱 线 重 建<br />

DTS 的 谱 线 解 码 可 以 使 用 huffman 编 码 算 法 或 是 Block 编 码 算 法 . 如 果 码 流 使<br />

用 块 编 码 , 解 码 时 从 码 流 得 到 当 前 帧 使 用 那 种 块 解 码 模 式 . 按 照 模 式 解 码 . 解 码<br />

方 法 有 2 种 . 一 次 解 码 出 4 个 量 化 谱 线 数 据 .<br />

例 :<br />

方 法 1: 商 解 法<br />

方 法 2: 差 解 法


Q 模 块<br />

DTS 的 量 化 模 块 有 2 中 编 码 方 法 , 对 低 频 数 据 和 scale factor 使 用 标 量 量 化 方 法 , 对 高 频 数 据 可 以<br />

选 择 使 用 矢 量 量 化 .<br />

当 使 用 标 量 量 化 时 :<br />

首 先 要 从 码 流 中 解 析 scale factor, 经 过 差 分 huffman 或 是 差 分 线 性 解 码 的 scale factor 再 经<br />

过 逆 开 方 量 化 表 查 表 出 得 数 据 . 其 次 解 码 出 quant_step 数 据 . quant_step 使 用 huffman 解 码 或 是<br />

线 性 解 码 解 出 . 再 解 码 出 scale 调 整 参 数 re_adj[ch]. 最 后 由 下 面 公 式 重 构 量 化 谱 线 .<br />

其 中 每 通 道 每 子 带 的 scale_factor 每 帧 更 新 一 次 . 而 quant_step 每 个 子 帧 更 新 一 次 .<br />

当 使 用 矢 量 量 化 时 :<br />

从 码 流 中 解 析 出 矢 量 索 引 , 查 表 后 乘 以 scale_factor 可 得 反 量 化 数 据 .<br />

标 量 反 量 化 公 式<br />

iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* quat _ step[ ch][ sub]* scale _ factor[ ch][ sub]* re _ adj[ ch]<br />

矢 量 反 量 化 公 式<br />

iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* scale _ factor[ ch][ sub]


ADPCM<br />

如 果 码 流 中 信 息 位 PMODE 为 1 表 示 DTS 使 用 了 4<br />

阶 前 向 预 测 器 . 从 码 流 中 解 析 出 4 个 预 测 系 数 , 按 照<br />

下 列 公 式 计 算 .<br />

3<br />

sample coeff<br />

[ n]* iquant _ sample[ ch][ sub][ n]<br />

n0


Stereo Process<br />

DTS 的 立 体 声 处 理 上 也 使 用 了<br />

MS 技 术 和 IS 技 术 .<br />

方 法 类 MP3.<br />

• QMF<br />

DTS 使 用 类 似 MPEG1/2 filterbank 的 QMF 滤 波 器 处 理 时 频 数 据 . 解<br />

码 时 , 通 过 QMF 综 合 滤 波 器 组 后 要 加 窗 和 累 加 . 而 与 MPEG1/2 不 同 的<br />

是 ,DTS 使 用 32 个 子 带 , 每 个 子 带 32 个 数 据 . 转 换 函 数 也 不 同 . 窗 函 数 也<br />

不 同 ,DTS 提 供 2 种 窗 函 数 .<br />

k<br />

k<br />

a<br />

cos( k<br />

)*sin( )*sin( )<br />

2 4<br />

(2i33)(2k1)<br />

<br />

M[ i][ k] 0.5* a*cos( )<br />

128


DTS-HD 是 一 套 相 关 声 学 音 频 编 码 系 统 , 包 含 原 先 的 DTS 数 字 环 绕 声 ,<br />

DTS-ES 和 DTS 96/24, 也 加 有 无 损 压 缩 技 术 。 但 它 具 有 更 高 的 互 换 性<br />

和 扩 张 性 , 除 了 兼 顾 更 高 音 质 、 更 多 声 道 外 , 还 能 兼 容 网 络 下 载 内<br />

容 的 互 动 性 。 取 样 频 率 和 声 道 选 取 也 更 加 灵 活 。 但 依 然 保 持 了 压 缩<br />

比 例 比 DD+ 小 的 特 点 , 故 声 音 信 息 损 失 少 、 细 节 更 为 丰 富 。<br />

<br />

<br />

<br />

采 样 率 8-192kHz(16/24bit)。<br />

声 道 数 :7.1~32 声 道<br />

码 率 : 可 以 达 到 1.5MBPS 以 上


背 景 :<br />

AVS 音 频 标 准 是 AVS 标 准 族 的 一 个 部 分 , 文 档 编 号 是 AVS-P3.AVS 音 频 标<br />

准 出 来 采 用 了 三 星 的 CBC 熵 编 码 技 术 和 芯 晟 的 PQ-SPSC 立 体 声 处 理 技 术 外 ,<br />

其 余 技 术 全 部 使 用 了 EVD 音 频 标 准 的 内 容 , 包 括 FLPVQ,2 级 MDCT 分 析 等 .<br />

技 术 指 标 :<br />

采 样 率 :8kHz-96kHz<br />

码 率 :16kbps-96kbps/ 声<br />

道<br />

声 道 : 支 持 32 个 主 声 道 、8<br />

个 低 频 增 强 声 道


• AVSA 技 术 特 点<br />

PQ-SPSC<br />

MDCT(2 级 )<br />

SQ<br />

上 下 文 位 平 面<br />

解 码<br />

后 量 化 方 极 坐 标<br />

立 体 声 解 码<br />

Bit Slice huffman Coding<br />

FLPVQ<br />

AVS Audio 编 码 音 频 流<br />

比 特 流<br />

去 格 式<br />

化 器<br />

反 量 化<br />

多 分 辨 率 综 合<br />

逆 频 域 线 性 预 测<br />

及 矢 量 量 化<br />

反 向 MDCT 变 换<br />

输 出 时 间 信 号


CBC<br />

三 星 提 出 的 CBC 熵 编 码 算 法 实 际 熵 是 采 用 了 他 们 自 己 在 BSAC 种 的 熵 编<br />

码 技 术 , 但 是 使 用 huffman 编 码 方 法 替 代 了 算 术 编 码 方 法 . 其 余 编 码 原 理 和<br />

BSAC 技 术 几 乎 完 全 一 致 .<br />

上 下 文 位 平 面 无 损 解 码 是 根 据 输 出 速 率 或 接 收 到 的 比 特 流 的 截 断 情 况 ,<br />

使 用 全 部 的 子 解 码 器 或 部 分 的 子 解 码 器 , 如 图 所 示 。 在 各 子 解 码 器 中 , 各 比 特<br />

层 矢 量 从 最 高 比 特 位 到 最 低 比 特 位 , 从 低 频 带 到 高 频 带 逐 级 解 码 。


CBC 解 码 与 谱 线 分 析<br />

利 用 上 下 文 信 息 的 比 特 层 熵 编 码 。<br />

‣ 编 码 带 : 上 下 文 位 平 面 编 码 的 一 个 基 本 编 码 单 元 , 每 个 编 码 带 包 含 32 个 频 谱 系 数 。<br />

‣ 编 码 子 层 : 每 个 子 层 包 含 一 个 或 多 个 上 下 文 位 平 面 编 码 的 编 码 带 。<br />

‣ 基 本 层 : 是 上 下 文 位 平 面 编 码 中 信 号 最 低 质 量 的 编 码 层 , 每 帧 包 含 一 个 基 本 层 , 一 个 基<br />

本 层 包 含 若 干 个 子 层 。<br />

‣ 增 强 层 : 是 上 下 文 位 平 面 编 码 中 用 来 增 强 基 本 层 质 量 的 编 码 层 , 每 帧 根 据 目 标 编 码 速 率<br />

包 含 若 干 个 子 层 。<br />

‣ 编 码 位 平 面 矢 量 : 每 个 位 平 面 编 码 矢 量 包 含 4 个 比 特 , 来 自 于 相 邻 的 4 个 频 谱 系 数 , 进 行 哈<br />

夫 曼 编 码 。


Stereo Process<br />

PQ-SPSC(Post-quatization Square Polar Stereo Coding)<br />

利 用 量 化 频 谱 中 声 道 对 间 的 相 关 性 在 给 定 音 质 下 降 低 码 率 , 或 在 给 定 的 码 率 下 提 高 音 质 。 通<br />

常 声 道 对 的 布 局 是 左 声 道 / 右 声 道 , 或 者 左 环 绕 / 右 环 绕 。PQ-SPSC 的 应 用 是 以 比 例 因 子 带 为 最 小<br />

单 位 的 。 也 就 是 说 对 某 一 比 例 因 子 带 中 的 所 有 量 化 后 MDCT 频 谱 或 者 全 部 使 用 PQ-SPSC, 或 者 全<br />

部 不 使 用 PQ-SPSC。 这 样 做 是 为 了 减 少 边 信 息 。<br />

公 式 如 下 :


T 模 块<br />

AVSA 的 时 频 转 换 模 块 由 2 级 MDCT 构 成 . 每 级 MDCT 有 变 换 和 WOA 两 个 子 模 块 组 成 .<br />

在 进 行 16 点 IMDCT 之 前 还 要 进 行 谱 线 重 排 .AVS 没 有 长 短 窗 分 析 , 编 码 时 先 进 行 2048<br />

点 的 MDCT 变 换 , 对 瞬 态 信 号 再 进 行 一 次 128 个 MDCT 变 换 (16 个 输 入 ,8 个 输 出 )。<br />

解 码 时 , 是 一 个 反 过 程 , 对 瞬 态 信 号 要 先 进 行 128 个 IMDCT 变 换 (8 个 输 入 ,16 个 输<br />

出 )。 再 进 行 2048 点 的 IMDCT. 对 稳 态 信 号 只 进 行 一 次 2048 点 的 IMDCT 信 号 即 可 . 每<br />

级 IMDCT 之 后 都 还 有 加 窗 和 交 叠 加 处 理 .<br />

处 理 过 程<br />

瞬 态 信 号<br />

标 志 和 谱<br />

线 输 入<br />

稳 态 信 号<br />

标 志 和 谱<br />

线 输 入<br />

谱 线<br />

重 排<br />

16 点<br />

IMDCT<br />

加 窗<br />

交 叠<br />

加<br />

2048 点<br />

IMDCT<br />

加 窗<br />

交 叠<br />

加<br />

时 域 PCM<br />

信 号<br />

IMDCT 公 式<br />

N<br />

1<br />

2<br />

2 2<br />

1 <br />

xin<br />

,<br />

spec[ i][ k]*cos n n0 k , 0 n N, n0<br />

N<br />

/ 2 1<br />

2<br />

N<br />

<br />

k0<br />

N<br />

2


FLPVQ<br />

在 编 码 端 , 对 滤 波 器 组 的<br />

输 出 系 数 , 按 照 一 定 的 增 益 阈<br />

值 进 行 线 性 预 测 , 如 果 增 益 阈<br />

值 满 足 给 定 的 条 件 , 则 用 线 性<br />

预 测 滤 波 器 对 频 域 系 数 预 测 分<br />

析 , 预 测 滤 波 器 的 参 数 采 用 分<br />

级 分 裂 矢 量 量 化 。 在 解 码 端 ,<br />

从 码 流 中 解 码 得 到 的 是 预 测 器<br />

系 数 量 化 后 的 码 书 索 引 。 起 始<br />

预 测 频 率 为 1875Hz 到 max_sfb。<br />

线 性 预 测 合 成 滤 波 器 的 传 递 函<br />

数 定 义 为 :<br />

1<br />

Aˆ(<br />

z)<br />

<br />

1<br />

<br />

i1<br />

解 码 LSP 参 数 LSP to LPC 频 域 滤 波<br />

P<br />

1<br />

a ˆ z i<br />

i


f<br />

f<br />

<br />

1<br />

1<br />

2<br />

1<br />

( z)<br />

(1 z ) (1 2q i<br />

z z )<br />

i1,3,..,<br />

P1<br />

<br />

1<br />

1<br />

2<br />

2<br />

( z)<br />

(1 z ) (1 2q i<br />

z z )<br />

i2,4,..,<br />

P<br />

1 st lsf1 lsf2 lsf3 lsf4 lsf5 lsf6<br />

2 nd lsf7 lsf8 lsf9 lsf10 lsf11 lsf12<br />

3 nd dlsf1 dlsf2 dlsf3 dlsf4 dlsf5 dlsf6<br />

4 th dlsf7 dlsf8 dlsf9 dlsf1<br />

0<br />

dlsf1<br />

1<br />

dlsf1<br />

2<br />

for (i = 1; i = 1; j--)<br />

curr_f[j] = prev_f[j] - 2*lsp[2*i-1-1] * prev_f[j-1] + prev_f[j-<br />

2];<br />

for(kk=0;kk


背 景 :<br />

DRA 是 由 广 晟 数 码 开 发 的 多 声 道 音 频 编 码 标 准 . 被 收 录 成 为 国 家 标 准 .<br />

技 术 指 标 :<br />

采 样 率<br />

码 率<br />

通 道 数<br />

:8~192khz<br />

:32~2304kbps<br />

:64+3 个 通 道


DRA 技 术 特 点<br />

Huffman 解 码<br />

IS + MS<br />

MDCT<br />

反 量 化<br />

SQ<br />

Huffman Coding<br />

DRA 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Rescaling<br />

M/S 解 码<br />

Intensity 解 码<br />

交 叉 重 组<br />

IMDCT<br />

输 出 PCM 数 据


时 频 转 换 模 块<br />

DRA 的 时 频 变 换 模 块 是 使 用 了 和 AAC 一 样 的 MDCT 变 换 进 行 时 频<br />

分 析 . 窗 长 是 128 或 1024 个 数 据 . 解 码 时 经 过 变 换 后 也 要 通 过 加 窗 和 交<br />

叠 加 (WOA). 使 用 正 弦 窗 , 比 较 有 特 点 是 使 用 了 13 种 窗 形 状 .<br />

变 换 公 式


WOA<br />

DRA 的 基 本 窗 是 正 弦 窗 . 但 是 灵 活 的 扩 展 了<br />

13 种 窗 形 , 以 便 于 更 好 的 描 述 信 号 类 型 .DRA<br />

的 交 叠 加 和 MP3,AAC 完 全 一 样 . 当 前 帧 的 前<br />

半 部 分 数 据 和 前 一 帧 的 后 半 部 分 相 加 .<br />

WIN_LONG_LONG2LONG<br />

WIN_LONG_LONG2SHORT<br />

WIN_LONG_LONG2BRIEF<br />

WIN_LONG_SHORT2SHORT<br />

WIN_LONG_BRIEF2BRIEF<br />

WIN_LONG_SHORT2BRIEF<br />

WIN_SHORT_SHORT2SHORT<br />

WIN_SHORT_BRIEF2BRIEF<br />

WIN_SHORT_SHORT2BRIEF


Stereo Process<br />

‣ 联 合 强 度 编 码<br />

结 合 起 始 IS 执 行 频 带 参 数 进 行 IS 解 码<br />

公 式 :<br />

联 合 声 道 样 本 = 比 例 因 子 * 源 声 道 样 本 .<br />

‣ 和 差 编 码<br />

灵 活 ,3 级 判 定<br />

位 置 获 取<br />

公 式 :<br />

左 声 道 = 和 声 道 + 差 声 道<br />

右 声 道 = 和 声 道 - 差 声 道


• 支 持 音 频 流 技 术<br />

• 压 缩 比 可 以 达 到 1∶18 左 右<br />

• 96Kbps 的 WMA 音 质 = 128Kbps 的<br />

MP3 音 质<br />

• 低 码 率 时 压 缩 比 和 音 质 优 于 MP3<br />

<br />

<br />

WMA7/8<br />

IS+ MS<br />

MDCT<br />

SQ/VQ<br />

Huffman Coding<br />

LSF<br />

WMA9 and WMA pro<br />

Unknown<br />

WMA7/8 比 特<br />

流 输 入<br />

Bitstream<br />

deformatter<br />

Huffman 解 码<br />

反 量 化<br />

MS 解 码<br />

IMDCT<br />

输 出 PCM 数 据


Cook 的 技 术 特 点<br />

Couple<br />

MLT<br />

SQ<br />

huffman coding<br />

noise fill<br />

Huffman 解 码 获 得<br />

vector_index<br />

Demuxer<br />

解 码 RMS 值<br />

噪 声 插 入<br />

反 量 化 和<br />

RMS 加 权<br />

IMLT<br />

内 插<br />

Cook decoder


Inverse Modulated Lapped Transform (IMLT)<br />

IMDCT 操 作 320 频 域 系 数 产 生 320 个 时 域 音 频 数 据 .IMLT 能 分 解 成 类 型 4 的 DCT<br />

变 换 . 在 IMLT 之 后 也 有 加 窗 和 交 叠 加 .<br />

IMLT<br />

Type IV DCT<br />

窗 函 数


QDM2 是 应 用 在 quicktime4 内 的 编 码 器 , 可 以 应 用 与 适 应 quicktime 流 媒 体<br />

的 网 络 点 播 和 下 载 中 .<br />

技 术 特 点 :<br />

IS<br />

FFT,PQMF<br />

SQ,<br />

huffman coding<br />

Demux<br />

Spectral decode<br />

Method decode<br />

Tone decode<br />

Stereo Process<br />

IDFT<br />

Filterbank


Sub Packet 0<br />

Sub packet<br />

Sub Packet 1<br />

Sub Packet 2<br />

Subband 0 Subband 1 ... Subband n<br />

Sub Packet 3<br />

Subband<br />

frame<br />

Sub Packet 4<br />

通 道 0 通 道 1 ... 通 道 n<br />

Sub Packet 5<br />

通 道<br />

谱 线 0 谱 线 1 谱 线 2 谱 线 3 谱 线 4 谱 线 7<br />

Sub Packet 15


背 景 :<br />

Ogg Vorbis 是 近 年 来 由 Xiph.Org Foundation 开 发 的 通 用 感 觉 音 频 编 码 器 ,<br />

其 特 点 是 : 源 码 完 全 开 放 、 无 专 利 限 制 , 具 有 较 大 编 码 灵 活 性 。 在 高 质 量<br />

( 高 比 特 率 ) 级 别 (CD 或 DAT 立 体 声 ,16/24 比 特 量 化 ), 与 现 在 的<br />

MPEG-2 和 MPEG-4 等 音 频 算 法 相 当 ;Ogg Vorbis 编 码 器 在 没 有 重 新 采 样 到<br />

低 采 样 率 情 况 下 , 可 以 将 CD 高 质 量 立 体 声 信 号 压 缩 到 低 于 48kbps 比 特 率 。<br />

技 术 指 标 :<br />

比 特 率 :16 到 128kb/s/ch ;<br />

采 样 率 8kHz-192kHz;<br />

声 道 数 : 单 声 道 、 立 体 声 、4 声 道 、5.1, 最 高 可 支 持 255 独 立 声 道 。


Vorbis<br />

Coupling<br />

MDCT<br />

SQ+VQ<br />

LSP<br />

Huffman Coding<br />

Residue decode<br />

Demuxer<br />

Floor<br />

reconstruction<br />

Compute<br />

Spectral curve<br />

Channel<br />

Uncoupling<br />

IMDCT


频 谱 包 络 分 析<br />

这 是 Ogg Vorbis 编 码 算 法 的 核 心 部 分 , 可 以 使 用 两 种 分 析 方 法 :<br />

Vorbis 基 底 类 型 0, 以 线 谱 对 LSP( 也 被 称 为 线 谱 频 率 LSF) 参 数 来 表 示 编 码<br />

平 滑 的 频 谱 包 络 曲 线 ,LSP 表 示 可 以 与 LPC 表 示 相 互 转 换 。Vorbis 基 底 类 型 1<br />

使 用 分 段 直 线 表 示 来 编 码 频 谱 包 络 曲 线 , 并 基 于 线 性 频 率 轴 和 对 数 (dB)<br />

幅 度 轴 画 出 曲 线 。 在 编 解 码 中 , 两 者 在 语 义 上 是 可 以 互 换 的 , 但 基 底 类 型 1<br />

提 供 了 更 稳 定 的 帧 间 特 性 , 因 此 在 所 有 耦 合 立 体 声 和 高 比 特 率 模 式 下 是 较 好<br />

的 选 择 , 并 且 与 基 底 0 相 比 其 解 码 更 加 简 单 。 在 基 底 1 算 法 中 , 对 短 块 使 用 11<br />

个 点 线 性 (10 折 线 ) 逼 进 频 谱 函 数 包 络 , 而 长 块 使 用 33 个 点 线 性 逼 进 , 且 两<br />

种 情 况 的 算 法 完 全 相 同 .


Vorbis 基 底 类 型 1 是 以 线 性 分 段 逼 近 方<br />

式 实 现 频 谱 包 络 曲 线 的 表 示 。 以 n=128 的 基<br />

底 采 样 为 例 , 对 各 个 分 段 点 的 频 率 (X 坐 标 )<br />

和 幅 度 (Y 坐 标 ) 分 别 进 行 一 系 列 编 码 得 到 压<br />

缩 的 比 特 流 , 在 解 码 端 , 首 先 从 码 流 中 解 码<br />

出 X 坐 标 值 。 这 些 坐 标 值 在 编 码 时 是 以 交 织<br />

方 式 编 码 的 , 如 假 设 编 码 时 频 率 坐 标 ( 即 X 坐<br />

标 ) 序 列 为 :0,16,32,48,64,80,96,112,128( 与<br />

实 际 不 符 , 仅 用 作 举 例 说 明 ), 则 在 对 X 坐 标<br />

值 编 码 时 按 照 规 律 交 织 为 :0, 128, 64, 32, 96,<br />

16, 48, 80, 112。 头 两 个 序 列 为 起 始 坐 标 和<br />

终 止 坐 标 , 其 后 依 次 分 段 去 点 . 假 定 X 序 列 0,<br />

128, 64, 32, 96, 16, 48, 80, 112。 对 应 的 Y<br />

值 序 列 分 别 为 :110, 20, -5, -45, 0, 30, -10。<br />

根 据 X 序 列 , 解 码 时 首 先 解 码 起 始 坐 标 0 和 终<br />

止 坐 标 128 对 应 的 幅 度 值 , 即 110, 20. 然 后 两<br />

点 确 定 一 条 直 线 ; 之 后 解 码 的 Y 值 对 应 与 X 序<br />

列 坐 标 的 第 三 个 , 即 64, 通 过 这 个 X 值 可 以 预<br />

测 其 在 已 确 定 的 线 段 中 对 应 的 幅 度 值 。 这 个<br />

预 测 值 并 非 编 码 原 值 , 在 此 基 础 上 , 我 们 从<br />

码 流 中 继 续 解 码 一 个 Y 值 , 这 个 值 是 一 个 差<br />

值 , 如 一 5。 利 用 预 测 值 和 差 值 可 以 确 定 真<br />

实 的 对 应 于 X 序 列 64 的 幅 度 值 Y=60.<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

65<br />

-5<br />

16 32 48 64 80 96 112 128<br />

16 32 48 64 80 96 112 128


声 道 耦 合 技 术<br />

正 方 形 极 坐 标 耦 合<br />

声 道 交 织 耦 合


时 频 变 换 模 块<br />

Ogg Vorbis 采 用 的 MDCT 变 换 类 似 于 MPEG-2 AAC 中 变 换 , 包 括 2 种 块 长 和 4 种 窗 型 。 对 于 通 常 的<br />

稳 态 信 号 , 为 获 得 编 码 效 率 , 变 换 长 度 从 64 到 4096 广 泛 使 用 , 但 通 常 采 用 长 度 M=2048, 而 对 于 频<br />

谱 变 化 迅 速 的 突 发 信 号 , 为 了 减 小 量 化 失 真 扩 散 的 “ 预 回 声 ” 失 真 , 切 换 到 M=256 的 短 块 MDCT。<br />

对 于 长 、 短 块 相 邻 时 的 长 块 MDCT 变 换 ,w(k) 则 改 为 采 用 起 始 窗 和 终 止 窗 来 保 证 长 窗 与 短 窗 之 间<br />

的 平 稳 过 渡 。Vorbis 编 码 中 采 用 了 一 种 新 颖 的 基 本 窗 函 数 , 公 式 如 下 .<br />

w(<br />

k)<br />

<br />

2 (<br />

k <br />

sin(sin (<br />

M<br />

for k 0,1,..., M 1<br />

0.5)<br />

)*<br />

<br />

)<br />

2


需 求 分 析<br />

技 术 分 析<br />

对 信 源 编 码 EQTP 技 术 以 及 S(tereo) 处 理 技 术<br />

的 灵 活 应 用 .<br />

发 展 趋 势<br />

面 向 存 储 : 趋 于 无 损 , 多 通 道<br />

面 向 传 输 : 区 域 深 度 挖 掘 人 耳 特 性


各 种 高 清 芯 片 中 的 音 频 部 分<br />

芯 片 代 号 支 持 的 音 频 标 准 实 现 方 式 芯 片 厂 商<br />

STi7200 Add WMA9,WMA9 pro,(7100 未 写 ) 双 ST231 400 ST<br />

BCM740x<br />

MPEG1 AUDIO,AAC LC,AC3,<br />

EAC3,HE-AACv1,WMA,WMA pro<br />

未 知<br />

Broadcom<br />

CX24501<br />

MPEG1/2 AUIDO,MPEG2/4 AAC,<br />

AC3,EAC3,HE-AACv1,WMA,<br />

WMApro,<br />

ARM11<br />

Conexant<br />

STB225<br />

DSP based, supports MPEG-1 layer<br />

1&2, MP3 ,MPEG-4 AAC ,Dolby<br />

Digital AC-3, AAC-HE, WMA,<br />

MIPS32<br />

NXP<br />

SMP863x<br />

Audio DSP supports wide variety of<br />

audio codecs<br />

8630 的 应 用 中 提 到 MPEG1/2 AUDIO,<br />

AC3, MPEG2/4 AAC,WMA<br />

Sigma Design<br />

ZR39150<br />

MPEG AUDIO,<br />

Zoran<br />

AC3,WMA 等<br />

STi7100 All Popular audio codec ST231 ST


各 种 系 统 中 的 音 频 部 分<br />

DTV 系 统<br />

ATSC<br />

DVB<br />

ISDB<br />

DMB-TH<br />

IPTV 系 统<br />

ITU<br />

DVB over IP<br />

ISMA<br />

Stream Media 系 统<br />

Windows Media<br />

音 频 部 分<br />

AC3/EAC3<br />

MPEG1/2 AUDIO,MPEG4 AAC,AC3/EAC3,HE-AACv1v2,DTS<br />

MPEG1/2 AUDIO 其 他 不 详<br />

DRA<br />

音 频 部 分<br />

MPEG1/2 AUDIO.MPEG2/4 AAC,HE-AACv1/v2,AC3,EAC3,AVS-P3 audio,<br />

DTS<br />

备 选 WMA<br />

HE-AACv2,AC3,EAC3 , AMR-WB+,<br />

MPEG2/4 AAC,HE-AACv1/v2<br />

音 频 部 分<br />

Windows Media Audio Codec<br />

Real Media Real Audio Codec ( AAC or Cook )<br />

Quicktime Media<br />

Quicktime Audio Codec (AAC or QDM)


各 种 系 统 中 的 音 频 部 分<br />

其 他 系 统<br />

ABS-S<br />

DVB-S/DVB-S2<br />

MDTV 系 统<br />

DVB-H<br />

MediaFlo<br />

DAB/DAB+/DAB-IP<br />

T-DMB<br />

S-DMB<br />

CMMB<br />

DRA<br />

多 种<br />

音 频 部 分<br />

AC3/EAC3<br />

AAC<br />

HE-AACv2,AC3,EAC3, AMR-WB+<br />

BSAC<br />

BSAC<br />

DRA


音 频 编 码 是 信 源 压 缩 与 人 类 听 觉 感 知 相 关 知 识 应 用 的 交 集 。 在 利<br />

用 人 耳 建 模 的 基 础 上 充 分 挖 掘 人 耳 的 不 可 听 特 性 并 加 之 信 源 压 缩 的<br />

各 种 技 术 实 现 音 频 压 缩 编 码 的 目 的 。 概 括 起 来 所 有 的 音 频 编 码 系 统<br />

都 是 使 用 信 源 压 缩 的 熵 编 码 技 术 (E), 量 化 技 术 (Q), 变 换 技 术 (T) 和 预 测<br />

技 术 (P) 。 再 加 上 立 体 声 处 理 技 术 (S) 总 共 有 EQTPS 五 种 技 术 的 应 用 。<br />

以 下 针 对 上 面 介 绍 的 音 频 标 准 在 这 五 种 技 术 应 用 中 的 区 别 分 别 进 行<br />

分 析 。


熵 编 码 技 术 (E)<br />

音 频 压 缩 系 统 中 经 过 前 端 处 理 后 , 输 入 给 熵 编 码 模 块 的 数 据 主 要<br />

有 3 类 , 编 码 控 制 参 数 ,scalefactor 参 数 和 谱 线 残 差 信 号 . 在 应 用 熵 编 码<br />

技 术 对 这 三 类 信 号 进 行 编 码 时 . 常 用 的 编 码 方 法 是 huffman 编 码 技 术 ,<br />

其 次 是 算 术 编 码 和 其 他 编 码 技 术 .<br />

位 分 配 技 术 :MP1/2 L1/2,AC3,EAC3,DTS<br />

算 术 编 码 技 术 :BSAC<br />

huffman 编 码 技 术 : 其 他 所 有 标 准 和 DTS.<br />

在 对 谱 线 残 差 信 号 编 码 时 huffman 编 码 应 用 最 广 泛 . 而 且 一 般 在 应<br />

用 huffman 编 码 可 以 对 残 差 谱 线 数 据 进 行 分 组 , 分 组 的 方 式 各 不 相 同 .


量 化 技 术 (Q)<br />

量 化 可 以 分 为 标 量 量 化 技 术 和 矢 量 量 化 技 术 . 量 化 技 术 实<br />

际 上 是 一 种 超 越 函 数 映 射 技 术 , 在 各 种 音 频 标 准 都 有 应 用 .<br />

量 化 的 目 的 是 降 低 谱 线 动 态 范 围 . 实 现 方 法 多 以 查 表 法 实<br />

现 .<br />

标 量 量 化 技 术 :<br />

均 匀 量 化 :<br />

除 法 量 化 : 用 频 域 谱 线 的 量 化<br />

非 均 匀 量 化 :<br />

对 数 量 化 : 对 scalefactor 的<br />

量 化<br />

指 数 量 化 :<br />

正 弦 量 化 :TNS 系 数 的 量 化<br />

开 方 量 化 :DTS 中 scalefactor<br />

的 量 化<br />

矢 量 量 化 技 术 :<br />

矢 量 量 化 技 术 主 要 针 对 高 频 数 据 进 行<br />

量 化 .<br />

EAC3,DTS,WMA 中 对 高 频 数 据 进 行 矢 量<br />

量 化 .<br />

Vorbis 中 针 对 一 般 谱 线 数 据 应 用 矢 量<br />

量 化 .<br />

TwinVQ,AVSA 中 针 对 LSP 数 据 进 行 矢 量<br />

量 化 .


预 测 技 术 (P)<br />

预 测 技 术 的 应 用 : 广 泛 应 用 于 各 种 标 准 . 一 般 的 信 号 压 缩 都 会 使 用 差<br />

分 预 测 编 码 . 而 有 些 预 测 应 用 通 道 内 , 通 道 间 , 帧 内 , 帧 间 . 以 达 到 压 缩 数<br />

据 减 小 噪 声 的 目 的 .<br />

通 道 内 : 大 量<br />

通 道 间 :MPEG2 audio 中 的 预 测 技 术 使 用 通 道 间 预 测 减 小 多 通 道 数 据 .<br />

帧 间 : MPEG4 AAC LTP 技 术 ( 前 向 自 适 应 ) 和 MPEG2 AAC<br />

prediction 技 术 ( 后 向 自 适 应 ).<br />

帧 内 : MPEG2 AAC TNS 技 术 . 注 意 TNS 目 的 不 是 压 缩 数 据 而 是 是 降 低<br />

pre-echo 噪 声 .<br />

HE-AACv1 的 SBR 技 术 中 应 用 预 测 技 术 生 成 高 频 数 据 .<br />

TwinVQ 技 术 中 应 用 预 测 技 术 对 谱 线 进 LPC 分 析 .<br />

各 种 标 准 对 预 测 技 术 的 应 用 (doc).


变 换 技 术 (T)<br />

基 于 人 耳 的 带 通 特 性 , 人 们 开 始 使 用 FFT 和<br />

PQMF 进 行 带 通 分 析 , 后 来 逐 步 通 过 MDCT 进 行 取 代 . 主 要 问<br />

题 是 带 通 分 析 不 可 避 免 的 带 入 频 带 交 叠 误 差 . 这 也 是 频 带<br />

处 理 技 术 引 入 的 主 要 误 差 . 技 术 发 展 是 从 早 期 的 大 运 算 量<br />

的 FFT 和 PQMF 到 小 运 算 量 且 容 易 进 行 频 带 交 叠 误 差 处 理 的<br />

MDCT 技 术 .<br />

变 换 技 术 主 要 过 程<br />

加 窗 , 变 换 , 去 交 叠 处 理<br />

各 种 标 准 对 变 换 技 术 的 应 用 (doc).


面 向 存 储 和 以 太 网 :<br />

由 于 存 储 介 质 和 网 络 带 宽 的 发 展 , 单 位 容 量 的 成 本 越 来 越 低 , 如<br />

Blue-DVD 单 层 25GB。 所 以 面 向 存 储 的 音 频 向 着 无 损 和 多 通 道 的 方<br />

向 发 展 。WavPack, MPL, FLAC,TTA, APE, Dolby TrueHD 等 . 而 面 向<br />

高 清 音 频 标 准 诸 如 EAC3(DD+) 和 DTS-HD 对 音 频 的 压 缩 采 用 7.1 通<br />

道 ,8.1 通 道 甚 至 13.1 通 道 的 要 求 编 码 , 力 求 达 到 音 质 的 完 美 还 原 .<br />

• 面 向 传 输<br />

为 了 进 一 步 提 高 压 缩 率 , 研 究 者 逐 步 深 入 挖 掘 人 耳 的 特 性 , 从 早 期 的<br />

人 耳 带 通 滤 波 技 术 到 现 在 的 心 理 暗 示 自 动 补 偿 技 术 , 深 入 研 究 人 类 的 生<br />

理 特 性 个 信 号 的 参 数 特 性 并 利 用 这 些 特 性 提 高 压 缩 比 是 未 来 研 究 的 方<br />

向 .


Graphical User Interface<br />

Moto Audio Engine<br />

Application Programming Interface(API)<br />

Rate Control<br />

Codec Library<br />

Loudness Control<br />

Equalizer<br />

MP3<br />

eAAC/eAAC+<br />

AVSA<br />

AAC<br />

WMA/WMA<br />

pro<br />

DRA<br />

Sampling Rate Converter<br />

AC3/EAC3<br />

DTS/DTS-HD<br />

Channel Mixer<br />

Vorbis<br />

Others<br />

Other Audio Processing Function<br />

DRM<br />

Demuxer<br />

Hardware Integration Level


End

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!