H(z,n)
H(z,n)
H(z,n)
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
前 言<br />
第 一 部 分 : 基 本 原 理<br />
第 二 部 分 : 主 流 标 准<br />
第 三 部 分 : 技 术 分 析
音 频 编 码 的 分 类<br />
按 照 编 码 的 采 样 率 分<br />
‣ 语 音 编 码 ( 小 于 8khz)<br />
‣ 音 频 编 码 ( 大 于 8khz)<br />
按 照 编 码 的 方 法 分<br />
‣ 波 形 编 码 器<br />
‣ 感 知 编 码 器<br />
‣ 参 数 编 码 器
不 同 编 码 方 法 的 应 用<br />
波 形 编 码 器<br />
ADPCM, G.721, G.722, G.726 等<br />
特 点 : 基 于 ADPCM 编 码 . 简 单 预 测 编 码 器 .<br />
感 知 编 码 器<br />
mp2, AAC, WMA, ATRAC, AC3 等<br />
特 点 : 基 于 人 耳 建 模 , 属 于 变 换 编 码 器 . 编 码 内 核 基 于 T+SQ.<br />
应 用 : 大 于 8khz 的 音 频 编 码 .<br />
参 数 编 码 器<br />
G.723.1, G.729, G.728, CELP,AMR,EVRC 等<br />
特 点 : 基 于 人 口 建 模 , 属 于 预 测 编 码 器 . 编 码 内 核 基 于 P+VQ.<br />
应 用 : 小 于 8khz 的 语 音 编 码 .
人 耳 模 型<br />
人 耳 的 听 隔<br />
‣ sound pressure level (SPL)<br />
‣ Absolute Threshold of Hearing<br />
‣ Critical Bands<br />
‣ Simultaneous Masking<br />
‣ Non-simultaneous Masking<br />
‣ Perceptual Entropy
外 耳 中 耳 内 耳<br />
组 成 耳 翼 , 外 耳 道 , 鼓 膜 听 小 骨 半 规 管 , 前 庭 窗 , 耳 蜗<br />
作 用 1. 声 源 定 位 ,<br />
2. 放 大 20db,<br />
共 振 , 头 部 衍 射<br />
作 用 :<br />
1. 放 大 声 压 .<br />
2. 保 护 内 耳 .<br />
半 规 管 , 前 庭 窗 属 于 主 体 感 受 器 . 耳 蜗<br />
是 听 觉 受 纳 器 .<br />
基 底 膜 : 带 通 特 性
Absolute Threshold of Hearing: 一 个 纯 音 在 无 声 环 境 下 可 以 被 人 听 到 的 能 量 大 小
巴 克 谱<br />
巴 克 谱 是 根 据 人 耳<br />
的 带 通 特 性 总 结 出<br />
的 公 式 .
第 一 心 理 声 学 模 型<br />
step 1:FFT Analysis<br />
step 6:Calculation of<br />
individual masking thresholds<br />
step 2:Determination of the<br />
sound pressure level<br />
step 7:Calculation of the<br />
global masking threshold LTg<br />
step 3:Considering the<br />
threshold in quiet<br />
step 8:Determination of the<br />
minimum masking threshold<br />
step 4:Finding of tonal and<br />
non-tonal components<br />
step 9:Calculation of the<br />
signal-to-mask-ratio<br />
step 5:Decimation of tonal<br />
and non-tonal masking<br />
components
Pre-echo 的 产 生
PCM<br />
时 频 变 换 模 块<br />
其 他 处 理 模 块<br />
量 化 模 块<br />
无 损 解 码 模 块<br />
Bitstream<br />
心 理 声 学 模 型<br />
Bitstream<br />
无 损 解 码 模 块 量 化 模 块 其 他 处 理 模 块<br />
时 频 变 换 模 块<br />
PCM
MPEG1/2 AUDIO<br />
MPEG2/4 AAC<br />
MPEG4 AUDIO(1) TwinVQ, BSAC<br />
MPEG4 AUDIO(2) HE-AAC,HE-AACv2,<br />
AC3/EAC3,DTS/DTS-HD<br />
AVSA,DRA<br />
Vorbis,<br />
WMA and WMA pro<br />
Qdesign, Cook
背 景 :<br />
为 了 在 1.5Mbps 码 率 对 视 频 和 伴 音 进 行 高 质 量 压 缩 ,<br />
MPEG 于 1992 年 制 订 完 成 了 MPEG-1 标 准 ,MPEG-1 音 频<br />
编 解 码 标 准 分 为 三 层 , 复 杂 度 和 音 质 逐 层 提 高 ,MP3 即<br />
为 其 中 的 第 三 层 ,MPEG-1 layer3. 层 3 的 算 法 组 要 是 靠<br />
ASPEC 算 法 和 OCF 算 法 进 行 加 强 的 .<br />
技 术 指 标 :<br />
采 样 率 :32、44.1、48 kHz<br />
码 率 :32kbps-160kbps/ 声 道<br />
声 道 : 单 声 道 、 立 体 声
编 码 器 技 术 框 架<br />
层 1/ 层 2 编 码 器<br />
层 3 编 码 器
Layer 1 and 2 技 术 特 点<br />
IS+MS<br />
PQF<br />
SQ<br />
Bit Allocation<br />
Scalefactor 解 码<br />
Huffman 解 码<br />
反 量 化<br />
• Layer 3 技 术 特 点<br />
IS+PQF<br />
PQF+MDCT<br />
SQ<br />
Huffman Coding<br />
mp3 比 特<br />
流 输 入<br />
Header 解<br />
析 与 解 码<br />
bit stream<br />
格 式 info<br />
REORDER<br />
立 体 声 解 码<br />
Alias cancellation<br />
IMDCT<br />
分 析 子 带 滤 波 器<br />
输 出 PCM 数 据
Scalefactor<br />
Part2_length<br />
576 个 频 率 线 的 huffman 码 字<br />
子 区 0 子 区 1 子 区 2 1 or 0<br />
Big value<br />
Count1<br />
Part3_length<br />
Part2_3_length<br />
0000000<br />
Zero 区<br />
无 损 解 码 模 块<br />
层 1/2 采 用 定 长 位 分 配 指 示 方<br />
法 对 残 差 谱 线 进 行 编 码 . 解 码 时 , 通<br />
过 获 得 每 个 采 样 的 编 码 位 宽 , 依 次<br />
读 取 码 流 中 码 字 . 完 成 解 码 .L2 和 L1<br />
不 同 的 是 , 层 二 对 3 个 数 据 进 行 打 包<br />
处 理 , 每 3 个 残 差 谱 线 分 成 一 组 , 统<br />
一 编 码 . 而 L3 只 对 spectral 使 用 了<br />
huffman 编 码 的 方 法 对<br />
scalefactor 使 用 定 长 码 编 码 .
• 量 化 模 块<br />
MPEG1/2 Audio 编 码 端 通 过 在 每 个 子 带 中 取 一 个 scalerfactor, 并 始 每 个<br />
谱 线 都 除 以 scalefactor 减 小 谱 线 的 动 态 幅 值 范 围 , 降 低 量 化 噪 声 , 并 且 使 用<br />
非 均 匀 量 化 进 一 步 减 小 频 率 谱 线 的 幅 值 , 便 于 进 行 huffman 编 码 时 减 小 码 表 。<br />
所 以 解 码 中 反 量 化 模 块 由 2 级 组 成 , 一 级 残 差 谱 反 量 化 , 一 级 是 sfb 反 量 化 .<br />
反 量 化<br />
Scalefactor<br />
Demux<br />
反 量 化<br />
残 差 谱 线<br />
De-scale
量 化 公 式<br />
层 1<br />
s <br />
whe re,<br />
2nb<br />
2 nb 1 * s <br />
2nb1<br />
s <br />
s <br />
nb<br />
s factor * s <br />
<br />
<br />
is the fra ctional num ber ,<br />
is the re qua ntize d value , and<br />
is the number of bits alloca te d to sa mples in the subband .<br />
s C * s D<br />
whe re,<br />
<br />
s <br />
s <br />
层 2<br />
<br />
is the fra ctional num ber , and<br />
is the re qua ntize d value .<br />
层 3<br />
(1) long block:<br />
4<br />
xr i<br />
= signis i * is 3 2 i<br />
<br />
1<br />
4<br />
global _gain[gr] - 210 - 8subblock_ gain[window][gr] <br />
scalefac _ multiplier* scalefac _ s[gr][ch ][sfb ][window]<br />
2<br />
<br />
(2) short block:<br />
4 1<br />
global _ gain[gr]- 210<br />
xr i<br />
= signis i * is 3 i<br />
*2 4<br />
<br />
<br />
<br />
scalefac _ multiplier* scalefac _ l[sfb][ch ][gr] preflag [gr]pretab[sfb]<br />
2
立 体 声 处 理 模 块<br />
MS stereo and Intensity stereo<br />
MS 和 IS 应 用 范 围
MS 立 体 在 左 右 声 道 所 传 送 的 分 别 为 middle 和 side, 要 经 过 以 下<br />
的 公 式 才 能 重 建 出 左 右 声 道 :<br />
.<br />
L i M i S i<br />
2<br />
and R i M i S i<br />
2
人 类 听 觉 系 统 一 般 对 低 频 信 号 而 言 , 其 对 信 号 的 能 量 与 相 位 皆 较<br />
敏 感 , 相 对 于 在 高 频 信 号 , 人 耳 只 对 其 能 量 较 为 敏 感 , 而 相 位 较 不<br />
敏 感 。Intensity Stereo coding 就 是 利 用 此 一 人 耳 的 特 性 , 被 使 用<br />
在 高 频 区 域 里 。<br />
其 中 is_possb 在 scale factor 中 指 定
时 频 变 换 模 块<br />
层 1/2 的 T 模 块 由 PQMF 和 WOA (window-overlapadd)<br />
组 成 . 层 3 在 进 行 PQMF 之 前 还 要 有 IMDCT 和 WOA 子<br />
模 块 .
N 1<br />
N<br />
X<br />
k<br />
xicos( ( i )(2k<br />
1))<br />
N 4<br />
i0<br />
N /21<br />
N<br />
xi<br />
X<br />
k<br />
cos( ( i )(2k<br />
1))<br />
N 4<br />
k 0<br />
<br />
<br />
MPEG1/2 Audio 都 采 用 了 一 种<br />
PQMF 变 换 进 行 时 频 分 析 . 一 帧 数<br />
据 以 12 个 样 本 为 一 组 , 层 1 有 32 个<br />
组 , 层 2,3 有 36 个 样 本 为 一 组 . 编 码<br />
时 每 帧 数 据 加 窗 和 将 采 样 后 的 数<br />
据 的 进 入 32 个 滤 波 器 , 得 到 频 域 数<br />
据 . 解 码 时<br />
Filter Bank<br />
N = 32
N-1<br />
π 1 N<br />
X<br />
k= xicos( (i+ + )(2k+1))<br />
N 2 4<br />
i=0<br />
N/2-1<br />
π 1 N<br />
x<br />
i= Xkcos( (i+ + )(2k+1))<br />
N 2 4<br />
k=0<br />
<br />
(I)MDCT<br />
层 3 在 PQMF 基 础 上 增 加 了<br />
MDCT 来 提 高 频 率 分 辨 率 . 公 式<br />
如 下 . 而 且 针 对 稳 态 帧 和 瞬 态 帧<br />
层 3 使 用 不 同 的 分 析 长 度 .<br />
N=36 长 窗<br />
12 短 窗
WOA: de-windowed<br />
<br />
层 3 使 用 正 弦 窗 . 规 定 了 4 种 窗 型 分 别 是 开 始 , 结 束 , 长 窗 和 短 窗 .<br />
层 使 用 当 前 帧 的 前 半 帧 数 据 和 前 一 帧 的 后 半 帧 数 据 叠 加 消 除 频 域 混 叠 .( 如 图 )<br />
当 使 用 短 窗 时 ,3 个 短 窗 是 在 码 流 中 是 interlace 存 储 的 . 首 先 要 进 行 解 交 织 处 理 . 处 理 方 法 如 图 .<br />
a) block_type=0 (normal window)<br />
z i x i sin <br />
i 1 36 2<br />
for i= 0 to 35<br />
d) block_type=2 (short block)<br />
j y i <br />
j xi sin<br />
<br />
12 i 1 2<br />
<br />
for i = 0 to 11, j= 0 to 2<br />
b) block_type=1 (start block)<br />
<br />
for i= 0 to 17<br />
<br />
x i sin 36 i 1 <br />
2<br />
x z i i for i=18 to 23<br />
<br />
x i sin <br />
12<br />
i 18 1 2<br />
for i= 24 to 29<br />
<br />
0 for i= 30 to 35<br />
c) block_type=3 (stop block)<br />
0 for i= 0 to 5<br />
<br />
x i sin i 6 1 12<br />
2<br />
z i<br />
for i= 6 to 11<br />
<br />
x i<br />
for i=12 to 17<br />
<br />
x i<br />
sin i 1 36<br />
2<br />
for i=18 to 35
背 景 :<br />
针 对 标 准 清 晰 度 数 字 电 视 和 高 等 清 晰 度 数 字 电 视 应 用 下 制 定 的 方<br />
案 1992 年 正 式 发 布 , 标 准 号 是 ISO/IEC13818-3. 他 能 够 提 供 CD 级 的 音<br />
质 .MPEG2 BC 是 针 对 MPEG-1 音 频 兼 容 的 多 声 道 和 低 码 率 的 扩 展 .<br />
技 术 背 景 :<br />
采 样 率<br />
: 16,22.05,24,32,44.1,48khz<br />
比 特 率 : 8~384kbps(2 声 道 )<br />
通 道<br />
: 5.1 声 道
Prediction<br />
利 用 预 测 技 术 减 少 通 道 间 冗 余 . 使 用 通 道 1 和 通 道 2 的 采 样 预 测 通 道<br />
3,4,5 的 采 样 数 据 .<br />
2<br />
<br />
T2(n) pred_ coef_ T2_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T2_1[sbgr,pci] T1(n delay_ comp pci)<br />
pci=0<br />
2<br />
<br />
T3(n) pred_ coef_ T3_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T3_1[sbgr,pci] T1(n delay_ comp pci)<br />
pci=0<br />
2<br />
<br />
T4(n) pred_ coef_ T4_0[sbgr,pci] T0(n delay_ comp pci) pred_ coef_ T4_1[sbgr,pci] T1(n delay_ comp pci)<br />
pci=0<br />
2<br />
<br />
pci<br />
0<br />
2<br />
<br />
pci<br />
0<br />
2<br />
<br />
pci<br />
0<br />
T2<br />
(n) = T2(n) - T2(n) <br />
T3<br />
(n) = T3(n) - T3(n) <br />
T4<br />
(n) = T4(n) - T4(n)
背 景<br />
1997 年 制 订 不 兼 容 MPEG-1 的 音 频 标 准 MPEG-2 NBC, 即 MPEG-2 AAC<br />
1999 年 MPEG-2 AAC 增 加 LTP 和 PNS 工 具 , 形 成 MPEG-4 AAC v1<br />
2002 年 MPEG-4 AAC v1 增 加 了 SBR 和 错 误 鲁 棒 性 工 具 , 形 成 MPEG-4 HE-AAC<br />
2004 年 MPEG-4 HE-AAC 引 入 PS 模 块 , 提 升 低 码 率 性 能 , 形 成 EAAC+<br />
技 术 指 标<br />
采 样 率 :8kHz - 96kHz<br />
码 率 : 8kbps - 576kbps<br />
声 道 : 最 多 支 持 48 个 主 声 道 ,16 个 低 频 增 强 声 道
MPEG2 AAC 技 术 特<br />
点<br />
IS+ MS+ Coupling<br />
MDCT<br />
SQ<br />
Huffman Coding<br />
GC, TNS, Prediction<br />
DRC<br />
• MPEG4 AAC 技 术 特 点<br />
MPEG2 AAC<br />
+LTP<br />
+PNS<br />
TwinVQ<br />
AAC<br />
Spectrum<br />
normalization and<br />
interleaved VQ<br />
Scalefactor coding<br />
Huffman coding<br />
Quantization<br />
Bitstream deformater<br />
M/S<br />
PNS<br />
Prediction<br />
Intensity<br />
Coding<br />
LTP<br />
TNS<br />
BSAC<br />
Scalefactor coding<br />
Arithmetic coding<br />
Quantization<br />
Filterbank<br />
Mandatory features<br />
Gain Control<br />
Unused features<br />
Optional features<br />
SSR<br />
LC/LD/LTP
无 损 解 码 模 块<br />
MPEG2/4 AAC 标 准 的 也 应 用 了 huffman 编 码 算 法 到 无 损 编 码 模 块 . 但 与<br />
mp3 不 同 的 是 .MPEG2 AAC 对 scalefactor 也 使 用 了 huffman 编 码 . 并 且 码<br />
本 更 加 合 理 .<br />
量 化 模 块<br />
MPEG2/4 AAC 标 准 中 的 量 化 部 分 也 是 用 了 非 均 匀 量 化 器 . 公 式 如 下 .<br />
mdct _ line sign( q( i) 0.4054)* abs( q( i) 0.4054)<br />
*2<br />
4 1<br />
( scalefactor common _ scalefac )<br />
3 4
时 频 转 换 模 块<br />
MPEG2/4 AAC 只 应 用 了 MDCT 算 法 把 时 域 数 据 转 换 到 频 域 数 据 , 没<br />
有 使 用 MP3 的 PQMF 模 块 . 而 且 ,AAC 中 一 帧 的 数 据 是 1024 个 采 样 , 并<br />
对 每 帧 的 信 号 类 型 进 行 分 析 , 分 为 和 mp3 相 似 的 4 个 类 型 编 码 , 长 窗 , 短<br />
窗 , 开 始 窗 和 结 束 窗 .AAC 长 窗 1024 个 数 据 , 短 窗 256 个 数 据 , 当 当 前 帧<br />
为 短 窗 时 , 每 帧 有 8 个 短 窗 数 据 . 而 且 在 AAC 中 , 标 准 提 供 了 2 中 基 本 窗<br />
函 数 , 一 种 是 和 mp3 一 样 的 正 弦 窗 , 一 种 是 KBD 窗 .<br />
其 他 模 块<br />
MPEG2 AAC 使 用 了 TNS 算 法 降 低 编 码 系 统 的 pre-echo 噪 音 , 使 用 了<br />
prediction 算 法 开 发 信 号 频 域 的 帧 间 特 性 , 提 高 编 码 效 率 .MPEG4<br />
AAC 使 用 了 LTP 代 替 MPEG2 AAC 的 prediction 算 法 , 力 图 在 获 得 同<br />
样 编 码 质 量 的 同 时 降 低 编 码 复 杂 度 .MPEG4 AAC 也 应 用 了 PNS 算 法<br />
提 高 系 统 对 高 频 部 分 信 号 编 码 的 质 量 .
Prediction<br />
Predictor Side Info<br />
RECONSTRUCTION CONTROL<br />
帧 间 预 测<br />
后 向 自 适 应 格 型 预 测<br />
LMS 自 适 应 原 理<br />
y i,q (n)<br />
Q i<br />
-1<br />
y i,rec (n)<br />
IF (PDP && PU)<br />
x i,rec (n) = y i,rec (n) + x i,est (n)<br />
ELSE<br />
x i,rec (n) = y i,rec (n)<br />
x i,rec (n)<br />
只 在 非 短 窗 内 使 用<br />
x i,est (n)<br />
x i,rec (n-1)<br />
应 用 单 位 为 sfb,<br />
P i<br />
z -1<br />
分 组 复 位<br />
Coeff 计 算 应 用 预 测 预 测 器 更 新
重 建 公 式<br />
x ( n) x ( n) e ( n)<br />
rec est q<br />
预 测 公 式<br />
x<br />
est<br />
( n)<br />
xest, 1(<br />
n)<br />
xest,<br />
2(<br />
n)<br />
x<br />
est<br />
, m( n)<br />
bkm(<br />
n)<br />
rq<br />
, m1(<br />
n1)<br />
r<br />
q,0(<br />
n)<br />
ax<br />
rec<br />
n<br />
r<br />
( n)<br />
a(<br />
rq<br />
,0(<br />
n1)<br />
bk1(<br />
n)<br />
eq,<br />
0(<br />
))<br />
q, 1<br />
n<br />
eq, m( n)<br />
eq,<br />
m1(<br />
n)<br />
xest,<br />
m(<br />
n)
自 适 应 公 式<br />
如 果 是 固 定 的 信 号 ( 指 有 规 则 的 周 期 的 信 号 ) 则 a = b = 1<br />
E eq, m1 ( n) rq , m1( n 1)<br />
<br />
km <br />
<br />
<br />
, m 1, 2, e<br />
2 2<br />
q,0 ( n) rq ,0( n) xrec<br />
( n)<br />
1<br />
2<br />
E <br />
eq, m1 ( n) <br />
E <br />
rq , m1( n 1)<br />
<br />
<br />
• 如 果 要 自 适 应 的 调 整 系 数 适 应 当 前 信 号 的 属 性 则<br />
k<br />
m<br />
COR<br />
( n1)<br />
<br />
VAR<br />
( n)<br />
( n)<br />
COR ( n) COR ( n 1) r ( n 1) e ( n)<br />
m m q, m1 q, m1<br />
VAR ( n) VAR ( n 1) 0.5 r ( n 1) e ( n)<br />
2 2<br />
m m q, m1 q, m1<br />
0.90625<br />
m<br />
m<br />
<br />
<br />
预 测 器 复 位<br />
Reset group number Predictors of reset group<br />
1 P0, P30, P60, P90,...<br />
2 P1, P31, P61, P91,...<br />
3 P2, P32, P62, P92,...<br />
...<br />
30 P29, P59, P89, P119,...
TNS<br />
Temporal Noise Shaping<br />
(TNS) 是 一 种 能 够 自 适 应 于<br />
入 信 号 特 性 来 降 低 pre-echo<br />
Spec data<br />
自 相 关 函<br />
数<br />
R0<br />
R(s)<br />
Levinson<br />
Durbin<br />
(order-12)<br />
/<br />
error<br />
gain<br />
Ref.coef<br />
量 化 反 射<br />
系 数<br />
Coef<br />
截 断 系 数<br />
Index, order<br />
计 算 LPC 系<br />
数<br />
效 应 的 新 技 术 。 它 利 用 应 用<br />
于 信 号 频 谱 的 处 理 来 实 现 时<br />
LPC 系 数<br />
TNS 滤 波<br />
(MA)<br />
域 噪 声 形 状 的 控 制 , 能 够 对<br />
Encode<br />
量 化 噪 声 的 细 微 时 域 结 构<br />
Decode<br />
( 甚 至 在 一 个 滤 波 器 组 窗 口<br />
内 ) 进 行 控 制 .<br />
Index,TNS<br />
order<br />
Truncate<br />
Coeffs<br />
TNS decode coeffs<br />
Compute<br />
LPC<br />
Coeffs<br />
LPC coeffs<br />
Spectral data<br />
TNS 滤 波<br />
(AR)
TNS 技 术 特 点<br />
帧 内 预 测<br />
任 意 窗 使 用<br />
L-D 算 法<br />
可 以 在 任 意 地 方 使 用 , 可 以 跨 越 SFB<br />
8 个 side info.<br />
Coeff 计 算 边 界 确 定 应 用 滤 波
Gain Conctrol 组 件 有 3 子 模 块 组 成 .<br />
(1) GC 数 据 解 析<br />
(2) GC 函 数 设 置<br />
(3) GC WOA 与 综 合
原 理 :<br />
‣ 类 音 调 信 号 与 类 噪 声 信 号 相 比 需<br />
要 更 高 的 编 码 精 度<br />
‣ Long Term Prediction 是 一 种 时<br />
域 帧 间 1 阶 前 相 自 适 应 IIR 滤 波 器 . 目<br />
的 在 于 减 少 信 号 的 时 域 帧 间 冗 余 .<br />
码 流 解 析<br />
预 测 计 算<br />
时 频 转 换<br />
LTP 模 块<br />
TNS 编 码<br />
LTP 采 样 更 新<br />
数 据 重 建<br />
TNS 解 码<br />
时 频 转 换
‣ 在 每 帧 有 一 个 ltp 参 数 , 用 ltp 参 数 查 表 可 以 得<br />
到 ltp 预 测 系 数 . 并 在 该 sfb 内 执 行 时 域 预 测 . 当<br />
前 帧 内 可 以 有 偏 移 参 数 .<br />
‣ 由 于 LTP 是 时 域 预 测 , 要 用 前 一 帧 的 时 域 数 据<br />
乘 以 预 测 系 数 得 到 当 前 预 测 值 . 再 经 过 时 频<br />
变 换 转 换 到 频 域 系 数 和 TNS 编 码 ( 如 果 使 用 )<br />
才 能 和 当 前 码 流 中 的 残 差 值 相 加 重 构 . ltp 从<br />
sfb 0 开 始 执 行 重 构 , 最 多 执 行 40 个 sfb.<br />
‣ LTP 和 PNS 不 可 同 时 使 用 , 如 果 码 流 中 同 时 标<br />
识 LTP 和 PNS 同 时 有 效 , 优 先 节 目 PNS, 不 解 码<br />
LTP.<br />
Pred_buf<br />
Est_buf<br />
T_Est_coef<br />
Sfb_coef<br />
X<br />
偏 移<br />
时 频 转 换<br />
F_Est_coef<br />
+<br />
F_Cur_coef<br />
F_Rec_coef<br />
Ltp_max_sfb
原 理 :<br />
Perceptual Noise Substitution (PNS)<br />
在 每 个 sfb 内 检 测 类 噪 声 信 号 .<br />
在 流 中 解 析 噪 声 替 代 标 志 和 替 代 信 号 带 宽 的 功 率 .<br />
解 码 器 按 照 功 率 谱 插 入 伪 随 机 矢 量 来 替 代 谱 线 信 号 .
背 景<br />
三 星 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方<br />
案 使 用 Bit Slice Arithmetic Coding 代 替 了 MPEG2 AAC 的 huffman 解 码<br />
单 元 . 该 方 案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该<br />
方 案 能 够 实 现 精 细 可 扩 展 编 码 . 被 应 用 于 T-DMB 和 S-DMB 系 统 .<br />
技 术 框 架<br />
Bitstream deformater<br />
TwinVQ<br />
Spectrum<br />
normalization and<br />
interleaved VQ<br />
M/S<br />
Intensity<br />
Coding<br />
AAC<br />
Scalefactor coding<br />
Huffman coding<br />
Quantization<br />
PNS<br />
Prediction<br />
LTP<br />
TNS<br />
BSAC<br />
Scalefactor coding<br />
Arithmetic coding<br />
Quantization<br />
Filterbank<br />
Mandatory features<br />
Unused features<br />
Optional features<br />
Gain Control SBR PS<br />
SSR HE-AAC AAC++ LC/LD/LTP
技 术 特 点 :<br />
1. 比 特 率 可 分 级 :<br />
分 层 实 现 比 特 率 16( 基 本<br />
层 ),24,32,40,48,56,64kb<br />
ps.<br />
2. 带 宽 可 分 级 :<br />
对 每 层 , 仅 仅 受 限 的 频 率<br />
带 宽 才 被 编 码 . 每 层 的 可<br />
分 级 增 量 带 宽 是 3.5khz.
1. BSAC 的 调 整 步 长 :<br />
基 本 层 : 16k bps<br />
每 个 增 加 层 : 1 kbps<br />
2. 每 32 个 谱 线 数 据 形 成 一 个 处 理 单 元 , 有 相 同 的 算 法 编 码 模 型 索 引 . 被 称 为 codeband<br />
3. 4 维 比 特 片 矢 量 分 为 2 个 子 矢 量 ( 矢 量 0 和 矢 量 1).<br />
4. 立 体 声 编 码 和 PNS 使 用 不 同 的 编 码 模 型<br />
5. 差 分 编 码 的 Scale-factor 使 用 许 多 不 同 的 编 码 模 型 .<br />
6. 不 同 的 codeband 可 以 有 共 同 的 Scale-factor 但 是 有 不 同 的 算 术 模 型 .
背 景<br />
NTT 在 ISO 制 定 MPEG4 音 频 标 准 时 提 交 了 自 己 的 音 频 编 码 方 案 . 该 方 案<br />
使 用 Twin-Vector Quant 代 替 了 MPEG2 AAC 的 huffman 解 码 单 元 . 该 方<br />
案 被 MPEG4 音 频 标 准 工 作 组 采 纳 , 应 用 到 MPEG4 音 频 标 准 中 . 该 方 案 能 够<br />
实 现 精 细 可 扩 展 编 码 .<br />
技 术 框 架<br />
Bitstream deformater<br />
TwinVQ<br />
Spectrum<br />
normalization and<br />
interleaved VQ<br />
M/S<br />
Intensity<br />
Coding<br />
AAC<br />
Scalefactor coding<br />
Huffman coding<br />
Quantization<br />
PNS<br />
Prediction<br />
LTP<br />
TNS<br />
BSAC<br />
Scalefactor coding<br />
Arithmetic coding<br />
Quantization<br />
Filterbank<br />
Mandatory features<br />
Unused features<br />
Optional features<br />
Gain Control SBR PS<br />
SSR HE-AAC AAC++ LC/LD/LTP
IMDCT<br />
Decode<br />
LPC coefficient<br />
calculation<br />
MDCT<br />
Encode<br />
TwinVQ 解 码 框 图<br />
X<br />
LPC spectrum<br />
calculation<br />
LPC cepstrum<br />
calculation<br />
LPC coefficient<br />
to<br />
LSP coefficient<br />
÷<br />
LPC cepstrum<br />
calculation<br />
Decoder<br />
LSP VQ<br />
Bark calculation<br />
X<br />
Decoder<br />
Bark VQ<br />
Bark envelope<br />
calculation<br />
÷<br />
Power<br />
calculation<br />
X<br />
Decoder<br />
Power VQ<br />
÷<br />
De-interleave<br />
Interleave<br />
Decoder<br />
Decoder<br />
Weighted<br />
VQ<br />
Weighted<br />
VQ
背 景 :<br />
HE-AACv1/v2 是 三 种 MPEG 技 术 的 整 合 体 , 包 括 高 级 音 频 编 码 (Advanced Audio<br />
Coding, AAC), 以 及 科 玎 技 术 有 限 公 司 (Coding Technologies) 的 谱 带 复 制 (Spectral<br />
Band Replication,SBR) 和 参 量 立 体 声 (Parametric Stereo,PS) 技 术 。SBR 是 一 种 独 特 的 带<br />
宽 扩 展 技 术 , 它 能 够 仅 仅 使 用 一 半 的 比 特 速 率 带 宽 来 进 行 音 频 编 解 码 , 而 传 输 质 量 却 一 致 。PS 则<br />
能 够 使 低 比 特 速 率 的 立 体 声 信 号 , 在 编 解 码 的 效 率 上 增 加 一 倍 。HE-AACv1/v2 在 许 多 的 国 际 标 准<br />
化 组 织 中 都 已 经 被 广 泛 采 用 。<br />
性 能 :<br />
• 支 持 多 声 道 5.1,7.1 以 及 更 多 ( 总 支 持 信 道 数 可 达 48)<br />
• 以 48kbps 速 率 传 输 CD 音 质 立 体 声 , 以 32kbps 速 率 传 输 准 CD 音 质 立 体 声 , 以 24kbps 速 率 传 输<br />
准 优 质 立 体 声 . 低 至 8kbps 的 速 率 单 声 道 优 化 传 输 话 音 、 话 音 / 音 乐 混 合 音 频<br />
• 遵 从 ISO/IEC 14496-3
SBR 技 术<br />
SBR 工 具 用 于 重 建 音 频 信 号 的 高 频 区 域 成 分 , 这 种 重 建 是 基 于 对<br />
在 编 码 过 程 中 被 截 断 的 谐 波 序 列 的 复 制 而 进 行 的 。SBR 首 先 对 生 成 的<br />
高 频 成 分 的 谱 包 络 进 行 调 整 , 然 后 对 经 过 调 整 的 谱 包 络 进 行 综 合 滤<br />
波 , 再 加 上 噪 声 处 理 和 正 弦 成 分 , 从 而 重 构 出 原 始 音 频 信 号 的 谱 特<br />
征 。
SBR 技 术 由 4 个 模 块 组 成<br />
分 别 是 :<br />
谱 线 解 码 模 块 .<br />
分 析 综 合 滤 波 器 模 块 .<br />
HF 产 生 模 块 .<br />
HF 调 整 模 块 .<br />
AAC Core<br />
Decoder<br />
Bitstream<br />
Payload<br />
Deformatter<br />
HE-AACv1 比 特 流<br />
Bitstream<br />
Parser<br />
Huffman<br />
Decoding &<br />
Dequantization<br />
Analysis<br />
QMF Bank<br />
HF Generator<br />
Envelope<br />
Adjuster<br />
Synthesis<br />
QMF Bank<br />
Output<br />
PCM Samples
比 特 流 输 入<br />
码 流 解 析<br />
残 差 谱 线 解 码<br />
谱 线 分 析<br />
MPEG4 AAC 解 码 器<br />
Huffman 解 码<br />
时 频 变 换 模 块<br />
反 量 化<br />
分 析 QMF<br />
X<br />
HF generation 模 块<br />
线 性 预 测<br />
XLow<br />
XHigh<br />
HF adjustment 模 块<br />
Eorig<br />
组 装 调 整<br />
XHigh<br />
Qorig<br />
加 躁<br />
W1<br />
正 弦 调 制<br />
时 频 变 换 模 块<br />
W2<br />
Y<br />
综 合 QMF<br />
时 域 PCM 信 号
时 域<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
● ● ● ●<br />
Huffman<br />
● 解 ●码 有 ●数<br />
●<br />
● ●<br />
据 的<br />
● ●<br />
区 域<br />
● ● ● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
频 带<br />
复 制<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
子 带 1<br />
子 带 2<br />
子 带 3<br />
子 带 4<br />
子 带 5<br />
子 带 6<br />
子 带 7<br />
子 带 8<br />
子 带 9<br />
子 带 10<br />
子 带 11<br />
子 带 12<br />
子 带 15<br />
子 带 14<br />
子 带 16<br />
●<br />
●<br />
●<br />
●<br />
●<br />
子 带 N-1<br />
残 差 谱 线 解 码 模 块<br />
该 模 块 实 现 确 定 非 零<br />
谱 线 位 置 和 非 零 谱 线<br />
的 解 码 . 在 确 定 非 零 谱<br />
线 位 置 , 标 准 采 取 的 方<br />
法 很 灵 活 . 在 解 码 谱 线<br />
数 据 时 依 然 采 用 差 分<br />
huffman 解 码 .<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
子 带 N<br />
频 域<br />
960samples/frame 时 N=30<br />
1024samples/frame 时 N=32
反 量 化<br />
反 量 化
QMF Analysis<br />
SBR 工 具 的 第 一 个 模 块 就 是 首 先 把 解 码<br />
后 的 时 域 数 据 转 换 到 频 域 , 这 个 功 能 是<br />
通 过 复 数 分 析 滤 波 器 组 实 现 的 . 复 数 矩<br />
阵 如 下 :
• QMF Synthesis:<br />
频 带 复 制 后 的 数 据 还 要 统 一 转 换 到<br />
时 域 . 复 数 矩 阵 如 下 :
• QMF 将 采 样 综 合<br />
SBR 内 部 还 有 一 种 子 带 综 合 模 式 ,<br />
既 是 降 采 样 综 合 , 其 变 换 矩 阵 如 下 :
HF 产 生 模 块<br />
HF 生 成 器 的 目 的 是 将 一 定 数 目<br />
的 由 从 矩 阵 XLow 的 一 些 连 续 子 带<br />
通 过 合 成 滤 波 器 组 得 到 的 子 带 信<br />
号<br />
复 制 到 矩 阵 XHigh 的 一 些 连 续 子 带<br />
中 去 。<br />
输 入 参 数 和 矢 量<br />
XLow<br />
计 算 协 方 差 矩 阵<br />
Φk(i,j)<br />
计 算 chirp factors 计 算 线 性 预 测 系 数 计 算 patch 信 息<br />
bwArray a0(k),a1(k) patchStartSubband<br />
和<br />
patchNumSubbands<br />
计 算 Xhigh 预 测 值<br />
XHigh<br />
输 出 参 数 和 矢 量
HF 产 生 模 块 公 式 推 导
EOrig<br />
QOrig<br />
谱 线 和 噪 声 地 址 映 射<br />
EOrigMapped<br />
QMapped<br />
输 入 参 数 与 矢 量<br />
Step2: 附 加 HF 信 号 计 算<br />
Generate Sinusoid<br />
Harmonic<br />
SIndexMapped<br />
Map Sinusoid<br />
Harmonic<br />
SMapped<br />
计 算 HF 信 号 的 幅 值<br />
Xhigh<br />
Estimation of current envelope<br />
Step1:Mapping<br />
Step3: 谱 线 估 计<br />
HF 调 整<br />
在 预 测 了 高 频 数 据 以 后 . 预 测 出 的 数 据<br />
和 原 始 数 据 差 异 还 有 很 大 ,HF 调 整 模 块<br />
就 是 利 用 码 流 中 的 参 数 信 息 , 解 析 出 附<br />
加 激 励 信 号 , 附 加 噪 声 信 号 和 附 加 正 弦<br />
信 号 , 再 把 这 些 信 号 值 加 到 预 测 值 上 ,<br />
近 似 还 原 得 到 原 始 高 频 数 据 .<br />
ECurr<br />
QM<br />
SM<br />
增 益 计 算<br />
Step4: 增 益 计 算<br />
SMBoost<br />
QMLimBoost<br />
GLimBoost<br />
Xhigh<br />
GLimBoost<br />
GFilt<br />
计 算 HF 信 号<br />
W<br />
1<br />
QMLimBoost<br />
参 数<br />
计 算<br />
QFilt<br />
加 躁 波<br />
W<br />
2<br />
SMBoost<br />
ΨRe<br />
加 正 弦 谐 波<br />
Step5:HF 信 号 组 装<br />
Y<br />
输 出 参 数 与 矢 量
映 射<br />
正 弦 产 生<br />
频 谱 评 定<br />
噪 声 谱 正 规 化<br />
正 弦 谱 正 规 化
增 益 计 算<br />
能 量 补 偿<br />
增 益 限 制
各 种 增 益 计 算
平 滑 滤 波
加 躁
正 弦 调 制
HF 调 整 后 得 到 的 矢 量 即 可 和 源 低 频 矢 量 合 并 ,<br />
统 一 进 入 QMF 综 合 滤 波 器 组 , 进 行 频 时 转 换 , 得<br />
到 时 域 数 据 输 出 , 完 成 解 码 过 程 .
HE-AACv2 = HE-AACv1 + Parametric<br />
stereo<br />
解 码 器 结 构 如 下<br />
HE-AACv1 解 码 器<br />
Parametric stereo<br />
MPEG4 AAC<br />
解 码 器<br />
QMF Analysis<br />
(64 bands)<br />
Other SBR Tool<br />
Hybrid<br />
analysis<br />
Delay<br />
LF<br />
HF<br />
De-correlation<br />
……s(k,n)……<br />
…d(k,n)…<br />
Stereo Processing<br />
Hybrid<br />
synthesis<br />
Hybrid<br />
synthesis<br />
QMF systhesis<br />
(64 bands)<br />
QMF systhesis<br />
(64 bands)<br />
L<br />
R
• PS<br />
PS 技 术 由 4 个 模 块 组 成 . 码 流 解 析 ,<br />
混 合 QMF 分 析 与 综 合 模 块 , 立 体 声<br />
处 理 模 块 , 解 相 关 模 块 .<br />
Low frequency filtering<br />
Sk(n)<br />
Demuxer<br />
Framing<br />
eAAC+ 码 流<br />
Stereo Processing<br />
De-correlation<br />
• PS 单 元 的 码 流 解 析 相 对 简 单 , 除<br />
了 要 解 码 出 相 应 的 定 长 sideinfo<br />
数 据 以 外 , 主 要 是 解 码 参 数 立 体<br />
声 的 4 个 参 数 iid, iic, opd 和 ipd 以<br />
及 它 们 的 位 置 信 息 . 这 4 个 参 数 都<br />
是 使 用 差 分 huffman 编 码 .<br />
Mixing<br />
Phase parameters<br />
Interpolation<br />
Hi,j(k,ne)<br />
Perform transient<br />
detection<br />
Apply transient<br />
reduction to<br />
decorrelated signal<br />
dk(z)<br />
Calculate decorrelated<br />
signal<br />
Mixing<br />
lk(n),rk(n)<br />
Hybrid QMF synthesis<br />
filterbank<br />
L,R
混 合 QMF 分 析 与 综 合 模 块<br />
对 经 过 QMF 处 理 的 频 谱 ,PS 模 块 要 做 进 一 步 谱 线 分 析 , 把 1024 个 谱 线 分 成 10,20<br />
或 34 个 子 带 . 分 组 方 式 和 公 式 如 下 , 根 据 码 流 中 不 同 的 信 息 选 择 相 应 的 QMF.
Hybrid QMF analysis filterbank for the 10 and 20 stereo-bands configuration
解 相 关 模 块<br />
目 的 : 是 预 测 参 数 通 道 数 据 d(z).<br />
2. 瞬 态 信 号 检 测<br />
1. 计 算 传 输 函 数<br />
q(m)<br />
fcenter(k)<br />
3. 计 算 相 关 信 号
q(m)<br />
fcenter(k)<br />
1. 计 算 传 输 函 数
2. 瞬 态 信 号 检 测
立 体 声 处 理 模 块<br />
目 的 : 实 现 计 算 相 位 和 振 幅 参 数 , 调 整 目 标 通 道 幅 值 和 相 位 , 还 原 立 体 生 数 据 .<br />
由 立 体 声 参 数 推 导 参 数 矩 阵 的 过 程 如 下<br />
iid,iic,ipd,<br />
opd 参 数<br />
h(z) H(z,ne) H(z,n)
icc_mode=0,1,2 时 振 幅 参 数 的 计 算 icc_mode=3,4,5 时 振 幅 参 数 的 计 算
相 位 参 数 计 算 于 立 体 声 参 数 矩 阵 计 算<br />
当 IPD.OPD 有 效 时<br />
exp( j1<br />
( b( k))) 1<br />
exp( j2( b( k))) 1<br />
exp( j3( b( k))) 1<br />
exp( j<br />
( b( k))) 1<br />
4<br />
当 IPD.OPD 无 效 时<br />
exp( j1<br />
( b( k)))<br />
exp( j2( b( k)))<br />
exp( j3( b( k)))<br />
exp( j<br />
( b( k)))<br />
4
参 数 内 插<br />
立 体 声 重 建
重 建 后 的 左 右 频 带 数 据 别 再 经 过 PS 内 部 的 混<br />
合 滤 波 器 组 和 SBR 的 QMF 滤 波 器 器 组 还 原 时<br />
域 信 号 .
AAC_LC<br />
MP3
背 景 :<br />
AC3 的 前 身 还 包 括 AC1 和 AC2, 只 不 过 因 为 效 果 不 是 很 好 没 有 得<br />
到 广 泛 应 用 .1994 年 12 月 27 日 , 日 本 先 锋 公 司 宣 布 与 美 国 的 杜 比 实 验<br />
室 合 作 在 之 前 AC2 的 基 础 上 研 制 成 功 新 的 环 绕 声 制 式 , 并 命 名 为<br />
“ 杜 比 AC-3(Dolby Surround Audio Coding-3)”。1997 年 初 ,<br />
杜 比 实 验 室 已 正 式 将 杜 比 AC-3 环 绕 声 改 称 为 杜 比 数 码 环 绕 声<br />
(Dolby Surround Digital), 简 称 为 Dolby Digital.. 现 被 广 泛 应 用 于<br />
DVD 影 碟 , ATSC 数 字 地 面 电 视 , DLNA 家 庭 互 联 , 有 线 电 视 , 卫 星 电 视 .<br />
技 术 特 点 :<br />
采 样 率 : 32、44.1、48 kHz<br />
码 率 : 96Kbps-640Kbps<br />
声 道 数 : 6 声 道<br />
AC3 编 码 器
AC3 技 术 特 点<br />
MS + Coupling<br />
MDCT<br />
SQ<br />
Bit allocation<br />
DRC<br />
Encoded AC3<br />
Bitstream<br />
AC-3 frame synchronization, error detection, and frame de-formatting<br />
Encoded<br />
Spectral<br />
envelop<br />
Bit allocation<br />
Bit allocation<br />
infomation<br />
Mantissa<br />
De-quantization<br />
Quantized<br />
mantissas<br />
mantissa<br />
Spectral<br />
Envelop<br />
decoding<br />
Exponent<br />
Synthesis Filter<br />
Bank<br />
PCM time<br />
samples
Bit Allocation<br />
AC3 的 Bit Allocation 技 术 和 MPEG1/2 层 1/2 的 位 分 配 技 术 相 似 . 但 与<br />
之 不 同 的 是 AC3 算 法 通 过 传 输 编 码 参 数 , 在 解 码 端 进 行 心 理 声 学 模 型 的 逆 运<br />
算 计 算 每 个 采 样 需 要 的 分 配 位 数 . 比 特 指 派 对 音 频 信 号 从 掩 蔽 效 应 分 析 它 的<br />
频 谱 包 络 , 以 确 定 分 配 给 各 频 谱 系 数 的 尾 数 所 需 要 的 比 特 数 。<br />
指 数<br />
功 率<br />
谱 密<br />
度<br />
带 化 的<br />
功 率 谱<br />
密 度<br />
谱 包 络 变 换 频 带 划 分 扩 展 函 数 听 阈<br />
激<br />
励<br />
函<br />
数<br />
掩 蔽 曲 线<br />
掩 蔽 比 较<br />
比 特 分 配
Mantissa Decode<br />
AC3 中 mantissa 的 意 义 和 其 他 编 码 标 准 的 残 差 谱 线 意 义 是 一 样 的 . 尾 数 的 量 化 和 解 码<br />
根 据 比 特 指 派 计 算 出 的 BAP 值 将 所 有 尾 数 量 化 到 同 一 等 级 精 度 上 。 该 步 骤 先 从 码 流 中<br />
取 出 尾 数 信 息 , 再 将 尾 数 信 息 和 指 数 解 码 解 出 的 频 谱 指 数 信 息 组 合 成 频 谱 系 数 , 在 解<br />
码 时 , 将 BAP 值 作 为 索 引 在 量 化 表 格 中 查 出 尾 数 占 用 的 比 特 数 , 根 据 该 比 特 数 将 尾 数<br />
从 码 流 中 取 出 , 在 根 据 BAP 值 对 尾 数 进 行 反 量 化 . 最 后 乘 以 指 数 值 .AC3 对 尾 数 的 组 装<br />
也 是 有 分 组 解 码 的 , 一 切 都 根 据 bap 值 的 提 示 进 行 . 而 且 根 据 bap 值 的 不 同 , 量 化 器 的 选<br />
择 也 不 同 ,AC3 即 使 用 了 均 匀 量 化 器 也 是 用 了 非 均 匀 量 化 器 .
Exponent Decode<br />
AC3 的 Exponent 参 数 的 意 义 和<br />
其 他 编 码 标 准 的 scalefactor 是 一 样 的 ,<br />
都 是 起 到 按 照 bark 谱 量 化 的 目 的 . 对<br />
exponent 的 编 码 AC3 采 用 差 分 分 组<br />
的 方 式 编 码 . 而 每 个 码 字 表 示 二 进 制 表<br />
达 式 中 前 导 零 的 个 数 ,AC3 标 准 采 用<br />
了 一 些 共 享 策 略 . 指 数 信 息 在 一 个 数 据<br />
帧 内 的 各 个 音 频 块 之 间 可 以 共 享 , 即<br />
根 据 不 同 指 数 共 享 策 略 数 据 块 1 到 数 据<br />
块 5 可 以 重 复 使 用 以 前 数 据 块 的 指 数 信<br />
息 。<br />
开 始<br />
是 否 重 用 上<br />
一 块 指 数<br />
N<br />
获 得 指 数 策 略 和 指<br />
数 组 编 码 值<br />
指 数 解 码 策 略<br />
Y<br />
结 束<br />
分 解 指 数 包 , 得 到<br />
编 码 值 序 列<br />
求 指 数 差 分 值 序 列<br />
差 分 解 码 , 得 到 实<br />
际 指 数
• Stereo Process<br />
AC3 使 用 了 2 种 技 术 对 通 道 对 进 行 处 理 . 一 种 是<br />
耦 合 技 术 一 种 是 rematrixing 技 术 . 其 中 rematrixing 技<br />
术 和 其 他 标 准 中 的 ms 技 术 是 完 全 一 样 的 .coupling 技<br />
术 在 其 后 的 AAC 标 准 种 也 有 使 用 .<br />
‣ Coupling<br />
耦 合 是 对 IS 编 码 的 推 广 .<br />
Demux<br />
解 码 耦 合 系 数<br />
left left ' right<br />
'<br />
right left ' right<br />
'<br />
解 码 参 考<br />
声 道 数 据<br />
耦 合 声 道 重 建<br />
‣ Rematrixing<br />
Rematrixing 和 Coupling 有 冲 突 .<br />
应 用 频 带 范 围 有 限 制 .
注 意 AC3 和 AAC 的 在 耦 合 上 的 差 别<br />
1.AAC 可 以 在 时 域 和 频 域 2 个 方 向 上 应 用 耦 和 .ac3 只 在 频 域 上 使 用 耦<br />
合 .<br />
2.AC3 没 有 sfb 的 概 念 , 所 以 有 独 立 的 coupling sub-band 和 band。<br />
每 个<br />
耦 合 band 有 一 个 耦 合 系 数 。sub-band 是 频 带 系 数 。n 个 subband 可<br />
以 组 成 一 个 band。 码 流 中 有 一 个 标 志 位 指 示 分 组 方 式 。 这 个 标 志 位 的<br />
解 码 和 AAC 中 窗 分 组 的 方 式 是 一 样 。AAC 有 sfb 的 概 念 , 每 个 sfb 一 个<br />
耦 合 因 子 。<br />
3.AAC 的 解 耦 合 公 式 是 dst+=src*cscale<br />
AC3 的 解 耦 合 公 式 是 dst =src*cscale<br />
4.AAC 是 全 频 带 , 一 直 到 max_sfb<br />
AC3 是 部 分 频 带 , 系 数 地 址 是 37~252
MDCT<br />
AC3 的 时 频 变 换 模 块 和 AAC 的 类 似 , 解 码 时 也 是 要 经 过 3 步 处<br />
理 ,IMDCT, 加 窗 和 交 叠 加 . 只 不 过 AC3 的 MDCT 窗 长 度 分 别 是 256 和<br />
512. 而 且 窗 类 型 稍 有 差 别 .
2005 年 为 了 迎 接 即 将 到 来 的 HD/ 蓝 光 高 清 时 代 , 杜 比 公 司 推 出 了 全<br />
新 的 DOLBY DIGITAL PLUS 音 效 格 式 。 该 格 式 最 高 能 够 支 持 多 达<br />
13.1 声 道 的 环 绕 声 音 效 , 而 最 低 能 够 支 持 7.1 声 道 。 高 码 率 的 DD<br />
PLUS 音 效 将 用 于 以 HD/ 蓝 光 光 盘 为 介 质 的 电 影 中 使 用 , 而 码 律 较 低<br />
的 DD PLUS 音 效 将 用 于 电 视 台 的 电 视 信 号 传 输 .<br />
码 率 32Kbps-6Mbps<br />
声 道 数 最 高 13.1 声 道 , 最 低 7.1 声 道 .<br />
采 样 率 16khz,22.05khz,24khz,32khz,44.1khz,48khz<br />
NBC
• EAC3 技 术 特 点<br />
关 键 模 块 有<br />
AHT 模 块<br />
ECC 模 块<br />
SE 模 块<br />
TNP 模 块<br />
Exponent decode<br />
bit allocation<br />
HE-bit allocation<br />
VQ decoder<br />
GAQ decoder<br />
Mantissa decode<br />
IDCT<br />
AHT 模 块<br />
Enhanced channel<br />
coupling<br />
(ECC)<br />
Spectral Extension<br />
(SE)<br />
IMDCT<br />
瞬 态 噪 声 处 理<br />
(TNP)<br />
技 术 框 图
AHT<br />
EAC3 的 Adaptive Hybrid Transform (AHT) 模 块 只 有 当 码 流 中 的 标 识 位<br />
有 效 时 , 该 模 块 才 有 效 。 该 模 块 包 含 3 个 子 单 元 , 参 数 位 分 配 , 改 进 的 量 化<br />
单 元 和 DCT 单 元 。 当 标 识 位 指 示 使 用 AHT 模 块 时 , 比 特 流 先 进 入 参 数 比 特 分 配<br />
单 元 , 提 取 位 分 配 信 息 . 使 用 GAQ 或 是 VQ 的 方 法 反 量 化 重 构 残 差 谱 线 , 再 结 合<br />
exponent 参 数 重 构 频 域 谱 线 , 最 后 经 过 IDCT 变 换 , 产 生 低 分 辨 率 频 域 谱 线 .
参 数 位 分 配 与 量 化<br />
AHT 模 块 中 的 位 分 配 技 术 与 AC3<br />
中 的 位 分 配 技 术 类 似 但 并 不 相 同 ,<br />
只 是 对 bap 的 表 做 了 改 进 . 当 使 用<br />
AHT 模 块 时 使 用 hebap 表 .<br />
反 量 化 前 , 先 要 根 据 每 个 bap 值<br />
选 择 反 量 化 模 块 ( 如 图 ).<br />
EAC3 使 用 了 VQ 和 GAQ 的 方 法<br />
对 频 域 谱 线 进 行 量 化 . 当 使 用 VQ 进<br />
行 量 化 时 6 个 交 叉 块 的 mantissa 数<br />
据 组 成 一 个 矢 量 , 统 一 分 配 量 化 . 解<br />
码 时 从 码 流 中 获 得 vq 索 引 后 查 表<br />
可 得 6 个 频 域 谱 线 .
GAQ 原 理 :<br />
每 个 DCT 块 中 , 频 率 高 出 现 的 数 字 使 用 增 益 放 大 并 用 短 码 字 传 输 。<br />
频 率 出 现 低 的 系 数 不 使 用 增 益 放 大 , 但 用 长 码 字 传 输 。 每 个 DCT 块<br />
一 个 Gain 系 数 , 编 码 器 可 以 一 帧 一 帧 的 调 整 频 率 统 计 表 , 所 以 要 用<br />
一 个 模 式 选 择 标 识 用 定 长 码 在 码 流 中 传 输 。
Enhance Channel Coupling 模 块<br />
EAC3 改 进 了 耦 合 处 理 模 块 提 高 立 体 声 编 码 的 效 率 . 当 使 用 该 单 元 解 码 时 , 首 先 对 输 入 的<br />
源 频 域 数 据 进 行 处 理 , 计 算 耦 合 通 道 的 频 谱 数 据 , 再 计 算 振 幅 参 数 和 角 度 参 数 . 最 后 把 2<br />
个 参 数 应 用 到 生 成 的 频 谱 数 据 中 即 可 得 耦 合 通 道 的 完 整 频 谱 系 数 .ECC 模 块 也 要 对 频<br />
域 系 数 进 行 分 组 , 从 13 到 252 每 6 或 12 个 数 据 为 一 个 子 带 , 共 22 个 子 带 .<br />
码 流 信 息 与 源 通 道 数 据<br />
振 幅 参 数 处 理<br />
混 沌 参 数 处 理<br />
角 度 参 数 处 理<br />
源 声 道<br />
残 差 谱 线 处 理<br />
耦 合 声 道 生 成<br />
耦 合 通 道 残 差<br />
谱 线
源 通 道 残 差 数 据 处 理 单 元 由 4 步 组 成 :<br />
step1: 对 前 一 个 块 , 当 前 块 和 下 一 个 块 的 增<br />
强 耦 合 系 数 分 别 进 行 IMDCT 变 换 和<br />
dewindow。 如 前 一 个 块 没 有 使 用 增 强<br />
耦 合 , 则 前 一 个 块 的 系 数 为 0.<br />
step2: 执 行 交 叠 加 处 理 。 对 前 一 个 块 的 后 半<br />
块 数 据 和 下 一 个 块 的 前 半 块 数 据 和 到 一<br />
起 和 当 前 块 的 数 据 相 加 。<br />
step3: 后 处 理 , 余 弦 调 整 。 产 生 复 数 域 数 据 。<br />
step4: 在 复 数 域 上 执 行 DFT 变 换 。<br />
前 一 块<br />
+<br />
当 前 块<br />
后 一 块<br />
Step2:WOA<br />
step3<br />
Step4:DFT
参 数 计 算<br />
这 部 分 包 括 三 个 参 数 的 计 算 , 振<br />
幅 参 数 , 角 度 参 数 和 chaos 参 数 .<br />
码 流 解 析<br />
查 表 获 得<br />
振 幅 参 数<br />
查 表 解 码<br />
Chaos 参 数<br />
查 表 解 码<br />
角 度 参 数<br />
振 幅 参 数<br />
调 整<br />
内 插 调 整<br />
振 幅 参 数<br />
amp[ch][bin]<br />
随 机 数 产 生<br />
角 度 参 数<br />
调 整<br />
角 度 参 数<br />
rangle[ch][bin]
耦 合 声 道 变 换 系 数 产 生<br />
1. 重 构 频 域 数 据<br />
2. 系 数 转 换
Spectral Extension<br />
Processing<br />
EAC3 的 谱 扩 展 技 术 是 一 种<br />
类 似 HE-AAC 中 SBR 的 一 种<br />
技 术 . 作 用 都 是 通 过 从 低 频<br />
带 复 制 高 频 带 数 据 , 再 对 复<br />
制 频 带 进 行 调 中 以 在 码 流 中<br />
不 传 输 高 频 带 数 据 , 提 高 编<br />
码 效 率 .<br />
SE 模 块 把 谱 线 数 据 从 第 25 个<br />
数 据 到 第 228 个 数 据 分 成 17<br />
个 子 带 , 每 个 子 带 12 个 系 数 .<br />
对 使 用 耦 合 处 理 的 频 带 采 用<br />
坐 标 从 37 到 228 的 谱 线 范 围 .<br />
分 成 16 个 子 带 , 每 个 子 带 12<br />
个 数 据 .<br />
Transform Coefficient<br />
Translation<br />
Transform Coefficient<br />
Band Border Filtering<br />
参 数 与 低 频 数 据<br />
Banded RMS Energy<br />
Calculation<br />
Noise Scaling and<br />
Transform Coefficient<br />
Blending Calculation<br />
Blended Transform<br />
Coefficient Scaling<br />
频 带 数 据<br />
Blending Factor<br />
Calculation<br />
Spectral Extension<br />
Coordinate Format<br />
SE 技 术 分 为 谱 线 复 制 , 谱 线 调<br />
整 两 模 块 .
谱 线 复 制<br />
SE 的 谱 线 复 制 是 从 码 流 中 解 析 出 每 个 子<br />
带 的 源 复 制 开 始 位 置 , 源 复 制 结 束 位 置<br />
和 目 标 插 入 开 始 位 置 3 个 参 数 . 每 个 块<br />
内 的 所 有 子 带 这 三 个 参 数 相 同 . 然 后 按<br />
照 顺 序 把 谱 线 从 源 地 址 复 制 插 入 目 的<br />
地 址 区 .<br />
谱 线 调 整<br />
谱 线 调 整 包 括 边 界 滤 波 , 噪 声 混 合 和 振 幅<br />
调 整 .<br />
边 界 滤 波 是 针 对 复 制 边 界 或 wrap 产 生<br />
的 区 域 进 行 滤 波 . 使 用 5 阶 滤 波 器 中 间<br />
对 称 , 查 表 获 得 滤 波 器 系 数 .<br />
噪 声 混 合 在 子 带 RMS 能 量 计 算 , 噪 声 产<br />
生 和 噪 声 因 子 解 码 完 成 以 后 执 行 .<br />
振 幅 调 整 在 噪 声 调 整 之 后 计 算 出 的 频 谱<br />
系 数 乘 以 一 个 scale.<br />
fc fc* fscale nc*<br />
nscale
Pre-noise process<br />
PNP 是 一 种 减 少 pre-noise 持<br />
续 时 间 的 新 技 术 . 应 用 在 时 频<br />
变 换 之 后 , 真 的 时 域 数 据 进 行<br />
处 理 .<br />
TC1 = 256<br />
TC2 = 128
Pre-noise process
背 景 :<br />
DTS 是 “Digital Theatre System” 的 缩 写 , 是 “ 数 字 化 影 院 系 统 ” 的 意 思 ,<br />
DTS 总 公 司 位 于 美 国 加 州 的 洛 杉 矾 。DTS 采 用 CAC(Coherent Acoustics<br />
Coding, 相 干 声 学 编 码 ) 方 式 工 作 , 和 Dolby Digital 一 样 也 属 于 利 用 心 理<br />
声 学 原 理 来 对 声 轨 进 行 编 码 的 有 损 的 数 字 压 缩 技 术 。<br />
技 术 指 标 :<br />
采 样 率 :8,16,32,11.025,22.05,44.1,12,24,48khz,96khz,192khz,<br />
比 特 率 :32~3840kbps<br />
通 道 数 :6 通 道
DTS 技 术 特 点<br />
MS+IS<br />
QMF<br />
SQ/VQ<br />
Prediction<br />
Huffman Coding/Block<br />
Coding<br />
DTS 比 特<br />
流 输 入<br />
Bitstream<br />
deformatter<br />
Huffman 解 码<br />
反 量 化<br />
ADPCM<br />
Intensity<br />
<br />
DTS-HD<br />
unknown<br />
MS 解 码<br />
Filterbank<br />
输 出 PCM 数 据
比 特 解 码 与 谱 线 重 建<br />
DTS 的 谱 线 解 码 可 以 使 用 huffman 编 码 算 法 或 是 Block 编 码 算 法 . 如 果 码 流 使<br />
用 块 编 码 , 解 码 时 从 码 流 得 到 当 前 帧 使 用 那 种 块 解 码 模 式 . 按 照 模 式 解 码 . 解 码<br />
方 法 有 2 种 . 一 次 解 码 出 4 个 量 化 谱 线 数 据 .<br />
例 :<br />
方 法 1: 商 解 法<br />
方 法 2: 差 解 法
Q 模 块<br />
DTS 的 量 化 模 块 有 2 中 编 码 方 法 , 对 低 频 数 据 和 scale factor 使 用 标 量 量 化 方 法 , 对 高 频 数 据 可 以<br />
选 择 使 用 矢 量 量 化 .<br />
当 使 用 标 量 量 化 时 :<br />
首 先 要 从 码 流 中 解 析 scale factor, 经 过 差 分 huffman 或 是 差 分 线 性 解 码 的 scale factor 再 经<br />
过 逆 开 方 量 化 表 查 表 出 得 数 据 . 其 次 解 码 出 quant_step 数 据 . quant_step 使 用 huffman 解 码 或 是<br />
线 性 解 码 解 出 . 再 解 码 出 scale 调 整 参 数 re_adj[ch]. 最 后 由 下 面 公 式 重 构 量 化 谱 线 .<br />
其 中 每 通 道 每 子 带 的 scale_factor 每 帧 更 新 一 次 . 而 quant_step 每 个 子 帧 更 新 一 次 .<br />
当 使 用 矢 量 量 化 时 :<br />
从 码 流 中 解 析 出 矢 量 索 引 , 查 表 后 乘 以 scale_factor 可 得 反 量 化 数 据 .<br />
标 量 反 量 化 公 式<br />
iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* quat _ step[ ch][ sub]* scale _ factor[ ch][ sub]* re _ adj[ ch]<br />
矢 量 反 量 化 公 式<br />
iquant _ sample [ ch][ sub][ m] iq _ env[ ch][ sub][ m]* scale _ factor[ ch][ sub]
ADPCM<br />
如 果 码 流 中 信 息 位 PMODE 为 1 表 示 DTS 使 用 了 4<br />
阶 前 向 预 测 器 . 从 码 流 中 解 析 出 4 个 预 测 系 数 , 按 照<br />
下 列 公 式 计 算 .<br />
3<br />
sample coeff<br />
[ n]* iquant _ sample[ ch][ sub][ n]<br />
n0
Stereo Process<br />
DTS 的 立 体 声 处 理 上 也 使 用 了<br />
MS 技 术 和 IS 技 术 .<br />
方 法 类 MP3.<br />
• QMF<br />
DTS 使 用 类 似 MPEG1/2 filterbank 的 QMF 滤 波 器 处 理 时 频 数 据 . 解<br />
码 时 , 通 过 QMF 综 合 滤 波 器 组 后 要 加 窗 和 累 加 . 而 与 MPEG1/2 不 同 的<br />
是 ,DTS 使 用 32 个 子 带 , 每 个 子 带 32 个 数 据 . 转 换 函 数 也 不 同 . 窗 函 数 也<br />
不 同 ,DTS 提 供 2 种 窗 函 数 .<br />
k<br />
k<br />
a<br />
cos( k<br />
)*sin( )*sin( )<br />
2 4<br />
(2i33)(2k1)<br />
<br />
M[ i][ k] 0.5* a*cos( )<br />
128
DTS-HD 是 一 套 相 关 声 学 音 频 编 码 系 统 , 包 含 原 先 的 DTS 数 字 环 绕 声 ,<br />
DTS-ES 和 DTS 96/24, 也 加 有 无 损 压 缩 技 术 。 但 它 具 有 更 高 的 互 换 性<br />
和 扩 张 性 , 除 了 兼 顾 更 高 音 质 、 更 多 声 道 外 , 还 能 兼 容 网 络 下 载 内<br />
容 的 互 动 性 。 取 样 频 率 和 声 道 选 取 也 更 加 灵 活 。 但 依 然 保 持 了 压 缩<br />
比 例 比 DD+ 小 的 特 点 , 故 声 音 信 息 损 失 少 、 细 节 更 为 丰 富 。<br />
<br />
<br />
<br />
采 样 率 8-192kHz(16/24bit)。<br />
声 道 数 :7.1~32 声 道<br />
码 率 : 可 以 达 到 1.5MBPS 以 上
背 景 :<br />
AVS 音 频 标 准 是 AVS 标 准 族 的 一 个 部 分 , 文 档 编 号 是 AVS-P3.AVS 音 频 标<br />
准 出 来 采 用 了 三 星 的 CBC 熵 编 码 技 术 和 芯 晟 的 PQ-SPSC 立 体 声 处 理 技 术 外 ,<br />
其 余 技 术 全 部 使 用 了 EVD 音 频 标 准 的 内 容 , 包 括 FLPVQ,2 级 MDCT 分 析 等 .<br />
技 术 指 标 :<br />
采 样 率 :8kHz-96kHz<br />
码 率 :16kbps-96kbps/ 声<br />
道<br />
声 道 : 支 持 32 个 主 声 道 、8<br />
个 低 频 增 强 声 道
• AVSA 技 术 特 点<br />
PQ-SPSC<br />
MDCT(2 级 )<br />
SQ<br />
上 下 文 位 平 面<br />
解 码<br />
后 量 化 方 极 坐 标<br />
立 体 声 解 码<br />
Bit Slice huffman Coding<br />
FLPVQ<br />
AVS Audio 编 码 音 频 流<br />
比 特 流<br />
去 格 式<br />
化 器<br />
反 量 化<br />
多 分 辨 率 综 合<br />
逆 频 域 线 性 预 测<br />
及 矢 量 量 化<br />
反 向 MDCT 变 换<br />
输 出 时 间 信 号
CBC<br />
三 星 提 出 的 CBC 熵 编 码 算 法 实 际 熵 是 采 用 了 他 们 自 己 在 BSAC 种 的 熵 编<br />
码 技 术 , 但 是 使 用 huffman 编 码 方 法 替 代 了 算 术 编 码 方 法 . 其 余 编 码 原 理 和<br />
BSAC 技 术 几 乎 完 全 一 致 .<br />
上 下 文 位 平 面 无 损 解 码 是 根 据 输 出 速 率 或 接 收 到 的 比 特 流 的 截 断 情 况 ,<br />
使 用 全 部 的 子 解 码 器 或 部 分 的 子 解 码 器 , 如 图 所 示 。 在 各 子 解 码 器 中 , 各 比 特<br />
层 矢 量 从 最 高 比 特 位 到 最 低 比 特 位 , 从 低 频 带 到 高 频 带 逐 级 解 码 。
CBC 解 码 与 谱 线 分 析<br />
利 用 上 下 文 信 息 的 比 特 层 熵 编 码 。<br />
‣ 编 码 带 : 上 下 文 位 平 面 编 码 的 一 个 基 本 编 码 单 元 , 每 个 编 码 带 包 含 32 个 频 谱 系 数 。<br />
‣ 编 码 子 层 : 每 个 子 层 包 含 一 个 或 多 个 上 下 文 位 平 面 编 码 的 编 码 带 。<br />
‣ 基 本 层 : 是 上 下 文 位 平 面 编 码 中 信 号 最 低 质 量 的 编 码 层 , 每 帧 包 含 一 个 基 本 层 , 一 个 基<br />
本 层 包 含 若 干 个 子 层 。<br />
‣ 增 强 层 : 是 上 下 文 位 平 面 编 码 中 用 来 增 强 基 本 层 质 量 的 编 码 层 , 每 帧 根 据 目 标 编 码 速 率<br />
包 含 若 干 个 子 层 。<br />
‣ 编 码 位 平 面 矢 量 : 每 个 位 平 面 编 码 矢 量 包 含 4 个 比 特 , 来 自 于 相 邻 的 4 个 频 谱 系 数 , 进 行 哈<br />
夫 曼 编 码 。
Stereo Process<br />
PQ-SPSC(Post-quatization Square Polar Stereo Coding)<br />
利 用 量 化 频 谱 中 声 道 对 间 的 相 关 性 在 给 定 音 质 下 降 低 码 率 , 或 在 给 定 的 码 率 下 提 高 音 质 。 通<br />
常 声 道 对 的 布 局 是 左 声 道 / 右 声 道 , 或 者 左 环 绕 / 右 环 绕 。PQ-SPSC 的 应 用 是 以 比 例 因 子 带 为 最 小<br />
单 位 的 。 也 就 是 说 对 某 一 比 例 因 子 带 中 的 所 有 量 化 后 MDCT 频 谱 或 者 全 部 使 用 PQ-SPSC, 或 者 全<br />
部 不 使 用 PQ-SPSC。 这 样 做 是 为 了 减 少 边 信 息 。<br />
公 式 如 下 :
T 模 块<br />
AVSA 的 时 频 转 换 模 块 由 2 级 MDCT 构 成 . 每 级 MDCT 有 变 换 和 WOA 两 个 子 模 块 组 成 .<br />
在 进 行 16 点 IMDCT 之 前 还 要 进 行 谱 线 重 排 .AVS 没 有 长 短 窗 分 析 , 编 码 时 先 进 行 2048<br />
点 的 MDCT 变 换 , 对 瞬 态 信 号 再 进 行 一 次 128 个 MDCT 变 换 (16 个 输 入 ,8 个 输 出 )。<br />
解 码 时 , 是 一 个 反 过 程 , 对 瞬 态 信 号 要 先 进 行 128 个 IMDCT 变 换 (8 个 输 入 ,16 个 输<br />
出 )。 再 进 行 2048 点 的 IMDCT. 对 稳 态 信 号 只 进 行 一 次 2048 点 的 IMDCT 信 号 即 可 . 每<br />
级 IMDCT 之 后 都 还 有 加 窗 和 交 叠 加 处 理 .<br />
处 理 过 程<br />
瞬 态 信 号<br />
标 志 和 谱<br />
线 输 入<br />
稳 态 信 号<br />
标 志 和 谱<br />
线 输 入<br />
谱 线<br />
重 排<br />
16 点<br />
IMDCT<br />
加 窗<br />
交 叠<br />
加<br />
2048 点<br />
IMDCT<br />
加 窗<br />
交 叠<br />
加<br />
时 域 PCM<br />
信 号<br />
IMDCT 公 式<br />
N<br />
1<br />
2<br />
2 2<br />
1 <br />
xin<br />
,<br />
spec[ i][ k]*cos n n0 k , 0 n N, n0<br />
N<br />
/ 2 1<br />
2<br />
N<br />
<br />
k0<br />
N<br />
2
FLPVQ<br />
在 编 码 端 , 对 滤 波 器 组 的<br />
输 出 系 数 , 按 照 一 定 的 增 益 阈<br />
值 进 行 线 性 预 测 , 如 果 增 益 阈<br />
值 满 足 给 定 的 条 件 , 则 用 线 性<br />
预 测 滤 波 器 对 频 域 系 数 预 测 分<br />
析 , 预 测 滤 波 器 的 参 数 采 用 分<br />
级 分 裂 矢 量 量 化 。 在 解 码 端 ,<br />
从 码 流 中 解 码 得 到 的 是 预 测 器<br />
系 数 量 化 后 的 码 书 索 引 。 起 始<br />
预 测 频 率 为 1875Hz 到 max_sfb。<br />
线 性 预 测 合 成 滤 波 器 的 传 递 函<br />
数 定 义 为 :<br />
1<br />
Aˆ(<br />
z)<br />
<br />
1<br />
<br />
i1<br />
解 码 LSP 参 数 LSP to LPC 频 域 滤 波<br />
P<br />
1<br />
a ˆ z i<br />
i
f<br />
f<br />
<br />
1<br />
1<br />
2<br />
1<br />
( z)<br />
(1 z ) (1 2q i<br />
z z )<br />
i1,3,..,<br />
P1<br />
<br />
1<br />
1<br />
2<br />
2<br />
( z)<br />
(1 z ) (1 2q i<br />
z z )<br />
i2,4,..,<br />
P<br />
1 st lsf1 lsf2 lsf3 lsf4 lsf5 lsf6<br />
2 nd lsf7 lsf8 lsf9 lsf10 lsf11 lsf12<br />
3 nd dlsf1 dlsf2 dlsf3 dlsf4 dlsf5 dlsf6<br />
4 th dlsf7 dlsf8 dlsf9 dlsf1<br />
0<br />
dlsf1<br />
1<br />
dlsf1<br />
2<br />
for (i = 1; i = 1; j--)<br />
curr_f[j] = prev_f[j] - 2*lsp[2*i-1-1] * prev_f[j-1] + prev_f[j-<br />
2];<br />
for(kk=0;kk
背 景 :<br />
DRA 是 由 广 晟 数 码 开 发 的 多 声 道 音 频 编 码 标 准 . 被 收 录 成 为 国 家 标 准 .<br />
技 术 指 标 :<br />
采 样 率<br />
码 率<br />
通 道 数<br />
:8~192khz<br />
:32~2304kbps<br />
:64+3 个 通 道
DRA 技 术 特 点<br />
Huffman 解 码<br />
IS + MS<br />
MDCT<br />
反 量 化<br />
SQ<br />
Huffman Coding<br />
DRA 比 特<br />
流 输 入<br />
Bitstream<br />
deformatter<br />
Rescaling<br />
M/S 解 码<br />
Intensity 解 码<br />
交 叉 重 组<br />
IMDCT<br />
输 出 PCM 数 据
时 频 转 换 模 块<br />
DRA 的 时 频 变 换 模 块 是 使 用 了 和 AAC 一 样 的 MDCT 变 换 进 行 时 频<br />
分 析 . 窗 长 是 128 或 1024 个 数 据 . 解 码 时 经 过 变 换 后 也 要 通 过 加 窗 和 交<br />
叠 加 (WOA). 使 用 正 弦 窗 , 比 较 有 特 点 是 使 用 了 13 种 窗 形 状 .<br />
变 换 公 式
WOA<br />
DRA 的 基 本 窗 是 正 弦 窗 . 但 是 灵 活 的 扩 展 了<br />
13 种 窗 形 , 以 便 于 更 好 的 描 述 信 号 类 型 .DRA<br />
的 交 叠 加 和 MP3,AAC 完 全 一 样 . 当 前 帧 的 前<br />
半 部 分 数 据 和 前 一 帧 的 后 半 部 分 相 加 .<br />
WIN_LONG_LONG2LONG<br />
WIN_LONG_LONG2SHORT<br />
WIN_LONG_LONG2BRIEF<br />
WIN_LONG_SHORT2SHORT<br />
WIN_LONG_BRIEF2BRIEF<br />
WIN_LONG_SHORT2BRIEF<br />
WIN_SHORT_SHORT2SHORT<br />
WIN_SHORT_BRIEF2BRIEF<br />
WIN_SHORT_SHORT2BRIEF
Stereo Process<br />
‣ 联 合 强 度 编 码<br />
结 合 起 始 IS 执 行 频 带 参 数 进 行 IS 解 码<br />
公 式 :<br />
联 合 声 道 样 本 = 比 例 因 子 * 源 声 道 样 本 .<br />
‣ 和 差 编 码<br />
灵 活 ,3 级 判 定<br />
位 置 获 取<br />
公 式 :<br />
左 声 道 = 和 声 道 + 差 声 道<br />
右 声 道 = 和 声 道 - 差 声 道
• 支 持 音 频 流 技 术<br />
• 压 缩 比 可 以 达 到 1∶18 左 右<br />
• 96Kbps 的 WMA 音 质 = 128Kbps 的<br />
MP3 音 质<br />
• 低 码 率 时 压 缩 比 和 音 质 优 于 MP3<br />
<br />
<br />
WMA7/8<br />
IS+ MS<br />
MDCT<br />
SQ/VQ<br />
Huffman Coding<br />
LSF<br />
WMA9 and WMA pro<br />
Unknown<br />
WMA7/8 比 特<br />
流 输 入<br />
Bitstream<br />
deformatter<br />
Huffman 解 码<br />
反 量 化<br />
MS 解 码<br />
IMDCT<br />
输 出 PCM 数 据
Cook 的 技 术 特 点<br />
Couple<br />
MLT<br />
SQ<br />
huffman coding<br />
noise fill<br />
Huffman 解 码 获 得<br />
vector_index<br />
Demuxer<br />
解 码 RMS 值<br />
噪 声 插 入<br />
反 量 化 和<br />
RMS 加 权<br />
IMLT<br />
内 插<br />
Cook decoder
Inverse Modulated Lapped Transform (IMLT)<br />
IMDCT 操 作 320 频 域 系 数 产 生 320 个 时 域 音 频 数 据 .IMLT 能 分 解 成 类 型 4 的 DCT<br />
变 换 . 在 IMLT 之 后 也 有 加 窗 和 交 叠 加 .<br />
IMLT<br />
Type IV DCT<br />
窗 函 数
QDM2 是 应 用 在 quicktime4 内 的 编 码 器 , 可 以 应 用 与 适 应 quicktime 流 媒 体<br />
的 网 络 点 播 和 下 载 中 .<br />
技 术 特 点 :<br />
IS<br />
FFT,PQMF<br />
SQ,<br />
huffman coding<br />
Demux<br />
Spectral decode<br />
Method decode<br />
Tone decode<br />
Stereo Process<br />
IDFT<br />
Filterbank
Sub Packet 0<br />
Sub packet<br />
Sub Packet 1<br />
Sub Packet 2<br />
Subband 0 Subband 1 ... Subband n<br />
Sub Packet 3<br />
Subband<br />
frame<br />
Sub Packet 4<br />
通 道 0 通 道 1 ... 通 道 n<br />
Sub Packet 5<br />
通 道<br />
谱 线 0 谱 线 1 谱 线 2 谱 线 3 谱 线 4 谱 线 7<br />
Sub Packet 15
背 景 :<br />
Ogg Vorbis 是 近 年 来 由 Xiph.Org Foundation 开 发 的 通 用 感 觉 音 频 编 码 器 ,<br />
其 特 点 是 : 源 码 完 全 开 放 、 无 专 利 限 制 , 具 有 较 大 编 码 灵 活 性 。 在 高 质 量<br />
( 高 比 特 率 ) 级 别 (CD 或 DAT 立 体 声 ,16/24 比 特 量 化 ), 与 现 在 的<br />
MPEG-2 和 MPEG-4 等 音 频 算 法 相 当 ;Ogg Vorbis 编 码 器 在 没 有 重 新 采 样 到<br />
低 采 样 率 情 况 下 , 可 以 将 CD 高 质 量 立 体 声 信 号 压 缩 到 低 于 48kbps 比 特 率 。<br />
技 术 指 标 :<br />
比 特 率 :16 到 128kb/s/ch ;<br />
采 样 率 8kHz-192kHz;<br />
声 道 数 : 单 声 道 、 立 体 声 、4 声 道 、5.1, 最 高 可 支 持 255 独 立 声 道 。
Vorbis<br />
Coupling<br />
MDCT<br />
SQ+VQ<br />
LSP<br />
Huffman Coding<br />
Residue decode<br />
Demuxer<br />
Floor<br />
reconstruction<br />
Compute<br />
Spectral curve<br />
Channel<br />
Uncoupling<br />
IMDCT
频 谱 包 络 分 析<br />
这 是 Ogg Vorbis 编 码 算 法 的 核 心 部 分 , 可 以 使 用 两 种 分 析 方 法 :<br />
Vorbis 基 底 类 型 0, 以 线 谱 对 LSP( 也 被 称 为 线 谱 频 率 LSF) 参 数 来 表 示 编 码<br />
平 滑 的 频 谱 包 络 曲 线 ,LSP 表 示 可 以 与 LPC 表 示 相 互 转 换 。Vorbis 基 底 类 型 1<br />
使 用 分 段 直 线 表 示 来 编 码 频 谱 包 络 曲 线 , 并 基 于 线 性 频 率 轴 和 对 数 (dB)<br />
幅 度 轴 画 出 曲 线 。 在 编 解 码 中 , 两 者 在 语 义 上 是 可 以 互 换 的 , 但 基 底 类 型 1<br />
提 供 了 更 稳 定 的 帧 间 特 性 , 因 此 在 所 有 耦 合 立 体 声 和 高 比 特 率 模 式 下 是 较 好<br />
的 选 择 , 并 且 与 基 底 0 相 比 其 解 码 更 加 简 单 。 在 基 底 1 算 法 中 , 对 短 块 使 用 11<br />
个 点 线 性 (10 折 线 ) 逼 进 频 谱 函 数 包 络 , 而 长 块 使 用 33 个 点 线 性 逼 进 , 且 两<br />
种 情 况 的 算 法 完 全 相 同 .
Vorbis 基 底 类 型 1 是 以 线 性 分 段 逼 近 方<br />
式 实 现 频 谱 包 络 曲 线 的 表 示 。 以 n=128 的 基<br />
底 采 样 为 例 , 对 各 个 分 段 点 的 频 率 (X 坐 标 )<br />
和 幅 度 (Y 坐 标 ) 分 别 进 行 一 系 列 编 码 得 到 压<br />
缩 的 比 特 流 , 在 解 码 端 , 首 先 从 码 流 中 解 码<br />
出 X 坐 标 值 。 这 些 坐 标 值 在 编 码 时 是 以 交 织<br />
方 式 编 码 的 , 如 假 设 编 码 时 频 率 坐 标 ( 即 X 坐<br />
标 ) 序 列 为 :0,16,32,48,64,80,96,112,128( 与<br />
实 际 不 符 , 仅 用 作 举 例 说 明 ), 则 在 对 X 坐 标<br />
值 编 码 时 按 照 规 律 交 织 为 :0, 128, 64, 32, 96,<br />
16, 48, 80, 112。 头 两 个 序 列 为 起 始 坐 标 和<br />
终 止 坐 标 , 其 后 依 次 分 段 去 点 . 假 定 X 序 列 0,<br />
128, 64, 32, 96, 16, 48, 80, 112。 对 应 的 Y<br />
值 序 列 分 别 为 :110, 20, -5, -45, 0, 30, -10。<br />
根 据 X 序 列 , 解 码 时 首 先 解 码 起 始 坐 标 0 和 终<br />
止 坐 标 128 对 应 的 幅 度 值 , 即 110, 20. 然 后 两<br />
点 确 定 一 条 直 线 ; 之 后 解 码 的 Y 值 对 应 与 X 序<br />
列 坐 标 的 第 三 个 , 即 64, 通 过 这 个 X 值 可 以 预<br />
测 其 在 已 确 定 的 线 段 中 对 应 的 幅 度 值 。 这 个<br />
预 测 值 并 非 编 码 原 值 , 在 此 基 础 上 , 我 们 从<br />
码 流 中 继 续 解 码 一 个 Y 值 , 这 个 值 是 一 个 差<br />
值 , 如 一 5。 利 用 预 测 值 和 差 值 可 以 确 定 真<br />
实 的 对 应 于 X 序 列 64 的 幅 度 值 Y=60.<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
65<br />
-5<br />
16 32 48 64 80 96 112 128<br />
16 32 48 64 80 96 112 128
声 道 耦 合 技 术<br />
正 方 形 极 坐 标 耦 合<br />
声 道 交 织 耦 合
时 频 变 换 模 块<br />
Ogg Vorbis 采 用 的 MDCT 变 换 类 似 于 MPEG-2 AAC 中 变 换 , 包 括 2 种 块 长 和 4 种 窗 型 。 对 于 通 常 的<br />
稳 态 信 号 , 为 获 得 编 码 效 率 , 变 换 长 度 从 64 到 4096 广 泛 使 用 , 但 通 常 采 用 长 度 M=2048, 而 对 于 频<br />
谱 变 化 迅 速 的 突 发 信 号 , 为 了 减 小 量 化 失 真 扩 散 的 “ 预 回 声 ” 失 真 , 切 换 到 M=256 的 短 块 MDCT。<br />
对 于 长 、 短 块 相 邻 时 的 长 块 MDCT 变 换 ,w(k) 则 改 为 采 用 起 始 窗 和 终 止 窗 来 保 证 长 窗 与 短 窗 之 间<br />
的 平 稳 过 渡 。Vorbis 编 码 中 采 用 了 一 种 新 颖 的 基 本 窗 函 数 , 公 式 如 下 .<br />
w(<br />
k)<br />
<br />
2 (<br />
k <br />
sin(sin (<br />
M<br />
for k 0,1,..., M 1<br />
0.5)<br />
)*<br />
<br />
)<br />
2
需 求 分 析<br />
技 术 分 析<br />
对 信 源 编 码 EQTP 技 术 以 及 S(tereo) 处 理 技 术<br />
的 灵 活 应 用 .<br />
发 展 趋 势<br />
面 向 存 储 : 趋 于 无 损 , 多 通 道<br />
面 向 传 输 : 区 域 深 度 挖 掘 人 耳 特 性
各 种 高 清 芯 片 中 的 音 频 部 分<br />
芯 片 代 号 支 持 的 音 频 标 准 实 现 方 式 芯 片 厂 商<br />
STi7200 Add WMA9,WMA9 pro,(7100 未 写 ) 双 ST231 400 ST<br />
BCM740x<br />
MPEG1 AUDIO,AAC LC,AC3,<br />
EAC3,HE-AACv1,WMA,WMA pro<br />
未 知<br />
Broadcom<br />
CX24501<br />
MPEG1/2 AUIDO,MPEG2/4 AAC,<br />
AC3,EAC3,HE-AACv1,WMA,<br />
WMApro,<br />
ARM11<br />
Conexant<br />
STB225<br />
DSP based, supports MPEG-1 layer<br />
1&2, MP3 ,MPEG-4 AAC ,Dolby<br />
Digital AC-3, AAC-HE, WMA,<br />
MIPS32<br />
NXP<br />
SMP863x<br />
Audio DSP supports wide variety of<br />
audio codecs<br />
8630 的 应 用 中 提 到 MPEG1/2 AUDIO,<br />
AC3, MPEG2/4 AAC,WMA<br />
Sigma Design<br />
ZR39150<br />
MPEG AUDIO,<br />
Zoran<br />
AC3,WMA 等<br />
STi7100 All Popular audio codec ST231 ST
各 种 系 统 中 的 音 频 部 分<br />
DTV 系 统<br />
ATSC<br />
DVB<br />
ISDB<br />
DMB-TH<br />
IPTV 系 统<br />
ITU<br />
DVB over IP<br />
ISMA<br />
Stream Media 系 统<br />
Windows Media<br />
音 频 部 分<br />
AC3/EAC3<br />
MPEG1/2 AUDIO,MPEG4 AAC,AC3/EAC3,HE-AACv1v2,DTS<br />
MPEG1/2 AUDIO 其 他 不 详<br />
DRA<br />
音 频 部 分<br />
MPEG1/2 AUDIO.MPEG2/4 AAC,HE-AACv1/v2,AC3,EAC3,AVS-P3 audio,<br />
DTS<br />
备 选 WMA<br />
HE-AACv2,AC3,EAC3 , AMR-WB+,<br />
MPEG2/4 AAC,HE-AACv1/v2<br />
音 频 部 分<br />
Windows Media Audio Codec<br />
Real Media Real Audio Codec ( AAC or Cook )<br />
Quicktime Media<br />
Quicktime Audio Codec (AAC or QDM)
各 种 系 统 中 的 音 频 部 分<br />
其 他 系 统<br />
ABS-S<br />
DVB-S/DVB-S2<br />
MDTV 系 统<br />
DVB-H<br />
MediaFlo<br />
DAB/DAB+/DAB-IP<br />
T-DMB<br />
S-DMB<br />
CMMB<br />
DRA<br />
多 种<br />
音 频 部 分<br />
AC3/EAC3<br />
AAC<br />
HE-AACv2,AC3,EAC3, AMR-WB+<br />
BSAC<br />
BSAC<br />
DRA
音 频 编 码 是 信 源 压 缩 与 人 类 听 觉 感 知 相 关 知 识 应 用 的 交 集 。 在 利<br />
用 人 耳 建 模 的 基 础 上 充 分 挖 掘 人 耳 的 不 可 听 特 性 并 加 之 信 源 压 缩 的<br />
各 种 技 术 实 现 音 频 压 缩 编 码 的 目 的 。 概 括 起 来 所 有 的 音 频 编 码 系 统<br />
都 是 使 用 信 源 压 缩 的 熵 编 码 技 术 (E), 量 化 技 术 (Q), 变 换 技 术 (T) 和 预 测<br />
技 术 (P) 。 再 加 上 立 体 声 处 理 技 术 (S) 总 共 有 EQTPS 五 种 技 术 的 应 用 。<br />
以 下 针 对 上 面 介 绍 的 音 频 标 准 在 这 五 种 技 术 应 用 中 的 区 别 分 别 进 行<br />
分 析 。
熵 编 码 技 术 (E)<br />
音 频 压 缩 系 统 中 经 过 前 端 处 理 后 , 输 入 给 熵 编 码 模 块 的 数 据 主 要<br />
有 3 类 , 编 码 控 制 参 数 ,scalefactor 参 数 和 谱 线 残 差 信 号 . 在 应 用 熵 编 码<br />
技 术 对 这 三 类 信 号 进 行 编 码 时 . 常 用 的 编 码 方 法 是 huffman 编 码 技 术 ,<br />
其 次 是 算 术 编 码 和 其 他 编 码 技 术 .<br />
位 分 配 技 术 :MP1/2 L1/2,AC3,EAC3,DTS<br />
算 术 编 码 技 术 :BSAC<br />
huffman 编 码 技 术 : 其 他 所 有 标 准 和 DTS.<br />
在 对 谱 线 残 差 信 号 编 码 时 huffman 编 码 应 用 最 广 泛 . 而 且 一 般 在 应<br />
用 huffman 编 码 可 以 对 残 差 谱 线 数 据 进 行 分 组 , 分 组 的 方 式 各 不 相 同 .
量 化 技 术 (Q)<br />
量 化 可 以 分 为 标 量 量 化 技 术 和 矢 量 量 化 技 术 . 量 化 技 术 实<br />
际 上 是 一 种 超 越 函 数 映 射 技 术 , 在 各 种 音 频 标 准 都 有 应 用 .<br />
量 化 的 目 的 是 降 低 谱 线 动 态 范 围 . 实 现 方 法 多 以 查 表 法 实<br />
现 .<br />
标 量 量 化 技 术 :<br />
均 匀 量 化 :<br />
除 法 量 化 : 用 频 域 谱 线 的 量 化<br />
非 均 匀 量 化 :<br />
对 数 量 化 : 对 scalefactor 的<br />
量 化<br />
指 数 量 化 :<br />
正 弦 量 化 :TNS 系 数 的 量 化<br />
开 方 量 化 :DTS 中 scalefactor<br />
的 量 化<br />
矢 量 量 化 技 术 :<br />
矢 量 量 化 技 术 主 要 针 对 高 频 数 据 进 行<br />
量 化 .<br />
EAC3,DTS,WMA 中 对 高 频 数 据 进 行 矢 量<br />
量 化 .<br />
Vorbis 中 针 对 一 般 谱 线 数 据 应 用 矢 量<br />
量 化 .<br />
TwinVQ,AVSA 中 针 对 LSP 数 据 进 行 矢 量<br />
量 化 .
预 测 技 术 (P)<br />
预 测 技 术 的 应 用 : 广 泛 应 用 于 各 种 标 准 . 一 般 的 信 号 压 缩 都 会 使 用 差<br />
分 预 测 编 码 . 而 有 些 预 测 应 用 通 道 内 , 通 道 间 , 帧 内 , 帧 间 . 以 达 到 压 缩 数<br />
据 减 小 噪 声 的 目 的 .<br />
通 道 内 : 大 量<br />
通 道 间 :MPEG2 audio 中 的 预 测 技 术 使 用 通 道 间 预 测 减 小 多 通 道 数 据 .<br />
帧 间 : MPEG4 AAC LTP 技 术 ( 前 向 自 适 应 ) 和 MPEG2 AAC<br />
prediction 技 术 ( 后 向 自 适 应 ).<br />
帧 内 : MPEG2 AAC TNS 技 术 . 注 意 TNS 目 的 不 是 压 缩 数 据 而 是 是 降 低<br />
pre-echo 噪 声 .<br />
HE-AACv1 的 SBR 技 术 中 应 用 预 测 技 术 生 成 高 频 数 据 .<br />
TwinVQ 技 术 中 应 用 预 测 技 术 对 谱 线 进 LPC 分 析 .<br />
各 种 标 准 对 预 测 技 术 的 应 用 (doc).
变 换 技 术 (T)<br />
基 于 人 耳 的 带 通 特 性 , 人 们 开 始 使 用 FFT 和<br />
PQMF 进 行 带 通 分 析 , 后 来 逐 步 通 过 MDCT 进 行 取 代 . 主 要 问<br />
题 是 带 通 分 析 不 可 避 免 的 带 入 频 带 交 叠 误 差 . 这 也 是 频 带<br />
处 理 技 术 引 入 的 主 要 误 差 . 技 术 发 展 是 从 早 期 的 大 运 算 量<br />
的 FFT 和 PQMF 到 小 运 算 量 且 容 易 进 行 频 带 交 叠 误 差 处 理 的<br />
MDCT 技 术 .<br />
变 换 技 术 主 要 过 程<br />
加 窗 , 变 换 , 去 交 叠 处 理<br />
各 种 标 准 对 变 换 技 术 的 应 用 (doc).
面 向 存 储 和 以 太 网 :<br />
由 于 存 储 介 质 和 网 络 带 宽 的 发 展 , 单 位 容 量 的 成 本 越 来 越 低 , 如<br />
Blue-DVD 单 层 25GB。 所 以 面 向 存 储 的 音 频 向 着 无 损 和 多 通 道 的 方<br />
向 发 展 。WavPack, MPL, FLAC,TTA, APE, Dolby TrueHD 等 . 而 面 向<br />
高 清 音 频 标 准 诸 如 EAC3(DD+) 和 DTS-HD 对 音 频 的 压 缩 采 用 7.1 通<br />
道 ,8.1 通 道 甚 至 13.1 通 道 的 要 求 编 码 , 力 求 达 到 音 质 的 完 美 还 原 .<br />
• 面 向 传 输<br />
为 了 进 一 步 提 高 压 缩 率 , 研 究 者 逐 步 深 入 挖 掘 人 耳 的 特 性 , 从 早 期 的<br />
人 耳 带 通 滤 波 技 术 到 现 在 的 心 理 暗 示 自 动 补 偿 技 术 , 深 入 研 究 人 类 的 生<br />
理 特 性 个 信 号 的 参 数 特 性 并 利 用 这 些 特 性 提 高 压 缩 比 是 未 来 研 究 的 方<br />
向 .
Graphical User Interface<br />
Moto Audio Engine<br />
Application Programming Interface(API)<br />
Rate Control<br />
Codec Library<br />
Loudness Control<br />
Equalizer<br />
MP3<br />
eAAC/eAAC+<br />
AVSA<br />
AAC<br />
WMA/WMA<br />
pro<br />
DRA<br />
Sampling Rate Converter<br />
AC3/EAC3<br />
DTS/DTS-HD<br />
Channel Mixer<br />
Vorbis<br />
Others<br />
Other Audio Processing Function<br />
DRM<br />
Demuxer<br />
Hardware Integration Level
End