7 – Disuguaglianza di Kraft-McMillan
7 – Disuguaglianza di Kraft-McMillan
7 – Disuguaglianza di Kraft-McMillan
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
(F1X) Teoria dell’Informazione e della Trasmissione<br />
7 <strong>–</strong> <strong>Disuguaglianza</strong> <strong>di</strong> <strong>Kraft</strong>-<strong>McMillan</strong><br />
Docente: Nicolò Cesa-Bianchi versione 19 marzo 2013<br />
I co<strong>di</strong>ci <strong>di</strong> Huffman sono i migliori co<strong>di</strong>ci istantanei possibili, nel senso che minimizzano la lunghezza<br />
me<strong>di</strong>a delle parole <strong>di</strong> co<strong>di</strong>ce. D’altra parte, in certi casi potrebbe essere vantaggioso rinunciare<br />
alla proprietà <strong>di</strong> istantaneità allo scopo <strong>di</strong> ottenere co<strong>di</strong>ci non istantanei (cioè univocamente deco<strong>di</strong>ficabili)<br />
migliori <strong>di</strong> quelli <strong>di</strong> Huffman. Il prossimo risultato mostra invece che il miglior co<strong>di</strong>ce<br />
univocamente deco<strong>di</strong>ficabile non è meglio del co<strong>di</strong>ce <strong>di</strong> Huffman. In particolare, <strong>di</strong>mostriamo che<br />
anche i co<strong>di</strong>ci univocamente deco<strong>di</strong>ficabili obbe<strong>di</strong>scono alla <strong>di</strong>suguaglianza <strong>di</strong> <strong>Kraft</strong>. Dato che il<br />
co<strong>di</strong>ce istantaneo ottimo per una sorgente 〈X , p〉 <strong>di</strong> m simboli è definito da<br />
min<br />
ℓ1,...,ℓm∈N<br />
m<br />
i=1<br />
pi ℓi<br />
tale che<br />
m<br />
D −ℓi ≤ 1<br />
ovvero <strong>di</strong>pende solo dalle lunghezze ℓ1, . . . , ℓm, è evidente che se i co<strong>di</strong>ci univocamente deco<strong>di</strong>ficabili<br />
debbono anch’essi obbe<strong>di</strong>re a <strong>Kraft</strong> allora l’ottimo dei co<strong>di</strong>ci istantanei coincide con l’ottimo dei<br />
co<strong>di</strong>ci univocamente deco<strong>di</strong>ficabili.<br />
Prima <strong>di</strong> procedere, introduciamo l’estensione k-esima <strong>di</strong> un co<strong>di</strong>ce c : X → D ∗ . Questa è la<br />
funzione Ck : X k → D ∗ definita come<br />
i=1<br />
Ck(x1, . . . , xk) = c(x1) · · · c(xk) .<br />
È chiaro che un co<strong>di</strong>ce c è univocamente deco<strong>di</strong>ficabile se e solo se la sua k-esima estensione Ck<br />
è non singolare per ogni k ≥ 1. Inoltre, è evidente che ℓCk (x1, . . . , xk) = ℓc(x1) + · · · + ℓc(xk) per<br />
ogni x1, . . . , xk ∈ X .<br />
Teorema 1 (<strong>Disuguaglianza</strong> <strong>di</strong> <strong>Kraft</strong>-<strong>McMillan</strong>) ℓ1, . . . , ℓm ∈ N sono le lunghezze <strong>di</strong> un co<strong>di</strong>ce<br />
D-ario univocamente deco<strong>di</strong>ficabile per una sorgente <strong>di</strong> m simboli se e solo se<br />
m<br />
D −ℓi ≤ 1 .<br />
i=1<br />
Dimostrazione. Prima <strong>di</strong> tutto osserviamo che se ℓ1, . . . , ℓm ∈ N sod<strong>di</strong>sfano la <strong>di</strong>suguaglianza <strong>di</strong><br />
<strong>Kraft</strong> per un co<strong>di</strong>ce D-ario, allora sono le lunghezze <strong>di</strong> un co<strong>di</strong>ce istantaneo —come abbiamo già<br />
<strong>di</strong>mostrato. Dato che un co<strong>di</strong>ce istantaneo è univocamente deco<strong>di</strong>ficabile, abbiamo <strong>di</strong>mostrato un<br />
verso della doppia implicazione.<br />
1
Ora <strong>di</strong>mostriamo che se c : X → D ∗ è univocamente deco<strong>di</strong>ficabile con |X | = m, allora ℓc(x1), . . . , ℓc(xm)<br />
sod<strong>di</strong>sfano la <strong>di</strong>suguaglianza <strong>di</strong> <strong>Kraft</strong>. Per ogni intero k ≥ 1 possiamo scrivere<br />
<br />
<br />
D −ℓc(x)<br />
x∈X<br />
k<br />
= <br />
=<br />
=<br />
x1∈X<br />
· · · <br />
<br />
xk∈X<br />
(x1,...,xk)∈X k<br />
<br />
(x1,...,xk)∈X k<br />
D −ℓc(x1) × · · · × D −ℓc(xk)<br />
D −<br />
ℓc(x1)+···+ℓc(xk)<br />
D −ℓC k (x1,...,xk) .<br />
Ora introduciamo l’insieme X k n ⊆ X k <strong>di</strong> tutti i messaggi che vengono co<strong>di</strong>ficati in parole <strong>di</strong> co<strong>di</strong>ce<br />
<strong>di</strong> lunghezza n,<br />
Possiamo allora scrivere<br />
<br />
(x1,...,xk)∈X k<br />
dove ℓmax = max<br />
i=1,...,m ℓc(xi).<br />
X k n =<br />
<br />
(x1, . . . , xk) ∈ X k : ℓCk (x1,<br />
<br />
. . . , xk) = n<br />
D −ℓC k (x1,...,xk) =<br />
k ℓmax <br />
n=1<br />
<br />
(x1,...,xk)∈X k n<br />
D −ℓC<br />
k ℓmax<br />
(x1,...,xk)<br />
k =<br />
<br />
.<br />
<br />
k<br />
X −n<br />
n D<br />
Ora, siccome c è univocamente deco<strong>di</strong>ficabile, Ck è non singolare (iniettiva) per ogni k ≥ 1. Ciò<br />
implica che X k n non può contenere più elementi <strong>di</strong> D n , altrimenti ci sarebbe una parola <strong>di</strong> co<strong>di</strong>ce<br />
in Dn che co<strong>di</strong>fica due messaggi <strong>di</strong>stinti in X k n , violando così l’ipotesi <strong>di</strong> iniettività. Quin<strong>di</strong> X k <br />
<br />
<br />
n ≤<br />
Dn = Dn . Questo <strong>di</strong> permette <strong>di</strong> scrivere<br />
<br />
<br />
D −ℓc(x)<br />
x∈X<br />
<br />
M<br />
k<br />
≤<br />
<br />
k ℓmax<br />
X k n<br />
n=1<br />
<br />
D −n ≤<br />
k ℓmax <br />
n=1<br />
n=1<br />
D n D −n = k ℓmax<br />
dove M > 0. La relazione sopra può essere scritta come M k ≤ k ℓmax. Dato che questa relazione<br />
vale per ogni k ≥ 1, se M > 1 ci sarebbe un k0 tale che per ogni k ≥ k0 si avrebbe M k > k ℓmax.<br />
Quin<strong>di</strong> dev’essere M ≤ 1. <br />
2