Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
Rezumat teza - Facultatea de Electronica, Telecomunicatii si ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capitolul 8 Melinda BARABÁS<br />
compară patru paradigme <strong>de</strong> antrenare, dintre care trei sunt întâlnite ¸<strong>si</strong> în literatura <strong>de</strong> specialitate<br />
(instruire STL – Single-Task Learning, instruire STL cu <strong>de</strong>scompunere multirezolu¸tie ¸<strong>si</strong> instruire<br />
MTL – Multi-Task Learning), iar una este proprie (instruire MTL cu multirezolu¸tie).<br />
S-a optat pentru o re¸tea <strong>de</strong> structură 4 − 5 − no cu algoritm backpropagation, adică 4 noduri<br />
<strong>de</strong> intrare, un strat ascuns <strong>de</strong> 5 neuroni (cu func¸tie <strong>si</strong>gmoidală logaritmică), respectiv un strat <strong>de</strong><br />
ie¸<strong>si</strong>re cu no noduri <strong>de</strong> ie¸<strong>si</strong>re, caracterizate <strong>de</strong> o func¸tie <strong>de</strong> activare liniară. Se alege no = 1 pentru<br />
instruire STL, respectiv no = 3 pentru MTL. Experimentele se execută cu acelea¸<strong>si</strong> valori ini¸tiale<br />
ale pon<strong>de</strong>rilor ¸<strong>si</strong> ale pragurilor. Numărul maxim <strong>de</strong> epoci se setează la 300 pentru paradigma STL<br />
¸<strong>si</strong> MTL, iar în cazul învă¸tării multirezolu¸tie fiecare etapă are o durată <strong>de</strong> 100 <strong>de</strong> itera¸tii. S-a ales<br />
metoda <strong>de</strong> antrenare trainlm bazată pe algoritmul Levenberg–Marquardt <strong>de</strong>oarece converge<br />
rapid ¸<strong>si</strong> oferă o precizie satisfăcătoare. Rata <strong>de</strong> învă¸tare a fost setată la 0.01, fără momentum.<br />
8.4.1 Instruire STL<br />
Figura 8.2(a) ilustrează arhitectura re¸telei neuronale utilizate în cazul procesului <strong>de</strong> învă¸tare prin<br />
intermediul paradigmei tradi¸tionale <strong>de</strong> antrenare folo<strong>si</strong>te în probleme <strong>de</strong> predic¸tie, ¸<strong>si</strong> anume învă¸tarea<br />
unui <strong>si</strong>ngur task (STL).<br />
∆<br />
∆<br />
∆<br />
x(t)<br />
x(t-1)<br />
x(t-2)<br />
x(t-3)<br />
(a) Arhitectura NN cu STL<br />
x(t+1)<br />
∆<br />
∆<br />
∆<br />
x(t)<br />
x(t-1)<br />
x(t-2)<br />
x(t-3)<br />
Figura 8.2 Arhitectura re¸telei neuronale<br />
(b) Arhitectura NN cu MTL<br />
8.4.2 Instruire STL cu <strong>de</strong>scompunere multirezolu¸tie<br />
x(t)<br />
x(t+1)<br />
Task<br />
suplimentar<br />
Task<br />
principal<br />
Task<br />
x(t+2) suplimentar<br />
Prin procesul <strong>de</strong> instruire multirezolu¸tie, ¸<strong>si</strong>rul <strong>de</strong> date <strong>de</strong> antrenare s m se <strong>de</strong>scompune în seturi<br />
distincte: setul original (având rezolu¸tia cea mai fină) ¸<strong>si</strong> seturi care reprezintă date <strong>de</strong> rezolu¸tie mai<br />
gro<strong>si</strong>eră s j , j < m. Pentru <strong>de</strong>scompunere se folose¸ste transformata wavelet Haar.<br />
Pon<strong>de</strong>ri iniţializate<br />
în mod aleator<br />
Am-2<br />
d m-2<br />
s m-2<br />
<br />
Pon<strong>de</strong>ri estimate<br />
în pasul prece<strong>de</strong>nt<br />
Am-1<br />
d m-1<br />
s m-1<br />
<br />
Pon<strong>de</strong>ri estimate<br />
în pasul prece<strong>de</strong>nt<br />
Am<br />
NN NN NN<br />
Figura 8.3 Schema <strong>de</strong> bază a instruirii multirezolu¸tie<br />
Teză <strong>de</strong> doctorat, 2011 35<br />
s m