metode de calcul numeric matriceal. algoritmi fundamentali

METODE DE CALCUL 

NUMERIC MATRICEAL. 

ALGORITMI 

FUNDAMENTALI 

Bogdan Dumitrescu Corneliu Popeea Boris Jora 

Partea I

Tuturor studenţilor, foşti, actuali sau viitori, 

precum şi copiilor noştri 

Andrei Octavia Monica 

Sebastian Corneliu Şerban

i 

Cuvânt introductiv 

Lucrarea de faţă, prima de o asemenea amploare în limba română, este construită 

pe structura cursului de Calcul numeric, predat de autori la Facultatea 

de Automatică şi Calculatoare a Universităţii Politehnica din Bucureşti. Lucrarea 

expune, în manieră eminamente algoritmică, metodele de rezolvare a problemelor 

fundamentale de calcul din algebra matriceală, care constituie primele şi, de cele 

mai multe ori, principalele componente ale celor mai diverse aplicaţii din inginerie, 

economie şi numeroase alte ramuri ale ştiinţei. 

În afara studenţilor din facultăţile cu profil tehnic sau economic, lucrarea poate 

fi utilă tuturor celor care, fie ei studenţi, cadre didactice, ingineri sau cercetători, 

doresc să utilizeze cele mai moderne instrumente de calcul numeric matriceal. Pentru 

înţelegerea noţiunilor prezentate, cititorul trebuie să posede cunoştinţe minime 

de matematică, la nivelul celor dobândite în liceu sau în primul an de facultate. 

Pentru orientare, fiecare capitol începe cu o trecere în revistă a bazelor matematice 

ale problemelor de calcul studiate. De asemenea, cititorul ar trebui să fie capabil a 

se exprima într-un limbaj de programare de nivel înalt; această condiţie nu e strict 

necesară, dar constituie un avantaj, pentru că îi permite să se concentreze asupra 

ideilor şi nu a detaliilor de implementare ale acestora. 

Cartea conţine 7 capitole, descrise în câteva cuvinte mai jos. La început se 

află o bibliografie de bază, cuprinzând lucrări de largă utilizare, referite cu cifre 

romane, care oferă o privire de perspectivă asupra întregului domeniu. În final 

se găseşte o a doua bibliografie, în general formată din articole (referite cu cifre 

arabe) privind aspecte specifice ale problemelor tratate şi destinată cititorului care 

doreşte să adâncească studiul dincolo de textul de faţă. Pentru facilitarea lecturii, 

recomandăm consultarea listelor de notaţii şi de prescurtări uzuale, aflate câteva 

pagini mai departe. 

Capitolul 0, numerotat astfel pentru a sublinia caracterul său de iniţiere în domeniu, 

prezintă specificul calculului numeric şi justifică necesitatea existenţei cărţii de 

faţă. Este vorba aici despre: reprezentarea numerelor reale în virgulă mobilă, proprietăţile 

(uneori neaşteptate ale) operaţiilor cu astfel de numere precum şi mecanismele 

de apariţie inevitabilă a erorilor numerice. Este apoi considerată perechea 

formată din problema de calcul şi algoritmul de rezolvare, relativ la care sunt defi-

ii 

nite noţiunile fundamentale de condiţionare şi, respectiv, stabilitate numerică. În 

încheiere, este aruncată o privire asupra modului în care arhitectura calculatorului 

influenţează concepţia algoritmilor. 

Capitolul 1 este dedicat expunerii noţiunilor primare ale algebrei matriceale 

(vectori, subspaţii, matrice de diverse tipuri şi proprietăţile acestora), constituind 

totodată o introducere în problematica specifică a capitolelor următoare. Algoritmii 

prezentaţi rezolvă unele probleme simple, dar fundamentale, cum ar fi înmulţirea a 

două matrice, sau unele cazuri particulare, de exemplu cel al matricelor triunghiulare, 

ale unor probleme mai dificile (rezolvarea sistemelor liniare, calculul valorilor 

şi vectorilor proprii). Aceşti algoritmi sunt larg utilizaţi în continuare, ca elemente 

constructive primare. 

Capitolul 2 tratează metodele directe de rezolvare a sistemelor liniare Ax = b, 

cu matrice A nesingulară, prezentând procedura de eliminare gaussiană, inclusiv 

strategiile de pivotare adecvate, precum şi versiunile compacte ale acestei metode 

bazate pe factorizarea LU a matricei A. În afara matricelor de formă generală, 

sunt studiate şi cazurile, des întâlnite în practică, ale matricelor bandă, simetrice şi 

simetric pozitiv definite. De asemenea, sunt abordate probleme conexe, cum ar fi 

calculul inversei şi al determinantului. 

Capitolul 3 descrie metodele de rezolvare în sensul celor mai mici pătrate (CMMP) 

a sistemelor liniare Ax = b, în care numărul ecuaţiilor diferă de cel al necunoscutelor, 

deci A este o matrice dreptunghiulară de formă generală. În acest caz se utilizează 

metode de ”eliminare” specifice, bazate pe aplicarea transformărilor ortogonale (reflectori 

Householder, rotaţii Givens etc.) iar conceptul central este cel de factorizare 

QR. Dacă matricea A nu este de rang maxim, se recomandă utilizarea factorizării 

ortogonale complete, care are la bază un algoritm de triangularizare cu pivotarea 

coloanelor. Sistemele liniare de acest tip apar frecvent în prelucrarea datelor experimentale, 

statistică, identificarea sistemelor etc. 

Capitolul 4 expune principalele metode de calcul al valorilor şi vectorilor proprii 

ai unei matrice A. Este prezentat în detaliu algoritmul QR, care aduce matricea A la 

forma Schur, reală sau complexă, pornind de la forma de principiu a algoritmului, ale 

cărei proprietăţi matematice sunt uşor de analizat, şi ajungând la variantele relativ 

sofisticate sub care acesta este implementat în programele profesionale. Alături de 

cazul general este tratat şi cel al matricelor simetrice. Nu sunt uitaţi alţi algoritmi 

importanţi, utili în cazuri particulare, cum ar fi metodele puterii, puterii inverse, 

bisecţiei sau Jacobi. Cunoaşterea valorilor proprii este utilă în analiza stabilităţii 

sistemelor dinamice, în studiul vibraţiilor (pentru clădiri, poduri, avioane) şi în 

multe alte probleme aplicative majore. 

Capitolul 5 prezintă metodele de calcul al descompunerii valorilor singulare 

(DVS), care constituie instrumentul cel mai sigur de rezolvare a numeroase probleme 

din algebra matriceală, cum ar fi determinarea rangului, calculul unor norme 

matriceale, construcţia bazelor pentru diverse subspaţii, rezolvarea în sensul celor 

mai mici pătrate a sistemelor cu matrice de rang nemaxim. Algoritmul DVS este 

o adaptare ingenioasă a algoritmului QR simetric, cunoscut din capitolul anterior. 

Utilizarea DVS este ilustrată considerând unele variante ale problemei CMMP, de 

exemplu CMMP totală sau cu restricţii, frecvent întâlnite în aplicaţii.

Capitolul 6 consideră calculul valorilor şi vectorilor proprii generalizaţi ai unei 

perechi de matrice (A, B). Este prezentat algoritmul QZ, care aduce perechea la 

forma Schur generalizată, precum şi problema conexă a calculului bazelor ortogonale 

pentru subspaţii de deflaţie. Noţiunile şi algoritmii studiaţi aici sunt de mare 

utilitate în probleme care apar, de exemplu, în teoria sistemelor precum şi în analiza 

circuitelor electrice sau mecanice cu elemente ideale. 

Principalele rezultate ale expunerii sunt concretizate sub formă de algoritmi 

de calcul descrişi într-un pseudocod extrem de apropiat de implementarea directă 

într-un limbaj de programare de nivel înalt. Algoritmii au fost testaţi de autori 

în mediul de programare MATLAB; cu toate acestea, orice observaţii şi propuneri 

din partea cititorilor, care să conducă la eliminarea unor erori sau la îmbunătăţirea 

performanţelor, sunt binevenite şi pot fi transmise la adresa menţionată mai jos. 

Pentru majoritatea algoritmilor sunt precizate proprietăţile de stabilitate numerică, 

de obicei într-o secţiune specială dedicată acestei teme, în fiecare capitol. Menţionăm 

că o altă secţiune expune întotdeuna informaţii despre condiţionarea problemelor de 

calcul studiate; în acest fel, cititorul va avea o imagine clară a acurateţii cu care se 

pot obţine soluţiile numerice ale diverselor probleme studiate. De asemenea, fiecare 

capitol conţine în final o secţiune ce prezintă rutine (funcţii) din biblioteca LA- 

PACK (Linear Algebra PACKage) şi din limbajul MATLAB (MATrix LABoratory), 

reprezentative pentru problemele de calcul studiate. LAPACK [XV] implementează 

cei mai eficienţi şi siguri algoritmi de calcul numeric matriceal şi este instrumentul 

cel mai utilizat în acest domeniu. MATLAB [XIV] are o componentă didactică 

mai pronunţată, îmbinând o interfaţă utilizator simplă cu o calitate remarcabilă a 

algoritmilor. 

De asemenea, fiecare capitol este însoţit de un set de probleme, în total peste 

200, ale căror rezolvări complete sau parţiale se găsesc în partea finală a lucrării. 

Recomandăm cititorului să consulte indicaţiile sau rezolvarea propusă de autori 

numai pentru verificarea soluţiei personale sau după tentative serioase de găsire a 

acesteia. În plus, un mare câştig pentru cititor îl poate reprezenta implementarea 

algoritmilor (cei de bază, din lucrare, şi cei derivaţi, în probleme) precum şi testarea 

funcţionării lor pe exemple numerice reprezentative. 

Aducem la cunoştinţa cititorilor că Grupul de Calcul Numeric din cadrul catedrei 

de Automatică şi Ingineria Sistemelor de la Facultatea de Automatică şi Calculatoare, 

din care autorii fac parte, dispune de o bibliotecă de calcul numeric matriceal 

scrisă în limbajul C, care conţine implementarea tuturor algoritmilor din lucrare. 

Cei interesaţi pot contacta autorii la următoarele adrese de e-mail 

bogdan,popeea,jora@lucky.schur.pub.ro 

Autorii mulţumesc colegilor lor prof. Paul Flondor şi conf.dr.ing. Ioan Tăbuş 

pentru interesul acordat şi în special pentru comentariile şi observaţiile constructive 

făcute pe marginea lucrării. De asemenea, autorii aduc mulţumiri doamnei redactor 

Viorica Fătu, de la Editura ALL Educational, pentru atenţia acordată acestei cărţi 

în drumul către tipar. 

iii 

Autorii

iv 

Bibliografie generală 

• Pentru chestiuni teoretice de calcul matriceal: 

[ I ] Gantmaher F.R. Teoriia matriţ (ediţia a 2-a), Ed. Nauka, Moscova, 

1966. (The Theory of Matrices, vols. 1-2, Chelsea, New York, 1959). 

[ II ] Horn R.A., Johnson C.R. Matrix Analysis, Cambridge University 

Press, Cambridge UK, 1985. 

[ III ] Strang G. Introduction to Linear Algebra, Wellesley-Cambridge 

Press, Wellesley, MA, USA, 1993. 

• Pentru algoritmi de calcul matriceal: 

[ IV] Wilkinson J.H. The Algebraic Eigenvalue Problem, Clarendon Press, 

Oxford, 1965. 

[ V] Stewart G. W. Introduction to Matrix Computations, Academic 

Press, New York and London, 1973. 

[ VI ] Golub G. H., Van Loan Ch. F. Matrix Computations, Second edition, 

The John Hopkins University Press, Baltimore, Maryland, 1989. 

[ VII ] Lawson C.L., Hanson R.J. Solving Least Squares Problems, SIAM, 

Philadelphia, PA, USA, 1995. 

• Pentru studiul condiţionării problemelor de calcul matriceal şi al stabilităţii 

numerice a algoritmilor aferenţi: 

[ VIII ] Stewart G.W., Sun J. Matrix Perturbation Theory, Academic 

Press, London, 1990. 

[ IX] Higham N.J. Accuracy and Stability of Numerical Algorithms, 

SIAM, Philadelphia PA, 1996. 

• Pentru programe de calcul şi indicaţii de utilizare: 

[ X] Wilkinson J.H., Reinsch C. Handbook for Automatic Computation. 

Linear Algebra, Springer-Verlag Berlin, 1971. 

[ XI ] Smith B.T., Boyle J.M., Ikebe Y., Klema V.C., Moler C.B. Matrix 

Eigensystem Routines: EISPACK Guide, 2-nd ed., Springer–Verlag, 

New York, 1974. 

[ XII ] Garbow B.S., Boyle J.M., Dongarra J.J., Moler C.B. Matrix 

Eigensystem Routines: EISPACK Guide Extension, Springer–Verlag, 

New York, 1977. 

[ XIII ] Dongarra J.J., Bunch J.R., Moler C.B., Stewart G.W. LINPACK 

User’s Guide, SIAM Publications, Philadelphia, PA, 1978. 

[ XIV] MATLAB User’s Guide, The MathWorks Inc., Natick, MA, USA, 1992.

v 

[ XV] Anderson E., Bai Z., Bischof C., Demmel J., Dongarra J., 

Du Croz J., Greenbaum A., Hammarling S., McKenney A., 

Ostrouchov S., Sorensen D. LAPACK Users’ Guide, Second Edition, 

SIAM, Philadelphia PA, 1995. (http://www.netlib.org/lapack/lug) 

• Lucrări în limba română: 

[ XVI ] Brânzănescu V., Stănăşilă O. Matematici speciale – teorie, 

exemple, aplicaţii, Ed. ALL, Bucureşti, 1994. 

[ XVII ] Bucur C.M., Popeea C.A., Simion Gh.Gh. Matematici speciale. 

Calcul numeric, E.D.P., Bucureşti, 1983. 

[ XVIII ] Ionescu V., Varga A. Teoria sistemelor. Sinteza robustă. 

Metode numerice de calcul., Ed. ALL, Bucureşti, 1994. 

[ XIX] Iorga V., Jora B., Nicolescu C., Lopătan I., Fătu I., Programare 

numerică, Ed. Teora, Bucureşti, 1996. 

Lista de notaţii 

N – mulţimea numerelor naturale 

Z – mulţimea numerelor întregi 

R – mulţimea numerelor reale 

C – mulţimea numerelor complexe 

• Vectori 

n i : p : n f – vectorul cu elementele întregi n i , n i + p, n i + 2p, . . . , n f ; dacă p = 1, 

vectorul se scrie simplu n i : n f 

R n – spaţiul liniar n-dimensional al vectorilor (coloană) x cu n componente reale 

x i ∈ R, i = 1 : n 

C n – spaţiul liniar n-dimensional al vectorilor (coloană) x cu n componente complexe 

x i ∈ C, i = 1 : n 

e k , k = 1 : n – baza standard a spaţiului liniar R n , respectiv C n 

x i , x(i) – elementul vectorului x aflat în poziţia i 

x(i 1 : i 2 ) – vectorul format din elementele din poziţiile de la i 1 la i 2 ale vectorului x 

(x, y) = y T x = ∑ n 

i=1 x iy i – produsul scalar standard a doi vectori x, y ∈ R n ; în 

cazul complex produsul scalar este (x, y) = y H x = ∑ n 

i=1 x iȳ i 

‖x‖ = (x, x) 1/2 = ( ∑ n 

i=1 |x i| 2 ) 1/2 – norma euclidiană a vectorului x ∈ R n

vi 

‖x‖ p 

= ( ∑ n 

i=1 |x i| p ) 1/p – p-normele vectorului n-dimensional x, p ≥ 1; în calcule se 

utilizează în special ‖x‖ 1 

,‖x‖ 2 

=‖x‖ şi ‖x‖ ∞ 

=max i=1:n |x i | 

• Matrice 

R m×n – spaţiul liniar al matricelor cu m linii şi n coloane cu elemente reale a ij ∈ R, 

i = 1 : m, j = 1 : n 

C m×n 

– spaţiul liniar al matricelor cu m linii şi n coloane cu elemente complexe 

a ij ∈ C, i = 1 : m, j = 1 : n 1 

I n – matricea unitate de ordinul n 

a ij , A(i, j) – elementul matricei A situat în linia i, coloana j 

A(i 1 : i 2 , j 1 : j 2 ) – blocul matricei A format din liniile de la i 1 la i 2 şi coloanele de 

la j 1 la j 2 . Indicele ”:”, fără altă precizare, semnifică luarea tuturor liniilor 

sau coloanele 

A T – transpusa matricei (reale sau complexe) A 

A H – conjugata hermitică a matricei (complexe) A, i.e. A H = ĀT , unde Ā este 

conjugata complexă a lui A 

A −1 – inversa matricei pătrate nesingulare A, i.e. AA −1 = A −1 A = I n 

A −T = (A −1 ) T = (A T ) −1 

A −H = (A −1 ) H = (A H ) −1 

trA – urma matricei pătrate A, i.e. suma elementelor diagonale 

detA – determinantul matricei pătrate A 

λ i (A), i = 1 : n – valorile proprii ale matricei pătrate A de ordin n 

λ(A) – spectrul (de valori proprii) {λ 1 (A), λ 2 (A), . . . , λ n (A)} al matricei A 

ρ(A) = max i=1:n |λ i (A)| – raza spectrală a matricei A 

cond(A) = ‖A‖ ‖A −1 ‖ – numărul de condiţie la inversare al matricei A (‖ · ‖ este o 

normă matriceală consistentă) 

A + – pseudoinversa normală (Moore-Penrose) a matricei A; dacă A este monică 

A + =(A T A) −1 A T , dacă A este epică, atunci A + =A T (AA T ) −1 

σ i (A), i = 1 : p, p = min(m, n) – valorile singulare ale matricei A ordonate astfel 

încât σ 1 ≥ σ 2 ≥ . . . ≥ σ p 

1 În calcule, vectorii se identifică cu matricele cu o singură coloană, iar scalarii se identifică cu 

matricele (sau vectorii) cu un singur element.

vii 

σ(A) – mulţimea {σ 1 (A), σ 2 (A), . . . , σ p (A)} a valorilor singulare ale matricei A 

r = rangA – rangul matricei A, i.e. numărul valorilor singulare nenule 

(A, B) = tr(B T A) (tr(B H A)) – produsul scalar a două matrice reale (complexe) 

‖A‖ F 

= (A, A) 1/2 – norma Frobenius a matricei A, 

‖A‖ 2 F = ∑ m ∑ n 

i=1 j=1 |a ij| 2 sau ‖A‖ 2 F = ∑ r 

i=1 σ i 2 

|A| p 

= ( ∑ r 

i=1 σ i p ) 1/p – p-normele Schatten, p ≥ 1; în calcule se utilizează în special 

norma-urmă |A| 1 

= ∑ r 

i=1 σ i, norma Frobenius |A| 2 

= ‖A‖ F şi norma 

spectrală |A| ∞ 

= σ 1 (A) 

‖A‖ p 

= max ‖x‖p =1‖Ax‖ p 

– p-normele induse; în calcule se utilizează în special 

norma ‖A‖ 1 

= max j=1:n 

∑ m 

i=1 |a ij|, norma spectrală ‖A‖ 2 

= σ 1 (A) şi norma 

‖A‖ ∞ 

= max i=1:m 

∑ n 

j=1 |a ij| 

• Transformări 

SAT – transformare de echivalenţă (bilaterală) a matricei A ∈ R m×n (S şi T sunt 

matrice pătrate nesingulare; transformarea de echivalenţă conservă rangul, iar 

dacă S, T sunt ortogonale, atunci conservă şi valorile singulare) 

T −1 AT – transformare de asemănare a matricei A ∈ R n×n (transformarea de 

asemănare conservă valorile proprii) 

T T AT – transformare de congruenţă a matricei A ∈ R n×n (T este nesingulară; aplicată 

unei matrice A simetrice, transformarea de congruenţă conservă rangul 

şi inerţia i.e. numerele de valori proprii negative, nule şi, respectiv, pozitive) 

Dacă T este ortogonală, atunci T −1 = T T şi transformarea T T AT se numeşte 

transformare de asemănare ortogonală 

• Prescurtări 

i.e. – (id est) adică 

e.g. – (exempli gratia) de exemplu, bunăoară 

DVS – descompunerea valorilor singulare 

FSR(G) – forma Schur reală (generalizată) 

FSC(G) – forma Schur complexă (generalizată) 

FSH – forma (bloc-)superior Hessenberg 

FVM – format virgulă mobilă 

ITE – matrice inferior triunghiulară elementară

viii 

LU – factorizarea LU 

PE – matrice de permutare elementară 

QR – factorizarea QR 

• Alfabetul grec 

Majuscule Minuscule Denumire Corespondentul 

latin 

A α alfa A, a 

B β beta B, b 

Γ γ gamma G, g 

∆ δ delta D, d 

E ǫ epsilon E, e 

Z ζ zeta Z, z 

H η eta E, e 

Θ θ theta - 

I ι iota I, i 

K κ kappa K, k 

Λ λ lambda L, l 

M µ mü M, m 

N ν nü N, n 

Ξ ξ xi X, x 

O o omicron O, o 

Π π pi P, p 

P ρ rho R, r 

Σ σ sigma S, s 

T τ tau T, t 

Υ υ upsilon U, u 

Φ φ phi F, f 

X χ hi H, h 

Ψ ψ psi - 

Ω ω omega O, o

Cuprins 

0 Concepte fundamentale 1 

0.1 Reprezentarea în virgulă mobilă . . . . . . . . . . . . . . . . . . . . . 2 

0.2 Aritmetica în virgulă mobilă . . . . . . . . . . . . . . . . . . . . . . . 7 

0.3 Condiţionarea problemelor de calcul . . . . . . . . . . . . . . . . . . 10 

0.4 Stabilitatea numerică a algoritmilor . . . . . . . . . . . . . . . . . . 12 

0.5 Calităţile unui algoritm numeric . . . . . . . . . . . . . . . . . . . . 15 

0.6 Implicaţiile arhitecturii calculatoarelor . . . . . . . . . . . . . . . . . 16 

0.7 Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

1 Algoritmi elementari 19 

1.1 Vectori. Spaţiul vectorial R n . . . . . . . . . . . . . . . . . . . . . . 19 

1.2 Produs scalar. Norme. Ortogonalitate . . . . . . . . . . . . . . . . . 24 

1.3 Matrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

1.4 Înmulţirea matricelor . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

1.5 Norme matriceale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

1.6 Matrice structurate . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

1.7 Matrice bloc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 

1.8 Matrice normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 

1.9 Sisteme de ecuaţii liniare . . . . . . . . . . . . . . . . . . . . . . . . . 49 

1.10 Valori şi vectori proprii . . . . . . . . . . . . . . . . . . . . . . . . . . 59 

1.11 Rutinele BLAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

1.12 Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

2 Rezolvarea sistemelor de ecuaţii liniare 69 

2.1 Transformări elementare . . . . . . . . . . . . . . . . . . . . . . . . . 70 

2.2 Triangularizare prin eliminare gaussiană . . . . . . . . . . . . . . . . 72 

2.3 Strategii de pivotare . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 

2.3.1 Pivotare parţială . . . . . . . . . . . . . . . . . . . . . . . . . 76 

2.3.2 Pivotare completă . . . . . . . . . . . . . . . . . . . . . . . . 78 

2.4 Factorizări LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 

2.4.1 Factorizări LU rezultate din eliminarea gaussiană . . . . . . . 82 

2.4.2 Factorizări LU compacte . . . . . . . . . . . . . . . . . . . . . 84 

2.4.3 Factorizări LU prin eliminare gaussiană la nivel de bloc . . . 86 

2.4.4 Factorizări LU compacte la nivel de bloc . . . . . . . . . . . . 89 

2.5 Rezolvarea sistemelor liniare . . . . . . . . . . . . . . . . . . . . . . . 91

x 

CUPRINS 

2.6 Calculul inversei şi al determinantului . . . . . . . . . . . . . . . . . 93 

2.6.1 Calculul inversei unei matrice . . . . . . . . . . . . . . . . . . 94 

2.6.2 Calculul determinantului . . . . . . . . . . . . . . . . . . . . 97 

2.7 Condiţionarea sistemelor liniare . . . . . . . . . . . . . . . . . . . . . 97 

2.8 Stabilitate numerică . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 

2.8.1 Scalarea sistemelor liniare . . . . . . . . . . . . . . . . . . . . 103 

2.8.2 Rafinarea iterativă a soluţiei calculate . . . . . . . . . . . . . 104 

2.9 Sisteme bandă . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 

2.10 Sisteme simetrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 

2.11 Sisteme simetrice pozitiv definite . . . . . . . . . . . . . . . . . . . . 114 

2.12 Rutine LAPACK şi MATLAB . . . . . . . . . . . . . . . . . . . . . . 117 

2.13 Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 

3 Problema celor mai mici pătrate 123 

3.1 Transformări ortogonale . . . . . . . . . . . . . . . . . . . . . . . . . 125 

3.1.1 Reflectori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 

3.1.2 Rotaţii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 

3.2 Transformări unitare . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 

3.2.1 Reflectori complecşi . . . . . . . . . . . . . . . . . . . . . . . 138 

3.2.2 Rotaţii complexe . . . . . . . . . . . . . . . . . . . . . . . . . 142 

3.3 Triangularizarea ortogonală . . . . . . . . . . . . . . . . . . . . . . . 143 

3.4 Factorizarea QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 

3.4.1 Acumularea transformărilor . . . . . . . . . . . . . . . . . . . 153 

3.4.2 Aplicarea transformărilor . . . . . . . . . . . . . . . . . . . . 155 

3.4.3 Triangularizarea ortogonală la nivel de bloc . . . . . . . . . . 156 

3.4.4 Alte metode de ortogonalizare . . . . . . . . . . . . . . . . . 160 

3.4.5 Factorizarea QL . . . . . . . . . . . . . . . . . . . . . . . . . 162 

3.5 Rezolvarea problemei CMMP . . . . . . . . . . . . . . . . . . . . . . 162 

3.5.1 Calculul pseudosoluţiei . . . . . . . . . . . . . . . . . . . . . . 164 

3.5.2 Calculul proiecţiilor . . . . . . . . . . . . . . . . . . . . . . . 167 

3.5.3 Problema CMMP cu membru drept multiplu . . . . . . . . . 168 

3.5.4 Calculul pseudoinversei . . . . . . . . . . . . . . . . . . . . . 168 

3.5.5 Alte metode de rezolvare a problemei CMMP . . . . . . . . . 169 

3.6 Sisteme liniare subdeterminate . . . . . . . . . . . . . . . . . . . . . 170 

3.6.1 Triangularizarea ortogonală la dreapta . . . . . . . . . . . . . 170 

3.6.2 Factorizarea LQ . . . . . . . . . . . . . . . . . . . . . . . . . 172 

3.6.3 Rezolvarea sistemelor subdeterminate . . . . . . . . . . . . . 174 

3.7 Condiţionarea problemelor CMMP . . . . . . . . . . . . . . . . . . . 177 

3.7.1 Preliminarii . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 

3.7.2 Sensibilitatea pseudosoluţiei . . . . . . . . . . . . . . . . . . . 180 

3.7.3 Sensibilitatea soluţiei normale . . . . . . . . . . . . . . . . . . 182 

3.8 Stabilitatea algoritmilor de triangularizare . . . . . . . . . . . . . . . 183 

3.8.1 Stabilitatea numerică a algoritmilor fundamentali . . . . . . . 184 

3.8.2 Acurateţea soluţiilor calculate . . . . . . . . . . . . . . . . . . 185 

3.8.3 Scalarea problemei CMMP . . . . . . . . . . . . . . . . . . . 186 

3.8.4 Rafinarea iterativă a soluţiei CMMP . . . . . . . . . . . . . . 187

CUPRINS 

xi 

3.9 Descompunerea ortogonală completă . . . . . . . . . . . . . . . . . . 189 

3.9.1 Triangularizarea ortogonală cu pivotarea coloanelor . . . . . . 190 

3.9.2 Determinarea rangului . . . . . . . . . . . . . . . . . . . . . . 193 

3.9.3 Triangularizarea ortogonală completă . . . . . . . . . . . . . 195 

3.9.4 Descompunerea ortogonală completă . . . . . . . . . . . . . . 197 

3.9.5 Problema generală CMMP . . . . . . . . . . . . . . . . . . . 197 

3.10 Rutine LAPACK şi MATLAB . . . . . . . . . . . . . . . . . . . . . . 199 

3.11 Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

0 CUPRINS

Capitolul 0 

Concepte fundamentale ale 

calculului numeric 

Rezolvarea numerică — cu ajutorul calculatorului – a unei probleme de calcul se face 

întotdeauna pe baza unui algoritm, i.e. a unei succesiuni finite şi bine precizate de 

operaţii elementare (cum ar fi adunarea, înmulţirea etc.) prin care soluţia problemei 

este calculată în funcţie de datele iniţiale. Deşi matematica furnizează deseori, în 

demonstraţiile numite constructive, algoritmi de rezolvare a problemelor pe care le 

tratează, s-a dovedit că de multe ori implementările numerice ale acestor algoritmi 

au dezavantaje majore care îi fac de nefolosit. 

Discrepanţa între corectitudinea matematică a unui algoritm şi adecvarea lui la 

specificul calculului numeric practic poate proveni din două cauze importante. Una, 

evidentă, constă în (eventuala) complexitate (în ce priveşte numărul operaţiilor de 

executat şi memoria ocupată de date), care poate duce fie la timpi de execuţie foarte 

mari, deci nepractici, fie, pur şi simplu, la imposibilitatea execuţiei programului 

care implementează algoritmul. A doua cauză, mai subtilă, o constituie erorile 

care însoţesc calculul numeric; prin acumulare, acestea pot periclita acurateţea 

rezultatului. 

O serie de erori sunt inerente, cum ar fi cele care apar la determinarea datelor 

din măsurători experimentale. Altele sunt legate de algoritmul de calcul utilizat, 

care se poate baza pe simplificări în modelarea unor fenomene fizice sau poate 

proveni dintr-o metodă matematică implicând o infinitate de operaţii, din care, 

prin trunchiere, se reţine doar un număr finit de operaţii; în ambele cazuri, prin 

natura lucrurilor, algoritmul va furniza o soluţie aproximativă. 

În fine, există erori având cauze specifice calculului numeric, care operează cu 

numere reale (şi nu doar cu numere întregi); de acestea ne vom ocupa mai pe larg. 

Desigur, numerele reale sunt reprezentate în memoria calculatorului într-un format 

bine precizat şi ocupând un număr relativ mic de locaţii de memorie, de exemplu 

4 sau 8 octeţi; astfel, o infinitate de numere este reprezentată printr-un număr 

finit de combinaţii de biţi. De aici o primă sursă de erori, cele de reprezentare. 

Apoi, pot apărea erori şi la efectuarea operaţiilor cu numere reale aflate în memoria 

calculatorului, erori numite de rotunjire; aceasta nu se întâmplă pentru că unitatea

2 CAPITOLUL 0. CONCEPTE FUNDAMENTALE 

centrală (microprocesorul, de exemplu) ar ”greşi” la calcule, ci, din nou, datorită 

faptului că numerele reale sunt reprezentate într-un format finit, atât în memorie, 

cât şi în unitatea centrală. 

Prin aceasta, calculul cu numere reale diferă fundamental de cel cu întregi. Vom 

obţine 1 + 2 = 3 pe orice calculator, în schimb 0.1 + 0.2 ≠ 0.3 pe orice calculator 

(doar dacă nu se folosesc programe speciale !); de exemplu — pe un calculator şi 

într-un limbaj de programare pe care nu le precizăm — adunând 0.1+0.2 şi scăzând 

din rezultat 0.3 nu obţinem 0, aşa cum ne-am aştepta, ci aproximativ 5.5 · 10 −17 ; e 

drept, eroarea este infimă. Pericolul apare în cazul acumulării unor astfel de mici 

erori, acumulare care poate duce la degradarea — uneori fatală — a rezultatului 

produs. 

În acest capitol ne vom ocupa de aspecte specifice elementare ale calculului 

numeric: modul de reprezentare a numerelor reale, felul în care se apreciază calitatea 

unui algoritm numeric, cuantificarea efectului erorilor de rotunjire asupra acurateţii 

soluţiei numerice a unei probleme; acest ultim scop face obiectul analizei numerice 

şi este, în general, dificil de atins. 

0.1 Reprezentarea în virgulă mobilă 

Fie x şi ˆx numere reale, ˆx fiind interpretat ca o aproximare a lui x. Vom prezenta 

două măsuri naturale ale calităţii aproximării. 

Eroarea absolută (cu care ˆx aproximează x) se defineşte prin 

∆ = |x − ˆx|. 

Dacă x ≠ 0, atunci eroarea relativă se defineşte prin 

ε = 

x − ˆx 

∣ x ∣ = ∆ 

|x| . 

Dacă x ∈ R n , se înlocuieşte în relaţiile de mai sus valoarea absolută | · | cu o 

normă vectorială ‖ · ‖ (vom discuta despre norme vectoriale în capitolul 1). 

Exemplul 0.1 Fie x = 1.0, şi ˆx = 0.999 o aproximare a sa. Atunci ∆ = 10 −3 şi 

ε = 10 −3 . Dacă ŷ = 0.009 este o aproximaţie a lui y = 0.01, atunci eroarea absolută 

este aceeaşi ca în cazul precedent, ∆ = 10 −3 , dar eroarea relativă este de o sută de 

ori mai mare: ε = 10 −1 . Raportându-se la valoarea lui x, eroarea relativă este mult 

mai adecvată pentru estimarea calităţii aproximării ˆx. 

♦ 

Erorile de reprezentare apar datorită memorării în calculator a numerelor reale 

printr-o secvenţă finită de simboluri (cifre binare). Pentru a prezenta o estimare 

a acestor erori, să reamintim bine cunoscuta reprezentare poziţională a numerelor 

reale. Fie 

• β ∈ N, β ≥ 2, baza de numeraţie; 

• C = {0, 1, . . ., β − 1}, mulţimea cifrelor în baza β, adică primele β numere 

naturale.

0.1. REPREZENTAREA ÎN VIRGULĂ MOBILĂ 3 

Se ştie că orice număr x ∈ R poate fi scris unic sub forma unei secvenţe infinite 

x = sa n−1 a n−2 . . . a 0 .a −1 a −2 a −3 . . ., (0.1) 

care nu se termină printr-o secvenţă infinită de cifre egale cu β −1 şi în care a i ∈ C, 

iar s este semnul, s ∈ {+, −}. Valoarea lui x este 

( n−1 

) 

∑ ∞∑ 

x = s a i β i + a −i β −i . (0.2) 

i=0 i=1 

Convenim să eliminăm din scriere secvenţa infinită de zerouri finale, atunci când 

este cazul. Să exemplificăm relaţiile (0.1) şi (0.2). 

Exemplul 0.2 Numărul în baza 10 

3.25 = 3 · 10 0 + 2 · 10 −1 + 5 · 10 −2 

se reprezintă în baza 2 în modul următor (verificaţi egalitatea): 

11.01 = 1 · 2 1 + 1 · 2 0 + 0 · 2 −1 + 1 · 2 −2 . 

În ambele baze, reprezentările au un număr finit de cifre. În schimb, numărul 

exprimat simplu în baza 10: 

0.1 = 1 · 10 −1 

are o reprezentare de lungime infinită în baza 2 (verificaţi din nou egalitatea): 

0.0001100110011... = (2 −4 + 2 −5 ) 

În baza 10, următoarele două secvenţe 

0.99999 . . . 

1.00000 . . . 

∞∑ 

2 −4k . 

reprezintă acelaşi număr real. Reprezentările binare corespunzătoare sunt 

0.11111 . . . 

1.00000 . . . 

k=0 

În ambele situaţii, reprezentarea acceptată este 1.0000 . . . 

Evident, reprezentarea numerelor reale pe calculator poate avea doar un număr 

finit de cifre şi deci, prin natura ei, este aproximativă. O ”bună” aproximare printr-o 

secvenţă finită de lungime fixată trebuie să asigure: 

• un domeniu suficient de mare de numere reprezentate; 

• o eroare relativă de reprezentare suficient de mică; 

• o distribuţie uniformă a erorii relative de reprezentare. 

♦


Un bun compromis în satisfacerea acestor cerinţe este dat de aşa numitul Format 

Virgulă Mobilă (FVM). 

Definiţia 0.1 Un Format Virgulă Mobilă (FVM) este definit de trei întregi (β, t, p), 

cu următoarea semnificaţie: 

β – baza de numeraţie (β ≥ 2); 

t – precizia, adică numărul de cifre semnificative (”lungimea” mantisei); 

p – numărul de cifre ale exponentului. 

Un număr în virgulă mobilă este o pereche (f, e), unde 

f = ±0.f 1 f 2 . . .f t , f 1 ≠ 0, f i ∈ C 

este un număr fracţionar cu semn (plus sau minus), normalizat (i.e. f 1 ≠ 0), cu 

t cifre, denumit mantisă, iar 

e = ±e 1 e 2 . . . e p 

este un întreg cu semn, cu p cifre, numit exponent. Valoarea reală asociată numărului 

în virgulă mobilă (f, e) este 

x = f · β e . 

Fie L valoarea minimă admisă a exponentului (de exemplu L = − ρ . . .ρ, unde 

} {{ } 

p 

ρ = β − 1) şi U cea maximă (de exemplu U = −L). Se observă că toate numerele 

în virgulă mobilă x satisfac: 

β L−1 = m ≤ |x| ≤ M = β U (1 − β −t ) 

adică domeniul reprezentării în virgulă mobilă este intervalul R = [−M, M]. Desigur, 

pentru majoritatea reprezentărilor pe calculator, β = 2 (se mai foloseşte, de 

exemplu, β = 16 şi chiar β = 10). 

Exemplul 0.3 Să considerăm FVM cu (β, t, p) = (2, 2, 1). Atunci L = −1, U = 1, 

m = 2 −2 = 0.25 10 , M = 2(1 − 2 −2 ) = 1.5 10 . Numerele reale care au o reprezentare 

exactă în acest FVM sunt: 

x 1 = (−0.11, +1) = −1.5 10 x 7 = (+0.10, −1) = 0.25 10 

x 2 = (−0.10, +1) = −1.0 10 x 8 = (+0.11, −1) = 0.375 10 

x 3 = (−0.11, 0) = −0.75 10 x 9 = (+0.10, 0) = 0.5 10 

x 4 = (−0.10, 0) = −0.5 10 x 10 = (+0.11, 0) = 0.75 10 

x 5 = (−0.11, −1) = −0.375 10 x 11 = (+0.10, +1) = 1.0 10 

x 6 = (−0.10, −1) = −0.25 10 x 12 = (+0.11, +1) = 1.5 10 

şi vor fi folosite pentru reprezentarea (aproximativă) a tuturor numerelor reale din 

intervalul [−1.5, 1.5]. Reprezentarea geometrică a tuturor acestor numere pe axa 

reală este prezentată în figura 0.1. Numerele cu reprezentare exactă în virgulă 

mobilă sunt relativ uniform distribuite; mai precis, |x i −x i−1 | / |x i | are aproximativ 

aceleaşi valori pentru orice i. 

♦ 

Exemplul 0.4 Un FVM pe 32 biţi poate fi următorul: (β, t, p) = (2, 24, 7). Doi 

biţi sunt atribuiţi reprezentării semnelor mantisei şi exponentului; deoarece primul

0.1. REPREZENTAREA ÎN VIRGULĂ MOBILĂ 5 

-1.5 -1 -0.5 

0.5 1 1.5 

0 

x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 12 

x 11 

✲ 

Fig. 0.1: Reprezentarea numerelor în virgulă mobilă din exemplul 0.3 

0 1 0 0 1 1 0 0 0 1 1 0 1 0 0 1 1 0 1 1 1 0 0 0 0 0 0 0 1 0 1 1 

✻✛ exponent (7 biţi) ✲ ✻✛ 

mantisa (23+1 biţi) 

✲ 

semn exponent 

semn număr (mantisă) 

Fig. 0.2: Structura unui număr în virgulă mobilă, pentru (β, t, p) = (2, 24, 7) 

bit al mantisei are întotdeauna valoarea 1, semnul mantisei se memorează în locul 

acestui bit, economisind astfel un bit al reprezentării. Un exemplu de număr în 

virgulă mobilă în acest format este prezentat în figura 0.2. 

Pentru acest FVM avem: L = −127, U = 127, m = 2 −127 = (2 −10 ) 13 2 3 ≈ 10 −38 , 

M ≈ 10 38 (putem aproxima 2 10 ≈ 10 3 ). Aceasta arată că FVM acoperă un domeniu 

larg de numere, utilizând un număr relativ mic de cifre binare. Acest exemplu este 

foarte apropiat de formatul standard IEEE pentru numere în virgulă mobilă în 

simplă precizie. 

În formatul din acest exemplu, numărul real 0.1 are mantisa 

0.110011001100110011001100 

şi exponentul 10000011 (−3 în baza 10; prima cifră 1 a exponentului reprezintă 

semnul). Aşadar numărul 0.1 este reprezentat aproximativ (vezi exemplul 0.2). ♦ 

Observaţia 0.1 Definiţia 0.1 nu permite reprezentarea exactă a numărului 0, 

acesta neputând avea o mantisă normalizată. Practic, pentru a reprezenta 0, precum 

şi unele simboluri speciale despre care se va vorbi mai târziu, se folosesc valori 

dedicate ale exponentului, în afara intervalului [L, U]. De aceea, în standardul 

IEEE pentru simplă precizie, L = −126. 

♦ 

Pentru a estima erorile efectuate la reprezentarea unui număr real în virgulă 

mobilă, să considerăm un FVM, adică (β, t, p), şi să notăm 

F = {x ∈ R | x are reprezentare exactă in VM} ∪ {0}. (0.3) 

Desigur, F este o mulţime finită de numere raţionale. 

Reprezentarea numărului real x ∈ [−M, M] în FVM înseamnă aproximarea lui 

cu un număr ˆx ∈ F. Această aproximare poate fi exprimată printr-o funcţie de 

rotunjire. 

Definiţia 0.2 Dacă (β, t, p) este un FVM şi F este mulţimea definită în (0.3), 

atunci o funcţie 

fl : [−M, M] → F


care asociază fiecărui x ∈ [−M, M] o unică reprezentare în virgulă mobilă 

ˆx = fl(x) 

este numită funcţie de rotunjire. Eroarea relativă de aproximare 

|x − fl(x)| 

|x| 

definită pentru orice x ∈ [−M, M] nenul este denumită eroare de reprezentare. 

Deoarece intervalul [−M, M] este o mulţime infinită de numere reale, fiecare 

ˆx ∈ F constituie ”reprezentarea în VM” a unei mulţimi infinite de numere din 

[−M, M]; suntem interesaţi să găsim o margine superioară a erorii de reprezentare 

pentru o funcţie de rotunjire dată. Există mai multe funcţii de rotunjire. O vom 

prezenta doar pe cea mai simplă, denumită rotunjire prin tăiere. În acest scop, să 

scriem numărul x ∈ [−M, M] în forma (0.1) normalizată: 

x = f · β e = ±0.f 1 f 2 . . . f t f t+1 . . . · β e = 

= ±0.f 1 f 2 . . . f t · β e ± 0.f t+1 f t+2 . . . · β e−t = 

= ˆf · β e + ĝ · β e−t , 

unde f i ∈ C, f 1 ≠ 0, ˆf = ±0.f 1 f 2 . . . f t , ĝ = ±0.f t+1 f t+2 . . . 

În mod evident: 

1/β ≤ |f| < 1, 1/β ≤ | ˆf| < 1, 0 ≤ |ĝ| < 1. (0.4) 

Funcţia de rotunjire prin tăiere 

este definită prin 

ˆx = fl 1 (x) = 

fl 1 : [−M, M] → F 

{ ˆf · β e , pentru x ≠ 0, 

0, pentru x = 0. 

Pe scurt, reprezentarea în VM se obţine prin tăierea cifrelor mantisei normalizate a 

numărului x care se află în afara formatului (de la poziţia t + 1 încolo). 

Utilizând inegalităţile (0.4), este uşor de stabilit o margine superioară a erorii 

de reprezentare introduse de fl 1 . Într-adevăr, pentru orice x ∈ [−M, M] \ {0} avem 

ε = |x − fl 1(x)| 

|x| 

= |fβe − ˆfβ e | 

|f|β e 

= |ĝ|βe−t 

|f|β e 

< β−t 

β −1 = β−t+1 . 

Această formulă arată că, indiferent de valoarea numărului x, o margine pentru 

mărimea erorii de reprezentare este determinată exclusiv de numărul de cifre ale 

mantisei (în baza de numeraţie a FVM) şi acesta este motivul pentru care t este 

numit precizia reprezentării în virgulă mobilă. Numărul β −t+1 este numit epsilon 

maşină şi reprezintă distanţa dintre 1 şi următorul număr cu reprezentare în FVM 

(vezi problema 0.5).

0.2. ARITMETICA ÎN VIRGULĂ MOBILĂ 7 

Pe majoritatea calculatoarelor, numerele în virgulă mobilă au o precizie fixată. 

Multe calculatoare au, de asemenea, posibilitatea de a manipula numere în virgulă 

mobilă cu aproximativ 2t biţi pentru mantisă; astfel de numere sunt numite în 

dublă precizie. De exemplu, în standardul IEEE, numerele în dublă precizie sunt 

memorate pe 64 biţi, cu t = 53 şi p = 10 (un bit suplimentar este dedicat memorării 

semnului exponentului). 

Pentru toate funcţiile de rotunjire folosite, marginea superioară a erorii de reprezentare 

are forma 

ε ≤ µ · β −t , (0.5) 

unde µ este un număr de ordinul unităţii. 

Din (0.5) rezultă existenţa unui număr ρ astfel încât 

ˆx = fl(x) = x(1 + ρ), |ρ| ≤ µβ −t , (0.6) 

ceea ce este un alt mod de exprimare a erorii de reprezentare. 

Cele t cifre ale mantisei sunt numite cifre semnificative ale numărului real reprezentat. 

În baza de numeraţie zecimală, numerele reprezentate în simplă precizie 

conform standardului IEEE (t = 24) au 7 cifre semnificative (numărăm 3 cifre 

zecimale pentru 10 cifre binare), iar cele în dublă precizie (t = 53) au 16 cifre semnificative; 

în consecinţă, eroarea maximă de reprezentare este de aproximativ 10 −7 , 

respectiv 10 −16 (anume chiar epsilon maşină). O prezentare detaliată a standardului 

IEEE poate fi găsită în []. 

0.2 Aritmetica în virgulă mobilă 

Calculatoarele cu hardware dedicat operaţiilor în virgulă mobilă sunt prevăzute cu 

un set de instrucţiuni pentru implementarea unor operaţii cu numere în virgulă 

mobilă ca, de exemplu, adunarea, scăderea, înmulţirea sau împărţirea. Trebuie subliniat 

că operaţiile menţionate diferă de cele matematice corespunzătoare deoarece 

rezultatul lor aparţine întotdeauna mulţimii finite F a numerelor în virgulă mobilă. 

Aşadar operaţiile aritmetice nu pot fi executate exact. Eroarea introdusă de 

operaţiile aritmetice în virgulă mobilă se numeşte eroare de rotunjire. Consecinţele 

pot fi foarte importante; există posibilitatea ca erorile de rotunjire să se acumuleze 

şi, în calcule lungi, valorile finale să fie afectate, chiar până la a le face inutilizabile. 

De aceea este de dorit ca fiecare algoritm să fie analizat pentru a vedea în ce măsură 

erorile de rotunjire afectează rezultatele; în general, aceasta este o sarcină dificilă. 

Exemplul 0.5 Considerăm FVM cu (β, t, p) = (10, 3, 1). Adunând exact numerele 

1.23 şi 20.5, amândouă reprezentabile exact în FVM ales, se obţine 21.73. Rotunjit 

prin tăiere, rezultatul în VM este 21.7, deci diferit de cel exact. 

♦ 

Analiza erorilor de rotunjire se bazează pe cunoaşterea marginilor superioare ale 

erorilor ce apar în operaţiile în virgulă mobilă. Pentru majoritatea calculatoarelor 

este valabil următorul model al erorilor asociate operaţiilor în virgulă mobilă, bazat 

pe evaluarea (0.6): notând cu fl(xy), fl(x/y) şi fl(x+y) produsul, câtul, respectiv 

suma calculate ale numerelor în virgulă mobilă x şi y, atunci, într-un FVM cu t cifre 

avem 

fl(xopy) = (xop y)(1 + ρ), |ρ| ≤ µβ −t , (0.7)


unde op poate fi +, · sau /, iar µ este un număr de ordinul unităţii. 

Modelul (0.7) este obţinut presupunând că xop y este calculat exact, apoi rezultatul 

este transformat în FVM printr-o funcţie de rotunjire. În realitate, lucrurile nu 

stau chiar aşa; unităţile specializate pentru calculul în VM nu obţin rezultatul exact, 

dar se comportă ca şi cum l-ar obţine, lucrând pe baza unor algoritmi nebanali, a 

căror cunoaştere nu este necesară pentru înţelegerea algoritmilor din această lucrare 

şi a căror prezentare depăşeşte cadrul problematicii propuse. 

În completarea relaţiei (0.7), trebuie să menţionăm că, atunci când o operaţie 

în virgulă mobilă produce un număr cu un modul prea mare (> M), apare eroarea 

numită de depăşire superioară (overflow). Când rezultatul este prea mic în valoare 

absolută (< m, dar nenulă), eroarea se numeşte de depăşire inferioară (underflow). 

Desigur, orice algoritm bine conceput trebuie să specifice cum se procedează în 

eventualitatea unor depăşiri şi, mai ales, să încerce evitarea lor (vom explica în 

capitolul următor tehnica folosită — scalarea). Depăşirea inferioară nu constituie 

de regulă o eroare gravă, de aceea majoritatea calculatoarelor atribuie automat 

rezultatului valoarea zero. În cazul unei depăşiri superioare, de obicei calculele sunt 

oprite sau, cel puţin, este afişat un mesaj de avertisment. În standardul IEEE pentru 

virgulă mobilă, există o valoare specială, numită Inf (infinit), care este atribuită 

rezultatului în cazul unei depăşiri superioare; calculele continuă cu această valoare; 

rezultatele se obţin conform regulilor uzuale de lucru cu infinităţi. O altă valoare 

specială – NaN (Not a Number) – este atribuită rezultatelor nedefinite, ca 0 · ∞, 

0/0, ∞/∞; o operaţie implicând NaN are întotdeauna ca rezultat NaN. 

Relaţia (0.7) garantează că o operaţie aritmetică introduce erori relative mici, 

de ordinul β −t (adică al lui epsilon maşină). O problemă fundamentală a calculului 

numeric este evaluarea mărimii erorii ce afectează rezultatul în cazul unei secvenţe 

de operaţii. 

Pentru a aborda problema, să considerăm două exemple în care apar erori numerice 

mari, dar din cauze esenţial diferite. Lucrăm în FVM cu (β, t, p) = (10, 3, 1). 

Pentru a evita confuziile, vom nota cu ⊕, ⊖, ⊗ şi ⊘ adunarea, scăderea, înmulţirea, 

respectiv împărţirea în VM; deci x + y este suma exactă, iar x ⊕ y = fl(x + y) este 

suma calculată în VM. 

Exemplul 0.6 În calculul rădăcinilor polinomului de gradul al doilea ax2 + bx + c, 

cu a ≠ 0, este necesar calculul expresiei b 2 − 4ac. Considerând b = 3.34, a = 1.22, 

c = 2.28, avem b 2 −4ac = 0.0292, în timp ce, rotunjind prin tăiere, b ⊗b = 4 ⊗a⊗c 

= 11.1, deci b ⊗ b − 4 ⊗ a ⊗ c = 0. Rezultatul calculat are toate cifrele semnificative 

eronate, iar eroarea relativă aferentă este egală cu 1; totuşi, pentru fiecare operaţie 

în parte, eroarea relativă este mai mică decât 10 −2 . 

♦ 

Exemplul 0.7 Dacă polinomul de gradul II are rădăcini reale, acestea se calculează 

de obicei utilizând formulele 

x 1 = −b − √ b 2 − 4ac 

2a 

, x 2 = −b + √ b 2 − 4ac 

. (0.8) 

2a 

Luând b = 10.1, a = 0.0123, c = 32.4, valoarea exactă rotunjită la 3 cifre 

semnificative a lui x 2 este −3.22. Efectuând calculele în formatul ales, obţinem 

∆ = b ⊗ b ⊖ 4 ⊗ a ⊗ c = 100 (în loc de 100.41, dar eroarea relativă e încă de ordinul

0.2. ARITMETICA ÎN VIRGULĂ MOBILĂ 9 

10 −3 ); dar −b ⊕ SQRT(∆) = −0.1, în timp ce −b + √ b 2 − 4ac = −0.0792, eroarea 

relativă fiind acum 0.26. Valoarea calculată a rădăcinii x 2 este −4.06, în timp ce 

valoarea exactă este −3.22; din nou toate cifrele semnificative ale rezultatului sunt 

eronate. 

♦ 

Se observă că, în ambele exemple, erorile mari apar după scăderea a două numere 

de valori apropiate. Se produce o anulare catastrofală, adică o pierdere completă a 

cifrelor semnificative ale rezultatului. În primul caz anularea trebuie pusă integral 

pe seama operaţiei matematice de scădere; problema calculului b 2 − 4ac este cauza 

erorilor, şi nu algoritmul de calcul. În schimb, în al doilea caz, algoritmul de calcul 

al rădăcinilor este de vină, deoarece nu evită scăderea a două numere apropiate, 

deşi aceasta este posibil, după cum vom vedea puţin mai târziu. Să studiem întâi 

mai amănunţit ce se întâmplă la scăderea a două numere apropiate. 

Exemplul 0.8 Considerăm două numere reale, x şi y, de acelaşi ordin de mărime 

(cu x > y, pentru simplitate), ale căror prime k cifre coincid, cu următoarele 

reprezentări (exacte) în baza β (d 1 ≠ 0): 

x = 0.d 1 d 2 . . . d k d k+1 . . . d t 1 · β e , 

y = 0.d 1 d 2 . . . d k c k+1 . . .c t 0 · β e . 

Rotunjind prin tăiere, reprezentările lor într-un FVM cu (β, t, p) sunt 

Diferenţa lor, calculată în VM, este 

ˆx = fl(x) = 0.d 1 d 2 . . . d k d k+1 . . . d t · β e , 

ŷ = fl(y) = 0.d 1 d 2 . . .d k c k+1 . . . c t · β e . 

ˆx ⊖ ŷ = 0.f 1 . . .f t−k 0 . . .0 · β −k+e . 

Observăm că ˆx − ŷ = ˆx ⊖ ŷ, deci scăderea se efectuează fără erori. În schimb, 

rezultatul scăderii cu valorile exacte ale operanzilor este 

x − y = 0.f 1 . . . f t−k 10 . . .0 · β −k+e , 

iar eroarea relativă asociată lui este 

(x − y) − (ˆx − ŷ) 

∣ x − y ∣ ≥ β−t+1+e 

β −k+e = β −t−1+k . 

În concluzie, observăm că operanzii scăderii sunt afectaţi de erori relative de reprezentare 

de ordinul β −t−1 , în timp ce rezultatul ei are o eroare relativă de ordinul 

β −t−1+k ; atunci când x şi y au multe cifre semnificative identice, deci k aproape de 

t, (şi acelaşi ordin de mărime) eroarea asociată rezultatului scăderii poate deveni 

uriaşă. 

♦ 

Exemplul 0.8 arată că adunarea (scăderea) nu introduce erori mari prin ea însăşi, 

ci potenţează — în anumite cazuri — erorile operanzilor. 

De aceea, scăderea numerelor apropiate trebuie evitată. Pentru aceasta, dacă 

este posibil, algoritmul de calcul este cel care trebuie modificat.


Exemplul 0.9 Am constatat, în exemplul 0.7, că formulele (0.8) nu sunt cele 

mai bune din punct de vedere numeric, mai ales când b 2 ≫ 4ac, şi deci |b| ≈ √ ∆. 

Pentru a evita scăderea unor numere apropiate, se pot folosi formulele 

x 1 = −b − sgn(b)√ b 2 − 4ac 

, x 2 = 

2a 

−2c 

b + sgn(b) √ b 2 − 4ac . (0.9) 

Utilizând în (0.9) valorile numerice din exemplul 0.7, se obţine, în FVM de lucru, 

un rezultat cu toate cifrele semnificative exacte. 

♦ 

0.3 Condiţionarea problemelor de calcul 

Orice problemă de calcul numeric impune obţinerea unor rezultate numerice, pornind 

de la date de intrare numerice, astfel încât rezultatele să poată fi interpretate ca o 

aproximaţie a soluţiei unei probleme matematice pentru datele de intrare respective. 

Pentru ca o astfel de problemă să fie bine definită, trebuie asigurate existenţa şi 

unicitatea soluţiei. În acest caz, o problemă de calcul numeric poate fi întotdeauna 

descrisă ca evaluare a unei funcţii 

f : D ⊂ R n −→ R m (0.10) 

într-un punct x ∈ D dat. Cele n componente ale argumentului constituie datele 

de intrare, iar cele m componente ale vectorului f(x) sunt rezultatele sau datele de 

ieşire. 

Desigur, aplicaţia f este de cele mai multe ori definită implicit iar descoperirea 

unei căi prin care calculul valorii f(x) devine posibil echivalează cu rezolvarea, 

printr-un algoritm specific, a problemei de calcul considerate. 

Exemplul 0.10 a) Fie D o mulţime de trei numere reale şi 

⎡ ⎤ 

x = 

⎣ a b 

c 

Rezolvarea ecuaţiei de gradul II 

⎦ ∈ D = {x ∈ R 3 | a ≠ 0, b 2 − 4ac ≥ 0} ⊂ R 3 . 

ay 2 + by + c = 0 

este o problemă numerică bine definită, deoarece pentru orice x ∈ D există un unic 

vector 

⎡ 

−b − sgn(b) √ b 2 ⎤ 

− 4ac 

[ ] 

y1 

2a 

y = f(x) = = ⎢ 

⎥ 

y 2 ⎣ −2c ⎦ ∈ R2 , 

care este soluţia problemei. 

b) Calculul integralei 

∫ b 

a 

b + sgn(b) √ b 2 − 4ac 

e −t2 dt,

0.3. CONDIŢIONAREA PROBLEMELOR DE CALCUL 11 

unde a, b ∈ R sunt date (a ≠ b), este de asemenea [ ] o problemă numerică bine definită. 

a 

Într-adevăr, pentru datele de intrare x = ∈ D = R 

b 

2 , există şi este unică 

valoarea integralei y ∈ R, deşi integrala nedefinită ∫ e −t2 dt nu este exprimabilă 

prin funcţii elementare. 

♦ 

Abaterea soluţiei calculate faţă de soluţia exactă a unei probleme numerice poate 

avea două surse esenţial diferite, legate de problemă în sine şi, respectiv, de algoritmul 

de calcul utilizat. De prima sursă de erori — numită condiţionarea problemei 

— ne ocupăm în continuare, de cea de-a doua — stabilitatea algoritmului — în 

paragraful următor. 

Condiţionarea problemei caracterizează sensibilitatea soluţiei în raport cu perturbaţiile 

datelor de intrare. În practică este cunoscută doar o aproximaţie ˆx a datelor 

de intrare x şi, în cel mai bun caz, presupunând că toate calculele se efectuează 

exact, putem calcula f(ˆx) în loc de f(x). Dacă funcţia f definind problema noastră 

este prea sensibilă la variaţii ale argumentului, f(ˆx) şi f(x) pot diferi semnificativ 

chiar în cazul unei erori relative mici ‖x − ˆx‖ / ‖x‖ a datelor de intrare (‖ · ‖ este o 

normă adecvată). O astfel de problemă este numită rău condiţionată. 

Dacă încercăm rezolvarea unei probleme rău condiţionate pornind de la date 

inexacte, atunci soluţia obţinută va fi însoţită de erori mari indiferent de felul în 

care este calculată ! 

Definiţia 0.3 Condiţionarea numerică sau sensibilitatea locală a unei probleme 

f : D ⊂ R n → R m într-un punct x ∈ D este exprimată de amplificarea erorii relative 

‖f(x) − f(ˆx)‖ ‖x‖ 

κ(x) = 

‖f(x)‖ ‖x − ˆx‖ , (0.11) 

pentru x ≠ 0 şi f(x) ≠ 0. Când κ(x) este mic (de ordinul unităţii, de exemplu) 

problema este numită bine condiţionată în punctul x. Altfel, problema este rău 

condiţionată. 

Observaţia 0.2 Dacă f este Lipschitz continuă, i.e. există L astfel încât 

atunci 

‖f(x) − f(y)‖ ≤ L‖x − y‖, 

κ(x) ≤ L ‖x‖ 

‖f(x)‖ , 

iar dacă f este de clasă C 1 iar x este apropiat de y, atunci L se poate lua ‖f ′ (x)‖, 

unde f ′ este derivata lui f în punctul x. 

♦ 

Subliniem faptul că condiţionarea este o proprietate locală. De obicei, totuşi, o 

problemă este numită bine condiţionată dacă este bine condiţionată în orice punct 

x ∈ D; de asemenea, este numită rău condiţionată, dacă există puncte x ∈ D în 

care este rău condiţionată. 

Exemplul 0.11 Problema calculului sumei a două numere x, y ∈ R poate fi 

bine sau rău condiţionată funcţie de valorile lui x şi y (datele de intrare). (Aici


[ x 

f(x, y) = x + y, f : R 2 −→ R; convenim să scriem şi f(x, y) în loc de f( 

y 

cum ar cere (0.10).) 

Presupunem că ˆx, ŷ sunt aproximări ale lui x, respectiv y, afectate de erori 

relative de acelaşi ordin de mărime, γ; mai precis, 

ˆx = x + ε x x, cu |ε x | ≤ γ ≪ 1, 

ŷ = y + ε y y, cu |ε y | ≤ γ. 

Eroarea relativă asociată sumei este (calculul sumei se face exact) 

ε = |x + ε xx + y + ε y y − (x + y)| 

|x + y| 

Dacă x şi y au acelaşi semn, atunci 

ε ≤ |ε xx| + |ε y y| 

|x| + |y| 

≤ γ 

] 

), 

= |ε xx + ε y y| 

. (0.12) 

|x + y| 

şi suma este afectată de o eroare de acelaşi ordin de mărime ca şi operanzii; în acest 

caz, adunarea este bine condiţionată. 

Dacă x şi y au semne diferite, este posibil (atunci când ε x şi ε y au şi ele semne 

diferite) ca ε şi 

γ · max(|x|, |y|) 

θ = 

|x + y| 

să aibă acelaşi ordin de mărime. Dar dacă |x + y| ≪ max(|x|, |y|), ceea ce se 

întâmplă atunci când x şi y au valori apropiate, atunci θ ≫ γ. În acest caz, 

problema calculului sumei este rău condiţionată. Exemplele 0.6, 0.7, 0.8 ilustrează 

această situaţie. Pentru a vedea câte subtilităţi ascunde calculul aparent simplu al 

unei sume, cititorul este invitat să consulte []. 

♦ 

0.4 Stabilitatea numerică a algoritmilor 

Pentru a rezolva o problemă de calcul numeric definită de funcţia (0.10), un calculator 

execută o secvenţă (finiţă) bine precizată de operaţii denumită algoritm. În 

general există mai mulţi algoritmi pentru rezolvarea unei probleme. Un algoritm 

ˆf pentru problema f produce un răspuns unic determinat pentru date de intrare 

fixate şi deci poate fi exprimat matematic printr-o funcţie 

ˆf : D ∩ F ⊂ R n −→ R m . 

Deoarece execuţia unui algoritm se face folosind numere în FVM şi calculele sunt 

însoţite de erori, este clar că ˆf(x) este de regulă diferit de f(x). De asemenea, nu ne 

putem aştepta ca algoritmul ˆf să calculeze soluţia unei probleme rău condiţionate 

mai precis decât o garantează datele de intrare. Totuşi, e de dorit ca ˆf să nu introducă 

erori exagerat de mari. Noţiunea de stabilitate numerică exprimă mărimea 

erorilor numerice introduse de un algoritm, în ipoteza că datele iniţiale sunt exacte.

0.4. STABILITATEA NUMERICĂ A ALGORITMILOR 13 

x 

✻ 

Eroare ”înapoi” 

❄ 

ˆx 

f 

f 

ˆf 

f(x) 

 

❅■ 

❅❅❅ ❅ 

❅ 

Eroare ”înainte” 

❅ 

❅❘ ˆf(x) = f(ˆx) 

Date de intrare 

Date de ieşire 

Fig. 0.3: Erori înainte şi înapoi 

Definiţia 0.4 Un algoritm ˆf, destinat rezolvării problemei f, este numeric stabil 

dacă una dintre următoarele două condiţii alternative este îndeplinită: 

i) ˆf(x) este aproape de f(x) pentru orice intrare x, adică soluţia calculată aproximează 

bine soluţia exactă. 

ii) pentru orice intrare x, există un ˆx ∈ D apropiat de x astfel încât f(ˆx) să fie 

egal cu ˆf(x), adică soluţia calculată de algoritmul ˆf cu date de intrare exacte este 

egală cu soluţia exactă pentru nişte date de intrare uşor perturbate. 

Altfel, algoritmul este numeric instabil. 

Cele două condiţii sunt similare, doar că prima se formulează în spaţiul datelor 

de ieşire, iar a doua în spaţiul datelor de intrare, după cum se poate remarca 

în figura 0.3; în mod plastic, eroarea (absolută) ˆf(x) − f(x) este numită eroare 

”înainte”, deoarece corespunde sensului de calcul al algoritmului, iar ˆx − x eroare 

”înapoi”, deoarece găsirea unui ˆx care să satisfacă ii) înseamnă întoarcerea în 

spaţiul datelor de intrare, ulterior aplicării algoritmului. Analiza stabilităţii numerice 

a unui algoritm înseamnă cuantificarea erorilor din definiţia 0.4; evaluarea 

‖ ˆf(x)−f(x)‖ este caracteristică analizei înainte (directe); evaluarea ‖ˆx−x‖ defineşte 

analiza înapoi (inversă). 

Noţiunea vagă ”aproape” se poate reexprima prin cea de eroare relativă mică 

(noţiune destul de vagă şi ea); în calculul numeric se folosesc deseori astfel de 

exprimări. În mod sigur, o eroare relativă de ordinul erorii de rotunjire (introduse 

de (0.7)) caracterizează un algoritm numeric stabil 1 : soluţia este calculată cu 

precizia intrinsecă a FVM utilizat. 

Este uşor de arătat că utilizarea unui algoritm stabil la rezolvarea unei probleme 

bine condiţionate conduce la un rezultat de înaltă acurateţe 2 . 

Într-adevăr, din definiţia 0.4 varianta ii), pentru intrarea exactă x există ˆx astfel 

încât eroarea relativă este (să zicem) de ordinul erorii de rotunjire 

‖x − ˆx‖ 

‖x‖ 

≤ µβ −t 

1 În continuare, vom spune ”algoritm stabil” în loc de ”algoritm numeric stabil”. 

2 Atragem atenţia asupra sensurilor diferite pe care le au în calculul numeric termenii precizie şi 

acurateţe, aproape sinonimi în limbajul uzual. Precizia se referă la numărul de cifre semnificative 

din FVM, iar acurateţea la mărimea erorii dintre rezultatul calculat numeric şi cel exact.


şi 

f(ˆx) = ˆf(x). (0.13) 

Problema fiind bine condiţionată, din (0.11) rezultă că 

‖f(x) − f(ˆx)‖ 

‖f(x)‖ 

‖x − ˆx‖ 

= κ ≤ κµβ −t , (0.14) 

‖x‖ 

unde κ şi µ sunt de ordinul unităţii. Deci, din (0.13) şi (0.14), 

‖f(x) − ˆf(x)‖ 

‖f(x)‖ 

≤ κµβ −t , 

adică un algoritm stabil nu introduce erori suplimentare semnificative în rezolvarea 

unei probleme bine condiţionate. 

În mod similar, se poate observa că, în alte situaţii (de exemplu pentru probleme 

rău condiţionate sau pentru algoritmi instabili), mărimea erorii asociate rezultatului 

nu poate fi apreciată. Când un algoritm stabil este folosit pentru a rezolva 

o problemă rău condiţionată, nu există nici o garanţie că f(ˆx) şi f(x) au valori 

apropiate şi, deşi f(ˆx) este (aproximativ) egal cu ˆf(x), diferenţa dintre f(x) şi ˆf(x) 

poate fi semnificativă. Când un algoritm instabil este folosit pentru rezolvarea unei 

probleme bine condiţionate, soluţia calculată ˆf(x) pentru date exacte de intrare 

este soluţie exactă a problemei cu ˆx departe de x, şi tot aşa este f(ˆx) de f(x). În 

sfârşit, nu e nici o speranţă de a obţine erori mici atunci când un algoritm instabil 

este utilizat pentru o problemă rău condiţionată. 

Exemplul 0.12 Revenim la problema calculului sumei, f : R 2 −→ R, 

f(x, y) = x + y. Problema poate fi bine sau rău condiţionată în funcţie de datele 

de intrare (vezi exemplul 0.11). 

”Algoritmul” de calcul al sumei în virgulă mobilă ˆf : R 2 −→ R este 

ˆf(x, y) = x ⊕ y = fl(x + y), 

unde fl este o funcţie de rotunjire care respectă relaţia (0.7), iar x şi y sunt numere 

în FVM; deci, în conformitate cu (0.7), 

ˆf(x, y) = x(1 + ρ) + y(1 + ρ), 

cu |ρ| de ordinul β −t , adică suma calculată este suma exactă a operanzilor uşor 

perturbaţi, şi deci algoritmul de sumare este stabil. 

♦ 

Exemplul 0.13 Să analizăm acum algoritmul de calcul al mărimii 

f(a, b, c) = b 2 − 4ac. Presupunem că a, b, c sunt numere în FVM. În conformitate 

cu (0.7) avem 

ˆf(a, b, c) = b ⊗ b ⊖ 4 ⊗ a ⊗ c = [b 2 (1 + ρ 1 ) − 4ac(1 + ρ 2 )](1 + ρ 3 ), 

cu |ρ 1 |, |ρ 2 |, |ρ 3 | de ordinul β −t ; am presupus că 4 ⊗ a se calculează fără erori, ceea 

ce e adevărat în baza 2, dar nu şi în baza 10.

0.5. 

CALITĂŢILE UNUI ALGORITM NUMERIC 15 

Definind 

â = a(1 + ρ 2 ), ˆb = b 

√ 

(1 + ρ1 )(1 + ρ 3 ), ĉ = c(1 + ρ 3 ), 

constatăm că 

ˆf(a, b, c) = ˆb 2 − 4âĉ, 

şi â, ˆb, ĉ sunt aproape de a, b, respectiv c (în sensul |â − a|/|a| de ordinul β −t etc.). 

Condiţia ii) a definiţiei 0.4 este îndeplinită, deci algoritmul este stabil. ♦ 

Exemplul de mai sus este o ilustrare foarte simplă a analizei inverse a erorilor 

de rotunjire ale unui algoritm. În această tehnică se utilizează limitele (0.7) ale 

erorilor introduse de operaţiile în virgulă mobilă pentru a demonstra că soluţia 

calculată a unei probleme este soluţia exactă a problemei cu date de intrare uşor 

perturbate. O astfel de demonstraţie garantează că algoritmul este numeric stabil şi, 

pentru probleme bine condiţionate, sunt asigurate erori relative mici ale rezultatelor 

calculate. 

Pentru probleme nebanale, a arăta că un anume algoritm este stabil poate fi 

o sarcină dificilă. Există foarte puţini algoritmi pentru care există o demonstraţie 

completă a stabilităţii numerice. Totuşi, mulţi algoritmi importanţi au fost validaţi 

în practică printr-o experienţă de zeci de ani. Cum spunea Wilkinson: ”scopul 

principal al analizei erorilor nu este de a stabili margini precise, ci de a evidenţia 

instabilităţile potenţiale ale unui algoritm, dacă ele există, şi, prin aceasta, de a găsi 

o cale de îmbunătăţire a algoritmului” [IV]. 

În această lucrare vom fi interesaţi mai mult de prezentarea celor mai buni algoritmi 

care rezolvă o problemă, şi mai puţin de demonstrarea — aproape întotdeauna 

extrem de ”tehnică” — a stabilităţii lor numerice. 

0.5 Calităţile unui algoritm numeric 

Pentru a încheia acest capitol, să precizăm criteriile după care se apreciază calitatea 

unui algoritm numeric. 

• Numărul de operaţii. Timpul de execuţie al unui program — pe un calculator 

precizat — este o caracteristică de prim ordin a acestuia. De regulă, un program se 

execută de mai multe ori, pentru a rezolva o anume problemă pentru diverse date 

de intrare; timpul de execuţie permite aprecierea numărului de soluţii care se pot 

obţine într-un anumit timp, de obicei impus. 

Desigur, este de dorit a estima timpul de execuţie al unui program înainte de 

crearea sa efectivă, numai pe baza algoritmului implementat de program. O bună 

măsură este numărul de operaţii aritmetice efectuate; în algoritmii numerici ele 

constituie de obicei partea majoritară a operaţiilor, cele cu întregi sau logice având 

o pondere mică, atât ca număr, cât şi ca durată de execuţie. 

Numim flop o operaţie aritmetică elementară (adunare, scădere, înmulţire, împărţire). 

Numărul de operaţii al unui algoritm este numărul de flopi necesari 

obţinerii rezultatului. Trebuie precizat că deşi numărul de operaţii poate indica 

doar cu aproximaţie timpul de execuţie pe un calculator dat, în schimb este o foarte 

bună măsură pentru compararea a doi algoritmi.


De regulă, numărul de operaţii N op al unui algoritm e funcţie de dimensiunea 

problemei care, de multe ori, poate fi apreciată prin numărul datelor de intrare, 

N op = f(n). În calculul numeric, de obicei f este un polinom (de grad mic), 

f(n) = a 0 n k + a 1 n k−1 + . . . + a k . Pentru că f poate avea o expresie complicată, se 

păstrează doar termenul cel mai semnificativ şi se scrie N op ≈ a 0 n k . O astfel de 

aproximare este cu atât mai bună cu cât n este mai mare. Pentru aprecieri pur 

calitative, vom omite a 0 şi vom scrie 3 N op = O(n k ). 

• Memoria ocupată. Pentru execuţia unui algoritm (program) este necesară 

memorarea datelor de intrare, rezultatelor, precum şi a altor valori intermediare. 

Numărul de elemente în FVM necesare în acest scop se numeşte memoria ocupată 

de algoritm. 

În majoritatea cazurilor, datele de intrare nu mai sunt necesare la terminarea algoritmului. 

Spaţiul de memorie ocupat de ele poate fi utilizat pe parcursul execuţiei 

algoritmului pentru a memora rezultate parţiale şi/sau finale. În acest caz se spune 

că efectuăm calculele pe loc. 

• Stabilitatea numerică, discutată în paragraful anterior, arată acurateţea rezultatelor 

obţinute de algoritmul numeric (în ipoteza că datele iniţiale sunt exacte). 

Aceste trei criterii trebuie corelate cu viteza calculatorului, memoria disponibilă, 

numărul de cifre semnificative al FVM utilizat. 

Desigur, nu trebuie uitată nici un moment condiţionarea problemei, care influenţează 

şi ea acurateţea rezultatului. Interesează în special performanţele algoritmului 

pentru probleme rău condiţionate, adică atunci când erorile datelor de intrare sunt 

mult amplificate. În orice caz, calculul soluţiei e bine a fi însoţit de determinarea 

(sau estimarea) condiţionării problemei, adică de calculul unei cantităţi de tip (0.11). 

Putem adăuga astfel un al patrulea criteriu de apreciere a unui algoritm: 

• Siguranţa în funcţionare – capacitatea de a semnala situaţiile în care rezultatul 

poate fi afectat de erori importante datorate relei condiţionări a problemei. Decizia 

de a utiliza sau nu un astfel de rezultat revine utilizatorului sau unui program 

expert. 

0.6 Implicaţiile arhitecturii calculatoarelor asupra 

organizării algoritmilor 

În consideraţiile din secţiunea precedentă am presupus calculatorul pe care se vor 

implementa algoritmii ca având arhitectura clasică von Neumann, schiţată în figura 

0.4a; pe un astfel de calculator, în principiu, pentru fiecare operaţie aritmetică 

se aduc operanzii din memoria M în unitatea centrală UC, se execută operaţia şi 

rezultatul este depus înapoi în M. Cu acest mod de operare, timpul de execuţie 

e dictat esenţialmente de numărul de operaţii în virgulă mobilă, durata traficului 

între M şi UC fiind proporţională cu numărul de flopi. 

În ultimele două decenii au apărut numeroase tipuri de arhitecturi pe care timpul 

de execuţie a unui algoritm nu mai este proporţional cu numărul de operaţii în 

3 Se scrie f(n) = O(g(n)) dacă există două constante c 1 , c 2 astfel încât c 1 g(n) ≤ f(n) ≤ c 2 g(n).

0.6. IMPLICAŢIILE ARHITECTURII CALCULATOARELOR 17 

UC 

❄ 

UC 

✻ 

UCS 

❄ 

UCV 

✻ 

❄ 

MR 

❄ 

✻ 

✻ 

M 

M 

MP 

(a) (b) (c) 

Fig. 0.4: Arhitecturi de calculatoare: (a) von Neumann; (b) vectorială; (c) cu 

memorie ierarhică 

virgulă mobilă. Vom exemplifica în continuare cu două arhitecturi larg răspândite, 

în special în gama calculatoarelor de mare performanţă. 

Calculatoarele vectoriale au două (tipuri de) unităţi de calcul, ca în figura 

0.4b. Una dintre unităţi – UCS – este obişnuită; ea execută operaţii scalare, adică 

operaţiile aritmetice uzuale. Cealaltă – UCV – este dedicată operaţiilor vectoriale, 

adică unor operaţii aritmetice de acelaşi tip repetate pentru mai multe perechi de 

date; de exemplu, adunarea a n perechi de numere, x i + y i , i ∈ 1 : n. Dacă pe un 

calculator von Neumann nu e nici o diferenţă de viteză între astfel de operaţii, pe 

calculatoarele vectoriale se execută mult mai rapid operaţiile vectoriale; explicaţia e 

relativ simplă: UCV e astfel construită încât datele o parcurg ca pe o bandă rulantă 

cu mai multe posturi de lucru, fiecare pereche de date suferind la un moment dat 

o altă operaţie intermediară (dacă sunt p posturi de lucru, timpul de producere a 

unui rezultat este de aproximativ p ori mai mic). La aceasta se adaugă şi un mod de 

comunicaţie sofisticat între M şi UCV, astfel încât UCV să poată fi în permanenţă 

alimentată cu date. În schimb, UCS prelucrează doar o pereche de date la un moment 

dat. Deci, un algoritm eficient pe un calculator vectorial va conţine mai ales 

operaţii de tip vectorial. 

Calculatoarele cu memorie ierarhică au structura sugerată în figura 0.4c. Principala 

noutate a acestei arhitecturi este organizarea memoriei pe cel puţin două 

niveluri. Timpul de acces la memorie creşte odată cu distanţa dintre unitatea centrală 

şi memoria respectivă; memoria rapidă (MR) are un timp de acces sensibil 

mai mic decât cel al memoriei principale (MP), dar şi o capacitate mult mai mică; 

aceste caracteristici provin mai ales din tehnologia de realizare, diferită de cea a 

memoriei principale (totuşi, în mod natural, o memorie mai mică este mai rapidă). 

Transferurile între UC şi MR durează puţin în comparaţie cu timpul de execuţie 

al unei operaţii în virgulă mobilă; în schimb, transferurile între MR şi MP durează 

mai mult. De aceea, un algoritm eficient pe un calculator cu memorie ierarhică are 

un număr cât mai mic de transferuri implicând MP, acesta fiind criteriul principal de


apreciere, şi nu numărul de operaţii. Caracteristica tipică a unui astfel de algoritm 

este organizarea calculelor la nivel de bloc de matrice, operându-se intensiv cu date 

aflate într-o aceeaşi zonă de memorie, suficient de mică pentru a încăpea în MR. 

Concluzia care se impune este că utilizarea unui acelaşi algoritm pentru rezolvarea 

unei anume probleme pe toate arhitecturile ar fi ineficientă. Vom sugera, 

în capitolele următoare, metode de creştere a eficienţei algoritmilor pe calculatoare 

vectoriale şi cu memorie ierarhică. De obicei, este necesară doar o reorganizare 

a calculelor; alteori, însă, algoritmi noi se dovedesc mult mai eficienţi pe aceste 

arhitecturi. 

O altă clasă de arhitecturi de mare performanţă cuprinde calculatoarele paralele. 

Acestea au mai multe procesoare identice care pot lucra independent şi care 

cooperează printr-un mediu de comunicaţie (legături directe sau memorie comună). 

Algoritmii eficienţi pe arhitecturi paralele au multe caracteristici ce îi diferenţiază 

net de cei secvenţiali; tratarea lor impune instrumente specifice, de aceea nu îi vom 

aborda în prezenta lucrare, ci în una următoare, dedicată numai lor. Pentru o 

introducere în materie, cititorul interesat poate consulta capitolul 6 din [VI]. 

0.7 Probleme 

P 0.1 Următorul exemplu arată că adunarea în virgulă mobilă nu este asociativă. Să 

considerăm numerele x 1 = 0.001, x 2 = 1, x 3 = −1, reprezentate într-un FVM cu β = 10, 

t = 3. Cât de mare este eroarea relativă atunci când se calculează y = x 1 + x 2 + x 3 

P 0.2 Găsiţi o limită a erorii relative pentru calculul în virgulă mobilă al sumei 

y = x 1 + x 2 + x 3; presupuneţi că x 1, x 2, x 3 sunt numere în virgulă mobilă. 

P 0.3 Să considerăm problema calculului soluţiei ecuaţiei liniare ax + b = 0, cu a, b ∈ R, 

a ≠ 0. Pentru ce valori ale datelor de intrare a, b este această problemă rău condiţionată 

”Algoritmul” pentru calculul soluţiei este x = −b/a; este acest algoritm numeric stabil 

P 0.4 Aceeaşi întrebare pentru ecuaţia (a 1 +a 2)x+(b 1+b 2) = 0, în care datele de intrare 

sunt a 1, a 2, b 1, b 2 ∈ R. 

P 0.5 Se consideră un FVM definit de (β, t, p). Care este distanţa între 1 şi cel mai 

apropiat număr reprezentabil în virgulă mobilă, mai mare ca 1 

P 0.6 Găsiţi limita (superioară) a erorii relative a funcţiei de rotunjire care asociază 

fiecărui x ∈ [−M, M] cel mai apropiat număr în virgulă mobilă. 

P 0.7 Ce formulă recomandaţi pentru calculul în virgulă mobilă: x 2 −y 2 sau (x−y)(x+y) 

(Se presupune că x şi y sunt numere în FVM.)

Capitolul 1 

Algoritmi elementari de 

calcul numeric 

Acest capitol este dedicat prezentării noţiunilor matematice aflate la baza dezvoltărilor 

ulterioare, formulării problemelor de calcul pe care le vom rezolva, în 

diverse variante, pe întreg parcursul lucrării, precum şi descrierii unor primi algoritmi 

numiţi ad-hoc elementari, unii folosiţi ca unelte mai târziu, alţii deja rezolvând 

probleme sau cazuri particulare ale unor probleme semnificative. 

Noţiunile matematice aparţin în mare majoritate algebrei liniare. Am încercat 

o prezentare de sine stătătoare, dar, desigur, cunoştinţele anterioare ale cititorului 

sunt binevenite. 

Fiecare secţiune a capitolului are două părţi: prima, cu nuanţă teoretică, de 

parcurgere a unor definiţii şi proprietăţi fundamentale; a doua, de ”aspecte algoritmice”, 

în care sunt prezentaţi şi analizaţi algoritmi simpli, moduri de memorare 

a datelor, artificii numerice etc. Subtitlurile acestor din urmă părţi vor începe cu 

sigla AA. 

Principalii algoritmi prezentaţi rezolvă următoarele probleme: produsul matriceal 

(cu diversele lui cazuri particulare: produsul scalar, produsul exterior, produsul 

matrice-vector), calculul normelor vectoriale şi matriceale, rezolvarea sistemelor 

liniare triunghiulare şi calculul valorilor şi vectorilor proprii ai matricelor 

triunghiulare. Sunt prezentate modalităţile prin care se măresc performanţele algoritmilor 

pe diverse arhitecturi de calculatoare. Capitolul se încheie cu prezentarea 

rutinelor BLAS, extrem de utilizate în calculul numeric. 

1.1 Vectori. Spaţiul vectorial R n 

În această lucrare vom utiliza de regulă entităţi (vectori şi matrice) construite cu 

numere reale; majoritatea definiţiilor şi proprietăţilor sunt valabile şi pentru numere 

complexe; vom face diferenţierile necesare atunci când va fi cazul. Un număr real 

α ∈ R va fi numit şi scalar; scalarii vor fi notaţi de obicei cu litere greceşti mici.

20 CAPITOLUL 1. ALGORITMI ELEMENTARI 

✻ 

✻ 

x 3 

✏✶ 

x 2 ✑✥✥✥✥✥✥ 

✑ 

✏✑ 

✏✏✏✏✏✏ 

✑ 

✑ 

✑ 

✑ 

✑✰ 

(a) 

x 1 

x 

✲ 

1 

✻ 

e 3 ✑ 

✑ 

✑ 

✲ 

✑ e ✑ 1 

1 

1 

✑ 

✑✰ e 2 

✑✰ 

(b) 

✲ 

Fig. 1.1: (a) Un vector în R 3 şi coordonatele sale; (b) vectorii unitate în R 3 

Vectori. Un vector real x de dimensiune n este o colecţie de n numere reale 

dispuse ordonat într-o coloană 

⎡ 

x = ⎢ 

⎣ 

⎤ 

x 1 

x 2 

⎥ 

. 

x n 

⎦ , (1.1) 

numerele x i fiind numite componente (elemente, sau coordonate) ale vectorului x. 

În general, vom nota vectorii cu litere latine mici, iar elementele lor cu litera respectivă 

şi indicele poziţiei. Pentru economie de spaţiu tipografic, vom nota deseori 

x = [x 1 . . . x n ] T , unde x T = [x 1 . . . x n ] este vectorul linie cu aceleaşi elemente ca 

în (1.1), iar indicele superior T denotă operaţia de transpunere. 

Mulţimea tuturor vectorilor de dimensiune n va fi notată cu R n şi va fi asimilată 

cu spaţiul real n-dimensional. În consecinţă, din punct de vedere geometric, un 

vector reprezintă segmentul orientat care uneşte originea spaţiului real cu n dimensiuni 

cu punctul de coordonate (x 1 , . . . , x n ), sau chiar numai acest din urmă punct. 

Vectorul cu toate componentele nule va fi notat cu 0, dimensiunea sa reieşind din 

context; geometric, acesta este originea spaţiului n-dimensional. Pentru o mai bună 

înţelegere, vom ilustra unele concepte în R 2 sau R 3 ; figura 1.1a prezintă un vector 

şi semnificaţia (de coordonate) a elementelor sale. 

Vectorii din R n care au un element egal cu 1 şi celelalte nule se numesc vectori 

unitate; ei vor fi notaţi 

e i = [0 . . . 0 

} {{ } 

i−1 

1 0 

} 

. 

{{ 

. . 0 

} 

] T , 

n−i 

indicele arătând poziţia valorii 1. Spre exemplu, vectorii unitate din R 3 sunt 

prezentaţi în figura 1.1b. 

Doi vectori sunt egali când toate componentele lor de acelaşi indice sunt egale; 

deci, dacă x, y ∈ R n , atunci x = y când x i = y i , ∀i ∈ 1 : n.

1.1. VECTORI. SPAŢIUL VECTORIAL R N 21 

✡✣ 

✡ 

✘✘ ✡ ✡ ✘✘✘ ✘ ✘✘✘ ✘ ✘ ✘✿ 

y 

x + y 

✲✡ ✡ 

x 

(a) 

x 

✲ 

αx 

(b) 

✲ 

Fig. 1.2: (a) Suma a doi vectori în R 2 ; (b) Produsul cu un scalar 

Introducem acum operaţiile elementare cu vectori. 

Suma a doi vectori x, y ∈ R n este vectorul z ∈ R n definit prin z i = x i + y i , 

i ∈ 1 : n; aşadar, suma se face pe componente. În acest fel sunt moştenite toate 

proprietăţile adunării numerelor reale: 

1. asociativitate (u + (v + w) = (u + v) + w); 

2. comutativitate (u + v = v + u); 

3. elementul neutru este vectorul nul (x + 0 = x); 

4. opusul unui vector x este −x, adică vectorul cu elementele −x i , i = 1 : n 

(x + (−x) = 0). 

Astfel, R n împreună cu operaţia de adunare formează un grup comutativ. 

Produsul unui vector x ∈ R n cu un scalar α ∈ R este vectorul y = αx ∈ R n 

definit de y i = αx i , i ∈ 1 : n; deci, produsul se face multiplicând cu α fiecare 

componentă a vectorului x. Produsul cu un scalar este o operaţie externă pe R n . 

Semnificaţiile geometrice ale celor două operaţii sunt prezentate în figura 1.2; 

adunarea se face după regula paralelogramului, iar produsul cu un scalar modifică 

doar lungimea vectorului, păstrându-i direcţia. 

Mulţimea R n împreună cu operaţiile de adunare şi produs cu un scalar are 

structura de spaţiu vectorial, adică, în afara structurii de grup comutativ faţă de 

adunare, mai sunt satisfăcute următoarele proprietăţi ale produsului cu un scalar: 

1. 1 · x = x; 

2. α(βx) = (αβ)x; 

3. (α + β)x = αx + βx; 

4. α(x + y) = αx + αy. 

Combinaţie liniară. Fie X ⊂ R n o mulţime având ca elemente vectorii 1 

x 1 , x 2 , . . . , x p . Vectorul 

y def 

= α 1 x 1 + α 2 x 2 + . . . + α p x p = 

p∑ 

α i x i (1.2) 

se numeşte combinaţie liniară a vectorilor din X cu coeficienţii α 1 , α 2 , . .., α p ∈ R. 

Dacă toţi coeficienţii sunt nuli, combinaţia se numeşte trivială. 

Vectorii din X sunt liniar independenţi dacă nu există o combinaţie liniară netrivială 

a elementelor lui X care să fie nulă. Dacă o astfel de combinaţie există, vectorii 

din X sunt numiţi liniar dependenţi. 

1 Se observă că acum x i este un vector şi nu un element de vector; aşadar, folosim indicii şi 

pentru a numerota vectorii dintr-o mulţime. 

i=1


Dacă vectorii sunt liniar dependenţi, atunci cel puţin unul dintre ei se poate 

exprima printr-o combinaţie liniară a celorlalţi; i.e., dacă ∑ p 

i=1 α ix i = 0, atunci 

există α j ≠ 0, şi deci x j = − ∑ p 

i=1,i̸=j (α i/α j )x i . 

Evident, într-o mulţime de vectori independenţi, nici unul dintre ei nu se poate 

exprima printr-o combinaţie liniară a celorlalţi. De exemplu, vectorii unitate 

e 1 , . . . , e n sunt liniar independenţi. Dacă X ⊂ R n este o mulţime de vectori 

liniar independenţi şi y = ∑ p 

i=1 α ix i ∈ R n este o combinaţie liniară a acestora, 

atunci coeficienţii combinaţiei liniare sunt unici (demonstraţi). 

Subspaţiu liniar. O mulţime S de vectori din R n este numită subspaţiu liniar 

al spaţiului R n dacă sunt îndeplinite următoarele două condiţii: 

1. x + y ∈ S, ∀x, y ∈ S; 

2. αx ∈ S, ∀α ∈ R, ∀x ∈ S. 

Aşadar, orice combinaţie liniară a unor vectori din S aparţine tot lui S; altfel spus, 

S e invariant la combinaţii liniare. Evident, orice subspaţiu liniar conţine vectorul 

nul (originea). 

Fie X ⊂ R n o mulţime de vectori şi S mulţimea tuturor combinaţiilor liniare ale 

vectorilor din X. Atunci S e un subspaţiu liniar, numit subspaţiul generat de X. De 

exemplu, în R 3 doi vectori generează de regulă un plan; dacă vectorii sunt coliniari 

(adică există scalarul α a.î. y = αx), atunci subspaţiul generat este o dreaptă. 

Fie S ⊂ R n un subspaţiu; o mulţime de vectori B ⊂ S este bază a subspaţiului 

S dacă: 

1. elementele lui B sunt liniar independente; 

2. S e generat de B. 

Aşadar o bază conţine numărul minim de vectori cu ajutorul cărora se poate genera 

subspaţiul. 

Dacă B = {b 1 , . . . , b m }, atunci ∀x ∈ S se scrie în mod unic în forma unei 

combinaţii liniare a vectorilor din bază, x = ∑ m 

i=1 α ib i . Numerele α i se numesc 

componentele sau coordonatele, vectorului x în raport cu baza B. 

De exemplu, e 1 , . . . , e n formează o bază pentru R n , numită şi baza canonică; 

componentele vectorului x, în sensul definiţiei (1.1), sunt componentele în raport 

cu această bază, deoarece evident x = ∑ n 

i=1 x ie i . 

Un subspaţiu are o infinitate de baze, dar toate au acelaşi număr de elemente. 

Evident, un vector x ≠ 0 are coordonate diferite în raport cu aceste baze. 

Dimensiunea unui subspaţiu, notată dim S, este numărul vectorilor din bază, 

adică numărul maxim de vectori din S liniari independenţi sau, cum am menţionat 

deja, numărul minim de vectori care generează S. 

De exemplu, R n are dimensiunea n, numărul de vectori din baza canonică; un 

plan în R 3 are dimensiunea 2. 

Două subspaţii S, T ⊂ R n se numesc complementare dacă 

1. S ∩ T = {0}. 

2. R n este generat de S ∪ T .

1.1. VECTORI. SPAŢIUL VECTORIAL R N 23 

✜❈ 

✻ 

❈❈❈❈❈❈❈❈❈ 

✜ ✜✜ 

T 

S ❈ 

❈❈ 

❈ ✑ ✑ 

❈❈❈❈❈❈✜ ✑ 

✑ 

✑✰ 

✑ 

✜ 

 

✜ ✜ 

✲ 

Fig. 1.3: Subspaţii complementare în R 3 : un plan S şi o dreaptă T 

În acest caz vom utiliza notaţia R n = S ⊕ T . Fiecare dintre cele două subspaţii este 

numit complementul celuilalt. Orice vector x ∈ R n se poate exprima în mod unic 

prin x = s + t, cu s ∈ S, t ∈ T . De asemenea, dim S + dim T = n. De exemplu, 

în figura 1.3 sunt reprezentate un plan şi o dreaptă în R 3 , care constituie imaginile 

geometrice a două subspaţii complementare. 

Să observăm că subspaţiul complementar al unui subspaţiu nu este, în general, 

unic. În exemplul din figura 1.3, orice dreaptă care nu aparţine planului este complementara 

acestuia. 

Spaţiul vectorial complex C n se defineşte analog cu spaţiul R n şi are aceleaşi 

proprietăţi, deoarece proprietăţile corpului numerelor reale folosite mai sus sunt 

identice cu cele ale corpului numerelor complexe. 

Desigur, orice vector x ∈ C n se poate scrie în forma x = u + iv, cu u, v ∈ R n şi 

i unitatea imaginară. 

AA. Saxpy. Vom descrie acum în termeni algoritmici o operaţie fundamentală 

cu vectori, anume y ← αx + y, cu x, y ∈ R n , α ∈ R, operaţie numită Saxpy 2 . 

Notaţia ←, citită ”ia valoarea”, are semnificaţia de atribuire. Cu alte cuvinte, 

într-un program ce realizează operaţia şi în care vectorii x şi y reprezintă variabile, 

vectorul calculat αx + y este depus în variabila y, suprascriind valoarea iniţială a 

acesteia. Vom introduce direct şi alte convenţii de scriere a algoritmilor, cu premiza 

că cititorul are noţiuni elementare despre limbajele de programare de nivel înalt. 

Algoritmul 1.1 (Saxpy) (Se dau x, y ∈ R n . Se calculează 

y ← αx + y ∈ R n .) 

1. Pentru i = 1 : n 

1. y i ← y i + αx i 

2 Notaţia provine din iniţialele variabilelor folosite: αx Plus y; în BLAS, iniţiala S semnifică 

faptul că calculele se efectuează în Simplă precizie; ea este ataşată în mod tradiţional numelui 

operaţiei.


Comentarii. Instrucţiunea Pentru i = 1 : n înseamnă repetarea execuţiei, pentru 

toate valorile indicate ale indicelui i, a instrucţiunilor ce îi urmează (până la prima 

instrucţiune aflată la acelaşi nivel cu Pentru). Instrucţiunile sunt referite prin 

secvenţe de numere cuprinzând (de la dreapta spre stânga) numărul din algoritm al 

instrucţiunii respective şi numerele instrucţiunilor cărora le este subordonată (de la 

cea mai apropiată la cea mai depărtată). În algoritmul Saxpy, prima instrucţiune 

este 1, a doua 1.1. 

Contorizând operaţiile executate de algoritmul 1.1, constatăm că fiecare execuţie 

a instrucţiunii 1.1 necesită 2 flopi (o înmulţire şi o adunare), deci, în total, sunt 

necesari N op = 2n flopi. 

În continuare, Saxpy va fi privită ca operaţie elementară şi va fi apelată prin 

Saxpy(α, x, y); ea face parte din grupul operaţiilor de nivel 1, împreună cu alte 

operaţii, dintre care unele vor fi prezentate ulterior 3 . 

Aşa cum este normal, Saxpy şi celelalte operaţii de nivel 1 sunt executate 

mai eficient pe calculatoare vectoriale. De aceea, pe astfel de calculatoare, există 

tendinţa de a scrie toţi algoritmii în termeni de operaţii de nivel 1 şi nu prin operaţii 

aritmetice elementare. 

♦ 

1.2 Produs scalar. Norme. Ortogonalitate 

Produsul scalar este o funcţie f : R n × R n −→ R cu proprietăţile: 

1. f(x, y) = f(y, x) (comutativitate); 

2. f(x, y + z) = f(x, y) + f(x, z) (distributivitate); 

3. f(x, αy) = αf(x, y); 

4. f(x, x) ≥ 0 şi f(x, x) = 0 ⇔ x = 0 (pozitivitate). 

Produsul scalar standard în R n , cel pe care îl vom utiliza de obicei, se defineşte 

prin f(x, y) not 

= y T x, unde y T x def 

= ∑ n 

i=1 x iy i . Invităm cititorul să verifice satisfacerea 

celor patru proprietăţi ale produsului scalar. 

Spaţiul R n împreună cu produsul scalar uzual este un spaţiu euclidian (în el este 

valabilă o geometrie similară cu cea din R 2 şi R 3 , cunoscută din liceu). 

Norme. Prin normă se asociază unui vector o mărime (lungime). O normă 

vectorială este o funcţie ν : R n → R + , notată de obicei ν(x) = ‖x‖, care satisface 

următoarele condiţii: 

1. ‖x‖ > 0, ∀x ∈ R n , x ≠ 0 (pozitivitate); 

2. ‖αx‖ = |α| · ‖x‖, ∀x ∈ R n , ∀α ∈ R (omogenitate); 

3. ‖x + y‖ ≤ ‖x‖ + ‖y‖, ∀x, y ∈ R n (inegalitatea triunghiului). 

Se deduce imediat că ‖0‖ = 0 şi ‖ − x‖ = ‖x‖. 

Cea mai utilizată normă vectorială este cea indusă de produsul scalar şi se 

numeşte normă euclidiană sau normă 2: 

‖x‖ 2 = √ ∑ 

x T x = √ n x 2 i . (1.3) 

3 Numerotarea nivelelor se face după exponentul lui n din expresia numărului de flopi necesari 

la execuţie; operaţiile de nivel 1 necesită O(n) flopi, cele de nivel 2 necesită O(n 2 ) flopi etc. 

i=1

1.2. PRODUS SCALAR. NORME. ORTOGONALITATE 25 

∞ 

✻ 

✬✩ 

 

 

❅ 

❅ ❅ ✟ 1 

✫✪ 

❅ ❜ 2 

✲ 

Fig. 1.4: Cercuri de rază 1 în R 2 , în normele 1, 2, ∞ 

Denumirea de normă 2 este justificată de faptul că (1.3) este un caz particular 

de normă p (sau normă Hölder). Pentru p ≥ 1, norma p se defineşte prin 

( n 

) 1/p 

∑ 

‖x‖ p = |x i | p . 

i=1 

Alte cazuri particulare de normă p folosite curent sunt normele 1 şi infinit, 

definite, în ordine, prin 

n∑ 

‖x‖ 1 = |x i |, 

i=1 

‖x‖ ∞ = max 

i=1:n |x i|. 

Pentru a ilustra geometric cele trei norme de mai sus, figura 1.4 prezintă ”cercurile” 

de rază 1 în R 2 , adică locul geometric al punctelor x ∈ R 2 pentru care 

‖x‖ p = 1, pentru p = 1, 2, ∞. 

Două norme pe R n , să zicem ‖ · ‖ q şi ‖ · ‖ r , se numesc echivalente dacă există 

γ 1 , γ 2 > 0 astfel încât pentru orice x ∈ R n avem 

γ 1 ‖x‖ q ≤ ‖x‖ r ≤ γ 2 ‖x‖ q . (1.4) 

Oricare două norme p sunt echivalente. De exemplu (demonstraţi !): 

‖x‖ ∞ ≤ ‖x‖ 1 ≤ n‖x‖ ∞ ; 

‖x‖ ∞ ≤ ‖x‖ 2 ≤ √ n‖x‖ ∞ ; 

‖x‖ 2 ≤ ‖x‖ 1 ≤ √ n‖x‖ 2 . 

Ortogonalitate. Unghiul α a doi vectori nenuli x, y ∈ R n se defineşte prin 

α = arccos(y T x/(‖x‖ · ‖y‖)); geometric, acesta este chiar unghiul format de cei doi 

vectori în planul generat de ei. 

Doi vectori x, y ∈ R n se numesc ortogonali dacă produsul lor scalar este nul, 

x T y = 0; semnificaţia geometrică este cea naturală: între cei doi vectori este un 

unghi drept; de aceea vom folosi şi notaţia x ⊥ y. 

Vectorii u 1 , u 2 , . . .,u p se numesc ortogonali dacă sunt ortogonali doi câte doi, 

adică 

u T i u j = 0, ∀i ≠ j, i, j ∈ 1 : p. (1.5)


Dacă, în plus faţă de (1.5), vectorii u i au norme euclidiene unitare, ‖u i ‖ 2 = 1, 

∀i = 1 : p, ei sunt numiţi ortonormali. 

Vectorii ortogonali sunt liniar independenţi; justificarea e intuitivă: un vector 

ortogonal pe toţi ceilalţi este ortogonal şi pe orice combinaţie liniară a lor. 

Orice subspaţiu de dimensiune mai mare ca unu are o infinitate de baze ortonormale 

4 . De exemplu, baza canonică a R n , e 1 , . . . , e n , este ortonormală. Folosirea 

bazelor ortonormale este recomandabilă nu numai datorită proprietăţilor matematice, 

dar şi a acurateţii numerice pe care o induc în calcule. Un mod simplu, dar nu 

şi numeric stabil, de a construi o bază ortonormală, pornind de la o bază oarecare, 

este sugerat în problema 1.6 (algoritmul Gram-Schmidt); metode numeric stabile 

vor fi prezentate în capitolele 3 şi 5. 

Teorema lui Pitagora se generalizează imediat în R n : vectorii x, y ∈ R n sunt 

ortogonali dacă şi numai dacă ‖x + y‖ 2 2 = ‖x‖2 2 + ‖y‖2 2 . 

Noţiunea de ortogonalitate poate fi extinsă la subspaţii liniare. Vectorul x ∈ R n 

este ortogonal pe subspaţiul S ⊂ R n dacă este ortogonal pe orice vector din S. Două 

subspaţii S, T ⊂ R n sunt ortogonale dacă orice vector s ∈ S este ortogonal pe orice 

vector t ∈ T ; vom nota S ⊥ T . 

Un subspaţiu S ⊂ R n este numit complementul ortogonal al subspaţiului 

T ⊂ R n dacă cele două subspaţii sunt ortogonale şi complementare. (∀x ∈ R n , 

există vectorii unici s ∈ S, t ∈ T astfel încât x = t + s şi t ⊥ s.) Se utilizează 

notaţia S = T ⊥ ; desigur, avem şi T = S ⊥ . 

Particularităţi ale spaţiului euclidian complex C n . Produsul scalar uzual 

al vectorilor x, y ∈ C n este definit de proprietăţi uşor diferite de cele ale produsului 

scalar din R n ; mai precis, notând cu α complex conjugatul scalarului complex α, 

proprietăţile 1 şi 3 devin: 

1’. f(x, y) = f(y, x); 

3’. f(x, αy) = αf(x, y). 

Produsul scalar uzual în C n se defineşte prin y H x = ∑ n 

i=1 x iy i . 

Doi vectori x, y ∈ C n sunt ortogonali dacă y H x = 0. 

Norma euclidiană ‖ · ‖ : C n → R + se defineşte prin ‖x‖ 2 = √ x H x, ∀x ∈ C n , 

unde x H x = ∑ n 

i=1 |x i| 2 , iar |α| este modulul scalarului complex α. 

AA. Calculul produsului scalar. Urmând (1.3), produsul scalar se calculează 

astfel: 

Algoritmul 1.2 (DOT – Calculul produsului scalar) (Se dau vectorii 

x, y ∈ R n . Se calculează α = y T x.) 

1. α ← 0 


1. α ← α + x i y i 

Comentarii. Algoritmul are 2n operaţii şi face deci parte din grupul operaţiilor 

de nivel 1. Îl vom apela prin α = DOT(x, y). 

4 În general vom spune baze ortogonale în loc de ortonormale, presupunând implicit că normele 

vectorilor sunt unitare.

1.2. PRODUS SCALAR. NORME. ORTOGONALITATE 27 

Datorită erorilor numerice, la execuţie algoritmul DOT nu va calcula α = y T x, 

ci o valoare ˆα, despre care se poate demonstra (vezi şi problema 1.5): 

|ˆα − α| ≤ nε M |y| T |x| + O(ε 2 M ), (1.6) 

unde |x| este vectorul modulelor elementelor vectorului x. Eroarea nu este neapărat 

mică; dacă |y T x| ≪ |y| T |x|, atunci eroarea relativă din (1.6) poate fi mare. ♦ 

AA. Calculul normelor. Normele 1 şi ∞ se calculează uşor. De exemplu, 

‖x‖ ∞ se calculează astfel: 

Algoritmul 1.3 (Nrminf – Calculul normei infinit a unui vector) 

(Se dă x ∈ R n . Se calculează ‖x‖ ∞ .) 

1. norm ← 0 


1. Dacă |x i | > norm atunci norm ← |x i | 

Pentru calculul normei 2 a unui vector x ∈ R n poate fi utilizat algoritmul 1.2, 

apelând DOT(x, x), şi apoi extrăgând radicalul. Există însă posibilitatea ca, deşi 

‖x‖ 2 este reprezentabil în virgulă mobilă, x T x = ‖x‖ 2 2 să nu fie (de exemplu 1025 este 

reprezentabil în simplă precizie, dar 10 50 nu) şi atunci calculul lui x T x să conducă 

la depăşire superioară. Similar poate apărea o depăşire inferioară, care antrenează 

pierdere de precizie sau decizii eronate: ‖x‖ 2 = 0 deşi x ≠ 0. Pentru a preveni acest 

eveniment care ar împiedica obţinerea rezultatului, se scalează vectorul x, adică se 

împart toate elementele sale cu, de exemplu, ‖x‖ ∞ (se aduce astfel x la altă scară 

de mărime). Dacă ˜x = x/‖x‖ ∞ , atunci |˜x i | ≤ 1, ∀i ∈ 1 : n, şi depăşirea superioară 

este practic imposibilă. (Apariţia unor depăşiri inferioare la ridicarea la pătrat a 

unor elemente ale vectorului ˜x nu este supărătoare, deoarece în acest caz rezultatul 

se aproximează cu zero.) Se obţine următorul algoritm. 

Algoritmul 1.4 (Nrm2 – Calculul normei 2 a unui vector) (Se dă 

x ∈ R n . Se calculează α = ‖x‖ 2 , efectuând o operaţie de scalare.) 

1. Se calculează β = ‖x‖ ∞ 

2. α = 0 


1. α ← α + (x i /β) 2 

4. α ← β √ α 

Comentarii. Se observă că scalarea, care se efectuează în instrucţiunile 1 şi 3.1, 

încarcă algoritmul cu n flopi (2) şi n comparaţii (1); cu toate acestea, siguranţa 

calculelor impune de regulă utilizarea ei, cu excepţia cazurilor în care informaţiile 

apriorice despre date exclud apariţia depăşirii. 

Un rafinament al algoritmului 1.4 este de a utiliza pentru scalare nu ‖x‖ ∞ , ci 

cea mai apropiată putere a bazei de numeraţie a formatului virgulă mobilă utilizat 

(de regulă 2). Scalările din instrucţiunea 3.1 vor avea rezultate de acelaşi ordin de 

mărime ca în cazul scalării cu ‖x‖ ∞ , deci nu va exista pericol de depăşire superioară, 

în schimb toate împărţirile se vor efectua exact, neintroducându-se nici un fel de 

eroare numerică suplimentară la calculul normei. 

♦


AA. Ortogonalitate numerică. Matematic, testul de ortogonalitate a doi 

vectori x, y ∈ R n este foarte clar: se verifică dacă x T y = 0. Numeric însă, se 

întâmplă foarte rar ca DOT(x, y) să fie exact 0; aceasta se datorează atât erorilor 

numerice apărute în execuţia algoritmului DOT, cât şi erorilor de reprezentare 

asociate elementelor celor doi vectori. De aceea, pentru a considera doi vectori 

numeric ortogonali, ne mulţumim cu condiţia 

|DOT(x/‖x‖ 2 , y / ‖y‖ 2 ) | < cε M , 

unde c ≥ 1 este o constantă mică, adică produsul scalar al vectorilor normalizaţi 

să fie de acelaşi ordin de mărime cu epsilon maşină al formatului virgulă mobilă 

utilizat. 

1.3 Matrice 

Matrice. O matrice reală A este un tablou bidimensional (rectangular) de 

numere reale dispuse pe m linii şi n coloane; notând cu a ij elementul matricei de 

pe linia i şi coloana j, matricea arată astfel 

⎡ 

A = ⎢ 

⎣ 

⎤ 

a 11 a 12 . . . a 1n 

a 21 a 22 . . . a 2n 

⎥ 

. . . ⎦ 

a m1 a m2 . . . a mn 

(1.7) 

Dacă m = n, matricea se numeşte pătrată. 

Mulţimea tuturor matricelor reale (complexe) cu m linii şi n coloane va fi notată 

R m×n (respectiv C m×n ). Păstrăm în continuare convenţia de a ne referi la cazul 

complex doar atunci când este diferit de cel real. 

Se numeşte diagonală principală a matricei mulţimea poziţiilor de indici egali din 

tablou; pentru A ∈ R n×n , suma elementelor de pe diagonala principală se numeşte 

urmă şi se notează tr(A) def 

= ∑ n 

i=1 a ii. 

Operaţii. Definim acum câteva operaţii elementare cu matrice: suma, produsul 

cu un scalar, transpunerea. 

Suma a două matrice A, B ∈ R m×n este matricea C = A + B ∈ R m×n , definită 

prin c ij = a ij + b ij ; aşadar, suma se face adunând elementele de pe poziţii corespondente. 

Produsul unei matrice A ∈ R m×n cu un scalar α ∈ R este matricea 

B = αA ∈ R m×n , definită prin b ij = αa ij , i = 1 : m, j = 1 : n. 

Cu aceste două operaţii — suma şi produsul cu un scalar — R m×n are o structură 

de spaţiu vectorial de dimensiune mn. O bază este E ij , i = 1 : m, j = 1 : n, unde 

E ij este matricea nulă cu excepţia elementului (i, j) egal cu 1. 

Transpusa unei matrice A ∈ R m×n este matricea B ∈ R n×m , notată B = A T , 

definită prin b ij = a ji . Propunem cititorului demonstrarea următoarelor proprietăţi 

simple ale operaţiei de transpunere:

1.3. MATRICE 29 

1. (A T ) T = A, ∀A ∈ R m×n ; 

2. (A + B) T = A T + B T , ∀A, B ∈ R m×n ; 

3. (αA) T = αA T , ∀A ∈ R m×n , ∀α ∈ R. 

Produsul matrice-vector. În funcţie de modul de utilizare, o matrice poate fi 

interpretată în mai multe feluri. De exemplu, o matrice poate fi văzută ca alăturare 

de vectori: 

A = [a 1 a 2 . . . a n ], (1.8) 

cu a 1 , a 2 , . . . , a n ∈ R m notându-se coloanele matricei A. Această interpretare este 

utilă în special în lucrul cu subspaţii. 

Cu notaţia (1.8), produsul dintre matricea A ∈ R m×n şi vectorul x ∈ R n este 

vectorul y ∈ R m 

y def 

= Ax = 

n∑ 

a j x j , (1.9) 

i.e. combinaţia liniară a coloanelor lui A cu coeficienţii x j . Un caz particular este 

produsul dintre matricea A şi vectorul unitate e j , care are ca rezultat coloana j a 

matricei: Ae j = a j . 

Se poate observa că produsul matrice-vector defineşte o transformare liniară 

f : R n → R m , f(x) = Ax, adică o aplicaţie cu proprietăţile (evident satisfăcute în 

cazul nostru): f(u + v) = f(u) + f(v), f(αu) = αf(u), ∀u, v ∈ R n , α ∈ R. 

Matrice şi subspaţii liniare. Deoarece matricea A poate fi privită ca o 

”mulţime” de vectori (coloane), se impune o notaţie specială pentru subspaţiul 

generat de coloanele matricei, numit imaginea acesteia: 

j=1 

ImA = {y ∈ R m | ∃x ∈ R n astfel încât y = Ax}. (1.10) 

Un alt subspaţiu interesant, de data asta în R n , este cel al vectorilor având ca 

elemente coeficienţii combinaţiilor liniare nule ale coloanelor lui A, numit nucleul 

matricei A: 

KerA = {x ∈ R n | Ax = 0}. (1.11) 

O proprietate fundamentală a acestor subspaţii este dată de 

Teorema 1.1 Dacă A ∈ R m×n , atunci ImA şi KerA T sunt subspaţii ortogonale şi 

complementare în R m , i.e. 

1. ImA ⊥ KerA T . 

2. R m = ImA ⊕ KerA T . 

Demonstraţie. 1. Fie y = Ax ∈ ImA şi z ∈ KerA T . Atunci y T z = x T A T z = 0. 

2. Fie z ⊥ ImA. Atunci x T A T z = 0, oricare x ∈ R n , deci A T z = 0. ♦ 

Evident, teorema poate fi aplicată pentru A T , şi deci avem ImA T ⊥ KerA şi 

R n = ImA T ⊕ KerA.


y 3 

✻ 

(1,0,1) 

✒ 

(0,1,1) 

◗❦ 

◗ 

◗ 

y 1 

◗ ImA 

✲ 

✟ 

✟ 

✟ ✟ 

y 2 ✟✙ 

✟ 

KerA T 

• (1,1,-1) 

Fig. 1.5: KerA T este complementul ortogonal al lui ImA. Datele sunt cele din 

exemplul 1.1 

Exemplul 1.1 Fie A = 

⎡ 

⎣ 1 0 

0 1 

1 1 

⎤ 

⎦. 

Atunci, S = ImA = {y ∈ R 3 | y = ⎣ 

⎡ 

⎤ 

x 1 

x 2 

⎦, x 1 , x 2 ∈ R}, adică S este 

x 1 + x 2 

planul de ecuaţie y 3 = y 1 + y 2 . 

T = KerA T = {y ∈ R⎡ 

3 | A T y ⎤= 0} = {y ⎛∈⎡ 

R 3 | ⎤y 2 ⎞+ y 3 = 0, y 1 + y 3 = 0}, deci 

avem T = {y ∈ R 3 | y = 

Vezi figura 1.5. 

⎣ 1 1 

−1 

⎦α} = Im ⎝⎣ 1 1 ⎦⎠. 

−1 

Privind în continuare matricea A în forma (1.8), rangul matricei A este dimensiunea 

subspaţiului ImA generat de coloanele lui A. Aşadar rangA = dim(ImA), 

sau, altfel spus, rangul este numărul maxim de coloane liniar independente din A. 

Se poate demonstra că rangA = rangA T şi deci rangul este totodată şi numărul 

maxim de linii liniar independente din A. Recapitulând: 

♦ 

dimImA = dimImA T not 

= r, 

dimKerA = n − r, 

dimKerA T = m − r. 

(1.12) 

O matrice A ∈ R m×n având coloanele liniar independente se numeşte monică; 

în acest caz, m ≥ n, rangA = n şi KerA = {0}. Se mai spune că A are rang maxim 

pe coloane. 

O matrice A ∈ R m×n având liniile liniar independente se numeşte epică; atunci 

m ≤ n, rangA = m şi ImA = R m ; se spune că A are rang maxim pe linii.

1.3. MATRICE 31 

O matrice A ∈ R m×n având una din dimensiuni egală cu 1 este un vector; dacă 

n = 1, vectorul este coloană (accepţiunea implicită), iar dacă m = 1 vectorul este 

linie. Este clar că transpusa unui vector linie este un vector coloană şi reciproc. În 

mod analog cu (1.8), o matrice poate fi scrisă evidenţiind liniile: 

⎡ ⎤ 

a T 1 

a T 

A = ⎢ 

⎣ 

2. 

a T m 

⎥ 

⎦ . (1.13) 

Atenţie: acum a T i e o notaţie pentru vectorul format de linia i a matricei A; a i nu 

este coloana i din (1.8). Pentru a evita confuziile, vom folosi şi notaţiile: A(:, i) 

pentru coloana i din A, respectiv A(i, :) pentru linia i din A. 

Folosind forma (1.13) a matricei A, se poate observa uşor că produsul matricevector 

se poate exprima prin intermediul unor produse scalare: 

⎡ 

Ax = 

⎢ 

⎣ 

a T 1 x ⎤ 

. 

a T m x 

⎥ 

⎦. (1.14) 

AA. Gaxpy. Vom prezenta acum mai multe implementări ale produsului 

matrice-vector, sub forma operaţiei y ← Ax + y, numită Gaxpy 5 . 

Din (1.9), la nivel de element, operaţia se scrie y i ← y i + ∑ n 

j=1 a ijx j , şi deci 

Algoritmul 1.5 (Gaxpy – Produs matrice-vector) (Se dau 

A ∈ R m×n , x ∈ R n . Se calculează y ← Ax + y ∈ R m utilizând operaţii 

elementare.) 

1. Pentru i = 1 : m 

1. Pentru j = 1 : n 

1. y i ← y i + a ij x j 

Se observă imediat că bucla interioară reprezintă o operaţie DOT, corespunzând 

exprimării produsului matrice-vector în forma (1.14). Algoritmul de mai sus 

se scrie deci, în forma vectorială 

Algoritmul 1.6 (Se dau A ∈ R m×n , x ∈ R n . 

y ← Ax + y ∈ R m utilizând operaţii DOT.) 


1. y i ← y i + DOT(A(i, :), x) 

Se calculează 

Inversând acum ordinea buclelor din algoritmul 1.5, ceea ce nu afectează în nici 

un fel rezultatul (ordinea operaţiilor pentru calculul fiecărei sume y i în parte este 

aceeaşi), obţinem 


y ← Ax + y ∈ R m utilizând operaţii elementare.) 

5 Prescurtare pentru General Ax Plus y. 

Se calculează




1. y i ← y i + a ij x j 

Bucla interioară reprezintă acum o operaţie Saxpy, corespunzând exprimării 

produsului matrice-vector în forma (1.9), care este o sumă de vectori. Algoritmul 

1.7 se rescrie deci în forma vectorială: 


y ← Ax + y ∈ R m folosind operaţii Saxpy.) 


1. y ← Saxpy(x j , A(:, j), y) 

Se calculează 

Comentarii. Toţi algoritmii de mai sus au 2n 2 operaţii. De aceea Gaxpy 

face parte din grupul operaţiilor de nivel 2. Vom face referinţă la ea în forma 

y = Gaxpy(A, x, y). Desigur, implementările din algoritmii 1.6 şi 1.8 vor fi deosebit 

de eficiente pe calculatoare vectoriale. 

♦ 

1.4 Înmulţirea matricelor 

Dedicăm o secţiune separată înmulţirii de matrice (şi unor noţiuni conexe), 

deoarece această operaţie este specifică (nu se poate defini în general produsul a 

doi vectori cu rezultat vector 6 ) şi apare deseori în construcţia algoritmilor de nivel 

superior, devenind astfel interesantă atât ”teoretic”, cât şi din punctul de vedere al 

detaliilor de implementare. 

Definiţia 1.1 Fie A ∈ R m×l şi B ∈ R l×n , două matrice; produsul lor este matricea 

C = AB ∈ R m×n , definită prin 

c ij = 

l∑ 

a ik b kj , i = 1 : m, j = 1 : n. 

k=1 

Cazuri particulare. Să discutăm întâi cazurile particulare în care cel puţin 

una dintre dimensiuni este egală cu 1. 

Dacă m = n = 1, atunci A not 

= x T este un vector linie, B not 

= y este un vector 

coloană, ambii în R l , iar produsul lor coincide cu simplul produs scalar AB = x T y. 

Dacă l = 1, atunci A not 

= x este un vector coloană în R m , B not 

= y T este un 

vector linie în R n , iar produsul lor este matricea C = xy T ∈ R m×n , definită prin 

c ij = x i y j ; această operaţie cu doi vectori poartă numele de produs exterior şi va fi 

notată prin OUT(x, y). 

Dacă n = 1, atunci B not 

= y este un vector coloană şi operaţia AB este o înmulţire 

matrice-vector. 

Dacă m = 1, atunci A not 

= x T este un vector linie şi AB = x T B este un vector 

linie (înmulţire vector linie - matrice). 

6 Produsul ”vectorial” a × b este posibil, printr-un accident fericit căruia îi este îndatorată 

întreaga fizică clasică, numai în R 3 .

1.4. ÎNMULŢIREA MATRICELOR 33 

Forme ale produsului matriceal. Vom evidenţia acum mai multe forme 

de prezentare a înmulţirii a două matrice, folosind ca operaţii elementare cazurile 

particulare prezentate mai sus. 

1. Să privim A ca alăturare de vectori linie, ca în (1.13), şi B ca alăturare de 

vectori coloană, ca în (1.8). Se observă imediat din definiţie că c ij = a T i b j, adică 

fiecare element al rezultatului poate fi exprimat printr-un produs scalar (DOT). 

2. Privim acum A partiţionată pe coloane şi B pe linii. Produsul lor se poate 

exprima ca o sumă de produse exterioare: 

⎡ ⎤ 

b T 

⎢ 

C = AB = [a 1 . . . a l ] ⎣ 

1. 

b T l 

⎥ 

⎦ = 

l∑ 

a k b T k . (1.15) 

Demonstraţie: c ij = ∑ l 

k=1 (a kb T k ) ij = ∑ l 

k=1 (a k) i (b T k ) j = ∑ l 

k=1 a ikb kj . 

3. Punem acum în evidenţă numai coloanele matricei B. Atunci 

k=1 

C = AB = A[b 1 . . . b n ] = [Ab 1 . . . Ab n ], (1.16) 

deci fiecare coloană a produsului este obţinută prin înmulţirea matrice-vector dintre 

matricea A şi coloana respectivă a lui B. 

4. Fie acum A partiţionată pe linii. Atunci 

⎡ ⎤ ⎡ ⎤ 

C = AB = 

⎢ 

⎣ 

a T 1. 

a T m 

⎥ 

⎦B = 

⎢ 

⎣ 

a T 1 B 

. 

a T mB 

⎥ 

⎦ , (1.17) 

deci fiecare linie a produsului este obţinută prin înmulţirea vector linie - matrice 

dintre linia respectivă a lui A şi matricea B. 

5. Să exprimăm acum coloanele produsului C în funcţie de coloanele matricei 

A. Cu ajutorul relaţiei (1.16) se obţine 

c j = Ab j = 

l∑ 

b kj a k , (1.18) 

deci orice coloană din C este combinaţie liniară a coloanelor matricei A. 

6. În sfârşit, o ultimă formă, în care vom exprima liniile produsului C în funcţie 

de liniile matricei B. Din (1.17) rezultă 

k=1 

l∑ 

c T i = a T i B = a ik b T k . (1.19) 

Proprietăţi. Înmulţirea de matrice are unele proprietăţi imediate, prezentate în 

continuare; presupunem că matricele au dimensiuni potrivite operaţiilor efectuate; 

demonstraţiile sunt lăsate cititorului. 

1. A(BC) = (AB)C (asociativitate); 

2. A(B + C) = AB + AC (distributivitate); 

k=1


3. (AB) T = B T A T . 

Trebuie subliniat faptul că înmulţirea de matrice nu este comutativă. Să detaliem 

puţin; considerăm A ∈ R m×l şi B ∈ R l×n , cazul cel mai general pentru care este 

definit produsul AB; dacă m ≠ n, atunci produsul BA nici măcar nu este definit. 

Dacă m = n, atunci AB ∈ R m×l , iar BA ∈ R l×m ; prin urmare, dacă m ≠ l, atunci 

AB şi BA au dimensiuni diferite, deci nu se pune problema egalităţii. În fine, dacă 

şi m = l, deci ambele matrice sunt pătrate, [ atunci ] egalitatea [ ] AB = BA nu are loc, 

1 1 1 2 

în general; un exemplu simplu: A = , B = . 

1 1 3 4 

Matrice pătrate. Ne vom ocupa în continuare de unele aspecte specifice matricelor 

pătrate din R n×n , a căror mulţime are structură de inel necomutativ. Matricea 

unitate de ordinul n are elementele de pe diagonala principală egale cu 1 şi 

toate celelalte elemente nule; ea este notată prin I n , sau numai I dacă dimensiunea 

rezultă din context; scrisă pe coloane, matricea unitate are forma I n = [e 1 . . . e n ]. 

Fie o matrice A ∈ R n×n ; dacă există o matrice X ∈ R n×n astfel încât 

AX = XA = I, atunci X se numeşte inversa matricei A şi se notează cu A −1 . 

O matrice care are inversă se numeşte inversabilă; matricea inversă este unică. Se 

poate demonstra că mulţimea matricelor inversabile din R n×n are o structură de 

grup (necomutativ) în raport cu înmulţirea, notat GL(n). 

Se pune întrebarea când este o matrice inversabilă Vom menţiona deocamdată, 

fără a demonstra, că inversabilitatea este echivalentă cu condiţia rangA = n, adică 

cu independenţa coloanelor (şi liniilor) matricei A. (O altă condiţie echivalentă este 

KerA = {0}, i.e. KerA are dimensiune nulă.) Testarea numerică a inversabilitaţii 

va fi o problemă tratată mai mult sau mai puţin explicit în capitolele următoare, 

metodele prezentate fiind din ce în ce mai sigure, dar şi mai sofisticate. 

O ultimă proprietate: inversarea şi transpunerea unei matrice sunt operaţii care 

comută între ele, adică (A T ) −1 = (A −1 ) T not 

= A −T . 

Echivalenţă. Două matrice A, B ∈ R m×n se numesc echivalente la dreapta 

dacă există o matrice T ∈ R n×n inversabilă astfel încât B = AT. Avem: 

Propoziţia 1.1 Dacă A, B ∈ R m×n sunt echivalente la dreapta, atunci avem ImA = 

ImB. 

Demonstraţie. Din definiţie, există T astfel încât B = AT. Evidenţiind coloanele 

din A şi B şi folosind (1.18) se obţine b j = At j = ∑ n 

i=1 t ija i , deci orice coloană 

din B este combinaţie liniară a coloanelor matricei A; atunci b j ∈ ImA, pentru 

j ∈ 1 : n, şi deci ImB ⊂ ImA. 

Cum T este inversabilă, A = BT −1 , şi un raţionament similar conduce la concluzia 

ImA ⊂ ImB. 

♦ 

Dacă matricele echivalente la dreapta A şi B au coloanele liniar independente, 

atunci coloanele fiecăreia formează o bază pentru ImA = ImB. În acest caz, matricea 

T este numită schimbare de bază (în R n , din baza A în baza B). 

Fie un vector x ∈ ImA; atunci x se exprimă unic în fiecare dintre cele două 

baze: x = Ac = ∑ n 

i=1 γ ia i , cu c = [γ 1 . . .γ n ] T şi, respectiv, x = Bd = ∑ n 

i=1 δ ib i , cu

1.4. ÎNMULŢIREA MATRICELOR 35 

d = [δ 1 . . . δ n ] T ; vectorii c şi d conţin coordonatele în cele două baze. Cum B = AT, 

atunci x = Ac = ATd, din unicitate rezultând c = Td, sau d = T −1 c. Această 

ultimă relaţie justifică denumirea de transformare de coordonate dată matricei T −1 

(din nou, din baza A în baza B). 

Desigur, dacă A şi B sunt echivalente la dreapta, atunci şi KerA T = KerB T , 

consecinţă a propoziţiei de mai sus şi a teoremei 1.1. 

Deoarece înmulţirea de matrice nu este comutativă, are sens noţiunea de echivalenţă 

la stânga; matricele A, B ∈ R m×n se numesc echivalente la stânga dacă există 

o matrice S ∈ R m×m inversabilă astfel încât B = SA. În acest caz, ImAT = ImB T 

şi KerA = KerB. 

Dacă coloanele fiecăreia dintre matricele echivalente la stânga A şi B formează 

o bază pentru ImA = ImB, atunci din (1.16) a j = Sb j , deci matricea S transformă 

vectorii unei baze în vectorii celeilalte. 

Două matrice sunt echivalente (bilateral) dacă există S ∈ R m×m , T ∈ R n×n 

inversabile astfel încât B = SAT. S şi T se numesc generic transformări (de 

echivalenţă). 

AA. Algoritmi. Vom prezenta mai multe variante de calcul al produsului matriceal, 

variante ce diferă, în esenţă, prin ordinea în care sunt efectuate operaţiile 

scalare. În acest mod punem în evidenţă diverse posibilităţi de organizare a calculelor 

în vederea unei exploatări optime a particularităţilor arhitecturale ale calculatorului 

ţintă. 

Pentru început prezentăm un algoritm pentru produsul exterior, singurul caz 

particular nedetaliat până acum în care cel puţin o dimensiune a operanzilor înmulţirii 

este 1. 

Algoritmul 1.9 (OUT – Calculul produsului exterior) (Se dau 

x ∈ R m , y ∈ R n . Se calculează C = xy T ∈ R m×n .) 



1. c ij ← x i y j 

În cazul general, o implementare directă a înmulţirii de matrice, folosind definiţia, 

este prezentată în continuare. 

Algoritmul 1.10 (MM – Înmulţire matriceală) (Se dau 

A ∈ R m×l , B ∈ R l×n . Se calculează C = AB ∈ R m×n .) 

1. C ← 0 



1. Pentru k = 1 : l 

1. c ij ← c ij + a ik b kj 

Rezultatul acestui algoritm nu se modifică dacă ordinea celor trei bucle Pentru 

este alta. Algoritmul de mai sus se mai numeşte ”forma jik” a produsului matriceal. 

Bucla Pentru cea mai interioară se poate înlocui cu apelul produsului scalar 

DOT(A(i, :), B(:, j)), obţinându-se astfel un algoritm cu operaţii vectoriale. Cele 

două buclePentru interioare se pot înlocui cu un apel la Gaxpy(A, B(:, j), C(:, j)), 

după cum sugerează direct relaţia (1.16). 

Forma jki pune în evidenţă operaţii Saxpy, având la bază relaţia (1.18):


Algoritmul 1.11 (Se dau A ∈ R m×l , B ∈ R l×n . Se calculează 

C = AB ∈ R m×n . Forma jki.) 

1. C ← 0 



1. C(:, j) ← Saxpy(B(k, j), A(:, k), C(:, j)) 

Din nou cele două bucle interioare se pot înlocui cu Gaxpy. 

Forma kji a algoritmului este o implementare directă a formulei (1.15), care 

evidenţiază produse exterioare. 

Algoritmul 1.12 (Se dau A ∈ R m×l , B ∈ R l×n . Se calculează 

C = AB ∈ R m×n folosind operaţii OUT.) 

1. C ← 0 


1. C ← C + OUT(A(:, k), B(k, :)) 

Apelul rutinei OUT înlocuieşte buclele Pentru cu indicii j şi i. 

Formele ijk, kij şi ikj sunt, în această ordine, variante ale celor trei forme 

prezentate mai sus. Permutarea buclelor i şi j nu este esenţială, deoarece acestea 

au rolul de parcurgere a matricei C, pe linii sau pe coloane. Acest lucru poate 

deveni important dacă se ţine seama de modul de adresare a elementelor matricei 

impus de limbajul de programare utilizat. De exemplu, în FORTRAN se preferă 

organizarea pe coloane, corespunzător formelor jik, jki, kji, deoarece matricele 

sunt memorate pe coloane. 

În oricare dintre formele menţionate, înmulţirea de matrice necesită 2mnl flopi, 

deci 2n 3 în cazul matricelor pătrate, şi face parte din grupul operaţiilor de nivel 3. 

Vom face referire la ea în forma C = MM(A, B). 

Înmulţirea matricelor complexe. Algoritmii de mai sus, ca şi toate consideraţiile 

care îi preced, sunt valabili şi pentru înmulţirea matricelor complexe 

C = AB ∈ C m×n , cu A ∈ C m×l , B ∈ C l×n . Diferenţa constă în numărul de 

flopi necesari execuţiei. Dacă adunarea a două numere complexe se face în doi flopi 

(unul pentru partea reală, altul pentru partea imaginară), în schimb înmulţirea 

necesită şase: 

(α + iβ)(γ + iδ) = αγ − βδ + i(αδ + βγ). (1.20) 

Aşadar înmulţirea matricelor complexe se execută în aproximativ 8mnl flopi (câte 

mnl înmulţiri şi adunări de scalari complecşi). 

Aceeaşi observaţie poate fi făcută scriind A = A 1 + iA 2 , cu A 1 , A 2 ∈ R m×l , 

B = B 1 + iB 2 , cu B 1 , B 2 ∈ R l×n , şi 

C = A 1 B 1 − A 2 B 2 + i(A 1 B 2 + A 2 B 1 ). (1.21) 

Înmulţirea matricelor complexe se poate efectua deci prin patru produse (şi două 

adunări) de matrice reale. 

Numărul de operaţii se poate reduce printr-un mic artificiu de calcul; o formă 

echivalentă cu (1.20) este 

(α + iβ)(γ + iδ) = αγ − βδ + i((α + β)(γ + δ) − αγ − βδ). (1.22)

1.5. NORME MATRICEALE 37 

Aparent, nu se câştigă nimic, deoarece în loc de patru înmulţiri şi două adunări 

reale, ca în (1.20), avem trei înmulţiri şi cinci adunări. Egalitatea (1.22) se scrie 

însă identic şi în cazul matriceal, înlocuindu-se (1.21) cu 

G = A 1 B 1 , 

H = A 2 B 2 , 

C = G − H + i((A 1 + A 2 )(B 1 + B 2 ) − G − H). 

(1.23) 

Aşadar C se calculează acum cu doar trei înmulţiri de matrice, adică 6mnl flopi, şi 

cinci adunări a căror contribuţie la numărul de operaţii este neglijabilă. 

Acest algoritm rapid pentru înmulţirea matricelor complexe are totuşi şi un 

dezavantaj: stabilitatea sa numerică este mai slabă decât cea a algoritmului ”clasic” 

(1.21); cu toate acestea, el poate fi folosit cu succes în majoritatea aplicaţiilor. 

1.5 Norme matriceale 

Produsul scalar matriceal este o generalizare imediată a produsului scalar 

a doi vectori. Dacă A, B ∈ R m×n , produsul lor scalar este 

(A, B) def 

= 

m∑ 

i=1 j=1 

n∑ 

a ij b ij = tr(B T A). (1.24) 

Se observă că (1.24) este identică cu produsul scalar al celor doi vectori din R mn 

obţinuţi prin vectorizarea matricelor A şi B, i.e. prin concatenarea coloanelor lui 

A, respectiv B. 

Normele matriceale se definesc la fel ca normele vectoriale. O normă matriceală 

este o funcţie ‖ · ‖ : R m×n → R + care satisface condiţiile 

1. ‖A‖ > 0, ∀A ∈ R m×n , A ≠ 0 (pozitivitate); 

2. ‖αA‖ = |α| · ‖A‖, ∀A ∈ R m×n , ∀α ∈ R (omogenitate); 

3. ‖A + B‖ ≤ ‖A‖ + ‖B‖, ∀A, B ∈ R m×n (inegalitatea triunghiului). 

Pentru a utiliza normele matriceale independent de dimensiunile matricelor, introducem 

noţiunea de familie de norme matriceale, care este o funcţie 

‖ · ‖ : ⋃ ∞ 

m=1,n=1 Rm×n → R + astfel încât, pentru fiecare m, n > 0, restricţia lui 

‖ · ‖ la R m×n este o normă matriceală. Dacă n = 1, atunci ‖ · ‖ este o familie de 

norme vectoriale. 

O familie ‖ · ‖ de norme matriceale este consistentă dacă 

‖AB‖ ≤ ‖A‖ · ‖B‖, (1.25) 

atunci când produsul AB este definit. (Să observăm că, în general, A, B şi AB au 

dimensiuni diferite, deci normele lor sunt funcţii diferite; de aceea se lucrează cu 

familii de norme.) 

Norma Frobenius este norma matriceală indusă de produsul scalar (1.24): 

m∑ n∑ 

‖A‖ F = √ a 2 ij . (1.26) 

i=1 j=1


Familia de norme Frobenius este consistentă. 

Norme subordonate. O familie de norme matriceale poate fi obţinută dintr-o 

familie de norme vectoriale ‖ · ‖, prin următoarea relaţie 

‖Ax‖ 

‖A‖ = sup 

x≠0 ‖x‖ 

= max ‖Ax‖, (1.27) 

‖x‖=1 

în care norma matriceală ‖A‖ se defineşte cu ajutorul normelor vectoriale ‖x‖ şi 

‖Ax‖. (Trecerea de la sup la max este justificată de faptul că hipersfera de ecuaţie 

‖x‖ = 1 este un compact iar norma vectorială ‖ · ‖ este o funcţie continuă, deci 

mărginită şi îşi atinge marginile.) Familia de norme matriceale este numită subordonată 

celei de norme vectoriale sau indusă de aceasta. 

Astfel, folosind (1.27), se pot defini normele p matriceale subordonate normelor 

p (Hölder) vectoriale. Cele mai utilizate norme p sunt normele 1, 2 şi ∞. Pentru 

p = 1, ∞, relaţia (1.27) se reduce la expresiile simple 

( m 

) 

‖A‖ 1 = max ‖Ax‖ ∑ 

1 = max |a ij | , 

‖x‖ 1=1 j=1:n 

i=1 ⎛ ⎞ 

(1.28) 

n∑ 

‖A‖ ∞ = max ‖Ax‖ ∞ = max ⎝ |a ij | ⎠. 

‖x‖ ∞=1 i=1:m 

Pentru norma 2, atât semnificaţia cât şi modul de calcul vor fi prezentate în 

capitolele următoare. 

Normele p matriceale, aplicate unor vectori priviţi ca matrice, dau aceleaşi valori 

ca normele p vectoriale. Astfel, nu e nici o posibilitate de confuzie în utilizarea 

aceluiaşi simbol ‖ · ‖ p pentru normele matriceale şi cele vectoriale. 

În sfârşit, normele matriceale subordonate unor norme vectoriale sunt consistente 

(demonstraţi, folosind definiţia) şi, în plus, au proprietatea ‖I‖ = 1. 

Echivalenţă. Normele matriceale prezentate mai sus sunt echivalente, în sensul 

relaţiei (1.4). De exemplu (vezi problema 1.10): 

j=1 

1 

√ n 

‖A‖ ∞ ≤ ‖A‖ 2 ≤ √ m‖A‖ ∞ , 

1 

√ m 

‖A‖ 1 ≤ ‖A‖ 2 ≤ √ n‖A‖ 1 , 

(1.29) 

‖A‖ 2 ≤ ‖A‖ F ≤ √ n‖A‖ 2 . 

Cazul complex. O normă matriceală peste spaţiul complex C m×n este o funcţie 

cu valori reale pozitive satisfăcând cele trei condiţii de la începutul secţiunii. Toate 

definiţiile şi relaţiile de mai sus rămân valabile, cu singura observaţie că acum norma 

Frobenius este ‖A‖ 2 F = ∑ m 

i=1 

∑ n 

j=1 |a ij| 2 . 

AA. Calculul normei 1 se face folosind direct relaţiile (1.28): 

Algoritmul 1.13 (Nm1 – Calculul normei matriceale 1) (Se dă 

A ∈ R m×n . Se calculează ν = ‖A‖ 1 .)

1.6. MATRICE STRUCTURATE 39 

0 

0 

L 

U 

Fig. 1.6: Matrice inferior şi superior triunghiulare 

1. ν ← 0 


1. α ← 0 


1. α ← α + |a ij | 

3. Dacă α > ν atunci ν ← α 

Algoritmul necesită mn flopi. Calculul normei ∞ este asemănător şi are aceeaşi 

complexitate. Calculul normei Frobenius necesită 2mn flopi; desigur, pentru evitarea 

depăşirilor superioare, în implementarea formulei directe (1.26) se utilizează scalarea. 

În schimb, după cum vom vedea, calculul normei 2 face apel la noţiuni mai evoluate 

şi implică O(n 3 ) operaţii (pentru matrice pătrate). De aceea, normele 1, ∞ şi 

Frobenius sunt cele mai folosite în calculul numeric elementar. Toate aceste norme 

fiind echivalente, criteriul de alegere primordial este efortul de calcul. 

1.6 Matrice structurate 

În numeroase probleme apar matrice ale căror elemente sunt nule în anumite regiuni. 

Astfel de matrice sunt numite generic structurate; în cazul lor, algoritmii de rezolvare 

a unei probleme oarecare sunt de obicei mai simpli; de aceea, majoritatea algoritmilor 

generali au ca prim obiectiv reducerea matricei iniţiale la una cu structură 

mai simplă. 

În această secţiune vom prezenta câteva tipuri de matrice structurate şi proprietăţile 

lor principale. Pentru simplitate, vom considera doar matrice pătrate, 

din R n×n . Extinderea la matrice dreptunghiulare este imediată. 

Definiţii. 1) O matrice D se numeşte diagonală dacă elementele nediagonale 

sunt nule, adică d ij = 0, pentru i ≠ j. 

2) O matrice T se numeşte inferior triunghiulară dacă t ij = 0, pentru i < j, şi 

superior triunghiulară dacă t ij = 0, pentru i > j. Figura 1.6 prezintă astfel de matrice. 

Evident, o matrice simultan inferior şi superior triunghiulară este diagonală. 

O matrice se numeşte triunghiulară unitate dacă este triunghiulară şi, în plus, 

toate elementele sale diagonale sunt egale cu 1. 

O matrice se numeşte strict triunghiulară dacă este triunghiulară şi toate e- 

lementele sale diagonale sunt nule. De exemplu, o matrice A este strict inferior


triunghiulară dacă a ij = 0, pentru i ≤ j. 

Matricele triunghiulare au proprietăţi deosebite care vor fi evidenţiate în secţiuni 

următoare ale acestui capitol. 

3) O matrice H se numeşte inferior Hessenberg dacă h ij = 0, pentru j > i + 1, 

şi superior Hessenberg dacă h ij = 0, pentru i > j + 1. 

4) O matrice A se numeşte tridiagonală dacă este simultan inferior şi superior 

Hessenberg, adică a ij = 0, pentru |i − j| > 1. 

În general, o matrice B se numeşte bandă, de lăţime inferioară p, dacă b ij = 0, 

pentru i > j+p, şi de lăţime superioară q, dacă b ij = 0, pentru j > i+q. Dacă p = q, 

vom spune că B este matrice bandă de lăţime p. Evident, matricele tridiagonale 

sunt un caz particular de matrice bandă, cu p = q = 1. O matrice bandă cu 

p = q = 2 se zice pentadiagonală. 

Proprietăţi. Vom prezenta în continuare câteva proprietăţi utile ale matricelor 

structurate. 

Este evident că suma a două matrice cu structuri identice va avea aceeaşi structură. 

De asemenea, înmulţirea unei matrice cu un scalar conservă structura. 

În ce priveşte produsul, proprietăţile nu mai sunt atât de generale. 

Propoziţia 1.2 a. Dacă D este o matrice diagonală şi A este o matrice structurată, 

atunci matricele DA şi AD vor avea structura matricei A. 

b. Produsul a două matrice inferior (superior) triunghiulare (unitate) este o 

matrice inferior (superior) triunghiulară (unitate). 

c. Dacă L este o matrice inferior (superior) triunghiulară şi H este inferior (superior) 

Hessenberg, atunci LH şi HL sunt matrice inferior (superior) Hessenberg. 

Demonstraţie. Vom demonstra doar punctul b în cazul inferior triunghiular, celelalte 

demonstraţii fiind lăsate ca exerciţiu. 

Fie A şi B două matrice inferior triunghiulare, şi C = AB. Evident, 

c ij = ∑ n 

k=1 a ikb kj . Considerăm i < j. A fiind inferior triunghiulară, a ik = 0 pentru 

k > i; în plus, b kj = 0, pentru k ≤ i < j, deoarece B este inferior triunghiulară; 

aşadar, a ik b kj = 0, pentru oricare k ∈ 1 : n, deci c ij = 0 pentru i < j, adică C este 

inferior triunghiulară. 

Elementele posibil nenule ale matricei C (pentru i ≥ j) se calculează economic 

cu relaţia 

i∑ 

c ij = a ik b kj , (1.30) 

k=j 

deoarece a ik = 0 pentru k > i şi b kj = 0 pentru k < j. 

Dacă A şi B sunt inferior triunghiulare unitate, atunci particularizând (1.30) se 

obţine c ii = a ii b ii = 1, deci şi C este inferior triunghiulară unitate. ♦ 

AA. Înmulţirea matricelor triunghiulare. Datorită elementelor nule, algoritmii 

implicând matrice structurate pot fi simplificaţi astfel încât să fie executate 

doar operaţiile aritmetice strict necesare. 

Vom exemplifica cu algoritmul de înmulţire a două matrice inferior triunghiulare, 

A şi B. Profităm de faptul că rezultatul C este inferior triunghiular şi calculăm c ij 

numai pentru i ≥ j, folosind (1.30) şi nu formula generală.

1.6. MATRICE STRUCTURATE 41 

Algoritmul 1.14 (TRMM – Înmulţire de matrice inferior triunghiulare) 

(Se dau A, B ∈ R n×n inferior triunghiulare. Se calculează 

C = AB.) 


1. Pentru j = 1 : i 

1. c ij = ∑ i 

k=j a ikb kj 

Comentarii. Cele două bucle sunt destinate parcurgerii pe linii a elementelor 

triunghiului inferior al matricei C; parcurgerea se poate face şi pe coloane, prin: 

Pentru j = 1 : n, Pentru i = j : n. Acest algoritm necesită n 3 /3 flopi, adică de 

şase ori mai puţin decât algoritmul general de înmulţire de matrice. ♦ 

AA. Memorarea matricelor structurate se poate face în tablouri n × n, 

ca pentru toate celelalte matrice, cu dezavantajul stocării elementelor nule; totuşi, 

există şi un avantaj: accesul la elementele matricelor se face identic pentru matricele 

generale şi pentru cele structurate. 

Dacă se doreşte economie de memorie, stocarea elementelor nule se poate evita 

uşor; acest mod de memorare se numeşte compact sau împachetat (packed). Exemplificăm 

în continuare pentru câteva tipuri de matrice. 

O matrice triunghiulară se poate memora într-un vector, să-l notăm v, de 

lungime n(n + 1)/2 (numărul elementelor posibil nenule ale matricei). Dacă L 

este inferior triunghiulară, atunci o ordine naturală de memorare, cea pe linii, este 

l 11 , l 21 , l 22 , l 31 , . . . (în v 1 , v 2 , v 3 , v 4 , . . . ). Se observă că l ij se memorează în poziţia 

i(i−1) 

2 

+ j din v. 

O matrice tridiagonală T se poate memora în trei vectori a, b, c (în fiecare câte 

o diagonală), ceea ce este evident din notaţia: 

⎡ 

T = 

⎢ 

⎣ 

a 1 c 1 

b 2 a 2 c 2 

. .. . .. . .. 

⎤ 

. 

⎥ 

b n−1 a n−1 c n−1 

⎦ 

b n a n 

În general, o matrice bandă B, de lăţime p, se poate memora uşor într-un tablou 

cu 2p + 1 linii şi n coloane. Exemplificăm pentru p = 2: 

⎡ 

⎤ 

α β γ 

δ α β γ 

∗ ∗ γ . . . γ γ γ 

ε δ α β γ 

∗ β β . . . β β β 

B = 

ε δ α β γ 

α α α . . . α α α 

⎢ 

⎣ 

ε δ α β γ ⎥ δ δ δ . . . δ δ ∗ 

⎦ 

. .. . .. . .. . .. . ε ε ε . . . ε ∗ ∗ 

.. 

În stânga se găseşte matricea bandă (cu elementele notate generic), în dreapta 

tabloul de memorare (prin ∗ sunt notate elemente nesemnificative); se observă că elementele 

de pe aceeaşi diagonală a matricei se memorează pe aceeaşi linie a tabloului. 

Elementul b ij se memorează pe linia p + i − j + 1, coloana j.


× • • × • 

× × × × × 

× • • × • 

× • • × • 

 

 

 

 

 

 

(a) (b) (c) 

Fig. 1.7: Submatrice: (a) cu I = {1, 3, 4}, J = {2, 3, 5} (elementele submatricei 

sunt notate cu •); (b) bloc; (c) lider principală 

1.7 Matrice bloc 

Submatrice, bloc. Până acum am privit o matrice A ca fiind formată din 

elemente sau, eventual, din coloane sau linii, ca în (1.7), (1.8), respectiv (1.13). Un 

alt punct de vedere este de a evidenţia submatrice sau blocuri, adică matrice de 

dimensiuni mai mici conţinute în A. 

În sensul cel mai larg, noţiunea de submatrice se defineşte după cum urmează. 

Dacă A ∈ R m×n , iar I = {i 1 , i 2 , . . . , i r } ⊂ 1 : m şi J = {j 1 , j 2 , . . . , j p } ⊂ 1 : n sunt 

două mulţimi de indici astfel încât i 1 

matricea A ′ de dimensiune r × p definită de a ′ kl = a i k j l 

, este numită submatrice a 

matricei A. Figura 1.7a ilustrează noţiunea. 

Se observă că A ′ este obţinută prin extragerea elementelor aflate la ”intersecţiile” 

liniilor şi coloanelor din I, respectiv J . Dacă indicii din I, respectiv J , sunt 

consecutivi, atunci submatricea mai este numită şi bloc. Pentru a ne referi la blocul 

astfel definit vom folosi şi notaţia A(i 1 : i r , j 1 : j p ). 

Dacă A ∈ R n×n şi I = J , atunci submatricea A ′ se numeşte principală. Dacă, 

în plus, I = {1, 2, . . ., r}, atunci A ′ not 

= A [r] este numită submatrice lider principală 

de ordin r a matricei A; aceasta este blocul r × r poziţionat stânga-sus în A. Vezi 

figurile 1.7b,c. 

Partiţionări conforme. Vom lucra în continuare cu matrice partiţionate în 

blocuri, notate astfel 

⎡ 

⎤ 

A 11 A 12 . . . A 1n 

A 21 A 22 . . . A 2n 

A = ⎢ 

⎣ 

. 

. 

. .. . 

⎥ 

⎦ , 

A m1 A m2 . . . A mn 

⎡ 

⎤ 

B 11 B 12 . . . B 1l 

B = B 21 B 22 . . . B 2l 

⎢ 

⎣ 

. 

. 

. .. . 

⎥ 

⎦ , (1.31) 

B p1 B p2 . . . B pl 

în care blocurile A ij au dimensiune µ i × ν j , iar B ij dimensiune π i × λ j . Evident, 

matricea A are (µ 1 + . . . + µ m ) linii şi (ν 1 + . . . + ν n ) coloane. 

Este interesant să studiem operaţiile cu matrice astfel partiţionate, mai precis 

modul de partiţionare care permite înlocuirea operaţiilor cu elemente prin cele cu 

blocuri.

1.7. MATRICE BLOC 43 

• Dacă m = p, µ i = π i , ∀i ∈ 1 : m, şi n = l, cu ν j = λ j , ∀j ∈ 1 : n, atunci 

A + B = C = 

⎡ 

⎢ 

⎣ 

⎤ 

C 11 . . . C 1n 

. 

. .. 

⎥ 

. ⎦, cu C ij = A ij + B ij . (1.32) 

. . . C mn 

C m1 

• Dacă n = p, ν i = π i , ∀i ∈ 1 : n, atunci 

⎡ 

⎤ 

D 11 . . . D 1l 

⎢ 

AB = D = ⎣ 

. 

. .. 

⎥ 

n∑ 

. ⎦, cu D ij = A ik B kj . (1.33) 

. . . D 

k=1 

ml 

D m1 

Partiţionările care permit scrierea relaţiilor de mai sus se numesc conforme cu 

operaţia executată; se observă că formulele de calcul al sumei şi produsului la nivel 

de bloc sunt similare celor la nivel de element; evident, suma şi produsul a două 

blocuri se calculează cu formulele elementare cunoscute. 

Întorcându-ne la secţiunea dedicată înmulţirii de matrice, putem acum constata 

că relaţiile (1.15)–(1.18) sunt cazuri particulare ale relaţiei (1.33). 

• Pentru transpunere avem 

⎡ 

⎤ 

A T 11 A T 21 . . . A T m1 

A T A T 12 A T 22 . . . A T m2 

= ⎢ 

⎣ 

. 

. 

. .. . 

⎥ 

⎦ . (1.34) 

A T 1n A T 2n . . . A T mn 

Matrice bloc structurate. O matrice partiţionată ca în (1.31) poate fi structurată 

la nivel de blocuri. Folosim aceleaşi definiţii ca în secţiunea precedentă, 

gândind însă acum la nivel de blocuri şi nu la nivel de element. 

Presupunem că A din 1.31 este pătrată, m = n şi blocurile diagonale sunt 

pătrate, adică µ i = ν i , i ∈ 1 : n (cu aceste ipoteze, diagonala principală a fiecărui 

bloc A ii este parte din diagonala principală a matricei). Spunem că A este bloc 

diagonală dacă A ij = 0, pentru i ≠ j; A este bloc superior triunghiulară dacă 

A ij = 0, pentru i > j, etc. Este evident că, în general, o matrice bloc diagonală nu 

este diagonală, o matrice bloc triunghiulară nu este triunghiulară etc. 

Structura la nivel de bloc este conservată la adunare dacă matricele operand sunt 

partiţionate conform pentru adunare. Pentru înmulţire, este adevărat analogul la 

nivel de bloc al propoziţiei 1.2, adică, de exemplu, produsul a două matrice bloc 

superior (inferior) triunghiulare partiţionate conform este o matrice bloc superior 

(inferior) triunghiulare. 

AA. Înmulţire la nivel de bloc. Pe calculatoarele cu memorie ierarhică, cu 

structura sugerată în figura 0.4c, partiţionarea matricelor în blocuri şi utilizarea unei 

relaţii de tipul (1.33) poate conduce la o eficienţă sporită a înmulţirii de matrice. 

Considerăm, pentru simplitate, matricele pătrate A, B ∈ R q×q şi dorim să calculăm 

produsul lor C = AB. Partiţionăm A, B şi C ca în (1.31), cu menţiunea 

că acum m = n, p = l, iar toate blocurile sunt pătrate şi au aceleaşi dimensiuni,


adică A ij ∈ R r×r , r fiind numită dimensiunea blocurilor, iar m = q/r numărul de 

blocuri; presupunem că r divide dimensiunea matricelor q doar pentru a simplifica 

expunerea. 

Exprimăm produsul matriceal ca în (1.33), deci 

C ij = 

m∑ 

A ik B kj . (1.35) 

k=1 

Pe un calculator cu memorie ierarhică trebuie minimizat traficul între memoria 

principală MP şi memoria rapidă MR. Desigur, matricele A, B, C sunt stocate 

în MP. Dacă alegem dimensiunea blocurilor r astfel încât 3 blocuri de matrice să 

poată fi stocate simultan în MR (deci, 3r 2 < dim(MR)), atunci putem construi 

un algoritm de calcul al produsului matriceal bazat pe ideea de a aduce, pe rând, 

blocurile A ik , B kj implicate în suma din (1.35), din MP în MR, şi abia apoi de a 

efectua înmulţirea lor. 

Algoritmul 1.15 (Se dau matricele A, B. Se calculează produsul 

matriceal C = AB, la nivel de bloc. Se presupune că variabilele X, Y şi 

Z se găsesc în MR.) 


1. Pentru j = 1 : m 

1. Z ← 0 

2. Pentru k = 1 : m 

1. X ← A ik , Y ← B kj 

2. Z ← Z + X · Y 

3. C ij ← Z 

Comentarii. În acest algoritm, atribuirile din instrucţiunea 1.1.2.1 reprezintă de 

fapt transferuri din MP în MR; analog, în instrucţiunea 1.1.3 se execută un transfer 

din MR în MP. Operaţia matriceală Z ← Z +X ·Y din 1.1.2.2 nu este detaliată aici; 

ea se execută cu algoritmul 1.10 la nivel de element; esenţial este faptul că toate 

variabilele implicate se găsesc în MR, deci nu e necesar nici un transfer din/spre MP. 

Lucrând la nivel de blocuri, numărul de operaţii rămâne neschimbat, adică 2q 3 ; 

în schimb, numărul de accesuri la MP devine 2r 2 m 3 = 2q 2 m = 2q 3 /r (instrucţiunea 

1.1.2.1 se execută de m 3 ori, de fiecare dată transferându-se două blocuri cu r 2 

elemente). 

Dacă s-ar folosi algoritmul 1.10 la nivel de element pe un calculator cu memorie 

ierarhică, fiecare operaţie c ij ← c ij + a ik b kj ar implica cel puţin două transferuri 

din MP în MR (putem presupune că c ij rămâne în MR cât timp este calculat). Ar 

avea loc deci aproximativ 2q 3 accesuri la MP. 

În concluzie, faţă de versiunea la nivel de element, în algoritmul 1.15 la nivel 

de bloc se accesează de r ori mai puţin memoria principală, ceea ce conduce la o 

creştere semnificativă de viteză. 

♦ 

Să rezumăm ideea eficientizării algoritmilor pe calculatoare cu memorie ierarhică; 

ea va fi folosită şi în rezolvarea altor probleme. Se partiţionează matricele de 

intrare în blocuri şi se exprimă algoritmul în operaţii între blocuri (aceasta e banal

1.7. MATRICE BLOC 45 

la produsul matriceal, dar mai complicat la alte probleme); dimensiunile blocurilor 

se aleg cât mai mari (de obicei), dar astfel încât toate blocurile implicate într-o 

operaţie să încapă simultan în MR. 

Algoritmul Strassen. Aparent, prin însăşi definiţia ei (algoritmul numit 

generic ”standard”, în continuare), înmulţirea a două matrice n × n reale necesită 

2n 3 flopi. Există însă o multitudine de algoritmi, numiţi global ”rapizi”, deşi se 

bazează pe idei diferite, care au o complexitate aritmetică mai mică. Primul dintre 

aceştia, şi singurul dovedit utilizabil în practică (împreună cu unele variante), este 

cel descoperit în 1969 de Strassen []. 

Fie A, B ∈ R n×n şi, pentru simplitate, considerăm că n este divizibil cu 2. 

Partiţionăm matricele A, B şi C = AB în blocuri de dimensiune n/2 × n/2, adică 

A = 

[ ] 

A11 A 12 

, B = 

A 21 A 22 

[ ] 

B11 B 12 

, C = 

B 21 B 22 

[ ] 

C11 C 12 

. (1.36) 

C 21 C 22 

Algoritmul lui Strassen este definit de formulele următoare, uşor de verificat prin 

simplă substituţie: 

[ ] 

M1 + M 

C = A · B = 2 + M 3 − M 4 M 4 + M 6 

M 3 + M 5 M 1 − M 5 + M 6 + M 7 

M 1 = (A 11 + A 22 ) · (B 11 + B 22 ) M 5 = (A 21 + A 22 ) · B 11 

M 2 = (A 12 − A 22 ) · (B 21 + B 22 ) M 6 = A 11 · (B 12 − B 22 ) 

M 3 = A 22 · (B 21 − B 11 ) M 7 = (A 21 − A 11 ) · (B 11 + B 12 ) 

M 4 = (A 11 + A 12 ) · B 22 

(1.37) 

Se observă că pentru calculul matricei C sunt necesare 7 înmulţiri şi 18 adunări 

de matrice de dimensiune n/2 × n/2, în timp ce în algoritmul standard la nivel de 

bloc se fac, pentru aceeaşi partiţionare (1.36), 8 înmulţiri şi 4 adunări de blocuri. 

Astfel, numărul de operaţii pentru algoritmul Strassen este N 1 (n) = 14n3 

8 

+ 18n2 

4 . 

Este evident că, pentru n suficient de mare (mai precis n > 18), N 1 (n) < 2n 3 şi deci 

algoritmul Strassen este mai rapid decât cel standard. În schimb, implementarea 

formulelor (1.37) necesită memorie suplimentară pentru rezultatele intermediare. 

Un număr de operaţii şi mai bun se obţine dacă, pentru calculul celor 7 produse 

de matrice n/2 × n/2 din (1.37) se utilizează, recursiv, aceleaşi formule ale 

lui Strassen. La fiecare nivel de recursie dimensiunea problemei se înjumătăţeşte 

(simplificând, presupunem acum că n este o putere a lui 2). Recursia are loc până 

când se atinge o dimensiune n 0 suficient de mică, pentru care algoritmul standard 

este mai eficient decât cel al lui Strassen. Numărul de operaţii N(n) este definit de 

recurenţa 

N(n) = 7N( n 2 ) + 18n2 4 , N(n 0) = 2n 3 0, (1.38) 

a cărei soluţie, pentru n ≫ n 0 , este de ordinul 

N(n) = O(n log 2 7 ), (log 2 7 ≈ 2.807). (1.39) 

Vezi problema 1.20 pentru soluţia exactă.


În practică, dimensiunea n 0 este mai mare decât 18 (dar de obicei n 0 < 100), 

datorită operaţiilor nearitmetice suplimentare necesare în algoritmul Strassen, în 

special alocărilor de memorie şi apelurilor recursive. Aşadar, acest algoritm este 

eficient pentru înmulţirea matricelor mari, cu dimensiuni de ordinul sutelor sau 

miilor. 

În privinţa stabilităţii numerice algoritmul Strassen este inferior celui standard, 

de aceea trebuie utilizat cu anume precauţii. Recomandăm referinţele [IX], [] 

cititorului interesat. 

1.8 Matrice normale 

În această secţiune vom lucra în principal cu matrice pătrate, din R n×n , specificând 

explicit celelalte cazuri. 

O matrice A ∈ R n×n se numeşte normală dacă A T A = AA T . 

Matricele normale au proprietăţi deosebit de interesante, cu precădere în câteva 

cazuri particulare pe care le enumerăm acum şi le vom discuta pe larg în continuare: 

1. matricele simetrice, pentru care A = A T ; 

2. matricele antisimetrice, care satisfac A = −A T ; 

3. matricele ortogonale, pentru care A T A = I. 

Fie A ∈ R n×n ; se numeşte formă biliniară asociată matricei A funcţia 

f : R n × R n → R, f(x, y) = x T Ay = ∑ n ∑ n 

i=1 j=1 a ijx i y j . Se observă că funcţia este 

liniară în fiecare din cele două argumente luate separat, ceea ce îi justifică numele. 

Matrice simetrice. Matricea A este simetrică dacă A = A T , adică a ij = a ji , 

∀i, j ∈ 1 : n. Aşadar simetria este faţă de diagonala principală a matricei; se observă 

că pentru o matrice nepătrată noţiunea de simetrie nu are sens, A şi A T neavând 

aceleaşi dimensiuni. 

Suma şi produsul cu scalari conservă simetria, adică dacă matricele A, B sunt 

simetrice şi α ∈ R, atunci A + B şi αA sunt simetrice. În schimb, în general, 

produsul AB nu este simetric; consideraţi, de exemplu, A = 

[ ] 1 1 

B = . 

1 1 

[ 

1 1 

1 2 

Matrice antisimetrice. Matricea A este antisimetrică dacă A = −A T , adică 

a ij = −a ji , ∀i, j ∈ 1 : n. Evident, elementele sale diagonale sunt nule. 

Forma pătratică asociată unei matrice simetrice este funcţia g : R n → R, 

g(x) = x T Ax = ∑ n ∑ n 

i=1 j=1 a ijx i x j . Forma pătratică este un polinom omogen de 

gradul 2, în n variabile; de asemenea, se observă că g(x) = f(x, x), unde f este 

forma biliniară asociată matricei A 7 . 

7 Formele pătratice se asociază numai matricelor simetrice din următorul motiv: dacă A nu e 

simetrică, luând Ã = (A + AT )/2 se vede că x T Ax = x T Ãx, ∀x ∈ Rn , şi Ã este simetrică. Să 

notăm că B = (A − A T )/2 se numeşte componenta antisimetrică, iar x T Bx = 0. 

] 

şi

1.8. MATRICE NORMALE 47 

Matricele simetrice şi formele pătratice asociate pot avea ”semn”, în sensul 

definit în continuare. 

O matrice simetrică A este pozitiv definită dacă x T Ax > 0, pentru orice vector 

x ∈ R n , x ≠ 0; se notează A > 0, dar, atenţie, [ aceasta] 

nu înseamnă că toate 

2 −1 

elementele matricei sunt pozitive; de exemplu, este pozitiv definită, 

−1 

[ 

2 

] 

1 2 

deoarece 2x 2 1 − 2x 1x 2 + 2x 2 2 > 0, ∀[x 1 x 2 ] T ≠ 0, însă nu este, deoarece 

2 1 

x 2 1 − 4x 1x 2 + x 2 2 poate avea orice semn când x 1, x 2 ∈ R. Matricea A este pozitiv 

semidefinită dacă x T Ax ≥ 0, ∀x ∈ R n , ceea ce se notează A ≥ 0. 

O matrice simetrică A este negativ (semi)definită dacă −A este pozitiv (semi)- 

definită. O matrice simetrică care nu se încadrează în nici una dintre categoriile de 

mai sus se numeşte cu semn nedefinit. 

Suma şi produsul cu scalari pozitivi conservă semnul; de exemplu, dacă A, B 

sunt pozitiv definite şi α > 0, atunci A+B şi αA sunt pozitiv definite (demonstraţi !). 

Propoziţia 1.3 O submatrice principală a unei matrice pozitiv definite A este pozitiv 

definită. În particular, submatricele lider principale A [k] , k ∈ 1 : n, sunt 

pozitiv definite şi toate elementele diagonale sunt pozitive. 

Demonstraţie. Fie I = {i 1 , i 2 , . . . , i r }, mulţimea de indici definind o submatrice 

principală A ′ a matricei A. Pentru orice vector nenul x ∈ R r , definim vectorul 

y ∈ R n prin: 

y ik = x k , k = 1 : r, 

y i = 0, i ∉ I. 

Evident, x ≠ 0 implică y ≠ 0, şi din pozitivitatea matricei A se deduce: 

x T A ′ x = y T Ay > 0, adică A ′ este pozitiv definită. 

♦ 

Congruenţă. Două matrice simetrice A, B se numesc congruente dacă există 

o matrice nesingulară T ∈ R n×n astfel încât B = T T AT. Evident, A = T −T BT −1 . 

(Demonstraţi că simetria este conservată de transformarea de congruenţă.) 

Dacă A, B sunt congruente şi A > 0, atunci B > 0, adică transformarea de 

congruenţă conservă semnul. (Într-adevăr, xT Bx = x T T T ATx = (Tx) T A(Tx) > 0, 

pentru că A > 0 şi Tx ≠ 0, dacă x ≠ 0, coloanele lui T fiind liniar independente.) 

Matrice ortogonale. O matrice pătrată Q ∈ R n×n este ortogonală dacă 

Q T Q = I n ; evident, avem Q T = Q −1 , deci transpusa matricei este chiar inversa ei, 

iar QQ T = I n . Partiţionând Q pe coloane şi exprimând Q T Q prin produse scalare, 

definiţia este echivalentă cu qi Tq j = 0, pentru i ≠ j, şi ‖q i ‖ 2 = 1, adică matricea Q 

are coloanele vectori ortonormali. 

În cazul în care matricea nu este pătrată, Q ∈ R m×n , dacă Q T Q = I n , atunci 

matricea are coloanele ortonormale (m > n şi QQ T ≠ I m ). Dacă QQ T = I m , atunci 

matricea are liniile ortogonale (m < n şi Q T Q ≠ I n ). 

Vom considera în continuare doar matrice ortogonale pătrate. Referitor la 

operaţiile elementare, vom observa că produsul a două matrice ortogonale este 

o matrice ortogonală; într-adevăr, dacă Q, U sunt amândouă ortogonale, atunci 

(QU) T (QU) = U T Q T QU = U T U = I. Aşadar, matricele ortogonale formează grup 

în raport cu înmulţirea, notat GO(n).


De asemenea, transpusa unei matrice ortogonale este ortogonală, deoarece 

(Q T ) T Q T = QQ T = I. În schimb, suma a două matrice ortogonale nu este ortogonală, 

nici produsul unei matrice ortogonale cu un scalar diferit de ±1. 

Matricele ortogonale au proprietatea remarcabilă de a conserva normele 2 şi 

Frobenius. 

Propoziţia 1.4 Fie matricele ortogonale Q ∈ R n×n , U ∈ R m×m . Atunci: 

1. ‖Qx‖ 2 = ‖x‖ 2 , ∀x ∈ R n , deci ‖Q‖ 2 = 1. 

2. ‖UAQ‖ 2 = ‖A‖ 2 , ‖UAQ‖ F = ‖A‖ F , ∀A ∈ R m×n . 

Demonstraţie. 1. ‖Qx‖ 2 2 = (Qx) T (Qx) = x T Q T Qx = x T x = ‖x‖ 2 . 

2. Aplicând punctul 1 avem 

‖UA‖ 2 = max 

‖x‖ 2=1 ‖U(Ax)‖ 2 = max 

‖x‖ 2=1 ‖Ax‖ 2 = ‖A‖ 2 . 

Deoarece ImQ = R n , aplicând din nou punctul 1 avem 

‖AQ‖ 2 = max 

‖x‖ 2=1 ‖AQx‖ 2 = max 

‖Qx‖ 2=1 ‖A(Qx)‖ 2 = ‖A‖ 2 . 

Utilizând cele două rezultate anterioare se obţine ‖UAQ‖ 2 = ‖AQ‖ 2 = ‖A‖ 2 . 

Revenim acum puţin la noţiunea de echivalenţă, prezentată în secţiunea 1.4. 

Două matrice A, B ∈ R m×n se numesc ortogonal echivalente la dreapta (stânga), 

dacă există o matrice ortogonală Q ∈ R n×n (Q ∈ R m×m ) astfel încât A = BQ (A = 

QB). A şi B se numesc ortogonal echivalente dacă există Q ∈ R m×m , P ∈ R n×n 

ortogonale astfel încât B = Q T AP. 

Presupunând A, B de rang maxim (deci coloanele lor sunt baze pentru ImA, respectiv 

ImB) şi amintindu-ne că A = QB se scrie pe coloane a i = Qb i , să observăm 

că a T i a j = b T i QT Qb j = b T i b j, deci unghiurile dintre vectorii componenţi ai bazei se 

păstrează la o transformare de echivalenţă ortogonală (la stânga). 

Proiectori. Fie o matrice P ∈ R n×n şi un subspaţiu S ⊂ R n . P se numeşte 

proiector pe S dacă ImP = S şi P 2 = P. Justificare: dacă x ∈ R n , atunci Px ∈ 

ImP = S, deci aplicarea proiectorului unui vector oarecare îl va duce pe acesta în S; 

Px este proiecţia lui x pe S. Mai mult, P(Px) = Px, deci aplicarea proiectorului 

nu modifică proiecţia. 

În general, orice matrice P astfel încât P 2 = P se zice matrice de proiecţie sau 

proiector, pentru că ea proiectează pe S def 

= ImP. Analog, Q = I − P proiectează 

pe T = ImQ. 

Dacă, în plus, matricea P este simetrică, atunci P se numeşte proiector ortogonal. 

Justificare: dacă x ∈ R n , atunci Px ∈ ImP şi P(x − Px) = 0, deci 

x − Px ∈ KerP = KerP T , deci Px ⊥ (x − Px), adică x se descompune ca sumă a 

doi vectori ortogonali ca în figura 1.8. 

Dacă matricea B ∈ R n×r are coloanele ortonormale (formând deci o bază ortogonală 

pentru ImB = S), atunci P = BB T este proiecţie ortogonală pe S şi, mai 

mult, este unică (demonstraţi !). 

Particularităţi ale matricelor complexe. Noţiunile de simetrie şi ortogonalitate 

se pot defini şi pentru matrice complexe. Având în vedere definiţia produsului 

♦

1.9. SISTEME DE ECUAŢII LINIARE 49 

✧ 

✧ 

✧ 

✧ 

✧ 

✻ 

x 

x − Px 

✟ ✟✟✟✟✟✟✟✟✟✯ ✲ 

✧ ✧✧✧✧ 

S 

Px 

Fig. 1.8: Acţiunea unui proiector ortogonal pe S asupra unui vector oarecare x 

scalar complex, mai utile sunt noţiunile analoage obţinute (formal) prin înlocuirea 

transpunerii prin transpunere şi complex conjugare. Dacă A ∈ C n×n , se notează 

cu A H = A T conjugata transpusei matricei A. Matricea A ∈ C n×n se numeşte 

normală dacă AA H = A H A. 

Matricea A ∈ C n×n se numeşte hermitică dacă A H = A. În acest caz scalarul 

x H Ax este real pentru orice x ∈ C n . O matrice hermitică A ∈ C n×n este pozitiv 

definită dacă x H Ax > 0, ∀x ∈ C n , x ≠ 0. O matrice A ∈ C n×n este unitară dacă 

A H A = I, adică are coloanele ortogonale în C n . 

AA. Memorarea matricelor simetrice. Dacă A ∈ R n×n este simetrică, deci 

A = A T , nu este necesară memorarea întregii matrice, ci doar a unei ”jumătăţi”, 

mai precis a triunghiului inferior sau a celui superior. Memorarea se poate face în 

variantele discutate pentru matrice triunghiulare, în secţiunea 1.6. 

Desigur, acest mod de memorare va implica particularizări ale algoritmilor; vom 

exemplifica pentru produsul matrice-vector (Gaxpy) y ← Ax + y, presupunând că 

A este memorată prin triunghiul superior. În exprimarea elementului y i, 

y i ← y i + 

n∑ ∑i−1 

a ij x j = y i + a ji x j + 

j=1 

j=1 

n∑ 

a ij x j , 

înlocuim elementele matricei A din linia i aflate în triunghiul inferior, prin cele egale 

aflate pe coloana i, în triunghiul superior, după cum este sugerat în figura 1.9. 

Acelaşi mod de memorare, printr-un singur triunghi, se utilizează şi în cazul 

matricelor antisimetrice sau hermitice. Propunem cititorului adaptarea algoritmului 

Gaxpy în aceste două cazuri. 

j=i 

1.9 Sisteme de ecuaţii liniare 

Un sistem de m ecuaţii liniare cu n necunoscute are forma 

⎧ 

a 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1 

⎪⎨ 

a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2 

. . . ⎪⎩ 

a m1 x 1 + a m2 x 2 + . . . + a mn x n = b m 

, (1.40) 

unde a ij ∈ R, b i ∈ R, pentru i = 1 : m, j = 1 : n, sunt date şi x j , j = 1 : n, sunt


i 

i 

A 

Fig. 1.9: Utilizarea elementelor din triunghiul superior în produsul dintre o matrice 

simetrică şi un vector 

x 

necunoscutele. 

În formă matriceală, sistemul este 

Ax = b, (1.41) 

A fiind numită matricea coeficienţilor, b termenul liber (sau partea dreaptă a sistemului), 

iar x vectorul necunoscutelor. 

Dacă termenul liber al sistemului este vectorul nul (b = 0), sistemul este numit 

omogen. 

Prima caracteristică importantă a unui sistem liniar este relaţia între m şi n: 

• când numărul de ecuaţii este mai mare decât numărul de necunoscute (m > n), 

sistemul (1.41) se numeşte supradeterminat; 

• când, dimpotrivă, numărul de necunoscute este mai mare (n > m), sistemul 

este numit subdeterminat; 

• în cazul unei matrice A pătrate (m = n), sistemul (1.41) este determinat. 

A găsi soluţia sistemului liniar (1.41) înseamnă a calcula un vector x ∈ R n astfel 

încât egalitatea Ax = b să fie satisfăcută. Desigur, aceasta se poate realiza doar 

dacă sistemul are într-adevăr (cel puţin) o soluţie. Dacă nu are, vom atribui o nouă 

semnificaţie noţiunii de ”soluţie”, astfel încât sistemul să aibă cel puţin una. Dacă 

există mai multe soluţii, va trebui selectată, într-un anume fel, una singură care va 

fi calculată. 

Condiţiile în care sistemul (1.41) are soluţie şi în care aceasta este unică sunt 

bine cunoscute din algebra liniară. 

Teorema 1.2 Sistemul liniar (1.41) are soluţie dacă şi numai dacă b ∈ ImA. 

Dacă ImA = R m , adică A este epică (are liniile independente), atunci sistemul 

(1.41) are soluţie pentru orice termen liber b ∈ R m şi reciproc. 

Demonstraţia este imediată prin definiţia lui ImA. 

♦


y 3 

✻ 

b ∉ ImA 

❍❨ b ❍ 

∈ ImA ❍ 

❍ 

❍ 

y 1 

❍✏ ✲ 

✟ 

✟ 

✏✏✏✏✏✏✏✶ 

✟ ✟ 

y 2 ✟✙ 

✟ 

ImA 

Fig. 1.10: ImA şi posibili b pentru exemplul 1.2 

⎡ 

Exemplul 1.2 Dacă A = ⎣ 1 0 ⎤ 

1 1 ⎦, atunci ImA este planul y 2 = y 1 + y 3 . Dacă 

0 1 

b = [b 1 b 2 b 3 ] T este astfel încât b 2 = b 1 + b 3 , atunci sistemul Ax = b are soluţie 

deoarece condiţia din teorema 1.2 este îndeplinită. Altfel, sistemul nu are soluţie 

(vezi figura 1.10). 

♦ 

Când soluţia există, unicitatea ei rezultă din 

Teorema 1.3 1) Dacă x 0 ∈ R n este o soluţie particulară a sistemului liniar (1.41), 

atunci mulţimea tuturor soluţiilor sistemului este varietatea liniară 

x 0 + KerA = {x = x 0 + z | z ∈ KerA}. 

2) Soluţia x este unică dacă şi numai dacă KerA = {0}, adică matricea A este 

monică (are coloanele independente). 

Demonstraţie. Dacă Ax 0 = b, atunci z = x − x 0 satisface Az = 0, deci z ∈ KerA; 

reciproc, Az = 0 implică A(x 0 + z) = b. 

♦ 

⎡ 

[ ] [ ] 

1 1 0 2 

Exemplul 1.3 Dacă A = şi b = , atunci x 

0 1 1 1 

0 = ⎣ 1 ⎤ 

1 ⎦ este 

0 

soluţie particulară pentru Ax = b. Pe de altă parte, KerA este dreapta descrisă de 

{ 

x1 + x 2 = 0 

x 2 + x 3 = 0 , 

care trece prin punctele O(0, 0, 0) şi P(1, −1, 1). Astfel, vectorii din KerA au forma 

⎡ 

Ker A ∋ z = α ⎣ 1 ⎤ 

−1 ⎦, α ∈ R, 

1


✻ 

P 

• 

x 3 

x 1 

✲ 

x 2 

✘✾✘ ✘✘ ✘ ✘✘✘ 

O 

• ✘ ✘✘✘ ✘ 

x ✘✘✘ ✘✿ 

x❅ 0 

❅❘ 

KerA 

x + KerA 

Fig. 1.11: Soluţiile (x 0 – soluţie particulară, x – soluţie generală) sistemului din 

exemplul 1.3 

şi deci (vezi figura 1.11), 

x + KerA = 

⎧ ⎡ 

⎨ 

⎩ y = ⎣ 1 + α 

1 − α 

α 

⎤ ⎫ 

⎬ 

⎦ | α ∈ R 

⎭ . 

♦ 

Corolar 1.1 Când matricea A este pătrată (A ∈ R n×n ), atunci următoarele afirmaţii 

sunt echivalente: 

i) ImA = R n , i.e. sistemul (1.41) admite soluţie unică pentru orice b ∈ R n ; 

ii) KerA = {0}; 

iii) A este inversabilă. 

Dacă sistemul are soluţie, aceasta se poate scrie 

x = A −1 b. (1.42) 

Dacă sistemul este omogen, atunci soluţia unică este x = 0. 

Trebuie subliniat că (1.42) nu este o formulă adecvată calculului numeric al 

soluţiei sistemului Ax = b. Vom vedea în capitolul 2 metode numerice eficiente şi 

precise pentru a face acest lucru. 

Când sistemul (1.41) nu are soluţie, este convenabil să definim pseudosoluţia x ∗ 

ca vectorul care minimizează o normă a reziduului r = b −Ax. Este evident că dacă 

b ∈ ImA, atunci această pseudosoluţie devine soluţie adevărată a sistemului. 

Când sistemul (1.41) are mai multe soluţii, o posibilitate de a selecta una dintre 

ele este de a defini soluţia normală x ∗ de ”lungime” minimă, lungimea fiind definită 

printr-o normă adecvată. 

Vom reveni asupra acestor definiţii în capitolul 3, acolo unde vom prezenta şi 

algoritmi de calcul al soluţiilor astfel definite.


Determinantul. Fie o matrice pătrată A ∈ R n×n ; determinantul matricei A 

este un număr real, notat det(A), pe care îl vom defini recursiv. Dacă A not 

= a ∈ R, 

atunci det(A) = a. Pentru A ∈ R n×n , 

det(A) = 

n∑ 

(−1) j+1 a 1j det(Ā1j), 

j=1 

unde Ā1j ∈ R (n−1)×(n−1) este matricea obţinută din A prin eliminarea liniei 1 şi 

coloanei j. 

Câteva proprietăţi importante ale determinantului sunt: 

1. det(I) = 1; 

2. det(αA) = α n det(A), ∀α ∈ R; 

3. det(A T ) = det(A); 

4. det(AB) = det(A) · det(B). 

O matrice A ∈ R n×n pentru care det(A) ≠ 0 se numeşte nesingulară. Se poate 

demonstra că noţiunea de nesingularitate este echivalentă cu cea de inversabilitate. 

Să notăm de acum că în rezolvarea numerică a sistemului determinat Ax = b 

nesingularitatea matricei A nu se verifică prin calculul determinantului, ci prin alte 

mijloace, mult mai eficiente şi sigure, după cum se va vedea în capitolul 2. De aceea 

mai departe vom spune de cele mai multe ori inversabilă în loc de nesingulară. 

AA. Rezolvarea sistemelor triunghiulare. Sistemul Ax = b este numit inferior 

(superior) triunghiular dacă matricea A este inferior (superior) triunghiulară. 

O matrice triunghiulară este inversabilă dacă şi numai dacă toate elementele 

sale diagonale sunt nenule. 

Algoritmii pentru rezolvarea sistemelor triunghiulare sunt foarte simpli, deoarece 

necunoscutele pot fi calculate, într-o ordine precizată, prin substituţie numerică. 

Să considerăm întâi un sistem inferior triunghiular, Lx = b, unde L ∈ R n×n , cu 

l ij = 0 pentru i < j, l ii ≠ 0, i ∈ 1 : n, şi b ∈ R n . Prima ecuaţie este l 11 x 1 = b 1 , din 

care 

x 1 = b 1 / l 11 . (1.43) 

În general, dacă se cunosc x 1 , x 2 , . . . , x i−1 , se poate rezolva a i-a ecuaţie, 

∑i−1 

l ij x j + l ii x i = b i , 

j=1 

pentru a obţine 

⎛ ⎞ 

∑i−1 

x i = ⎝b i − l ij x j 

⎠ / l ii . (1.44) 

j=1 

Formulele (1.43) şi (1.44) definesc un algoritm pentru calculul soluţiei sistemului 

Lx = b, cunoscut ca metoda substituţiei înainte. 

Algoritmul 1.16 (LTRIS – Calculul soluţiei unui sistem inferior 

triunghiular) (Se dau L ∈ R n×n , inferior triunghiulară, inversabilă, şi 

b ∈ R n . Se calculează soluţia x a sistemului Lx = b.)


1. x ← b 


1. Pentru j = 1 : i − 1 

1. x i ← x i − l ij x j 

2. x i ← x i / l ii 

Comentarii. Bucla Pentru interioară se poate înlocui cu un apel la produsul 

scalar DOT(L(i, 1 : i − 1), x(1 : i − 1)). Fiecare execuţie a buclei Pentru i necesită 

2(i − 1) flopi în 2.1.1, pentru calculul sumei din (1.44), şi 1 flop pentru împărţirea 

din 2.2. În total, sunt necesari N LTRIS = ∑ n 

i=1 

(2(i − 1) + 1) = n(n − 1) + n = n2 

flopi şi M LTRIS = n(n + 1)/2 + 2n + 1 ≈ n 2 /2 locaţii de memorie (pentru elemente 

în virgulă mobilă). Dacă vectorul b nu este necesar ulterior, soluţia x poate fi 

memorată în aceeaşi zonă de memorie cu b; se spune că se efectuează calculul pe loc 

în b. Ulterior, vom apela acest algoritm prin x = LTRIS(L, b). 

♦ 

Un algoritm cu aceleaşi proprietăţi se obţine dacă schimbăm ordinea celor două 

bucle, ceea ce revine la a parcurge matricea L pe coloane, nu pe linii. Substituţia 

decurge acum astfel: după calculul lui x 1 cu (1.43), se actualizează valorile celorlalte 

necunoscute x i , i = 2 : n (iniţializate cu b i ), cu termenul l i1 x 1 care contribuie la 

sumele din (1.44); se poate calcula acum x 2 , după care se actualizează din nou 

restul necunoscutelor. 

Algoritmul 1.17 (LTRIS – versiunea pe coloane) (Se dau 

L ∈ R n×n , inferior triunghiulară, inversabilă, şi b ∈ R n . Se calculează 

soluţia x a sistemului Lx = b.) 

1. x ← b 


1. x j ← x j / l jj 

2. Pentru i = j + 1 : n 

1. x i ← x i − l ij x j 

Comentarii. Se observă că bucla Pentru interioară se poate înlocui cu un apel la 

Saxpy(−x(j), L(j + 1 : n, :), x(j + 1 : n)). 

♦ 

Datorită erorilor numerice, execuţia algoritmului LTRIS nu produce x = L −1 b, 

ci o soluţie aproximativă ˆx. Se poate demonstra că acest ˆx satisface 

(L + F)ˆx = b, cu |f ij | ≤ nε M |l ij | + O(ε 2 M), (1.45) 

adică ˆx este soluţia unui sistem cu matricea coeficienţilor uşor perturbată faţă 

de L. Aşadar algoritmul LTRIS este numeric stabil. (Acesta este un rezultat tipic 

de analiză inversă a erorilor.) Practica numerică arată o acurateţe a algoritmului 

LTRIS mult superioară celei indicate de (1.45). 

Pentru a rezolva sistemul superior triunghiular (nesingular) Ux = b, unde 

U ∈ R n×n este o matrice superior triunghiulară, cu u ii ≠ 0, i ∈ 1 : n, şi b ∈ R n , să 

observăm că ultima ecuaţie are forma u nn x n = b n , iar de aici 

x n = b n /u nn . (1.46)


Mai mult, dacă x n , x n−1 , . . . , x i+1 , sunt deja calculate, atunci, din a i-a ecuaţie, 

se obţine 

u ii x i + 

⎛ 

x i = ⎝b i − 

n∑ 

j=i+1 

n∑ 

j=i+1 

u ij x j = b i , 

u ij x j 

⎞ 

⎠/u ii . (1.47) 

Din formulele (1.46) şi (1.47), care definesc aşa numita substituţie înapoi, obţinem 

direct algoritmul următor. 

Algoritmul 1.18 (UTRIS – Calculul soluţiei unui sistem superior 

triunghiular) (Se dau U ∈ R n×n , superior triunghiulară, inversabilă, şi 

b ∈ R n . Se calculează soluţia x a sistemului Ux = b.) 

1. x ← b 

2. Pentru i = n : −1 : 1 

1. Pentru j = i + 1 : n 

1. x i ← x i − u ij x j 

2. x i ← x i /u ii 

Perfect analog cu algoritmul 1.17 avem versiunea pe coloane a UTRIS. 

Algoritmul 1.19 (UTRIS – versiunea pe coloane) (Se dau 

U ∈ R n×n , superior triunghiulară, inversabilă, şi b ∈ R n . Se calculează 

soluţia x a sistemului Ux = b.) 

1. x ← b 

2. Pentru j = n : −1 : 1 

1. x j ← x j /u jj 

1. Pentru i = 1 : j − 1 

1. x i ← x i − u ij x j 

Comentarii. Ca şi în cazul inferior triunghiular, efortul de calcul este N UTRIS = n 2 

flopi, iar memoria ocupată M UTRIS ≈ n 2 /2 locaţii în virgulă mobilă. Vom apela 

acest algoritm prin x = UTRIS(L, b). Şi pentru algoritmul UTRIS este valabilă 

o relaţie de genul (1.45), i.e. algoritmul de mai sus este numeric stabil. Rezolvarea 

sistemelor triunghiulare este o operaţie de nivel 2. 

♦ 

AA. Sisteme triunghiulare cu parte dreaptă multiplă. Se spune despre 

un sistem de forma AX = B, cu A ∈ R n×n , B ∈ R n×p (rezultând X ∈ R n×p ), cu 

p > 1, că este un sistem cu parte dreaptă multiplă. Desigur, a rezolva AX = B este 

matematic echivalent cu a calcula X = A −1 B. Partiţionând X şi B pe coloane, 

rezolvarea sistemului AX = B se poate reduce rezolvarea a p sisteme de forma 

(1.41), Ax j = b j , j ∈ 1 : p. 

Considerăm A inferior triunghiulară. Prezentăm o variantă bloc de rezolvare a 

sistemului AX = B, adecvată calculatoarelor cu memorie ierarhică. Partiţionăm 

sistemul astfel


⎡ 

⎢ 

⎣ 

⎤⎡ 

A 11 0 . . . 0 

A 21 A 22 . . . 0 

. 

. 

. .. 

⎥⎢ 

0 ⎦⎣ 

A m1 A m2 . . . A mm 

⎤ ⎡ 

X 1 

X 2 

⎥ 

. ⎦ = ⎢ 

⎣ 

X m 

⎤ 

B 1 

B 2 

⎥ 

. ⎦ , (1.48) 

B m 

în care A ij ∈ R r×r , iar B i , X i ∈ R r×p . Evident, blocurile diagonale A ii sunt inferior 

triunghiulare. Se presupune că r divide n şi fie m = n/r. 

Sistemul (1.48) se rezolvă în mod analog cu sistemul inferior triunghiular cu o 

singură parte dreaptă, tratat mai sus. Bloc linia i a sistemului (1.48) conduce la o 

relaţie asemănătoare cu (1.44): 

i∑ 

∑i−1 

A ij X j = B i =⇒ A ii X i = B i − A ij X j , (1.49) 

j=1 

din care se poate deduce un algoritm similar cu LTRIS (prin substituţie înainte). 

Pe un calculator cu memorie ierarhică (figura 0.4c), A, B şi X sunt stocate în 

memoria principală MP. Alegem r astfel încât blocurile A ij , X j şi B i să poată fi 

stocate simultan în memoria rapidă MR (deci r 2 + 2rp < dim(MR)). Algoritmul 

următor se bazează pe ideea aducerii acestor blocuri în MR şi apoi a efectuării 

calculelor din (1.49). 

Algoritmul 1.20 (Se dau A ∈ R n×n , inferior triunghiulară, inversabilă, 

şi B ∈ R n×p . Se rezolvă sistemul AX = B. Se utilizează 

variabilele C, D, Z în MR.) 


1. D ← B i 

2. Pentru j = 1 : i − 1 

1. C ← A ij , Z ← X j 

2. D ← D − CZ 

3. C ← A ii 

4. rezolvă sistemul triunghiular cu p.d.m. CZ = D 

(aplicând de p ori algoritmul LTRIS pentru 

Cz j = d j , j ∈ 1 : p) 

5. X i ← Z 

Comentarii. Toate operaţiile aritmetice, în număr de pn 2 (de p ori mai multe 

decât pentru algoritmul LTRIS aplicat unui sistem Ax j = b j ), se efectuează cu 

operanzi din MR. Instrucţiunile 1.1, 1.2.1, 1.3, 1.5 reprezintă transferuri între MP 

şi MR; numărul acestor transferuri este de 

⎛ 

⎞ 

m∑ ∑i−1 

⎝ (r 2 + rp) + r 2 + rp⎠ ≈ pn2 

2r + n2 

2 , 

i=1 

j=1 

sensibil mai mic decât în cazul în care operanzii s-ar fi aflat în MP (atunci ar fi fost 

aproximativ 2pn 2 accesuri la MP). 

j=1


Rezolvarea sistemelor triunghiulare cu parte dreaptă multiplă face parte din 

grupul operaţiilor de nivel 3. 

♦ 

AA. Inversarea matricelor triunghiulare. Fie L ∈ R n×n o matrice inferior 

triunghiulară; presupunem că L este inversabilă, adică l ii ≠ 0, i ∈ 1 : n. Pentru a 

calcula X = L −1 , utilizăm egalitatea evidentă 

pe care o partiţionăm pe coloane 

LX = I n , 

Lx j = e j , j ∈ 1 : n, (1.50) 

x j = Xe j fiind cea de-a j-a coloană a matricei X. Sistemul inferior triunghiular 

(1.50) poate fi rezolvat în mod eficient prin adaptarea algoritmului LTRIS la forma 

particulară a termenului drept. Într-adevăr, sistemul (1.50) poate fi partiţionat 

astfel: [ 

unde L (j) 

11 

matricei L şi 

L (j) 

11 0 

L (j) 

21 L (j) 

22 

] [ x 

′ 

j 

x ′′ 

j 

] 

= 

[ 0 

e ′′ 

j 

] 

, (1.51) 

este submatricea de dimensiune (j − 1) × (j − 1) din colţul stânga sus al 

Din (1.51) rezultă { 

e ′′ 

j = [1 0 . . .0]T ∈ R n−j+1 . 

L (j) 

11 x′ j = 0, 

L (j) 

21 x′ j + L(j) 22 x′′ j = e′′ j . (1.52) 

Deoarece L este inversabilă şi, prin urmare, la fel sunt L (j) 

11 

şi L(j) 22 , relaţia (1.52) 

devine { 

x 

′ 

j = 0, 

L (j) 

22 x′′ j = e′′ j . (1.53) 

Această relaţie stabileşte un fapt important, dat de 

Propoziţia 1.5 Inversa unei matrice inferior triunghiulare nesingulare este inferior 

triunghiulară. 

În concluzie, matricele inferior triunghiulare inversabile formează grup în raport 

cu înmulţirea matriceală. 

Din (1.53) poate fi dedus un algoritm de calcul al inversei unei matrice nesingulare, 

având la bază următoarea schemă de calcul: 

L −1 


1. Dacă j > 1 atunci x ′ j = 0 

2. x ′′ 

j = LTRIS(L(j) 22 , e′′ j ) 

Se poate observa că inversa calculată poate fi memorată în aceeaşi zonă de 

memorie ca matricea L. Explicitând rezolvarea sistemului inferior triunghiular, 

obţinem


Algoritmul 1.21 (LINV – Calculul inversei unei matrice inferior 

triunghiulare) (Se dă L ∈ R n×n , inferior triunghiulară şi inversabilă. Se 

calculează pe loc în L inversa acesteia.) 


1. l jj ← x jj = 1 / l jj 

2. Pentru i = j + 1 : 

( 

n 

∑i−1 

) 

1. l ij ← x ij = − 

k=j l ikx kj / l ii 

Comentarii. 

Numărul de operaţii necesar este 

n−1 

∑ 

N LINV = n + 

n∑ 

j=1 i=j+1 

2(i − j) ≈ n3 

3 . 

Memoria necesară este M LINV ≈ n 2 /2 locaţii în virgulă mobilă. Se vede acum că 

rezolvarea sistemului liniar Lx = b folosind relaţia x = L −1 b (adică LINV) este 

ineficientă în comparaţie cu algoritmul direct LTRIS. 

♦ 

Pentru a calcula inversa unei matrice superior triunghiulare nesingulare 

U ∈ R n×n , trebuie rezolvată ecuaţia matriceală UX = I n , sau, echivalent, cele 

n ecuaţii liniare 

Ux j = e j , j = 1 : n, (1.54) 

unde x j este coloana j a matricei X = U −1 . 

Utilizând partiţia 

[ ] [ 

U (j) 

11 U (j) 

12 x 

′ 

j 

0 U (j) x ′′ 

22 j 

] [ e 

′ 

= j 

0 

] 

, (1.55) 

unde U (j) 

11 este submatricea de dimensiune j × j din colţul stânga sus a lui U şi 

e ′ j = [0 0 . . .0 1]T ∈ R j , şi urmând o cale asemănătoare celei parcurse pentru inversarea 

matricelor inferior triunghiulare, se obţin analoagele relaţiei (1.53), propoziţiei 

1.5 şi algoritmului LINV. Avem: 

{ 

U (j) 

11 x′ j = e′ j , 

x ′′ 

j = 0. (1.56) 

Propoziţia 1.6 Inversa unei matrice superior triunghiulare nesingulare este superior 

triunghiulară. 

Aşadar matricele superior triunghiulare inversabile formează grup în raport cu 

înmulţirea. 

Dacă sistemele (1.56) sunt rezolvate în ordine inversă (pentru j = n, n−1, . . ., 1), 

se poate vedea cu uşurinţă că elementele matricei inverse se pot memora peste cele 

ale matricei originale, pe măsură ce sunt calculate. Vom obţine deci următorul 

algoritm.

1.10. VALORI ŞI VECTORI PROPRII 59 

Algoritmul 1.22 (UINV – Calculul inversei unei matrice superior 

triunghiulare) (Se dă U ∈ R n×n , superior triunghiulară şi inversabilă. 

Se calculează pe loc în U inversa acesteia.) 

1. Pentru j = n : −1 : 1 

1. u jj ← x jj = 1/u jj 

2. Pentru i = j − 1 : −1 ( : 1 

∑j 

) 

1. u ij ← x ij = − 

k=i+1 u ikx kj /u ii 

Comentarii. Ca în cazul inferior triunghiular, N UINV ≈ n 3 /3 şi M UINV ≈ n 2 /2. 

Algoritmii de inversare a matricelor triunghiulare sunt numeric stabili. ♦ 

1.10 Valori şi vectori proprii 

Fie A ∈ C n×n . Numărul λ ∈ C se numeşte valoare proprie a matricei A dacă există 

un vector v ∈ C n , v ≠ 0, astfel încât 

Av = λv. (1.57) 

În acest caz, v se numeşte vector propriu al matricei A, asociat lui λ. 

Se observă că dacă v este vector propriu al matricei A, atunci şi u = αv este 

vector propriu al lui A, corespunzând aceleiaşi valori proprii, oricare α ∈ C, α ≠ 0. 

Aşadar, vectorii proprii sunt determinaţi numai ca direcţie, nu şi ca mărime. 

Teorema 1.4 Fie A ∈ C n×n . Scalarul λ ∈ C este valoare proprie a matricei A 

dacă şi numai dacă matricea λI − A este singulară. Mai mult, matricea A are 

exact n valori proprii (numărând separat valorile proprii multiple), care coincid cu 

zerourile polinomului caracteristic 

p(λ) = det(λI n − A). (1.58) 

Dacă A ∈ R n×n , valorile proprii apar în perechi complex conjugate (iar vectorii 

proprii asociaţi acestor perechi pot fi aleşi complex conjugaţi). 

Demonstraţie. Dacă λ este valoare proprie a matricei A, atunci există un vector 

v ≠ 0 astfel încât Av = λv, deci (λI n − A)v = 0 şi în consecinţă λI n − A este 

singulară. Reciproc, dacă pentru un λ ∈ C matricea λI n − A este singulară, atunci 

există v ∈ C n , v ≠ 0, astfel încât (λI n − A)v = 0, adică Av = λv şi deci λ este 

valoare proprie a matricei A. 

Deoarece λI n −A este singulară dacă şi numai dacă λ satisface det(λI −A) = 0, 

iar p(λ) = det(λI −A) este un polinom monic de grad n, din teorema fundamentală 

a algebrei rezultă că (1.58) are n zerouri care coincid cu valorile proprii ale matricei 

A. Dacă A este reală, polinomul caracteristic p(λ) are coeficienţi reali şi atunci 

zerourile sale complexe apar în perechi complex conjugate (pentru vectori proprii, 

vezi problema 1.28). 

♦ 

Ca o consecinţă directă a faptului că valorile proprii sunt rădăcinile ecuaţiei 

det(λI n − A) = 0, să observăm că dacă A este diagonală sau triunghiulară, atunci 

valorile sale proprii sunt chiar elementele diagonale.


Notăm prin 

λ(A) = {λ 1 , λ 2 , . . .,λ n } = {λ ∈ C | det(λI − A) = 0} (1.59) 

mulţimea valorilor proprii ale matricei A ∈ C n×n (cu repetarea valorilor proprii 

multiple). Mulţimea λ(A) se numeşte spectrul matricei A. 

Transformări de asemănare. Suntem interesaţi de transformările care conservă 

spectrul unei matrice date; se observă că valorile proprii nu sunt conservate 

în urma premultiplicării sau postmultiplicării cu o altă matrice. 

Două matrice A, B ∈ C n×n sunt numite asemenea dacă există o matrice nesingulară 

T ∈ C n×n astfel încât 

B = TAT −1 . (1.60) 

T se numeşte transformare de asemănare. Dacă T este unitară (ortogonală, în cazul 

real), atunci A şi B sunt ortogonal asemenea. 

Teorema 1.5 Două matrice asemenea A, B ∈ C n×n au acelaşi spectru, adică 

λ(A) = λ(B). Mai mult, dacă T este matricea de transformare din (1.60) şi dacă 

v A este vector propriu al matricei A corespunzător valorii proprii λ ∈ λ(A), atunci 

vectorul 

v B = Tv A (1.61) 

este vector propriu al matricei B, corespunzător aceleiaşi valori proprii. 

Demonstraţie. Dacă A şi B satisfac (1.60), atunci 

det(λI − B) = det(λI − TAT −1 ) = det(T(λI − A)T −1 ) = 

= det(T)det(λI − A)det(T −1 ) = det(λI − A), 

deci λ(A) = λ(B). Dacă v A este vector propriu al matricei A corespunzător valorii 

proprii λ, atunci Av A = λv A , sau TAT −1 Tv A = λTv A , de unde Bv B = λv B şi deci 

(1.61) este adevărată. ♦ 

Matrice simple. O matrice A ∈ C n×n care are un set complet de n vectori 

proprii liniar independenţi se numeşte simplă. Acesta este cazul generic şi totodată 

cel în care proprietăţile spectrale ale matricelor sunt mai ”vizibile”. Se poate 

demonstra că dacă matricea A are n valori proprii distincte, atunci ea este simplă. 

Teorema 1.6 Fie A ∈ C n×n o matrice simplă şi V ∈ C n×n matricea ale cărei 

coloane sunt vectorii proprii ai lui A. Atunci 

este o matrice diagonală. 

V −1 AV = Λ ∈ C n×n (1.62) 

Demonstraţie. V = [v 1 v 2 . . . v n ] şi Av j = λ j v j , j ∈ 1 : n, unde λ j sunt valorile 

proprii ale lui A. Atunci 

AV = [Av 1 Av 2 . . . Av n ] = [λ 1 v 1 λ 2 v 2 . . . λ n v n ] =

1.10. VALORI ŞI VECTORI PROPRII 61 

= [v 1 v 2 . . . v n ] diag(λ 1 , λ 2 , . . .,λ n ) = V Λ. 

Deoarece vectorii v j , j ∈ 1 : n, sunt liniar independenţi, matricea V este nesingulară 

şi (1.62) este adevărată. 

♦ 

Aşadar o matrice simplă poate fi diagonalizată peste C printr-o transformare de 

asemănare. Nu aceasta este şi abordarea numerică a problemei, care va fi discutată 

pe larg în capitolul 4. 

Subspaţii invariante. Fie A ∈ C n×n şi un subspaţiu S ⊂ C n ; spunem că S 

este A-invariant dacă Av ∈ S, ∀v ∈ S. (Definiţia este identică pentru A ∈ R n×n , 

S ⊂ R n .) 

Se observă uşor că dacă S are o bază formată din vectori proprii ai matricei A, 

atunci S este A-invariant. Reciproca acestei afirmaţii nu este, în general, adevărată. 

AA. Calculul vectorilor proprii ai matricelor triunghiulare. Fie 

U ∈ R n×n o matrice superior triunghiulară. Aşa cum am observat mai sus, valorile 

sale proprii sunt λ i = u ii , i ∈ 1 : n. Dorim acum să calculăm vectorii proprii. 

1. Considerăm întâi cazul în care valorile proprii sunt distincte două câte două. 

Fie T = λ j I −U; vectorul propriu v j va fi calculat rezolvând sistemul liniar Tv j = 0, 

care poate fi partiţionat 

⎡ 

⎣ T ⎤⎡ 

11 y T 13 v ′ ⎤ ⎧ 

0 w T 

j ⎨ T 11 v j ′ + v jjy + T 13 v j ′′ = 0 

⎦⎣ 

v jj 

⎦ = 0 ⇔ w T v 

T 33 v j 

′′ 

j ′′ 

⎩ 

= 0 

, (1.63) 

T 33 v j ′′ = 0 

unde v j ′ ∈ Rj−1 , v j ′′ ∈ Rn−j . Valorile proprii fiind distincte, T 11 şi T 33 sunt nesingulare. 

Din (1.63), T 33 v j ′′ = 0, şi deci v′′ j = 0. Ecuaţia wT v j ′′ = 0 este întotdeauna 

satisfăcută iar v jj poate avea o valoare nenulă oarecare, să zicem v jj = 1. În fine, 

sistemul superior triunghiular T 11 v j ′ = −y are soluţie unică, care se poate calcula 

cu algoritmul UTRIS. 

Vectorii proprii astfel calculaţi sunt liniar independenţi, deoarece matricea 

V = [v 1 v 2 . . . v n ] este superior triunghiulară unitate; rezultatul e natural, deoarece 

U este simplă. Direcţiile vectorilor proprii sunt unic definite, mărimile lor fiind alese 

arbitrar prin constrângerea v jj = 1. 

2. Dacă există valori proprii multiple, atunci T va avea mai multe valori diagonale 

nule. Putem alege în continuare, în (1.63), v j ′′ = 0, v jj = 1. Acum însă, 

T 11 poate fi singulară, deci se pune problema dacă sistemul superior triunghiular 

T 11 v j ′ = −y are soluţie. Procedând prin substituţie înapoi, presupunem că v jj = 1, 

v j−1,j , ..., v i+1,j au fost calculate şi scriem ecuaţia i a acestui sistem 

t ii v ij = β ij , 

cu β ij = −t ij − 

∑j−1 

k=i+1 

t ik v kj . (1.64) 

Dacă t ii ≠ 0, evident că în (1.64) v ij = β ij / t ii şi substituţia poate continua. Dacă 

t ii = 0, sunt două variante: fie β ij = 0, şi atunci v ij din (1.64) poate avea o valoare 

arbitrară, de exemplu v ij = 1, şi substituţia continuă; fie β ij ≠ 0, şi atunci (1.64) 

nu este satisfăcută, deci sistemul (1.63) nu are soluţie v j ; în acest caz, matricea U 

este defectivă, adică nu are n vectori proprii liniar independenţi.


Consideraţiile de mai sus conduc la următorul algoritm general, în care matricea 

T = λ j − U nu se formează explicit 

Algoritmul 1.23 (TRV – Calculul vectorilor proprii ai unei matrice 

superior triunghiulare) (Se dă U ∈ R n×n , superior triunghiulară. 

Se calculează vectorii proprii ai matricei U în matricea V ; coloanele nule 

din V desemnează cazurile de defectivitate.) 

1. V ← 0 


1. v jj ← 1 

2. Pentru i = j − 1 : −1 : 1 

1. β ← u ij + ∑ j−1 

k=i+1 u ikv kj 

2. Dacă u ii ≠ u jj atunci % t ii ≠ 0 

1. v ij ← β/(u jj − u ii ) 

altfel dacă β = 0 atunci 

2. v ij ← 1 

altfel % β ≠ 0 

3. v kj ← 0, cu k = i + 1 : j 

4. treci la următorul j 

Comentarii. Instrucţiunile 2.2.2.1, 2.2.2.2, 2.2.2.3 implementează cele trei cazuri 

posibile în rezolvarea ecuaţiei (1.64); în 2.2.2.3 se refac zerourile din coloana j 

a matricei V , pentru a se marca necalcularea unui vector propriu. Numărul de 

operaţii este de cel mult n 3 /3 flopi. 

Deoarece calculul valorii β este afectat de erori numerice, decizia β = 0 se 

implementează efectiv printr-un test de genul |β| < cε M , unde c > 1 este o constantă 

mică. În unele programe de calcul, cazurile de defectivitate sunt pur şi simplu 

ocolite; atunci când u ii = u jj , se ia forţat în 2.2.2.1 u jj −u ii = ε M şi se lucrează ca 

şi cum matricea U are avea valori proprii distincte. Se obţin astfel întotdeauna n 

vectori proprii distincţi; în cazurile de defectivitate, vectorii proprii corespunzători 

aceleiaşi valori proprii sunt aproape (cu o aproximaţie de ordinul preciziei de calcul) 

coliniari. 

♦ 

Cazul matricelor inferior triunghiulare se tratează analog şi e lăsat ca exerciţiu. 

1.11 Rutinele BLAS 

Am prezentat în secţiunile anterioare algoritmi simpli adecvaţi calculatoarelor cu 

memorie ierarhică: 1.15 pentru înmulţirea de matrice şi 1.20 pentru rezolvarea 

sistemelor triunghiulare cu parte dreaptă multiplă. Pentru majoritatea problemelor, 

însă, algoritmii sunt complicaţi şi efortul găsirii unei idei de adaptare poate fi considerabil; 

programatorul ar fi obligat să cunoască detalii arhitecturale şi ale sistemului 

de operare pentru calculatorul în cauză. În plus, programul realizat ar funcţiona 

doar pe tipul respectiv de calculator, transferul pe un altul implicând rescrierea 

parţială. 

Pentru a uşura sarcina programatorului şi pentru a realiza portabilitatea, a 

apărut ideea scrierii unor biblioteci de rutine fundamentale, puţine la număr, dar

1.11. RUTINELE BLAS 63 

S – real simplă precizie 

D – real dublă precizie 

C – complex simplă precizie 

Z – complex dublă precizie 

GE - generală GB - generală bandă 

SY - simetrică SB - simetrică bandă SP - simetrică împachetat 

HE - hermitică HB - hermitică bandă HP - hermitică împachetat 

TR - triunghiulară TB - triungh. bandă TP - triungh. împachetat 

Tabelul 1.1: Convenţii de nume în BLAS: tipuri de date şi structuri de matrice 

implementate foarte eficient pe majoritatea calculatoarelor (de către programatori 

profesionişti). Atunci, un program obişnuit va folosi cât mai mult aceste rutine, şi 

cât mai puţin alt gen de operaţii; eficienţa este asigurată, datorită adecvării rutinelor 

de bază la arhitectură, iar efortul de programare este redus, datorită numărului 

redus al rutinelor. 

Astfel s-au născut (începând din 1973, până în 1989) bibliotecile BLAS (Basic 

Linear Algebra Subroutines – rutine de bază în algebra liniară), care s-au impus ca 

un standard unanim acceptat şi sunt implementate pe marea majoritate a calculatoarelor 

de performanţă. Există trei nivele BLAS, în fapt trei biblioteci distincte 

al căror conţinut tratează operaţii asemănătoare din punct de vedere al datelor 

implicate: 

• nivel 1: dedicat operaţiilor vectoriale, de genul Saxpy sau DOT, care necesită 

O(n) flopi. BLAS-1 este adecvat calculatoarelor vectoriale. 

• nivel 2: dedicat operaţiilor matrice-vector, de tipul Gaxpy sau rezolvare de 

sisteme triunghiulare, care necesită O(n 2 ) flops. Şi BLAS-2 are aplicabilitate 

în special pe calculatoare vectoriale. 

• nivel 3: operaţii matrice-matrice, ca înmulţirea de matrice sau rezolvarea de 

sisteme triunghiulare cu parte dreaptă multiplă, care necesită O(n 3 ) flops. 

BLAS-3 este eficient îndeosebi pe calculatoare cu memorie ierarhică. 

Prezentăm în continuare câteva din rutinele BLAS, insistând asupra nivelului 3, 

deoarece calculatoarele cu memorie ierarhică sunt tot mai răspândite. 

Convenţii de nume. Scrise iniţial în FORTRAN, numele rutinelor sunt foarte 

scurte (cel mult şase caractere) şi de aceea greu de înţeles fără explicaţii asupra 

convenţiilor utilizate pentru stabilirea lor. În tabelul 1.1, prima literă a numelui 

unei rutine indică tipul datelor, iar următoarele două (numai pentru nivelele 2 şi 

3), structura matricelor argumente ale funcţiei. 

În fine, ultimele trei (uneori două) litere — tot pentru nivelele 2 şi 3 — codifică 

operaţia executată, după cum se va vedea imediat. 

BLAS 1. Prezentăm în tabelul 1.2 cele mai importante rutine ale nivelului 1 al 

BLAS, fără a preciza argumentele lor, ci numai operaţia realizată; ca şi până acum, 

x, y sunt vectori în R n sau C n , iar α scalar. Prima literă a numelui, care arată tipul 

datelor, este precizată în ultima coloană.


Nume Operaţie Prefixe 

xSWAP x ↔ y S, D, C, Z 

xSCAL x ← αx S, D, C, Z 

xCOPY x ← y S, D, C, Z 

xAXPY y ← αx + y S, D, C, Z 

xDOT dot ← x T y S, D 

xDOTU dot ← x T y C, Z 

xDOTC dot ← x H y C, Z 

xNRM2 nrm2 ← ‖x‖ 2 S, D, C, Z 

Tabelul 1.2: Rutine din BLAS 1 

Deoarece argumentele funcţiilor sunt asemănătoare, exemplificăm cu un apel 

tipic: 

SAXPY(N, ALFA, X, INCX, Y, INCY) 

INCX reprezintă distanţa, în memorie, între două elemente succesive ale vectorului 

al cărui prim element se găseşte la adresaX. Argumentul INCX permite utilizarea 

ca vectori, în SAXPY, atât a coloanelor cât şi a liniilor unei matrice. Să presupunem 

că o matrice A este memorată într-un tablou m × n, în ordinea coloanelor (adică 

a 11 , a 21 , . . ., a m1 , a 12 , . . . ). Atunci coloana j este reprezentată astfel: X este adresa 

elementului a 1j (adică A + mjd, unde d este numărul de octeţi necesari memorării 

unui element), iar INCX = 1. Pentru a reprezenta linia i a matricei A, luămXadresa 

elementului a i1 (adică A + id), iar INCX = m. 

BLAS 2. Nivelul 2 al BLAS conţine rutine pentru trei operaţii: produsul 

matrice-vector, rezolvarea sistemelor triunghiulare şi produsul exterior, în diverse 

variante pe care le enumerăm în continuare. 

Rutinele care execută înmulţire matrice-vector de forma y ← αAx + βy au 

numele de tipul xyyMV, în care primele trei litere sunt cele din tabelul 1.1 (toate 

combinaţiile permise). 

Rezolvarea sistemelor (inferior sau superior) triunghiulare este efectuată de rutinele 

xyySV, unde yy este TR, TB sau TP. 

Pentru produsul exterior, rutina de bază este xGER, care execută operaţia 

A ← αxy T + A, unde A este o matrice. 

Nu dăm un exemplu de apel, deoarece descrierea matricelor se face ca la rutinele 

de nivel 3, explicate mai jos, iar cea a vectorilor ca în rutinele de nivel 1. 

BLAS 3. Vom prezenta acum cele 6 rutine alese a face parte din setul BLAS 

nivel 3 în []. Ele sunt puţine la număr, deoarece munca de creare a unei rutine 

optime este dificilă; chiar dacă rutinele rezolvă probleme relativ simple, arhitectura 

complicată implică folosirea aproape exclusivă a limbajului de asamblare; pe un 

calculator CRAY, s-a ajuns chiar la 100 000 linii de program pentru o, în aparenţă 

banală, înmulţire de matrice. 

Operaţiile implementate de rutinele BLAS nivel 3 sunt esenţialmente în număr 

de două: înmulţirea de matrice, în câteva variante, şi rezolvarea de sisteme triunghiulare 

cu parte dreaptă multiplă. Numele rutinelor sunt deja intrate în uzul curent şi

1.11. RUTINELE BLAS 65 

✛ 

K 

✲ 

✻ 

✻ 

LDA 

M 

❄ 

❄ 

Fig. 1.12: Memorarea (pe coloane a) unei matrice într-un tablou 

respectă regulile din tabelul 1.1; pentru a nu încărca expunerea, nu vom prezenta 

modul efectiv de apel decât pentru prima rutină prezentată. 

În cele ce urmează, A, B, C sînt matrice oarecare, cu dimensiuni oarecare, 

dar adecvate operaţiilor, sau simetrice şi pătrate, T este o matrice triunghiulară, 

superior sau inferior, iar α şi β sînt scalari. 

1. xGEMM (GEneral Matrix Multiplication) – înmulţirea matrice-matrice, în cazul 

general. Modul complet de apel este: 

xGEMM(TRANSA, TRANSB, M, N, K, ALFA, A, LDA, B, LDB, BETA, C, LDC) 

Operaţiile efectuate de rutină sînt prezentate în tabelul următor; C este întotdeuna 

de dimensiune m × n. 

TRANSA = ’N’ TRANSA = ’T’ 

TRANSB = ’N’ C ←− αAB + βC C ←− αA T B + βC 

A este m × k, B este k × n A este k × m, B este k × n 

TRANSB = ’T’ C ←− αAB T + βC C ←− αA T B T + βC 

A este m × k, B este n × k A este k × m, B este n × k 

Argumentele rutinei devin acum mai clare: TRANSA şi TRANSB arată dacă matricele 

A, B se transpun sau nu; M, N, K sunt dimensiunile efective ale matricelor; 

LDA, LDB, LDC conţin dimensiunea principală a variabilelor în care sunt stocate 

matricele, presupuse memorate pe coloane. Semnificaţia acestor variabile dimensionale 

este mai clară în figura 1.12. Elementele de pe aceeaşi linie se află la distanţă 

LDA în memorie. Se mai poate observa că patru variabile (analog cu A, M, K, LDA) 

sunt suficiente pentru utilizarea oricărei submatrice a matricei din figură. 

Rutina acoperă toate variantele de înmulţire a două matrice, operaţia de bază 

fiind C ← αAB + βC; transpunerea nu este lăsată utilizatorului, deoarece poate 

fi mare consumatoare de timp dacă se execută explicit (în xGEMM nu se întâmplă 

aşa); la fel, înmulţirea matrice-scalar. Cum toate celelalte rutine BLAS nivel 3 au 

argumente de apelare asemănătoare, vom prezenta în continuare doar operaţia de 

bază implementată. 

2. xSYMM (SYmetric Matrix Multiplication) – înmulţire matrice-matrice, cu una 

din matrice simetrică:


C ← αAB + βC. (1.65) 

3. xSYRK (SYmmetric Rank-K update) – actualizare de rang k a unei matrice 

simetrice; A are dimensiune n × k. 

C ← αAA T + βC. (1.66) 

De obicei, k < n; de aici numele rutinei, AA T având rang ≤ k. 

4. xSYR2K – actualizare de rang 2k a unei matrice simetrice: 

C ← αAB T + αBA T + βC. (1.67) 

5. xTRMM (TRiangular Matrix Multiplication) – înmulţire matrice-matrice, cu 

una dintre matrice triunghiulară: 

B ← αTB. (1.68) 

Evident, există şi varianta în care T este la dreapta; de asemenea, T poate fi inferior 

sau superior triunghiulară. 

6. xTRSM (TRiangular system Solver, with Multiple right hand term) – calculează 

soluţia unui sistem liniar triunghiular, cu parte dreaptă multiplă (TX = B): 

X ← αT −1 B. (1.69) 

Şi pentru această rutină există versiuni în care necunoscuta este în stânga (de genul 

XT = B); T este fie superior, fie inferior triunghiulară. 

Ca pentru orice standard, alegerea setului de mai sus poate părea mai mult sau 

mai puţin arbitrară; principala justificare a alegerii este numărul mare de algoritmi 

din algebra liniară care folosesc rutine din setul propus. 

Vom prezenta în cursul acestei lucrări şi algoritmi scrişi astfel încât marea majoritate 

a operaţiilor să apară în execuţia unor rutine BLAS de nivel 3. Pentru a 

cuantifica eficienţa lor, introducem ponderea operaţiilor de nivel 3 prin raportul 

P 3 (n) = 

N 3(n) 

N total (n) . (1.70) 

N total (n) reprezintă numărul total de flopi necesari execuţiei algoritmului, iar N 3 (n) 

numărul de flopi executaţi în rutinele din BLAS-3; ele depind (cel puţin) de dimensiunea 

problemei n. 

Pe un calculator cu memorie ierarhică, un algoritm este cu atât mai bun cu cât 

P 3 (n) este mai apropiată de 1; evident, P 3 (n) ≤ 1. Motivul este clar: pe un astfel 

de calculator, operaţiile din rutinele BLAS-3 se execută mai rapid decât celelalte 

deoarece memoria rapidă este utilizată optim.

1.12. PROBLEME 67 

1.12 Probleme 

P 1.1 Demonstraţi că un subspaţiu liniar în R n este un spaţiu vectorial. 

P 1.2 Scrieţi algoritmi pentru calculul normelor 1 şi ∞ ale unui vector x ∈ R n . 

P 1.3 (Cauchy-Buniakowski-Schwarz) Demonstraţi că |x T y| ≤ ‖x‖ 2‖y‖ 2, ∀x, y ∈ R n . 

P 1.4 Găsiţi vectori liniar independenţi x, y ∈ R n care să satisfacă ‖x+y‖ p = ‖x‖ p+‖y‖ p, 

pentru p = 1,2, ∞. 

P 1.5 Demonstraţi (1.6) pentru n = 2, apoi în cazul general. 

P 1.6 (Ortogonalizare Gram-Schmidt) Fie b 1, ..., b p o bază a unui subspaţiu S ⊂ R n . 

Să se găsească o bază ortogonală a 1, ..., a p a lui S procedând prin inducţie: a 1 = b 1 şi 

a k+1 = P k 

i=1 α ika i + b k+1 . (Evident, baza devine ortonormală prin normalizare.) 

P 1.7 Fie x ∈ R m şi y ∈ R n doi vectori, şi A = xy T ∈ R m×n produsul lor exterior. 

Demonstraţi că rangA = 1. 

P 1.8 Fie matricele A ∈ R n 1×n 2 

, B ∈ R n 2×n 3 

, C ∈ R n 3×n 4 

. Sugeraţi un algoritm de 

calcul al produsului ABC. 

P 1.9 Demonstraţi că max i,j |a ij| ≤ ‖A‖ 2 ≤ √ mnmax i,j |a ij|, ∀A ∈ R m×n . 

P 1.10 Demonstraţi (1.29) şi găsiţi matrice pentru care inegalităţile (fie cele de majorare, 

fie cele de minorare) devin egalităţi. 

P 1.11 Fie B o submatrice a matricei A. Arătaţi că ‖B‖ p ≤ ‖A‖ p. 

P 1.12 Demonstraţi că: 1. ‖A‖ 2 = max ‖x‖2 =1,‖y‖ 2 =1 |y T Ax|; 2. ‖A T ‖ 2 = ‖A‖ 2; 

3. ‖A T A‖ 2 = ‖A‖ 2 2. 

P 1.13 Demonstraţi că dacă A ∈ R n×n este inversabilă, atunci pentru orice normă matriceală 

subordonată unei norme vectoriale avem 1 / ‖A −1 ‖ = min ‖x‖=1 ‖Ax‖. 

P 1.14 Fie L ∈ R n×n o matrice strict inferior triunghiulară. Demonstraţi că L n = 0. 

P 1.15 Fie A,B ∈ R n×n două matrice bandă, prima de lăţime p, a doua de lăţime q. 

Demonstraţi că AB este o matrice bandă de lăţime p + q şi scrieţi un algoritm pentru 

calculul acestui produs. 

P 1.16 Scrieţi un algoritm pentru calculul produsului dintre o matrice inferior triunghiulară 

şi una superior triunghiulară. 

P 1.17 Arătaţi că algoritmul 1.14 de înmulţire de matrice inferior triunghiulare se poate 

executa pe loc în A. Cum trebuie modificat pentru a se putea executa pe loc în B 

P 1.18 Arătaţi că submatricele lider principale ale unor matrice triunghiulare, Hessenberg, 

simetrice sunt triunghiulare, Hessenberg, respectiv simetrice. Este afirmaţia valabilă 

pentru matrice ortogonale 

P 1.19 Presupunem că dispuneţi de un algoritm general de rezolvare a sistemelor liniare. 

Indicaţi un mod eficient de rezolvare a sistemului Ax = b atunci când A, partiţionată ca 

în (1.31), este pătrată şi bloc superior triunghiulară. 

P 1.20 Demonstraţi că numărul de operaţii N(n) al algoritmului Strassen, respectând 

recurenţa (1.38), este 

N(n) = 2n3 0 + 6n 2 0 

n log 7 − 6n 2 0. 

n log 7 

0


P 1.21 Dacă A ∈ R n×n este simetrică pozitiv definită, demonstraţi că ‖x‖ A = √ x T Ax 

este o normă vectorială. (Indicaţie: matricele simetrice sunt ortogonal diagonalizabile.) 

P 1.22 Fie A ∈ R n×n , simetrică pozitiv definită. Demonstraţi că A este inversabilă şi că 

A −1 este pozitiv definită. 

P 1.23 a. Este clar că o matrice triunghulară şi simetrică este diagonală. Cum este o 

matrice triunghiulară şi antisimetrică 

b. Demonstraţi că o matrice triunghiulară şi ortogonală este diagonală. 

c. Puteţi extinde rezultatul în cazul matricelor triunghiulare şi normale 

P 1.24 Scrieţi algoritmi eficienţi pentru rezolvarea sistemului Ax = b, cu A ∈ R n×n şi 

b ∈ R n , în cazurile: 

a. A inferior bidiagonală, adică a ij = 0 pentru i < j sau i > j + 1. 

b. A inferior triunghiulară şi bandă de lăţime p (a ij = 0 pentru i < j sau i > j + p). 

c. A superior bidiagonală. 

d. A superior triunghiulară şi bandă de lăţime p. 

P 1.25 Adaptaţi algoritmii LINV şi UINV pentru inversarea matricelor inferior, respectiv 

superior bidiagonale. 

P 1.26 Propuneţi algoritmi de rezolvare a sistemelor inferior (superior) triunghiulare, 

folosind operaţiile vectoriale DOT sau Saxpy. 

P 1.27 Prezentaţi un algoritm de rezolvare a sistemului inferior triunghiular Lx = b, 

ştiind că matricea L este memorată compact, pe linii (i.e. sunt memorate doar elementele 

din triunghiul inferior, în ordinea l 11, l 21, l 22, l 31 etc. Dar dacă L este memorată pe 

coloane 

P 1.28 Fie A ∈ R n×n şi x = u + iv ∈ C n un vector propriu al său, cu u, v ∈ R n , v ≠ 0. 

Demonstraţi că: 

a. u − iv este vector propriu al matricei A. 

b. Vectorii u şi v sunt liniar independenţi iar subspaţiul generat de ei în R n este 

A-invariant. 

P 1.29 Dacă matricea A ∈ R n×n are spectrul λ(A) = {λ 1, . . . , λ n}, atunci 

tr(A) = P n 

i=1 λi, iar detA = Q n 

i=1 

λi. Puteţi generaliza 

P 1.30 Fie A ∈ R n×n , simetrică pozitiv definită. Demonstraţi că toate valorile proprii 

ale matricei A sunt (reale şi) pozitive.

Capitolul 2 

Rezolvarea sistemelor de 

ecuaţii liniare 

În acest capitol vom prezenta principalele metode de rezolvare a sistemelor determinate 

de ecuaţii liniare 

Ax = b, (2.1) 

unde A ∈ R n×n este o matrice inversabilă, iar b ∈ R n este un vector dat. Aşa cum 

am văzut în secţiunea 1.9, în virtutea condiţiei de inversabilitate, sistemul (2.1) are 

o soluţie unică x ∈ R n . 

În practica numerică actuală se folosesc două categorii principale de metode 

numerice sigure pentru determinarea acestei soluţii: 

• Metode directe, bazate pe reducerea sistemului (2.1), printr-o secvenţă finită 

de transformări elementare, la unul sau două sisteme triunghiulare, care se 

rezolvă utilizând procedurile de substituţie cunoscute din secţiunea 1.9 (algoritmii 

LTRIS şi UTRIS). Din această categorie fac parte metodele de 

eliminare gaussiană şi de factorizare compactă LU, care sunt recomandate 

pentru sisteme de dimensiuni medii, să zicem n < 500, dar această limită 

depinde de puterea calculatorului pe care rezolvăm sistemul. 

• Metode iterative, bazate pe construirea recursivă a unui şir de vectori care 

converge către soluţia sistemului (2.1). Aceste metode sunt recomandate pentru 

sisteme de dimensiuni foarte mari, sau/şi atunci când matricea A are o 

structură specială, eventual rară. 

Acest capitol este dedicat prezentării celor mai importante metode directe de 

rezolvare a sistemelor liniare. 

Deoarece în reducerea sistemului (2.1) la formă triunghiulară transformările 

matricei A sunt primordiale, în primele patru secţiuni ale capitolului vom trata 

aceste transformări ca subiect de sine stătător. Algoritmii descrişi vor fi utilizaţi 

în secţiunea 2.5 pentru rezolvarea efectivă a unui sistem (2.1), de formă generală. 

Ca probleme conexe, în secţiunea 2.6 vor fi prezentaţi algoritmi de calcul al inversei 

şi determinantului unei matrice. Următoarele două secţiuni sunt dedicate

70 CAPITOLUL 2. REZOLVAREA SISTEMELOR DE ECUAŢII LINIARE 

analizei condiţionării unui sistem liniar şi respectiv stabilităţii numerice a algoritmilor 

prezentaţi. De asemenea, sunt descrise unele metode de îmbunătăţire a 

acurateţii soluţiei numerice obţinute. În fine, ultimele secţiuni ale capitolului se 

ocupă de cazuri particulare de sisteme liniare cu structură — bandă, bloc, simetrice 

şi pozitiv definite — care apar frecvent în practică. 

2.1 Transformări elementare 

Transformările matricei A necesare pentru rezolvarea sistemului (2.1) se pot descrie 

concis şi elegant în termeni de operaţii matriceale, mai precis ca produs între A 

şi anumite matrice elementare. (În loc de produs sau înmulţire, vom vorbi despre 

aplicarea asupra lui A a matricei de transformare corespunzătoare.) 

Definiţia 2.1 O matrice inferior triunghiulară elementară (ITE) de ordin n şi indice 

k este o matrice de forma 

M k = I n − m k e T k , (2.2) 

unde 

m k = [0 0 . . . 0 µ k+1,k . . . µ nk ] T (2.3) 

este un vector având primele k componente nule, iar e k este vectorul unitate de 

indice k. 

Din motive ce vor fi evidente ulterior, M k se mai numeşte transformare elementară 

sau gaussiană, m k se numeşte vector Gauss, iar scalarii µ ik se numesc 

multiplicatori (gaussieni). 

Structura unei matrice elementare inferior triunghiulare de ordinul n şi indice k 

este 

⎡ 

⎤ 

1 0 . . . 0 . . . 0 

0 1 . . . 0 . . . 0 

. .. . . . 

M k = 

0 0 . . . 1 . . . 0 

. 

0 0 . . . −µ k+1,k . . . 0 

⎢ 

⎣ 

. ⎥ 

. . . . . . .. 0 ⎦ 

0 0 . . . −µ nk . . . 1 

Notăm de acum faptul că o matrice ITE este complet definită de vectorul m k 

din (2.3); în orice algoritm, matricea M k nu se memorează integral, ci doar prin 

vectorul m k , i.e. prin multiplicatorii µ ik , i = k + 1 : n. Principalele proprietăţi ale 

unei astfel de matrice sunt rezumate în următoarea propoziţie. 

Propoziţia 2.1 a) O matrice ITE este inversabilă şi 

M −1 

k 

= I n + m k e T k . (2.4)

2.1. 

TRANSFORMĂRI ELEMENTARE 71 

b) Fie x ∈ R n un vector dat, iar M k o matrice ITE precizată. Atunci vectorul 

transformat y = M k x are elementele 

{ 

xi , pentru i = 1 : k, 

(M k x) i = 

(2.5) 

x i − µ ik x k , pentru i = k + 1 : n. 

c) Fie x ∈ R n . Dacă x k ≠ 0, atunci există o matrice ITE M k astfel încât 

vectorul transformat y = M k x are ultimele n − k componente nule, mai precis 

{ 

xi , pentru i = 1 : k, 

(M k x) i = 

(2.6) 

0, pentru i = k + 1 : n. 

Dacă x k = 0, atunci pentru orice M k 

M k x = x. (2.7) 

Demonstraţie. 

a) Evident, det(M k ) = 1, adică M k este inversabilă. Mai mult, 

M k (I n + m k e T k ) = (I n − m k e T k )(I n + m k e T k ) = I n − m k (e T k m k)e T k = I n 

deoarece, din (2.3), e T k m k = 0. Deci (2.4) este adevărată. 

b) Utilizând (2.2), obţinem 

M k x = (I n − m k e T k )x = x − m k e T k x = x i − x k m k . 

Scriind relaţia de mai sus pe componente şi ţinând seama de (2.3), obţinem (2.5). 

c) Ţinând seama de (2.5) şi alegând 

µ ik = x i /x k , i = k + 1 : n, (2.8) 

rezultă (M k x) i = 0, pentru i = k + 1 : n. Dacă x k = 0, atunci (2.5) conduce direct 

la (2.7). De observat că, dacă x k ≠ 0, atunci matricea ITE definită de vectorul 

Gauss cu elementele din (2.8) este unica matrice ITE de indice k care introduce 

zerouri în ultimele n − k componente ale vectorului x. 

♦ 

După cum vom vedea în secţiunea următoare, proprietăţile (2.6) şi (2.7) sunt 

cruciale în reducerea unei matrice la formă triunghiulară. 

Similar se introduce noţiunea de matrice superior triunghiulară elementară (STE) 

sau transformare elementară ”retrogradă”, în care vectorul m k are ultimele k componente 

nule. Propunem cititorului formularea şi demonstrarea analoagei propoziţiei 

2.1. 

Vom introduce acum noţiunea de matrice de permutare, care permite descrierea 

concisă a interschimbărilor de linii sau coloane în termeni de operaţii matriceale. 

Definiţia 2.2 O matrice P ij ∈ R n×n obţinută din matricea unitate I n prin interschimbarea 

a două coloane (sau linii) i şi j, adică o matrice de forma (aici i < j): 

⎡ 

⎤ 

I i−1 0 1 

P ij = [e 1 e 2 . . . e i−1 e j e i+1 . . . e j−1 e i e j+1 . . . e n ] = 

⎢ I j−i−1 

⎥ 

⎣ 1 0 ⎦ 

I n−j


în care toate elementele nefigurate sunt nule, se numeşte (matrice de) permutare 

elementară (PE). 

Dacă (i 1 , i 2 , . . . , i n ) este o permutare a mulţimii 1 : n, atunci matricea 

P = [e i1 e i2 . . . e in ] este o matrice de permutare. Desigur, un produs de matrice 

elementare de permutare este o matrice de permutare şi, reciproc, orice matrice de 

permutare se poate exprima ca produs de matrice PE. 

Proprietăţile matricelor elementare de permutare sunt expuse în următoarea 

propoziţie, a cărei demonstraţie e evidentă. 

Propoziţia 2.2 a) O PE este ortogonală şi simetrică, deci Pij 

−1 = P ij , iar 

detP ij = −1. 

b) Premultiplicarea unei matrice A cu PE P ij interschimbă linia i cu linia j din 

A, adică: 

⎧ 

⎨e T 

e T k A, pentru k ≠ i, j, 

k (P ij A) = e T j A, pentru k = i, 

⎩ 

A, pentru k = j. 

e T i 

c) Postmultiplicarea unei matrice A cu PE P ij interschimbă coloana i cu coloana 

j din A, adică: 

{ Aek , pentru k ≠ i, j, 

(AP ij )e k = Ae j , pentru k = i, 

Ae i , pentru k = j. 

2.2 Triangularizare prin eliminare gaussiană 

Fie A ∈ R n×n (cazul A ∈ C n×n este identic) o matrice nu neapărat inversabilă. 

Eliminarea gaussiană este o metodă de reducere a matricei A la formă superior 

triunghiulară prin aplicarea la stânga lui A a unei secvenţe M k , k = 1 : n − 1, 

de matrice ITE, fiecare aleasă astfel încât să anuleze elementele subdiagonale în 

coloana corespunzătoare a k a matricei A. 

Pentru prezentarea metodei avem nevoie de două rezultate cu caracter tehnic, 

a căror demonstraţie e lăsată cititorului. 

Propoziţia 2.3 Fie A ∈ R n×n . a) Dacă L ∈ R n×n este inferior triunghiulară, 

atunci 1 (LA) [k] = L [k] A [k] . 

b) Dacă L i ∈ R n×n , i = 1 : p, sunt matrice inferior triunghiulare, atunci 

(L 1 L 2 . . .L p A) [k] = L [k] 

1 L[k] 2 . . .L[k] p A[k] . 

Următoarea teoremă stabileşte condiţiile în care este posibilă reducerea unei 

matrice la formă triunghiulară, utilizând transformări ITE. 

1 Reamintim că A [k] def 

= A(1 : k,1 : k) este submatricea lider principală de ordin k a matricei A.

2.2. TRIANGULARIZARE PRIN ELIMINARE GAUSSIANĂ 73 

Teorema 2.1 Dacă matricea A ∈ R n×n satisface condiţia 

(i) submatricele lider principale A [k] , k = 1 : n − 1, sunt nesingulare, 

atunci există o matrice inferior triunghiulară unitate M astfel încât matricea 

MA = U 

este superior triunghiulară. Dacă A este nesingulară, atunci U este nesingulară. 

Demonstraţia este constructivă, adică descrie o procedură pentru reducerea efectivă 

a matricei A la forma superior triunghiulară U. Procedura constă în n − 1 paşi. 

Pasul 1. Fie A 1 = A şi a 1 = Ae 1 prima sa coloană. Prin ipoteză, A [1] 

1 = A[1] = 

= a 11 ≠ 0. Din propoziţia 2.1, există o matrice ITE M 1 astfel încât 

{ 

a11 , pentru i = 1, 

(M 1 a 1 ) i = 

0, pentru i = 2 : n, 

adică matricea A 2 = M 1 A 1 are toate elementele subdiagonale ale primei coloane 

egale cu zero: 

⎡ 

a (2) 

11 a (2) 

12 . . . a (2) ⎤ 

1n 

A 2 = 

⎢ 

⎣ 

0 a (2) 

22 . . . a (2) 

2n 

0 a (2) 

32 . . . a (2) 

3n 

. . . . . . . . . . . . 

0 a (2) 

n2 . . . a (2) 

nn 

Pasul k. Presupunem că matricea curentă 

A k = M k−1 . . . M 2 M 1 A 

este superior triunghiulară în primele k − 1 coloane, i.e. are toate elementele subdiagonale 

ale acestor coloane egale cu zero. Aplicând propoziţia 2.3, obţinem 

A [k] 

k 

= M[k] k−1 . . .M[k] 1 A[k] , 

unde matricele M [k] 

i sunt toate inferior triunghiulare unitate, deci det(M [k] 

i ) = 1, 

i = 1 : k − 1. Deoarece A [k] 

k 

este superior triunghiulară, în virtutea condiţiei (i) din 

enunţul teoremei avem 

. 

⎥ 

⎦ 

k 

det(A [k] 

k ) = ∏ 

a (k) 

ii = det(A [k] ) ≠ 0, 

i=1 

adică elementul a (k) 

kk 

, numit pivot, este nenul. Considerăm partiţionarea pe coloane 

a matricei A k : 

A k = [ a (k) 

1 a (k) 

2 . . . a (k) 

k 

. . . a (k) 

n ]. 

Putem utiliza acum propoziţia 2.1 pentru a conchide că există o matrice ITE M k 

astfel încât (M k a (k) 

k ) i = 0, pentru i = k + 1 : n. Mai mult, premultiplicarea cu 

M k a matricei A k nu alterează primele k − 1 coloane şi în particular zerourile deja


introduse la paşii anteriori, deoarece a (k) 

kj 

= 0, pentru j = 1 : k − 1 (vezi propoziţia 

2.1, punctul c). Prin urmare matricea 

este superior triunghiulară în primele k coloane. 

A k+1 = M k A k (2.9) 

Astfel, procedura de introducere a zerourilor subdiagonale, începută la pasul 1 

şi continuată până la pasul n − 1 (inclusiv), are ca rezultat matricea 

U def 

= A n = M n−1 M n−2 . . .M 1 A, (2.10) 

evident superior triunghiulară. Mai mult, deoarece produsul matriceal conservă 

structura inferior triunghiulară unitate (vezi propoziţia 1.2), matricea 

M = M n−1 M n−2 . . .M 1 

este inferior triunghiulară unitate iar, dacă A este nesingulară, atunci şi U rezultă 

nesingulară, ca produs a două matrice nesingulare. 

♦ 

Demonstraţia de mai sus furnizează o procedură de triangularizare a unei matrice, 

cunoscută sub numele de eliminare gaussiană. Procedura este bazată pe 

următoarea schemă, în care calculele se desfăşoară pe loc în tabloul A 

ElG 1. Pentru k = 1 : n − 1 

1. Se calculează matricea ITE M k (adică multiplicatorii µ ik , 

i = k + 1 : n), astfel încât (M k A) i = 0, pentru i = k + 1 : n 

2. Se calculează A ← M k A 

La pasul 1.1, multiplicatorii gaussieni µ ik sunt calculaţi conform (2.8) prin 

µ ik = a (k) 

ik /a(k) kk 

, i = k + 1 : n, (2.11) 

şi pot fi memoraţi pe poziţiile elementelor anulate. Prin instrucţiunea 1.2 a schemei 

de mai sus, toate rezultatele intermediare sunt depuse în spaţiul de memorie ocupat 

de matricea A; vezi şi figura 2.1. 

La pasul 1.2, transformarea A ← M k A este echivalentă cu calculul a j ← M k a j , 

pentru toate coloanele a j = Ae j ale matricei A. Transformarea poate fi efectuată 

eficient ţinând cont că primele k−1 coloane ale matricei A nu sunt afectate. Coloana 

k este modificată prin anularea elementelor subdiagonale. Pentru restul submatricei, 

ţinând seama de propoziţia 2.1b, coloana transformată are elementele 

a ij ← (M k a j ) i = ((I n − m k e T k )a j) i = a ij − µ ik a kj , i = k + 1 : n, (2.12) 

unde j = k + 1 : n. Relaţiile (2.11) şi (2.12) împreună cu schema de calcul ElG 

definesc algoritmul de eliminare gaussiană detaliat în continuare. Condiţia de terminare 

corectă a algoritmului este ca numerele a (k) 

kk 

, k = 1 : n − 1, numite elemente 

pivot, să fie nenule, adică submatricele lider principale A [k] , k = 1 : n − 1, ale 

matricei iniţiale, să fie nesingulare.

2.2. TRIANGULARIZARE PRIN ELIMINARE GAUSSIANĂ 75 

⎡ 

⎢ 

⎣ 

u 11 u 12 . . . u 1k u 1,k+1 . . . u 1n 

µ 21 u 22 . . . u 2k u 2,k+1 . . . u 2n 

. . . . . . 

µ k1 µ k2 . . . u kk u k,k+1 . . . u kn 

µ k+1,1 µ k+1,2 . . . µ k+1,k a (k+1) 

k+1,k+1 . . . a(k+1) k+1,n 

. . . . . . 

µ n1 µ n2 . . . µ nk a (k+1) 

n,k+1 

După pasul k 

. . . a (k+1) 

nn 

⎤ 

⎥ 

⎦ 

⎡ 

⎤ 

u 11 u 12 . . . u 1k . . . u 1n 

µ 21 u 22 . . . u 2k . . . u 2n 

. . . . . . 

µ k1 µ k2 . . . u kk . . . u kn 

⎢ . . . . . . 

⎥ 

⎣ . . . . . . ⎦ 

µ n1 µ n2 . . . µ nk . . . u nn 

În final 

Fig. 2.1: Conţinutul matricei A după pasul k al eliminării gaussiene şi la terminarea 

execuţiei algoritmului 

Algoritmul 2.1 (G – Eliminare gaussiană) (Se dă A ∈ R n×n , cu 

submatricele lider principale A [k] , k = 1 : n − 1, nesingulare. Se calculează 

matricea superior triunghiulară U şi matricele ITE M 1 , . . ., 

M n−1 , astfel încât U = M n−1 M n−2 . . .M 1 A. Matricea U se memorează 

în triunghiul superior al lui A, inclusiv diagonala, iar multiplicatorii 

gaussieni µ ik care definesc transformările M k se memorează în triunghiul 

inferior al matricei A, pe poziţiile elementelor anulate.) 

1. Pentru k = 1 : n − 1 

1. Pentru i = k + 1 : n 

1. a ik ← µ ik = a ik /a kk 

2. Pentru j = k + 1 : n 

1. Pentru i = k + 1 : n 

1. a ij ← a ij − µ ik a kj 

O formă vectorială a eliminării gaussiene se poate deduce imediat din cea de 

mai sus, prin înlocuirea buclelor 1.1 şi 1.2.1 cu operaţiile corespunzătoare: scalare, 

respectiv Saxpy (aceasta din urmă putând fi dedusă din (2.12), care se mai scrie 

M k a j = a j − a kj m k ). Avem 

Algoritmul 2.2 (G – varianta vectorială) 

1. Pentru k = 1 : n − 1 

1. A(k + 1 : n, k) ← m k = A(k + 1 : n, k)/A(k, k) 

2. Pentru j = k + 1 : n 

1. A(k + 1 : n, j) ← A(k + 1 : n, j) − A(k, j)m k 

Comentarii. 

În oricare dintre cele două forme de mai sus, algoritmul necesită 

n−1 

∑ 

N G = (n − k + 2(n − k) 2 ) = 

k=1 

n(n − 1) 

2 

n(n − 1)(2n − 1) 

+ 2 ≈ 2n3 

6 3 ,


operaţii în virgulă mobilă (flopi), iar memoria ocupată este de M G = n 2 locaţii 

(elemente în virgulă mobilă). 

♦ 

Algoritmul G poate fi utilizat pentru rezolvarea sistemului liniar Ax = b atunci 

când A are toate submatricele lider principale nesingulare (inclusiv A [n] = A). 

Într-adevăr, sistemul Ax = b are aceeaşi soluţie ca sistemul superior triunghiular 

Ux = M n−1 M n−2 . . . M 1 b, 

în care matricea U este furnizată de algoritmul G. Acest sistem triunghiular poate 

fi rezolvat cu algoritmul UTRIS. 

Semnificaţia operaţiilor din algoritmul G este imediată; introducerea de zerouri 

subdiagonale în coloana k înseamnă eliminarea necunoscutei x k din ecuaţiile 

k+1 : n; buclele 1.2 şi 1.2.1 reprezintă scăderea din ecuaţiile i = k+1 : n a ecuaţiei 

k înmulţite, pe rând, cu multiplicatorii µ ik , cu scopul de a elimina x k din fiecare 

ecuaţie i. 

Totuşi, nesingularitatea submatricelor lider principale ale matricei A nu este o 

condiţie necesară pentru existenţa şi unicitatea soluţiei sistemului (2.2). De aceea, 

algoritmul G trebuie modificat astfel încât să producă rezultatul dorit şi atunci 

când unele submatrice lider principale sunt singulare, dar A este nesingulară. 

2.3 Strategii de pivotare 

Dacă o submatrice lider principală A [k] este singulară, atunci, la pasul k al procedurii 

de eliminare gaussiană, pivotul a (k) 

kk 

este nul; deci, conform propoziţiei 2.1c, nu există 

nici o matrice ITE M k care să anuleze, prin premultiplicare, elementele subdiagonale 

ale coloanei k din A k . Modificarea algoritmului G recomandată pentru a evita 

această dificultate constă într-o interschimbare de linii (sau/şi coloane), care aduce 

în poziţia pivotului un element nenul. Un alt motiv pentru permutarea de linii şi 

coloane este asigurarea stabilităţii numerice a procesului de calcul. O explicaţie 

intuitivă este că, atunci când un proces matematic nu poate fi definit pentru o 

anumită valoare ”critică” a unui parametru (de exemplu A [k] singulară), există 

şanse mari ca procesul numeric corespunzător să fie instabil atunci când parametrul 

efectiv este în vecinătatea valorii critice. În cazul nostru, trebuie evitaţi pivoţii 

mici (în modul), corespunzători cazului în care submatricele lider principale sunt 

”aproape” singulare; astfel se îmbunătăţeşte stabilitatea numerică a algoritmului. 

2.3.1 Pivotare parţială 

Vom modifica algoritmul G după cum urmează. La pasul k al procedurii de triangularizare 

a matricei A ∈ R n×n (vezi demonstraţia teoremei 2.1), se alege ca pivot 

primul element maxim în modul din coloana k. Presupunând că acest element 

se găseşte în linia i k şi este nenul, i.e. a (k) 

i k k ≠ 0, interschimbarea liniilor k şi i k, 

obţinută matriceal prin înmulţirea la stânga a lui A k cu PE P kik , va muta a (k) 

i k k în 

poziţia (k, k), astfel încât acest element devine noul pivot. Pentru a evita alterarea 

structurii matricei obţinute până la pasul k (superior triunghiulară în primele k −1 

coloane), trebuie să alegem i k ≥ k. Vezi figura 2.2.

2.3. STRATEGII DE PIVOTARE 77 

⎡ 

⎤ 

u 11 . . . u 1k . . . u 1n 

0 . . . . . . 

a (k) 

kk 

A k = 

. . . a(k) kn 

0 . . . 

a (k) 

⎢ i k k . . . a(k) i k n 

⎥ 

⎣ 0 . . . ⎦ 

a (k) 

nk . . . a(k) nn 

⎡ 

⎤ 

u 11 . . . u 1k . . . u 1n 

0 . . . . . . 

a (k) 

i 

P kik A k = 

k k . . . a(k) i k n 

0 . . . 

a (k) 

⎢ kk 

. . . a(k) 

kn ⎥ 

⎣ 0 . . . ⎦ 

a (k) 

nk . . . a(k) nn 

Fig. 2.2: Pasul k al eliminării gaussiene cu interschimbare de linii; a (k) 

kk 

este nul 

sau prea aproape de zero; în P kik A k , noul pivot este a (k) 

i k k şi are o valoare ”bună” 

(suficient de mare, în modul) 

Pentru simplitate, vom nota matricea P ik k cu P k . Pasul k al algoritmului G 

devine 

1. Se determină cel mai mic (primul) i k ≥ k astfel încât |a ik k| = max i=k:n |a ik |. 

2. Se interschimbă liniile i k şi k, adică A ← P k A. 

3. Se determină matricea ITE M k astfel încât (M k A) ik = 0, i = k + 1 : n. 

4. Se aplică transformarea A ← M k A. 

Astfel la pasul k are loc transformarea 

A ← A k+1 = M k P k A k , (2.13) 

unde matricea T k = M k P k se numeşte transformare elementară stabilizată. 

Procesul global, cunoscut sub numele de eliminare gaussiană cu pivotare parţială, 

conduce în cele din urmă la matricea superior triunghiulară 

U def 

= A n = M n−1 P n−1 M n−2 P n−2 . . .M 1 P 1 A. (2.14) 

Această egalitate afirmă că orice matrice A este echivalentă la stânga cu o matrice 

superior triunghiulară, iar matricea de transformare poate fi un produs de 

transformări elementare stabilizate. 

Algoritmul corespunzător este prezentat în continuare. 

Algoritmul 2.3 (GPP – Eliminare gaussiană cu pivotare parţială) 

(Se dă A ∈ R n×n , nesingulară. Se calculează matricea superior triunghiulară 

U, matricele ITE M 1 , . . ., M n−1 şi PE P 1 , . . . , P n−1 astfel 

încât (2.14) să fie satisfăcută. Matricea U se memorează în triunghiul 

superior al lui A, inclusiv diagonala, iar multiplicatorii gaussieni µ ik 

care definesc matricele M k se memorează în triunghiul inferior al lui 

A. Întregii i k care definesc PE P k , sunt memoraţi într-un vector p de 

dimensiune n − 1, cu elementele p(k) = i k , pentru k = 1 : n − 1.)


1. Pentru k = 1 : n − 1 

1. Se determină cel mai mic i k ∈ k : n astfel încât 

|a ik k| = max i=k:n |a ik |. 

2. p(k) ← i k 

3. Pentru j = k : n % interschimbă liniile k şi i k 

1. a kj ↔ a ik j 

4. Pentru i = k + 1 : n 


5. Pentru j = k + 1 : n 

1. Pentru i = k + 1 : n 


Comentarii. Operaţiile suplimentare necesare în algoritmul GPP, faţă de algoritmul 

G, apar numai în căutarea pivotului şi constau în comparaţiile necesare găsirii 

maximului din instrucţiunea 1.1; numărul de comparaţii este 

n−1 

∑ 

(n − k + 1) ≈ n 2 /2 ≪ 2n 3 /3, 

k=1 

deci pivotarea parţială nu este costisitoare (relativ la numărul de operaţii aritmetice). 

Necesarul de memorie este M GPP = n 2 . 

♦ 

Un rezultat important referitor la algoritmul GPP este dat de 

Teorema 2.2 Dacă A ∈ R n×n este nesingulară, atunci algoritmul GPP se va 

executa complet iar matricea superior triunghiulară U rezultată în final, vezi (2.14), 

este nesingulară. 

Demonstraţie. Algoritmul GPP nu se execută complet dacă, la un pas k, elementul 

pivot a ik k = 0. Într-un astfel de caz, deoarece pivotul este maxim în modul 

pe coloană (sub diagonală), toate elementele a ik , i = k : n, sunt nule, deci matricea 

A k este singulară (vezi structura matricei A k , cu A [k] 

k 

superior triunghiulară). 

Matricele ITE şi PE fiind nesingulare, singularitatea matricei 

A k = M k−1 P k−1 . . . M 1 P 1 A 

implică A singulară; contradicţie. Deci, toţi pivoţii a ik k ≠ 0 şi algoritmul se execută 

complet. Nesingularitatea matricei U rezultă din nesingularitatea tuturor matricelor 

din termenul drept din (2.14). 

♦ 

2.3.2 Pivotare completă 

Proprietăţi numerice superioare se pot obţine dacă, la pasul k al eliminării gaussiene, 

pivotul maxim în modul este căutat printre elementele a (k) 

ij , i = k : n, j = k : n, 

adică în întregul colţ dreapta jos al matricei A k . Primul element cu modul maxim

2.3. STRATEGII DE PIVOTARE 79 

⎡ 

⎤ 

u 11 . . . u 1k . . . u 1jk . . . u 1n 

0 . . . . . . . . . 

a (k) 

kk 

A k = 

. . . a(k) kj k 

. . . a (k) 

kn 

0 . . . 

a (k) 

⎢ i k k . . . a(k) i k j k 

. . . a (k) 

i k n 

⎥ 

⎣ 0 . . . ⎦ 

a (k) 

nk . . . a(k) nj k 

. . . a (k) 

nn 

⎡ 

⎤ 

u 11 . . . u 1jk . . . u 1k . . . u 1n 

0 . . . . . . . . . 

a (k) 

i 

P kik A k Q kjk = 

k j k 

. . . a (k) 

i k k . . . a(k) 

i k n 

0 . . . 

a (k) 

⎢ kj k 

. . . a (k) 

kk . . . a(k) kn 

⎥ 

⎣ 0 . . . ⎦ 

a (k) 

nj k 

. . . a (k) 

nk . . . a(k) nn 

Fig. 2.3: Pasul k al eliminării gaussiene, cu interschimbări de linii şi coloane 

(e.g. în ordinea explorării pe coloane), să zicem a ik j k 

, este mutat în poziţia pivot 

(k, k), prin intermediul a două interschimbări, una de linii, cealaltă de coloane, 

exprimate matriceal prin înmulţirea lui A k la stânga, respectiv la dreapta, cu PE 

P kik , respectiv Q kjk ; vezi figura 2.3. 

Notând P kik cu P k şi Q kjk cu Q k , pasul k al algoritmului G devine: 

1. Se determină cei mai mici i k şi j k astfel încât |a ik j k 

| = max i=k:n,j=k:n |a ij |. 

2. Se interschimbă liniile i k şi k, adică A ← P k A. 

3. Se interschimbă coloanele j k şi k, adică A ← AQ k . 

4. Se determină matricea ITE M k astfel încât (M k A) ik = 0, i = k + 1 : n. 

5. Se aplică transformarea A ← M k A. 

Astfel, la pasul k are loc transformarea 

A ← A k+1 = M k P k A k Q k , (2.15) 

iar procesul global de calcul, cunoscut sub numele de eliminare gaussienă cu pivotare 

completă, conduce la matricea superior triunghiulară 

A ← U def 

= M n−1 P n−1 . . .M 1 P 1 AQ 1 . . .Q n−1 . (2.16) 

Algoritmul rezultat este prezentat în continuare. 

Algoritmul 2.4 (GPC – Eliminare gaussiană cu pivotare completă) 

(Se dă A ∈ R n×n , nesingulară. Se calculează matricea superior triunghiulară 

U, matricele ITE M 1 , . . . , M n−1 şi PE P 1 , Q 1 , . . . , P n−1 , 

Q n−1 , astfel încât (2.16) să fie satisfăcută. Matricea U se memorează 

în triunghiul superior al lui A, inclusiv diagonala, iar multiplicatorii 

gaussieni µ ik care definesc matricele M k se memorează în triunghiul inferior 

al matricei A. Întregii i k şi j k , definind PE P k , respectiv Q k , sunt 

memoraţi în vectorii p, respectiv q, de dimensiune n − 1, astfel încât 

p(k) = i k şi q(k) = j k , pentru k = 1 : n − 1.)


1. Pentru k = 1 : n − 1 

1. Se determină i k ∈ k : n şi j k ∈ k : n astfel încât 

|a ik j k 

| = max i=k:n,j=k:n |a ij |. 

2. p(k) ← i k 

3. q(k) ← j k 

4. Pentru j = k : n % interschimbă liniile k şi i k 


5. Pentru i = 1 : n % interschimbă coloanele k şi j k 

1. a ik ↔ a ijk 

6. Pentru i = k + 1 : n 


7. Pentru j = k + 1 : n 

1. Pentru i = k + 1 : n 


Comentarii. Operaţiile suplimentare ce apar în algoritmul GPC, faţă de algoritmul 

G, sunt doar cele necesare căutării pivotului, ca şi la pivotarea parţială; acum 

însă, numărul de comparaţii este 

n−1 

∑ 

(n − k + 1) 2 = 

k=1 

n∑ 

k 2 ≈ n 3 /3; 

spre deosebire de pivotarea parţială, pivotarea completă introduce un număr de 

comparaţii de acelaşi ordin de mărime cu numărul operaţiilor aritmetice; aceasta 

poate conduce la creşterea semnificativă a timpului de execuţie, de aceea pivotarea 

completă trebuie folosită doar atunci când se doreşte o mare siguranţă în calculul 

rezultatului. Vom prezenta ulterior argumentele care conduc la alegerea strategiei 

de pivotare. Necesarul de memorie este şi aici M GPC = n 2 . 

♦ 

Teorema următoare corespunde teoremei 2.2, demonstraţia fiind asemănătoare. 

Teorema 2.3 Dacă A ∈ R n×n este nesingulară, atunci algoritmul GPC se execută 

complet, iar matricea superior triunghiulară rezultată U din (2.16) este nesingulară. 

Observaţia 2.1 Algoritmii GPP şi GPC pot fi modificaţi cu uşurinţă pentru a 

putea triangulariza şi matrice singulare. 

În GPP, după pasul 1.1, trebuie adăugată următoarea condiţie: dacă a ik k = 0, 

adică a ik = 0, i = k : n, atunci pentru acest k, instrucţiunile 1.2 – 1.5 nu trebuie 

executate. În acest caz matricea U = A n poate avea elemente diagonale nule 

În GPC, dacă a ik j k 

= 0, adică a ij = 0, i = k : n, j = k : n, atunci algoritmul 

se termină la pasul k, deoarece matricea U = A k este deja superior triunghiulară, 

mai precis superior trapezoidală, iar rangA = k − 1. Desigur, datorită erorilor de 

rotunjire inerente, găsirea unui pivot nul este un eveniment destul de rar. Deoarece 

este dificil de stabilit, în general, o toleranţă de trunchiere ǫ astfel încât |a ik j k 

| < ǫ 

să fie considerat pivot nul, algoritmul GPC nu se foloseşte pentru determinarea 

rangului unei matrice; proceduri mai sigure sunt oferite de algoritmii de factorizare 

QR cu pivotarea coloanelor şi DVS, vezi capitolele 3 şi 5. 

♦ 

k=2

2.4. 

FACTORIZĂRI LU 81 

2.4 Factorizări LU 

În multe situaţii, este convenabil a exprima o matrice dată ca produs a două matrice 

triunghiulare. Această formă poate fi utilizată pentru a simplifica anumite calcule 

implicând matricea respectivă. 

Definiţia 2.3 Fie A ∈ R n×n . Dacă există o matrice inferior triunghiulară 

L ∈ R n×n şi o matrice superior triunghiulară U ∈ R n×n astfel încât 

A = LU (2.17) 

atunci se spune că A admite o factorizare (sau descompunere) LU. L şi U se numesc 

factori triunghiulari ai matricei A. 

În general, orice exprimare a matricei A ca produs de două matrice triunghiulare 

(cu eventuale permutări) se numeşte factorizare triunghiulară. 

Dacă A ∈ R n×n este o matrice care are o factorizare LU, iar D este o matrice 

diagonală nesingulară, atunci, D −1 fiind de asemenea diagonală, (2.17) poate fi 

scrisă în forma 

A = LU = LDD −1 U = L ′ U ′ , (2.18) 

unde L ′ = LD este inferior triunghiulară şi U ′ = D −1 U este superior triunghiulară. 

Dacă D ≠ I, atunci factorizările (2.17) şi (2.18) diferă şi deci factorizarea LU, dacă 

există, nu este unică. De aceea este util a se introduce definiţia următoare. 

Definiţia 2.4 Fie A ∈ R n×n . Dacă există matricele L ∈ R n×n inferior triunghiulară 

unitate, U ∈ R n×n superior triunghiulară unitate şi D ∈ R n×n diagonală astfel 

încât 

A = LDU, 

atunci expresia de mai sus este numită factorizare LDU a matricei A. 

Arătăm în continuare în ce condiţii o factorizare LDU există şi este unică. 

Teorema 2.4 O matrice A ∈ R n×n are o unică factorizare LDU dacă şi numai 

dacă submatricele lider principale A [k] , k = 1 : n − 1, sunt nesingulare. 

Demonstraţie. Demonstrăm aici doar existenţa factorizării LDU, pentru unicitate 

vezi problema 2.5. 

În condiţiile enunţate, din teorema 2.1, care constituie baza eliminării gaussiene, 

rezultă că există M inferior triunghiulară unitate (deci inversabilă) astfel încât 

MA = U, cu U superior triunghiulară. Cu notaţia L = M −1 , matrice inferior 

triunghiulară unitate, avem A = LU. Notând acum 

D = diag(u 11 , u 22 , . . . , u nn ), 

U ′ = D −1 U, 

atunci A = LDU ′ , cu L, D, U ′ satisfăcând condiţiile descompunerii LDU.


Reciproc, se poate demonstra prin reducere la absurd — vezi problema 2.6 — 

că dacă factorizarea LDU este unică, atunci submatricele A [k] , k = 1 : n − 1, sunt 

nesingulare. 

♦ 

Factorizările LU utilizate în practica numerică curentă asociază matricea diagonală 

D din cu una dintre matricele U, L ale factorizării LDU. Astfel se obţin, 

respectiv: 

• factorizarea Doolittle A = LU, cu L inferior triunghiulară unitate şi U superior 

triunghiulară, 

• factorizarea Crout A = LU, cu L inferior triunghiulară şi U superior triunghiulară 

unitate. 

Din teorema 2.4 rezultă că ambele factorizări, Doolittle şi Crout, există şi sunt 

unice dacă şi numai dacă submatricele lider principale A [k] , k = 1 : n − 1, sunt 

nesingulare. Vom păstra în continuare această ipoteză, specificând cazurile în care 

ea nu este necesară. 

2.4.1 Factorizări LU rezultate din eliminarea gaussiană 

Factorizarea Doolittle este calculată chiar de algoritmul G de triangularizare gaussiană 

! Este una din ”surprizele” plăcute ale calculului numeric. 

Teorema 2.5 Algoritmul G, aplicat matricei A ∈ R n×n , cu detA [k] ≠ 0, 

k = 1 : n − 1, calculează factorizarea Doolittle A = LU, cu L inferior triunghiulară 

unitate şi U superior triunghiulară. Factorii L (mai puţin elementele diagonale) şi 

U sunt memoraţi peste A. 

Demonstraţie. Algoritmul G produce matricele ITE M k , k = 1 : n − 1, astfel 

încât din (2.10) rezultă A = LU, cu L = (M n−1 . . . M 2 M 1 ) −1 şi U memorată peste 

A. Aşadar 

L = M1 −1 M 2 −1 . . . Mn−1 −1 . 

Dar (vezi propoziţia 2.1), M −1 

k 

= I n + m k e T k , deci 

n−1 

L = (I n + m 1 e T 1 )(I n + m 2 e T 2 )...(I n + m n−1 e T n−1 ) = I ∑ 

n + m k e T k + S, 

unde S este o sumă de matrice de forma 

T = . . . m p e T p m qe T q . . . 

cu p < q. Deoarece e T p m q = 0, pentru orice p < q, obţinem T = 0 şi S = 0. Astfel, 

⎡ 

⎤ 

1 0 . . . 0 0 

µ 21 1 . . . 0 0 

n−1 

∑ 

L = I n + m k e T µ 31 µ 32 . . . 0 0 

k = 

. 

k=1 ⎢ . . . .. , 

. . . 

⎥ 

⎣ µ n−1,1 µ n−1,2 . . . 1 0 ⎦ 

µ n1 µ n2 . . . µ n,n−1 1 

k=1

2.4. 


deci matricea L este formată chiar din multiplicatorii gaussieni memoraţi în A, în 

algoritmul G. 

♦ 

Vom studia acum legătura între algoritmul GPP de eliminare gaussiană cu pivotare 

parţială şi factorizările LU. 

Teorema 2.6 Triangularizarea (2.14) (M n−1 P n−1 . . . M 1 P 1 A = U) a matricei 

A ∈ R n×n , obţinută prin algoritmul GPP, este echivalentă cu factorizarea Doolittle 

a matricei A cu liniile permutate, adică 

PA = LU, (2.19) 

unde P = P n−1 . . . P 1 . În partea subdiagonală, coloana k ∈ 1 : n − 1 a matricei 

L este o permutare a vectorului Gauss corespunzător m k ; mai precis, dacă 

h k = P n−1 . . .P k+1 m k , atunci L(k + 1 : n, k) = h k (k + 1 : n). 


Se poate verifica uşor echivalenţa dintre (2.14) şi 

˜M n−1 . . . ˜M 1 PA = U, (2.20) 

unde ˜M n−1 = M n−1 şi, pentru k < n − 1, 

˜M k = P n−1 . . . P k+1 M k P k+1 . . .P n−1 = 

= I − P n−1 . . .P k+1 m k e T k P k+1 . . . P n−1 = 

= I − P n−1 . . .P k+1 m k e T k = I − h ke T k . 

În relaţiile de mai sus am ţinut seama că M k = I − m k e T −1 

k şi Ps 

= P s ; în plus, 

e T k P s = e T k , pentru s > k, deoarece P s este o PE de indici s şi t ≥ s. Deci ˜Mk este o 

matrice ITE definită de vectorul Gauss h k . Deoarece (2.20) şi (2.10) sunt analoage, 

−1 −1 

rezultă, ca în teorema 2.5, că matricea L = ˜M 1 . . . ˜M n−1 este inferior triunghiulară 

unitate cu coloanele egale în partea subdiagonală cu vectorii h k , k ∈ 1 : n − 1. Prin 

urmare relaţia (2.19) este satisfăcută. 

♦ 

Expresia vectorului h k arată cum trebuie modificat algoritmul GPP pentru a 

produce factorizarea LU cu pivotare (2.19); se observă că asupra fiecărui vector 

Gauss m k trebuie aplicate toate permutările ulterioare P s , cu s > k. Pentru a 

implementa aceasta, modificăm instrucţiunea 1.3 a GPP din ”Pentru j = k : n” 

în ”Pentru j = 1 : n”, adică, ceea ce e echivalent cu afirmaţia anterioară, fiecare 

permutare P k se aplică şi tuturor vectorilor Gauss anteriori m j , cu j ∈ 1 : k − 1. 

După execuţia algoritmului GPP astfel modificat, matricele triunghiulare L şi U 

din (2.19) se vor afla în A. 

Cazul eliminării gaussiane cu pivotare completă este acum clar şi vom lăsa detaliile 

ca exerciţiu pentru cititor (problema 2.8). Modificând algoritmul GPC în 

acelaşi mod ca pe GPP, se va obţine pe loc în matricea A o factorizare LU a unei 

matrice obţinute din A prin permutări de linii şi coloane: 

PAQ = LU, (2.21) 

unde P, L şi U au aceeaşi semnificaţie (dar nu aceleaşi elemente) ca în teorema 

2.6, iar Q = Q 1 . . . Q n−1 este construită din matricele de permutare elementară din 

relaţia (2.16).


elemente calculate 

0 

1 

❄ 

a kk . . . a kj . . . 

. 

a ik 

. 

. 

= l kk 

. 

i l ik 

. 

. 

✒ 

elemente calculate 

0 

1 

k 

. . . u kj . . . 

1 

Fig. 2.4: Stadiu intermediar al factorizării Crout. 

2.4.2 Factorizări LU compacte 

Factorizarea Crout poate fi calculată luând în relaţia (2.18) expresia LU ca fiind factorizarea 

Doolittle şi D = diag(u 11 , u 12 , . . .,u nn ). Atunci, L ′ U ′ este descompunerea 

Crout a matricei A. 

Totuşi, există şi alte posibilităţi de a organiza calculele, care de obicei se numesc 

scheme de factorizare compactă. Vom deduce o astfel de factorizare Crout pe baza 

ideii de a utiliza direct identitatea A = LU, calculând succesiv câte o coloană din 

L şi câte o linie din U. Procedura poate fi iniţializată considerând prima coloană a 

identităţii A = LU, i.e. 

Ae 1 = LUe 1 = Le 1 , 

de unde 

respectiv prima linie a aceleiaşi identităţi, 

adică 

l i1 = a i1 , i = 1 : n, (2.22) 

e T 1 A = eT 1 LU = l 11e T 1 U, 

a 1j = l 11 u 1j , j = 2 : n. 

Deoarece l 11 = a 11 = A [1] ≠ 0, din relaţia anterioară rezultă 

u 1j = a 1j / l 11 , j = 2 : n. (2.23) 

Presupunem acum că primele k − 1 coloane din L şi primele k − 1 linii din U 

sunt cunoscute (calculate); vezi figura 2.4. Din identitatea A = LU obţinem 

k−1 

∑ 

a ik = l is u sk + l ik , i = k : n, 

s=1 

în care singura necunoscută este scalarul l ik . Deci, 

k−1 

∑ 

l ik = a ik − l is u sk , i = k : n. (2.24) 

s=1

2.4. 


De asemenea, 

k−1 

∑ 

a kj = l ks u sj + l kk u kj , j = k + 1 : n, 

s=1 

în care acum singura necunoscută este scalarul u kj . Din propoziţia 2.3 rezultă 

A [k] = L [k] U [k] , unde A [k] , deci şi L [k] sunt nesingulare, adică l kk ≠ 0. Aşadar, 

( 

) 

k−1 

∑ 

u kj = a kj − l ks u sj / l kk , j = k + 1 : n. (2.25) 

s=1 

Astfel, procedura iniţiată prin (2.22) şi (2.23) poate fi continuată prin (2.24) şi 

(2.25); dacă submatricele A [k] , k = 1 : n − 1, sunt nesingulare, ceea ce garantează 

că împărţirea din (2.25) poate fi executată, procedura va calcula complet factorii 

L şi U. Observând că (2.22) şi (2.23) sunt cazuri particulare ale (2.24), respectiv 

(2.25), putem include primul pas în bucla generală, rezultând algoritmul următor. 

Algoritmul 2.5 (CROUT – Factorizare Crout) (Se dă A ∈ R n×n , 

cu submatricele lider principale A [k] , k = 1 : n − 1, nesingulare. Se 

calculează factorizarea Crout A = LU, cu L inferior triunghiulară şi U 

superior triunghiulară unitate. Matricele L şi U sunt memorate peste 

elementele corespunzătoare din A, mai puţin elementele diagonale ale 

lui U, egale cu 1.) 

1. Pentru k = 1 : n 

1. Pentru i = k : n 

1. a ik ← l ik = a ik − ∑ k−1 

s=1 l isu sk 

2. Pentru j = k + 1 (: n 

1. a kj ← u kj = a kj − ∑ ) 

k−1 

s=1 l ksu sj / l kk 

Comentarii. Numărul de operaţii în virgulă mobilă este N CROUT ≈ 2n 3 /3 la fel 

ca în algoritmii G, GPP sau GPC, iar memoria ocupată este M CROUT ≈ n 2 . ♦ 

Ca şi algoritmul G de eliminare gaussiană, algoritmul CROUT eşuează pe 

parcurs dacă se obţine un l kk = 0 (ceea ce este echivalent cu A [k] singulară); mai 

mult, valori apropiate de zero ale unui l kk conduc la valori absolute foarte mari ale 

elementelor matricei U calculate în instrucţiunea 1.2.1 precum şi la erori numerice 

inadmisibile în rezultat. 

Pentru a preveni această situaţie se introduce pivotarea parţială (pe linii). Spre 

deosebire de algoritmul G unde, la pasul k, permutarea liniilor se efectua înaintea 

celorlaltor operaţii, aici permutarea poate avea loc doar după calcularea elementelor 

l ik , cu i ∈ k : n, pentru a putea aduce cea mai convenabilă valoare în poziţia (k, k). 

(Să observăm că pivotarea completă este acum imposibilă, deoarece ar implica anticiparea 

calculelor pentru toată matricea.) Aceasta revine la înmulţirea la stânga 

a matricei A cu o PE P kik , cu i k ≥ k, la fiecare pas k şi, global, la o factorizare 

PA = LU, cu P = P n−1 . . . P 1 . Algoritmul corespunzător este următorul. 

Algoritmul 2.6 (CROUTP – Factorizare Crout cu pivotare parţială) 

(Se dă A ∈ R n×n nesingulară. Se calculează factorizarea Crout


PA = LU, cu L inferior triunghiulară, U superior triunghiulară unitate 

şi P = P n−1 . . . P 1 matrice de permutare. Matricele L şi U sunt 

memorate peste elementele corespunzătoare din A, mai puţin elementele 

diagonale ale lui U, egale cu 1. Întregii i k definind PE P k sunt memoraţi 

într-un vector p astfel încât p(k) = i k , k = 1 : n − 1.) 


1. Pentru i = k : n 

1. a ik ← l ik = a ik − ∑ k−1 

s=1 l isu sk 

2. Se determină i k ∈ k : n astfel încât |l ik k| = max i=k:n |l ik | 

3. Pentru j = 1 : n {interschimbă liniile k şi i k } 


4. Pentru j = k + 1 : n 

1. a kj ← u kj = 

( 

a kj − ∑ k−1 

s=1 l ksu sj 

) 

/ l kk 

Comentarii. Desigur, numărul comparaţiilor efectuate în instrucţiunea 1.2 este 

de ordinul O(n 2 ), adică neglijabil faţă de cel al operaţiilor aritmetice. ♦ 

2.4.3 Factorizări LU prin eliminare gaussiană la nivel de bloc 

Vom elabora în continuare un algoritm pentru calculul factorizării Doolittle a unei 

matrice A ∈ R n×n , folosind cât mai mult operaţii din setul BLAS nivel 3, anume 

GEMM şi TRSM. Abordarea problemei se face în mod natural prin partiţionarea matricelor 

în blocuri. Vom prezenta întâi varianta fără pivotare, deci presupunem că 

submatricele A [k] sunt nesingulare, pentru k ∈ 1 : n − 1. 

Partiţionăm matricea A astfel 

A = 

[ ] 

A11 A 12 } r 

A 21 A 22 } n − r 

}{{} }{{} 

r n−r 

, (2.26) 

alegerea lui r urmând a fi precizată ulterior. 

În ideea calculului la nivel de bloc al factorizării LU, să începem prin a determina 

L 11 , L 21 , U 11 , U 12 , astfel încât să fie satisfăcută egalitatea: 

[ ] 

A11 A 12 

= 

A 21 A 22 

[ ] 

L11 0 

· 

L 21 I n−r 

[ 

Ir 0 

0 B 

] 

· 

[ ] 

U11 U 12 

. (2.27) 

0 I n−r 

Din această egalitate, privită pe rând pentru cele patru blocuri componente, se pot 

deduce uşor blocurile dorite din L şi U: 

1. A 11 = L 11 U 11 , deci L 11 şi U 11 provin din factorizarea LU la nivel de element 

a matricei A 11 . 

2. A 21 = L 21 U 11 ⇒ L 21 = A 21 U −1 

11 . Deci, U 11 fiind cunoscut de la pasul 

anterior, L 21 poate fi calculat prin rezolvarea unui sistem superior triunghiular 

cu parte dreaptă multiplă.

2.4. 


3. A 12 = L 11 U 12 ⇒ U 12 = L −1 

11 A 12. Deci, U 12 este soluţia unui sistem inferior 

triunghiular cu parte dreaptă multiplă. 

4. A 22 = L 21 U 12 + B ⇒ B = A 22 − L 21 U 12 ; blocul ”restant” B depinde doar 

de matrice cunoscute sau deja calculate. 

Deci, în ordinea de mai sus, se pot calcula toate necunoscutele din (2.27). 

Procedând mai departe în mod similar cu matricea B, se poate calcula o factorizare 

LU a acesteia, adică 

B = L 22 U 22 . (2.28) 

În acest caz, egalitatea (2.27) devine o factorizare LU a matricei A, cu 

[ ] 

[ ] 

L11 0 

U11 U 

L = ; U = 12 

. (2.29) 

L 21 L 22 0 U 22 

Pe scurt, aplicând în mod repetat paşii 1-4 de mai sus, dimensiunea problemei 

se reduce de la n la n − r, n − 2r etc. La etapa m (unde n = mr), problema constă 

în factorizarea LU a unui bloc r ×r, factorizarea întregii matrice A fiind terminată. 

Algoritmul de factorizare LU va consta deci dintr-o buclă conţinând paşii 1-4. În 

figura 2.5 sunt reprezentate blocurile de interes pe parcursul unei iteraţii. 

Algoritmul 2.7 (Gbl – Eliminare gaussiană la nivel de bloc) (Se 

dau A ∈ R n×n , cu A [k] , k = 1 : n − 1, nesingulare, şi r ∈ N astfel încât 

n = mr. Se calculează factorizarea Doolittle A = LU, prin operaţii la 

nivel de bloc.) 


1. s ← (k − 1)r + 1 

2. f ← kr 

3. Se calculează factorizarea LU 

A(s : f, s : f) = L(s : f, s : f) · U(s : f, s : f) 

4. Se rezolvă sistemul superior triunghiular 

Z · U(s : f, s : f) = A(f + 1 : n, s : f) 

5. L(f + 1 : n, s : f) ← Z 

6. Se rezolvă sistemul inferior triunghiular 

L(s : f, s : f) · Z = A(s : f, f + 1 : n) 

7. U(s : f, f + 1 : n) ← Z 

8. A(f + 1 : n, f + 1 : n) ← A(f + 1 : n, f + 1 : n)− 

−L(f + 1 : n, s : f)U(s : f, f + 1 : n) 

Comentarii. Se observă că doar în instrucţiunea 1.3, factorizarea LU a blocului 

A(s : f, s : f), de dimensiune r × r, trebuie explicitată cu operaţii la nivel de 

element; în rest, în instrucţiunile 1.4 şi 1.6 se foloseşte TRSM, iar în 1.8 GEMM. Din 

totalul de 2n 3 /3 flopi ai algoritmului 2.7 (la fel ca pentru algoritmul G), doar 

2mr 3 /3 = 2nr 2 /3 apar în factorizările LU ”mici” din instrucţiunea 1.3. În acest 

caz, ponderea operaţiilor de nivel 3 este 

P3 LU (n, r) = 2n3 /3 − 2nr 2 /3 

2n 3 /3 

= 1 − r2 

n 2 . (2.30)


deja factorizat 

s f n 

s 

f 

❇ 

❇❇ 

❇◆ 

❄ 

L 

U 

✛ 

✻ 

✛ 

curent 

n 

curent 

❍❨ 

❍ 

❍ 

❍ 

de factorizat 

Fig. 2.5: Structura blocurilor într-un pas al factorizării Doolittle la nivel de bloc 

Cum, în general, se alege r ≪ n (şi deci, cu atât mai mult, r 2 ≪ n 2 ), ponderea 

operaţiilor de nivel 3 este apropiată de 1, deci putem estima o bună comportare 

a algoritmului pe un calculator cu memorie ierarhică. Totuşi, alegerea dimensiunii 

blocurilor r se face în urma unui compromis: pe de o parte, din (2.30) e de dorit 

ca r să fie cât mai mic, pe de alta, pentru ca rutinele din BLAS-3 să fie eficiente 

trebuie ca r să fie suficient de mare; valoarea ideală se determină fie din estimări 

teoretice, fie, mai ales, prin încercări experimentale. 

♦ 

Introducerea pivotării se face relativ simplu, ţinându-se seama că în (2.27) apare 

în plus o matrice de permutare P 1 : 

[ ] 

A11 A 

P 1 · 12 

= 

A 21 A 22 

[ ] 

L11 0 

· 

L 21 I n−r 

[ 

Ir 0 

0 B 

] [ ] 

U11 U 

· 12 

. (2.31) 

0 I n−r 

Reducerea calculului factorizării LU a matricei A la un calcul analog pentru 

matricea de dimensiuni mai mici B se face în felul următor: 

1. Se calculează, de exemplu prin eliminare gaussiană, factorizarea LU (rezultată 

din (2.31), pentru cele două blocuri din stânga): 

[ ] [ ] 

A11 L11 

P 1 · = · U 

A 21 L 11 . (2.32) 

21 

(Se aplică algoritmul GPP, chiar dacă matricea în cauză este n × r; căutarea 

pivotului se face pe toată porţiunea subdiagonală a unei coloane. Vezi problema 

2.9.) 

2. Se aplică permutarea restului matricei A (cele două blocuri din dreapta), 

obţinându-se [ ] [ ] 

Ã12 A12 

= P 1 · . 

Ã 22 A 22

2.4. 


3. Din Ã12 = L 11 U 12 se poate calcula U 12 = L −1 

11 Ã12, prin rezolvarea unui sistem 

inferior triunghiular cu parte dreaptă multiplă (se apelează TRSM). 

4. Mai rămâne B = Ã22 − L 21 U 12 , termenii din dreapta fiind toţi deja calculaţi; 

deci B se poate obţine în urma unui apel la GEMM. 

Lăsăm cititorului detalierea ideii algoritmice de mai sus, ca şi calculul ponderii 

operaţiilor de nivel 3; deşi acum vor fi mai multe operaţii la nivel de element faţă de 

cazul factorizării fără pivotare, totuşi numărul lor rămâne suficient de mic pentru 

a putea aprecia algoritmul ca eficient. 

2.4.4 Factorizări LU compacte la nivel de bloc 

Vom prezenta în continuare o variantă la nivel de bloc a metodei Crout pentru 

factorizarea LU; ne vom ocupa doar de cazul în care nu se efectuează pivotare. 

Raţionamentul este absolut identic cu cel la nivel de element. La nivel de bloc, 

egalitatea A = LU se poate scrie 

⎡ 

⎤ ⎡ 

⎤ ⎡ 

⎤ 

A 11 A 12 . . . A 1m L 11 0 . . . 0 U 11 U 12 . . . U 1m 

A 21 A 22 . . . A 2m 

⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ = L 21 L 22 . . . 0 

⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ · 

0 U 22 . . . U 2m 

⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ , 

A m1 A m2 . . . A mm L m1 L m2 . . . L mm 0 0 . . . U mm 

(2.33) 

ceea ce, pentru blocul cu indici i, j, revine la A ij = ∑ min(i,j) 

t=1 

L it U tj . 

Detaliind această relaţie, distingem următoarele cazuri: 

( 

) 

k∑ 

k−1 

∑ 

i = j = k ⇒ A kk = L kt U tk ⇒ L kk U kk = A kk − L kt U tk . (2.34) 

i > j = k ⇒ A ik = 

k = i < j ⇒ A kj = 

t=1 

t=1 

t=1 

t=1 

( 

) 

k∑ 

k−1 

∑ 

L it U tk ⇒ L ik = A ik − L it U tk U −1 

kk ; (2.35) 

k∑ 

t=1 

L kt U tj ⇒ U kj = L −1 

kk 

( 

) 

k−1 

∑ 

A kj − L kt U tj . (2.36) 

Ordinea în care se aplică formulele de mai sus este aceeaşi ca în algoritmul la 

nivel de element: se calculează întâi prima bloc coloană din L şi prima bloc linie din 

U; diferenţa este că acum trebuie calculate două blocuri diagonale, L 11 şi U 11 (în 

algoritmul la nivel de element, u 11 = 1); aceasta se face printr-o factorizare Crout 

LU; se continuă apoi cu a doua bloc coloană din L şi a doua bloc linie din U etc. 

Procesul de calcul va decurge conform următoarei scheme: 


1. Se calculează L kk şi U kk factorizând LU termenul drept din (2.34) 

2. Pentru i = k + 1 : m 

1. Se calculează L ik ca în (2.35) 

3. Pentru j = k + 1 : m 

1. Se calculează U kj ca în (2.36) 

t=1


Pentru a detalia algoritmul şi a-l scrie în mod cât mai eficient prin apeluri la 

rutine BLAS-3, să observăm că sumele din relaţiile (2.34–2.36) se pot scrie compact; 

exemplificăm doar pentru una dintre sume, cea din (2.35), notând s = (k − 1)r + 1, 

f = kr, s i = (i − 1)r + 1, f i = ir: 

k−1 

∑ 

L it U tk ≡ L(s i : f i , 1 : s − 1) · U(1 : s − 1, s : f). 

t=1 

Mai mult, putem scrie compact toate relaţiile de tip (2.35), pentru un k fixat, dar 

cu i = k + 1 : m. Mai exact, bucla 1.2 din schema de mai sus se transformă într-o 

singură atribuire (profitând de faptul că U −1 

kk 

nu depinde de i), anume: 

L(f +1 : n, s : f) ← [A(f +1 : n, s : f) − L(f +1 : n, 1 : s−1) · U(1 : s−1, s : f)] · 

·U(s : f, s : f) −1 

În fine, combinând forma de mai sus cu termenul drept din (2.34), obţinem instrucţiunea 

1.3 din algoritmul detaliat în continuare (calculele se pot efectua pe loc în 

matricea A, dar, pentru claritate, nu procedăm astfel). 

Algoritmul 2.8 (CROUTbl – Factorizare Crout la nivel de bloc) 

(Se dau A ∈ R n×n şi r ∈ N astfel încât n = mr. Se calculează factorizarea 

A = LU, utilizând operaţii la nivel de bloc.) 


1. s ← (k − 1)r + 1 

2. f ← kr 

3. A(s : n, s : f) ← A(s : n, s : f) − L(s : n, 1 : s−1)·U(1 : s−1, s : f) 

4. Se calculează factorizarea LU Crout 

A(s : f, s : f) = L(s : f, s : f) · U(s : f, s : f) 

5. Se rezolvă sistemul superior triunghiular 

Z · U(s : f, s : f) = A(f + 1 : n, s : f) 

6. L(f + 1 : n, s : f) ← Z (o bloc coloană din L) 

7. A(s : f, f + 1 : n) ← A(s : f, f + 1 : n)− 

−L(s : f, 1 : s − 1) · U(1 : s − 1, f + 1 : n) 

8. Se rezolvă sistemul inferior triunghiular 

L(s : f, s : f) · Z = A(s : f, f + 1 : n) 

9. U(s : f, f + 1 : n) ← Z (o bloc linie din U) 

Comentarii. Desigur, înmulţirile matriceale din instrucţiunile 1.3 şi 1.7 se vor 

executa prin apeluri la GEMM, iar rezolvările de sisteme triunghiulare din 1.5 şi 1.8, 

prin apeluri laTRSM. Ponderea operaţiilor de nivel 3 este aceeaşi ca pentru algoritmul 

2.7, diferenţa fiind că aici se execută mai multe apeluri la GEMM, ceea ce ar putea 

mări timpul de execuţie, dar probabil numai într-o măsură nesemnificativă. 

Algoritmul de mai sus poate calcula şi o factorizare LU Doolittle dacă în instrucţiunea 

1.4 se utilizează algoritmul G în loc de CROUT. 

♦

2.5. REZOLVAREA SISTEMELOR LINIARE 91 

2.5 Rezolvarea sistemelor liniare 

Teoremele 2.2 şi 2.3 arată că algoritmii GPP şi GPC constituie un bun instrument 

pentru rezolvarea sistemului liniar nesingular Ax = b. 

Să considerăm următoarea sintaxă neformală pentru utilizarea algoritmilor GPP 

şi respectiv GPC: 

[M, U, p] = GPP(A) 

[M, U, p, q] = GPC(A) 

unde M denotă multiplicatorii gaussieni µ ik , k = 1 : n − 1, i = k + 1 : n, U 

este matricea superior triunghiulară produsă de algoritm, iar p şi q sunt vectori de 

întregi definind permutările de linii şi, respectiv, coloane. Deşi matricele M şi U se 

memorează peste A (aşa cum am şi procedat în GPP şi GPC), vom utiliza sintaxa 

de mai sus pentru claritate. 

Rezolvarea sistemelor utilizând GPP. Considerăm sistemul liniar Ax = b, 

cu A nesingulară şi utilizăm GPP pentru triangularizarea matricei A conform 

relaţiei (2.14). Doarece toate matricele M k şi P k sunt nesingulare, sistemul Ax = b 

este echivalent (are aceeaşi soluţie) cu sistemul 

M n−1 P n−1 . . .M 1 P 1 Ax = M n−1 P n−1 . . . M 1 P 1 b. (2.37) 

În consecinţă, (2.37) se scrie în forma 

Ux = d, 

unde matricea superior triunghiulară U se află în A, iar vectorul 

d = M n−1 P n−1 . . . M 1 P 1 b, (2.38) 

se poate calcula pe loc în b, utilizând următoarea schemă de calcul: 

b 1. Pentru k = 1 : n − 1 

1. b ← P k b 

2. b ← M k b 

În definitiv, soluţia x a sistemului Ax = b se obţine rezolvând (pe loc în b) sistemul 

superior triunghiular Ux = b. Evident, în acest scop se utilizează algoritmul 

UTRIS, cu sintaxa 

x = UTRIS(U, b). 

Pentru detalierea schemei facem apel la propoziţiile 2.1 şi 2.2. Se obţine algoritmul 

de mai jos. 

Algoritmul 2.9 (S GPP – Calculul soluţiei unui sistem liniar utilizând 

GPP) (Se dau A ∈ R n×n nesingulară şi b ∈ R n . Se calculează 

soluţia x ∈ R n a sistemului liniar Ax = b, utilizând procedura de eliminare 

gaussiană cu pivotare parţială.)


1. [M, U, p] = GPP(A) 

2. Pentru k = 1 : n − 1 

1. b k ↔ b p(k) 

2. Pentru i = k + 1 : n 

1. b i ← b i − µ ik b k 

3. x = UTRIS(U, b) 

Comentarii. 

Numărul de operaţii este: 

n−1 

∑ 

N S GPP = N GPP + 2(n − k) + N UTRIS ≈ 2n3 

3 + n2 + n 2 ≈ 2n3 

3 ≈ N GPP, 

k=1 

şi deci principalul efort constă în triangularizarea matricei A. Evident, memoria 

necesară este M S GPP ≈ n 2 . 

♦ 

Rezolvarea sistemelor utilizând GPC. Alternativ, dar mai costisitor, putem 

utiliza GPC, vezi (2.16); în acest caz, sistemul Ax = b este echivalent cu 

M n−1 P n−1 . . . M 1 P 1 AQ 1 . . . Q n−1 Q n−1 . . . Q 1 x = M n−1 P n−1 . . . M 1 P 1 b. (2.39) 

Notând 

Q n−1 . . .Q 1 x = y, (2.40) 

din (2.16) rezultă că vectorul y poate fi calculat prin rezolvarea sistemului superior 

triunghiular 

Uy = d, (2.41) 

unde d este vectorul dat de (2.38). În final, din (2.40), şi ştiind că Q −1 

k 

= Q k , 

obţinem 

x = Q 1 Q 2 . . . Q n−1 y. (2.42) 

Din relaţiile (2.38)–(2.42), rezultă algoritmul următor. 

Algoritmul 2.10 (S GPC – Calculul soluţiei unui sistem liniar 

utilizând GPC) (Se dau A ∈ R n×n nesingulară şi b ∈ R n . Se calculează 

soluţia x ∈ R n a sistemului liniar Ax = b, utilizând procedura 

de eliminare gaussiană cu pivotare completă.) 

1. [M, U, p, q] = GPC(A) 

2. Pentru k = 1 : n − 1 

1. b k ↔ b p(k) 

2. Pentru i = k + 1 : n 

1. b i ← b i − µ ik b k 

3. x = UTRIS(U, b) 

4. Pentru k = n − 1 : −1 : 1 

1. x k ↔ x q(k) 

Comentarii. Complexitatea acestui algoritm este asimptotic aceeaşi cu cea a 

algoritmului GPC. 

♦

2.6. CALCULUL INVERSEI ŞI AL DETERMINANTULUI 93 

Observaţia 2.2 Eliminarea gaussiană, prezentată aici într-un mod sistematic, 

este binecunoscuta metodă de calcul manual prin reducere şi substituţie. Pivotarea 

pe linii corespunde unei reordonări a ecuaţiilor în (2.1), iar pivotarea pe coloane 

corespunde unei reordonări a componentelor necunoscutei x. Subliniem că această 

metodă este cea mai eficientă procedură de rezolvare a sistemelor de ecuaţii liniare 

nesingulare de formă generală. Stabilitatea numerică a acestor algoritmi va fi discutată 

ulterior. 

♦ 

Este clar că sistemul Ax = b se poate rezolva şi recurgând explicit la factorizarea 

LU a matricei A. Presupunând, pentru simplitate, că nu a fost utilizată pivotarea, 

factorizarea este A = LU. Avem LUx = b, sau Ly = b, unde am notat Ux = y. 

Prin urmare, soluţia sistemului poate fi găsită după următoarea schemă: 

Ax = b 

1. A = LU (calculează factorizarea LU) 

2. Se rezolvă sistemul inferior triunghiular Ly = b 

3. Se rezolvă sistemul superior triunghiular Ux = y 

Efortul de calcul este acelaşi ca în eliminarea gaussiană şi partea sa cea mai 

importantă se consumă în procesul de factorizare. 

Dacă sistemul liniar are parte dreaptă multiplă, adică este de forma AX = B 

cu B ∈ R n×p , p > 1, atunci X va rezulta de aceeaşi dimensiune; sistemul AX = B 

poate fi redus la p sisteme cu parte dreaptă simplă, Ax j = b j , j = 1 : p, unde 

vectorii b j şi x j sunt coloanele j din B, respectiv X. Utilizarea naivă de p ori a 

algoritmului S GPP ar conduce la un efort de calcul de pn 3 /3 flopi, inacceptabil 

de mare. Dar, deoarece A este aceeaşi pentru toate cele p sisteme, factorizarea LU 

sau, în general, triangularizarea matricei A, se efectuează o singură dată, rămânând 

apoi de rezolvat doar sisteme triunghiulare. Ideea algoritmului, în cazul factorizării 

LU, este următoarea: 

AX = B 

1. A = LU (calculează factorizarea LU) 

2. Pentru j = 1 : p 

1. Se rezolvă sistemul inferior triunghiular Ly = b j 

2. Se rezolvă sistemul superior triunghiular Ux j = y 

Numărul de operaţii va de numai aproximativ 2n 3 /3 + 2pn 2 flopi, menţinânduse 

complexitatea O(n 3 ). Desigur, în practică este recomandat a se folosi pivotarea, 

efectuând o factorizare LU de forma PA = LU sau apelând algoritmul GPP. 

Modificarea corespunzătoare a schemelor de calcul prezentate mai sus este propusă 

cititorului (vezi problema 2.15). 

2.6 Calculul inversei şi al determinantului 

unei matrice 

Grupăm în această secţiune două probleme care au în comun metoda de rezolvare 

utilizată — eliminarea gaussiană, precum şi recomandarea de a calcula inversa sau 

determinantul unei matrice doar atunci când acestea se doresc explicit. Repetăm


A ← 

M 

U 

⇒ 

A ← 

M 

U −1 

Fig. 2.6: Memorarea datelor în inversarea matriceală 

că, de exemplu, inversa nu se calculează atunci când se rezolvă sisteme liniare, după 

cum nu se calculează determinantul pentru a testa nesingularitatea unei matrice. 

2.6.1 Calculul inversei unei matrice 

Dacă A ∈ R n×n este nesingulară, atunci procedura de eliminare gaussiană cu pivotare 

parţială se termină cu succes şi produce o matrice superior triunghiulară 

nesingulară U astfel încât 

M n−1 P n−1 . . . M 1 P 1 A = U, (2.43) 

unde M k sunt matrice ITE şi P k sunt matrice elementare de permutare. Din (2.43) 

rezultă 

X ≡ A −1 = U −1 M n−1 P n−1 . . .M 1 P 1 , 

deci inversa matricei A poate fi calculată astfel 

A −1 

1. [M, U, p] = GPP(A) 

2. X = UINV(U) 

3. Pentru k = n − 1 : −1 : 1 

1. X ← XM k 

2. X ← XP k 

Ne amintim că în algoritmul GPP, matricea U şi multiplicatorii gaussieni µ ik , 

k = 1 : n −1, i = k +1 : n, notaţi global cu M în schema de mai sus, se memorează 

peste matricea A ca în partea stângă a figurii 2.6. În algoritmul UINV, am văzut 

că U −1 se poate memora peste U, astfel că, după instrucţiunea 2 a schemei de mai 

sus, datele sunt memorate ca în partea dreaptă a figurii 2.6. 

Pornind de la schema precedentă, vom prezenta un algoritm care calculează 

inversa matricei A, folosind minimum de memorie. Pentru aceasta, observăm că 

primele două instrucţiuni necesită memorie adiţională doar pentru vectorul p ∈ 

R n−1 , în care se memorează permutările de linii din GPP. Analizăm acum bucla 

Pentru din instrucţiunea 3. Prima atribuire, X ← XM k , poate fi detaliată utilizând 

o partiţionare pe linii a lui X: 

x T i M k = x T i (I n − m k e T k ) = x T i − (x T i m k )e T k (2.44) 

= [x i1 x i2 . . . x i,k−1 x ik − x T i m k x i,k+1 . . . x in ], i = 1 : n. 

Se poate observa că sunt modificate numai elementele de pe coloana k a lui X.

2.6. CALCULUL INVERSEI ŞI AL DETERMINANTULUI 95 

Ū −1 

¯M 

u (−1) 

1ḳ 

× . . . × 

. . . 

. 

× . . . × 

. . . 

. 

µ nk × . . . × 

u (−1) 

kk 

µ k+1,k 

k 

× × . . . × 

Ū −1 

. . . 

. 

X ← XM k P k × × . . . × 

✲ 

× 

¯M . . . 

. 

× × . . . × 

k 

Fig. 2.7: Memorarea datelor în pasul k al inversării matriceale 

A doua instrucţiune a buclei Pentru, X ← XP k , interschimbă coloanele k şi i k 

(i k ≥ k). 

Ţinând cont de toate aceste consideraţii şi de ordinea inversă de calcul a coloanelor, 

pasul k al buclei Pentru din schema de mai sus, adică X ← XM k P k , poate fi 

descris ca în figura 2.7, unde Ū −1 şi ¯M reprezintă elementele din U 

−1 şi, respectiv, 

multiplicatorii gaussieni care nu au fost utilizaţi (şi nici modificaţi) în execuţia buclei 

până la pasul curent; elementele modificate (parte a lui X) sunt notate prin ×. 

Astfel, singura informaţie care trebuie salvată constă în multiplicatorii gaussieni 

din coloana curentă, µ ik , i = k + 1 : n, necesari pentru calculul din (2.45). 

În acest fel, inversarea matricei A poate fi executată utilizând doar doi vectori 

suplimentari de lungime (n − 1), anume p pentru memorarea permutărilor şi, 

să zicem, g pentru salvarea temporară a multiplicatorilor gaussieni de pe coloana 

curentă. 

Algoritmul care implementează consideraţiile de mai sus este: 

Algoritmul 2.11 (INV GPP – Calculul inversei unei matrice) (Se 

dă A ∈ R n×n nesingulară. Se calculează matricea A −1 peste A. Algoritmul 

utilizează algoritmii GPP pentru triangularizarea gaussiană şi 

UINV pentru inversarea unei matrice superior triunghiulare.) 

1. [M, U, p] = GPP(A) % M şi U sunt memorate în A 

2. A ← X = UINV(U) % doar triunghiul sup. e modificat 

3. Pentru k = n − 1 : −1 : 1 

1. Pentru i = k + 1 : n 

1. g i ← µ ik % salvează multiplicatorii 

2. Pentru i = 1 : k 

1. a ik ← a ik − ∑ n 

t=k+1 a itg t % relaţia (2.45), primele k linii 

3. Pentru i = k + 1 : n 

1. a ik ← − ∑ n 

t=k+1 a itg t 

% relaţia (2.45), celelalte linii 

4. Dacă p(k) ≠ k atunci 

1. Pentru i = 1 : n % interschimbă coloanele k şi p(k) 

1. a ik ↔ a i,p(k)


Comentarii. 

Numărul de operaţii în virgulă mobilă este 

n−1 

∑ 

N INV GPP = N GPP + N UINV + 2n(n − k) ≈ 2n3 

3 + n3 

3 + n3 = 2n 3 

k=1 

şi memoria utilizată M INV GPP = n 2 . 

Este remarcabil faptul că inversarea matriceală nu este mai complexă (ca număr 

de operaţii) decât înmulţirea de matrice. 

♦ 

O acurateţe mai bună a matricei inverse calculate se poate obţine utilizând 

algoritmul GPC în locul lui GPP. În acest caz, 

M n−1 P n−1 . . . M 1 P 1 AQ 1 Q 2 . . . Q n−1 = U, 

şi deci 

X ≡ A −1 = Q 1 Q 2 . . . Q n−1 U −1 M n−1 P n−1 . . .M 1 P 1 . 

Scrierea algoritmului corespunzător este lăsată în sarcina cititorului. 

În practică, acurateţea obţinută cu INV GPP este suficient de bună pentru 

majoritatea aplicaţiilor. 

Observaţia 2.3 Efortul de calcul necesar inversării unei matrice este de aproximativ 

trei ori mai mare decât cel pentru rezolvarea unui sistem liniar de aceeaşi 

dimensiune. De aceea, de câte ori e posibil, inversarea matriceală trebuie evitată 

şi înlocuită de rezolvarea de sisteme liniare. De exemplu, pentru calculul scalarului 

real 

α = c T A −1 b, 

unde A ∈ R n×n , b, c ∈ R n , schema recomandată este 

c T A −1 b 1. Se rezolvă sistemul Ax = b % rezultă x = A −1 b 

2. α ← c T x 

sensibil mai eficientă decât varianta cu inversarea matricei A 

Este clar că inversa matricei A se poate calcula şi recurgând explicit la factorizarea 

LU a matricei. Presupunând că A = LU, avem 

A −1 = U −1 L −1 , 

iar o procedură de inversare ar putea consta în: 

1. A = LU (se calculează factorizarea LU) 

2. U ← X = U −1 

3. L ← Y = L −1 

3. A −1 ← XY 

Numărul de operaţii este tot 2n 3 . Desigur, în practică este indicat a se folosi o 

factorizare LU cu pivotare. 

♦

2.7. CONDIŢIONAREA SISTEMELOR LINIARE 97 

2.6.2 Calculul determinantului 

Algoritmii GPP şi GPC sunt utili şi în calculul determinantului unei matrice. 

Amintim că interschimbarea a două linii sau coloane ale unei matrice schimbă 

semnul determinantului acesteia, sau, echivalent, dacă P este o permutare elementară, 

atunci det(P) = −1. În plus, matricele ITE M k, k = 1 : n − 1, din (2.43), au 

elementele diagonale egale cu 1 şi deci det(M k ) = 1. Aşadar 

∏ 

n 

det(A) = (−1) s det(U) = (−1) s u ii , 

unde s ≤ n − 1 este numărul de PE proprii (adică P k ≠ I n ) în (2.43). 

Algoritmul corespunzător celor de mai sus este: 

Algoritmul 2.12 (DET GPP – Calculul determinantului) (Se dă 

A ∈ R n×n . Se calculează detA, utilizând algoritmul GPP.) 

1. [M, U, p] = GPP(A) 

2. det ← 1 


1. det ← det · u kk 

4. Pentru k = 1 : n − 1 

1. Dacă p(k) ≠ k atunci 

1. det ← −det 

Principalul efort de calcul în algoritmul de mai sus este efectuat în execuţia 

algoritmului GPP. Desigur, algoritmul GPC poate fi utilizat în loc de GPP, 

obţinându-se, de regulă, o acurateţe superioară a rezultatului. Scrierea algoritmului 

corespunzător este propusă cititorului. 

Dacă este disponibilă o factorizare LU a matricei A, atunci det(A) = det(LU) = 

= det(L) · det(U) = ( ∏ n 

i=1 l ii)( ∏ n 

i=1 u ii), ceea ce permite evaluarea imediată a 

determinantului. 

2.7 Condiţionarea sistemelor liniare 

După cum am văzut în capitolul 0, condiţionarea unei probleme de calcul, în cazul 

nostru rezolvarea sistemului liniar determinat nesingular Ax = b, este crucială în 

aprecierea acurateţii rezultatelor obţinute. Să considerăm o perturbaţie a datelor 

de intrare ale sistemului 

i=1 

(A, b) −→ (A + ∆A, b + ∆b) ≡ (Â,ˆb), 

care va avea ca efect o perturbaţie a soluţiei x 

x −→ x + ∆x ≡ ˆx, (2.45) 

astfel încât 

(A + ∆A)(x + ∆x) = b + ∆b. (2.46)


Considerăm doar perturbaţii mici, respectând ‖∆A‖ ≪ ‖A‖, ‖∆b‖ ≪ ‖b‖ (unde 

‖ ·‖ este o normă consistentă oarecare), i.e. efectuăm o analiză a sensibilităţii locale 

a soluţiei în raport cu variaţia datelor. 

Teorema 2.7 Presupunem că x ≠ 0. Eroarea relativă a soluţiei (2.45) a sistemului 

perturbat (2.46) este mărginită conform relaţiei 

( 

‖∆x‖ ‖∆A‖ 

‖x‖ 

≤ κ(A) ‖A‖ 

+ ‖∆b‖ ) 

, (2.47) 

‖b‖ 


κ(A) = ‖A −1 ‖ · ‖A‖ (2.48) 

se numeşte număr de condiţionare (la inversare) al matricei A. 

Cu alte cuvinte, erorile relative ‖∆A‖ / ‖A‖ şi ‖∆b‖ / ‖b‖ ale datelor de intrare 

pot fi amplificate de κ(A) ori în soluţie, presupunând că toate calculele se efectuează 

exact (deci indiferent de algoritmul folosit). 


Deoarece Ax = b, din (2.46) rezultă 

A · ∆x + ∆A · x + ∆A · ∆x = ∆b. 

Neglijând produsul ∆A · ∆x (deoarece perturbaţiile sunt mici), obţinem 

∆x ≈ −A −1 · ∆A · x + A −1 · ∆b. 

Utilizând o familie consistentă de norme matriceale ‖ · ‖, din relaţia de mai sus 

rezultă 

‖∆x‖ ≤ ‖A −1 ‖ · ‖∆A‖ · ‖x‖ + ‖A −1 ‖ · ‖∆b‖. 

Prin urmare, dacă x ≠ 0, o limită superioară a erorii relative este dată de 

‖∆x‖ 

‖x‖ 

≤ 

≤ 

‖A −1 ‖ · ‖A‖ · ‖∆A‖ 

‖A‖ + ‖∆b‖ 

‖A−1 ‖ · ‖A‖ · 

‖A‖ · ‖x‖ ≤ 

( ‖∆A‖ 

‖A −1 ‖ · ‖A‖ 

‖A‖ 

+ ‖∆b‖ ) 

, 

‖b‖ 

ceea ce demonstrează (2.47). (Am ţinut seama că ‖b‖ = ‖Ax‖ ≤ ‖A‖ · ‖x‖.) 

Aşadar numărul de condiţionare κ(A) definit în (2.48) furnizează o măsură a 

condiţionării problemei rezolvării unui sistem liniar Ax = b. Un κ(A) mic corespunde 

unei bune condiţionări, adică unei sensibilităţi reduse a soluţiei în raport cu 

perturbaţiile datelor. Vom prezenta în secţiunea următoare un rezultat care permite 

aprecierea mai precisă a condiţionării în funcţie de valoarea κ(A). Se observă că 

doar matricea A determină condiţionarea unui sistem, termenul liber b neavând 

nici un rol; de aceea vorbim de ”condiţionarea matricei A” în loc de ”condiţionarea 

sistemului”. Vom ataşa un indice notaţiei κ(A) atunci când vom preciza norma 

folosită în (2.48); de exemplu, κ ∞ (A) = ‖A −1 ‖ ∞ · ‖A‖ ∞ . Între norme echivalente, 

alegerea uneia anume pentru evaluarea lui κ(A) nu este relevantă, ordinul de mărime 

al rezultatului fiind acelaşi; de obicei, dintre normele p se alege κ ∞ (A) pentru 

♦


uşurinţa calculului (vezi mai jos). Să notăm că κ p (A) ≥ 1 şi κ 2 (A) = 1 dacă şi 

numai dacă A este ortogonală (demonstraţi !). 

Este intuitiv faptul că un sistem este cu atât mai rău condiţionat cu cât matricea 

A este mai ”aproape” de o matrice singulară. Trebuie subliniat că măsura acestei 

apropieri este dată de numărul de condiţionare şi nu de determinantul matricei A. 

Exemplul 2.1 Să considerăm matricele D, T ∈ R n×n 

⎡ 

⎤ ⎡ 

⎤ 

0.1 

1 −1 . . . −1 

0.1 

D = ⎢ 

⎣ 

. .. 

⎥ 

⎦ , T = 1 . . . −1 

⎢ 

⎣ 

. .. 

⎥ 

. ⎦ . 

0.1 

1 

Fiind diagonală, este evident că D este bine condiţionată; se verifică imediat că 

κ(D) = 1, în schimb det(D) = 10 −n , adică, dacă de exemplu n = 20, o valoare 

foarte mică. Pentru matricea triunghiulară T situaţia este contrară: deşi 

det(A) = 1, matricea este rău condiţionată pentru că κ ∞ (T) = n2 n−1 (U = T −1 

este inferior triunghiulară unitate cu elementele u ij = 2 j−i−1 , pentru j > i, deci 

‖T −1 ‖ ∞ = 1 + 2 + 2 2 + . . . + 2 n−2 = 2 n−1 − 1. Pe de altă parte, ‖T ‖ ∞ = n). ♦ 

Un mod uzual dar naiv de verificare a posteriori a ”calităţii” soluţiei calculate 

ˆx a unui sistem liniar Ax = b constă în a calcula norma reziduului r = b − Aˆx, i.e. 

‖r‖ = ‖b − Aˆx‖ 

şi de a conchide că dacă ‖r‖ este ”mic”, atunci ˆx este o soluţie precisă. De fapt, 

această concluzie, corectă pentru matricele bine condiţionate, poate să nu fie (şi 

de cele mai multe ori nu este) adevărată dacă matricea A este rău condiţionată. 

Într-adevăr, soluţia exactă este x = A −1 b, astfel că avem 

x − ˆx = A −1 b − A −1 (b − r) = A −1 r, 

deci eroarea relativă este mărginită conform relaţiei 

‖x − ˆx‖ 

‖x‖ 

= ‖A−1 r‖ 

‖A −1 b‖ ≤ ‖A−1 ‖ · ‖r‖ 

‖A −1 r‖ 

‖r‖ 

≤ κ(A) 

‖A‖ · ‖A −1 b‖ ≤ κ(A)‖r‖ ‖b‖ , 

pentru orice normă consistentă ‖ · ‖. Astfel, testul ”r este mic” e valid doar dacă 

matricea A este bine condiţionată. 

Exemplul 2.2 Matricele Hilbert H n ∈ R n×n , definite prin h ij = 1/(i+j −1) sunt 

rău condiţionate, κ(H n ) crescând foarte repede cu n. De exemplu, κ ∞ (H 3 ) ≈ 748. 

Dacă luăm 

x = 

⎡ 

⎣ 8.27 

4.60 

3.23 

⎤ 

⎦, b = 

⎡ 

⎣ 11.646 . . . 

6.475 . . . 

4.552 . . . 

⎤ 

⎦, d = 

⎡ 

⎣ 0.0128 

−0.0714 

0.0689 

⎤ 

⎦, ˆx = x + d, 

atunci x este soluţia sistemului H 3 x = b (în acest exemplu am ales x şi am calculat 

b). Pentru soluţia ”aproximativă” ˆx avem 

‖b − H 3ˆx‖ ∞ 

‖b‖ ∞ 

≈ 1.7 · 10 −5 , 

‖x − ˆx‖ ∞ 

‖x‖ ∞ 

≈ 8.6 · 10 −3 .


Deci, deşi reziduul ‖b − H 3ˆx‖ este relativ mic faţă de b, eroarea relativă a soluţiei 

aproximative ˆx este mult mai mare, de aproximativ 510 ori, i.e. cu un factor de 

mărime de ordinul lui κ ∞ (H 3 ). 

♦ 

Estimarea numărului de condiţionare 

Un algoritm bun de calcul al soluţiei sistemului Ax = b indică şi cât de sigură este 

soluţia obţinută, în condiţiile perturbării inerente a datelor de intrare. Numărul 

de condiţionare κ ∞ (A) (se alege norma ∞ doar pentru uşurinţa calculului) poate 

furniza informaţii sigure asupra acurateţii soluţiei. În continuare, presupunem că 

rezolvarea sistemului se face prin intermediul unei factorizări cu pivotare PA = LU, 

de exemplu cu algoritmul GPP modificat după cum este sugerat în secţiunea 2.4.1, 

dar concluziile pot fi extinse şi în celelalte cazuri. 

Calculul exact al κ ∞ (A), utilizând relaţia de definiţie, (2.48) este prea costisitor. 

Dacă ‖A‖ ∞ se obţine simplu în O(n 2 ) flopi conform (1.28), a calcula ‖A −1 ‖ ∞ 

implică o inversare matriceală care necesită de trei ori mai multe operaţii decât 

rezolvarea sistemului, adică inacceptabil de mult. Deoarece κ ∞ (A) indică numai o 

limită superioară, şi nu valoarea exactă a amplificării erorii datelor de intrare, ne 

punem problema estimării numărului de condiţionare cu doar O(n 2 ) operaţii. 

Cline et al. [] au propus o metodă eficientă prin care se obţin estimaţii de bună 

calitate ale normei ‖A −1 ‖ ∞ . Metoda se bazează pe implicaţia 

Ay = d ⇒ ‖A −1 ‖A −1 f‖ ∞ 

‖ ∞ = sup ≥ ‖y‖ ∞ 

. 

f≠0 ‖f‖ ∞ ‖d‖ ∞ 

Problema este de a găsi un vector d care conduce la un y suficient de mare în normă. 

Considerăm cazul simplu în care A este inferior triunghiulară. Deoarece sistemul 

Ay = d se rezolvă prin substituţie înainte (algoritmul LTRIS), elementele lui d nu 

trebuie precizate toate de la început ci se pot alege convenabil pe măsură ce sistemul 

este rezolvat. O primă idee constă în a considera d i ∈ {1, −1} (deci ‖d‖ ∞ = 1) şi 

de a alege în expresia 

∑i−1 

y i = (d i − a ij y j )/a ii 

j=1 

acea valoare d i care produce cel mai mare |y i |. Schema de calcul poate fi rezumată 

astfel: 

ν ≈ ‖A −1 ‖ ∞ 


1. ζ ← ∑ i−1 

j=1 a ijy j 

2. Dacă ζ ≥ 0 atunci d i ← −1 

altfel d i ← 1 

3. y i ← (d i − ζ)/a ii 

2. ν ← ‖y‖ ∞ 

Sunt necesari aproximativ n 2 flopi, la fel ca pentru LTRIS. 

O metodă mai eficientă constă în a urmări, la pasul i al schemei de mai sus, majorarea 

în modul nu numai a lui y i , ci şi a tuturor sumelor parţiale z ki = ∑ i 

j=1 a kjy j ,


cu k > i, contribuind astfel la majorarea tuturor y k , şi deci a lui ‖y‖ ∞ . Putem 

realiza aceasta alegând valoarea d i = ±1 care corespunde celei mai mari dintre 

sumele 

s + = |y + i | + n 

∑ 

k=i+1 

s − = |y − i | + n ∑ 

k=i+1 

|z + ki |, 

|z − ki |, 

unde elementele y + i , y− i 

corespund alegerii d i = 1, respectiv d i = −1, iar sumele 

parţiale au valorile z ± ki = ∑ i−1 

j=1 a kjy j +a ki y i ± . Algoritmul rezultat pentru estimarea 

numărului de condiţionare κ ∞ (A) = ‖A‖ ∞ ‖A −1 ‖ ∞ este prezentat mai jos; pentru 

k fixat, sumele z ki de mai sus se memorează într-un scalar notat ζ k . 

Algoritmul 2.13 (COND – Estimarea numărului de condiţionare) 

(Se dă A ∈ R n×n , inferior triunghiulară nesingulară. Se calculează o 

estimare ¯κ a lui κ ∞ (A).) 


1. ζ k ← 0 


1. y + i 

← (1 − ζ i )/a ii 

2. y − i ← (−1 − ζ i )/a ii 

3. Pentru k = i + 1 : n 

1. ζ + k ← ζ k + a ki y + i 

2. ζ − k ← ζ k + a ki yi 

− 

4. s + ← |y + i | + ∑ n 

k=i+1 |ζ+ k | 

5. s − ← |y − i | + ∑ n 

k=i+1 |ζ− k | 

6. Dacă s + ≥ s − atunci 

1. y i ← y + i 

2. Pentru k = i + 1 : n 

1. ζ k ← ζ + k 

altfel 

3. y i ← y − i 

4. Pentru k = i + 1 : n 

1. ζ k ← ζ − k 

3. ¯κ ← ‖y‖ ∞ ‖A‖ ∞ 

Execuţia algoritmului necesită aproximativ 3n 2 flopi. 

Considerăm acum cazul general al unei matrice A ∈ R n×n a cărei factorizare 

PA = LU este cunoscută. Numărul de condiţionare κ ∞ (A) se poate estima utilizând 

următoarea schemă de calcul, a cărei justificare depăşeşte cadrul acestei 

lucrări. 

¯κ ≈ κ ∞ (A) 

1. Se aplică algoritmul 2.13 pentru a obţine o soluţie de 

normă cât mai mare a sistemului U T y = d 

2. Se rezolvă sistemele triunghiulare L T r = y, Lv = Pr, 

Uw = v 

3. ¯κ ← ‖A‖ ∞ ‖w‖ ∞ / ‖r‖ ∞


Algoritmul necesită aproximativ 7n 2 flopi şi s-a dovedit excelent în practică, 

valorile obţinute fiind de regulă de cel mult 2-5 ori mai mici decât κ ∞ (A), ceea ce 

constituie o aproximaţie acceptabilă, mai ales în situaţiile critice când κ ∞ (A) are 

valori foarte mari. 

2.8 Stabilitatea numerică a algoritmilor de 

eliminare gaussiană 

Vom prezenta în această secţiune caracterizări ale stabilităţii numerice a algoritmilor 

de eliminare gaussiană (G, GPP, GPC), precum şi modalităţi de îmbunătăţire a 

rezultatelor numerice obţinute. 

Un algoritm de rezolvare a sistemului liniar determinat Ax = b produce o soluţie 

calculată ˆx afectată de erori numerice. Vectorul ˆx este soluţia aceluiaşi sistem cu 

datele perturbate, i.e. 

(A + H)ˆx = b. (2.49) 

Vom evalua ”mărimea” matricei H pentru algoritmii menţionaţi, adică vom prezenta 

rezultate ale analizei inverse a erorilor. Evaluarea unor margini superioare pentru 

‖H‖ este o sarcină dificilă, iar marginile au de obicei expresii complicate, de aceea 

nu va fi prezentată nici o demonstraţie. În plus, aceste margini sunt mult mai mari 

decât erorile numerice întâlnite în practică; ele au rolul de a preciza cazurile când 

erorile pot fi importante, nu de a cuantifica cu precizie aceste erori. 

Nu trebuie uitat nici o clipă că, chiar în prezenţa unor valori ale ‖H‖ foarte 

mici, acurateţea soluţiei este asigurată doar dacă matricea A este bine condiţionată. 

Altfel, ‖H‖ / ‖A‖ mic poate implica (‖ˆx − x‖)/‖x‖ mare, indiferent de algoritmul 

utilizat. 

În contextul teoremei 2.1, notăm cu Âk şi ˆMk matricele A k , respectiv M k , calculate 

efectiv de algoritmul de eliminare gaussiană G. Introducem în plus următoarele 

notaţii: 

β k = max 

i,j 

|â (k) 

ij |, k ∈ 1 : n, 

γ = max k=1:n β k 

β 1 

. 

Numărul real γ este numit factor de creştere, deoarece arată cât de mult cresc 

valorile elementelor matricei A în cursul transformărilor efectuate de algoritmul G. 

Teorema 2.8 Matricele ˆM 1 , ˆM2 , ..., ˆMn−1 , Â n = Û calculate în algoritmul G 

satisfac 

ˆM 1 −1 −1 

. . . ˆM n−1Û = A + E, cu |e ij| ≤ nτβ 1 γε M , (2.50) 

cu τ o constantă de ordinul unităţii, independentă de A. 

Deoarece procedura de rezolvare a sistemelor triunghiulare prin substituţie este 

numeric stabilă, majoritatea erorile numerice în rezolvarea unui sistem Ax = b apar 

la triangularizarea matricei A. De aceea, matricea H din (2.49) satisface margini 

superioare la nivel de element asemănătoare cu (2.50).

2.8. STABILITATE NUMERICĂ 103 

Se observă că valoarea marginii din (2.50) este determinată în special de factorul 

de creştere γ. Pentru algoritmii GPP şi GPC sunt valabile margini identice cu 

(2.50), dar cu valori maxime diferite pentru γ. 

• În algoritmul G, factorul de creştere γ poate avea valori oricât de mari; aşadar 

acest algoritm este numeric instabil. 

• Introducerea pivotării parţiale conduce la γ ≤ 2 n−1 . Deşi teoretic această 

margine este mare chiar pentru valori modeste ale lui n, totuşi algoritmul 

GPP produce rezultate precise în marea majoritate a cazurilor uzuale (unele 

excepţii sunt prezentate în []); marginea este atinsă numai pentru anumite 

matrice ”patologice”, special construite în acest scop; un exemplu este prezentat 

în problema 2.24. De aceea, GPP poate fi considerat practic stabil. 

• În cazul pivotării complete avem γ ≤ [n · 21 · 3 1/2 · 4 1/3 · . . . · n 1/(n−1) ] 1/2 . 

Această margine creşte lent cu n şi practic se poate considera γ ≤ n, ceea ce 

înseamnă că algoritmul GPC este necondiţionat stabil. 

Combinând constatările de mai sus cu efortul de calcul cerut de algoritmii 

studiaţi, putem conchide că algoritmul GPP este cel mai recomandat pentru rezolvarea 

sistemelor liniare. În cazuri speciale, când se doreşte o siguranţă deosebită 

a rezultatului, se pot utiliza algoritmul GPC sau metodele prezentate în continuare. 

Pentru că marginea superioară (2.50) e relativ complicată, să deducem un rezultat 

euristic, şi deci aproximativ, dar cu aplicaţii practice clare şi imediate. Dacă în 

rezolvarea sistemului Ax = b se foloseşte o strategie de pivotare, atunci γ este suficient 

de mic; pe de altă parte, β 1 ≤ ‖A‖ ∞ , dar de acelaşi ordin de mărime (în orice 

caz, nβ 1 ≥ ‖A‖ ∞ ). Atunci (2.50) este esenţial echivalentă cu afirmaţia grosieră 

‖E‖ ∞ ≈ ‖H‖ ∞ ≈ ‖A‖ ∞ ε M . (2.51) 

Combinând (2.51) cu (2.47) (în care ∆A = H, ∆b = 0, ∆x = ˆx − x), se obţine 

aproximaţia 

‖ˆx − x‖ ∞ 

‖x‖ ∞ 

≈ κ ∞ (A) · ε M , (2.52) 

care conduce la următoarea regulă de apreciere a acurateţii rezolvării unui sistem: 

Dacă ε M ≈ 10 −t şi κ ∞ (A) ≈ 10 q , atunci soluţia calculată are aproximativ t − q 

cifre zecimale corecte (restul de q fiind nesigure). 

Altfel spus, un număr de condiţionare de ordinul 10 q antrenează pierderea a q 

cifre semnificative în soluţie. Această constatare subliniază importanţa cunoaşterii 

unei evaluări a lui κ(A) pentru aprecierea acurateţii soluţiei calculate. 

2.8.1 Scalarea sistemelor liniare 

Fie D 1 , D 2 ∈ R n×n două matrice diagonale nesingulare ale căror elemente sunt puteri 

ale bazei de numeraţie β a formatului virgulă mobilă utilizat. Evident, sistemul 

Ax = b este echivalent cu sistemul 

D 1 AD 2 y = D 1 b, unde x = D 2 y. (2.53)


Transformarea A ← D 1 AD 2 , b ← D 1 b, prin care sistemul Ax = b se aduce la forma 

(2.53) se numeşte scalare. 

Astfel definită, scalarea nu introduce erori numerice, iar costul ei este de O(n 2 ) 

flopi, deci convenabil. Sunt mai multe considerente care sugerează ideea de scalare 

şi strategia de alegere a factorilor de scală D 1 , D 2 . 

Dacă elementele din A sunt de mărimi foarte diferite, atunci, marginea din (2.50) 

fiind aceeaşi pentru toate elementele, e posibil ca erorile relative asociate elementelor 

a ij mici (în modul) să fie foarte mari. De aceea, un obiectiv al scalării poate fi acela 

de a echilibra valorile elementelor matricei A. 

Pe de altă parte, (2.52) sugerează să alegem D 1 , D 2 astfel încât să minimizăm 

κ ∞ (D 1 AD 2 ). Acest obiectiv este dificil de realizat în general şi imposibil cu restricţia 

de cost impusă; de altfel, nu are sens a optimiza pornind de la o relaţie aproximativă. 

Ţinând seama de cele spuse mai sus precum şi de cerinţa evidentă ca D 1 şi D 2 

să fie calculate cu O(n 2 ) operaţii, s-au impus câteva modalităţi de scalare: 

• scalare pe linii: D 2 = I şi D 1 se alege astfel încât liniile matricei D 1 A să aibă 

aproximativ aceeaşi normă ∞. 

• echilibrare linii-coloane: D 1 şi D 2 se aleg astfel încât fiecare linie şi coloană 

din D 1 AD 2 să aibă norma ∞ cuprinsă în intervalul [1/β, 1] (vezi problema 

2.26). 

De obicei, soluţia calculată a sistemului (2.53) astfel scalat este mai precisă decât 

soluţia calculată a sistemului iniţial, dar în general nu există nici o garanţie în acest 

sens, de aceea scalarea nu trebuie privită ca panaceu universal ci aplicată în funcţie 

de problemă. 

2.8.2 Rafinarea iterativă a soluţiei calculate 

O altă metodă de îmbunătăţire a acurateţii soluţiei calculate ˆx a sistemului Ax = b 

este prezentată în continuare. Presupunem că sistemul a fost rezolvat folosind un 

algoritm cu pivotare parţială şi deci că o factorizare PA = LU este disponibilă. 

Fie r = b − Aˆx reziduul corespunzător lui ˆx. Dacă notăm e = x − ˆx, atunci 

Ae = Ax − Aˆx = b − (b − r) = r. (2.54) 

Această egalitate sugerează să rezolvăm sistemul Ae = r, obţinând soluţia ê, şi apoi 

să calculăm o nouă soluţie 

ˆx nou = ˆx + ê, (2.55) 

sperând că aceasta este mai precisă decât ˆx (dacă nu ar exista erori numerice în 

rezolvarea sistemului Ae = r, atunci ê = e, deci ˆx nou = x). Procedura poate fi 

repetată pentru noua soluţie, până la atingerea unei acurateţi mulţumitoare sau 

până când nu se mai obţine o îmbunătăţire a acesteia. (Nu discutăm aici modalitatea 

tehnică de estimare a acurateţii soluţiei, care depăşeşte nivelul acestei lucrări.) 

Aparent, aşa cum rezultă din (2.52), sistemele Ax = b şi Ae = r se rezolvă 

cu acurateţi asemănătoare, în esenţă dictate de κ ∞ (A), iar adunarea soluţiilor lor 

în (2.55) nu ar produce un rezultat mai precis. Se poate însă demonstra că, dacă

2.9. SISTEME BANDĂ 105 

κ ∞ (A)ε M ≪ 1, atunci schema de rafinare iterativă sugerată mai sus conduce (de 

obicei într-un număr foarte mic de iteraţii) la soluţia aproximativă ˆx satisfăcând 


‖ˆx − x‖ ∞ 

‖x‖ ∞ 

≤ 2n · cond(A, x) · ε M , (2.56) 

cond(A, x) def 

= ‖ |A−1 | · |A| · |x| ‖ ∞ 

‖x‖ ∞ 

, (2.57) 

iar |A| este matricea cu elementele |a ij |. 

Comparând acum (2.52) şi (2.56) constatăm că în general rafinarea iterativă 

conduce într-adevăr la îmbunătăţirea acurateţii soluţiei calculate deoarece 

cond(A, x) ≤ κ ∞ (A). (2.58) 

(Pentru demonstrarea acestei inegalităţi vezi problema 2.25.) Creşterea acurateţii 

soluţiei este cu atât mai mare cu cât raportul dintre cei doi termeni ai inegalităţii 

(2.58) este mai mic. 

Rafinarea iterativă dă rezultate şi mai bune dacă se calculează reziduul r în 

dublă precizie (utilizând un format virgulă mobilă cu mai multe cifre semnificative 

decât cel utilizat la rezolvarea Ax = b). Mai precis, dacă κ ∞ (A)ε M ≪ 1, atunci prin 

rafinare se obţine ‖ˆx − x‖ ∞ / ‖x‖ ∞ ≈ ε M , adică cel mai precis rezultat la care se 

poate ajunge în formatul virgulă mobilă de lucru. Aceasta concluzie este intuitivă, 

deoarece în (2.55) ê este calculat mai precis decât ˆx. 

Pentru a rezuma, o iteraţie a schemei de rafinare are forma (beneficiind de 

factorizarea PA = LU disponibilă) 

x nou 

1. Se calculează r = b − Ax (eventual în dublă precizie) 

2. Se rezolvă sistemele triunghiulare Ly = Pr, Uz = y 

3. x ← x + z 

Numărul de operaţii este de O(n 2 ), deci câteva iteraţii au un cost semnificativ 

mai mic decât cel al eliminării gaussiene. Există şi dezavantaje: trebuie păstrată o 

copie a matricei A pentru calculul reziduului, iar implementarea calculelor în dublă 

precizie poate fi dependentă de maşină (deşi standardul IEEE este respectat pe majoritatea 

calculatoarelor); de aceea, în bibliotecile actuale, de exemplu LAPACK, se 

utilizează precizia de lucru. O analiză detaliată a erorilor pentru rafinarea iterativă 

poate fi găsită în [IX]. 

2.9 Sisteme bandă 

În această secţiune vom considera sisteme Ax = b, în care A ∈ R n×n este o matrice 

bandă nesingulară, de lăţime inferioară r şi superioară q. Astfel de matrice apar 

deseori în practică, de exemplu la soluţionarea numerică a ecuaţiilor cu derivate 

parţiale. Vom vedea în continuare că aplicarea adecvată a procedurii de eliminare 

gaussiană poate aduce o mare reducere a numărului de operaţii, faţă de cazul matricelor 

oarecare.


⎡ ⎤ 

× × 

× × × 

⎢ × × × × 

⎥ 

⎣ × × × × ⎦ 

× × × 

k=1 

−→ 

⎡ 

⎢ 

⎣ 

× × 

0 ∗ × 

0 ∗ × × 

⎤ 

⎥ 

× × × × ⎦ 

× × × 

k=2 

−→ 

⎡ 

⎢ 

⎣ 

× × 

× × 

0 ∗ × 

⎤ 

⎥ 

0 ∗ × × ⎦ 

× × × 

k=3 

−→ . . . 

Fig. 2.8: Eliminarea gaussiană aplicată unei matrice bandă de lăţime inferioară 2 

şi superioară 1. S-au notat cu ∗ elementele modificate la pasul respectiv, cu 0 cele 

anulate, iar cu × cele rămase nemodificate 

Teorema 2.9 Dacă eliminarea gaussiană (algoritmul G) este aplicată matricei 

A ∈ R n×n bandă de lăţime inferioară r şi superioară q, nesingulară şi cu A [k] nesingulare, 

k = 1 : n − 1, atunci în egalitatea (2.10) (M n−1 . . . M 1 A = U), matricea U 

este superior triunghiulară bandă de lăţime q, iar matricele ELT M k = I − m k e T k 

sunt caracterizate de µ ik = 0, pentru i > k + r (altfel spus, în factorizarea LU 

produsă de algoritmul G, matricea L este inferior triunghiulară bandă de lăţime r). 

Pe scurt, în procedura de eliminare gaussiană fără pivotare, structura bandă a 

matricei A este ereditară, i.e. se transmite ca atare factorilor L, U furnizaţi de 

procedură. 

Demonstraţie. Figura 2.8 ilustrează procesul de eliminare gaussiană. Deoarece 

µ i1 = a i1 /a 11 , rezultă µ i1 = 0 pentru i > 1 + r. În atribuirea A ← M 1 A scrisă 

detaliat 

a ij ← a ij − µ i1 a 1j , pentru i, j = 2 : n, 

se observă că a ij rămâne nemodificat pentru i > 1+r (deoarece µ i1 = 0) şi j > 1+q 

(deoarece a 1j = 0). Aşadar, se modifică doar blocul A(2 : 1 + r, 1 : 1 + q) (în prima 

coloană sunt introduse zerouri subdiagonale) şi matricea A, inferior triunghiulară 

în prima coloană, rămâne bandă de lăţime inferioară r şi superioară q. 

Procesul continuă analog pentru k = 2, . . .,n−1, la fiecare pas k modificându-se 

blocul A(k + 1 : k + r, k : k + q), ceea ce conduce la structura bandă a matricei 

U, iar blocul (n − k) × (n − k) dreapta jos păstrându-şi structura bandă, ceea ce 

asigură forma enunţată a matricelor ITE. 

♦ 

Algoritmul rezultat este prezentat în continuare. 

Algoritmul 2.14 (Gb – Eliminare gaussiană pentru matrice bandă) 

(Se dă A ∈ R n×n , bandă de lăţime inferioară r şi superioară q, cu A [k] 

nesingulare, k = 1 : n −1. Se calculează matricea superior triunghiulară 

U şi matricele ITE M 1 , . . . , M n−1 astfel încât U = M n−1 M n−2 . . . M 1 A.) 

1. Pentru k = 1 : n − 1 

1. Pentru i = k + 1 : min(k + r, n) 


2. Pentru i = k + 1 : min(k + r, n)

2.9. SISTEME BANDĂ 107 

1. Pentru j = k + 1 : min(k + q, n) 


Lăsăm cititorului calculul unei formule pentru numărul de operaţii; dacă r ≪ n 

sau q ≪ n, acesta este ≪ 2n 3 /3. 

Triangularizarea matricei A conform algoritmului de mai sus permite reducerea 

sistemului Ax = b la sistemul echivalent superior triunghiular Ux = d, cu U bandă 

de lăţime superioară q. Adaptarea UTRIS la acest caz este imediată, elementele 

x i calculându-se prin substituţie înapoi cu formula 

⎛ 

x i = ⎝d i − 

min(i+q,n) 

∑ 

j=i+1 

u ij x j 

⎞ 

⎠/u ii . 

Vom vedea acum ce efect are pivotarea asupra structurii bandă. 

Teorema 2.10 Dacă eliminarea gaussiană cu pivotare parţială (algoritmul GPP) 

este aplicată matricei A ∈ R n×n bandă de lăţime inferioară r şi superioară q, nesingulară, 

atunci în egalitatea (2.14) (M n−1 P n−1 . . . M 1 P 1 A = U), matricea U este 

superior triunghiulară bandă de lăţime q + r, iar matricele ITE M k = I − m k e T k 

sunt caracterizate de µ ik = 0, pentru i > k + r. 

Demonstraţia va fi doar schiţată, procesul de eliminare fiind ilustrat cu ajutorul 

figurii 2.9. Primul pivot este găsit pe linia i 1 ∈ 1 : 1 + r, restul elementelor din 

prima coloană fiind nule. Permutarea liniilor 1 şi i 1 (operaţia A ← P 1 A) va face ca 

pe prima linie elementele nenule să fie în coloanele 1 : 1+q+r, în cel mai defavorabil 

caz (i 1 = 1+r). Evident, µ i1 = a i1 /a 11 , deci µ i1 = 0 pentru i > 1+r. În atribuirea 

A ← M 1 A scrisă detaliat 

a ij ← a ij − µ i1 a 1j , pentru i, j = 2 : n, 

a ij rămâne nemodificat pentru i > 1 + r (deoarece µ i1 = 0) şi j > 1 + q + r 

(deoarece a 1j = 0). Aşadar se modifică doar blocul A(2 : 1 + r, 1 : 1 + q + r). 

Matricea A rămâne bandă de lăţime inferioară r; în prima linie, A este bandă de 

lăţime superioară q + r, iar în liniile 1 + r : n bandă de lăţime superioară q. 

Procesul continuă asemănător pentru k = 2, . . .,n − 1; după A ← P k A, în linia 

k rezultă a kj = 0 pentru j > k + q + r; operaţia A ← M k A modifică doar blocul 

A(k+1 : k+r, k : k+r+q). În final, U şi matricele ITE M k au structura prezentată 

în enunţ. 

♦ 

Observăm că pivotarea parţială conduce la o matrice U superior triunghiulară 

bandă de lăţime mai mare decât cea a matricei iniţiale A. Mai mult, în factorizarea 

rezultată PA = LU, matricea inferior triunghiulară L nu mai este bandă, ca în 

lipsa pivotării; ţinând seama de teorema 2.6, deoarece o coloană a matricei L este 

o permutare a vectorului m k (ce defineşte matricea ITE M k = I − m k e T k 

), coloana 

respectivă are doar r elemente nediagonale nenule, dar în poziţii ce diferă de la caz 

la caz. 

Prezentăm mai jos algoritmul sugerat de demonstraţia teoremei 2.10.


⎡ 

× × 

× × × 

⎢ 

⎣ 

× × × × 

× × × × 

× × × × 

× × × 

⎡ 

P 

−→ 

2 

⎢ 

⎢ 

⎣ 

⎤ ⎡ 

∗ ∗ ∗ ∗ 

P 1 

−→ ⎥ ⎢ 

⎦ ⎣ 

× × × × 

∗ ∗ ∗ ∗ 

× × × 

∗ ∗ ∗ 

× × × 

∗ ∗ 

× × × × 

⎤ ⎡ 

M 2 

−→ ⎥ ⎢ 

× × × × ⎦ ⎣ 

× × × 

× × × × 

× × × 

⎤ ⎡ 

M 1 

−→ ⎥ ⎢ 

⎦ ⎣ 

× × × × 

× × × × 

0 ∗ ∗ ∗ 

0 ∗ ∗ ∗ 

⎥ 

× × × × ⎦ 

× × × 

× × × × 

0 ∗ ∗ ∗ 

0 ∗ ∗ ∗ 

× × × × 

⎤ 

× × × × 

× × × 

P 3 

−→ . . . 

Fig. 2.9: Eliminarea gaussiană cu pivotare parţială aplicată unei matrice bandă 

de lăţime inferioară 2 şi superioară 1. S-a presupus că la pasul k se efectuează 

permutarea liniilor k (curentă) şi k + 2 (cea mai depărtată posibil de cea curentă) 

⎤ 

⎥ 

⎦ 

Algoritmul 2.15 (GPPb – Eliminare gaussiană cu pivotare parţială 

pentru matrice bandă) (Se dă A ∈ R n×n , bandă de lăţime inferioară 

r şi superioară q, nesingulară. Se calculează matricea superior 

triunghiulară U, matricele ITE M 1 , . . . , M n−1 (memorate peste A) 

şi matricele PE P 1 , . . . , P n−1 (memorate în vectorul p), astfel încât 

U = M n−1 P n−1 . . . M 1 P 1 A.) 

1. Pentru k = 1 : n − 1 

1. r 1 = min(k + r, n), q 1 = min(k + q + r, n) 

2. Se determină i k ∈ k : r 1 astfel încât |a ik k| = max i=k:r1 |a ik | 

3. p(k) ← i k 

4. Pentru j = k : q 1 


5. Pentru i = k + 1 : r 1 


6. Pentru i = k + 1 : r 1 

1. Pentru j = k + 1 : q 1 


Comentarii. Numărul de operaţii este mai mare decât pentru algoritmul 2.14, 

dar, dacă r ≪ n sau q ≪ n, acesta este totuşi ≪ 2n 3 /3. 

♦ 

Lăsăm cititorului problema scrierii unui algoritm eficient de rezolvare a sistemului 

Ax = b, atunci când A are structură bandă, utilizând algoritmul 2.15. 

În final, precizăm că pivotarea completă distruge structura bandă şi deci nu este 

recomandată în acest caz.

2.10. SISTEME SIMETRICE 109 

Factorizarea Crout aplicată unei matrice A ∈ R n×n bandă de lăţime inferioară 

r şi superioară q are proprietăţi similare cu cele ale eliminării gaussiane; cititorul 

este invitat să demonstreze afirmaţiile următoare. 

Algoritmul CROUT produce o matrice L inferior triunghiulară bandă de lăţime 

r şi o matrice U superior triunghiulară (unitate) bandă de lăţime q. 

Algoritmul CROUTP (cu pivotare parţială) produce o matrice L inferior triunghiulară 

şi o matrice U superior triunghiulară (unitate) bandă de lăţime q + r. 

În plus, fiecare coloană a matricei L are cel mult r elemente nediagonale nenule. 

2.10 Sisteme simetrice 

Ne ocupăm în această secţiune de rezolvarea sistemului Ax = b, cu A inversabilă 

şi simetrică, în general de semn nedefinit. Nucleul rezolvării sistemului este factorizarea 

matricei A, chiar dacă eventual ea nu se face explicit. Presupunând că 

matricea A are factorizare LDU, deoarece A = A T şi factorizarea este unică (în 

condiţiile teoremei 2.4), rezultă imediat că U = L T . Se pune întrebarea cum putem 

profita de simetrie pentru a reduce numărul operaţiilor de la 2n 3 /3 (cazul general) 

la, sperăm, jumătate, adică n 3 /3. 

Dificultăţile problemei. Aplicarea ca atare a procedurii de eliminare gaussiană 

(algoritmul G) pare a avea inconvenientul major de a distruge simetria matricei 

A. Să explicităm primul pas al eliminării gaussiene; se calculează A ← M 1 A, 

unde M 1 = I − m 1 e T 1 este matricea ITE pentru care (M 1A) i1 = 0, i ∈ 2 : n. Matricea 

M 1 A nu este simetrică: prima coloană are elementele subdiagonale nule, în 

schimb prima linie are elemente în general nenule. Totuşi submatricea (M 1 A) 2:n,2:n 

este simetrică, ceea ce se observă şi detaliind instrucţiunea 1.2.1.1 din algoritmul G 

(cu k = 1), adică, 

a ij ← a ij − a i1 a 1j /a 11 

care se aplică identic şi elementului a ji = a ij 

a ji ← a ji − a j1 a 1i /a 11 = a ij − a i1 a 1j /a 11 . 

Aşadar nu este necesară modificarea tuturor elementelor matricei, ci doar a celor din 

(să zicem) triunghiul inferior; numărul de operaţii se reduce astfel la aproximativ 

jumătate. 

Pentru a păstra simetria sunt necesare transformări de congruenţă, adică se 

aplică transformările ITE de ambele părţi ale matricei A. Primul pas al eliminării 

gaussiene (modificate) va fi acum A ← M 1 AM T 1 = M 1A − (M 1 A)e 1 m T 1 ; deoarece 

(M 1 A)e 1 = a 11 e 1 , se observă că înmulţirea la dreapta cu M T 1 , adică (M 1 A)M T 1 , 

nu afectează decât prima linie a matricei M 1 A (identică cu prima linie a matricei 

A), anume introducând zerouri în toate poziţiile din dreapta diagonalei. Aşadar, 

din punctul de vedere al implementării, înmulţirea la dreapta cu M T 1 nu necesită 

calcule. 

Continuând analog pentru celelalte coloane, se obţine echivalentul relaţiei (2.10) 

în cazul simetric 

D def 

= M n−1 . . . M 2 M 1 AM T 1 M T 2 . . . M T n−1, (2.59)


unde D este evident o matrice diagonală. 

Modificând algoritmul G astfel încât să se acceseze doar triunghiul inferior al 

matricei A, se obţine factorizarea A = LDL T , cu L = M1 −1 M 2 −1 . . . Mn−1 −1 inferior 

triunghiulară unitate şi D memorate peste A: 

LDL T 1. Pentru k = 1 : n − 1 

1. Pentru i = k + 1 : n 

1. t i ← a ik 

2. a ik ← a ik /a kk 

2. Pentru j = k + 1 : n 

1. Pentru i = j : n 

1. a ij ← a ij − a ik t j 

Vectorul auxiliar t se foloseşte pentru salvarea elementelor coloanei curente k, 

egale cu cele de pe linia k în triunghiul superior, pe poziţiile cărora se memorează 

multiplicatorii. 

Ca şi în cazul general, chiar dacă A este inversabilă, se pot obţine pivoţi nuli 

dacă det(A [k] ) = 0 pentru un k ∈ 1 : n −1. Un exemplu evident este A = 

[ 0 1 

1 0 

În plus, algoritmul este numeric instabil. De aceea se impune pivotarea. 

Din păcate, strategiile de pivotare (parţială sau completă) propuse anterior pentru 

eliminarea gaussiană distrug simetria. O primă idee ar fi de a aplica permutările 

elementare de ambele părţi ale matricei A, aşa cum am procedat şi cu transformările 

ITE; de exemplu, la primul pas, să se calculeze A ← P 1 AP T 1 . O astfel de permutare 

nu poate aduce pe poziţia pivotului decât unul dintre elementele diagonale; exemplul 

de mai sus dovedeşte că această strategie poate da greş în situaţii banale. 

Factorizarea cvasi-diagonală. Păstrarea simetriei trebuie deci îmbinată cu 

participarea la pivotare a elementelor nediagonale. O posibilitate de realizare a 

acestui compromis este de a calcula o factorizare LDL T de un tip special, în care 

matricea D este cvasi-diagonală 2 . 

Teorema 2.11 Fie A ∈ R n×n o matrice inversabilă şi simetrică. Atunci există 

o matrice inferior triunghiulară unitate L ∈ R n×n , o matrice cvasi-diagonală 

D ∈ R n×n cu blocuri diagonale de dimensiune 1 × 1 sau 2 × 2, şi o matrice de 

permutare P ∈ R n×n astfel încât 

PAP T = LDL T . (2.60) 

Desigur, matricea D este inversabilă. Expresia de mai sus este numită factorizare 

cvasi-diagonală a matricei A. 

Demonstraţia este constructivă. Vom descrie modul de calcul al factorizării cvasidiagonale 

fără a preciza strategia de permutare mai mult decât este matematic 

necesar demonstraţiei. Desigur, într-un algoritm de calcul efectiv matricea de permutare 

P va fi construită pornind de la considerente de stabilitate numerică. 

2 O idee alternativă, descrisă în [], este de a lua D tridiagonală. 

] 

.


Primul pas al procedurii de factorizare se aplică matricei 

[ ] 

P 1 AP1 T E C = T 

, (2.61) 

C B 

unde E este un bloc s × s, cu s = 1 sau s = 2, iar P 1 o matrice de permutare, 

eventual elementară. Demonstrăm acum că dacă A este inversabilă, atunci există 

P 1 astfel încât E să fie inversabil; de exemplu, dacă a 11 ≠ 0, se poate lua s = 1, 

P 1 = I; dacă a 11 = 0, există a 1j ≠ 0, altfel prima coloană a matricei A este nulă, 

deci A este singulară; în acest caz, cu s = 2 şi P 1 permutând liniile 2 şi j se obţine 

det(E) = −a 2 1j ≠ 0. 

Pentru a determina primele s coloane ale factorilor L şi D, se utilizează o relaţie 

asemănătoare cu (2.31): 

[ ][ ] [ ] 

P 1 AP1 T = I s 0 E 0 Is E −1 C T 

CE −1 I n−s 0 B − CE −1 C T (2.62) 

0 I n−s 

Dacă s = 1, calculul factorizării (2.62) este efectuat de schema LDL T . Dacă 

s = 2, atunci CE −1 se poate calcula folosind eliminarea gaussiană cu pivotare (vezi 

problema 2.30) sau chiar — variantă pe care o adoptăm aici pentru simplitate — 

calculând direct 

E −1 = 

1 

det(E) 

[ 

] 

e 22 −e 21 

−e 21 e 11 

(2.63) 

şi apoi înmulţind C şi E −1 ; evident, blocul B −CE −1 C T se calculează acum banal, 

printr-un produs şi o adunare matriceale, dar numai în partea sa inferior triunghiulară, 

deoarece este simetric. 

Procedura continuă identic pentru matricea B − CE −1 C T de dimensiune 

(n − s) × (n − s), şi aşa mai departe până la obţinerea factorizării cvasi-diagonale 

(2.60). ♦ 

Algoritmul corespunzător este prezentat în continuare. Se vede uşor că procedura 

se poate executa pe loc în A; totuşi, la fel ca în schema LDL T , e necesară 

alocarea unui spaţiu suplimentar pentru salvarea temporară, acum într-o matrice 

T ∈ R n×2 , a elementelor coloanei (coloanelor, dacă s = 2) curente. 

Algoritmul 2.16 (FCD – Factorizare cvasi-diagonală) (Se dă 

A ∈ R n×n simetrică şi inversabilă. Se calculează matricea inferior triunghiulară 

unitate L, matricea D ∈ R n×n cvasi-diagonală, cu blocuri de 

dimensiune 1 × 1 sau 2 × 2, şi matricea de permutare P ∈ R n×n astfel 

încât relaţia (2.60) să fie satisfăcută. Matricele L şi D se memorează 

peste A. Modul de calcul al lui P nu este detaliat.) 

0. k ← 1 

1. C^at timp k < n 

1. Se determină P k şi s. 

2. Se efectuează permutarea (simetrică) A ← P k AP T k 

3. Dacă s = 1 atunci 

1. Pentru i = k + 1 : n 

1. t i1 ← a ik


2. a ik ← a ik /a kk 

altfel [ ] 

[ ] 

e11 · 

1 ak+1,k+1 · 

2. 

← 

e 21 e a 22 kk a k+1,k+1 −a 2 k+1,k −a k+1,k a kk 

3. Pentru i = k + 2 : n 

1. t i1 ← a ik , t i2 ← a i,k+1 

2. a ik ← a ik e 11 + a i,k+1 e 21 

3. a i,k+1 ← t i1 e 21 + a i,k+1 e 22 

4. Pentru j = k + s : n 

1. Pentru i = j : n 

1. Dacă s = 1 atunci 

1. a ij ← a ij − a ik t j1 

altfel 

2. a ij ← a ij − a ik t j1 − a i,k+1 t j2 

5. k ← k + s 

Comentarii. Numărul de operaţii este de ordinul n 3 /3 flopi, iar memoria ocupată 

de n(n + 1)/2 + 2n. 

♦ 

Strategii de pivotare. Vom prezenta în continuare două strategii de alegere 

a permutărilor, completând astfel algoritmul FCD cu detalierea instrucţiunii 1.1. 

Ne vom limita la descrierea primei etape din procedura de factorizare. Prin extensie 

de terminologie, numim pivot blocul E din (2.61) şi pivotare permutarea din 

instrucţiunea 1.2. 

Pivotare completă. Spre deosebire de eliminarea gaussiană, la procedura de 

factorizare cvasi-diagonală pivotarea completă se poate descrie mai uşor decât cea 

parţială. Matricea P 1 şi întregul s sunt alese conform următoarei scheme []: 

FCDPC 1 1. Se alege α ∈ (0, 1) 

2. µ 0 = max i,j |a ij |, µ 1 = max i |a ii | 

3. Dacă µ 1 ≥ αµ 0 atunci 

1. s = 1, se alege P 1 astfel încât în (2.61) |e 11 | = µ 1 

altfel 

2. s = 2, se alege P 1 astfel încât în (2.61) |e 21 | = µ 0 

Ideea este de a alege un pivot 1 × 1 dacă există un element diagonal suficient 

de mare în raport cu elementul de modul maxim µ 0 (depăşind un prag dictat de 

constanta α). Altfel pivotul este 

E = 

[ ] 

a11 a r1 

, unde |a 

a r1 a r1 | = µ 0 . (2.64) 

rr 

Notând Ã = B − CE−1 C T , se poate demonstra că (vezi problema 2.31): 

{ ( 

1 + 

1 

α) 

µ0 , dacă s = 1, 

|ã ij | ≤ 

( ) 

1 + 2 

1−α 

µ 0 , dacă s = 2. 

(2.65)


Constanta α se determină impunând condiţia ( ) ( ) 

1 + 1 2 

α = 1 + 2 

1−α 

, ceea ce 

va conduce la factori de creştere (vezi secţiunea 2.8) asemănători indiferent de dimensiunile 

pivoţilor. Se obţine α = (1 + √ 17)/8 ≈ 0.64. 

Această strategie de pivotare face ca algoritmul FCD să fie numeric stabil. 

O analiză inversă a erorilor conduce la o margine similară cu cea din (2.50), cu 

γ ≤ 3n ·[2 1 ·3 1/2 ·4 1/3 ·. . . ·n 1/(n−1) ] 1/2 ; această margine pentru factorul de creştere 

γ este puţin mai mare decât cea pentru eliminarea gaussiană cu pivotare completă 

(algoritmul GPC). 

Costul pivotării complete este de O(n 3 ) comparaţii, la fel ca pentru algoritmul 

GPC, ceea ce constituie un efort de calcul important. De aceea este interesantă 

găsirea unei strategii de pivotare parţială. 

Pivotare parţială. Se poate demonstra că alegerea pivotului căutând pe o singură 

coloană (şi eventual pe diagonală) nu poate avea succes. Surprinzător, căutând 

pe două coloane se poate descrie o strategie de pivotare parţială eficientă (vezi []), 

detaliată de schema (ne ocupăm din nou doar de primul pas al factorizării): 

FCDPP 1 1. Se alege α ∈ (0, 1) 

2. λ = max i=2:n |a i1 | (şi |a r1 | = λ) 

3. Dacă |a 11 | ≥ αλ atunci 

1. s = 1, P 1 = I 

altfel 

2. σ = max i=1:n, i̸=r |a ir | 

3. Dacă |a 11 |σ ≥ αλ 2 atunci 

1. s = 1, P 1 = I 

altfel dacă |a rr | ≥ ασ atunci 

2. s = 1, se alege P 1 astfel încât în (2.61) e 11 = a rr 

altfel 

3. s = 2, se alege P 1 astfel încât în (2.61) |e 21 | = λ 

Pentru a înţelege ideea pivotării, este util a considera matricea 

⎡ 

a 11 . . . λ . . . . . . . . . 

. . 

λ . . . a rr . . . σ . . . 

. . 

. . 

⎢ 

⎣ . σ 

. 

. 

[ ] 

a11 a 

şi a observa că pivotul este a 11 sau a rr când s = 1, sau r1 

când s = 2. 

a r1 a rr 

Se poate demonstra că relaţia (2.65) rămâne în continuare adevărată, deci se va 

alege aceeaşi valoare pentru α. Factorul de creştere din (2.50) va fi acum limitat de 

γ ≤ (1 + 1/α) n−1 ≈ (2.57) n−1 , o margine ceva mai largă decât pentru algoritmul 

GPP. În practică, algoritmul de factorizare cvasi-diagonală cu pivotare parţială 

⎤ 

⎥ 

⎦


are o stabilitate numerică satisfăcătoare. Cum numărul de comparaţii este redus 

acum la O(n 2 ), pivotarea parţială este de obicei preferată celei complete (la fel ca 

la eliminarea gaussiană). 

Utilizarea factorizării cvasi-diagonale. Factorizarea (2.60) poate fi folosită 

în modul cel mai simplu pentru rezolvarea sistemelor liniare, redusă la rezolvarea 

a două sisteme triunghiulare şi a unuia cvasi-diagonal; lăsăm cititorului detaliile de 

implementare. 

De asemenea, (2.60) se poate utiliza pentru calculul inversei matricei A, ţinând 

seama că 

A −1 = P T L −T D −1 L −1 P. 

Remarcăm faptul că şi matricea A −1 este simetrică. 

Cazul complex. În cazul în care A ∈ Cn×n este hermitică (A = A H ), factorizarea 

sa cvasi-diagonală are forma (analoagă cu (2.60)) 

PAP T = LDL H , 

unde P este o matrice de permutare, L ∈ C n×n este inferior triunghiulară unitate, 

iar D ∈ C n×n este bloc diagonală (cu blocuri 1 × 1 sau 2 × 2) şi hermitică. 

Algoritmul FCD îşi păstrează forma generală; trebuie luat însă în considerare 

faptul că în cazul complex transpunerea este însoţită şi de conjugare. De exemplu, 

(2.61) devine 

[ ] 

P 1 AP1 T E C = H 

, (2.66) 

C B 

iar E este hermitică, adică, în cazul 2 × 2, 

[ ] 

e11 ē 

E = 21 

. 

e 21 e 22 

Instrucţiunile algoritmului FCD se modifică corespunzător, de exemplu 1.4.1.1.1 

are forma a ij ← a ij − a ik ā jk . 

2.11 Sisteme simetrice pozitiv definite 

Considerăm acum sistemul Ax = b, unde matricea A ∈ R n×n este simetrică şi 

pozitiv definită. Ideea de bază a rezolvării lui este dată de teorema următoare. 

Teorema 2.12 Pentru orice matrice simetrică şi pozitiv definită A ∈ R n×n , există 

o unică matrice inferior triunghiulară L ∈ R n×n , cu elemente diagonale pozitive, 

astfel încât 

A = LL T , (2.67) 

expresie care este numită factorizare Cholesky (iar L este numit factorul Cholesky 

al matricei A). Reciproc, dacă factorizarea Cholesky există, atunci A este pozitiv 

definită.

2.11. SISTEME SIMETRICE POZITIV DEFINITE 115 

Evident, (2.67) se poate scrie sub forma A = R T R, unde R = L T este superior 

triunghiulară. De asemenea, factorizările A = L T L, respectiv A = RR T , se numesc 

tot Cholesky. 

Demonstraţie. Deoarece A este pozitiv definită atunci, conform propoziţiei 1.3, 

submatricele lider principale A [k] , k = 1 : n − 1, sunt pozitiv definite, deci nesingulare. 

Atunci A are o unică factorizare LDU (vezi teorema 2.4), A = L ′ DU ′ şi, din 

motive de simetrie, U ′ = (L ′ ) T . Dar A şi D sunt congruente, deci D este pozitiv 

definită, adică d ii > 0, i = 1 : n. Fie F ∈ R n×n matricea diagonală definită de 

f ii = √ d ii , i = 1 : n. Notând L = L ′ F, prima parte a teoremei este demonstrată 

(l ii = √ d ii , i = 1 : n). 

Reciproca este evidentă; fie x ∈ R n nenul, altfel arbitrar; atunci avem x T Ax = 

x T LL T x = ‖L T x‖ 2 2 > 0 (deoarece L este nesingulară, LT x ≠ 0). 

♦ 

Există mai mulţi algoritmi pentru calculul factorizării Cholesky a unei matrice 

pozitiv definite, care diferă doar prin ordinea de efectuare a calculelor. Vom deduce 

aici o procedură de factorizare compactă, similară cu cea folosită la calculul factorizării 

Crout, în care elementele factorului Cholesky L sunt calculate în ordinea 

(crescătoare a) coloanelor. Din identitatea A = LL T (doar triunghiul inferior stâng 

al lui A este reprezentat, deoarece A este simetrică) 

⎡ 

⎤ ⎡ 

⎤ ⎡ 

⎤ 

a 11 

l 11 

l 11 . . . l k1 . . . l n1 

. . .. 

. . .. 0 

. .. . . 

a k1 . . . a kk 

= 

l k1 . . . l kk 

l kk . . . l nk 

⎢ 

⎣ 

. ⎥ ⎢ 

. . .. ⎦ ⎣ 

. ⎥ ⎢ 

. . .. ⎦ ⎣ 

. ⎥ 

0 .. . ⎦ 

a n1 . . . a nk . . . a nn l n1 . . . l nk . . . l nn l nn 

obţinem pentru prima coloană: 

a 11 = l 2 11 ⇒ l 11 = √ a 11 , 

a i1 = l i1 l 11 ⇒ l i1 = a i1 / l 11 , i = 2 : n, 

(2.68) 

şi deci procesul de calcul poate fi iniţiat. 

Acum, presupunând că primele k−1 coloane din L au fost calculate, identificarea 

elementului din poziţia (k, k) în A = LL T furnizează 

k−1 

∑ 

a kk = lkj 2 + l2 kk , (2.69) 

j=1 

în care singura necunoscută este l kk . Conform teoremei 2.12, dacă A este pozitiv 

definită, atunci există un unic l kk pozitiv astfel încât (2.69) să aibă loc. Atunci, 

şi 

k−1 

∑ 

a kk − lkj 2 > 0 (2.70) 

j=1 

k−1 

∑ 

l kk = √ akk − lkj 2 . (2.71) 

j=1


De asemenea, 

k−1 

∑ 

a ik = l ij l kj + l ik l kk , i = k + 1 : n, 

j=1 

în care, în ordinea de calcul considerată, singura necunoscută este l ik . Aşadar 

⎛ ⎞ 

k−1 

∑ 

l ik = ⎝a ik − l ij l kj 

⎠ / l kk , i = k + 1 : n. (2.72) 

j=1 

Formulele (2.68), (2.71) şi (2.72) definesc algoritmul de mai jos; pentru concizie, 

am inclus şi primul pas în bucla de parcurgere a coloanelor. Totodată, acest algoritm 

este cel mai bun mijloc de testare a pozitivităţii unei matrice; testul se bazează pe 

faptul că factorizarea Cholesky a unei matrice poate fi calculată dacă şi numai 

dacă matricea este pozitiv definită (teorema 2.12); aşadar, dacă termenul stâng al 

inegalităţii (2.70) nu este pozitiv, atunci matricea A nu este pozitiv definită. 

Algoritmul 2.17 (CHOL – factorizare Cholesky) (Se dă A ∈ R n×n 

simetrică. Se stabileşte dacă A este pozitiv definită şi, în acest caz, 

se scrie peste triunghiul inferior al lui A matricea L din factorizarea 

Cholesky A = LL T .) 


1. α ← a kk − ∑ k−1 

j=1 l2 kj 

2. Dacă α ≤ 0 atunci 

1. Tipăreşte ’A nu este pozitiv definită’ 

2. Stop 

3. a kk ← l kk = √ α 

4. Pentru i = k + 1 : n 

1. a ik ← l ik = 

( 

a ik − ∑ k−1 

j=1 l ijl kj 

) 

/ l kk 

Comentarii. În mod evident, instrucţiunea 1.4.1 reprezintă o operaţie DOT. O 

altă ordonare a calculelor, care, în variantă vectorială, conduce la operaţii Saxpy, 

este propusă în problema 2.33. Tot ca exerciţiu pentru cititor (problema 2.34) 

este lăsată varianta la nivel de bloc a factorizării Cholesky, foarte asemănătoare 

algoritmilor de factorizare LU la nivel de bloc, prezentaţi în secţiunea 2.4. 

Algoritmul CHOL necesită aproximativ N CHOL = n 3 /3 flopi şi, în plus, calculul 

a n rădăcini pătrate (care e neglijabil). Memoria necesară este de aproximativ 

M CHOL = n 2 /2. 

Algoritmul este numeric stabil; dacă ˆL reprezintă factorul Cholesky calculat, 

atunci ˆLˆL T = A+E, unde perturbaţia E satisface limita (2.50) pentru γ = 1; deci, 

stabilitatea este mai bună decât a eliminării gaussiene cu pivotare completă. ♦ 

Desigur, sistemul liniar Ax = b, cu A pozitiv definită se calculează cu schema 

Ch 

1. Se factorizează A = LL T cu algoritmul CHOL 

2. Se rezolvă sistemul inferior triunghiular Ly = b 

3. Se rezolvă sistemul superior triunghiular L T x = y

2.12. RUTINE LAPACK ŞI MATLAB 117 

efectuându-se de două ori mai puţine operaţii decât dacă s-ar aplica algoritmul de 

eliminare gaussiană. 

În privinţa condiţionării, problema rezolvării sistemului pozitiv definit Ax = b 

satisface inegalitatea (2.47). 

Inversa (care este tot simetrică şi pozitiv definită) şi determinantul unei matrice 

simetrice pozitiv definite se calculează adaptând ideile din secţiunea 2.6 la contextul 

factorizării Cholesky A = LL T . 

Matrice bandă. Dacă A ∈ R n×n este o matrice simetrică, pozitiv definită 

şi bandă de lăţime r, atunci factorul Cholesky este inferior triunghiular bandă de 

lăţime r. Aceasta se poate observa cu uşurinţă din relaţia (2.72), în care un element 

l ik depinde de valorile l ij aflate la stânga sa pe linia i (i.e. j < k); aşadar, l i1 = a i1 , 

deci în prima coloană se moşteneşte structura matricei A; dacă, pentru un indice 

de coloană s, avem l ij = 0 pentru j = 1 : s − 1, atunci este evident că l is = a is /l ss , 

deci structura se moşteneşte şi în coloana s. În concluzie, linia i are, în porţiunea 

subdiagonală, aceeaşi structură în A şi L. 

Adaptarea algoritmului CHOL la cazul matricelor bandă este un exerciţiu relativ 

simplu pe care îl lăsăm cititorului (vezi problema 2.36). 

Cazul complex. Dacă matricea A ∈ C n×n este hermitică şi pozitiv definită, 

atunci factorizarea sa Cholesky este unică şi are forma 

A = LL H , 

unde L ∈ C n×n este inferior triunghiulară, cu elementele diagonale reale şi pozitive 

(şi A are elementele diagonale reale, fiind hermitică, şi pozitive, fiind pozitiv 

definită). Factorul Cholesky se poate calcula cu algoritmul CHOL uşor modificat, 

deoarece (2.71) şi (2.72) se transformă în 

k−1 

∑ 

l kk = √ akk − l kj l kj , (2.73) 

j=1 

respectiv 

⎛ ⎞ 

k−1 

∑ 

l ik = ⎝a ik − l ij l kj 

⎠ / l kk , i = k + 1 : n. (2.74) 

j=1 

2.12 Rutine LAPACK şi MATLAB 

Prezentăm pe scurt în continuare rutinele din biblioteca LAPACK şi instrucţiunile 

sau funcţiile limbajului MATLAB care rezolvă problemele tratate în acest capitol. 

LAPACK (Linear Algebra PACKage) [XV] este o bibliotecă de rutine scrise 

iniţial în FORTRAN dar apelabile din mai multe limbaje de programare. Rutinele 

implementează în special algoritmi la nivel de bloc (apelând rutinele BLAS de nivel 

3) şi de aceea ating maximul de performanţă pe calculatoare cu memorie ierarhică. 

Pentru fiecare problemă au fost aleşi algoritmii cei mai fiabili şi rapizi dintre cei 

cunoscuţi, bună parte dintre aceştia fiind adaptarea celor din bibliotecile LINPACK


[XIII] (dedicată în special rezolvării sistemelor liniare) şi EISPACK [XI,XII] (pentru 

calculul valorilor proprii şi probleme conexe), cele mai performante şi folosite pachete 

de programe de calcul numeric ale anilor ’70–’80. De aceea se poate aprecia că 

LAPACK este cel mai modern şi puternic instrument de calcul în algebra matriceală. 

În plus, sursele LAPACK sunt disponibile gratuit (vezi http://www.netlib.org). 

Numele rutinelor LAPACK respectă convenţiile BLAS (vezi secţiunea 1.11), 

adică au forma xyyzzz, unde x codifică formatul de reprezentare a datelor, yy 

reprezintă tipul matricei (vezi tabelul 1.1 pentru cele mai importante tipuri), iar 

zzz arată operaţia executată. 

Rutinele LAPACK sunt împărţite în trei categorii: 

• rutine driver, care rezolvă o problemă completă, de exemplu aflarea soluţiei 

unui sistem liniar; 

• rutine de calcul, care rezolvă subprobleme sau completează rezolvarea unei 

probleme, de exemplu calculul factorizării LU sau rafinarea iterativă a soluţiei 

unui sistem liniar; 

• rutine auxiliare. 

Rezolvării sistemelor liniare îi sunt dedicate în LAPACK două tipuri de rutine 

driver: 

1. Driverul simplu, cu numele de forma xyySV, rezolvă sistemele (cu parte 

dreaptă multiplă) AX = B sau A T X = B. De exemplu, xGESV se utilizează pentru 

matrice A oarecare (implementând eliminarea gaussiană la nivel de bloc), xPOSV se 

utilizează când matricea A este simetrică pozitiv definită (implementând algoritmul 

Cholesky la nivel de bloc) etc. 

2. Driverul expert, cu numele xyySVX, care, în plus 

• scalează matricea A dacă este necesar; 

• estimează numărul de condiţionare al matricei A; 

• rafinează iterativ soluţia. 

În contextul rezolvării de sisteme, rutinele de calcul cele mai importante sunt 

următoarele: 

1. xyyTRF calculează factorizarea PA = LU în cazul general (yy=GE), factorizarea 

Cholesky A = LL T pentru matrice simetrice (hermitice) pozitiv definite 

(yy=PO), factorizarea cvasi-diagonală PAP T = LDL T pentru matrice simetrice 

(hermitice) (yy=SY, yy=HE). În toate cazurile de mai sus există rutine şi 

pentru matrice bandă. 

2. xyyTRS utilizează rezultatul factorizării (ieşirea rutineixyyTRF corespunzătoare) 

pentru a calcula soluţia unui sistem liniar. 

3. xyyEQU scalează matricea A. 

4. xyyRFS rafinează iterativ soluţia unui sistem liniar.


5. xyyCON estimează inversul numărului de condiţionare, adică 1/κ(A). 

6. xyyTRI calculează inversa unei matrice, utilizând rezultatul factorizării. 

MATLAB (MATrix LABoratory) [XIV] are o interfaţă mai simplă, dar rutinele 

sale implementează de asemenea algoritmi de mare performanţă. 

Rezolvarea sistemului liniar (eventual cu parte dreaptă multiplă) AX = B se 

face apelând la operatorul de ”împărţire” la stânga; dacă A şi B sunt variabilele 

memorând matricea coeficienţilor sistemului şi, respectiv, termenul său drept, atunci 

soluţia se calculează cuA\B. Sistemul (cu necunoscuta la stânga) XA = B se rezolvă 

utilizând operatorul de ”împărţire” la dreapta, soluţia fiind B/A. În ambele cazuri, 

algoritmul implementat este eliminarea gaussiană cu pivotare parţială, indiferent 

de tipul matricei. 

Factorizarea PA = LU este calculată de funcţia lu, iar factorizarea Cholesky 

de funcţia chol. Nu există o funcţie dedicată factorizării cvasi-diagonale. 

Inversa unei matrice se calculează cu funcţia inv, iar determinantul cu det. 

Reamintim că în nici un caz soluţia unui sistem AX = B nu se calculează cu 

inv(A)*B. 

Pentru calculul numărului de condiţionare există mai multe funcţii; cond calculează 

exact κ 2 (A), ceea ce necesită mai multe operaţii decât rezolvarea sistemului 

liniar Ax = b (algoritmul va fi prezentat în capitolul 5); rcond estimează 1/κ ∞ (A), 

utilizând algoritmul din finalul secţiunii 2.7; în fine, condest estimează 1/κ 1 (A) cu 

un algoritm neprezentat în această lucrare. 

2.13 Probleme 

P 2.1 Descrieţi o variantă a eliminării gaussiene în care se introduc zerouri în coloanele 

lui A, deasupra diagonalei, în ordinea n : −1 : 2, şi care produce factorizarea A = UL, 

unde U este superior triunghiulară unitate şi L este inferior triunghiulară. 

P 2.2 Scrieţi variantele vectoriale ale algoritmilor GPP şi GPC, utilizând apeluri la 

funcţii din biblioteca BLAS 1. 

P 2.3 Fie A ∈ R n×n o matrice strict diagonal dominantă pe coloane, i.e. cu proprietatea 

|a jj| > P n 

i=1,i≠j 

|aij|. Demonstraţi că pivotarea parţială nu este necesară în procesul de 

eliminare gaussiană şi că toţi multiplicatorii gaussieni sunt subunitari (în modul). 

P 2.4 Fie matricea de transformare elementară Gauss-Jordan ˜M k = I n − ˜m k e T k , definită 

de vectorul ˜m k = [µ 1k . . . µ k−1,k 0 µ k+1,k . . . µ nk ] T . 

a. Fie x ∈ R n , cu x k ≠ 0. Determinaţi ˜m k astfel încât ˜M k x = x k e k . 

b. Fie A ∈ R n×n , având submatricele lider principale A [k] nesingulare, k = 1 : n − 1. 

Scrieţi un algoritm care, utilizând transformări Gauss-Jordan, diagonalizează matricea A, 

i.e. generează ˜M 1, ˜M 2, ..., ˜M n−1 astfel încât ˜M n−1 . . . ˜M 2 ˜M 1A = D, cu D diagonală. 

Care este numărul de operaţii 

c. Introduceţi pivotarea în algoritmul anterior. 

P 2.5 Demonstraţi unicitatea factorizării LDU în condiţiile teoremei 2.4. 

P 2.6 Demonstraţi că dacă A ∈ R n×n admite o factorizare LDU unică, atunci submatricele 

lider principale A [k] , k = 1 : n − 1, sunt nesingulare. (Indicaţie: utilizaţi reducerea 

la absurd.)


P 2.7 Demonstraţi că algoritmul GPP modificat conform descrierii din secţiunea 2.4.1 

produce o factorizare LU pentru care |l ik | ≤ 1, pentru i > k. 

P 2.8 Cum trebuie modificat algoritmul GPC aplicat matricei A ∈ R n×n pentru a furniza 

factorizarea LU cu permutări pe linii şi pe coloane de forma PAQ = LU Demonstraţi 

că |u kk | ≥ |u kj |, pentru j > k (în plus, |l ik | ≤ 1, pentru i > k). 

P 2.9 Adaptaţi algoritmul de eliminare gaussiană cu pivotare parţială astfel încât să 

calculeze factorizarea (2.32). 

P 2.10 Scrieţi o variantă la nivel de bloc a algoritmului de factorizare Crout cu pivotare 

CROUTP. 

P 2.11 Cum trebuie modificaţi algoritmii 2.7 şi 2.8 astfel încât să funcţioneze corect şi 

atunci când dimensiunea n a matricei nu este multiplu al dimensiunii r a blocurilor 

P 2.12 Prezentaţi o variantă a algoritmului de rezolvare a sistemelor liniare de forma 

Ax = b prin eliminare gaussiană cu pivotare parţială, fără a memora multiplicatorii. 

P 2.13 Fie H ∈ R n×n o matrice nesingulară superior Hessenberg (h ij = 0, pentru 

i > j + 1). 

a. Dacă toate submatricele lider principale ale lui H sunt nesingulare, adaptaţi algoritmul 

de eliminare gaussiană pentru rezolvarea sistemului liniar Hx = b, unde b ∈ R n ; 

calculaţi numărul de operaţii. 

b. Adaptaţi algoritmul GPP pentru aceeaşi problemă. 

c. Adaptaţi algoritmul Crout de factorizare LU. 

P 2.14 Se consideră două matrice: H ∈ R n×n , superior Hessenberg nesingulară, şi 

R ∈ R n×n , superior triunghiulară unitate. Prezentaţi algoritmi eficienţi pentru: 

a. rezolvarea sistemului liniar HRx = b, cu b ∈ R n . 

b. Atunci când toate submatricele lider principale ale lui H sunt nesingulare, factorizarea 

Crout A = HR poate fi obţinută printr-una din următoarele două scheme: 

Schema 1. 1. Calculează A = HR. 

2. Calculează factorizarea Crout a lui A: A = LU. 

Schema 2. 1. Calculează factorizarea Crout a lui H: H = LŪ. 

2. Calculează U = ŪR. 

Care dintre ele este mai eficientă 

P 2.15 a. Propuneţi un algoritm pentru rezolvarea sistemului liniar Ax = b, unde 

A ∈ R n×n este nesingulară şi b ∈ C n , utilizând numai aritmetica reală. 

b. Prezentaţi un algoritm pentru rezolvarea ecuaţiei matriceale AX = B, în care 

A ∈ R n×n este nesingulară şi B ∈ R n×m . (Indicaţie: utilizaţi GPP.) 

c. Idem, dar pentru ecuaţia XA = B, cu A ∈ R n×n , B ∈ R m×n . 

P 2.16 Se dă matricea A ∈ R n×n nesingulară. Utilizând rezultatul algoritmului de eliminare 

gaussiană cu pivotare parţială (M n−1P n−1 . . . M 1P 1A = U) sau factorizarea LU 

(PA = LU), scrieţi algoritmii pentru rezolvarea sistemelor A T y = c, A T Y = C, unde 

c ∈ R n , C ∈ R n×m . 

P 2.17 Prezentaţi un algoritm eficient pentru rezolvarea sistemului liniar A k x = b, unde 

A ∈ R n×n este nesingulară, b ∈ R n şi k ∈ N, k > 1. 

P 2.18 Dacă A,B ∈ R n×n sunt matrice nesingulare, prezentaţi un algoritm eficient de 

rezolvare a sistemului liniar (AB) k x = c, unde c ∈ R n .


P 2.19 Sistemul complex Cz = w (cu C = A + iB, z = x + iy, w = u + iv) se poate scrie 

(prin ”decomplexificare”) în forma 

» – » – » – 

A −B x u 

= 

B A y v 

Ce este preferabil: (a) rezolvarea sistemului Cz = w cu operaţii complexe sau (b) rezolvarea 

sistemului decomplexificat cu operaţii reale 

P 2.20 Se presupune că A ∈ R n×n are o factorizare LU şi că L şi U sunt cunoscuţi. 

Prezentaţi un algoritm care calculează elementul din poziţia (i, j) a matricei A −1 , cu 

aproximativ (n − j) 2 + (n − i) 2 flopi. 

P 2.21 Detaliaţi algoritmii de calcul al inversei unei matrice A ∈ R n×n şi al det(A), 

utilizând eliminarea gaussiană cu pivotare completă. 

P 2.22 Se dau A ∈ R n×n , B ∈ R n×r , C ∈ R r×n , D ∈ R r×r , matricele A şi D fiind 

inversabile. Fie A + = A+BD −1 C (actualizare de rang r a matricei A). Cazuri particulare: 

1 ◦ A, D simetrice pozitiv definite, C = B T ; 2 ◦ r = 1, adică A + = A + bc T /δ (actualizare 

de rang 1). 

a. Demonstraţi că are loc formula (Sherman-Morrison-Woodbury): 

A −1 

+ = A −1 − A −1 BD −1 

+ CA −1 , unde D + = D + CA −1 B. 

b. Scrieţi un algoritm de calcul al matricei A −1 

+ , presupunând A −1 cunoscută (actualizarea 

inversei). Consideraţi cazurile 

» 

particulare 

– 

1 ◦ şi 2 ◦ . Evaluaţi numărul de operaţii. 

A B 

c. Se consideră matricea H = . Demonstraţi că 

C −D 

» 

H −1 = 

A −1 

+ A −1 BD −1 

+ 

D −1 

+ CA−1 −D −1 

+ 

– 

. 

P 2.23 Fie u, v ∈ R n doi vectori nenuli şi matricea A = I n + uv T . 

a. Prezentaţi un algoritm eficient pentru calculul determinantului matricei A. Când 

este A nesingulară 

b. Dacă A este nesingulară şi b ∈ R n , scrieţi un algoritm eficient pentru rezolvarea 

sistemului liniar Ax = b. 

P 2.24 Matricea A ∈ R n×n de mai jos este un exemplu (construit special în acest scop) 

în care factorul de creştere γ atinge valoarea maximă în algoritmul GPP. 

2 

A = 

6 

4 

1 0 . . . 0 1 

−1 1 . . . 0 1 

. 

. 

. .. 

. .. 

. .. 

−1 −1 . . . 1 1 

−1 −1 . . . −1 1 

Demonstraţi că în algoritmul GPP nu se efectuează nici o permutare şi că γ = 2 n−1 . 

P 2.25 Fie A ∈ R n×n şi x ∈ R n . Demonstraţi inegalitatea cond(A,x) ≤ κ ∞(A) (relaţia 

(2.58)). 

3 

. 

7 

5


P 2.26 Se dă A ∈ R n×n . Să se găsească matricele diagonale D 1 şi D 2 astfel încât fiecare 

linie şi coloană din D 1AD 2 să aibă norma ∞ egală cu 1. (Impunându-se restricţia ca 

elementele matricelor D 1 şi D 2 să fie puteri ale bazei de numeraţie β, să se construiască 

D 1 şi D 2 astfel încât liniile şi coloanele lui D 1AD 2 să aibă norma ∞ cuprinsă în intervalul 

[1/β, 1].) 

» – A 0 

P 2.27 Fie B = , cu A,R ∈ R n×n , nesingulare, R superior triunghiulară. Se 

R A 

presupune că factorizarea LU a lui A există şi este cunoscută (A = LU). 

a. Scrieţi un algoritm pentru calculul factorizării LU a lui B, B = ˜LŨ. 

b. Propuneţi un algoritm pentru rezolvarea sistemului liniar Bx = d, în care d ∈ R 2n . 

Calculaţi numărul de operaţii pentru ambii algoritmi. 

P 2.28 Fie A ∈ R 2n×2n » o matrice– 

nesingulară cu toate submatricele lider principale nesingulare, 

de forma A = , cu A 

A1 A 2 

A 3 A 1, A 2, A 3, A 4 ∈ R n×n şi A 3 superior triunghiulară. 

4 

a. Scrieţi un algoritm pentru rezolvarea sistemului liniar Ax = b, cu b ∈ R 2n . 

b. Aceeaşi problemă, dar presupunând doar că A este nesingulară. 

P 2.29 Fie A ∈ R n×n o matrice nesingulară tridiagonală (a ij = 0, pentru i > j + 1 sau 

i < j − 1). 

a. Adaptaţi algoritmul de eliminare gaussiană la acest tip de matrice. 

b. Prezentaţi un algoritm care rezolvă sistemul Ax = b, cu b ∈ R n . 

c. Dacă matricea A este simetrică şi pozitiv definită, adaptaţi algoritmul de factorizare 

Cholesky pentru A. 

P 2.30 Detaliaţi o procedură de calcul al matricei F = CE −1 din (2.62), pentru cazul 

s = 2, utilizând eliminarea gaussiană cu pivotare parţială. 

P 2.31 Demonstraţi relaţia (2.65) (care mărgineşte creşterea elementelor matricei simetrice 

A în timpul execuţiei algoritmul FCD, de factorizare cvasi-diagonală cu pivotare 

completă). 

P 2.32 Detaliaţi permutările efectuate în algoritmul de factorizare cvasi-diagonală cu pivotare 

completă (schema FCDPC 1), operând numai în triunghiul inferior al matricei simetrice 

date. 

P 2.33 Scrieţi un algoritm de calcul al factorului Cholesky L al unei matrice A ∈ R n×n 

pozitiv definite, în care elementele lui L să fie calculate prin operaţii Saxpy (şi nu DOT, 

ca în algoritmul CHOL). Indicaţie: algoritmul este asemănător eliminării gaussiene. 

P 2.34 Scrieţi o variantă la nivel de bloc a algoritmului de factorizare Cholesky a unei 

matrice simetrice pozitiv definite. 

P 2.35 Fie A ∈ R n×n o matrice nesingulară inferior bidiagonală, şi T = AA T . Prezentaţi 

un algoritm eficient pentru calculul factorizării Cholesky a matricei T (demonstraţi întâi 

că T este simetrică şi pozitiv definită). 

P 2.36 Adaptaţi algoritmul CHOL pentru factorizarea matricelor simetrice pozitiv definite 

bandă de lăţime r. 

P 2.37 Dacă matricea A ∈ R n×n este simetrică şi pozitiv definită, propuneţi un algoritm 

pentru factorizarea Cholesky A = RR T , unde R este superior triunghiulară şi are 

elementele diagonale pozitive. 

P 2.38 Fie A ∈ R n×n o matrice simetrică şi pozitiv definită. Scrieţi un algoritm de calcul 

al factorizării A = LDL T , cu L inferior triunghiulară unitate şi D diagonală. (A = LDL T 

mai este numită factorizare Cholesky ”fără radical”.)

Capitolul 3 

Problema celor mai mici 

pătrate 

În acest capitol vom prezenta principalele metode numerice de rezolvare a sistemelor 

de ecuaţii liniare 

Ax = b, (3.1) 

în care matricea A ∈ R m×n şi vectorul b ∈ R m sunt date, iar m ≠ n, adică 

numărul ecuaţiilor este diferit de cel al necunoscutelor. Întrucât, de regulă, un 

sistem supradeterminat (cu m > n) nu are soluţii, iar un sistem subdeterminat (cu 

m < n) nu are soluţie unică, pentru a asigura buna formulare a problemei de calcul, 

în prima situaţie trebuie să redefinim, iar în a doua trebuie să precizăm noţiunea 

de ”soluţie” a sistemului (3.1). 

În cazul m > n, o reformulare naturală a problemei (3.1) constă în a cere determinarea 

unei soluţii aproximative a sistemului (3.1), adică a unui vector 

x ∗ ∈ R n astfel încât reziduul corespunzător r ∗ = b − Ax ∗ să fie, într-un anumit 

sens, cât mai mic. (Altfel spus, vectorul b trebuie să fie aproximat cât mai bine 

printr-o combinaţie liniară a coloanelor lui A.) Într-o exprimare mai precisă, aceasta 

înseamnă că x ∗ trebuie să minimizeze funcţia 

ρ(x) = ν(b − Ax), (3.2) 

unde ν(·) este o normă pe R m , aleasă în mod adecvat. 

În cazul m < n, un criteriu natural de selecţie a unei singure soluţii x ∗ ∈ R n a 

sistemului (3.1) impune ca aceasta să fie, într-un anumit sens, cât mai ”economică”, 

de exemplu să aibă o ”lungime”, adică o normă, cât mai mică. Altfel spus, x ∗ trebuie 

să minimizeze funcţia 

φ(x) = µ(x)| Ax=b , (3.3) 

unde µ(·) este o normă pe R n 1 . 

1 Notaţia din (3.3) spune că φ este restricţia normei µ pe mulţimea X a soluţiilor sistemului 

(3.1). Desigur, pentru ca problema minimizării funcţiei φ să aibă sens, este necesar să presupunem 

că sistemul liniar (3.1) are cel puţin o soluţie, i.e. b ∈ ImA.

124 CAPITOLUL 3. PROBLEMA CELOR MAI MICI PĂTRATE 

Subliniem din start că alegerea normelor din (3.2) şi (3.3) depinde de natura 

problemei considerate şi, în acelaşi timp, determină specificul metodelor de calcul 

utilizate pentru rezolvarea ei. (De exemplu, în cazul normelor ‖ · ‖ 1 sau ‖ · ‖ ∞ 

se obţin probleme de programare liniară, care se rezolvă prin metodele expuse în 

capitolul 2, vezi [X]). 

În acest capitol vom considera că normele ν şi µ coincid cu norma euclidiană 

‖ · ‖ = ‖ · ‖ 2 , iar terminologia utilizată va fi următoarea. 

1. 

2. 

În cazul m ≥ n problema de minimizare 

‖b − Ax ∗ ‖ = min ‖b − Ax‖ (3.4) 

x∈Rn a normei euclidiene a reziduului r = b − Ax se numeşte problema (liniară) a 

celor mai mici patrate (CMMP), iar soluţia ei x ∗ este, prin definiţie, pseudosoluţia 

sistemului (3.1) în sensul CMMP. Vectorul b ∗ = Ax ∗ constituie cea 

mai bună aproximare a lui b printr-o combinaţie liniară a coloanelor matricei 

A, i.e. pe ImA, iar reziduul de normă minimă r ∗ = b −Ax ∗ reprezintă eroarea 

de aproximare optimală. 

În cazul m ≤ n soluţia problemei de minimizare cu restricţii liniare 

‖x ∗ ‖ = min ‖x‖ (3.5) 

Ax=b 

este, prin definiţie, soluţia normală în sensul CMMP (i.e. soluţia de normă 

euclidiană minimă) a sistemului (3.1). 

Problemele de tip CMMP enunţate mai sus apar sub diverse forme (inclusiv cu 

date complexe) în multe aplicaţii care, de exemplu, vizează aproximarea funcţiilor, 

prelucrarea statistică a datelor experimentale, modelarea şi identificarea sistemelor 

dinamice, prelucrarea semnalelor etc. 

Exemplul 3.1 Considerăm un proces descris printr-o dependenţă funcţională 

y = f 0 (u), cunoscută doar parţial din date experimentale constând într-o mulţime 

de perechi intrare-ieşire (u i , y i ), unde y i = f 0 (u i ), i = 1 : m. 

Se pune problema găsirii unei expresii analitice aproximative f pentru funcţia 

f 0 , sub forma unei combinaţii liniare cu coeficienţii c 1 , c 2 , . . . , c n a n funcţii date 

g 1 , g 2 , . . . , g n , i.e. 

n∑ 

f(u) = c j g j (u), 

j=1 

astfel încât erorile de aproximare (sau reziduurile) 

r i = y i − f(u i ), i = 1 : m, 

evaluate în punctele date (u i , y i ), să fie cât mai mici. 

În cazul tipic m > n, formularea în sens CMMP a problemei de aproximare 

considerate mai sus constă în determinarea coeficienţilor c j , j = 1 : n, astfel încât 

eroarea medie pătratică 

⎛ 

⎞2 

m∑ m∑ n∑ 

‖r‖ 2 = ri 2 = ⎝y i − c j g j (u i ) ⎠ 

(3.6) 

i=1 

i=1 

j=1

3.1. 

TRANSFORMĂRI ORTOGONALE 125 

să fie minimă. 

Introducând matricea A ∈ R m×n cu elementele a ij = g j (u i ), i = 1 : m, 

j = 1 : n, precum şi vectorii b = [ y 1 y 2 . . . y m ] T ∈ R m şi x = [ c 1 c 2 . . . c n ] T ∈ R n , 

problema minimizării lui (3.6) se scrie evident sub forma sintetică (3.4). ♦ 

Exemplul 3.2 În problemele de identificare şi estimare a parametrilor, relaţiile 

din exemplul anterior apar scrise sub forma 

y i = 

n∑ 

c j g j (u i ) + r i , i = 1 : m, 

j=1 

în care acum reziduurile r i reprezintă erori (sau zgomote) de măsură şi, în consecinţă, 

au o descriere statistică. Se poate arăta că, în anumite condiţii standard, estimările 

optimale ale parametrilor x = [c 1 . . . c n ] T sunt soluţii ale problemei CMMP (3.6) 

cu exact aceleaşi date A, b ca mai sus. În general, probleme de modelare sistemică 

extrem de complicate admit o dublă interpretare, ca probleme de aproximare sau de 

estimare, şi în consecinţă se tratează în spiritul principiului CMMP. Pentru detalii 

şi aplicaţii specifice, cititorul poate consulta [, ]. 

♦ 

Teoria problemelor CMMP este intim legată de geometria spaţiului euclidian 

R m , în special de noţiunea de ortogonalitate, care – după cum vom vedea mai departe 

– dă un sens (geometric) clar şi extrem de intuitiv problemelor de minimizare 

formulate mai sus. În mod corespunzător, practica numerică actuală recomandă 

rezolvarea acestor probleme prin metode directe de triangularizare a matricei A, 

bazate pe utilizarea transformărilor ortogonale 2 . 

De aceea, în primele secţiuni ale acestui capitol, vom introduce transformările 

ortogonale utilizate în calcule şi vom descrie procedurile corespunzătoare de triangularizare 

ortogonală. Pe această bază, în continuare vom prezenta procedurile de 

rezolvare a problemelor CMMP de tip (3.4) şi (3.5), insistând totodată asupra unor 

aspecte practice importante privind condiţionarea problemelor considerate precum 

şi stabilitatea numerică a algoritmilor de calcul propuşi. 

3.1 Transformări ortogonale 

În această secţiune vom defini cele două tipuri de transformări ortogonale utilizate 

în calculul numeric şi vom descrie proprietăţile lor importante. 

3.1.1 Reflectori 

Considerăm spaţiul R m cu produsul scalar (x, y) = y T x şi notăm cu ‖x‖ = (x T x) 1/2 

norma euclidiană indusă. Amintim că o matrice U ∈ R m×m se numeşte ortogonală 

dacă U T U = I m . 

2 Aici este esenţial faptul că norma euclidiană considerată în (3.4) şi (3.5) este invariantă în 

raport cu grupul transformărilor ortogonale. În legătură cu aceste noţiuni, cititorul este invitat să 

consulte capitolul 1.


Definiţia 3.1 Fie u ∈ R m un vector normat, i.e. ‖u‖ = 1. O matrice U ∈ R m×m 

de forma 

U = I m − 2uu T (3.7) 

se numeşte reflector elementar de ordinul m sau transformare Householder 3 . 

Se constată imediat că orice reflector elementar U este o matrice simetrică şi 

ortogonală. Într-adevăr, produsul exterior uuT este evident o matrice simetrică, iar 

în virtutea condiţiei de normare, ‖u‖ 2 = u T u = 1, avem 

U T U = U 2 = ( I m − 2uu T) ( I m − 2uu T) = I m − 4uu T + 4u(u T u)u T = I m . 

Aşadar, un reflector elementar este o transformare involutivă, i.e. coincide cu propria 

sa inversă. 

În cele ce urmează vom fixa un întreg k ∈ 1 : m −1 şi vom considera că vectorul 

u ≠ 0 din (3.7), nu neapărat normat, are primele k −1 componente nule, i.e. u i = 0, 

i = 1 : k − 1. Pentru precizare, în acest caz vom scrie 


U k = I m − uuT 

β , 

β def 

= 1 2 ‖u‖2 (3.8) 

u = [ 0 . . . 0 u k . . . u m ] T (3.9) 

şi vom spune că U k este un reflector de ordin m şi indice k. Vectorul u se numeşte 

vector Householder, iar β este factorul de normare corespunzător. (Uneori, în loc de 

β se utilizează scalarul τ = β −1 . Vom reveni asupra acestei chestiuni în secţiunea 

următoare.) Observăm că datorită zerourilor din (3.9) matricea U k are structura 

[ ] 

Ik−1 0 

U k = , (3.10) 

0 Ũ 1 

în care Ũ1 este evident un reflector de ordin m − k + 1 şi indice 1. 

Reflectorii U k cu structura precizată mai sus au două proprietăţi importante 4 . 

AA. Fiind daţi un reflector U k şi un vector x ∈ R m , aplicarea transformării 

U k , i.e. calculul vectorului transformat y = U k x, se face simplu, observând că 

unde, evident 

U k x = (I m − uuT 

β )x = x − u(uT x) 

= x − νu, (3.11) 

β 

ν = uT x 

β . (3.12) 

Relaţia (3.11) scrisă pe componente (unde amintim că u i = 0, i = 1 : k − 1) 

arată că premultiplicarea cu U k nu modifică primele k −1 componente ale lui x. De 

aceea, transformarea y = U k x se efectuează avantajos pe loc în x, conform schemei 

x ← y = U k x. Considerând că reflectorul U k este definit de vectorul u ∈ R m precum 

şi de scalarul β, procedura de calcul este următoarea. 

3 Transformările de tip (3.7) au fost introduse în calculul numeric de A. Householder în 1958. 

De regulă, mai departe vom omite calificativul ”elementar”. 

4 La fel ca în capitolul 1, sigla AA indică expunerea unor aspecte algoritmice semnificative.

3.1. 


✛ 

−νu 

U k x 

❍❍❨ 

✟✯ x 

❍ 

❍ 

❍ 

❍ 

❍ 

❍ 

❍ 

❍ 

❍ 

❍✟ ✟✟✟✟✟✟✟✟✟✟ ✲ 

✲ 

0 u (u T x)u 

H 

Fig. 3.1: Efectul aplicării unui reflector U asupra unui vector x, în R 2 

Algoritmul 3.1 (Se dau un reflector U k şi un vector x ∈ R m . Se 

aplică transformarea x ← U k x). 

1. ν = ( ∑ m 

i=k u ix i )/β. 

2. x i ← x i − νu i , pentru i = k : m 

Comentarii. În esenţă, la pasul 1 se calculează un produs scalar (de exemplu, 

utilizând funcţia DOT), iar la pasul 2 se face o actualizare de tip Saxpy a lui x 

(funcţiile DOT şi Saxpy au fost definite în capitolul 1). De fiecare dată se operează 

asupra unor vectori de dimensiune m − k + 1. Prin urmare, numărul de operaţii 

necesar este aproximativ N op = 4(m − k). 

♦ 

Semnificaţia geometrică a transformării (3.11) rezultă din figura 3.1, unde pentru 

claritate am considerat m = 2 şi ‖u‖ = 1, deci ν = 2u T x (vezi (3.12)), iar (u T x)u 

este proiecţia ortogonală a lui x pe direcţia lui u. În general, transformarea U k 

reprezintă simetria (”reflexia”) în raport cu hiperplanul H (”oglinda”) care trece 

prin origine şi are vectorul normal u. 

În practică, algoritmul 3.1 apare extrem de frecvent. 

• Aplicarea transformării B = U k A, unde A ∈ R m×n este o matrice cu n coloane, 

iar U k acţionează la stânga, se face partiţionând A pe coloane. Avem 

A = [a 1 a 2 . . . a n ] ⇒ U k A = [U k a 1 U k a 2 . . . U k a n ], 

deci calculul se poate desfăşura pe loc în tabloul A, utilizând algoritmul 3.1 pentru 

actualizarea fiecărei coloane a matricei A. 

% Se aplică transformarea A ← U k A 


1. a j ← U k a j 

Conform celor spuse mai sus, premultiplicarea cu U k nu modifică primele k − 1 

linii ale matricei A. Mai precis, partiţionând A conform cu U k din (3.10), avem 

[ ] [ ] 

B B 

A = ⇒ U 

C 

k A = . 

Ũ 1 C


Pe de altă parte, în formă compactă, similară cu (3.11), avem evident 

U k A = (I m − uuT 

β )A = A − uvT , unde v = AT u 

β . 

Altfel spus, matricea transformată B = U k A este o modificare de rang 1 a lui A. 

• Aplicarea transformării C = AU k , unde acum A ∈ R l×m are m coloane, 

iar U k acţionează la dreapta, se face partiţionând A pe linii şi observând că, în 

virtutea simetriei lui U k , avem AU k = (U k A T ) T . Prin urmare, asupra coloanelor 

lui A T , adică a liniilor lui A, are loc aceeaşi transformare ca mai sus. În particular, 

postmultiplicarea cu U k nu modifică primele k − 1 coloane ale matricei A. 

AA. În calculul numeric generarea reflectorilor se face în scopul introducerii 

de zerouri într-un vector. Pe scurt, fiind dat un vector x ∈ R m , putem determina 

un reflector U k de forma (3.8) astfel încât ultimele m −k componente ale vectorului 

transformat să fie nule, i.e. (U k x) i = 0, pentru i = k + 1 : m. Formularea precisă a 

acestui fapt esenţial trebuie reţinută. 

Propoziţia 3.1 Fixăm un întreg k ∈ 1 : m − 1 şi fie x ∈ R m un vector astfel încât 

σ 2 def 

= 

Vectorul Householder u ∈ R m având componentele 

{ 0, pentru i = 1 : k − 1 

u i = x k + σ, pentru i = k 

x i , pentru i = k + 1 : m 

precum şi scalarul 

m∑ 

x 2 i ≠ 0. (3.13) 

i=k 

(3.14) 

β def 

= 1 2 ‖u‖2 = σu k (3.15) 

definesc un reflector U k de ordin m şi indice k astfel încât 

{ xi , pentru i = 1 : k − 1 

(U k x) i = −σ, pentru i = k 

0, pentru i = k + 1 : m. 

(3.16) 

Demonstraţie. Într-adevăr, datorită alegerii (3.14), avem 

( 

) 

β = 1 m∑ 

u 2 i 

2 

= 1 m∑ 

(x k + σ) 2 + x 2 i = σ 2 + x k σ = σu k , 

2 

i=k 

i=k+1 

deci (3.15) are loc. Mai departe, din (3.12) rezultă 

ν = 

∑ m 

i=1 u ix i 

β 

= x k(x k + σ) + ∑ m 

i=k+1 x2 i 

β 

= σ2 + x k σ 

β 

= 1. 

În virtutea acestui fapt, (3.16) rezultă imediat din (3.11) şi (3.14). 

♦

3.1. 


Relaţiile (3.13)–(3.15) furnizează un algoritm aproape complet pentru calculul 

reflectorului U k cu proprietatea cerută. Constanta σ este determinată, mai puţin 

semnul, de faptul că U k este o matrice ortogonală, deci ‖U k x‖ = ‖x‖ (vezi (3.13) şi 

(3.16)). Pentru a evita pierderea de cifre semnificative la calculul componentei 

u k = x k + σ, semnul lui σ se alege acelaşi cu cel al lui x k . (Menţionăm că 

această alegere este esenţială pentru stabilitatea numerică a algoritmului rezultat.) 

Consideraţiile de mai sus pot fi rezumate astfel. 

Algoritmul 3.2 (Se dau un întreg k ∈ 1 : m − 1 şi un vector 

x ∈ R m cu proprietatea (3.13). Se determină un reflector U k astfel 

încât (U k x) i = 0, pentru i = k + 1 : m.) 

) 1/2 

i=k x2 i 

1. σ = sgn(x k ) · (∑ m 

2. u k = σ + x k ; u i = x i , pentru i = k + 1 : m 

3. β = σu k 

% Vectorul transformat 

4. x k = −σ; x i = 0, pentru i = k + 1 : m 

Comentarii. Subliniem încă o dată că reflectorul U k nu se formează niciodată 

ca matrice, ci este complet definit numai prin intermediul vectorului u (ale cărui 

prime k − 1 componente sunt nule) precum şi al scalarului β. Ultimele componente 

u i , i = k + 1 : m, ale lui u se memorează natural pe poziţiile elementelor anulate 

din x, după aplicarea transformării (vezi paşii 2 şi 4). Componenta u k şi scalarul 

β se memorează separat. Numărul de operaţii necesar este N op ≈ 2(m − k) (plus o 

extragere de radical), vezi pasul 1. 

♦ 

Implementarea 5 algoritmului 3.2 ţine seama de următoarele considerente specifice. 

1 ◦ . Pentru a evita eventualele depăşiri în virgulă mobilă, posibile dacă elementele 

x i , i = k : m, au valori absolute foarte mari sau foarte mici, calculul normei 

euclidiene de la pasul 1 se asociază cu scalarea vectorului corespunzător, e.g. prin 

raportare la M = max i=k:m |x i |. (Pentru indicaţii mai precise, vezi secţiunea 3.1.2.) 

2 ◦ . Dacă în situaţia de la punctul 1 ◦ rezultă M = 0 sau σ = 0, i.e. toate 

componentele x i , i = k : m, ale vectorului dat x sunt deja nule, atunci convenim 

să considerăm U k = I m şi să semnalăm această situaţie punând β = 0. (Matricea 

unitate I m este ortogonală şi poate fi asimilată cu un reflector ”impropriu”). Aceeaşi 

convenţie se adoptă dacă algoritmul 3.2 este apelat pentru k = m. 

3 ◦ . Deoarece vectorul Householder u este esenţial determinat numai ca direcţie, 

la pasul 2 se poate face scalarea acestuia, e.g. luând 

2 ′ . u k = 1 + x k 

σ ; u i = x i 

σ , i = k + 1 : m. 

Se vede uşor că în acest caz rezultă β = u k , deci organizarea procedurală a calculelor 

se simplifică, în particular se memorează separat un singur număr 6 . (Creşterea 

numărului de operaţii este fără importanţă.) Rezumând cele de mai sus, obţinem 

5 Convenim j ca funcţia sgn : R → R utilizată în algoritmii ce urmează este definită de 

−1, dacă x < 0 

sgn(x) = 

. Atragem atenţia că utilizarea unor funcţii sgn predefinite în diverse 

limbaje de nivel înalt (pentru care de regulă sgn(0) = 0) poate conduce la rezultate eronate. 

6 Alternativ, u poate fi scalat astfel încât u k = 1. Această posibilitate va fi discutată 

1, dacă x ≥ 0 

mai 

departe.


% Forma implementabilă a algoritmului 3.2. 

1. β = 0 

2. Dacă k < m 

1. σ = (∑ m 

) 1/2 

i=k x2 i 

2. Dacă σ ≠ 0 

1. σ ← sgn(x k )σ 

2. x i ← u i = x i /σ, pentru i = k : m 

3. β ← u k = 1 + x k 

% Componenta k a vectorului transformat 

4. x k = −σ 

Pe scurt, la pasul 2.1 are loc calculul normei, căreia mai departe i se atribuie 

semnul corespunzător, iar la pasul 2.2.2 are loc scalarea vectorului Householder u. 

Componentele u i , i = k + 1 : m, care constituie partea esenţială a vectorului u, se 

memorează pe poziţiile corespunzătoare din x. În final, se calculează şi se memorează 

separat scalarul β = u k , iar componenta de indice k a vectorului transformat 

este returnată pe poziţia corespunzătoare x k , vezi (3.16). 

Observaţia 3.1 În unele aplicaţii apar reflectori modificaţi U k, de forma (3.8), în 

care, spre deosebire de (3.9), vectorul Householder u are ultimele k − 1 componente 

nule, i.e. 

u = [ u 1 . . . u m−k+1 0 . . . 0 ] T . (3.17) 

În consecinţă, matricea U k are acum structura 

[ ] 

Ũ1 0 

U k = , (3.18) 

0 I k−1 

deci, în procesul de aplicare a transformării x ← U k x, premultiplicarea cu U k 

nu modifică ultimele k − 1 componente ale lui x. De asemenea, este clar că prin 

alegerea adecvată a vectorului Householder u, putem genera un reflector modificat 

U k astfel încât primele m −k componente ale vectorului transformat să fie nule, i.e. 

(U k x) i = 0, i = 1 : m − k. Scrierea algoritmilor de transformare şi generare a 

reflectorilor modificaţi, perfect similari cu algoritmii 3.1 şi 3.2 stabiliţi anterior, este 

propusă ca exerciţiu. 

♦ 

Proceduri de calcul cu reflectori 

În problemele de calcul numeric relativ simple, algoritmii 3.1 şi 3.2 (ultimul, sub 

forma sa implementabilă) pot fi utilizaţi ca atare. În practica profesională, calculele 

se organizează procedural, exploatând faptul că algoritmii menţionaţi sunt 

vectorizaţi în mod natural. 

Pentru început, observăm că, în acord cu (3.10), partea ”activă” a unui reflector 

U k de indice k este întotdeauna un reflector de indice 1 care acţionează asupra unui 

vector de dimensiune adecvată. De aceea, în continuare vom considera k = 1. 

AA. Fie x ∈ R m un vector dat. Generarea unui reflector U 1 astfel încât (U 1 x) i = 

0, i = 2 : m, adică 

U 1 x = −σe 1 , (3.19) 

se face utilizând forma implementabilă a algoritmului 3.2 în care punem k = 1.

3.1. 


⎡ 

⎢ 

⎣ 

⎤ 

x 1 

x 2 

⎥ 

. ⎦ 

x m 

U 1 

−→ 

⎡ 

⎢ 

⎣ 

⎤ 

−σ 

u 2 

⎥ 

. ⎦ 

u m 

⎡ 

⎢ 

⎣ 

x 1 

. 

x k−1 

x k 

x k+1 

. 

x m 

⎤ 

⎥ 

⎦ 

U k 

−→ 

⎡ 

⎢ 

⎣ 

x 1 

. 

x k−1 

−σ 

u k+1 

. 

u m 

⎤ 

⎥ 

⎦ 

Fig. 3.2: Efectul aplicării procedurii RFG asupra vectorului x ∈ R m ; în stânga, 

β = RFG(x); în dreapta, β = RFG(x(k : m)) 

RFG 

% Se dă x ∈ R m . Se generează un reflector U 1 cu proprietatea 

(3.19) şi se aplică transformarea. Partea esenţială u i , 

i = 2 : m, a vectorului Householder u se memorează pe 

poziţiile corespunzătoare din x. La aplicarea ulterioară a 

transformării se consideră u 1 = β. 

1. β = 0 

2. Dacă m > 1 atunci 

1. σ = ‖x‖ % NRM2 

2. Dacă σ ≠ 0 atunci 

1. Dacă x 1 ≠ 0 atunci σ ← sgn(x 1 )σ 

2. x i ← u i = x i /σ, pentru i = 1 : m % SCAL 

3. β ← u 1 = 1 + x 1 

4. x 1 ← −σ 

Comentarii. La pasul 2.1 nu am explicitat modul de calcul al normei euclidiene 

pentru a aminti necesitatea scalării lui x. La pasul 2.2.2 are loc scalarea lui u, specifică 

procedurii RFG. Având în vedere considerente de eficienţă, la paşii menţionaţi 

se recomandă utilizarea procedurilor NRM2 şi SCAL din BLAS. Observăm că dacă 

vectorul dat x este nul sau are o singură componentă, atunci algoritmul returnează 

β = 0, ceea ce, conform convenţiei adoptate anterior, înseamnă că U 1 = I m . 

Modul de apel al procedurii de generare (evidenţiind argumentele de intrare şi 

ieşire) este [u, β, x] = RFG(x). Pentru a sublinia că, după cum am spus, partea 

esenţială u i , i = 2 : m, a vectorului Householder este returnată în x, mai departe 

vom nota 

β = RFG(x), 

în care x apare ca tablou de intrare/ieşire. În consecinţă, execuţia instrucţiunilor 

β = RFG(x), respectiv β = RFG(x(k : m)), are efectul indicat în figura 3.2. ♦ 

AA. Fie acum U 1 un reflector dat, generat de RFG, iar x ∈ R m un vector 

arbitrar. Aplicarea transformării 

x ← U 1 x (3.20)


Transformare Funcţie Mod de apel Apel ”rapid” Obs. 

Reflector 

U 

def 1 x = −σe 1 [u, β, x] = RFG(x) β = RFG(x) 

U 1 = (u, β) 

u 1 = β 

x ∈ R m x ← U 1 x x = RF(u, β, x) RF(u, β, x) 

Reflector 

modificat U 1 x = −σe m [u, β, x] = mRFG(x) β = mRFG(x) 

def 

u m = β 

U 1 = (u, β) x ← U 1 x x = mRF(u, β, x) mRF(u, β, x) 

x ∈ R m 

Tabelul 3.1: Proceduri de calcul cu reflectori 

se face având în vedere algoritmul 3.1 precum şi convenţia specifică de memorare 

a vectorului Householder u. Notând α = −ν şi ţinând seama că u 1 = β, vectorul 

transformat poate fi calculat efectuând numai adunări şi înmulţiri. 

RF 

% Se dau un reflector U 1 generat de RFG şi un vector 

x ∈ R m . Se aplică transformarea x ← U 1 x. 

1. Dacă β ≠ 0 atunci 

1. t = u 1 

2. u 1 = β 

3. α = −( ∑ m 

i=1 u ix i )/β % DOT 

4. x i ← x i + αu i , pentru i = 1 : m % SAXPY 

5. u 1 = t 

Comentarii. Deoarece β = 0 semnalează că U 1 = I m , transformarea se aplică 

efectiv numai dacă β ≠ 0. Prima componentă u 1 a lui u nu este alterată, deoarece 

ea conţine informaţii despre vectorul transformat în procesul de generare a reflectorului. 

Modul de apel al procedurii este x = RF(u, β, x). Deoarece transformarea se 

efectuează întotdeauna pe loc în x, vom scrie simplu RF(u, β, x). ♦ 

Procedurile de calcul cu reflectori modificaţi se scriu similar. De exemplu, generarea 

unui reflector (modificat) U 1 astfel încât (U 1 x) i = 0, i = 1 : m − 1, adică 

U 1 x = −σe m , 

se face înlocuind pur şi simplu x 1 cu x m în RFG. (Desigur, acum partea esenţială 

a vectorului Householder u este u i , i = 1 : m − 1, iar u m = β.) Scrierea detaliată 

a procedurilor de generare şi aplicare a reflectorilor modificaţi, notate mai departe 

mRFG şi respectiv mRF, este propusă cititorului ca exerciţiu. 

Procedurile de calcul cu reflectori sunt prezentate sintetic în tabelul 3.1. 

Subliniem că, în general, procedurile de generare şi aplicare a reflectorilor apar 

în perechi, modificarea convenţiei de memorare a vectorului Householder din RFG 

antrenând după sine o modificare corespunzătoare în RF. 

Ilustrăm utilizarea procedurilor prin două exemple simple, dar extrem de importante 

pentru întreaga expunere ulterioară.

3.1. 


Exemplul 3.3 Se dă o matrice A ∈ R m×n . Vom determina un reflector 

U 1 ∈ R m×m astfel încât elementele subdiagonale din prima coloană a matricei 

B = U 1 A să fie nule; apoi, vom calcula matricea transformată A ← B = U 1 A. 

Deoarece transformarea se aplică la stânga, partiţionăm A pe coloane. Notând 

a j = A(:, j), j = 1 : n, trebuie să avem U 1 a 1 = −σe 1 , deci U 1 se determină aplicând 

procedura RFG primei coloane a 1 a matricei A. Totodată are loc şi transformarea 

acestei coloane, i.e. scalarul −σ este returnat pe prima poziţie a 11 . În continuare 

transformarea celorlalte coloane a j , j = 2 : n, se face aplicând repetat procedura 

RF. Prin urmare, rezultatul dorit se obţine pe loc în A utilizând algoritmul 

QR 1 1. β = RFG(A(:, 1)) 


1. RF(A(:, 1), β, A(:, j)). 

Desigur, reflectorul U 1 obţinut la pasul 1 poate fi aplicat mai departe unei alte 

matrice, atâta timp cât partea esenţială A(2 : m, 1) a vectorului Householder u 

precum şi scalarul β sunt disponibili. De exemplu, dacă C ∈ R l×m , atunci transformarea 

la dreapta C ← CU 1 se efectuează partiţionând C pe linii, i.e. 

1. Pentru i = 1 : l 

1. RF(A(:, 1), β, C(i, :)). 

♦ 

Exemplul 3.4 Se dă o matrice A ∈ R m×n . Vom determina un reflector 

Z 1 ∈ R n×n astfel încât elementele nediagonale din prima linie a matricei B = AZ 1 

să fie nule; apoi vom calcula matricea transformată A ← B = AZ 1 . 

Deoarece transformarea se aplică la dreapta, partiţionăm A pe linii. Raţionând 

la fel ca mai sus, algoritmul de calcul este 

LQ 1 1. β = RFG(A(1, :)) 


1. RF(A(1, :), β, A(i, :)). 

Pentru a evidenţia avantajele organizării procedurale, propunem cititorului să 

scrie detaliat algoritmii de calcul stabiliţi mai sus, înlocuind apelurile la procedurile 

RFG şi RF cu secvenţele de instrucţiuni ”scalare” corespunzătoare. Având în 

vedere expunerea ulterioară, menţionăm că aceşti algoritmi efectuează prima etapă 

de triangularizare a matricei A prin transformări ortogonale la stânga şi respectiv 

la dreapta (vezi secţiunile 3.3 şi 3.6). 

3.1.2 Rotaţii 

După cum se ştie, în cazul m = 2 o rotaţie (plană) de unghi θ se reprezintă prin 

matricea 

[ ] 

cosθ − sinθ 

P = 

. (3.21) 

sinθ cosθ 

În cazul general m ≥ 2, vom adopta următoarea definiţie. 

♦


Definiţia 3.2 Fixăm doi întregi i ≠ k ∈ 1 : m. O matrice P ki ∈ R m×m de forma 

⎡ 

⎤ 

I k−1 c s 

P ki = 

⎢ I i−k−1 

⎥ 

⎣ −s c ⎦ , unde c2 + s 2 = 1 (3.22) 

I m−i 

se numeşte rotaţie de ordinul m în planul (k, i) sau transformare Givens 7 . 

Se constată imediat că orice rotaţie P ki este o matrice ortogonală. 

Rotaţiile P ki cu structura precizată mai sus au două proprietăţi importante. 

AA. Fiind date o rotaţie P ki şi un vector x ∈ R m , aplicarea transformării P ki , 

i.e. calculul vectorului transformat y = P ki x, se face extrem de simplu. Din (3.22) 

se vede că P ki modifică numai elementele lui x cu aceiaşi indici, deci calculele se 

desfăşoară avantajos pe loc în x, utilizând următoarea procedură. 

Algoritmul 3.3 (Se dau o rotaţie P ki şi un vector x ∈ R m . Se 

aplică transformarea x ← P ki x). 

1. t = x k 

2. x k = ct + sx i 

3. x i = cx i − st 

Numărul de operaţii necesar este N op = 6. 

Aplicarea transformării B = P ki A, unde A ∈ R m×n este o matrice cu n coloane, 

se face utilizând algoritmul 3.3 pentru actualizarea fiecărei coloane. 

% Se aplică transformarea A ← P ki A 


1. a j ← P ki a j 

Aplicarea transformării C = APki T se face similar, partiţionând A pe linii. 

În legatură cu algoritmul 3.3, este important să reţinem că, spre deosebire de 

reflectori, rotaţiile nu sunt matrice simetrice. Mai precis, transformarea x ← Pki Tx 

diferă de transformarea x ← P ki x, considerată mai sus, prin semnul scalarului s. 

AA. La fel ca în cazul reflectorilor, generarea rotaţiilor vizează introducerea de 

zerouri într-un vector. Mai precis, fiind dat un vector x ∈ R m , putem determina 

o rotaţie P ki astfel încât componenta i a vectorului transformat să fie nulă, i.e. 

(P ki x) i = 0. 

Propoziţia 3.2 Fixăm doi întregi i ≠ k ∈ 1 : m şi fie x ∈ R m un vector astfel 

încât 

r 2 def 

= x 2 k + x2 i ≠ 0. (3.23) 

7 Deşi cunoscute din secolul trecut şi utilizate de Jacobi, Rotaţiile au fost introduse în calculul 

numeric de W. Givens în 1954. Structura (3.22) corespunde cazului i > k, iar în (3.21) avem 

P = P 12 cu c = cos θ, s = −sin θ. Subliniem că, în accepţiunea noastră, o rotaţie este definită de 

două numere reale c, s, satisfăcând condiţia c 2 + s 2 = 1. Evident, în acest fel se evită utilizarea 

în calcule a funcţiilor trigonometrice.

3.1. 


Numerele reale 

c = x k 

r , s = x i 

r 

definesc o rotaţie P ki de ordin m în planul (k, i) astfel încât 

(P ki x) l = 

{ xl , pentru l ≠ k, i 

r, pentru l = k 

0, pentru l = i. 

(3.24) 

(3.25) 

Demonstraţia este imediată observând că avem 

[ ] [ ] [ 

c s xk r 

= 

−s c x i 0 

] 

, (3.26) 

precum şi c 2 + s 2 = 1. 

Precizând (deocamdată arbitrar) semnul lui r, relaţiile (3.23) şi (3.24) conduc 

la următorul algoritm de calcul al rotaţiei P ki cu proprietatea cerută. 

Algoritmul 3.4 (Se dau i ≠ k ∈ 1 : m şi un vector x ∈ R m . Se 

calculează o rotaţie P ki astfel încât (P ki x) i = 0). 

1. r = √ x 2 k + x2 i 

2. c = x k /r, s = x i /r 

% vectorul transformat 

3. x k = r; x i = 0 

Numărul de operaţii necesar este N op = 6. 

Semnificaţia geometrică a rotaţiei P ki calculate de algoritmul 3.4 apare în figura 

3.3, unde m = 2, k = 1, i = 2. 

Implementarea algoritmului 3.4 ţine seama de următoarele considerente. 

1 ◦ . La pasul 1 se recomandă scalarea componentelor x k şi x i , de exemplu prin 

împărţire la N = |x k | + |x i |. 

2 ◦ . Dacă N = 0 sau r = 0, i.e. ambele componente x k şi x i sunt deja nule, 

atunci se ia P ki = I m , punând c = 1, s = 0. 

3 ◦ . Semnul lui r se alege astfel încât r şi cel mai mare (în valoare absolută) 

dintre cele două numere x k şi x i să aibă acelaşi semn. 

Această convenţie, adoptată în BLAS, nu este importantă în sine, dar are avantajul 

de a permite reconstrucţia numeric stabilă a parametrilor c, s, dintr-un singur 

număr z. (Desigur, în acest fel devine posibilă memorarea rotaţiei P ki pe poziţia 

elementului x i anulat prin aplicarea transformării la pasul 3). Precizările necesare 

vor fi făcute mai departe. 

Observaţia 3.2 Reţinem că, deşi rotaţiile sunt transformări considerabil mai 

simple decât reflectorii, ele sunt în acelaşi timp şi mai puţin eficiente decât aceştia, 

întrucât o rotaţie permite anularea unei singure componente a vectorului transformat. 

(Tocmai de aceea rotaţiile se utilizează mai ales în probleme cu date structurate, 

asupra cărora ele au un efect de ”rezoluţie fină” a zerourilor.) 

În caz de nevoie, un efect similar cu al reflectorului U k determinat de algoritmul 

3.2 poate fi obţinut utilizând o secvenţă de rotaţii, e.g. 

♦


2 

✻ 

x 2 

x 1 

r 

✚ ✚✚✚✚✚✚✚✚❃x 

✲ 

P 12 x 

Fig. 3.3: Efectul aplicării unei rotaţii P 12 asupra unui vector x ∈ R 2 

✲ 

1 

P k = P km . . . P k,k+2 P k,k+1 , (3.27) 

în care rotaţiile P ki se determină succesiv (aplicând algoritmul 3.4) pentru a anula 

componentele corespunzătoare x i , i = k + 1 : m. (Scrierea algoritmului de calcul 

este propusă ca exerciţiu.) Alternativ, în acelaşi scop poate fi utilizată secvenţa 

P k = P k,k+1 P k+1,k+2 . . . P m−1,m , (3.28) 

în care rotaţiile P ki anulează aceleaşi componente în ordine inversă, adică x i , 

i = m : −1 : k + 1. 

Menţionăm că în practică se utilizează frecvent secvenţe de rotaţii disjuncte care 

au proprietăţi numerice mai bune, vezi problemele 3.14 şi 3.22 8 . 

♦ 

Proceduri de calcul cu rotaţii 

În continuare dăm câteva indicaţii privind organizarea procedurală a calculelor cu 

rotaţii 9 . Deoarece partea activă a unei rotaţii P ki de forma (3.22) este evident o 

rotaţie plană ce acţionează asupra unui vector x ∈ R 2 , în continuare vom considera 

m = 2 şi vom nota P 12 = P. 

AA. Fie x ∈ R 2 un vector dat. Generarea unei rotaţii P astfel încât (Px) 2 = 0, 

adică [ ][ ] [ ] 

c s x1 r 

= , (3.29) 

−s c x 2 0 

se face ţinând seama de indicaţiile de implementare ce însoţesc algoritmul 3.4. 

ROTG 

% Se dă x ∈ R 2 . Se generează o rotaţie P cu proprietatea 

(3.29) şi se aplică transformarea. Totodată, pe poziţia elementului 

anulat x 2 se returnează scalarul z, pe baza căruia 

este posibilă reconstrucţia numeric stabilă a parametrilor 

c, s. 

1. r = ‖x‖ 

2. Dacă r = 0 atunci 

8 Două rotaţii P ki , P lj se numesc disjuncte dacă toţi indicii sunt diferiţi. 

9 Subliniem că, întrucât operează asupra unor vectori cu două componente, procedurile de calcul 

cu rotaţii sunt de tip scalar.

3.1. 


1. c = 1, s = 0 

altfel 

2. Dacă |x 2 | ≥ |x 1 | atunci 

1. r ← sgn(x 2 )r 

altfel 

2. r ← sgn(x 1 )r 

3. c = x 1 /r, s = x 2 /r 

4. x 1 = r 

% calculul lui z 

5. Dacă c = 0 atunci 

1. z = 1 

altfel dacă |x 2 | ≥ |x 1 | atunci 

2. z = 1/c 

altfel 

3. z = s 

6. x 2 = z 

Modul de apel al procedurii de generare este [c, s, x 1 , x 2 ] = ROTG(x 1 , x 2 ). 

AA. Fie acum P o rotaţie dată, generată de ROTG, iar x ∈ R 2 un vector 

arbitrar. Aplicarea transformării 

x ← Px (3.30) 

se face direct numai dacă parametrii c, s sunt disponibili ca atare; în caz contrar, în 

prealabil are loc reconstrucţia lor pe baza scalarului z, utilizând secvenţa următoare.



a ← r 

Rotaţie Px = re 1 [c, s, a, b] = ROTG(a, b) [c, s] = ROTG(a, b) 

b ← z 

= [(c, s) ] x ← Px 

a 

x = 

b 

x ← P T x 

P def 

[a, b] = ROT(c, s, a, b) 

[a, b] = ROT(c, −s, a, b) 

ROT(c, s, a, b) 

ROT(c, −s, a, b) 

Tabelul 3.2: Proceduri de calcul cu rotaţii. (N.B. Semnificaţia lui z este precizată 

în text) 

% Reconstrucţia perechii (c, s). 

1. Dacă z = 1 atunci 

1. c = 0, s = 1 

altfel dacă |z| > 1 atunci 

2. c = 1/z, s = √ 1 − c 2 

altfel 

3. s = z, c = √ 1 − s 2 

Procedura de transformare propriu-zisă coincide în esenţă cu algoritmul 3.3. 

ROT 

% Se aplică transformarea x ← Px. 

1. t = x 1 

2. x 1 ← ct + sx 2 

3. x 2 ← cx 2 − st 

Modul de apel al procedurii este [x 1 , x 2 ] = ROT(c, s, x 1 , x 2 ). 

Procedurile de calcul cu rotaţii sunt prezentate sintetic în tabelul 3.2. (Şi în 

cazul rotaţiilor, ca şi al reflectorilor, mai departe vom utiliza notaţiile procedurale 

prescurtate indicate în penultima coloană a tabelului.) 

3.2 Transformări unitare 

În această secţiune vom prezenta principalele transformări unitare utilizate în calculele 

cu matrice complexe. Având în vedere că proprietăţile structurale ale acestor 

transformări sunt aceleaşi cu proprietăţile similare ale transformărilor ortogonale 

descrise în secţiunea anterioară, expunerea va fi orientată în principal asupra aspectelor 

procedurale specifice. 

3.2.1 Reflectori complecşi 

Considerăm spaţiul complex C m cu produsul scalar (x, y) = y H x şi norma euclidiană 

m∑ 

‖x‖ = (x H x) 1/2 = ( |x i | 2 ) 1/2 . 

i=1

3.2. 

TRANSFORMĂRI UNITARE 139 

Im ✻ 

Γ 

✬✩ ✘✾ 

0 

τ = 1 

✫✪β = 2 

‖u‖ 2 Re 

✲ 

Fig. 3.4: Cercul Γ în planul complex 

Amintim că o matrice Q ∈ C m×m se numeşte unitară dacă Q H Q = I m . 

Fie u ∈ C m un vector Householder, u ≠ 0. Considerăm matrice complexe de 

forma 

not 

U 1 = Q H 1 = I m − uuH 

β , (3.31) 

respectiv 

Q 1 = I m − τuu H , (3.32) 

unde β şi τ sunt doi parametri legaţi prin relaţia τ = ¯β −1 . Avem 

Q H 1 Q 1 = (I m − ¯τuu H )(I m − τuu H ) = I m − (τ + ¯τ)uu H + |τ| 2 u(u H u)u H , 

deci matricea Q 1 este unitară dacă şi numai dacă 

2Reτ = |τ| 2 ‖u‖ 2 , (3.33) 

i.e. scalarul τ aparţine cercului Γ din planul complex care trece prin origine şi are 

raza egală cu 1/‖u‖ 2 (vezi figura 3.4). Pe de altă parte, matricea Q 1 este hermitică 

dacă şi numai dacă τ ∈ R. Asociind cele două proprietăţi, pentru τ = 0 obţinem 

Q 1 = I m , iar pentru 

τ = 1 β = 2 

‖u‖ 2, (3.34) 

din (3.31) sau (3.32) obţinem reflectorii hermitici care constituie generalizarea directă 

a reflectorilor reali din (3.8). 

Pentru toate celelalte valori τ ∈ Γ (τ ≠ 0 şi τ ≠ 2/‖u‖ 2 ), matricele de forma 

(3.32) sunt unitare şi de aceea se numesc (abuziv dar comod) reflectori complecşi. 

Subliniem că, în această accepţiune mai largă, reflectorii complecşi nu sunt hermitici, 

deci necesită o manipulare relativ mai atentă decât omologii lor reali (acum 

not 

U 1 = Q H 1 ≠ Q 1 !). 

AA. Fie x ∈ C m un vector dat. Vom determina un reflector Q 1 astfel încât 

(Q H 1 x) i = 0, i = 2 : m, i.e. 

Q H 1 x = −σe 1, (3.35) 

unde σ ∈ C este un scalar încă nedeterminat. Deoarece matricea Q 1 este unitară 

trebuie să avem ‖Q H 1 x‖ = ‖x‖, deci modulul lui σ este fixat, mai precis |σ| = ‖x‖. 

Din considerente de stabilitate numerică, vom alege 

σ = x 1 

‖x‖ (3.36) 

|x 1 |


sau 

(Reţinem că în primul caz σ ∈ C, iar în al doilea σ ∈ R.) 

În continuare scriem ca de obicei 


σ = sgn(Rex 1 )‖x‖. (3.37) 

Q H 1 x = (I m − uuH )x = x − νu, (3.38) 

β 

ν = uH x 

β . (3.39) 

Prin urmare, relaţia (3.35) are loc dacă şi numai dacă u = (x + σe 1 )/ν, sau pe 

componente 

u 1 = x 1 + σ 

ν 

De asemenea, trebuie să avem 

β = uH x 

ν 

; u i = x i 

, i = 2 : m. (3.40) 

ν 

= (xH + ¯σe T 1 )x 

|ν| 2 = ‖x‖2 + ¯σx 1 

|ν| 2 , 

unde, conform celor spuse mai sus, ‖x‖ 2 = |σ| 2 , deci 

β = ¯σ¯ν 

x 1 + σ 

. (3.41) 

ν 

Pentru a determina complet reflectorul U 1 cu proprietatea (3.35) rămâne să 

precizăm valoarea parametrului de scalare ν ≠ 0 din (3.40) şi (3.41). 

a) Dacă luăm ν = 1 şi alegem σ din (3.36) (sau din (3.37)), atunci obţinem 

analogul complex al algoritmului 3.1. 

b) Pe de altă parte, dacă dorim simplificarea relaţiei (3.41), atunci sunt posibile 

două alegeri, i.e. ν = σ şi ν = x 1 + σ, care conduc la 

{ 

u 1 = 1 + x 1 

σ ; u i = x i 

σ , i = 2 : m 

(3.42) 

β = u 1 

şi respectiv ⎧ 

⎪⎨ 

⎪ ⎩ 

u 1 = 1; u i = x i 

x 1 + σ , i = 2 : m 

τ = 1 + x 1 

σ , (β = 1¯τ ). (3.43) 

În practica numerică actuală se întâlnesc două versiuni de implementare a relaţiilor 

de calcul stabilite mai sus. 

• În LINPACK [XIII] se asociază relaţiile (3.36) şi (3.42). În consecinţă, parametrul 

β = u 1 rezultă real, deci reflectorul obţinut este hermitic, Q H 1 = Q 1 . În 

schimb, prima componentă a vectorului transformat 

x 1 ← −σ

3.2. 

TRANSFORMĂRI UNITARE 141 

este complexă. Procedura de generare a reflectorului hermitic Q 1 diferă de procedura 

reală RFG numai prin modul de calcul al lui σ, vezi (3.36). 

•• În LAPACK [XV] se asociază relaţiile (3.37) şi (3.43). Instrumentul fundamental 

de lucru este acum reflectorul complex Q 1 , în care parametrul τ rezultă 

complex; în schimb faptul că u 1 = 1 şi σ ∈ R poate fi exploatat avantajos în multe 

situaţii concrete. Procedura de generare a reflectorului Q 1 este următoarea. 

CRFG 

% Se dă x ∈ C m . Se generează un reflector complex Q 1 cu proprietatea 

(3.35) şi se aplică transformarea. Componentele 

u i , i = 2 : m, ale vectorului Householder u se memorează 

pe poziţiile corespunzătoare din x. La aplicarea ulterioară 

a transformării se consideră u 1 = 1. 

1. τ = 0 

2. Dacă m > 1 atunci 

1. σ = ‖x‖ 


1. Dacă Re(x 1 ) ≠ 0 atunci σ ← sgn(Rex 1 )σ 

2. x i ← u i = x i /(x 1 + σ), pentru i = 1 : m 

3. τ ← (x 1 + σ)/σ 

4. x 1 ← −σ 

Comentarii. Calculul normei euclidiene la pasul 2.1 se poate face utilizând funcţia 

complexă CNRM2 din BLAS 1. 

♦ 

AA. Fie acum x ∈ C m un vector arbitrar, iar Q 1 un reflector dat. Aplicarea 

transformărilor 

x ← Q H 1 x, x ← Q 1x (3.44) 

se face ţinând seama de relaţiile (3.38), (3.39) precum şi de tipul reflectorului considerat. 

• Dacă Q 1 este un reflector hermitic, atunci cele două transformări (3.44) coincid, 

iar procedura corespunzătoare diferă de procedura reală RF numai prin utilizarea 

produsului scalar complex la pasul 1.1, vezi (3.39). 

•• Dacă Q 1 este un reflector complex, generat de procedura CRFG, atunci se 

ţine seama că prima componentă u 1 = 1 a vectorului Householder nu este memorată 

ca atare. Scrierea procedurii de transformare corespunzătoare primei relaţii (3.44), 

de exemplu notată CRF, este propusă ca exerciţiu. 

Procedurile de calcul cu reflectori complecşi sunt prezentate în tabelul 3.3 10 . 

La fel ca în cazul real, tipic procedura CRFG se utilizează pentru a introduce 

zerouri într-o anumită coloană a unei matrice A, iar procedura CRF se utilizează 

pentru a transforma în mod corespunzător celelalte coloane. 

Presupunând că tabloul A e dimensionat adecvat, în general există patru tipuri 

de transformări posibile, două la stânga (QA şi Q H A) şi două la dreapta (AQ şi 

AQ H ). În primul caz A se partiţionează pe coloane şi fiecărei coloane i se aplică 

11 

transformarea corespunzătoare. În al doilea caz A se partiţionează pe linii. 

10 Procedurile de calcul cu reflectori complecşi modificaţi, e.g. CmRFG etc. se scriu similar cu 

cazul real. Detaliile sunt lăsate în sarcina cititorului interesat. 

11 Pentru a acoperi toate aceste situaţii cu o singură procedură CLARF, în LAPACK (ca şi în



Reflector 

Q 

complex 

1 x = −σe τ ∈ C 

1 [u, τ, x] = CRFG(x) τ = CRFG(x) 

σ ∈ R 


Q 1 = (τ, u) 

x ∈ C m 

x ← Q H 1 x 

x ← Q 1 x 

x = CRF(u, τ, x) 

x = CRF(u, ¯τ, x) 

CRF(u, τ, x) 

CRF(u, ¯τ, x) 

Tabelul 3.3: Proceduri de calcul cu reflectori complecşi. Procedurile de calcul cu 

reflectori hermitici sunt similare cu RFG şi RF 

3.2.2 Rotaţii complexe 

Considerăm spaţiul complex C 2 cu norma euclidiană ‖x‖ = (|x 1 | 2 + |x 2 | 2 ) 1/2 . 

O rotaţie complexă este o matrice de forma 

[ ] 

c s 

P = , (3.45) 

−¯s ¯c 

în care parametrii c, s satisfac relaţia 

|c| 2 + |s| 2 = 1. (3.46) 

Se verifică uşor că matricea P este unitară, i.e. P H P = I 2 . 

AA. Fie x ∈ C 2 un vector dat. Vom determina o rotaţie complexă P astfel 

încât [ ][ ] [ ] 

c s x1 r 

= , (3.47) 

−¯s ¯c x 2 0 

unde r este un scalar astfel încât |r| = ‖x‖. O analiză simplă arată că aici, ca şi în 

cazul reflectorilor complecşi, sunt posibile două opţiuni. 

• Putem alege r complex, e.g. 

şi în acest caz obţinem 

r = x 1 

‖x‖, (3.48) 

|x 1 | 

c = |x 1| 

‖x‖ , s = x 1 

|x 1 | 

¯x 2 

‖x‖ , (3.49) 

deci parametrul c rezultă real pozitiv. Procedura de calcul este următoarea. 

CROTG 

% Se dă x ∈ R 2 . Se generează o rotaţie complexă P cu proprietatea 

(3.47) şi se efectuează transformarea. 

1. Dacă |x 1 | = 0 atunci 

1. c = 0, s = 1 

BLAS3) se utilizează opţiunile TRANS şi SIDE, vezi secţiunea 1.11. Subliniem că urmărirea acestor 

detalii, aparent pur tehnice, este esenţială pentru asigurarea corectitudinii şi optimizarea calculatorie 

a algoritmilor de calcul obţinuţi.

3.3. TRIANGULARIZAREA ORTOGONALĂ 143 


Rotaţie 

c ∈ R 

Px = re 

complexă 1 [c, s, a, b] = CROTG(a, b) [c, s] = CROTG(a, b) 

r ∈ C 

= [(c, s) ] x ← Px 

a 

x = 

b 

x ← P H x 

P def 

[a, b] = CROT(c, s, a, b) 

[a, b] = CROT(¯c, −s, a, b) 

CROT(c, s, a, b) 

CROT(¯c, −s, a, b) 

Tabelul 3.4: Proceduri de calcul cu rotaţii complexe 

2. x 1 ← r = x 2 , x 2 = 0 

altfel 

3. α = x 1 / |x 1 | 

4. ρ = ‖x‖ 

5. c = |x 1 | / ρ, s = α¯x 2 / ρ 

6. x 1 ← r = αρ, x 2 = 0 

•• Alternativ, putem alege r real, de exemplu 

şi în acest caz ambii parametri 

r = sgn(Rex 1 )‖x‖ (3.50) 

c = ¯x 1 

r , s = ¯x 2 

r 

(3.51) 

rezultă complecşi. (Menţionăm că în practică se întâlnesc ambele opţiuni (3.48) şi 

(3.50), implementate sub diverse forme relativ sofisticate.) 

AA. Fie acum P o rotaţie complexă dată, generată de CROTG, iar x ∈ C 2 un 

vector arbitrar. Procedura de transformare 

x ← Px, (3.52) 

de exemplu notată CROT, se scrie cu uşurinţă în maniera algoritmului 3.3, dar, 

desigur, ţinând seama de forma actuală (3.45) a lui P. 

Procedurile de calcul cu rotaţii complexe sunt prezentate sintetic în tabelul 3.4. 

3.3 Triangularizarea ortogonală 

În această secţiune vom descrie principalele proceduri de triangularizare a unei 

matrice A ∈ C m×n prin transformări unitare de echivalenţă la stânga. În cazul real 

A ∈ R m×n , în acelaşi scop se utilizează transformări ortogonale. Pentru concizia 

expunerii vom considera ambele cazuri în paralel. 

Teorema 3.1 Oricare ar fi A ∈ C m×n , există o matrice unitară U not 

= Q H ∈ C m×m 

astfel încât matricea 

UA = R, respectiv Q H A = R (3.53)


este superior triunghiulară. 

În cazul real A ∈ R m×n , matricea de transformare U = Q T poate fi aleasă reală 

şi ortogonală, deci R rezultă reală. 

Pe scurt, orice matrice este unitar echivalentă (la stânga) cu o matrice superior 

triunghiulară. A doua relaţie arată că A poate fi scrisă sub forma unui produs 

A = QR, unde Q este unitară, iar R este superior triunghiulară. În calculul numeric, 

această relaţie se numeşte factorizare QR, de aceea procedurile de calcul stabilite 

pe baza relaţiei fundamentale (3.53) vor fi notate cu sigla QR. (Asupra factorizării 

QR vom reveni pe larg în secţiunea următoare.) 

Demonstraţia va fi constructivă, conducând la o procedură de triangularizare 

ortogonală a matricei A utilizând reflectori sau rotaţii. Pentru precizare, în cele ce 

urmează alegem prima posibilitate. 

În cazul real, ne referim la faptele stabilite în secţiunea 3.1.1 şi pentru claritate 

considerăm succesiv două situaţii cu semnificaţii structurale distincte. 

În cazul m > n matricea de transformare va fi un produs de reflectori, i.e. 

U = Q T = U n . . .U 2 U 1 , 

unde reflectorii U k ce se determină prin metodele cunoscute pentru a introduce 

zerourile necesare în coloanele corespunzătoare a k , k = 1 : n, ale matricei A. 

În consecinţă, procedura de triangularizare are n etape. Notăm A 1 = A, unde 

A = [a 1 a 2 . . . a n ]. 

Etapa 1. Dacă elementele a i1 , i = 2 : m, nu sunt toate nule, atunci conform 

propoziţiei 3.1, există un reflector U 1 ∈ R m×m de ordinul m şi indice 1, astfel încât 

(U 1 a 1 ) i = 0, i = 2 : m. 

În virtutea acestui fapt, matricea transformată 

⎡ 

A 2 = U 1 A 1 = [U 1 a 1 U 1 a 2 . . . U 1 a n ] = 

⎢ 

⎣ 

r 11 r 12 . . . r 1n 

0 a (2) 

22 . . . a (2) 

2n 

0 a (2) 

32 . . . 

. . . 

a (2) 

3n 

0 a (2) 

m2 . . . a (2) 

mn 

⎤ 

⎥ 

⎦ 

are toate elementele subdiagonale ale primei coloane egale cu zero, i.e. este superior 

triunghiulară în prima coloană. Dacă a i1 = 0 pentru i = 2 : m, atunci luăm 

pur şi simplu U 1 = I m şi trecem la etapa următoare. (Matricea unitate I m este 

ortogonală !) 

Etapa k, k = 2 : n. Presupunem că după desfăşurarea primelor k − 1 etape ale 

procedurii am obţinut matricea 

A k = U k−1 . . .U 2 U 1 A


superior triunghiulară în primele k − 1 coloane, i.e. 

A k = [a (k) 

1 . . . a (k) 

k 

⎡ 

. . . a (k) 

n ] = ⎢ 

⎣ 

r 11 r 12 . . . r 1,k−1 r 1k . . . r 1n 

r 22 . . . r 2,k−1 r 2k . . . r 2n 

. .. . . . 

r k−1,k−1 r k−1,k 

. . . r k−1,n 

. 

⎥ 

. ⎦ 

a (k) 

kk 

. . . a (k) 

kn 

0 a (k) 

k+1,k . . . a(k) k+1,n 

. 

. 

a (k) 

mk 

. . . a (k) 

mn 

Acum, dacă elementele a (k) 

ik 

, i = k + 1 : m, nu sunt toate nule, atunci există un 

reflector U k ∈ R m×m de ordinul m şi indice k, astfel încât 

(U k a (k) 

k ) i = 0, i = k + 1 : m. 

(Altfel, luăm U k = I m şi trecem la etapa următoare.) Tinând cont de faptul că 

orice reflector de indice k nu modifică un vector ale cărui ultime m −k+1 elemente 

sunt nule (vezi (3.11), unde ν = 0), rezultă că matricea 

A k+1 = U k A k = [U k a (k) 

1 . . . U k a (k) 

k 

. . . U k a (k) 

n ] 

are primele k − 1 coloane nemodificate, iar în coloana k elementele subdiagonale 

sunt nule; prin urmare A k+1 este superior triunghiulară în primele k coloane. De 

asemenea, deoarece reflectorul este de indice k, primele k − 1 linii ale lui A k rămân 

nemodificate. 

Aşadar, procedura de anulare a elementelor subdiagonale poate fi iniţializată, 

ca în etapa 1, şi, o dată pornită, poate fi continuată, ca în etapa k. Astfel, când 

m > n, după n etape, obţinem matricea 

R def 

= A n+1 = U n U n−1 . . . U 2 U 1 A = 

unde R ′ ∈ R n×n este superior triunghiulară de ordin n. 

[ 

R 

′ 

0 

⎤ 

] 

, (3.54) 

În cazul m ≤ n, procedând similar, după m−1 etape obţinem matricea superior 

trapezoidală 

R def 

= A m = U m−1 . . .U 2 U 1 A = [ R ′ S ], (3.55) 

unde R ′ ∈ R m×m este superior triunghiulară de ordin m, iar S ∈ R m×(n−m) este 

un bloc dreptunghiular fără particularităţi de structură. 

Demonstraţia teoremei în cazul real este încheiată. 

În cazul complex raţionamentul este identic, iar detaliile pot fi completate cu 

uşurinţă de cititorul interesat prin referire la secţiunea 3.2.1. 

♦ 

Observaţia 3.3 Atât enunţul cât şi demonstraţia teoremei 3.1 au un caracter 

procedural, în sensul că matricea R rezultată în urma procesului de triangularizare


nu trebuie să fie neapărat superior triunghiulară. De exemplu, în cazul m = n, matricea 

A poate fi adusă la forma inferior triunghiulară utilizând reflectorii modificaţi 

din observaţia 3.1. Această posibilitate va fi discutată în finalul secţiunii următoare. 

De asemenea, transformările unitare de echivalenţă pot fi aplicate la dreapta matricei 

A, după cum vom arăta în secţiunea 3.6. În toate cazurile, tehnica de lucru este 

aceeaşi, iar alegerea procedurii de triangularizare adecvate este dictată de structura 

problemei considerate. 

♦ 

A. Proceduri de triangularizare cu reflectori 

Procedura de triangularizare ortogonală degajată pe parcursul demonstraţiei de 

mai sus este similară cu procedura de eliminare gaussiană, cunoscută din capitolul 

anterior, şi, la fel ca aceasta, se poate desfăşura pe loc în tabloul A, astfel încât în 

final matricea R să fie memorată în triunghiul superior al lui A. 

În cazul real, relaţiile (3.54) şi (3.55) conduc la următoarea schemă de calcul. 

QR RF 

% Triangularizarea matricei A utilizând reflectori 

1. Pentru k = 1 : min (m − 1, n) 

1. Se determină U k a.î. (U k A) ik = 0, i = k + 1 : m 

2. A ← U k A. 

Dacă matricea A este monică, i.e. are coloane independente, atunci la fiecare 

etapă elementele a ik , i = k : m, ale matricei curente A nu sunt toate nule. În 

consecinţă, pentru a determina reflectorul U k (adică vectorul Householder u k şi 

scalarul β k ), la pasul 1.1 se utilizează algoritmul 3.2, aplicat vectorului x = A(:, k). 

(Componentele nenule ale vectorilor Householder u k vor fi notate u ik , i = k : m.) 

Pentru calculul transformării de la pasul 1.2 se utilizează algoritmul 3.1 aplicat 

vectorilor x = A(:, j), j = k + 1 : n. Combinând ideile de mai sus, rezultă imediat 

% Versiunea primară a algoritmului de triangularizare cu reflectori 

1. Pentru k = 1 : min (m − 1, n) 

% se determină transformarea U k 

) 1/2 

i=k a2 ik 

1. σ = sgn(a kk ) · (∑ m 

2. u kk = a kk + σ; u ik = a ik , pentru i = k + 1 : m 

3. β k = σu kk 

% se aplică U k 

4. Pentru j = k + 1 : n 

1. ν = ( ∑ m 

i=k u ika ij )/β k 

2. a ij ← a ij − νu ik , pentru i = k : m 

% coloana k 

5. a kk = −σ; a ik = 0, pentru i = k + 1 : m 

Comentarii. Algoritmul necesită aproximativ N QR = 2(mn 2 − n 3 /3) operaţii, 

care în principal se consumă la pasul 1.4 pentru actualizarea coloanelor A(k : m, j), 

j = k + 1 : n, ale matricei ”rămase”. În particular, dacă m = n, atunci 

N QR = (4/3)n 3 este dublu faţă de algoritmul de eliminare gaussiană. ♦


În general, fie acum A ∈ C m×n o matrice oarecare. Pentru uniformizarea scrierii, 


în cazul m ≤ n completăm şirul de transformări din (3.55) cu U m = I m . De asemenea, 

notăm s = min(m, n), precum şi U k = Q H k , unde Q k sunt reflectorii complecşi 

(în particular hermitici) utilizaţi pentru anularea elementelor subdiagonale la 

etapele k = 1 : s. Cu aceste notaţii, relaţiile (3.54) şi (3.55) pot fi scrise împreună 

sub forma (3.53), unde 

U = Q H = Q H s . . .QH 2 QH 1 , (3.56) 

iar schema de triangularizare devine 

QR 

% Schemă generală de triangularizare QR 

1. Pentru k = 1 : s 

1. Se generează Q H k a.î. (QH k A) ik = 0, i = k + 1 : m 

2. A ← Q H k A. 

• În cazul real sau în cazul utilizării reflectorilor hermitici de forma (3.31) avem 

Q H k = Q k, iar implementarea schemei QR are la bază procedurile RFG şi RF din 

tabelul 3.1. Componentele u ik , i = k + 1 : m, ale vectorilor Householder u k se 

memorează natural pe poziţiile elementelor anulate, iar scalarii β k se memorează 

într-un vector suplimentar, ca în următoarea diagramă corespunzătoare situaţiei de 

după pasul k 

⎡ 

⎤ 

r 11 r 12 . . . r 1k r 1,k+1 . . . r 1n 

u 21 r 22 . . . r 2k r 2,k+1 . . . r 2n 

. . .. . . . u k1 u k2 . . . r kk r k,k+1 . . . r kn 

u k+1,1 u k+1,2 . . . u k+1,k a (k+1) 

k+1,k+1 . . . a(k+1) k+1,n 

⎢ 

⎥ 

⎣ . . . . . ⎦ 

u m1 u m2 . . . u mk a (k+1) 

m,k+1 

. . . a (k+1) 

mn 

[ 

] 

β 1 β 2 . . . β k 

Algoritmul rezultat se redactează astfel. 

Algoritmul 3.5 (QR – triangularizare ortogonală cu reflectori hermitici) 

(Se dă A ∈ C m×n . Se efectuează triangularizarea ortogonală a 

matricei A, i.e. Q H A = R, unde Q H = Q s . . . Q 2 Q 1 , iar Q k sunt reflectori 

hermitici. Partea esenţială u k (k + 1 : m) a vectorilor Householder 

u k se memorează pe poziţiile corespunzătoare A(k + 1 : m, k). La aplicarea 

ulterioară a transformărilor se ţine seama că u kk = β k , k = 1 : s. 

Elementele nenule ale matricei superior triunghiulare R suprascriu elementele 

corespunzătoare din triunghiul superior al matricei A.) 


1. β k = 0 

2. Dacă k < m atunci 

1. σ = ‖A(k : m, k)‖



1. Dacă a kk ≠ 0 atunci σ ← a kk 

|a kk | σ 

2. a ik ← u ik = a ik /σ, pentru i = k : m 

3. β k ← u kk = 1 + a kk 

4. Pentru j = k + 1 : n 

1. α = − ( ∑ m 

i=k ūika ij )/β k 

2. a ij ← a ij + αu ik , pentru i = k : m 

% elementul diagonal 

5. a kk = −σ 

Comentarii. În cazul real, algoritmul 3.5 necesită N QR operaţii 12 şi este numeric 

stabil, după cum vom arăta în secţiunea 3.8. Modul de apel este [A, β] = QR(A), 

unde β este vectorul real cu componentele β k , k = 1 : s, iar A apare ca tablou 

de intrare-ieşire. Subliniem că algoritmul 3.5 nu calculează explicit reflectorii Q k 

din (3.56), şi cu atât mai puţin matricea de transformare Q H , ci doar memorează 

(extrem de economic) toate elementele necesare pentru definirea acestora. ♦ 

Exemplul 3.5 În cazul matricelor cu structură specială, algoritmul general prezentat 

mai sus se adaptează în mod corespunzător, având în vedere conservarea structurii 

şi exploatarea acesteia [ ] în scopul reducerii numărului de operaţii. În acest sens 

R 

fie matricea A + = , în care blocul lider R ∈ C 

C 

n×n este deja superior triunghiular, 

iar C ∈ C (m−n)×n este un bloc dat cu l = m − n ≥ 1 linii. Schema de 

triangularizare ortogonală este 

[ ] 

Q H R+ 

A + = , Q 

0 

H = Q H n . . .QH 2 QH 1 , 

în care Q k sunt reflectori definiţi de vectorii Householder 

u k = [0 . . . 0 u kk 0 . . . 0 u n+1,k . . . u mk ] T . 

La fiecare etapă, elementele β k = u kk şi u ik , i = n + 1 : m, se determină ca în 

algoritmul 3.5 pentru a anula elementele corespunzătoare din coloana k a blocului 

C. În plus, datorită structurii suplimentare de zerouri, aplicarea transformării lasă 

nemodificate liniile i = k + 1 : n ale matricei A + , deci conservă structura superior 

triunghiulară a blocului lider. În consecinţă, numărul de operaţii se reduce la 

2(m − n)n 2 . Detaliile de implementare şi analiza unor cazuri particulare semnificative 

sunt propuse în problema 3.20. 

♦ 

•• În cazul utilizării reflectorilor complecşi de forma generală (3.32), 

implementarea schemei QR se face utilizând direct procedurile CRFG şi CRF 

din tabelul 3.3. 

12 În cazul complex, notând N = mn 2 − n 3 /3, algoritmul 3.5 cere N adunări complexe şi N 

înmulţiri complexe. Deoarece o adunare complexă este echivalentă cu 2 adunări (reale), iar o 

înmulţire complexă este echivalentă cu două adunări şi patru înmulţiri, algoritmul 3.5 cere 4N 

adunări şi 4N înmulţiri, adică 8N (sau 4N QR ) operaţii reale (flopi).

3.4. FACTORIZAREA QR 149 

CQR 

% Algoritmul de triangularizare ortogonală cu reflectori complecşi, 

i.e. Q H A = R, unde Q H = Q H s . . . QH 2 QH 1 . 


1. τ k = CRFG(A(k : m, k)) 

2. Pentru j = k + 1 : n 

1. CRF(A(k : m, k), τ k , A(k : m, j)) 

Modul de apel este [τ, A] = CQR(A), unde τ este acum vectorul complex cu 

componentele τ k , k = 1 : s. 

B. Proceduri de triangularizare cu rotaţii 

Procesul de triangularizare definit prin relaţia (3.53) poate fi implementat alternativ 

utilizând rotaţii. 

De exemplu, în cazul real, pentru anularea elementelor subdiagonale se utilizează 

secvenţe de rotaţii P k de forma (3.26), în care la fiecare etapă k rotaţiile P ki se 

determină utilizând algoritmul 3.4 pentru a introduce zerourile necesare în poziţiile 

corespunzătoare a ik , i = k + 1 : m, ale matricei curente A. Actualizarea coloanelor 

următoare se face utilizând algoritmul 3.3. 

Procedura de triangularizare se poate desfăşura pe loc în tabloul A, utilizând 

următoarea schemă de calcul. 

QR ROT 

% Triangularizarea matricei A utilizând rotaţii 

1. Pentru k = 1 : min (m − 1, n) 

1. Pentru i = k + 1 : m 

1. Se determină P ki astfel încât (P ki A) ik = 0 

2. A ← P ki A 

Detaliile de justificare precum şi scrierea algoritmului în forma sa implementabilă 

sunt propuse ca exerciţii. Menţionăm că numărul de operaţii efectuat aici este dublu 

faţă de algoritmul similar care utilizează reflectori, de aceea acesta din urmă este 

în general preferabil. În cazul complex, schema de mai sus rămâne valabilă, cu 

menţiunea că rotaţiile P ki se calculează ca în secţiunea 3.2.2. 

3.4 Factorizarea QR 

În această secţiune vom utiliza procedurile de triangularizare ortogonală stabilite 

în secţiunea anterioară pentru a construi factorizarea QR a unei matrice A ∈ C m×n 

de formă generală. Notăm ca de obicei s = min(m, n). 

În cazul m ≥ n din (3.53) şi (3.56) rezultă 

[ R 

′ 

A = QR, R = 

0 

] }n 

}m − n 

(3.57) 

unde matricea 

Q = Q 1 Q 2 . . . Q n (3.58)


este unitară iar R este superior triunghiulară ca în (3.54). 

m = n atunci R = R ′ .) Partiţionând Q conform cu R, i.e. 

(În particular, dacă 

din (3.57) deducem 

Q = [ Q ′ 

}{{} 

n 

Q ′′ 

}{{} 

m−n 

], (3.59) 

A = Q ′ R ′ , (3.60) 

unde acum Q ′ are coloanele ortogonale, pe scurt Q ′H Q ′ = I n , iar R ′ este pătrată. 

Am demonstrat astfel prima parte a următorului rezultat fundamental. 

Teorema 3.2 Orice matrice A ∈ C m×n cu m ≥ n poate fi scrisă sub forma (3.60), 

unde Q ′ ∈ C m×n are coloane ortogonale, iar R ′ ∈ C n×n este superior triunghiulară. 

Prin definiţie, relaţia (3.60) constituie factorizarea QR a matricei A. Dacă A 

este monică, atunci R ′ rezultă inversabilă şi reciproc. În acest caz, factorizarea 

QR este unică dacă în plus impunem condiţia ca factorul triunghiular R ′ să aibă 

elemente diagonale (reale şi) pozitive. 

Demonstraţie. Pentru a demonstra a doua afirmaţie, să ne amintim că matricea 

A este monică dacă şi numai dacă Ax ≠ 0, oricare ar fi x ∈ C n , x ≠ 0, deci 

x H A H Ax = ‖Ax‖ 2 > 0 pentru orice x ≠ 0, adică matricea hermitică G = A H A 

este pozitiv definită. Atunci, conform teoremei de factorizare Cholesky, există şi 

este unică matricea R 1 superior triunghiulară cu elemente diagonale pozitive astfel 

încât G = R1 HR 1. Fie Q 1 = AR1 −1 . Avem 

Q H 1 Q 1 = R −H 

1 A H AR −1 

1 = R −H 

1 R H 1 R 1R −1 

1 = I n , 

adică Q 1 are coloanele ortogonale, şi în plus A = Q 1 R 1 . Prin urmare, unicitatea 

factorizării QR rezultă din unicitatea factorizării Cholesky, i.e. dacă R ′ satisface 

condiţia din enunţ atunci R ′ = R 1 şi Q ′ = Q 1 . (Condiţia ca elementele diagonale 

ale lui R ′ să fie pozitive poate fi întotdeauna satisfăcută, dar, de obicei, nu prezintă 

interes în practică.) 

♦ 

Observaţia 3.4 În general, matricea hermitică pozitiv semidefinită G = A H A 

se numeşte gramian al (coloanelor) matricei A. Demonstraţia teoremei 3.2 arată 

că dacă matricea A este monică, atunci factorul triunghiular R ′ al lui A coincide 

în esenţă cu factorul Cholesky R 1 al lui G. În principiu, acest rezultat extrem de 

important poate fi exploatat în două sensuri. 

a) Factorizarea QR a matricei A poate fi determinată relativ economic efectuând 

în prealabil factorizarea Cholesky a matricei G. Schema de calcul, dedusă direct 

din demonstraţia teoremei amintite, este următoarea 

QR Ch 

1. Se formează G = A H A 

2. Se calculează R 1 efectuând factorizarea Cholesky G = R1 H R 1 

3. Se calculează Q 1 = AR1 −1 rezolvând sistemul superior 

triunghiular Q 1 R 1 = A


Trebuie însă să subliniem că această metodă, deşi conceptual extrem de simplă, 

nu este recomandabilă din punct de vedere numeric deoarece matricea G, rezultată 

la pasul 1 prin ”ridicarea la pătrat” a lui A, este rău condiţionată, vezi mai departe 

propoziţia 3.5. În consecinţă, rezultatele calculate la paşii 2 şi 3 sunt afectate de erori 

străine de problemă şi eventual catastrofale, independent de calitatea algoritmilor 

utilizaţi. Ca regulă generală, formarea gramianului G = A H A trebuie sistematic 

evitată în favoarea operării directe asupra matricei date A. 

b) O serie de probleme de calcul, vizând de exemplu actualizarea unor factorizări 

LU sau Cholesky, pot fi reformulate în termenii unei factorizări QR echivalente şi 

rezolvate în consecinţă aplicând procedurile numeric stabile bazate pe utilizarea 

transformărilor ortogonale. Spre deosebire de abordarea de la punctul a), această 

idee, care constituie baza unei întregi familii de metode de calcul, tradiţional numite 

”de rădăcină pătrată”, este larg aplicată în practică. 

♦ 

Exemplul 3.6 Pentru a ilustra ideea de bază a algoritmilor de rădăcină pătrată, 

fie G = R H R o matrice hermitică pozitiv definită al cărei factor Cholesky superior 

triunghiular R ∈ C n×n este cunoscut. Problema de actualizare a factorizării 

Cholesky constă în a calcula factorul Cholesky R + al matricei modificate 

G + = G + C H C, 

în care C ∈ C l×n este o matrice dată. În particular, dacă l = 1, i.e. C = cT este 

un vector linie, atunci G + este o modificare de rang 1 a lui G. 

Această problemă poate fi rezolvată extrem de simplu, fără a forma explicit G + , 

observând că 

[ ] 

G + = R H R + C H C = [R H C H R 

] = A 

C 

H + A +, 

i.e. G + este gramianul matricei A din exemplul 3.5. În consecinţă, factorul Cholesky 

căutat R + poate fi determinat efectuând triangularizarea ortogonală a matricei A + , 

construite direct cu elementele date R şi C. 

O idee asemănătore se aplică pentru a efectua actualizarea factorizării Cholesky 

în cazul unei modificări de rang 2, i.e. 

G + = G + dc H + cd H + cc H , 

unde c, d ∈ C n sunt doi vectori (coloană) daţi. 

Dacă matricea A este monică, atunci factorul ortogonal Q ′ 

semnificaţie geometrică remarcabilă. Din (3.60) rezultă 

♦ 

al lui A are o 

y not 

= Ax = Q ′ (R ′ x), ∀x ∈ C n , (3.61) 

unde R ′ este superior triunghiulară inversabilă. Prin urmare, coloanele matricelor 

A şi Q ′ generează acelaşi subspaţiu liniar S not 

= ImA. Mai precis, prin ipoteză A are 

coloanele independente, deci constituie o bază a lui S, iar prin construcţie Q ′ are 

coloanele ortogonale, deci constituie o bază ortogonală a lui S. Proiectorul ortogonal 

pe S este P 1 = A(A H A) −1 A H sau, mai simplu, P 1 = Q ′ Q ′H . (Prin calcul direct


S ⊥ 

✻ 

q 3 

✲ 

✟ q 2 

✟ 

✟ ✟✟✟✟✟✟✟✟ q 1 

✟✟✙ 

S ✟ 

✟ 

✟ 

✟ 

✟ 

✟ 

✟ 

✟ Fig. 3.5: Baze ortogonale pentru ImA şi KerA H . Q = [q 1 q 2 | q 3 ], m = 3, n = 2 

se verifică uşor că P1 2 = P 1 şi P1 

H = P 1 , iar faptul că ImP 1 = S este evident. 

Echivalenţa celor două expresii ale lui P 1 rezultă din (3.60).) 

În mod similar, matricea Q ′′ ∈ C m×(m−n) (care, în (3.59), completează Q ′ până 

la o matrice unitară Q), constituie o bază ortogonală a subspaţiului complementar 

S ⊥ = KerA H . Proiectorul ortogonal pe S ⊥ este P 2 = Q ′′ Q ′′H şi, în plus, avem 

P 1 + P 2 = I m . 

Pe scurt, partiţia (3.59) a matricei unitare Q corespunde descompunerii ortogonale 

fundamentale 

C m = ImA ⊕ KerA H , (3.62) 

furnizând baze ortogonale pentru ambele subspaţii. Cazul m = 3, n = 2 este ilustrat 

în figura 3.5. În consecinţă, orice vector b ∈ Cm se scrie unic sub forma b = b 1 +b 2 , 

unde b i = P i b, i = 1 : 2, sunt proiecţiile ortogonale ale lui b pe S şi, respectiv, S ⊥ . 

În cazul m < n, din (3.53) şi (3.56) rezultă 

A = QR, R = [R ′ S], (3.63) 

unde Q = Q 1 Q 2 . . . Q m este unitară, iar R este superior trapezoidală ca în (3.55). 

Utilizând partiţia conformă A = [A ′ B] obţinem factorizarea 

A ′ = QR ′ , (3.64) 

unde, evident, A ′ = A [m] este submatricea lider principală a matricei A. 

Dacă A ′ este inversabilă, atunci R ′ are aceeaşi proprietate, iar din (3.64) şi 

B = QS rezultă B = A ′ (R ′ ) −1 S. Altfel spus, între coloanele matricei A există 

relaţia B = A ′ X, unde X = (R ′ ) −1 S este soluţia sistemului triunghiular R ′ X = S, 

prin urmare matricea 

[ ] 

−X 

N = 

I m−n 

constituie o bază (neortogonală) a subspaţiului N not 

= KerA ∈ C n . (Se constată 

imediat că A este epică şi AN = 0.) 

Trebuie însă să observăm că, în absenţa unei strategii adecvate de pivotare a 

coloanelor, condiţia de inversabilitate menţionată mai sus nu este îndeplinită, astfel


încât în cazul m < n, utilitatea practică a procedurii de triangularizare ortogonală 

(la stânga) precum şi a factorizării QR asociate sunt limitate. 

Având în vedere rezultatele teoretice stabilite mai sus, care evidenţiază clar 

importanţa factorizării QR, în continuare ne vom concentra atenţia asupra aspectelor 

procedurale privind calculul şi aplicaţiile practice ale acestei factorizări. 

3.4.1 Acumularea transformărilor 

În cazul m ≥ n, factorizarea QR a matricei A poate fi determinată utilizând procedurile 

de triangularizare ortogonală stabilite în secţiunea anterioară. Într-adevăr, 

în urma execuţiei acestor proceduri, factorul triunghiular R ′ se obţine ca atare în 

triunghiul superior al matricei A iar, în acord cu relaţiile (3.58) şi (3.59), factorul 

ortogonal Q ′ poate fi calculat sub forma 

[ ] 

[ ] 

Q ′ In In 

= Q = Q 

0 1 Q 2 . . .Q n , (3.65) 

0 

aplicând următoarea schemă caracteristică de acumulare a transformărilor. 

GQR 

% Acumularea primelor n coloane Q ′ ale matricei 

Q = Q[ 1 Q 2 .]. . Q n , m ≥ n. 

1. Q ′ In 

= 

0 

2. Pentru k = n : −1 : 1 

1. Q ′ ← Q k Q ′ 

Cu referire la algoritmul 3.5, implementarea schemei GQR este simplă. Ţinând 

seama de particularităţile de structură ale matricei Q ′ şi utilizând elementele definitorii 

ale transformărilor Q k , memorate în triunghiul inferior strict al matricei A 

precum şi în vectorul β, procesul de calcul poate fi organizat astfel încât Q ′ să 

rezulte pe loc în tabloul A 13 . 

Algoritmul 3.6 (GQR) (Utilizând ieşirea algoritmului 3.5, se efectuează 

acumularea pe loc în A a primelor n coloane Q ′ ale matricei 

Q = Q 1 Q 2 . . .Q s , unde Q k sunt reflectori hermitici. Se presupune 

m ≥ n.) 


1. a ij = 0, pentru i = 1 : j − 1 

2. Pentru k = n : −1 : 1 

1. Dacă β k ≠ 0 atunci 

1. a kk ← u kk = β k 

2. Pentru j = k + 1 : n 

1. α = − ( ∑ m 

i=k ūika ij ) /β k 


13 În caz de nevoie, factorul triunghiular R ′ sau chiar întregul tablou A sunt în prealabil salvate. 

Acest mod de lucru se justifică având în vedere că, în general, un anumit algoritm de calcul trebuie 

să manevreze un număr cât mai mic de tablouri de lucru.


% coloana k 

3. a ik ← −a ik , i = k : m 

4. a kk = 1 + a kk 

altfel 

5. a ik = 0, pentru i = k + 1 : m 

6. a kk = 1 

Comentarii. În cazul real, algoritmul 3.6 necesită N QR operaţii, care (la fel ca 

în algoritmul 3.5) se consumă pentru actualizarea coloanelor la pasul 2.1.2. Modul 

de apel este A = GQR(A, β). Reţinem că determinarea explicită a factorizării 

QR a matricei A prin apelarea succesivă a procedurilor QR şi GQR necesită în 

total 2N QR operaţii, deci este relativ costisitoare. Pentru utilizare în capitolele 

următoare, sintaxa unei astfel de proceduri de factorizare QR este [Q, R] = FQR(A) 

(lăsăm cititorului micile detalii de implementare). 

♦ 

În contextul procedurii de triangularizare CQR, care utilizează reflectori complecşi, 

schema de acumulare GQR rămâne evident valabilă. Implementarea ei ”directă”, bazată 

pe aplicarea la pasul 2 a procedurii de transformare CRF pentru actualizarea coloanelor 

lui Q ′ , este extrem de simplă. 

GCQR % Acumularea primelor n coloane Q ′ ale matricei Q = Q 1Q 2 . . . Q n, 

m ≥ n, unde Q k sunt reflectori complecşi. 


1. q ij = 0, pentru i = 1 : m 

2. q jj = 1 

2. Pentru k = n : −1 : 1 


1. CRF(A(k : m,k), ¯τ k , Q(k : m, j)) 

Subliniem însă că procedura GCQR în forma scrisă mai sus este neeficientă deoarece 

nu exploatează structura specială a matricei Q ′ care, pe măsura aplicării transformărilor 

la pasul 2, se ”umple” progresiv, începând cu ultima coloană. (Un calcul simplu arată 

că, în cazul m = n, algoritmul GCQR necesită N op = 2n 3 operaţii complexe, adică cu 

50% mai mult decât algoritmul 3.6.) Modificările necesare pentru a corecta acest defect, 

permiţând totodată formarea lui Q ′ pe loc în tabloul A, pot fi aduse de către cititorul 

interesat, eventual după o analiză comparativă cu algoritmul 3.6. 

Matricea Q ′′ , care completează Q ′ până la o matrice unitară, poate fi calculată 

sub forma 

[ ] 

[ ] 

Q ′′ 0 

0 

= Q = Q 

I 1 Q 2 . . . Q n , (3.66) 

m−n I m−n 

utilizând o schemă de acumulare similară, dar mai puţin eficientă. (Evident, acum 

tabloul A trebuie extins cu m − n coloane necesare pentru a memora Q ′′ .) 14 

În final, subliniem că formarea matricelor Q ′ , Q ′′ sau Q prin acumularea transformărilor 

este relativ costisitoare. De aceea, în contextul aplicaţiilor considerate 

în acest capitol, se recomandă evitarea acestui calcul în favoarea utilizării formei 

factorizate (3.58) a matricei Q, furnizată ca atare de algoritmii de triangularizare 

QR. 

14 În cazul m < n, cu referire la (3.64), calculul matricei Q se poate face apelând direct procedura 

GQR sub forma A(:,1 : m) = GQR(A(:,1 : m), β). După execuţie, rezultatul dorit Q suprascrie 

blocul lider A ′ al matricei A.


3.4.2 Aplicarea transformărilor 

În practică, matricea unitară Q H generată sub forma (3.56) de procedurile de triangularizare 

ortogonală aplicate matricei A, se utilizează pentru a transforma în 

mod adecvat o altă matrice dată B. Ca regulă generală, cele patru tipuri de transformări 

posibile, două la stânga (Q H B şi QB) şi două la dreapta (BQ şi BQ H ), se 

efectuează pe loc în B fără a forma explicit matricele Q H sau Q. 

Aplicarea transformărilor 

şi 

B ← Q H B = Q H s . . . Q H 2 Q H 1 B (3.67) 

B ← QB = Q 1 Q 2 . . . Q s B (3.68) 

se face partiţionând B pe coloane. 

În cazul (3.67), schema de calcul este evident următoarea. 

MQR % Aplicarea transformării B ← Q H B, unde Q = Q 1 Q 2 . . . Q s . 


1. B ← Q H k B 

Cu referire la algoritmul 3.5, implementarea schemei MQR are la bază o procedură 

de tip RF pentru actualizarea fiecărei coloane a matricei B. Desigur, la 

pasul 1.1, transformarea se aplică efectiv numai dacă β k ≠ 0, utilizând vectorul 

Householder u k memorat în A(k : m, k). 

Algoritmul 3.7 (MQR) (Se dă B ∈ C m×p . Utilizând ieşirea algoritmului 

3.5, se aplică transformarea B ← Q H B, unde Q = Q 1 Q 2 . . .Q s , 

iar Q k sunt reflectori hermitici.) 


1. Dacă β k ≠ 0 atunci 

1. t = a kk 

2. a kk ← u kk = β k 


1. α = − ( ∑ m 

i=k ūikb ij )/β k 

2. b ij ← b ij + αu ik , pentru i = k : m 

4. a kk = t 

Comentarii. În cazul real cu m ≥ n, algoritmul 3.7 necesită N op = pN m operaţii, 

unde am notat cu N m = 2n(2m − n) numărul de operaţii necesar pentru a aplica 

transformarea (3.67) unui vector b cu m componente. 

♦ 

În contextul procedurii de triangularizare CQR, schema MQR se implementează astfel. 

MCQR 

% Aplicarea transformării B ← Q H B, unde Q = Q 1Q 2 . . . Q s, iar 

Q k sunt reflectori complecşi. 



1. CRF(A(k : m,k), τ k , B(k : m, j))


În cazul (3.68) se procedează analog. Dacă Q k sunt reflectori hermitici, atunci 

algoritmul rezultat diferă de algoritmul 3.7 numai prin ordinea de aplicare a transformărilor. 

Având în vedere simplificarea redactării unor proceduri ulterioare, vom 

presupune că ambele transformări (3.67) şi (3.68) pot fi efectuate apelând o singură 

procedură, al cărei mod de apel este B = MQR(TRANS, A, β, B), unde TRANS 

este o variabilă logică cu valorile ’da’ în cazul (3.67), respectiv ’nu’ în cazul (3.68). 

Scrierea acestei proceduri (din care jumătatea ’da’ coincide cu algoritmul 3.7) consituie 

un exerciţiu uşor. 

Aplicarea transformărilor la dreapta B ← BQ şi B ← BQ H se face partiţionând 

B pe linii şi ţinând seama de precizările făcute în finalul secţiunii 3.2.1. Scrierea 

procedurii corespunzătoare, de exemplu notată MQRd, este propusă ca exerciţiu. 

(La nevoie, cele două proceduri MQR şi MQRd pot fi reunite într-una singură 

introducând o variabilă suplimentară SIDE, aşa cum se procedează în LAPACK.) 

În concluzia expunerii de până acum, subliniem că procedurile de triangularizare, 

acumulare şi transformare, notate generic QR, GQR şi MQR, apar întotdeauna în 

triplete, orice modificare a procedurii fundamentale de triangularizare QR, în ceea 

ce priveşte calculul şi memorarea transformărilor Q k , k = 1 : s, antrenând după sine 

modificări corespunzătoare în procedurile asociate GQR şi MQR. Având în vedere 

recomandările făcute în finalul secţiunii precedente, procedura de acumulare GQR 

se utilizează numai în caz de strictă necesitate. Aproape întotdeauna, obiectivele 

urmărite prin calcul pot fi atinse utilizând procedura de transformare MQR care 

operează direct cu forma factorizată a matricei Q. 

3.4.3 Triangularizarea ortogonală la nivel de bloc 

Ideea procedurilor bloc de triangularizare ortogonală este aceeaşi cu a procedurilor 

bloc de factorizare LU, descrise în secţiunea 2.4. La fel ca acolo, utilizarea acestui 

tip de proceduri este indicată pe calculatoarele cu memorie ierarhică. 

Pentru precizare, în continuare ne vom referi la procedura CQR care efectuează 

triangularizarea matricei A, partiţionată pe coloane, utilizând reflectori complecşi. 

După cum am văzut, această procedură este bogată în operaţii vectoriale, iar efortul 

principal de calcul se consumă la pasul 1.2 pentru actualizarea coloanelor următoare. 

Având în vedere accelerarea acestui proces pe seama reducerii numărului de apeluri 

la memoria principală, procedura bloc operează asupra matricei A partiţionate în 

blocuri de coloane, cu scopul de a efectua operaţiile indicate utilizând procedurile 

de înmulţire matriceală (la nivel de bloc) de tip GEMM din BLAS 3. 

Considerăm A ∈ C m×n cu m ≥ n şi n = νn b , unde n b e dimensiunea comună a 

blocurilor (de coloane), iar ν este numărul total de blocuri. Procedura de triangularizare 

la nivel de bloc are ν etape. (Pentru simplitate, în continuare indicele de 

etapă va fi omis.) 

La prima etapă, are loc triangularizarea primului bloc al matricei A, efectuând 

transformarea A ← Q H b A. În consecinţă, se consideră partiţia A = [A b B], unde 

şi se procedează astfel: 

A b = A(1 : m, 1 : n b ), B = A(1 : m, n b + 1 : n) (3.69)


Bl 1 

1. Se generează Q b a.î. Q H b A b = R b este superior triunghiulară 

2. Se formează Q b 

3. Se aplică transformarea B ← Q H b B 

Evident, la pasul 1 se aplică procedura uzuală CQR blocului A b . Matricea Q b 

rezultată este de forma 

Q b = Q 1 Q 2 . . . Q nb , (3.70) 

unde Q i = I m − τ i u i u H i sunt reflectorii complecşi determinaţi pentru a introduce 

zerouri subdiagonale în coloanele i = 1 : n b ale blocului A b . Problema constă în 

găsirea unei forme de reprezentare a lui Q b la pasul 2, adecvate accelerării execuţiei 

pasului 3 15 . 

La o etapă ulterioară l ∈ 2 : ν, matricea curentă A este superior triunghiulară 

în primele k − 1 coloane, unde k = (l − 1)n b + 1, prin urmare 

[ ] R 

′ 

S 

A = , 

0 Ã 

unde matricea R ′ este superior triunghiulară de ordin k − 1, iar Ã = A(k : m, k : n) 

este matricea ”rămasă”. Acum are loc triangularizarea blocului următor efectuând 

transformarea A ← Q H b A, unde 

Q b = Q k Q k+1 . . .Q k+nb −1, 

iar fiecare reflector Q i are o structură de tip (3.10), deci 

[ ] 

Ik−1 0 

Q b = . 

0 ˜Qb 

În consecinţă, se consideră partiţia Ã = [Ãb ˜B], unde acum 

Ã b = A(k : m, k : k + n b − 1), 

˜B = A(k : m, k + nb : n), 

şi se aplică procedura Bl 1 cu noile date. Matricea ˜Q b rezultată este de forma 

˜Q b = ˜Q 1 ˜Q2 . . . ˜Q nb , 

iar problemele de calcul la paşii 2 şi 3 sunt aceleaşi ca mai sus. 

Pentru precizare, în continuare ne vom referi la partiţia (3.69) şi vom descrie 

cele două tipuri de reprezentări structurate ale matricelor Q b de tip (3.70), utilizate 

15 Procedurile uzuale de tip vectorial, expuse în secţiunile anterioare, nu satisfac acest deziderat. 

Aplicarea succesivă a transformărilor Q i , i = 1 : n b , în maniera MQR, este eficientă (numărul 

de operaţii este 2n b (2m − n b )(n − n b )) dar nu conduce la operaţii matriceale implementabile în 

BLAS 3. Pe de altă parte, formarea explicită a matricei Q b prin acumularea transformărilor 

în maniera GQR este costisitoare, totodată Q b rezultă nestructurată, deci produsul matriceal 

B ← Q H b B cere 2m2 (n − n b ) operaţii, unde tipic, m ≫ n b , adică cu un ordin mai mult decât 

este necesar. În plus, un asemenea mod de lucru cere un spaţiu considerabil pentru memorarea 

matricei Q b . 

De aceea, în practică, se utilizează reprezentări speciale ale matricelor de tip Q b care poartă 

numele de reflectori bloc şi care vor fi descrise în continuare.


în practică. (Indicele b va fi omis.) Aceste reprezentări se numesc reflectori bloc, iar 

elementele lor definitorii se construiesc exploatând relaţia recurentă 

Q = Q 1 , Q ← Q + = QQ i , i = 2 : n b . 

a. Reprezentarea WY este de forma Q H = I − WY H , respectiv 

Q = I − Y W H , (3.71) 

unde W, Y ∈ C m×n b 

sunt două matrice ce urmează a fi determinate. 

Iniţial avem Q = I − τ 1 u 1 u H 1 , deci putem lua 

Mai departe putem scrie 

deci 

W = u 1 , Y = τ 1 u 1 . 

Q + = QQ i = (I − Y W H )(I − τ i u i u H i ) = 

= I − Y W H − τ i (I − Y W H )u i u H i = 

= I − [ ] [ ] 

W 

Y z H 

i = 

= I − Y + W H + , 

u H i 

W + = [W u i ], Y + = [Y z i ], 

unde z i = τ i (I − Y W H )u i . Matricea W, formată prin alăturarea vectorilor Householder 

u i , este produsă şi memorată ca atare de către procedura CQR pe poziţiile 

subdiagonale din tabloul A b . (Întrucât primele i − 1 componente ale vectorilor 

Householder u i sunt nule, iar u ii = 1, W este chiar inferior trapezoidală unitate.) 

În consecinţă, reprezentarea WY este complet definită de tabloul Y , a cărui procedură 

de formare (vezi pasul 2 al schemei Bl 1 ) este următoarea. 

% Formarea lui Y 

1. Y (:, 1) = τ 1 u 1 

2. Pentru i = 2 : n b 

1. Y (:, i) = (τ i u i ) − Y (W H (τ i u i )) 

La pasul 3 al procedurii Bl 1 , reflectorul bloc în reprezentarea WY se aplică 

matricei B conform schemei 

respectiv 

B ← Q H B = (I − WY H )B = B − W(Y H B), (3.72) 

1. N = Y H B 

2. B ← B − WN 

Ambele produse se efectuează utilizând GEMM şi cer 4mn b (n − n b ) operaţii. Singurul 

neajuns al reprezentării WY constă în necesitatea formării tabloului de lucru 

suplimentar Y de dimensiune m × n b , relativ mare.


b. Reprezentarea W 2 T sau triunghiulară este de forma Q H = I −WT H W H , 

respectiv 

Q = I − WTW H (3.73) 

unde, după cum vom vedea, W este acelaşi ca mai sus, iar T ∈ C n b×n b 

rezultă 

superior triunghiulară. 

Iniţial avem Q = I − τ 1 u 1 u H 1 , deci putem lua 

Mai departe putem scrie 

deci avem 

W = u 1 , T = τ 1 . 

Q + = QQ i = (I − WTW H )(I − τ i u i u H i ) = 

= I − WTW H − τ i u i u H i + W(τ i TW H u i )u H i = 

= I − [ ] [ ][ ] 

T t 

W u i W 

H 

i 

0 τ i u H = 

i 

= I − W + T + W+ 

H 

W + = [W u i ], T + = 

[ ] T ti 

, 

0 τ i 

unde t i = −τ i T(W H u i ). 

Procedura de formare a tabloului triunghiular T, care defineşte complet reprezentarea 

W 2 T, este următoarea. 

% Formarea lui T 

1. T(1, 1) = τ 1 

2. Pentru i = 2 : n b 

1. T(1 : i − 1, i) = −τ i T(W H u i ) 

2. T(i, i) = τ i 

La pasul 3 al procedurii Bl 1 , reflectorul bloc în reprezentarea W 2 T se aplică 

matricei B conform schemei 

respectiv 

B ← Q H B = (I − WTW H )B = B − WT(W H B), (3.74) 

1. N = W H B 

2. N ← T H N 

3. B ← B − WN 

O analiză simplă arată că în acest caz este suficient un singur tablou de lucru de 

dimensiune n b × n, relativ mică. În primele n b coloane ale acestuia se formează T, 

iar în coloanele următoare se depune produsul intermediar N = W H B. (Subliniem 

că blocurile T utilizate în etapele succesive ale procedurii de triangularizare nu se 

memorează, ci se formează pe măsură ce sunt necesare.) Numărul de operaţii este 

(4m+n b )n b (n−n b ). Creşterea numărului de operaţii este compensată de memorarea 

mai compactă a reprezentării triunghiulare. 

Combinând ideile de mai sus, procedura de triangularizare ortogonală la nivel 

de bloc poate fi rezumată astfel.


CQR Bl 

% Triangularizare la nivel de bloc, utilizând reflectori complecşi. 

1. Pentru k = 1 : n b : min(n, m) 

1. f = min(k + n b − 1, n) 

2. A b = A(k : m, k : f) 

3. τ(k : f) = CQR(A b ) 

4. A(k : m, k : f) = A b 

5. Dacă f < n atunci 

% Formarea lui T 

1. T(k, k) = τ k 

2. Pentru i = k + 1 : f 

1. T(k : i − 1, i) = −τ i T(W H u i ) 

2. T(i, i) = τ i 

% aplicarea transformării 

3. B = A(k : m, f + 1 : n) 

4. N = W H B 

5. N ← T H N 

6. B ← B − WN 

7. A(k : m, f + 1 : n) = B 

În redactarea de mai sus, A b este tabloul de lucru din memoria rapidă în care 

se efectuează triangularizarea blocului curent, iar B şi N sunt blocurile utilizate de 

GEMM în procesul de aplicare a transformării. (În caz de necesitate, blocul B poate 

fi tratat sub formă partiţionată.) Amintim că tabloul W este format şi memorat 

ca atare în triunghiul strict inferior al blocului A b obţinut la pasul 1.3. Evident, în 

cazul n b = 1 procedura de mai sus se reduce la CQR. Instrucţiunile 1.2, 1.4, 1.5.3 

şi 1.5.7 efectuează transferul datelor între memoria principală şi cea rapidă. 

În final, subliniem că procedurile de acumulare şi transformare GCQR şi 

MCQR pot fi de asemenea reformulate la nivel de bloc, procedând în esenţă ca la 

pasul 1.5 al algoritmului de mai sus. 

3.4.4 Alte metode de ortogonalizare 

Factorizarea QR a unei matrice monice A ∈ C m×n poate fi calculată utilizând procedurile 

de ortogonalizare de tip Gram-Schmidt, care constituie analogul schemelor 

compacte Crout şi Doolittle, cunoscute din secţiunea 2.4. 

Considerând relaţia A = Q ′ R şi partiţionând A şi Q ′ pe coloane, putem scrie 

⎡ 

⎤ 

r 11 . . . r 1j . . . r 1n 

. .. 

. . 

. . 

[a 1 . . . a j . . .a n ] = [q 1 . . . q j . . . q n ] 

r jj . . . r jn 

. 

⎢ 

⎣ 

. ⎥ .. . ⎦ 

r nn 

Egalând primele coloane avem 

a 1 = q 1 r 11 ,


unde vectorul q 1 este normat, i.e. ‖q 1 ‖ = 1, deci r 11 = ‖a 1 ‖ şi q 1 = a 1 /r 11 . În 

general avem 

a j = q 1 r 1j + . . . + q j−1 r j−1,j + q j r jj , 

unde q k ⊥ q j , deci q H k a j = r kj , k = 1 : j − 1, iar q j este şi el normat, deci 

∑j−1 

r jj = ‖a j − q k r kj ‖. 

Procedura de ortogonalizare Gram-Schmidt astfel obţinută este următoarea. 

k=1 

GS 

% Procedura Gram-Schmidt (schema jk) 


1. q j = a j 

2. Pentru k = 1 : j − 1 

1. r kj = qk Hq j 

3. q j ← q j − ∑ j−1 

k=1 q kr kj 

4. r jj = ‖q j ‖ 

5. q j ← q j /r jj 

Prin rearanjarea buclelor procedurii GS şi actualizarea coloanei curente q j imediat 

după calculul unui coeficient r kj , se obţine procedura de ortogonalizare Gram- 

Schmidt modificată. 

MGS 

% Procedura Gram-Schmidt modificată (schema kj) 


1. q k = a k 


1. r kk = ‖q k ‖ 

2. q k ← q k /r kk 

3. Pentru j = k + 1 : n 

1. r kj = q H k q j 

2. q j ← q j − q k r kj 

Aici este important să subliniem că, deşi cele două proceduri sunt echivalente din 

punct de vedere matematic, iar numărul de operaţii este acelaşi în ambele cazuri, 

N GS = 2mn 2 , totuşi performanţele lor numerice sunt diferite. Procedura GS este 

numeric instabilă atât ca mijloc de calcul al factorizării QR cât şi ca metodă de 

rezolvare a problemei CMMP. În schimb, procedura MGS furnizează o factorizare 

QR satisfăcătoare (în sensul că, de regulă, vectorii calculaţi q j rezultă ortogonali 

în precizia de lucru) şi constituie totodată un algoritm numeric stabil pentru rezolvarea 

problemei CMMP. De aceea, în multe situaţii, procedura MGS (implementată 

îngrijit) poate constitui o alternativă viabilă faţă de perechea QR, GQR, 

relativ mai costisitoare.


3.4.5 Factorizarea QL 

În unele aplicaţii matricea A este adusă la forma inferior triunghiulară în raport cu 

diagonala secundară care începe din colţul dreapta-jos, i.e. 

Q H A = L, (3.75) 

unde l ij = 0, i < m − n + j, j = 1 : n, iar Q este unitară. (Pentru simplitate am 

presupus m ≥ n.) 

Procesul de triangularizare parcurge coloanele în ordine inversă, începând cu 

ultima şi anulează elementele situate deasupra diagonalei secundare utilizând reflectori 

modificaţi. Notând reflectorii cu indicele coloanei în care se păstrează vectorii 

Householder corespunzători, putem scrie 

iar procedura de calcul poate fi rezumată astfel. 

QL 

Q H = Q H 1 Q H 2 . . . Q H n , (3.76) 

% Schema de triangularizare QL, cazul m ≥ n 

1. Pentru k = n : −1 : 1 

1. Se generează Q k a.î. (Q H k A) ik = 0, i = 1 : m − n + k − 1 

2. A ← Q H k A 

La pasul 1.1 se utilizează o procedură de tip mRFG (vezi tabelul 3.1), iar la 

pasul 1.2 se modifică numai primele m − n + k elemente din coloanele j = 1 : k − 1, 

utilizând procedura corespunzătoare mRF. 

Aplicaţiile procedurii de triangularizare QL sunt perfect similare cu aplicaţiile 

descrise mai sus ale procedurii QR (vezi problemele 3.42, 3.43). 

3.5 Rezolvarea problemei CMMP 

Revenim acum la problema (3.4) din secţiunea introductivă a acestui capitol şi, pentru 

generalitate, considerăm versiunea ei complexă. Fie A ∈ C m×n o matrice dată şi 

b ∈ C m un vector arbitrar. Problema CMMP constă în determinarea pseudosoluţiei 

x ∗ ∈ C n a sistemului Ax = b astfel încât norma euclidiană a reziduului r = b − Ax 

să fie minimă, i.e. 

‖b − Ax ∗ ‖ = min ‖b − Ax‖. (3.77) 

x∈Cn În primul rând, vom stabili condiţiile în care problema (3.77) este bine definită, 

i.e. are o soluţie unică. 

Teorema 3.3 Oricare ar fi vectorul b ∈ C m , problema (3.77) are o soluţie unică 

dacă şi numai dacă matricea A ∈ C m×n este monică, i.e. m ≥ n şi rangA = n. 

În acest caz, pseudosoluţia în sensul CMMP a sistemului Ax = b poate fi scrisă 

în forma 

x ∗ = A + b, (3.78) 

în care matricea A + ∈ C n×m este prin definiţie pseudoinversa lui A şi are expresia 

A + = (A T A) −1 A T (3.79)

3.5. REZOLVAREA PROBLEMEI CMMP 163 

Demonstraţie. Vom stabili pe rând a) existenţa şi b) unicitatea pseudosoluţiei x ∗ . 

a) Pentru a demonstra existenţa, nu e necesar să presupunem că matricea A 

este monică. Considerăm subspaţiul S = ImA şi fie S ⊥ = KerA H complementul 

său ortogonal în C m . Vectorul b poate fi scris în mod unic sub forma b = b 1 + b 2 , 

unde b 1 ∈ S şi b 2 ∈ S ⊥ sunt proiecţiile ortogonale ale lui b pe S şi respectiv S ⊥ . 

Avem 

r = b − Ax = b 2 + (b 1 − Ax), (3.80) 

unde b 1 ∈ S, Ax ∈ S implică b 1 − Ax ∈ S, deci b 2 şi b 1 − Ax sunt ortogonali, 

∀x ∈ C n , vezi figura 3.6. Aplicând teorema lui Pitagora obţinem 

‖b − Ax‖ 2 = ‖b 1 − Ax + b 2 ‖ 2 = ‖b 1 − Ax‖ 2 + ‖b 2 ‖ 2 ≥ ‖b 2 ‖ 2 , ∀x ∈ C n . (3.81) 

Întrucât b 1 ∈ S = ImA, există (cel puţin) un x ∗ ∈ C n astfel încât 

Ax ∗ = b 1 , (3.82) 

iar din (3.81) se vede că orice astfel de x ∗ are proprietatea (3.77) şi reciproc. 

Existenţa pseudosoluţiei x ∗ este demonstrată. 

Relaţia (3.82) arată că cea mai bună aproximare b ∗ = Ax ∗ a lui b pe S = ImA 

coincide cu proiecţia ortogonală b 1 , deci b ∗ = b 1 există întotdeauna şi este unic 

determinată oricare ar fi A. Această afirmaţie constituie lema proiecţiei ortogonale 

şi reprezintă generalizarea unui fapt binecunoscut din geometria elementară. Pe 

scurt (vezi (3.77) şi figura 3.6), distanţa minimă de la un punct b la un subspaţiu 

S este lungimea (euclidiană) a perpendicularei duse din b pe S. 

Consideraţiile geometrice de mai sus pot fi exprimate analitic. Notând 

r ∗ = b − Ax ∗ , din (3.80) şi (3.82) se vede că r ∗ = b 2 , unde b 2 ∈ S ⊥ = KerA H , 

deci A H r ∗ = 0. Prin urmare avem 

[ ] [ ] [ ] 

Im A r 

∗ b 

A H 0 x ∗ = , (3.83) 

0 

de unde, eliminând r ∗ între cele două ecuaţii, rezultă 

A H Ax ∗ = A H b. (3.84) 

b) Din (3.82), pseudosoluţia x ∗ e unic determinată dacă şi numai dacă 

A(x − x ′ ) = 0 implică x = x ′ , adică KerA = {0}, sau, echivalent, A este monică. 

În acest caz, gramianul G = A H A este o matrice pozitiv definită, deci inversabilă 

(vezi demonstraţia teoremei 3.2), iar din (3.84) rezultă imediat (3.78) şi (3.79). ♦ 

Observaţia 3.5 Sistemul liniar (3.83), de ordin m+n, se numeşte sistemul extins 

asociat problemei CMMP. Matricea acestui sistem este hermitică de semn nedefinit 

şi are o structură particulară remarcabilă. Prin rezolvarea acestui sistem putem 

calcula atât pseudosoluţia x ∗ cât şi reziduul de normă minimă r ∗ . Procedurile de 

calcul corespunzătoare vor fi expuse mai jos 16 . 

16 În principiu, sistemul extins poate fi rezolvat utilizând procedurile de factorizare cvasidiagonală 

descrise în secţiunea 2.10, dar acestea nu sunt eficiente în cazul de faţă deoarece nu 

exploatează structura specială a sistemului considerat (vezi problema 3.52).


S = ImA 

b 2 

❈❈❖ 

✻ ❈ 

b ❈ b − Ax 

❈ 

❈ 

❈ 

❈ 

❙♦ ❈ 

✏ ✏✏✏ ✏✶ 

✁ ✁✁✁✁✁✁✁✁✁✕ b 1 

❳ ❙b 1 ❈ − Ax 

❳ ❳ ❳❳❳ ❙ ❈ 

Ax ❳❳3 ❙❈ 

T = S ⊥ 

Fig. 3.6: Lema proiecţiei ortogonale 

Sistemul liniar (3.84), de ordin n, se numeşte sistemul de ecuaţii normale, pe 

scurt sistemul normal asociat problemei CMMP. Dacă matricea A e monică, gramianul 

G este o matrice hermitică pozitiv definită, iar pseudosoluţia x ∗ coincide cu 

soluţia sistemului normal. La fel ca în observaţia 3.4, această echivalenţă poate fi 

exploatată în două sensuri. 

a) Pseudosoluţia x ∗ a sistemului Ax = b poate fi determinată prin rezolvarea 

sistemului normal asociat. Schema de calcul este următoarea: 

S Ch 

1. Se formează c = A H b 

2. Se formează G = A H A 

3. Se efectuează factorizarea Cholesky G = R H 1 R 1 

4. Se calculează x ∗ rezolvând succesiv sistemele 

triunghiulare R H 1 y = c şi R 1x ∗ = y. 

Trebuie însă să subliniem că, la fel ca în observaţia 3.4, această metodă (deşi 

relativ economică şi extrem de compactă) nu este recomandabilă din punct de vedere 

numeric, deoarece matricea G = A H A este rău condiţionată. Cu precauţie, ea poate 

fi avută în vedere, în special dacă m ≫ n, iar economia de memorie realizată prin 

formarea lui G constituie un obiectiv esenţial. 

b) Soluţiile unor sisteme liniare cu matrice pozitiv definite având structură de 

gramian pot fi determinate aplicând ideea algoritmilor de rădăcină pătrată bazaţi 

pe utilizarea transformărilor unitare (vezi observaţia 3.4). Acest mod de lucru, 

frecvent utilizat în practica actuală, este ilustrat prin problema 3.46. ♦ 

3.5.1 Calculul pseudosoluţiei 

Având în vedere teorema 3.3, peste tot mai departe vom presupune că matricea 

A ∈ C m×n este monică.


Rezolvarea problemei CMMP se poate face utilizând informaţia furnizată de 

algoritmul de triangularizare ortogonală QR, i.e. 

[ R 

Q H ′ 

A = 

0 

] }n 

}m − n , QH = Q H n . . . QH 2 QH 1 , (3.85) 

unde Q este unitară, iar R ′ este superior triunghiulară inversabilă. Aplicând transformarea 

Q H ambilor membri ai sistemului Ax = b şi notând 

[ ] 

Q H d 

′ }n 

b = d, d = 

d ′′ }m − n , (3.86) 

obţinem sistemul unitar echivalent 

[ R 

′ 

0 

] 

x = 

[ d 

′ 

d ′′ ] }n 

}m − n . (3.87) 

În general, în (3.87) avem d ′′ ≠ 0, deci sistemul dat Ax = b este incompatibil. 

Pentru a determina pseudosoluţia x ∗ , considerăm reziduul r = b − Ax. Din 

(3.87) rezultă 

[ ] d 

Q H r = 

′ − R ′ x 

d ′′ , (3.88) 

unde matricea Q H este unitară, deci ‖r‖ = ‖Q H r‖. Prin urmare 

‖r‖ 2 = ‖Q H r‖ 2 = ‖d ′ − R ′ x‖ 2 + ‖d ′′ ‖ 2 ≥ ‖d ′′ ‖ 2 , ∀x ∈ C n . (3.89) 

Efectuând minimizarea în raport cu x indicată în (3.77) obţinem 

R ′ x ∗ = d ′ , (3.90) 

deci soluţia în sens CMMP a sistemului supradeterminat Ax = b coincide cu soluţia 

sistemului superior triunghiular nesingular reprezentat de primele n ecuaţii din 

(3.87) 17 . Pe scurt, avem 

x ∗ = [(R ′ ) −1 0]Q H b (3.91) 

sau echivalent 

x ∗ = (R ′ ) −1 Q ′H b. (3.92) 

Procedural, soluţia problemei CMMP (3.77) este determinată de relaţiile (3.86) 

şi (3.90). Ţinând cont de structura lui Q H din (3.85), se vede uşor că transformările 

(3.86) pot fi efectuate (pe loc în b), utilizând o procedură de tip MQR. Schema de 

calcul astfel obţinută este următoarea 

SQR 

% Calculul pseudosoluţiei x = A + b 


1.b ← Q H k b 

2. Se rezolvă sistemul triunghiular R ′ x = b(1 : n) 

17 Raţionamentul de mai sus constituie o nouă demonstraţie, de data aceasta constructivă, a 

teoremei 3.3. Relaţiile (3.80-3.82) şi (3.88-3.90) se corespund în mod evident.


Cu referire la algoritul 3.5, care utilizează reflectori hermitici, implementarea 

schemei SQR are loc astfel. 

Algoritmul 3.8 (SQR – problema liniară a celor mai mici pătrate) 

(Se dă un vector b ∈ C m . Utilizând ieşirea algoritmului 3.5, se calculează 

în x soluţia în sens CMMP a sistemului liniar Ax = b. Se presupune că 

matricea A este monică.) 

% se aplică transformările vectorului b 


1. t = a kk 

2. a kk ← u kk = β k 

3. α = − ( ∑ m 

i=k ūikb i )/β k 

4. b i ← b i + αu ik , pentru i = k : m 

5. a kk = t 

% calculul soluţiei problemei CMMP 

2. Pentru k = n : −1 : 1 

1. x k = (b k − ∑ n 

j=k+1 a kjx j )/a kk 

Comentarii. În cazul real, algoritmul 3.8 necesită N op = N m + n 2 = 4mn − n 2 

operaţii. Modul de apel este x = SQR(A, β, b). Reţinem că determinarea pseudosoluţiei 

prin apelarea succesivă a procedurilor QR şi SQR necesită asimptotic N QR 

operaţii, i.e. principalul efort de calcul se consumă pentru triangularizarea ortogonală 

a matricei A. 

♦ 

În cazul utilizării algoritmului CQR, implementarea schemei SQR este următoarea. 

SCQR 

% Calculul pseudosoluţiei. 


1. CRF(A(k : m, k), τ k , b(k : m)) 

2. x = UTRIS(A(1 : n,:), b(1 : n)) 

Pe baza informaţiilor furnizate de schema SQR, putem calcula uşor şi reziduul 

de normă minimă r ∗ = b −Ax ∗ , obţinând astfel soluţia completă a sistemului extins 

(3.83). Din (3.88) şi (3.90) obţinem imediat 

[ ] 

r ∗ 0 

= Q 

d ′′ , (3.93) 

în care d ′′ are semnificaţia din (3.86). Prin urmare, având în vedere că vectorul 

transformat b ← d = Q H b a fost deja calculat la pasul 1, r ∗ poate fi obţinut (pe loc 

în b) completând schema SQR cu secvenţa 

3. b(1 : n) = 0 

4. Pentru k = n : −1 : 1 

1. b ← Q k b


În rezumat, fiind date matricea A şi vectorul b, calculul pseudosoluţiei x ∗ a 

sistemului Ax = b şi al reziduului de normă minimă r ∗ constă în triangularizarea 

ortogonală a matricei A, urmată de aplicarea schemei SQR completată aşa cum am 

spus mai sus. Utilizând procedurile cunoscute QR, MQR şi UTRIS, algoritmul 

de calcul se redactează concis astfel. 

CMMP 

% Rezolvarea completă a problemei CMMP. 

0. [A, β] = QR(A) 

1. b = MQR( ′ da ′ , A, β, b) 

2. x = UTRIS(A(1 : n, :), b(1 : n)) 

3. b(1 : n) = 0 

4. b = MQR( ′ nu ′ , A, β, b) 

Subliniem că la pasul 2 pseudosoluţia x ∗ nu se calculează pe locul membrului 

drept b, tocmai având în vedere utilizarea acestui spaţiu la paşii 3 şi 4 pentru 

memorarea lui r ∗ . Deseori în practică, pentru aprecierea gradului de incompatibilitate 

a sistemului Ax = b, este suficient calculul normei ρ = ‖r ∗ ‖. Evident, 

avem ρ = ‖b(n + 1 : m)‖, unde b este vectorul transformat obţinut la pasul 1 al 

procedurilor SQR sau CMMP. 

3.5.2 Calculul proiecţiilor 

În numeroase aplicaţii prezintă interes calculul proiecţiilor ortogonale b 1 şi b 2 ale 

unui vector b pe subspaţiile S = ImA şi respectiv S ⊥ = KerA H . 

Din demonstraţia teoremei 3.5 (vezi figura 3.6) a rezultat că proiecţia b 2 a lui b pe 

S ⊥ coincide cu reziduul de normă minimă r ∗ , deci se calculează aplicând procedura 

CMMP din care pasul 2 se omite 18 . 

În mod similar proiecţia b 1 a lui b pe S, care coincide cu vectorul de cea mai 

bună aproximaţie b ∗ = Ax ∗ , are expresia 

[ ] 

b ∗ d 

′ 

= Q , (3.94) 

0 

deci se calculează aplicând aceeaşi procedură CMMP în care pasul 3 se înlocuieşte 

cu 

3 ′ . b(n + 1 : m) = 0. 

Subliniem că, pentru siguranţa calculului, proiecţiile b 1 = b ∗ şi b 2 = r ∗ se 

determină întotdeauna utilizând relaţiile (3.86), (3.93) şi (3.94), în care au loc numai 

transformări ortogonale. În special, nu se recomandă utilizarea relaţiilor ”evidente” 

b ∗ = Ax ∗ şi r ∗ = b − Ax ∗ sau b 1 + b 2 = b, aparent mai simple, deoarece acestea din 

urmă pot conduce la erori catastrofale de anulare prin scădere. De asemenea, este 

esenţial să reţinem că determinarea proiecţiilor precum şi calculul pseudosoluţiei 

se efectuează operând direct asupra vectorului b, fără a forma explicit proiectorii 

ortogonali P 1 , P 2 sau pseudoinversa A + . 

18 Tocmai în virtutea acestei semnificaţii geometrice remarcabile, reziduul r ∗ = b − Ax ∗ poate fi 

calculat fără a determina în prealabil pseudosoluţia x ∗ . În general, toate calculele se fac utilizând 

exclusiv informaţiile obţinute la paşii 0 şi 1 ai procedurii CMMP, fără nici o referire la datele 

iniţiale A, b care, de altfel, au şi fost distruse.


3.5.3 Problema CMMP cu membru drept multiplu 

Fie acum A ∈ C m×n o matrice dată şi B ∈ C m×p o matrice arbitrară cu p coloane, 

unde p ≥ 1. Problema rezolvării în sensul CMMP a sistemului cu membru drept 

multiplu AX = B constă în determinarea pseudosoluţiei X ∗ ∈ C n×p astfel încât 

norma Frobenius a reziduului matriceal R = B − AX să fie minimă, pe scurt 

‖B − AX ∗ ‖ F = 

min 

X∈C n×p ‖B − AX‖ F. (3.95) 

Analiza acestei probleme este simplă. Partiţionând matricele B, X şi R pe 

coloane, cu notaţii clare putem scrie r j = b j −Ax j , j = 1 : p. Pe de altă parte, prin 

definiţia normei Frobenius avem 

‖R‖ 2 F = 

p∑ 

‖r j ‖ 2 . (3.96) 

j=1 

În consecinţă, problema de minimizare (3.95) este echivalentă cu p probleme CMMP 

de tip (3.77), având aceeaşi matrice A şi membri drepţi diferiţi, i.e. 

‖b j − Ax ∗ j ‖ = min 

x∈C n ‖b j − Ax‖, j = 1 : p. (3.97) 

Prin urmare, dacă matricea A este monică, atunci conform teoremei 3.3 fiecare 

problemă (3.97) are o soluţie unică x ∗ j = A + b j , j = 1 : p, iar matricea 

X ∗ = [x ∗ 1 . . . x∗ p ], rezultată prin agregarea acestora constituie soluţia unică 

X ∗ = A + B (3.98) 

a problemei (3.95). 

Procedural, pseudosoluţia X ∗ ∈ C n×p se calculează simplu, efectuând o singură 

dată triangularizarea ortogonală a matricei A şi aplicând apoi repetat algoritmul 

de rezolvare SQR fiecărei coloane B(:, j), j = 1 : p, a matricei B. Dacă 

în plus se doreşte calculul reziduului de normă Frobenius minimă R ∗ = B − AX ∗ , 

atunci se aplică procedura CMMP în care vectorul b se înlocuieşte peste tot cu matricea 

B. Desigur, în acest nou context pot fi aplicate avantajos (pe calculatoarele 

cu memorie ierarhică) procedurile bloc de triangularizare ortogonală şi aplicare a 

transformărilor, expuse în secţiunea 3.4.4. 

3.5.4 Calculul pseudoinversei 

Matricea pseudoinversă A + , definită prin (3.78) are multe proprietăţi interesante 

şi, în principiu, poate fi calculată în multe feluri. 

În primul rând, utilizând relaţia (3.79), constatăm imediat că 

1 ◦ A + A = I n 

2 ◦ AA + = (AA + ) H . 

Prima relaţie afirmă că A + este o inversă la stânga a matricei A; în particular, 

rangA + = n, deci A + este epică. A doua relaţie, în combinaţie cu prima, arată


că matricea hermitică P 1 = AA + coincide cu proiectorul ortogonal pe subspaţiul 

S = ImA. Prin urmare, relaţiile 1 ◦ şi 2 ◦ determină unic matricea A + cu expresia 

(3.79). Din nefericire, (3.79) este improprie din punct de vedere numeric, deoarece 

implică inversarea gramianului G = A H A. 

În al doilea rând, punând B = I m din (3.98) găsim X ∗ = A + . Prin urmare, 

având în vedere (3.95), A + este soluţia unică a problemei de minimizare 

‖I m − AA + ‖ F = 

min 

X∈C n×m ‖I m − AX‖ F . (3.99) 

Nici această constatare, deşi teoretic extrem de interesantă, nu are însă utilitate 

calculatorie. Determinarea lui A + prin rezolvarea sistemului AX = I m utilizând 

procedura CMMP este evident neeficientă, deoarece aplicarea transformărilor de la 

pasul 1 nu ţine seama de structura specială a membrului drept B = I m . 

În sfârşit, din (3.78), prin identificare cu (3.91), (3.92) rezultă 

A + = [(R ′ ) −1 0]Q H , respectiv A + = (R ′ ) −1 Q ′H , (3.100) 

în care apar direct elementele factorizării QR a matricei A. În consecinţă, A + 

poate fi calculată efectuând triangularizarea ortogonală a matricei A şi utilizând 

informaţia astfel obţinută pentru a explicita oricare dintre relaţiile (3.100). 

a) În primul caz se calculează inversa matricei triunghiulare R′ şi apoi se aplică 

transformarea Q H la dreapta inversei extinse cu zerouri, utilizând o procedură de 

tip MQRd. 

b) În al doilea caz se acumulează matricea Q′ utilizând procedura GQR şi apoi 

se rezolvă sistemul superior triunghiular R ′ A + = Q ′H 19 . 

Detaliile de implementare precum şi analiza algoritmilor de calcul astfel obţinuţi 

sunt propuse cititorului ca exerciţii. 

Întrucât matricea A + este rareori necesară ca atare în calcule, iar formarea sa 

explicită este costisitoare, în practică se recomandă evitarea determinării lui A + în 

favoarea rezolvării în sens CMMP a unui sistem AX = B definit în mod adecvat. O 

observaţie similară este valabilă relativ la proiectorii P 1 şi P 2 . Calculul proiecţiilor 

se face direct, după cum am arătat în secţiunea 3.5.2. 

3.5.5 Alte metode de rezolvare a problemei CMMP 

Calculul pseudosoluţiei x ∗ a sistemului Ax = b se poate face utilizând factorizarea 

QR a matricei furnizată de procedura Gram-Schmidt modificată din secţiunea 3.4.4. 

Pe scurt, avem A = Q ′ R ′ , unde ambele matrice Q ′ şi R ′ sunt formate explicit de 

procedura MGS, iar relaţia (3.92) spune că x ∗ = (R ′ ) −1 Q ′H b. Partiţionând Q ′ pe 

coloane, schema de calcul este următoarea. 

SMGS 

% Calculul pseudosoluţiei. 


1. x j ← d j = q H j b 

2. Se rezolvă sistemul triunghiular R ′ x = d ′ 

19 Amintim că procedura GQR calculează Q ′ pe loc în A. Prin urmare, matricea Y = (A + ) H 

poate fi obţinută tot în A, rezolvând sistemul inferior triunghiular Y (R ′ ) H = Q ′ .


Numărul de operaţii este N op = 2mn + n 2 , prin urmare calculul pseudosoluţiei 

prin apelarea succesivă a procedurilor MGS şi SMGS cere asimptotic N GS > N QR 

operaţii. 

Desigur, procedura de triangularizare ortogonală este mai economică deoarece 

nu formează explicit matricea Q ′ , totuşi simplitatea procedurii MGS este uneori 

atractivă. Realmente neplăcută aici este absenţa matricei de completare Q ′′ pe 

care procedura MGS nu o poate calcula. În consecinţă, calculul reziduului de normă 

minimă nu se poate face acum decât pe baza relaţiei r ∗ = b − Ax ∗ , ceea ce necesită 

păstrarea unor copii ale datelor de intrare A, b. În plus, dacă sistemul Ax = b este 

”aproape” compatibil, i.e. vectorii b şi b ∗ = Ax ∗ sunt apropiaţi, atunci calculul 

lui r ∗ este ameninţat de erori catastrofale şi, de aceea, trebuie efectuat lucrând în 

dublă precizie (vezi secţiunea 2.7). 

3.6 Sisteme liniare subdeterminate 

Rezolvarea sistemelor liniare subdeterminate necesită o procedură specifică de triangularizare 

ortogonală la dreapta, pe care o vom expune în prima parte a acestei 

secţiuni. În continuare vom construi factorizarea LQ corespunzătoare, iar în final 

vom prezenta procedura de rezolvare a problemelor CMMP de tip (3.5). 

3.6.1 Triangularizarea ortogonală la dreapta 

Propoziţia 3.3 Oricare ar fi A ∈ C m×n , există o matrice unitară V H not 

= Z ∈ 

C n×n astfel încât matricea 

AV H = L, respectiv AZ = L, (3.101) 

este inferior triunghiulară. 

În cazul real A ∈ R m×n , matricea de transformare V T = Z poate fi aleasă (reală 

şi) ortogonală, deci L rezultă reală. 

Pe scurt, orice matrice A este unitar echivalentă la dreapta cu o matrice inferior 

triunghiulară. Prima relaţie arată că A poate fi scrisă sub forma unui produs 

A = LV , unde V este unitară, iar L este inferior triunghiulară. În calculul numeric 

o relaţie de acest tip se numeşte factorizare LQ, de aceea procedurile de calcul 

stabilite pe baza relaţiei fundamentale (3.101) vor fi notate cu sigla LQ. 

Demonstraţia rezultă imediat aplicând teorema 3.1 matricei B = A H . 

Într-adevăr, dacă V A H = R este superior triunghiulară, atunci are loc (3.101), 

unde L = R H este evident inferior triunghiulară 20 . 

♦ 

Având în vedere că operaţia de transpunere şi conjugare este costisitoare, în 

practica profesională se operează direct asupra matricei date A ∈ C m×n . Notăm ca 

de obicei s = min(m, n) şi fie Z k reflectorii utilizaţi în scopul anulării elementelor 

20 Corespondenţa A → A H se numeşte dualitate, iar rezultatele şi relaţiile asociate prin această 

corespondenţă se numesc duale. De exemplu, relaţiile (3.53) şi (3.101) sunt duale.

3.6. SISTEME LINIARE SUBDETERMINATE 171 

situate la dreapta diagonalei principale, din liniile matricei A, la etapele k = 1 : s. 

Similar cu (3.56), matricea de transformare are structura 

iar schema de triangularizare este următoarea 

V H = Z = Z 1 Z 2 . . . Z s (3.102) 

LQ 

% Schemă generală de triangularizare LQ 


1. Se generează Z k a.î. (AZ k ) kj = 0, j = k + 1 : n 

2. A ← AZ k . 

• În cazul real sau în cazul utilizării reflectorilor hermitici (Z k = Zk H ), componentele 

v kj , j = k + 1 : n, ale vectorilor Householder v k se memorează natural pe 

poziţiile elementelor anulate. Algoritmul rezultat poate fi redactat astfel. 

Algoritmul 3.9 (LQ – triangularizare ortogonală la dreapta cu reflectori 

hermitici) (Se dă A ∈ C m×n . Se efectuează triangularizarea 

ortogonală la dreapta a matricei A, i.e. AZ = L, unde Z = Z 1 Z 2 . . .Z s , 

iar Z k sunt reflectori hermitici. Partea esenţială v k (k+1 : n) a vectorilor 

Householder v k se memorează pe poziţiile corespunzătoare A(k, k + 1 : n). 

La aplicarea ulterioară a transformărilor se ţine seama că v kk = β k , 

k = 1 : s. Elementele nenule ale matricei inferior triunghiulare L 

suprascriu elementele corespunzătoare din triunghiul inferior al matricei 

A.) 


1. β k = 0 

2. Dacă k < n atunci 

1. σ = ‖A(k, k : n)‖ 


1. Dacă a kk ≠ 0 atunci σ ← ākk 

|a kk | σ 

2. a kj ← v kj = ā kj /σ, pentru j = k : n 

3. β k ← v kk = 1 + a kk 

4. Pentru i = ( k + 1 : m 

∑n 

) 

1. α = − 

j=k a ijv kj /β k 

2. a ij ← a ij + α¯v kj , pentru j = k : n 

% elementul diagonal 

5. a kk = −¯σ 

Comentarii. În cazul real algoritmul 3.9 necesită N LQ = 2nm 2 − m 3 /3 operaţii 

şi este numeric stabil, după cum vom arăta în secţiunea 3.8. Modul de apel este 

[A, β] = LQ(A), unde β este vectorul real cu componentele β k , k = 1 : s, iar A 

apare ca tablou de intrare-ieşire. 

♦ 

•• În cazul utilizării reflectorilor complecşi, detaliile sunt propuse cititorului ca 

exerciţiu.


3.6.2 Factorizarea LQ 

În această secţiune construim factorizarea LQ a unei matrice A ∈ C m×n de formă 

generală. 

În cazul m ≤ n, relaţiile (3.101) şi (3.102) pot fi scrise sub forma 

unde matricea 

A = LV, L = [ L ′ 

}{{} 

m 

}{{} 

0 

n−m 

], (3.103) 

V = Z H m . . .Z H 2 Z H 1 (3.104) 

este unitară, iar L ′ este inferior triunghiulară de ordin m. Partiţionând V = Z H 

conform cu L, i.e. 

[ ] V 

′ }m 

V = 

V ′′ }n − m , Z = [ }{{} 

Z′ }{{} 

Z ′′ ] (3.105) 

m n−m 

din (3.103) deducem 

A = L ′ V ′ , (3.106) 

unde evident V ′ = Z ′H are liniile ortogonale, i.e. V ′ V ′H = I m . 

Propoziţia 3.4 Orice matrice A ∈ C m×n cu m ≤ n poate fi scrisă sub forma 

(3.106), unde V ′ ∈ C m×n are liniile ortogonale, iar L ′ ∈ C m×m este inferior 

triunghiulară. Prin definiţie, relaţia (3.106) constituie factorizarea LQ a matricei 

A. Dacă A este epică, atunci L ′ rezultă inversabilă şi reciproc. 

Demonstraţia ultimei afirmaţii este evidentă. Mai mult, dacă A este epică, 

atunci matricea hermitică G = AA H este pozitiv definită, prin urmare considerând 

factorizarea Cholesky G = L 1 L H 1 şi definind V 1 = L −1 

1 A, putem stabili cu uşurinţă 

unicitatea factorizării LQ, în care factorul triunghiular L ′ are elementele diagonale 

pozitive. 

♦ 

În general, matricea hermitică pozitiv semidefinită G = AA H se numeşte gramian 

al (liniilor) lui A. Observaţia 3.4 se reformulează corespunzător în noul context. 

Dacă matricea A este epică, atunci matricea Z ′′ din (3.105) are o semnificaţie 

geometrică remarcabilă. Din (3.101) sau (3.103) rezultă AZ = [L ′ 0], unde Z are 

structura (3.105), deci 

AZ ′′ = 0. (3.107) 

Mai mult, Z ′′ ∈ C n×(n−m) are coloanele ortogonale, deci constituie o bază ortogonală 

a subspaţiului N = KerA. Proiectorul ortogonal pe N este P 2 = Z ′′ Z ′′H . 

În mod similar, matricea Z ′ ∈ C n×m (care, în (3.105), completează Z ′′ până 

la o matrice ortogonală) constituie o bază ortogonală a subspaţiului complementar 

N ⊥ = ImA H . Proiectorul ortogonal pe S este P 1 = A H (AA H ) −1 A sau mai simplu 

P 1 = Z ′ Z ′H . Pe scurt, partiţia (3.105) corespunde descompunerii ortogonale 

C n = ImA H ⊕ KerA. (3.108)


Acumularea transformărilor 

În cazul m ≤ n, factorizarea LQ a matricei A poate fi determinată utilizând procedura 

de triangularizare ortogonală la dreapta din secţiunea anterioară. Factorul 

triunghiular L ′ se obţine ca atare în triunghiul inferior al matricei A, iar factorul 

ortogonal V ′ poate fi calculat sub forma 

V ′ = [I m 0]V = [I m 0]Z H m . . . Z H 2 Z H 1 , (3.109) 

aplicând următoarea schemă evidentă de acumulare a transformărilor. 

GLQ % Acumularea primelor n linii V ′ ale matricei V = Z H , m ≤ n. 

1. V ′ = [I n 0] 

2. Pentru k = m : −1 : 1 

1. V ′ ← V ′ Z H k 

Cu referire la algoritmul 3.9, calculul poate fi organizat pe loc în tabloul A, 

iar procedura poate fi scrisă cu uşurinţă de cititorul interesat. Menţionăm însă că 

formarea explicită a matricelor V ′ sau Z ′ , Z ′′ etc. este de regulă contraindicată. 

Aproape întotdeauna forma factorizată (3.102) este suficientă. 

Aplicarea transformărilor 

La fel ca în secţiunea 3.4, matricea unitară Z generată de algoritmul de triangularizare 

LQ aplicat matricei A se utilizează pentru a transforma adecvat o altă 

matrice dată B. 

Aplicarea transformării 

se face partiţionând B pe coloane: 

B ← ZB = Z 1 Z 2 . . . Z s B (3.110) 

MLQ % Aplicarea transformării B ← ZB, unde Z = Z 1 Z 2 . . . Z s . 

1. Pentru k = s : −1 : 1 

1. B ← Z k B 

Procedând în acelaşi spirit, toate rezultatele din secţiunea 3.4 pot fi reformulate 

în contextul factorizării LQ. Stabilirea versiunii la nivel de bloc a procedurii de 

triangularizare la dreapta precum şi a procedurilor de ortogonalizare Gram-Schmidt 

sunt propuse cititorului ca exerciţii. 

Factorizarea RQ 

În unele aplicaţii matricea A este adusă la forma superior triunghiulară în raport 

cu diagonala secundară care începe din colţul dreapta-jos, i.e. 

AZ = R, (3.111) 

unde r ij = 0, j < n − m + i, i = 1 : m, iar Z este unitară. (Pentru simplitate am 

presupus m ≤ n.)


Procesul de triangularizare la dreapta parcurge liniile în ordine inversă, începând 

cu ultima şi anulează elementele situate la stânga diagonalei secundare utilizând 

reflectori modificaţi. Notând reflectorii cu indicele liniei în care se păstrează vectorii 

Householder corespunzători, putem scrie 

iar procedura de calcul poate fi rezumată astfel. 

Z = Z m . . .Z 2 Z 1 , (3.112) 

RQ 

% Schema de triangularizare RQ, cazul n > m 

1. Pentru k = m : −1 : 1 

1. Se generează Z k a.î. (AZ k ) kj = 0, j = 1 : n − m + k − 1 

2. A ← AZ k 

La pasul 1.1 se utilizează o procedură de tip mRFG (vezi tabelul 3.1), iar la 

pasul 1.2 se modifică numai primele n − m + k elemente din liniile i = 1 : k − 1, 

utilizând procedura corespunzătoare mRF. 

Aplicaţiile procedurii de triangularizare RQ sunt perfect similare cu aplicaţiile 

descrise mai sus ale procedurii LQ. 

3.6.3 Rezolvarea sistemelor subdeterminate 

Revenim acum la problema (3.5) din secţiunea introductivă a acestui capitol. Fie 

A ∈ C m×n şi b ∈ C n . Problema constă în determinarea soluţiei normale a sistemului 

Ax = b, i.e. a unui vector x ∗ ∈ C n astfel încât 

‖x ∗ ‖ = min ‖x‖. (3.113) 

Ax=b 

Condiţiile de existenţă şi unicitate ale soluţiei normale pot fi formulate astfel. 

Teorema 3.4 Oricare ar fi b ∈ R m , problema (3.113) are o soluţie unică dacă şi 

numai dacă A este epică, i.e. m ≤ n şi rangA = m. 

În acest caz, soluţia normală x ∗ a sistemului Ax = b poate fi scrisă în forma 

x ∗ = A + b, (3.114) 

în care matricea A + este prin definiţie (pseudo)inversa normală a lui A şi are 

expresia 

A + = A T (AA T ) −1 . (3.115) 

Demonstraţia rezultă uşor (cel puţin în cazul real) utilizând metodele clasice de 

minimizare cu restricţii (problema (3.113) este extrem de simplă). Noi vom proceda 

direct, stabilind pe rând a) unicitatea şi b) existenţa globală a soluţiei x ∗ . 

a) Pentru a demonstra unicitatea, nu e necesar să presupunem că matricea A 

este epică, ci doar că 

b ∈ ImA, (3.116) 

i.e. mulţimea X a soluţiilor sistemului Ax = b nu e vidă. Desigur, în limbaj 

geometric, X este planul (sau varietatea liniară) de ecuaţie Ax = b. Mai precis,


N = KerA 

”planul” 

Ax = b 

✑ ✑✑✑✑✑✑✑✑ ✑ ✑✑✑✑✑✑✑✑ x 

x 2 

✘ ✘ ✘ ✘✘✘ ✘ ✘✘✘ ✘ ✘✘✘ ✘ ✘✘✘ ✘✘✿ 

✁ ✁✁✁✁✕ 

✑ 

✑ 

✑ 

✲✁ ✁✁✁✁✕ 

✑ 

N ⊥ 0 ✑ 

x ✑ 

✑ 

∗ = x 1 

✑ 

✑ 

✑ 

✑ 

✑ 

✑ 

✑ ✑ 

✑ Fig. 3.7: Forma generală a soluţiilor sistemului subdeterminat Ax = b 

teorema 1.3 din capitolul 1 afirmă că X = x 0 + KerA, unde x 0 este o soluţie particulară. 

În consecinţă, conform lemei proiecţiei ortogonale, soluţia x∗ a problemei 

(3.113) coincide cu piciorul perpendicularei din origine pe planul X şi ca atare este 

unic determinată, vezi figura 3.7. 

La fel ca în demonstraţia teoremei 3.3, aceste consideraţii geometrice pot fi 

exprimate analitic. Planul X este paralel cu subspaţiul N = KerA, deci x ∗ ⊥ KerA 

sau x ∗ ∈ N ⊥ = ImA H , i.e. există (cel puţin) un y ∗ ∈ C m astfel încât x ∗ = A H y ∗ . 

(În interpretare variaţională, y∗ este vectorul multiplicatorilor Lagrange asociaţi 

restricţiilor egalitate Ax = b din (3.113).) În definitiv avem 

[ ] [ ] [ 

In A H x 

∗ 0 

A 0 −y ∗ = 

b 

de unde, eliminând x ∗ rezultă 

] 

, (3.117) 

AA H y ∗ = b, x ∗ = A H y ∗ . (3.118) 

b) Existenţa globală a lui x ∗ este asigurată, i.e. (3.116) are loc oricare ar fi 

b ∈ C m , dacă şi numai dacă A este epică. În acest caz, matricea G = AA H este 

pozitiv definită deci inversabilă, iar (3.114) şi (3.115) rezultă din (3.118). ♦ 

Observaţia 3.6 Sistemul extins (3.117) şi sistemul normal (3.118) au o semnificaţie 

similară cu cea a sistemelor (3.83) şi respectiv (3.84) din observaţia anterioară. Si 

aici gramianul G = AA H este o matrice rău condiţionată, astfel încât, în general, 

calculul soluţiei normale prin rezolvarea sistemului (3.118) nu este recomandabil. ♦ 

Calculul soluţiei normale 

Rezolvarea problemei de minimizare cu restricţii (3.113) se poate face utilizând 

informaţiile furnizate de algoritmul de triangularizare ortogonală 

AZ = [L ′ 0], Z = Z 1 Z 2 . . . Z m , (3.119)


unde Z este unitară, iar L ′ este inferior triunghiulară inversabilă. Notăm 

x = Zu, u = 

[ 

u 

′ 

u ′′ ] 

}m 

}n − m 

(3.120) 

şi scriem sistemul Ax = b sub forma echivalentă 

[ ] 

[L ′ u 

′ 

0] 

u ′′ = b, (3.121) 

Relaţia de mai sus arată că, în procesul de minimizare din (3.113), vectorul u ′ = u ′∗ 

este fixat prin 

Lu ′∗ = b, (3.122) 

iar u ′′ este liber. 

Pentru a determina soluţia normală x ∗ , considerăm (3.120), unde Z este ortogonală, 

deci ‖Zu‖ = ‖u‖. Avem 

‖x‖ 2 = ‖Zu‖ 2 = ‖u ′∗ ‖ 2 + ‖u ′′ ‖ 2 ≥ ‖u ′∗ ‖ 2 . (3.123) 

Efectuând minimizarea în raport cu u ′′ , obţinem evident 

u ′′∗ = 0. (3.124) 

Prin urmare soluţia normală este 

x ∗ = Z 

[ 

(L ′ ) −1 b 

0 

] 

, (3.125) 

sau 

x ∗ = Z ′ (L ′ ) −1 b. (3.126) 

Ţinând seama de structura matricei Z din (3.119), se vede uşor că transformarea 

(3.125) poate fi efectuată pe loc în x utilizând o procedură de tip MLQ. Schema de 

calcul este următoarea 

SLQ 

% Calculul soluţiei normale x = A + b 

1. Se rezolvă sistemul triunghiular L ′ x(1 : m) = n 

2. x(m + 1 : n) = 0 

3. Pentru k = m : −1 : 1 

x ← Z k x 

Cu referire la algoritmul 3.9, care utilizează reflectori hermitici, implementarea 

schemei de mai sus are loc astfel. 

Algoritmul 3.10 (SLQ – rezolvarea sistemelor subdeterminate) (Se 

dă un vector b ∈ C m . Utilizând ieşirea algoritmului 3.9, se calculează 

soluţia normală x a sistemului liniar Ax = b. Se presupune că matricea 

A este epică.)

3.7. CONDIŢIONAREA PROBLEMELOR CMMP 177 

% se rezolvă sistemul inferior triunghiular (3.122) 


1. x k = (b k − ∑ k−1 

j=1 a kjx j )/a kk 

% calculul soluţiei normale 

2. x(m + 1 : n) ← 0 

3. Pentru k = m : −1 : 1 

1. t = a kk 

2. a kk = β( k 

∑n 

) 

3. α ← − 

j=k v kjx j /β k 

4. Pentru j = k : n 

1. x j ← x j + αv kj 

5. a kk = t 

Calculul proiecţiilor (pe ImA H şi KerA), rezolvarea sistemelor subdeterminate 

cu membru drept multiplu precum şi calculul pseudoinversei normale A + se fac 

adaptând în mod corespunzător metodologia din secţiunea 3.5. Desigur, acum A + 

este o inversă la dreapta a lui A, i.e. AA + = I. 

3.7 Condiţionarea problemelor CMMP 

În această secţiune prezentăm câteva rezultate privind sensibilitatea soluţiilor problemelor 

de calcul abordate anterior în raport cu variaţia datelor de intrare 21 . 

3.7.1 Preliminarii 

Considerăm sistemul liniar 

Ax = b, (3.127) 

unde A ∈ R m×n este o matrice dată, iar b ∈ R n este un vector arbitrar. Notăm 

r = rangA şi presupunem că matricea A este de rang maxim, i.e. r = s, unde 

s = min(m, n) 22 . În consecinţă, conform teoremelor 3.5 şi 3.6, sistemul (3.127) are 

o soluţie în sens CMMP unică 

x ∗ = A + b, (3.128) 

unde matricea A + are expresii diferite după cum m ≥ n sau m ≤ n. 

Având în vedere concizia expunerii, în cele ce urmează vom adopta o terminologie 

precum şi notaţii cât mai uniforme. Vom spune că A + este inversa (în sens 

21 Deoarece această tematică are un caracter pur matematic, i.e. nu vizează calitatea algoritmilor 

de calcul, pe parcurs vom utiliza formulele cele mai convenabile pentru scopul propus. 

22 O proprietate P definită pe R m×n se numeşte tipică dacă este generică şi structural stabilă, 

adică are loc ”aproape peste tot” (în afara unei varietăţi algebrice) şi se conservă oricare ar fi 

micile variaţii ale (elementelor) matricei considerate. 

De exemplu, în cazul m = n, proprietatea de inversabilitate este generică (are loc peste tot 

în afara varietăţii definite de ecuaţia detA = 0) şi structural stabilă (dacă detA ≠ 0, atunci 

det(A + E) ≠ 0, oricare ar fi perturbaţia E suficient de mică). Pe scurt, matricele inversabile sunt 

tipice în R n×n . Similar, matricele de rang maxim sunt tipice în R m×n .


CMMP a) matricei A şi vom defini numărul de condiţionare (la inversare) al lui A 

prin 

κ(A) = ‖A‖‖A + ‖, (3.129) 

unde ‖ · ‖ = ‖ · ‖ 2 este norma spectrală, indusă de norma (vectorială) euclidiană 

‖x‖ = (x T x) 1/2 , adică 

‖A‖ def 

= max ‖Ax‖. (3.130) 

‖x‖=1 

Desigur, în cazul m = n avem A + = A −1 , deci (3.129) se reduce la definiţia cunoscută 

a lui κ(A) din secţiunea 2.7 23 . 

Direct din (3.129) şi (3.130), 

(i) dacă matricea A este ortogonală, atunci κ(A) = 1, i.e. matricele ortogonale 

sunt perfect condiţionate la inversare. 

Pe de altă parte, norma euclidiană precum şi norma spectrală sunt ortogonal 

invariante, deci 

(ii) transformările ortogonale nu modifică condiţionarea datelor, i.e. 

κ(A) = κ(Q T AZ), oricare ar fi matricele ortogonale Q şi Z. 

avem 

Proprietăţile remarcabile (i) şi (ii) explică folosirea intensivă a matricelor ortogonale 

în calculul numeric. (Aceleaşi proprietăţi de invarianţă apar şi în norma 

Frobenius ‖ · ‖ F , care este şi ea ortogonal invariantă. Numărul de condiţionare 

evaluat folosind această normă este notat κ F (A).) 

Revenim acum la sistemul (3.127), în care prin ipoteză matricea A este de rang 

maxim şi facem următoarele precizări. 

• În cazul m ≥ n matricea A este monică, iar A+ = (A T A) −1 A T este epică. 

Evident, avem A + A = I n , deci A + este o inversă la stânga a lui A, dar AA + ≠ I m , 

mai precis P 1 = AA + şi P 2 = I m − P 1 sunt proiectorii (ortogonali) pe subspaţiile 

S = ImA şi respectiv S ⊥ = KerA. De asemenea, este adevărat că ‖A‖ 2 = ‖A T A‖ 

sau, pe scurt, 

‖A‖ 2 = ‖G‖, (3.131) 

unde matricea simetrică G = A T A este gramianul (coloanelor) matricei A. 

•• În cazul m ≤ n matricea A este epică, iar A+ = A T (AA T ) −1 este monică. 

Evident, acum avem AA + = I m , deci A + este o inversa la dreapta a lui A, iar 

P 1 = A + A şi P 2 = I m − P 1 sunt proiectorii pe subspaţiile N ⊥ = ImA T şi respectiv 

N = KerA. De asemenea, are loc relaţia (3.131), unde matricea G = AA T este 

gramianul (liniilor) matricei A. 

Putem acum formula concis primele noastre rezultate. 

Propoziţia 3.5 Dacă A ∈ R m×n este de rang maxim, atunci 

unde G este gramianul matricei A. 

κ(G) = κ 2 (A), (3.132) 

23 Acolo am evaluat κ(A) utilizând normele ‖ · ‖ 1 sau ‖ · ‖ ∞, relativ mai simple. În acelaşi scop, 

aici vom utiliza norma spectrală, care, după cum ştim din capitolul 1, este ortogonal invariantă. 

Anticipând rezultate din capitolul 5, precizăm că în general norma spectrală ‖A‖ coincide cu 

valoarea singulară maximă a matricei A, notată de obicei σ 1 , iar numărul de condiţionare este 

κ(A) = σ 1 /σ r ≥ 1, unde σ r este cea mai mică valoare singulară nenulă a lui A.


Demonstraţie. Notăm cu H gramianul lui A + . În cazul m ≥ n, A+ este epică, 

deci 

H = A + (A + ) T = (A T A) −1 A T A(A T A) −1 = (A T A) −1 = G −1 . 

Aplicând acum (3.131) lui A + găsim 

‖A + ‖ 2 = ‖H‖ = ‖G −1 ‖, (3.133) 

deci (3.132) rezultă direct, utilizând definiţia lui κ(G) precum şi relaţiile (3.131) şi 

(3.133). Cazul m ≤ n este similar; desigur acum H = (A + ) T A + . ♦ 

Propoziţia 3.6 Dacă A ∈ R m×n este de rang maxim, atunci matricea Â = A + E 

are aceeaşi proprietate, oricare ar fi perturbaţia E astfel încât 

‖E‖ < κ −1 (A)‖A‖. (3.134) 

Demonstraţie. În cazul m ≥ n putem scrie Â = (I m + EA + )A, unde, conform 

unui rezultat cunoscut, matricea I m + EA + este inversabilă dacă ‖EA + ‖ < 1. Dar 

întotdeauna avem ‖EA + ‖ ≤ ‖E‖ · ‖A + ‖. Prin urmare, dacă (3.134) are loc, atunci 

A şi Â sunt echivalente (la stânga), deci Â rezultă monică o dată cu A. În cazul 

m ≤ n scriem Â = A(I n + A + E) şi raţionăm similar. 

♦ 

Propoziţia 3.5 arată că sistemele normale (3.84) şi (3.118) 24 sunt mult mai 

rău condiţionate decât sistemul dat (3.127) şi explică de ce determinarea soluţiei 

x ∗ prin rezolvarea acestor sisteme este întotdeauna contraindicată din punct de 

vedere numeric. Propoziţia 3.6 arată că soluţia x ∗ este robustă, i.e. continuă să 

fie bine definită chiar dacă matricea A a sistemului (3.127) suferă perturbaţii E 

relativ importante. Conform relaţiei (3.134), aceste perturbaţii sunt strict limitate 

în normă numai de κ(A). Pentru orientare, dacă κ(A) = 10 3 , atunci κ(G) = 10 6 , 

deci la rezolvarea în simplă precizie (i.e. cu t = 7 cifre zecimale semnificative) a 

sistemului normal se pierd aproape toate cifrele semnificative. Pe de altă parte, dacă 

‖A‖ ≈ 1, atunci perturbaţiile admisibile în A sunt numai de ordinul ‖E‖ < 10 −3 . 

Concluziile obţinute mai sus subliniază importanţa deosebită a numărului de 

condiţionare κ(A) pentru caracterizarea din punct de vedere numeric a problemei 

(3.127). În continuare vom preciza aceste concluzii, efectuând analiza cantitativă a 

sensibilităţii (locale) a soluţiei x ∗ în raport cu perturbaţiile datelor. În consecinţă, 

vom considera sistemul perturbat 

(A + E)x = b + f, (3.135) 

în care perturbaţiile E şi f sunt relativ mici în raport cu nivelul maxim admisibil, 

e.g. avem 

‖E‖ ≤ ǫ A ‖A‖, ‖f‖ ≤ ǫ b ‖b‖, (3.136) 

unde tipic ǫ A şi ǫ b sunt de acelaşi ordin de mărime şi, în orice caz, ǫ A < κ −1 (A). 

Notând cu ˆx ∗ soluţia în sens CMMP a sistemului perturbat (3.136), problema 

de analiză a sensibilităţii constă pe scurt în a evalua diferenţa ∆x = ˆx ∗ − x ∗ . 

24 A căror matrice este evident G = A T A, respectiv G = AA T .


b ✚❃ 

r ∗ = b 2 

✚✚✚✚✚✚ θ 

✚ b 1 = Ax ∗ 

Fig. 3.8: θ este unghiul dintre vectorul b şi subspaţiul ImA 

3.7.2 Sensibilitatea pseudosoluţiei 

Considerăm sistemul (3.127) în care presupunem că A ∈ R m×n este monică, iar 

A T b ≠ 0. 

Teorema 3.5 Sensibilitatea relativă a pseudosoluţiei x ∗ ≠ 0 a sistemului (3.127) 

în raport cu perturbaţiile (3.136) poate fi evaluată acoperitor prin 

‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

unde θ are semnificaţia din figura 3.8. 

≤ (κ 2 (A)tgθ + κ(A))ǫ A + κ(A) 

cos θ ǫb , (3.137) 

Demonstraţie. Conform teoremei 3.5, pseudosoluţia ˆx ∗ = x ∗ + ∆x a sistemului 

perturbat (3.135) satisface relaţia 

(A T + E T )(A + E)(x ∗ + ∆x) = (A T + E T )(b + f). 

Desfăcând parantezele şi ţinând seama că A T Ax ∗ = A T b, obţinem 

(A T E + E T A)x ∗ + (A T A)∆x = E T b + A T f + . . . , 

unde + . . . indică termeni neglijabili în primă aproximaţie, ca produs a două cantităţi 

mici. Prin urmare putem scrie 

∆x = (A T A) −1 E T (b − Ax ∗ ) − A + Ex ∗ + A + f, (3.138) 

unde evident A T A = G este gramianul lui A, iar b − Ax ∗ = r ∗ este reziduul de 

normă minimă. Evaluând în normă ambii membri ai relaţiei (3.138), găsim 

‖∆x‖ ≤ ‖G −1 ‖ · ‖E‖ · ‖r ∗ ‖ + ‖A + ‖ · ‖E‖ · ‖x ∗ ‖ + ‖A + ‖ · ‖f‖, 

de unde, ţinând seama de relaţiile (3.133) şi (3.136), rezultă imediat 

( 

‖∆x‖ 

‖x ∗ ‖ ≤ ‖A + ‖ 2 ‖A‖ 2 ‖r ∗ ) 

‖ 

‖A‖ · ‖x ∗ ‖ + ‖A+ ‖ · ‖A‖ ǫ A + ‖A + ‖b‖ 

‖ · ‖A‖ 

‖A‖ · ‖x ∗ ‖ ǫb . 

În sfârşit, avem b 1 = Ax ∗ , deci ‖b 1 ‖ ≤ ‖A‖ · ‖x ∗ ‖, iar din figura 3.8 se vede că 

‖r ∗ ‖ 

‖b 1 ‖ = tgθ, 

‖b‖ 

‖b 1 ‖ = 1 

cosθ .


Demonstraţia este terminată. 

♦ 

Observaţia 3.7 Putem obţine uşor o evaluare mai fină decât (3.137), ţinând 

seama că în (3.138) perturbaţiile E şi f acţionează diferenţiat. În acest scop scriem 

E = E 1 + E 2 , unde E α = P α E, α = 1 : 2, sunt proiecţiile (coloanelor) lui 

E pe subspaţiile S şi respectiv S ⊥ . Avem A + E = A + E 1 (deoarece A + P 2 = 

= A + (I − AA + ) = 0) precum şi E T r ∗ = E2 T r ∗ (deoarece r ∗ = P 2 b iar P 2 este 

proiector ortogonal, i.e. P2 2 = P 2 şi P2 T = P 2). În mod similar avem f = f 1 + f 2 , 

unde f α = P α f, α = 1 : 2, iar A + f = A + f 1 . Prin urmare, relaţia (3.138) poate fi 

scrisă sub forma echivalentă, dar mai precisă 

∆x = G −1 E T 2 r ∗ − A + E 1 x ∗ + A + f 1 , (3.139) 

unde E 1 , E 2 şi f 1 apar acum ca perturbaţii independente, iar f 2 a dispărut. Prin 

urmare, dacă în locul relaţiei (3.136) considerăm că pentru α = 1 : 2 avem 

atunci concluzia teoremei este 

‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

‖P α E‖ ≤ ǫ A α ‖A‖, ‖P α f‖ ≤ ǫ b α‖b‖, (3.140) 

≤ κ(A) 

( ) 

ǫ A 1 + ǫb 1 

+ κ 2 (A)tgθ ǫ A 2 

cosθ 

. (3.141) 

Mai departe vom utiliza relaţiile (3.137) şi (3.141) sub forma relativ mai simplă 

‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

≤ ǫ 1 κ(A) + ǫ 2 κ 2 (A)tgθ, (3.142) 

unde, în acord cu (3.140), ǫ α , α = 1 : 2, reprezintă estimări (în norma spectrală) 

ale perturbaţiilor datelor A şi b la nivelul subspaţiilor S şi S ⊥ . 

♦ 

În esenţă, relaţia (3.142) arată că, din punctul de vedere al sensibilităţii pseudosoluţiei 

x ∗ , există două clase distincte de probleme CMMP, având caracteristici 

numerice net diferite. 

• Prima clasă conţine problemele CMMP ”aproape” compatibile, la care reziduul 

r ∗ este mic în normă faţă de membrul drept b, deci θ ≈ 0. În acest caz, al doilea 

termen din (3.142) este neglijabil, deci practic sensibilitatea locală a pseudosoluţiei 

x ∗ este proporţională cu numărul de condiţionare κ(A) al lui A. În particular, dacă 

m = n, atunci avem exact r ∗ = 0 şi θ = 0, iar (3.142) se reduce la relaţia (2.47) 

stabilită în secţiunea 2.7. Concluziile de acolo se aplică evident şi aici. 

•• A doua clasă de probleme CMMP corespunde sistemelor (3.127) cu reziduu 

de normă minimă r ∗ mare în normă faţă de membrul drept b 25 . În acest caz al 

doilea termen din (3.142) este evident dominant, deci practic sensibilitatea locală 

a pseudosoluţiei x ∗ este proporţională cu pătratul numărului de condiţionare κ(A). 

Aceste probleme, specific de tip CMMP, sunt considerabil mai dificile din punct de 

vedere numeric decât cele din prima clasă şi necesită luarea unor măsuri speciale 

de precauţie (vezi secţiunea următoare). 

25 Această situaţie poate fi uşor detectată în practică calculând ‖b‖ şi ρ = ‖r ∗ ‖, vezi comentariile 

la algoritmul 3.8. Subliniem că în acest caz sensibilitatea pseudosoluţiei x ∗ depinde nu numai de 

matricea A a sistemului (3.127) ci şi de membrul drept b (prin intermediul lui θ).


În orice caz, relaţia (3.142) subliniază că elementul determinant în stabilirea 

sensibilităţii pseudosoluţiei este numărul de condiţionare κ(A), de aceea în practică 

se recomandă insistent evaluarea lui κ(A) în cursul procesului de calcul. Desigur, 

dacă am efectuat triangularizarea ortogonală Q T A = R a lui A, atunci, beneficiind 

de invarianţa ortogonală a normei spectrale, avem 

κ(A) = κ(R), (3.143) 

deci κ(A) poate fi estimat extrem de simplu, utilizând estimatorul de condiţie pentru 

matrice triunghiulare descris în secţiunea 2.7. Acelaşi rezultat poate fi obţinut 

aplicând procedura de triangularizare ortogonală cu pivotarea coloanelor, descrisă 

în secţiunea 3.9. În acest caz, o (sub)evaluare a lui κ(A) poate fi obţinută prin simplă 

inspecţie, sub forma ˆκ(A) = r 11 /r nn , unde r kk , k = 1 : n, sunt elementele diagonale 

ale factorului triunghiular R, dispuse pe diagonală în ordine descrescătoare. 

Pe de altă parte, reexaminând formula fundamentală (3.142), este util să reţinem 

că influenţa perturbaţiilor E şi f asupra pseudosoluţiei x ∗ depinde de localizarea 

acestora în raport cu subspaţiile S şi S ⊥ . De exemplu, dacă ImE ⊂ ImA, atunci evident 

E 2 = P 2 E = 0, deci sensibilitatea lui x ∗ este dictată de κ(A) (iar nu de κ 2 (A)), 

chiar dacă reziduul r ∗ este important. În unele aplicaţii, aceste circumstanţe pot fi 

realizate printr-o ”filtrare” prealabilă adecvată a datelor de intrare, dar discutarea 

acestor tehnici depăşeşte scopurile expunerii de faţă. În altă ordine de idei, este 

evident că perturbaţiile inerente datorate erorilor de rotunjire acţionează în general 

aleator şi în orice caz nediferenţiat în raport cu S şi S ⊥ , astfel încât de fapt 

dependenţa de κ 2 (A) nu poate fi niciodată eliminată complet în situaţiile practice, 

indiferent de măsurile de precauţie luate. 

În rezumat, sensibilitatea pseudosoluţiei este determinată de condiţionarea matricei 

A precum şi de clasa θ a problemei CMMP considerate. De asemenea, ea 

depinde de tipul structural al perturbaţiilor considerate. 

3.7.3 Sensibilitatea soluţiei normale 

Considerăm sistemul (3.127) în care presupunem că matricea A ∈ R m×n este epică, 

iar b ≠ 0. 

Teorema 3.6 Sensibilitatea relativă a soluţiei normale x ∗ ≠ 0 a sistemului (3.127) 

poate fi evaluată acoperitor prin 

‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

≤ ǫ 1 κ(A), unde ǫ 1 = 2ǫ A + ǫ b . (3.144) 

Demonstraţie. Procedăm ca în demonstraţia teoremei 3.5. Conform cu teorema 

3.4, soluţia normală ˆx ∗ = x ∗ + ∆x a sistemului perturbat (3.135) satisface relaţiile 

(A + E)(x ∗ + ∆x) = b + f, x ∗ + ∆x = (A T + E T )(y ∗ + ∆y), 

unde Ax ∗ = b şi x ∗ = A T y ∗ . Prin urmare, în primă aproximaţie avem 

A∆x + Ex ∗ = f, ∆x = A T ∆y + E T y ∗ .

3.8. STABILITATEA ALGORITMILOR DE TRIANGULARIZARE 183 

Eliminând ∆y între aceste relaţii şi notând A + = A T (AA T ) −1 , obţinem 

∆x = (I n − A + A)E T y ∗ − A + Ex ∗ + A + f, (3.145) 

unde y ∗ = (AA T ) −1 b = (A + ) T x ∗ , iar în paranteza din membrul drept recunoaştem 

proiectorul ortogonal P 2 = I n − A + A pe subspaţiul N = KerA. Deoarece P 2 este o 

matrice simetrică cu valorile proprii 0 şi 1, avem ‖P 2 ‖ = 1. În consecinţă, evaluând 

în normă ambii membri ai relaţiei (3.145), găsim 26 

‖∆x‖ ≤ ‖E‖ · ‖A + ‖ · ‖x ∗ ‖ + ‖A + ‖ · ‖E‖ · ‖x ∗ ‖ + ‖A + ‖ · ‖f‖, 

de unde, ţinând seama de (3.136), rezultă (3.145). 

♦ 

Observaţia 3.8 Considerând proiecţiile E α = EP α , α = 1 : 2, ale liniilor matricei 

E pe subspaţiile N ⊥ şi N şi procedând ca în observaţia 3.7, putem şi aici scrie mai 

precis 

∆x = (I n − A + A)E T 2 y∗ − A + E 1 x ∗ + A + f. (3.146) 

Având însă în vedere structura extrem de simplă a relaţiei (3.145), utilitatea practică 

a acestei precizări este aici limitată. 

♦ 

În esenţă, relaţia (3.144) spune că sensibilitatea locală a soluţiei normale x ∗ este 

proporţională cu numărul de condiţionare κ(A) al matricei A. 

Având în vedere că, în ipoteza teoremei 3.6, sistemele subdeterminate sunt 

întotdeauna compatibile, relaţia (3.144) poate fi considerată caz particular al relaţiei 

(3.137), în care r ∗ = 0, deci θ = 0. Observăm totuşi că demonstraţiile celor două 

teoreme se bazează pe relaţii diferite, iar coeficientul 2 din (3.144) nu apare în 

(3.137). Prin urmare, apelul la (3.137) oferă mai curând o confirmare intuitivă, 

decât o justificare fermă a relaţiei (3.144). În rest, implicaţiile practice ale relaţiei 

(3.144) sunt similare cu cele cunoscute din secţiunea 2.7. 

În rezumat, sensibilitatea soluţiei normale este dictată numai de condiţionarea 

matricei A. În acest sens, problema rezolvării sistemelor subdeterminate este relativ 

simplă. 

3.8 Stabilitatea numerică a algoritmilor de 

triangularizare ortogonală 

În această secţiune oferim câteva informaţii de bază privind stabilitatea numerică a 

algoritmilor de calcul prezentaţi anterior în acest capitol. De asemenea, sprijiniţi pe 

analiza sensibilităţii problemelor de calcul din secţiunea precedentă, facem câteva 

consideraţii privind acurateţea soluţiilor calculate şi descriem o procedură de rafinare 

iterativă a acestor soluţii. 

26 Amintim că, în norma spectrală avem întotdeauna ‖A‖ = ‖A T ‖.


3.8.1 Stabilitatea numerică a algoritmilor fundamentali 

În general, analiza stabilităţii numerice a algoritmilor de calcul din acest capitol nu 

prezintă dificultăţi de esenţă, ci numai obstacole pur tehnice. În principiu, începând 

cu algoritmii de bază 3.1-3.4, întregul proces de calcul se reduce la o succesiune 

determinată de operaţii aritmetice elementare, inclusiv extrageri de radical, pentru 

care erorile de rotunjire sunt de ordinul ε M ≈ 10 −t , unde t este precizia de lucru, 

adică numărul de cifre zecimale semnificative, vezi capitolul 0. Prin urmare, efectul 

(cumulat al) acestor erori asupra rezultatelor obţinute în urma unui proces de calcul 

liniar poate fi apreciat utilizând parametrul generic 

γ cm = cmε M , (3.147) 

unde m reprezintă numărul de operaţii efectuate, iar c este o constantă de ordinul 

unităţii, în general diferită de la caz la caz. Aici este esenţial să subliniem că întreaga 

tehnică de analiză inversă a erorilor constă în a converti acest efect direct al erorilor 

de rotunjire asupra soluţiei calculate în perturbaţii echivalente la nivelul datelor. 

În consecinţă, algoritmul analizat este (invers) numeric stabil dacă soluţia calculată 

coincide cu soluţia exactă a problemei de calcul cu datele ”puţin” perturbate 27 . 

Rezultatele analizei pot fi sintetizate astfel. (Pentru demonstraţii şi rezultate 

adiţionale, vezi [IX].) 

1 ◦ . Fie x ∈ R m un vector dat. Vectorul Householder û, calculat de procedura 

RFG, este apropiat de vectorul Householder exact u, i.e. 

û = u + ∆u, unde ‖∆u‖ ≤ γ cm . (3.148) 

Subliniem că acest rezultat se datorează exclusiv alegerii judicioase a semnului 

lui σ de la pasul 2.2.1. 

2 ◦ . Fie x ∈ R m un vector dat, U 1 un reflector definit de vectorul Householder 

u, iar y = U 1 x. Vectorul transformat ŷ, calculat de procedura RF, utilizând un 

vector Householder aproximativ û de tip (3.148) satisface relaţia 

ŷ = (U 1 + ∆U)x, unde ‖∆U‖ F ≤ γ cm . (3.149) 

În continuare, utilizând rezultatele fundamentale 1 ◦ şi 2 ◦ , se poate demonstra 

afirmaţia următoare. (Vezi schema de calcul MQR din secţiunea 3.4.) 

3 ◦ Fie A ∈ R m×n o matrice dată, Q T = U s . . . U 2 U 1 o secvenţă de s reflectori 

definiţi de vectorii Householder u k , k = 1 : s, iar B = Q T A. Matricea transformată 

ˆB, calculată utilizând schema de calcul 

1. B = A 


1. B ← U k B 

cu vectori Householder aproximativi û k de tip (3.148), satisface relaţia 

ˆB = Q T (A + ∆A), unde ‖∆A‖ F ≤ sγ cm ‖A‖ F . (3.150) 

27 Peste tot mai departe noţiunea de stabilitate numerică a unui algoritm concret va fi înţeleasă 

în acest sens, deci este implicit legată de o anume problemă de calcul precizată.


Pe scurt, algoritmul de aplicare a unei secvenţe de reflectori este (invers) numeric 

stabil, iar perturbaţia echivalentă relativă la nivelul matricei date A este 

ǫ A = sγ cm , (3.151) 

unde s este lungimea secvenţei, m este ordinul reflectorilor iar c este o constantă de 

ordinul unităţii. 

Pe baza proprietăţii generale 3 ◦ se poate demonstra că 

4 ◦ Algoritmul de triangularizare ortogonală QR este numeric stabil. Mai precis, 

dacă ˆR este matricea superior triunghiulară calculată (în cazul m ≥ n), atunci 

există o matrice ortogonală ˆQ astfel încât 

ˆQ T (A + ∆A) = ˆR, unde ‖∆A‖ F ≤ nγ cm ‖A‖ F . (3.152) 

O afirmaţie similară este valabilă relativ la algoritmul LQ de triangularizare ortogonală 

la dreapta precum şi la toţi algoritmii de calcul derivaţi (cum ar fi GQR, 

MQR, SQR etc.). Subliniem că, în ultimă instanţă, toate procedurile menţionate 

sunt de tip 3 ◦ , unde parametrii s = min(m, n) şi m iau valori adecvate. În consecinţă 

5 ◦ Procedurile SQR (respectiv CMMP) şi SLQ, care calculează pseudosoluţia şi 

respectiv soluţia normală x ∗ a sistemului Ax = b, sunt numeric stabile. Perturbaţiile 

echivalente relative la nivelul datelor sunt de ordinul 

(SQR) ǫ A,b = nγ cm , (m ≥ n), (3.153) 

şi respectiv 

(SLQ) ǫ A,b = mγ cn , (m ≤ n). (3.154) 

Rezultate asemănătoare sunt valabile pentru procedurile de calcul ce utilizează 

reflectori bloc, respectiv rotaţii 28 . 

3.8.2 Acurateţea soluţiilor calculate 

Vom combina acum rezultatele privind sensibilitatea soluţiilor de tip CMMP, stabilite 

în secţiunea 3.7, cu estimările perturbaţiilor echivalente la nivelul datelor, introduse 

de procedurile de calcul analizate mai sus. În acest fel vom obţine evaluări a 

priori ale acurateţei soluţiilor calculate, i.e. ale abaterilor relative ale acestor soluţii 

faţă de soluţiile exacte. 

• Considerăm problema calculului pseudosoluţiei x ∗ a sistemului (3.127), în care 

matricea A este monică. Dacă rezolvăm această problemă utilizând procedura 

SQR, bazată pe algoritmul de triangularizare ortogonală QR, atunci în virtutea 

stabilităţii numerice inverse a acestei proceduri, pseudosoluţia calculată ˆx ∗ coincide 

cu soluţia exactă a problemei (3.127) cu datele perturbate în acord cu (3.153). 

Aplicând teorema 3.5 (vezi relaţiile (3.137)) conchidem că 

‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

≤ ǫ 1 κ(A) + ǫ 2 κ 2 (A)tgθ, (3.155) 

28 În cazul secvenţelor de rotaţii disjuncte, estimarea (3.151) este independentă de lungimea 

secvenţei [IX].


unde { 

not 

ǫ 1 = ǫ A + ǫb 

cos θ = nγ cm(1 + 1 

not 

ǫ 2 = ǫ A tgθ = nγ cm tgθ. 

cos θ ), 

(3.156) 

Relaţia (3.155) arată că în final acurateţea soluţiei calculate x ∗ depinde atât de 

condiţionarea κ(A) şi clasa θ ale problemei CMMP considerate, cât şi de nivelul 

erorilor ǫ α , α = 1 : 2, introduse de algoritmul folosit pentru rezolvarea ei. Conform 

relaţiilor (3.155) şi (3.136), acest nivel este determinat de dimensiunile m, n ale 

problemei precum şi de precizia de lucru ε M conţinută implicit de parametrul generic 

γ cm (vezi (3.147)). 

În general, evaluările de tip (3.155), (3.156) sunt extrem de acoperitoare, dar 

totodată au marele merit de a sublinia că în situaţiile dificile (care, după cum am 

văzut, pot fi detectate relativ uşor în practică) sunt necesare acţiuni suplimentare 

(vizând e.g. lucrul în dublă precizie, rafinarea iterativă a soluţiei calculate ˆx ∗ etc.), 

chiar dacă aceasta se obţine utilizând un algoritm numeric stabil cum este SQR. 

•• Considerăm acum problema, relativ mai simplă, a calculului soluţiei normale 

x ∗ a sistemului (3.127), în care matricea A este epică. Conform relaţiilor (3.154) şi 

(3.144), soluţia normală calculată ˆx ∗ satisface o relaţie de forma 


‖ˆx ∗ − x ∗ ‖ 

‖x ∗ ‖ 

≤ ǫ 1 κ(A), (3.157) 

ǫ 1 

not 

= 2ǫ A + ǫ b = mγ cm . (3.158) 

Menţionăm că, în practică, acurateţea soluţiei calculate în acest mod se dovedeşte 

de cele mai multe ori satisfăcătoare. 

3.8.3 Scalarea problemei CMMP 

Considerăm sistemul liniar (3.127), în care matricea A este monică. La fel ca în 

secţiunea 2.8, scalarea acestui sistem constă în înlocuirea sa cu sistemul echivalent 

D 1 AD 2˜x = D 1 b, (3.159) 

în care D 1 şi D 2 sunt matrice inversabile (în particular diagonale sau triunghiulare) 

alese în mod adecvat. 

Matricea D 2 realizează scalarea coloanelor lui A, iar introducerea ei se reduce la 

schimbarea de variabilă x = D 2˜x. Prin urmare D 2 nu alterează pseudosoluţia în sens 

CMMP a sistemului considerat, mai precis dacă ˜x ∗ este pseudosoluţia sistemului 

scalat, atunci pseudosoluţia sistemului iniţial poate fi recuperată utilizând relaţia 

x ∗ = D 2˜x ∗ . 

Din contra, matricea D 1 , care realizează scalarea liniilor lui A, atrage după sine 

modificarea normei din R m în raport cu care se formulează problema CMMP şi deci 

a pseudosoluţiei corespunzătoare. Într-adevăr, notând cu ˜r = D 1b −D 1 Ax reziduul 

sistemului scalat, avem ˜r = D 1 r, deci 

‖˜r‖ 2 = r T Sr not 

= ‖r‖ 2 S, S = D T 1 D 1 ,


în care ‖ · ‖ S este noua normă determinată de alegerea matricei D 1 . Problema 

CMMP în raport cu norma ‖ · ‖ S se numeşte problema CMMP ponderată, iar 

rezolvarea ei se face aplicând sistemului scalat tehnicile de calcul expuse anterior. 

Subliniem că pseudosoluţia ˜x ∗ astfel obţinută nu coincide cu pseudosoluţia 

x ∗ a problemei CMMP în norma standard (corespunzătoare alegerii D 1 = I m ). 

În consecinţă, scalarea pe linii în problemele CMMP la care se doreşte calculul 

pseudosoluţiei x ∗ este interzisă. Pe de altă parte, în multe probleme, alegerea lui 

D 1 este impusă de tipul zgomotelor de măsură asociate problemei CMMP (vezi 

exemplul 3.2), iar în acest context matricea S are o semnificaţie statistică precisă. 

În problemele care privesc rezolvarea în sens CMMP a sistemelor subdeterminate 

Ax = b, în care matricea A este epică, situaţia se inversează. Matricea D 1 

realizează o simplă scalare (pe linii) a sistemului de restricţii Ax = b şi ca atare este 

permisă întotdeauna. Din contra, matricea D 2 modifică norma din R n considerată 

la definirea soluţiei normale, mai precis 

‖˜x‖ 2 = x T Tx not 

= ‖x‖ 2 T, T = D −T 

2 D −1 

2 , 

de aceea scalarea pe coloane a sistemelor subdeterminate la care se doreşte calculul 

soluţiei normale în raport cu norma standard este interzisă. 

Din punctul de vedere al calculului numeric, alegerea matricelor de scalare D 1 , 

D 2 urmăreşte echilibrarea sistemului în sensul uniformizării nivelului de eroare 

în elementele matricei A. În acest scop se recomandă evaluarea erorilor iniţiale 

E = [ǫ ij ] care afectează elementele lui A precum şi determinarea matricelor D 1 , D 2 

astfel încât elementele matricei scalate D 1 ED 2 să aibă acelaşi ordin de mărime ǫ. 

(Dacă matricea A este cunoscută exact, atunci se poate lua ǫ ij = ε M a ij .) Pentru 

detalii vezi [XIII]. 

3.8.4 Rafinarea iterativă a soluţiei CMMP 

Considerăm din nou problema CMMP (3.127), în care matricea A este monică. 

Pentru simplitate, în continuare omitem indicele superior ∗ , notând soluţiile în sens 

CMMP x ∗ şi ˆx ∗ cu x şi respectiv ˆx. 

Presupunem că am obţinut soluţia aproximativă ˆx, utilizând procedura CMMP, 

bazată pe algoritmul de triangularizare ortogonală 

A ← Q T A = 

[ 

R1 

0 

] 

, Q T = U n . . . U 2 U 1 . (3.160) 

În general, problema rafinării iterative a soluţiei aproximative ˆx constă în construcţia 

recurentă a unui şir ˆx k , k = 0, 1, 2, . . ., convergent (în precizia de lucru) 

către soluţia exactă x a problemei de calcul considerate. 

În cazul m = n, ştim din secţiunea 2.8 că un pas al procesului de rafinare se 

desfăşoară conform următoarei scheme de principiu. (Pentru simplitate, omitem 

indicele de iterare k.) 

% Se dă ˆx. Se determină aproximaţia următoare ˆx + . 

1. Se calculeaza reziduul r = b − Aˆx 

2. Se determină corecţia ∆x rezolvând sistemul A∆x = r 

3. Se actualizează aproximaţia ˆx ← ˆx + = ˆx + ∆x


În cazul m > n, schema de mai sus este, în principiu, aplicabilă ca atare sistemului 

(3.127), dar ea se dovedeşte eficientă numai dacă acest sistem este aproape compatibil, 

i.e. θ ≈ 0 (vezi discuţia din secţiunea 3.7.2). În caz contrar, influenţa reziduului 

asupra soluţiei este determinantă (în acord cu relaţiile (3.137) şi (3.138)), deci 

rafinarea iterativă trebuie să se facă corectând simultan evoluţia ambelor mărimi. 

Altfel spus, în problemele specific CMMP, cu reziduu mare, schema de corecţie 

prezentată mai sus trebuie aplicată nu sistemului dat (3.127), ci sistemului extins 

(3.83). 

În consecinţă, presupunând dată o soluţie aproximativă (ˆx, ˆr) a sistemului extins, 

în primul rând vom calcula reziduul corespunzător 

[ ] [ ] [ ] [ ] 

s b Im A 

= − 

t 0 A T , (3.161) 

0 

ˆrˆx 

iar apoi vom determina corecţiile ∆r şi ∆x rezolvând sistemul 

[ ] [ ] [ ] 

Im A ∆r s 

A T = . (3.162) 

0 ∆x t 

Desigur, în acest scop vom folosi triangularizarea ortogonală (3.160) a matricei A, 

deja calculată în urma aplicării procedurii CMMP, iar soluţia (∆r, ∆x) va fi obţinută 

în locul membrului drept (s, t). 

Pentru a vedea cum este posibil acest lucru, considerăm prima ecuaţie (3.162), 

i.e. ∆r + A∆x = s, pe care o premultiplicăm cu Q T , vezi (3.160). Notând 

Q T ∆r = z, efectuând pe loc în s transformarea 

s ← Q T s (3.163) 

şi utilizând pentru vectorii z şi s partiţii adecvate, putem scrie 

[ ] [ ] [ ] 

z1 R1 s1 

+ ∆x = , 

z 2 0 s 2 

de unde deducem imediat 

R 1 ∆x = s 1 − z 1 , z 2 = s 2 . (3.164) 

În continuare, pentru a determina z 1 şi ∆x, considerăm a doua ecuaţie (3.148), 

i.e. A T ∆r = t. Aici avem ∆r = Qz, iar din (3.160) rezultă A T Q = [R1 T 0], deci 

R T 1 z 1 = t. (3.165) 

Acum este clar că dezideratele formulate mai sus relativ la rezolvarea sistemului 

extins (3.162) pot fi realizate procedând în ordinea (3.163), (3.165), (3.164), după 

care ∆r rezultă utilizând relaţia 

[ ] 

z1 

∆r = Q . (3.166) 

z 2 

În rezumat, schema de calcul pentru un pas al procesului de rafinare iterativă 

aplicat sistemului extins (3.83) este următoarea.

3.9. DESCOMPUNEREA ORTOGONALĂ COMPLETĂ 189 

% Se dau (ˆr, ˆx). Se determină aproximaţia următoare 

(ˆr, ˆx) ← (ˆr + , ˆx + ) = (ˆr, ˆx) + (∆r, ∆x) . 

% se calculează reziduul (3.161) 

1. s = (b − Aˆx) − ˆr 

2. t = −A T ˆr 

% se rezolvă sistemul extins (3.162) 

3. s ← Q T s 

4. z 1 = R −T t 

5. s 1 ← s 1 − z 1 

6. t ← ∆x = R −1 s 1 

7. s 1 = z 1 

8. s ← ∆r = Qs 

% se actualizează aproximaţia 

9. ˆr ← ˆr + = ˆr + ∆r 

10. ˆx ← ˆx + = ˆx + ∆x 

Implementarea schemei se face de regulă lucrând în precizie mixtă. Reziduul 

(s, t) se calculează în precizie dublă, apoi se rotunjeşte la precizia de lucru în care se 

fac restul calculelor. Condiţia de oprire a algoritmului este ‖∆x‖ ∞ , ‖∆r‖ ∞ ≤ cε M , 

sau efectuarea unui număr maxim de iteraţii. Practic, schema e utilă atunci când 

problema nu este prea rău condiţionată. Pentru amănunte consultaţi []. 

3.9 Descompunerea ortogonală completă 

Procedurile de triangularizare ortogonală prezentate în secţiunile anterioare constituie 

instrumente eficiente şi numeric stabile de rezolvare a problemelor de tip 

CMMP cu matrice A ∈ C m×n de rang maximal, r = s. (Peste tot mai departe vom 

nota r = rangA, iar s va avea semnificaţia obişnuită s = min(m, n).) În aceasta 

secţiune vom considera cazul general r ≤ s şi vom descrie un set de proceduri (directe), 

capabile să determine rangul efectiv al matricei A în prezenţa erorilor de 

rotunjire şi să utilizeze această informaţie. 

Subliniem că, în general, determinarea rangului unei matrice A cu mijloace 

de calcul numeric presupune luarea unei decizii inerent afectate de riscuri privind 

structura lui A. Totodată, această decizie influenţează decisiv şi ireversibil întregul 

proces de calcul ulterior. Având în vedere reducerea riscurile menţionate, actualmente 

se consideră că cel mai sigur instrument de determinare a rangului este descompunerea 

valorilor singulare (DVS), care va fi prezentată pe larg în capitolul 5. 

(Construcţia acestei descompuneri are la bază tehnici iterative de determinare a valorilor 

proprii, care vor fi dezvoltate în capitolul următor.) Din această perspectivă, 

procedura (directă) de triangularizare ortogonală completă prezentată în continuare 

apare ca fiind relativ elementară şi ca atare se aplică în situaţiile în care simplitatea 

primează iar deciziile de rang nu sunt critice. În esenţă, procedura se desfăşoară în 

trei etape. 

În prima etapă are loc triangularizarea ortogonală a matricei date A, utilizând 

o strategie adecvată de pivotare (permutare) a coloanelor, cu scopul de a evidenţia


în colţul dreapta-jos al factorului triunghiular R partea neglijabilă, corespunzătoare 

eventualului defect de rang. 

În a doua etapă are loc determinarea rangului prin ”trunchierea” lui R, adică 

prin identificarea şi eliminarea părţii sale neglijabile. Desigur, într-un calcul ideal cu 

precizie infinită, această parte se anulează exact, dar în calculul practic acest lucru 

nu se realizează niciodată datorită (i) erorilor iniţiale cu care elementele matricei A 

au fost calculate sau determinate experimental şi reprezentate în calculator precum 

şi (ii) erorilor de rotunjire comise pe parcursul procesului de calcul. Prin urmare, 

în realitate, este întotdeauna necesară corectarea forţată a rezultatului calculat ˆR 

şi tocmai acest lucru se face prin trunchierea menţionată. Desigur, în acest scop 

este necesar un criteriu de decizie, care în principiu este formulat de utilizator în 

funcţie de situaţia concretă precum şi de obiectivele urmărite prin calcul. Indicaţii 

mai precise vor fi date la momentul potrivit. 

În a treia etapă (în anumite situaţii, facultativă) matricea superior trapezoidală 

rămasă după trunchierea lui R este adusă la forma superior triunghiulară printr-o 

procedură de tip RQ (vezi secţiunea 3.6.2). 

Trecem acum la descrierea succintă a etapelor procedurii de triangularizare completă, 

după care vom prezenta câteva aplicaţii ale acesteia în legătură cu problema 

generală CMMP. 

3.9.1 Triangularizarea ortogonală cu pivotarea coloanelor 

Teorema 3.7 Fie A ∈ C m×n . Există o matrice unitară U = Q H ∈ C m×m precum 

şi o matrice de permutare Π astfel încât matricea 

Q H AΠ = R (3.167) 

este superior triunghiulară, iar pentru fiecare k = 1 : s sunt satisfăcute condiţiile 

|r kk | 2 ≥ 

min(j,m) 

∑ 

i=k 

|r ij | 2 , j = k + 1 : n. (3.168) 

În consecinţă, |r 11 | ≥ |r 22 | ≥ . . . ≥ |r ss |, i.e. elementele diagonale ale matricei R 

sunt ordonate descrescător. 

Relaţia (3.167) afirmă că matricele A şi R sunt ortogonal echivalente, în particular 

au acelaşi rang. Prin urmare, dacă A este de rang r ≤ s, atunci în mod 

necesar r kk = 0, k = r + 1 : s, deci în virtutea relaţiilor (3.168) ultimele m − r linii 

ale lui R sunt nule. În consecinţă, 

Corolar 3.1 După o permutare convenabilă Π a coloanelor sale, orice matrice 

A ∈ C m×n de rang r este echivalentă (la stânga) cu o matrice superior trapezoidală, 

i.e. 

[ ] T 

Q H AΠ = , (3.169) 

0 

unde T = R(1 : r, :), iar blocul lider T(:, 1 : r) este inversabil. 

r coloane ale matricei AΠ sunt independente. 

În consecinţă, primele


Având în vedere că situaţia din corolar nu poate fi realizată exact, în continuare 

ne vom concentra atenţia asupra condiţiilor (3.168). Problema determinării rangului 

va fi discutată ulterior. 

Demonstraţia teoremei 3.7. Procedura de triangularizare ortogonală cu pivotare 

are s etape. Fie A 1 = A. Vom determina matricea unitară 

Q H = Q H s . . . QH 2 QH 1 (3.170) 

procedând ca în secţiunea 3.3 (vezi demonstraţia teoremei 3.1), dar acţionând la 

fiecare etapă k = 1 : s asupra unei matrice A k Π k , cu coloanele permutate în scopul 

satisfacerii condiţiei (3.168). 

Ţinând seama de invarianţa normei euclidiene în raport cu transformările unitare 

(3.170), aceasta înseamnă că la etapa k, în poziţia pivot (adică în coloana k) trebuie 

să se găsească acea coloană j ≥ k a tabloului curent A k pentru care norma euclidiană 

a vectorului A k (k : m, j) este maximă. Pe scurt, notând 

ρ (k) 

j = ‖A k (k : m, j)‖, j = k : n, (3.171) 

strategia de pivotare a coloanelor este 

1. Se determină cel mai mic j k astfel încât ρ (k) 

j k 

2. Dacă j k ≠ k 

1. A k (:, k) ↔ A k (:, j k ). 

= max j=k:n ρ (k) 

j 

După permutare, procedura de triangularizare continuă ca de obicei, i.e. are loc 

generarea reflectorului Q H k care anulează elementele subdiagonale din coloana k şi 

aplicarea sa coloanelor următoare. Astfel se obţine tabloul transformat 

A k+1 = Q H k (A kΠ k ), (3.172) 

asupra căruia se va opera similar la etapa următoare. În final, matricea R = A s+1 

este superior triunghiulară şi satisface (3.168). 

♦ 

Având în vedere implementarea eficientă a procedurii descrise, ţinem seama de 

invarianţa normelor (3.171) în raport cu transformările (3.172) şi constatăm că 

(ρ (k) 

j 

) 2 = (ρ (k+1) 

j ) 2 + |a (k+1) 

kj 

| 2 . (3.173) 

Prin urmare, calculul repetat şi costisitor al normelor (3.171) poate fi evitat, utilizând 

în schimb relaţiile de actualizare relativ simple 29 

( 

(k+1) 

)2 

ρ (k+1) 

j = ρ (k) √ |a 

kj 

| 

j 

√1 − . (3.174) 

Întregul proces de calcul se desfăşoară pe loc în tabloul A conform următoarei 

scheme de principiu. 

29 Subliniem că deşi scrierea (3.174) evită depăşirile superioare, totuşi utilizarea ei nu este lipsită 

de riscuri dacă |a (k+1) 

kj | şi ρ (k) 

j au valori apropiate. În acest caz, pentru siguranţă se recomandă 

recalcularea normelor ρ (k+1) 

j , j = k + 1 : n, vezi [XIII, pag. 9.17]. 

ρ (k) 

j


QRP 

% Schema de triangularizare ortogonală cu pivotarea coloanelor 

% iniţializarea normelor 


1. ρ j = ‖A(:, j)‖ 


% strategia de pivotare 

1. Se determină cel mai mic j k a.î. ρ jk = max j=k:n ρ j 

2. Dacă j k ≠ k 

1. A(:, k) ↔ A(:, j k ) 

2. ρ jk ↔ ρ k 

% procedura de triangularizare ortogonală 

3. Se determină Q H k a.î. (QH k A) ik = 0, i = k + 1 : m 

4. A ← Q H k A 

% actualizarea normelor 

( ) 

|akj | 2, 

5. ρ j ← ρ j 

√1 − pentru j = k + 1 : n 

ρ j 

În ceea ce priveşte permutările de coloane, ele pot fi memorate într-un vector π 

astfel încât π k = j k , k = 1 : s, la fel ca în procedurile de eliminare gaussiană din 

capitolul 2. Pentru a putea identifica direct poziţia în tabloul iniţial A a coloanelor 

matricei (permutate) AΠ, aici vom aplica o convenţie de memorare diferită. Vectorul 

π este iniţializat cu indicii coloanelor lui A în ordinea naturală, iar conţinutul 

său este actualizat după fiecare permutare de coloane efectuată. Forma finală a 

procedurii de triangularizare se obţine aplicând algoritmul 3.5 la paşii 2.3, 2.4 şi 

plasând instrucţiunea 2.5 la locul potrivit. 

Algoritmul 3.11 (QRP) (Se dă A ∈ C m×n . Se efectuează triangularizarea 

ortogonală cu pivotarea coloanelor a matricei A utilizând 

reflectori hermitici, i.e. Q H AΠ = R, vezi algoritmul 3.5. Permutările 

de coloane se memorează în vectorul π astfel încât dacă în final π k = j, 

atunci coloana k a lui AΠ a fost coloana j a lui A.)


1. Pentru j = 1 : n % iniţializarea normelor 

1. ρ j = ‖A(:, j)‖ 

2. π j = j 


1. Se determină cel mai mic j k a.î. ρ jk = max j=k:n ρ j 

2. Dacă j k ≠ k % pivotare 

1. A(:, k) ↔ A(:, j k ) 

2. ρ jk ↔ ρ k 

3. π jk ↔ π k 

3. β k = 0 % triangularizare 

4. Dacă k < m atunci 

1. σ = ‖A(k : m, k)‖ 

2. Dacă σ ≠ 0 

1. Dacă a kk ≠ 0 atunci σ ← a kk 

|a kk | σ 

2. a ik ← u ik = a ik /σ, pentru i = k : m 

3. β k ← u kk = 1 + a kk 

4. Pentru j = k + 1 : n 

1. α = − ( ∑ m 

i=k ūika ij )/β k 


% actualizarea normei 

3. ρ j ← ρ j 

√1 − 

5. a kk = −σ 

( 

|akj | 

ρ j 

) 2 

Comentarii. Pe parcursul procesului de calcul, normele ρ j se memorează în β j , 

fiind suprascrise pe măsură ce nu mai sunt necesare; pentru claritate, nu am mai 

indicat explicit acest lucru. 

Modul de apel al procedurii este [A, β, π] = QRP(A). 

♦ 

Dacă matricea A este monică, atunci aplicaţiile algoritmului 3.11 sunt similare cu 

aplicaţiile algoritmului 3.5. În plus, după cum am menţionat în secţiunea anterioară, 

ordonarea coloanelor lui A în acord cu (3.168) permite estimarea rapidă (ca ordin de 

mărime) a numărului de condiţionare 30 ˆκ(A) = |r 11 | / |r nn |. Dacă matricea A este 

epică, atunci din nou în virtutea ordonării (3.168), blocul lider R ′ din (3.63) rezultă 

în mod necesar inversabil, deci construcţia unor baze pentru subspaţiile N = KerA 

şi N ⊥ = ImA H precum şi determinarea unei soluţii particulare a sistemului Ax = b 

se poate face aproape prin inspecţie. 

De aceea, mai departe ne vom concentra atenţia asupra cazului general în care 

matricea A nu este de rang maxim. 

3.9.2 Determinarea rangului 

Aplicăm procedura QRP matricei date A şi considerăm matricea superior triunghiulară 

calculată 

Q H AΠ = ˆR. (3.175) 

30 Tipic, această relaţie furnizează o subevaluare de 2–3 ori mai mică decât valoarea adevărată 

κ(A).


În cazul m ≥ n, ˆR are structura 

⎡ 

ˆR 

not 

= 

⎣ 

R 1 R 12 

0 ˆR2 

0 0 

}{{} 

r 

}{{} 

n−r 

⎤ 

⎦ 

} r 

} n − r 

} m − n 

(3.176) 

în care elementele satisfac relaţiile (3.168), blocul lider R 1 este superior triunghiular 

inversabil, dar blocul ˆR 2 nu rezultă nul datorită erorilor de calcul inerente. Pentru a 

determina rangul r al matricei A, trebuie să efectuăm corect trunchierea factorului 

triunghiular ˆR, punând 

ˆR 2 = 0, (3.177) 

în acord cu (3.169), în care evident matricea superior trapezoidală rămasă este 

T = [R 1 R 12 ]. (3.178) 

În cazul m < n se procedează similar. 

Pe scurt, determinarea rangului r constă în a decide care este primul element 

neglijabil de pe diagonala lui ˆR. Strategia recomandată în LINPACK [XIII] presupune 

scalarea prealabilă a liniilor şi coloanelor lui A astfel încât erorile la nivel 

de element să fie de acelaşi ordin de mărime ǫ (vezi secţiunea 3.8.3). În acest caz, 

prin definiţie, rangul numeric (sau efectiv) al lui A este primul întreg k ∈ 1 : s astfel 

încât 

|r k+1,k+1 | ≤ ǫ|r 11 |. (3.179) 

Mai departe, vom presupune mereu că rangul numeric determinat în acord cu 

criteriul de decizie (3.179) coincide cu rangul ”adevărat” r al lui A 31 . Subliniem 

că, în urma acestei trunchieri ”corecte”, se recuperează forma superior trapezoidală 

(3.169), iar numărul de condiţionare al matricei A (de rang r ≤ s) poate fi estimat 

ca fiind 

ˆκ(A) = |r 11| 

|r rr | < ǫ−1 . (3.180) 

Relaţia (3.169) are câteva aplicaţii specifice extrem de importante. Notând 

Q ′ = Q(:, 1 : r) primele r coloane ale matricei unitare Q = Q 1 Q 2 . . . Q s , din (3.169) 

obţinem imediat factorizarea QR cu pivotarea coloanelor 

AΠ = Q ′ T. (3.181) 

În virtutea structurii lui T, matricea Q ′ constituie o bază ortogonală a subspaţiului 

S = ImA, generat de primele r coloane ale matricei AΠ sau, echivalent, 

de coloanele π k , k = 1 : r, ale lui A (vezi comentariile de început la algoritmul 

3.11). Altfel spus, o dată cu determinarea rangului, în (3.181) a avut loc selecţia 

31 Realizarea practică a acestei coincidenţe este condiţionată de alegerea judicioasă a toleranţei 

ǫ. (Valoarea ǫ = 0 nu este interzisă, dar de obicei conduce la decizia r = s.) Pe de altă parte, 

gradul de siguranţă al deciziei de rang poate fi nesatisfăcător, mai ales dacă modulele r kk scad 

uniform, fără să înregistreze vreun ”salt” semnificativ. În asemenea situaţii dificile se recomandă 

determinarea rangului pe baza descompunerii valorilor singulare, vezi capitolul 5.


unui set de r coloane liniar independente ale matricei iniţiale A, iar Q ′ constituie 

”versiunea” lor ortogonalizată. În mod corespunzător, matricea Q′′ = Q(:, r+1 : n) 

constituie o bază ortogonală a subspaţiului complementar S ⊥ = KerA H . (Vom 

folosi sintaxa [Q, R, π] = FQRP(A) pentru apelul procedurii de calcul al factorizării 

QR cu pivotarea coloanelor; implementarea este lăsată cititorului, cu menţiunea că 

acumularea transformărilor ortogonale este identică cu aceea din algoritmul GQR.) 

Pe de altă parte, considerând gramianul G = A H A şi ţinând seama de (3.181), 

în care matricea Q ′ are coloanele ortogonale, deducem 

Π T GΠ = T H T. (3.182) 

Această relaţie se numeşte factorizare Cholesky cu pivotare şi afirmă că, după 

o permutare congruentă a liniilor şi coloanelor sale, orice matrice hermitică pozitiv 

semidefinită G de rang r admite o factorizare Cholesky în care factorul superior 

trapezoidal T are structura (3.178) 32 . 

În multe situaţii constatările de mai sus prezintă un interes intrinsec. Având în 

vedere abordarea problemei generale CMMP, descriem în continuare ultima fază a 

procedurii de triangularizare ortogonală completă. 

3.9.3 Triangularizarea ortogonală completă 

Corolar 3.2 Fie A ∈ C m×n , de rang r ≤ s. Există două matrice unitare 

U = Q H ∈ C m×m şi Z = V H ∈ R n×n precum şi o matrice de permutare Π astfel 

încât matricea 

Q H AΠZ = S (3.183) 

are structura 

S = 

[ 

S 

′ 

0 

0 0 

}{{} }{{} 

r n−r 

] 

} r 

} m − r 

în care blocul lider S ′ ∈ C r×r este superior triunghiular inversabil. 

(3.184) 

Demonstraţia este simplă. Considerăm matricea superior trapezoidală T din 

(3.178) şi o aducem la forma triunghiulară utilizând transformări unitare la dreapta. 

Această etapă se numeşte compresie şi poate fi efectuată în multe feluri. De exemplu, 

aplicând o procedură de tip RQ (vezi secţiunea 3.6.2), obţinem 

în care S 1 este superior triunghiulară iar 

TZ = [S 1 0], (3.185) 

Z = Z r . . .Z 2 Z 1 . (3.186) 

Acum relaţiile (3.183) şi (3.184) rezultă aplicând Z la dreapta în (3.169) şi ţinând 

seama de (3.185). Evident, matricea S ′ not 

= S 1 rezultă inversabilă, transformările 

32 Subliniem că această factorizare poate fi calculată direct, aplicând matricei G procedura 

CHOLDC din LINPACK [XIII].


unitare Q şi Z au expresiile (3.168) şi respectiv (3.186), iar Π este permutarea 

produsă de procedura QRP. 

♦ 

Cu referire la o matrice superior trapezoidală oarecare A ∈ C m×n cu m < n, 

schema de triangularizare RQ este următoarea. 

TZRQ 

% Schema de compresie la dreapta, cazul m < n 

1. Pentru k = m : −1 : 1 

1. Se determină Z k a.î. (AZ k ) kj = 0, j = m + 1 : n 

2. A ← AZ k 

Desigur, liniile lui A sunt parcurse în ordine inversă, începând cu ultima, iar 

anularea elementelor are în vedere conservarea structurii preexistente de zerouri. 

În consecinţă, reflectorii Z k sunt de tipul celor din exemplul 3.5, dar aici vectorii 

Householder sunt notaţi v k , iar partea lor esenţială v kj , j = m+1 : n, este memorată 

pe poziţiile elementelor anulate din liniile lui A, la fel ca în algoritmul 3.9. Procedura 

rezultată din combinarea acestor idei se redactează astfel. 

Algoritmul 3.12 (TZRQ) (Se dă A ∈ C m×n superior trapezoidală 

cu m < n. Se efectuează compresia la dreapta a matricei A utilizând o 

procedură de tip RQ cu reflectori hermitici, i.e. A ← AZ = [R 0], unde 

Z = Z m . . .Z 2 Z 1 , iar R rezultă superior triunghiulară. Partea esenţială 

v kj , j = m + 1 : n, a vectorilor Householder se memorează pe poziţiile 

corespunzătoare A(k, m + 1 : n) din tabloul A. La aplicarea ulterioară 

a transformărilor se ţine seama că v kk = β k , k = 1 : m.) 

1. Pentru k = m : −1 : 1 

1. β k = 0 

( 

1. σ = |a kk | 2 + ∑ ) 1/2 

n 

j=m+1 |a kj| 2 

2. Dacă σ ≠ 0 

1. Dacă a kk ≠ 0 atunci σ ← ākk 

|a kk | σ 

2. a kj ← v kj = ā kj /σ, pentru j = k, m + 1 : n 

3. β k ← v kk = 1 + a kk 

4. Pentru i = ( 1 : k − 1 

1. α = − a ik v kk + ∑ n 

j=m+1 a ijv kj 

)/β k 

2. a ij ← a ij + α¯v kj , pentru j = k, m + 1 : n 

5. a kk = −¯σ 

Comentarii. În cazul real, algoritmul cere 2m 2 (n − m) operaţii. Modul de apel 

este [A, β] = TZRQ(A). 

♦ 

În sinteza întregii expuneri de până acum, procedura de triangularizare ortogonală 

completă, corespunzătoare relaţiilor (3.183) şi (3.184), este următoarea. 

QRX 

% Procedura de triangularizare ortogonală completă a matricei 

A ∈ C m×n ; ǫ este o toleranţă dată, utilizată la determinarea 

rangului. 

% triangularizarea ortogonală cu pivotarea coloanelor 

1. [A, β, π] = QRP(A)


% trunchierea şi determinarea rangului 

2. k = 1 

3. C^at timp k ≤ s şi |a kk | > ǫ|a 11 | 

1. k ← k + 1 

4. r = k − 1 

% compresia la dreapta 

5. [A(1 : r, :), γ] = TZRQ(A(1 : r, :)) 

Modul de apel este [r, A, β, π, γ] = QRX(A, ǫ). Subliniem că toată informaţia 

despre transformările unitare Q şi Z, generate la paşii 1 şi 5, este memorată (extrem 

de compact) în tabloul A. 

3.9.4 Descompunerea ortogonală completă 

Pentru a facilita expunerea, notăm X = ΠZ şi scriem relaţiile (3.183) şi (3.184) sub 

forma 

[ ] S 

′ 

0 

A = Q X 

0 0 

H . (3.187) 

Partiţionând Q şi X conform cu S, obţinem 

A = Q ′ S ′ X ′H , (3.188) 

unde matricele Q ′ = Q(:, 1 : r) şi X ′ = X(:, 1 : r) au coloanele ortogonale, iar S ′ 

este superior triunghiulară inversabilă de ordin r = rangA ≤ s. 

Relaţia (3.188) constituie descompunerea ortogonală completă a matricei 

A ∈ C m×n şi reprezintă, în cazul general r ≤ s = min(m, n), echivalentul factorizărilor 

QR şi LQ (sau RQ), specifice matricelor de rang maxim. Subliniem că, 

deşi descompunerea (3.188) este relativ elementară şi are un evident caracter procedural, 

totuşi ea constituie un instrument preţios de rezolvare a numeroase probleme 

de calcul, în general inabordabile prin metode ”clasice”, de tip Cholesky sau Gram- 

Schmidt. În plus, performanţele numerice ale algoritmilor bazaţi pe această descompunere 

sunt apropiate de performanţele algoritmilor similari, derivaţi pe baza 

descompunerii valorilor singulare din capitolul 5. 

Aplicaţiile descompunerii ortogonale complete sunt extrem de variate (vezi problemele 

3.61–3.63, precum şi capitolul 5). Ne vom mulţumi aici să menţionăm că, 

la fel ca în secţiunile 3.4 şi 3.6.2, matricele Q ′ şi Q ′′ = Q(:, r + 1 : m) constituie 

baze ortogonale pentru subspaţiile descompunerii C m = ImA ⊕ KerA H , iar matricele 

X ′ şi X ′′ = X(:, r + 1 : n) joacă un rol similar relativ la descompunerea 

C n = ImA H ⊕ KerA. Vom insista mai mult numai asupra problemei generale 

CMMP, care constituie pentru noi un subiect inedit. 

3.9.5 Problema generală CMMP 

Considerăm sistemul liniar Ax = b, în care A ∈ C m×n este o matrice dată, nu 

neapărat de rang maxim, iar b ∈ C m este un vector arbitrar. Problema generală


CMMP, pe scurt CMMPX, constă în determinarea pseudosoluţiei normale a sistemului 

Ax = b, i.e. a unui vector x ∗ ∈ C n astfel încât 

‖x ∗ ‖ = min ‖x‖, (3.189) 

x∈X ∗ 

unde X ∗ este mulţimea pseudosoluţiilor cu proprietatea (3.77). Teorema următoare 

arată că problema CMMPX este întotdeauna bine formulată. 

Teorema 3.8 Oricare ar fi vectorul b ∈ C m , problema CMMPX are o soluţie unică 

x ∗ ∈ C n . Pseudosoluţia normală a sistemului Ax = b poate fi scrisă sub forma 

x ∗ = A + b, (3.190) 

unde, prin definiţie, matricea A + ∈ C n×m este pseudoinversa normală (sau Moore- 

Penrose) a lui A. 

Demonstraţie. Conform părţii a) a teoremei 3.3, sistemul Ax = b are întotdeauna 

pseudosoluţii care satisfac sistemul Ax = b 1 , unde b 1 ∈ S = ImA, vezi (3.82). 

Conform părţii a) a teoremei 3.4, acest sistem are întotdeauna o soluţie normală 

unică x ∗ ∈ N ⊥ = ImA H . Altfel spus, restricţia lui A la N ⊥ , văzută ca aplicaţie 

liniară A de la N ⊥ la S este inversabilă. Inversa A −1 : S → N ⊥ , prelungită cu 0 

pe S ⊥ , constituie pseudoinversa A + a lui A. 

♦ 

Pseudosoluţia normală x ∗ a sistemului Ax = b, poate fi determinată utilizând 

informaţia furnizată de procedura de triangularizare ortogonală completă 

[ ] S 

Q H ′ 

0 

AΠZ = , (3.191) 

0 0 

în care matricele Q şi ΠZ sunt unitare, iar S ′ este superior triunghiulară inversabilă 

de ordin r = rangA. Aplicând transformarea Q H ambilor membri ai sistemului şi 

notând 

[ ] [ ] 

Q H d 

′ 

u 

′ 

b = 

d ′′ , x = ΠZ 

u ′′ , (3.192) 

obţinem sistemul ortogonal echivalent 

[ S 

′ 

0 

0 0 

] [ u 

′ 

u ′′ ] 

= 

[ d 

′ 

d ′′ ] 

. (3.193) 

La fel ca în secţiunea 3.5.1, pentru a determina pseudosoluţiile considerăm 

reziduul 

[ ] d 

Q H r = 

′ − S ′ u ′ 

d ′′ , (3.194) 

în care matricea Q este unitară, deci minimul normei ‖r‖ = ‖Q H r‖ se atinge pentru 

S ′ u ′∗ = d ′ . În continuare, la fel ca în secţiunea 3.6.3, din (3.192), în care matricea 

ΠZ este unitară, rezultă u ′′∗ = 0. Prin urmare, pseudosoluţia normală a sistemului 

Ax = b este unic determinată prin relaţia 

[ ] 

x ∗ (S 

= ΠZ 

′ ) −1 d ′ 

, (3.195) 

0

3.10. RUTINE LAPACK ŞI MATLAB 199 

sau 

[ (S 

x ∗ = ΠZ 

′ ) −1 0 

0 0 

] 

Q H b, (3.196) 

din care expresia pseudoinversei A + este evidentă. 

Exploatând forma factorizată a transformărilor unitare Q H şi Z, schema de 

calcul al pseudosoluţiei normale se stabileşte imediat. 

SQRX 

% Calculul pseudosoluţiei normale x = A + b 


1. b = Q H k b 

2. Se rezolvă sistemul triunghiular S ′ x(1 : r) = b(1 : r) % r = rangA 

3. x(r + 1 : n) = 0 

4. Pentru k = 1 : r 

x ← Z k x 

5. x ← Πx 

Detalierea procedurii de permutare, necesare la pasul 5 pentru plasarea componentelor 

lui x pe poziţiile naturale, precum şi completarea schemei SQRX în scopul 

obţinerii reziduului de normă minimă r ∗ = b − Ax ∗ sau a vectorului de cea mai 

bună aproximaţie b ∗ = Ax ∗ sunt propuse cititorului ca exerciţii. 

3.10 Rutine LAPACK şi MATLAB 

Primele implementări profesionale şi de largă circulaţie ale procedurilor de triangularizare 

ortogonală au fost rutinele xQRDC şi xQRSL din LINPACK, care corespund 

(ca organizare şi tip de reflectori) procedurilor QRP (algoritmul 3.11) şi CMMP din 

secţiunile 3.9 şi, respectiv, 3.5. 

În LAPACK procedurile de calcul sunt mai diversificate. 

Pentru fiecare dintre cele 4 scheme de triangularizare standard zz = (’QR’, ’QL’, 

’LQ’ sau ’RQ’) 33 există câte trei rutine de calcul, care efectuează triangularizarea 

propriu-zisă, acumularea şi aplicarea transformărilor; numele rutinelor se obţin 

adăugând literele ’F’, ’G’ şi respectiv ’M’ la combinaţia zz. Rutinele operează cu 

matrice de formă generală (GE), unitare sau ortogonale (yy = ’UN’, ’OR’). 

De exemplu, rutinele din clasa QR se numesc xGEQRF, xyyGQR, xyyMQR şi corespund 

versiunilor la nivel de bloc ale procedurilor CQR, GCQR, respectiv MCQR 

din secţiunile 3.3 şi 3.4. (Amintim că în LAPACK se operează cu reflectori în scrierea 

Q 1 = I − τuu H , vezi secţiunea 3.2.) Numele celorlalte rutine se formează analog. 

Pentru calculul descompunerii ortogonale complete din secţiunea 3.9 se utilizează 

rutinelexGEQPF şixTZRQF, care corespund schemelor QRP, respectiv TZRQ din text. 

Rezolvarea problemelor de tip CMMP de rang maxim, relativ la sistemele Ax = b 

sau A H x = b se efectuează cu driverul xGELS, iar pentru rezolvarea problemei generale 

CMMP se utilizează driverul expert xGELSX. (Primul reuneşte versiunile bloc 

ale schemelor SQR şi SLQ din secţiunile 3.5 şi 3.6, iar al doilea corespunde schemei 

SQRX din secţiunea 3.9.) Un al treilea driver (xGELSS) utilizează descompunerea 

valorilor singulare. 

33 Pentru convenţiile de compunere a numelor rutinelor LAPACK, a se revedea secţiunea 2.12.


În MATLAB, funcţia qr realizează triangularizarea ortogonală (în diverse versiuni) 

a matricei A. Organizarea riguroasă a spaţiului de memorie (specifică implementărilor 

LINPACK şi LAPACK) este de regulă sacrificată în favoarea unei manipulări 

mai comode de către utilizator, dar performanţele numerice sunt aceleaşi. 

Apelul R = qr(A) calculează factorul superior triunghiular R returnând totodată, 

în partea inferioară a aceluiaşi tablou, vectorii Householder corespunzători reflectorilor 

Q 1 , . . . , Q n . Prin [Q,R] = qr(A) se acumulează în plus Q, iar comanda 

[Q,R,P] = qr(A) efectuează triangularizarea ortogonală cu pivotare, formând totodată 

explicit matricele Q şi P = Π. 

Rezolvarea în sens CMMP a sistemului liniar Ax = b, cu m ≠ n se face utilizând 

comanda x=A\b, unde \ este operatorul de împărţire la stânga. (Dacă m > n, 

atunci x este pseudosoluţia sistemului Ax = b, iar dacă m < n, atunci x este o 

soluţie particulară a aceluiaşi sistem.) 

3.11 Probleme 

P 3.1 În planul R2 se dă vectorul x = [3 4] T şi se consideră reflectorul elementar 

U = I − 2uu T , unde ‖u‖ = 1. 

a. Fie u = e 1. Să se construiască vectorul transformat y = Ux şi să se reprezinte grafic 

transformarea. Ce modificări apar dacă u = e 2 

b. Să se determine vectorul Householder normat u astfel încât Ux = ρe 1. Câte soluţii 

există Cât rezultă ρ 

c. Explicaţi de ce în calcule este mai bine să presupunem că vectorul u nu este neapărat 

normat, introducând scalarul β ca în (3.8). Rezolvaţi din nou punctul b aplicând algoritmul 

3.2 şi observând că ρ = −σ. Justificaţi alegerea semnului lui σ recomandată în text. Ce 

se întâmplă dacă x = [3 10 −5 ] 

d. Aplicaţi în acest caz simplu indicaţiile de implementare ce însoţesc algoritmul 

3.2. Arătaţi cum se face scalarea vectorului Householder u = [u 1 u 2] T astfel încât să 

obţinem u 1 = β, respectiv u 1 = 1. Verificaţi că în fiecare caz are loc transformarea dorită 

Ux = −σe 1. 

e. Ilustraţi grafic diversele situaţii semnificative întâlnite la punctele b–d. 

P 3.2 Rezolvaţi problema anterioară în R 3 , considerând de exemplu vectorii x = [3 4 0] T 

sau x = [3 4 5] T . 

P 3.3 Fie x, y ∈ R m doi vectori daţi. În ce condiţii există un scalar ρ şi un reflector U 

astfel încât Ux = ρy Ce restricţii apar dacă impunem condiţia suplimentară ρ = 1 

Scrieţi algoritmii de generare a reflectorului U în cele două situaţii. 

P 3.4 Fie x ∈ R m un vector dat, x ≠ 0. 

a. Să se determine un reflector U astfel încât prima coloană Ue 1 a lui U să fie un 

multiplu scalar de x, i.e. Ue 1 = ρx. Cât trebuie să fie ρ Câte soluţii există 

b. Ce semnificaţie geometrică au celelalte coloane Ue j, j = 2 : m, ale lui U 

c. Scrieţi algoritmul de calcul al unei baze ortogonale B = [b 1 b 2 . . . b m] a lui R m , 

unde b 1 = x este un vector dat, ‖x‖ = 1. 

d. Reformulaţi în mod avantajos punctele a–c de mai sus în cazul în care vectorul 

dat x are primele k − 1 componente nule, i.e. x i = 0, i = 1 : k − 1. Precizaţi structura 

lui U precum şi structura bazei ortogonale B astfel obţinute. Ilustraţi grafic construcţia, 

considerând m = 3, k = 2. 

e. Reveniţi la punctul a şi încercaţi să determinaţi U astfel încât Ue m = ρx. Ce se 

schimbă la punctele b–d


P 3.5 Fie x ∈ R m un vector dat, x ≠ 0. 

a. Să se construiască m − 1 vectori liniar independenţi y j astfel încât x T y j = 0, 

j = 2 : m. 

b. Cum se construiesc vectorii de la punctul a dacă în plus ei trebuie să fie ortogonali 

doi câte doi, i.e. yi T y j = 0, i ≠ j (Indicaţie. Asimilând x T cu o matrice cu o singură 

linie, problema constă în a construi o bază ortogonală a subspaţiului N = Kerx T , i.e. o 

matrice Y ∈ R m×(m−1) cu coloane ortogonale astfel încât x T Y = 0. Se ţine seama de 

punctul b al problemei anterioare.) 

c. Utilizând rezultatele de la punctele a şi b, descrieţi mulţimea tuturor soluţiilor 

ecuaţiei x T y = 1. Ilustraţi grafic situaţia în cazul m = 2, considerând de exemplu x = e 1 

şi x = [3 4] T . 

d. Determinaţi soluţia normală y ∗ a ecuaţiei x T y = 1. Arătaţi că y ∗ este de forma 

αx şi precizaţi interpretarea geometrică a lui y ∗ . (Indicaţie. Orice vector y ∈ R m poate fi 

scris unic sub forma y = αx + P m 

i=2 

βiyi, unde yi, i = 2 : m, sunt vectorii de la punctele 

a sau b.) 

e. Scrieţi algoritmii de calcul ce rezolvă punctele b şi d. Ce simplificări apar dacă 

‖x‖ = 1 

P 3.6 Se dau doi vectori x, y ∈ R m , x ≠ 0. 

a. Determinaţi pseudosoluţia α ∗ a sistemului αx = y, astfel încât norma euclidiană a 

reziduului ρ(α) not 

= ‖y − αx‖ să fie minimă. Evaluaţi r ∗ = y − α ∗ x şi ρ(α ∗ ) = ‖r ∗ ‖. 

b. Scrieţi algoritmul de calcul corespunzător şi găsiţi interpretarea geometrică a vectorilor 

y ∗ = α ∗ x şi r ∗ . 

c. Reluaţi punctul a presupunând că x i = 0, i = 2 : m. Ce simplificări apar Puteţi 

realiza această condiţie aplicând o transformare adecvată T ambilor vectori daţi x şi y 

Cum trebuie să fie T pentru ca funcţia ρ(α) să rămână neschimbată (”invariantă”) 

P 3.7 Consideraţi un reflector U = I − 2uu T , ‖u‖ = 1. 

a. Calculaţi detU. 

b. Determinaţi valorile şi vectorii proprii ai lui U. 

c. Determinaţi n vectori v i, i = 1 : n, astfel încât Uv i = e i şi Ue i = v i, i = 1 : n. 

Observaţie. În general, se numeşte reflector elementar (nu neapărat ortogonal) orice 

matrice U ∈ R m×m de forma U = I m − 2uv T , în care u, v ∈ R m sunt doi vectori astfel 

încât v T u = 1. Multe dintre proprietăţile reflectorilor (ortogonali) considerate mai sus se 

păstrează (sau se reformulează adecvat) în acest cadru mai general. 

P 3.8 Arătaţi că orice matrice de permutare elementară este un reflector. 

P 3.9 Fie S ∈ R m×m o matrice simetrică pozitiv definită, arbitrară dar fixată. Se 

consideră spaţiul vectorial R m cu produsul scalar (x, y) S = y T Sx şi norma euclidiană 

‖x‖ 2 S = (x,x) S. Doi vectori x,y ∈ R m se numesc S-ortogonali dacă (x,y) S = 0. Matricea 

A se numeşte S-simetrică dacă (y, Ax) S = (Ay, x) S, ∀x, y ∈ R m , adică SA = A T S sau 

A = S −1 A T S. Matricea U ∈ R m×m se numeşte S-ortogonală dacă păstrează produsul 

scalar (·, ·) S, i.e. (Ux, Uy) S = (x,y) S, ∀x, y ∈ R m , adică U T SU = S. 

a. Să se arate că orice matrice S-ortogonală este asemenea cu o matrice ortogonală. 

Să se deducă de aici că, în general, după o transformare de coordonate convenabilă, 

proprietăţile geometrice ale spaţiului R m dotat cu produsul scalar (·, ·) S se reduc la proprietăţile 

euclidiene ”uzuale”. 

b. Să se definească noţiunea de S-reflector elementar şi să se studieze principalele 

proprietăţi ale acestui tip de transformări. Cum se implementează avantajos algoritmii de 

generare şi aplicare a reflectorilor S-ortogonali


P 3.10 Păstrăm aceeaşi terminologie ca în problema anterioară chiar dacă matricea simetrică 

(inversabilă) S este de semn nedefinit. În particular, fie S = J, unde 

» – 

Ip 0 

J = , p + q = m. (3.197) 

0 −I q 

Observaţie. Spaţiul R m cu produsul scalar ”nedefinit” (·, ·) J se numeşte spaţiu pseudoeuclidian 

(sau spaţiu hiperbolic) de signatură (p, q). Mulţimea vectorilor din R m cu 

proprietatea 

pX mX 

‖x‖ 2 J = 0 ⇔ x 2 i − x 2 i = 0 (3.198) 

i=1 

i=p+1 

se numeşte con izotrop 34 . 

a. Fie x ∈ R m un vector dat, iar U un J-reflector de forma 

U = I m − uuT J 

β , β = 1 2 ‖u‖2 J. (3.199) 

Să se scrie algoritmul de aplicare a transformării x ← y = Ux şi să se verifice prin calcul 

direct că ‖Ux‖ J = ‖x‖ J. 

b. Fie x ∈ R m un vector dat. Să se stabilească în ce condiţii există un J-reflector de 

forma (3.199) astfel încât 

Ux = −σe 1, σ ∈ R − {0} (3.200) 

şi să se scrie algoritmul de generare a lui U. Discuţie. 

c. Fie S o matrice simetrică inversabilă. Să se stabilească în ce condiţii S admite 

factorizări de forma S = R T JR sau S = L T JL, în care R şi L sunt matrice superior, 

respectiv inferior triunghiulare. Să se scrie algoritmii de factorizare Cholesky ”cu semn”, 

corespunzători celor două relaţii de mai sus. 

d. Arătaţi că dacă există două matrice pătrate A şi B (nu neapărat triunghiulare) 

astfel încât S = A T JA = B T JB, atunci există o matrice J-ortogonală Q astfel încât 

B = QA. Altfel spus, oricare doi factori ”cu semn” ai lui S sunt J-ortogonal echivalenţi. 

P 3.11 În planul R2 se dă vectorul x = [3 4] T şi se consideră rotaţia plană P = P 12 cu 

parametrii c, s. 

a. Fie c = √ 3/2, s = 1/2. Să se calculeze vectorul transformat y = Px şi să se 

reprezinte grafic transformarea. 

b. Să se determine c, s astfel încât Px = re 1. Câte soluţii există Cât rezultă r 

P 3.12 Fie x, y ∈ R m doi vectori daţi. În ce condiţii există un scalar ρ şi o rotaţie P ki 

astfel încât P ki x = ρy 

P 3.13 Fie P o rotaţie plană. Calculaţi detP şi determinaţi valorile şi vectorii proprii ai 

matricei P. 

P 3.14 Fie x ∈ R m un vector dat. 

a. Scrieţi algoritmii de generare a unei secvenţe de rotaţii P astfel încât Px = re 1. 

Analizaţi diversele variante posibile. 

b. Acelaşi enunţ, utilizând o grupare convenabilă a rotaţiilor în secvenţe de rotaţii 

disjuncte (vezi observaţia 3.2). 

P 3.15 Se dă o matrice A ∈ R m×m . Să se scrie algoritmii de aplicare a transformărilor 

A ← PA şi A ← AP T , unde P sunt secvenţele de rotaţii generate în problema 3.14. 

34 Cel mai simplu exemplu este planul Lobacevski R 2 cu p = 1, q = 1. Spaţiul Minkovsky din 

teoria relativităţii este R 4 cu p = 1, q = 3. În acest caz (3.198) se numeşte con de lumină, iar 

transformările J-ortogonale formează grupul Poincaré al lui R 4 .


P 3.16 O matrice P de forma 

» 

P = 

c 

−s 

−s 

c 

– 

, c 2 − s 2 = 1 

se numeşte rotaţie hiperbolică (plană) 35 . 

a. Arătaţi că P este o transformare J-ortogonală, i.e. P T JP = J. Cât este J 

b. Fie x ∈ R 2 un vector dat. În ce condiţii există o rotaţie hiperbolică astfel încât 

Px = re 1, respectiv Px = re 2 Scrieţi algoritmul de generare a lui P şi discutaţi 

aplicabilitatea lui practică 36 . 

P 3.17 În planul C2 se dă vectorul x = [1 + i 2 + i] T . 

a. Să se determine un reflector complex Q astfel încât Qx = −σe 1. 

b. Să se determine o rotaţie complexă P astfel încât Px = re 1. 

P 3.18 Formulaţi şi rezolvaţi versiunile complexe ale problemelor anterioare 3.3–3.10 şi 

3.12–3.14, semnalând în fiecare caz modificările de notaţie şi de terminologie introduse. 

P 3.19 Demonstraţi că orice matrice ortogonală se poate exprima ca produs de reflectori 

elementari. 

» – R 

P 3.20 Scrieţi algoritmul de triangularizare ortogonală a matricei A + = , în care 

C 

blocul R este superior triunghiular de ordin n, iar C ∈ R (m−n)×n este un bloc oarecare. 

Evaluaţi numărul de operaţii. Precizaţi ce simplificări apar în următoarele cazuri 

a. m − n = 1, i.e. C = c T este un vector linie; 

b. R este superior bidiagonală, respectiv superior Hessenberg; 

c. C este superior triunghiulară. 

P 3.21 Cum procedaţi dacă blocul lider R al matricei A + din problema precedentă este 

inferior triunghiular Scrieţi algoritmul corespunzător. 

P 3.22 Scrieţi algoritmul de triangularizare cu rotaţii a unei matrice A ∈ R m×n , utilizând 

diverse strategii de anulare a elementelor subdiagonale (vezi problema 3.14). 

P 3.23 Scrieţi algoritmul de triangularizare cu rotaţii a unei matrice A ∈ R n×n a) superior 

Hessenberg, b) tridiagonale. 

În al doilea caz, presupuneţi că A este memorată împachetat (prin trei vectori). Ce 

dificultăţi apar în ceea ce priveşte memorarea informaţiei generate de algoritm 

P 3.24 Fie R ∈ R n×n o matrice superior triunghiulară, iar b, c ∈ R n doi vectori. Scrieţi 

un algoritm eficient de triangularizare a matricei A + = R + bc T , i.e. Q T A + = R +, unde 

R + este superior triunghiulară. 

Fie k ∈ 1 : n − 1. Cum procedaţi dacă ultimele n − k elemente ale vectorului b sunt 

nule 

P 3.25 Cum procedaţi în problema precedentă dacă A + = R + BC T , unde B, C ∈ R n×p , 

cu p > 1 

P 3.26 Se consideră relaţia P + = A T PA + C T C, unde A ∈ R n×n şi C ∈ R l×n sunt două 

matrice date, iar P = R T R este o matrice pozitiv definită al cărei factor Cholesky superior 

triunghiular R este cunoscut. Scrieţi o procedură (de tip rădăcină pătrată) care calculează 

factorul Cholesky R + al matricei P +, fără a forma explicit P +. 

35 Denumirea se justifică observând că putem întotdeauna considera c = chξ, s = −shξ. 

36 Observaţi că rotaţia hiperbolică este o transformare simetrică.


P 3.27 Ce simplificări apar în problema precedentă dacă A este superior Hessenberg, iar 

C = c T este un vector linie având numai ultima componentă nenulă 

P 3.28 Fie A ∈ R m×n monică, cu m > n. Utilizând informaţia furnizată de algoritmul de 

triangularizare cu reflectori U n . . . U 2U 1A = R, scrieţi algoritmul de acumulare a primelor 

p coloane ale matricei Q = U 1U 2 . . . U n, unde p ∈ 1 : m este un întreg dat. Calculaţi 

numărul de operaţii în funcţie de p. Cum memoraţi rezultatul Discutaţi cazul în care 

matricea A nu este neapărat monică. 

P 3.29 Aceeaşi problemă ca mai sus, utilizând algoritmul de triangularizare ortogonală 

cu rotaţii. 

P 3.30 Fie Q matricea din problema 3.28. Precizaţi care dintre schemele următoare 

realizează mai eficient acumularea lui Q şi de ce. 

1. Q = I m 1. Q = I m 

2. Pentru k = 1 : n 2. Pentru k = n : −1 : 1 

1. Q ← QU k 1. Q ← U k Q 

P 3.31 a. Construiţi reprezentările WY şi W 2 T ale reflectorilor bloc Q = U 1U 2 . . . U nb , 

considerând relaţia de recurenţă 

1. Q = U nb 

2. Pentru k = n b − 1 : −1 : 1 

1. Q ← U k Q 

Ce diferenţe apar faţă de soluţia adoptată în secţiunea 3.4.3 

b. Scrieţi reprezentarea W 2 T sub forma Q = I −WS −1 W T , unde S −1 = T. Precizaţi 

structura şi scrieţi procedura de construcţie a matricei S. Care dintre cele două forme de 

reprezentare este preferabilă şi de ce 

P 3.32 Fie A ∈ R m×n (m > n) o matrice superior Hessenberg. Prezentaţi algoritmi 

pentru: 

a. calculul factorizării QR a matricei A; 

b. rezolvarea sistemului liniar supradeterminat Ax = b, cu b ∈ R m dat. 

c. Cum procedaţi dacă A este bandă de lăţime inferioară p > 1 

Utilizaţi reflectori şi rotaţii. Comparaţi cele două versiuni. 

P 3.33 Aceeaşi problemă, când A ∈ R m×n este inferior Hessenberg, repectiv bandă de 

lăţime inferioară p. 

P 3.34 Fie A ∈ R m×n , m > n, o matrice de rang n a cărei factorizare QR este cunoscută, 

i.e. A = QR, Q ∈ R m×m , R ∈ R m×n . Fie A + = [A y], cu y ∈ R m . Prezentaţi algoritmi 

pentru 

a. calculul factorizării QR a matricei A +; 

b. rezolvarea sistemului A +x + = b, cu b ∈ R m dat. 

c. Stabiliţi o relaţie între pseudosoluţiile x ∗ + şi x ∗ ale sistemelor A +x + = b, respectiv 

Ax = b. 

d. Consideraţi cazul general A + = [A Y ], cu Y ∈ R m×p . 

P 3.35 Fie » A ∈ – R m×n , m ≥ n, o matrice de rang n a cărei factorizare QR este cunoscută. 

z 

T 

Fie A + = , cu z ∈ R n dat. Arătaţi că coloanele lui A + sunt liniar independente. 

A 

Prezentaţi algoritmi pentru 

a. calculul factorizării QR a matricei A +.


» – δ 

b. rezolvarea sistemului A +x + = b +, unde b + = , cu b ∈ R m şi δ ∈ R daţi. 

b 

c. Stabiliţi o relaţie între pseudosoluţiile x ∗ + şi x ∗ ale sistemelor A +x + = b +, respectiv 

Ax = b. 

» – Z 

d. Consideraţi cazul general A + = , cu Z ∈ R p×n . 

A 

P 3.36 Scrieţi algoritmi eficienţi de aplicare a transformărilor B ← Q T B şi B ← QB, 

unde Q este matricea din problema 3.28 iar B ∈ R m×p este superior sau inferior triunghiulară. 

Evaluaţi numărul de operaţii în cele patru situaţii. 

P 3.37 Aceeaşi problemă ca mai sus, pentru transformările la dreapta, B ← BQ şi 

B ← BQ T . 

P 3.38 Fie B ∈ R m×p o matrice dată, iar Q = Q 1Q 2 . . . Q n matricea din problema 3.28. 

Scrieţi algoritmul de aplicare a transformărilor B ← Q T B şi B ← QB la nivel de bloc. 

P 3.39 Aceeaşi problemă ca mai sus, pentru transformările la dreapta, B ← BQ şi 

B ← BQ T . 

P 3.40 În condiţiile problemei 3.28, scrieţi un algoritm pentru calculul vectorului y = Ax, 

cu x ∈ R n dat. (N.B. Matricea A a fost distrusă în urma execuţiei algoritmului de 

triangularizare.) 

P 3.41 În condiţiile problemei 3.28, scrieţi algoritmi pentru 

a. rezolvarea sistemului A T Ax = c, cu c ∈ R n dat; 

b. calculul inversei H = (A T A) −1 ; 

c. calculul scalarului α = c T (A T A) −1 c, c ∈ R n . 

P 3.42 Scrieţi procedurile GQL şi MQL de acumulare şi aplicare a transformărilor generate 

de algoritmul de triangularizare QL. 

P 3.43 Scrieţi algoritmul de triangularizare ortogonală QL la nivel de bloc. 

P 3.44 Fie A ∈ R m×n o matrice monică. Scrieţi procedurile de ortogonalizare GS şi 

MGS care calculează factorizarea A = Q ′′ L ′′ , unde Q ′′ are coloanele ortogonale, iar L ′′ 

este inferior triunghiulară. 

P 3.45 Rezolvaţi problemele 3.24-3.26 înlocuind peste tot matricele superior triunghiulare 

R şi R + cu matrice inferior triunghiulare. Reformulaţi în acelaşi spirit problema 3.27. 

P 3.46 a. Să se scrie un algoritm eficient de rezolvare a sistemului 

(G + C T C)x + = c + C T y, 

în care G = R T R este o matrice simetrică pozitiv definită al cărei factor Cholesky superior 

triunghiular R este cunoscut, iar matricea C ∈ R l×n precum şi vectorii c ∈ R n , y ∈ R l 

sunt daţi. Stabiliţi o relaţie între x + şi soluţia x a sistemului Gx = c. 

b. Aceeaşi problemă ca mai sus, pentru sistemul A +x + = d, unde A + este matricea 

din problemele 3.24, 3.25 iar d ∈ R n un vector dat. 

P 3.47 Fie A ∈ R m×n monică. Scrieţi algoritmul de calcul al pseudosoluţiei sistemului 

Ax = b cu b ∈ R m dat, utilizând informaţia furnizată de algoritmul de triangularizare 

ortogonală QL.


P 3.48 Scrieţi algoritmul de triangularizare ortogonală la dreapta a matricei A + = [L B], 

în care blocul L este inferior triunghiular de ordin m iar B ∈ R m×(n−m) este o matrice 

oarecare. Precizaţi ce modificări apar dacă 

a. n − m = 1, i.e. B = b este un vector; 

b. L este inferior bidiagonală, respectiv inferior Hessenberg; 

c. B este inferior triunghiulară. 

Observaţie. Evident, această problemă reprezintă o simplă formulare ”prin dualitate” a 

problemei 3.20. Propunem cititorului ca, procedând în mod similar, să obţină şi să rezolve 

dualele problemelor 3.21–3.47 (sau ale celor mai interesante dintre acestea), comentând în 

fiecare caz paralelismele observate. 

P 3.49 Fie A ∈ R m×n o matrice de rang maxim. 

a. Discutaţi existenţa şi unicitatea inverselor la stânga (dreapta) ale matricei A. Puteţi 

descrie printr-o formulă mulţimea acestor inverse 

b. Evaluaţi expresiile ‖I m − AA + ‖ F şi ‖I n − A + A‖ F. Ce se schimbă dacă mai sus 

înlocuim norma Frobenius cu norma spectrală 

P 3.50 a. Fie A ∈ R m×n o matrice monică, iar b ∈ R m , c ∈ R n doi vectori daţi. 

Utilizând informaţia furnizată de algoritmul de triangularizare ortogonală Q T A = R, 

scrieţi o procedură care rezolvă (în sensul CMMP) ambele sisteme Ax = b şi A T x = c. 

b. Aceeaşi problemă ca mai sus, dacă A este epică, utilizând algoritmul de triangularizare 

la dreapta AZ = L. 

c. Aceleaşi probleme ca mai sus, relativ la sistemele cu membru drept multiplu 

AX = B şi A T Y = C, în care B şi C sunt două matrice date, dimensionate corespunzător. 

P 3.51 Fie A ∈ R m×n cu m ≠ n. Scrieţi algoritmii de triangularizare prin eliminare 

gaussiană MA = U, respectiv AN = L şi indicaţi câteva aplicaţii. Ce strategii de pivotare 

recomandaţi în fiecare caz 

» – 

» – 

Im A 

R 

′ 

P 3.52 Fie H = 

A H , cu A = Q monică (Q ∈ C m×m , R ′ ∈ R n×n ). 

0 

0 

a. Arătaţi că factorizarea cvasi-diagonală a matricei H este de forma THT H = J, 


2 

3 

J 1 

. .. 

J n 

I m−n 

J = 6 

4 

7 

5 , J k = 

» 1 1 

1 0 

– 

, k = 1 : n. 

b. Arătaţi că H este inversabilă şi 

» – 

H −1 P2 (A + ) H 

= 

A + −G −1 , 

unde G = A H A, A + = (A H A) −1 A H , P 2 = I − AA 

» + . Cât este 

– 

detH 

In A H 

c. Formulaţi rezultatele a şi b pentru H = , cu A epică. 

A 0 

P 3.53 Consideraţi funcţia pătratică F : R n → R definită prin 

F(x) = 1 2 xT Gx − x T c, 

unde G ∈ R n×n este o matrice simetrică pozitiv definită, iar c ∈ R n . 

a. Scrieţi condiţiile necesare de minim şi arătaţi că F are un punct de minim unic 

x ∗ ∈ R n care satisface sistemul Gx ∗ ∂F 

= c. (Indicaţie: 

∂x i 

= 0, i = 1 : n.) 

b. Scrieţi un algoritm care calculează x ∗ şi ρ not 

= F(x ∗ ).


P 3.54 Fie A ∈ R m×n , b ∈ R m . De asemenea, fie S ∈ R m×m şi T ∈ R n×n două matrice 

pozitiv definite. Consideraţi funcţia pătratică 

F(x) = ‖b − Ax‖ 2 S + ‖x‖ 2 T , 

unde notaţiile sunt cele din problema 3.9. 

a. Arătaţi că F are un punct de minim unic x ∗ şi scrieţi un algoritm care calculează 

x ∗ şi ρ = F(x ∗ ). 

b. Analizaţi separat problema CMMP ponderată, în care F(x) = ‖b − Ax‖ 2 S. (Aici S 

se numeşte tradiţional matrice pondere.) 

P 3.55 Consideraţi problema de minimizare cu restricţii liniare 

F(x ∗ ) = min 

Ax=b F(x), 

unde F este funcţia pătratică din problema 3.53, matricea A ∈ R m×n este epică, iar 

b ∈ R m . 

a. Scrieţi condiţiile necesare de minim utilizând metoda multiplicatorilor Lagrange. 

Puteţi arăta că problema considerată are soluţie unică Analizaţi cazul general în care 

matricea G nu este neapărat pozitiv definită. 

b. Scrieţi un algoritm care calculează x ∗ şi ρ = F(x ∗ ). 

P 3.56 Fie A ∈ R m×n monică, B ∈ R m×p epică şi b ∈ R m . Rezolvaţi problema CMMP 

generalizată 

‖y ∗ ‖ 2 = min 

Ax+By=b ‖y‖2 . 

Observaţie. Dacă p = m şi B = I m, atunci evident y = r not 

= b − Ax, deci se obţine 

problema CMMP din secţiunea 3.5. 

P 3.57 Fie A ∈ R m×n monică, C ∈ R l×n epică şi b ∈ R m , d ∈ R l . Rezolvaţi problema 

CMMP cu restricţii liniare 

‖b − Ax ∗ ‖ = min ‖b − Ax‖. 

Cx=d 

P 3.58 Consideraţi vectorul de permutări π produs de algoritmul 3.11 şi fie x ∈ R n . 

Scrieţi procedurile de permutare pe loc x ← Πx şi x ← Π T x. 

P 3.59 Se dau doi vectori b ∈ R m şi c ∈ R n . Scrieţi algoritmi de determinare a proiecţiilor 

ortogonale ale acestor vectori pe subspaţiile descompunerilor ortogonale 

R m = ImA ⊕ KerA T şi respectiv R n = ImA T ⊕ KerA, utilizând informaţia furnizată 

de procedura de triangularizare ortogonală QRX. 

P 3.60 a. Cu notaţiile din secţiunea 3.9.5, arătaţi că matricea 

» – 

X not 

= A + (S ′ ) −1 0 

= ΠZ 

Q H 

0 0 

satisface condiţiile (Moore-Penrose) 1 ◦ AXA = X, 2 ◦ XAX = X, 3 ◦ AX = (AX) H , 

4 ◦ XA = (XA) H . 

b. Precizaţi ce formă iau aceste condiţii dacă A este monică (epică). 

c. Demonstraţi că 5 ◦ (A + ) H = (A H ) + , 6 ◦ (A + ) + A = A, 7 ◦ A + = (A H A) + A H , 

8 ◦ A + = A H (AA H ) + . 

d. Puteţi indica o metodă de calcul al pseudoinversei unei matrice hermitice (vezi 

proprietăţile 7 ◦ şi 8 ◦ ) fără a utiliza triangularizarea ortogonală completă 

e. Ţinând seama de forma factorizată a matricelor Q şi Z, scrieţi un algoritm pentru 

calculul pseudoinversei A + .


P 3.61 a. Arătaţi că orice matrice A ∈ C m×n poate fi scrisă sub oricare din formele 

(i) A = Q ′ C, (ii) A = BV ′ , unde Q ′ are coloanele ortogonale, C este epică, respectiv B 

este monică, iar V ′ are liniile ortogonale. 

b. Scrieţi algoritmi pentru determinarea factorizărilor (i) şi (ii). 

c. Arătaţi că A + = C + (Q ′ ) H , respectiv A + = (V ′ ) H B + . 

d. Scrieţi algoritmi pentru calculul pseudoinversei normale a sistemului Ax = b, cu 

b ∈ R m dat, utilizând factorizările (i) şi (ii). 

P 3.62 O matrice A ∈ C m×n se numeşte (ad-hoc) pseudounitară (sau parţial izometrică) 

dacă există două matrice cu coloane ortogonale U ∈ C m×r şi V ∈ C n×r astfel încât 

A = UV H . 

a. Ce structură au gramienii G 1 = A H A şi G 2 = AA H Interpretare geometrică. 

b. Arătaţi că A + = V U H . 

c. Arătaţi că o matrice A ∈ C m×n este pseudounitară dacă şi numai dacă A + = A H . 

d. Cum se poate testa faptul că o anumită matrice dată A ∈ C m×n este 1) monică, 

2) epică, 3) pseudounitară, 4) proiector ortogonal 

P 3.63 Fie A ∈ C m×n . 

a. Scrieţi un algoritm de triangularizare ortogonală la dreapta cu pivotarea liniilor, i.e. 

ΠAZ = L, unde L rezultă inferior triunghiulară. Precizaţi strategia de pivotare utilizată. 

b. Indicaţi câteva aplicaţii posibile ale acestui algoritm şi explicaţi de ce în practică 

algoritmul QRP din secţiunea 3.9 este întotdeauna suficient. 

P 3.64 Fie A ∈ R m×n , B ∈ R m×p monice. 

a. Explicaţi de ce în general matricea M = [A B] nu este monică. Arătaţi că 

ImM = ImA + ImB. 

b. Efectuaţi » – triangularizarea ortogonală completă a matricei M, i.e. 

S 

Q H ′ 

0 

MΠZ = , unde S este inversabilă de ordin r = rangM. Ce semnificaţie 

0 0 

geometrică au r şi Q 

c. Notăm S = ImA, T = ImB. Utilizând rezultatele de la punctul b, precizaţi cum 

poate fi verificată condiţia S T T = ∅. 

d. Idem, indicaţi o bază ortogonală pentru subspaţiul (S + T ) ⊥ . 

e. Cum se schimbă concluziile de la punctele b–d dacă matricele iniţiale nu sunt 

neapărat monice 

Pentru exemplificare, fie A = 4 

2 

1 

0 

0 

3 

2 

5, B = 4 

1 1 

0 1 

0 0 

3 

5. Cine sunt S, T şi S + T 

P 3.65 Fie A ∈ R m×n , C ∈ R l×n epice. 

» – A 

a. Explicaţi de ce în general matricea N = nu este epică. Arătaţi că 

C 

KerN = KerA T KerC. 

b. Formulaţi ”prin dualitate” şi rezolvaţi punctele b–d din problema precedentă. 

c. Fie x ∈ R n . Scrieţi algoritmul de calcul al proiecţiilor ortogonale ale lui x pe 

subspaţiile N şi N ⊥ , unde N = KerA T KerC. 

» – 1 0 0 

Pentru exemplificare, fie A = [1 0 0], C = . Cine sunt KerA, KerC şi 

1 1 0 

KerA T KerC

metode de calcul numeric matriceal. algoritmi fundamentali

Create successful ePaper yourself

Delete template?

Save as template?