TEZ˘A DE DOCTORAT - Mihail-Iulian ANDREI

UNIVERSITATEA ”POLITEHNICA” din BUCURES¸TI 

FACULTATEA DE INGINERIE ELECTRICĂ 

DEPARTAMENTUL DE ELECTROTEHNICĂ 

Nr. Decizie Senat 219 din 28.09.2012 

TEZĂ DE DOCTORAT 

MODELAREA ELECTROMAGNETICĂ A INDUCTOARELOR 

INTEGRATE PE SISTEME MULTIPROCESOR 

ELECTROMAGNETIC MODELLING OF INTEGRATED 

INDUCTORS USING MULTIPROCESSOR SYSTEMS 

Autor: Ing. Mihail-Iulian ANDREI 

Conducător de doctorat: Prof. dr. ing. Daniel IOAN 

COMISIA DE DOCTORAT 

Pres¸edinte Prof. dr. ing. Alexandru MOREGA UPB 

Conducător de doctorat Prof. dr. ing. Daniel IOAN UPB 

Referent Conf. dr. ing. Gabriela CIUPRINA UPB 

Referent Prof. dr. Raimond Grimberg NIRDTP 

Referent Prof. dr. ing. Dan Zlatanovici ICEMENERG 

BUCURES¸TI 

2012

Această pagină este lăsată goală în mod intent¸ionat.

Mult¸umiri 

Încep prin a mult¸umi domnului prof. dr. ing. Daniel IOAN, conducătorul s¸tiint¸ific 

al prezentei lucrări, pentru profesionalismul cu care m-a ghidat către obt¸inerea titlului de 

doctor, pentru îndurmarea s¸tiint¸ifică, pentru sprijinul acordat pe întreaga perioadă a doctoratului 

s¸i a elaborării tezei de doctorat. 

De asemenea, doresc să multumesc doamnei conf. dr. ing. Gabriela CIUPRINA pentru 

tot suportul acordat pe întreaga perioadă pe care mi-am petrecut-o în Laboratorul de Metode 

Numerice. 

Le mult¸umesc colaboratorilor din Polonia, prof. dr. ing. Mariusz KACZMAREK s¸i dr. 

ing. Sebastian KULA de la Universitatea ”Kazimierz Wielki” din Bydgoszcz, care au făcut 

posibil stagiul de pregătire doctorală. 

Doresc să mult¸umesc colegilor s¸i profesorilor ce fac parte din echipa din cadrul Departamentului 

de Electrotehnică. 

As¸ vrea să mult¸umesc Emei care mi-a fost colegă de birou s¸i alături de care am petrecut 

multe momente frumoase, dar s¸i tuturor colegilor cu care am avut deosebita plăcere să 

colaborez: Radu, Alex, Bogdan, Dan, Iulia, Cerasela, Carmen, S¸tefan. Nu în ultimul rând 

mult¸umesc Dianei MIHALACHE care m-a îndrumat sa aleg aceast drum spre o teză de 

doctorat. 

Mult¸umesc familiei, în special mamei mele, pentru tot sprijinul acordat pe parcursul 

acestor ani. 

Rezultatele prezentate în acestă teză au fost obt¸inute cu sprijinul Ministerului Muncii, 

Familiei s¸i Protect¸iei Sociale prin Programul Operational Sectorial Dezvoltarea Resurselor 

Umane 2007-2013, Contract nr. POSDRU/88/1.5/S/61178, s¸i Comisiei Europene care a 

finant¸at proiectele Codestar, Chameleon, Tok4nEDA. Tot legat de rezultatele prezentate în 

teză, doresc să mult¸umesc companiilor AustriaMicroSistems (Graz, Austria), IMEC (Leuven 

Belgia) s¸i Philips (Eidhoven, Olanda) pentru că au proiectat, realizat practic s¸i măsurat 

structurile de test, ce au permis validarea experimentală a programelor dezvoltate în cadrul 

LMN. 

iii


Cuprins 

Cuprins vi 

Listă figuri ix 

Listă tabele xi 

Listă abrevieri xv 

1 Introducere 1 

1.1 Important¸a s¸i actualitatea temei . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 Structura lucrării . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

2 Stadiul actual al modelării inductoarelor spiralate integrate 5 

2.1 Modele cu parametri concentrat¸i . . . . . . . . . . . . . . . . . . . . . . . 6 

2.2 Modele cu parametri distribuit¸i . . . . . . . . . . . . . . . . . . . . . . . . 11 

2.3 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 

3 Modelarea inductoarelor spiralate integrate 33 

3.1 Modelarea fizică . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

3.2 Modelarea matematică . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 

3.3 Modelarea numerică (FIT) . . . . . . . . . . . . . . . . . . . . . . . . . . 43 

3.4 Reducerea ordinului modelului prin es¸antionarea adaptivă a frecvent¸elor cu 

procedura Vector Fitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

3.4.1 Procedura Vector Fitting . . . . . . . . . . . . . . . . . . . . . . . 52 

3.4.2 Algoritmul AFS-VF . . . . . . . . . . . . . . . . . . . . . . . . . 53 

3.5 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

4 Folosirea sistemelor multiprocesor în modelarea inductoarelor spiralate 57 

4.1 Arhitectura hardware s¸i software a sistemelor multiprocesor . . . . . . . . 57 

4.1.1 Sistemul de calcul multiprocesor ATLAS . . . . . . . . . . . . . . 59 

4.2 Rezolvarea directă s¸i iterativă, în paralel, a sistemelor lineare mari . . . . . 60 

4.2.1 Rezolvarea directă . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

4.2.2 Rezolvarea iterativă paralelă . . . . . . . . . . . . . . . . . . . . . 63 

4.2.3 Rezolvarea iterativă cu precondit¸ionare . . . . . . . . . . . . . . . 68 

4.2.4 Rezolvarea, în paralel, a mai multor sisteme liniare . . . . . . . . . 70 

v

CUPRINS 

4.3 Paralelizarea Es¸ationării Adaptive a Frecvent¸elor cu Vector Fitting(AFS- 

VF paralel) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 

4.4 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 

5 Studii de caz - rezultate numerice s¸i validarea lor experimentală 77 

5.1 Inductorul spiralat pătrat - CDST-SP-MIDDLE . . . . . . . . . . . . . . . 79 

5.1.1 Modelarea aproximativă . . . . . . . . . . . . . . . . . . . . . . . 80 

5.1.2 Modelarea numerică . . . . . . . . . . . . . . . . . . . . . . . . . 90 

5.1.3 Performant¸ele procedurii de extract¸ie a modelului . . . . . . . . . . 96 

5.2 Inductorul spiralat hexagonal - CHRF217 . . . . . . . . . . . . . . . . . . 97 




5.3 Inductoare spiralate cuplate - CHRF201 . . . . . . . . . . . . . . . . . . . 102 




5.4 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

6 Concluzii finale s¸i contribut¸ii originale 113 

Listă lucrărilor publicate de autor 115 

A Definire schedulere 117 

A.1 Definire scheduler JobManager . . . . . . . . . . . . . . . . . . . . . . . . 117 

A.2 Definire scheduler Torque . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 

B AFS-VF paralel 119 

B.1 Cod pm sys2snp vf3 v*.m . . . . . . . . . . . . . . . . . . . . . . . . . . 119 

B.2 Cod compute list frequencies v*.m . . . . . . . . . . . . . . . . . . . . . . 128 

B.3 Funct¸ie profilare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 

C Solver iterativ paralel GPU 133 

C.1 Readme file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 

C.2 Installation file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 

C.3 Example file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 

C.4 Solver call file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 

C.5 CSC to COO convert procedure . . . . . . . . . . . . . . . . . . . . . . . 138 

C.6 Complex solvers file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 

C.7 Real solvers file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 

D Save state space function 163 

Bibliografie 178 

vi

Listă de figuri 

1.1 Legea lui Moore - Numărul de tranzistoare dintr-un procesor. . . . . . . . . 3 

2.1 Forme inductoare: (a) pătratică, (b) octogonală, (c) hexagonală, (d) circulară 7 

2.2 Modelul cu parametri concentrat¸i pentru inductorul spiralat . . . . . . . . . 8 

2.3 Modelul cu parametri concentrat¸i pentru inductorul spiralat cu adăugarea 

unui grup LskRsk paralel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

2.4 Modelul cu parametri concentrat¸i pentru inductorul spiralat. . . . . . . . . 10 

2.5 Modelul cu parametri concentrat¸i pentru inductorul spiralat 2π. . . . . . . . 10 

2.6 Forma elementelor finite. (a) unidimensionale. (b) bidimensionale. (c) 

tridimensionale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

2.7 Ret¸ea de discretizare adaptiv . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.8 Placă conductoare în domeniu 2D. . . . . . . . . . . . . . . . . . . . . . . 16 

2.9 Distribut¸ia potent¸ialului în placă conductoare . . . . . . . . . . . . . . . . 18 

2.10 Captură din ANSYS HFSS. . . . . . . . . . . . . . . . . . . . . . . . . . . 26 

2.11 Captură din SONNET. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

2.12 Captură din ADS-Momentum. . . . . . . . . . . . . . . . . . . . . . . . . 28 

2.13 Captură din ASITIC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

2.14 Captură din COMSOL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 

3.1 Geometria tipică a unui inductor spiralat integrat . . . . . . . . . . . . . . 37 

3.2 Efectele câmpului electromagnetic . . . . . . . . . . . . . . . . . . . . . . 38 

3.3 Domeniu de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

3.4 Domeniu de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

3.5 Sistemul de modelat (MIMO). . . . . . . . . . . . . . . . . . . . . . . . . 40 

3.6 Elementul Electromagnetic de Circuit . . . . . . . . . . . . . . . . . . . . 42 

3.7 Modelul continuu, modelul discret s¸i modelul compact . . . . . . . . . . . 43 

3.8 Ret¸eaua de discretizare duală . . . . . . . . . . . . . . . . . . . . . . . . . 44 

3.9 Circuitele echivalente FIT . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

3.10 Structura sistemului de stare . . . . . . . . . . . . . . . . . . . . . . . . . 51 

3.11 Reducerea efortului de calcul folosind algoritmul AFS-VF . . . . . . . . . 54 

3.12 Algoritm AFS-VF - schema logica . . . . . . . . . . . . . . . . . . . . . . 55 

4.1 Calculatoare MIMD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 

4.2 Structura clusterului ATLAS . . . . . . . . . . . . . . . . . . . . . . . . . 59 

4.3 Problemă de test Ucoupled . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

vii

LISTĂ DE FIGURI 

4.4 Matricea FIT înainte s¸i după factorizarea LU. . . . . . . . . . . . . . . . . 63 

4.5 Pseudocod algoritm GMRES . . . . . . . . . . . . . . . . . . . . . . . . . 64 

4.6 Pseudocod algoritm BiCGSTAB . . . . . . . . . . . . . . . . . . . . . . . 64 

4.7 Structura suitei de programe . . . . . . . . . . . . . . . . . . . . . . . . . 65 

4.8 Problema Ushape . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

4.9 Structura matricelor problemei Ushape pentru diferite griduri de discretizare 66 

4.10 Problema cu bobina spiralată . . . . . . . . . . . . . . . . . . . . . . . . . 68 

4.11 Performant¸e metode de rezolvare directe vs iterative . . . . . . . . . . . . . 71 

4.12 Abordări paralele ale AFS-VF . . . . . . . . . . . . . . . . . . . . . . . . 74 

5.1 Dispunerea straturilor în tehnologia folosită pentru problemele CODES- 

TAR s¸i CHAMELEON . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 

5.2 Problema CDST-SP-MIDLLE . . . . . . . . . . . . . . . . . . . . . . . . 79 

5.3 Materialele inductorului spiralat . . . . . . . . . . . . . . . . . . . . . . . 80 

5.4 Dimensiunile inductorului spiralat . . . . . . . . . . . . . . . . . . . . . . 80 

5.5 Modelul cu parametri concentrat¸i pentru inductorul spiralat . . . . . . . . . 81 

5.6 Circuitul echivalent pentru inductorul integrat (LTSpice) . . . . . . . . . . 83 

5.7 Simularea 1 - Y11 s¸i Y21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

5.8 Simularea 1 s¸i 2 - Y11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 

5.9 Simularea 1 s¸i 2 - Y21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.10 Simularea 1 s¸i 3 - Y11 s¸i Y21 . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.11 Simularea 1 s¸i 4 - Y21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.12 Simularea 1 s¸i 5 - Y11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.13 Simularea 1 s¸i 5 - Y21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 



5.16 Inductorul integrat CDST-SP-MIDDLE . . . . . . . . . . . . . . . . . . . 91 

5.17 Ret¸ea de discretizare pe axa Oy . . . . . . . . . . . . . . . . . . . . . . . 92 

5.18 Caracteristicile de frecvent¸ă pentru diferite distribut¸ii ale nodurilor pe Oy . 92 

5.19 Ret¸ea de discretizare pe axa xz . . . . . . . . . . . . . . . . . . . . . . . . 93 

5.20 Caracteristicile de frecvent¸ă pentru diferite ret¸ele în planul xOz . . . . . . 93 

5.21 Caracteristicile de frecvent¸ă pentru diferite ret¸ele în planul xOz . . . . . . 94 

5.22 Efectul tehnicii FredHo asupra caracteristicii de frecvent¸ă . . . . . . . . . . 94 

5.23 Caracteristicile de frecvent¸ă Y11: măsurate, simulate ale modelului cu parametri 

concentrat¸i s¸i distribuit¸i . . . . . . . . . . . . . . . . . . . . . . . . 95 

5.24 Caracteristicile de frecvent¸ă Y12: măsurate, simulate ale modelului cu parametri 

concentrat¸i s¸i distribuit¸i . . . . . . . . . . . . . . . . . . . . . . . . 96 

5.25 Problema CHRF217 - Inductor spiralat hexagonal . . . . . . . . . . . . . . 97 

5.26 Modelarea geometrică 3D a structurii CHRF217 . . . . . . . . . . . . . . . 98 

5.27 Dimensiunile inductorului spiralat hexagonal . . . . . . . . . . . . . . . . 98 

5.28 Simularea modelului aproximativ 1 s¸i 2 - Y11 . . . . . . . . . . . . . . . . 100 

5.29 Geometria Manhattan a problemei CHRF217 - Vedere în planul xOz . . . . 101 

5.30 Problema CHRF217 - Ret¸eaua de discretizare adaptată . . . . . . . . . . . 101 

5.31 Simularea SPICE s¸i Chamy - Y11 . . . . . . . . . . . . . . . . . . . . . . . 101 

5.32 Problema CHRF201 - Inductoare spiralate cuplate . . . . . . . . . . . . . . 103 

5.33 Pozit¸ionarea conductoarelor paralele . . . . . . . . . . . . . . . . . . . . . 104 

viii

LISTĂ DE FIGURI 

5.34 Problema CHRF201 echivalentă cu inductoare medii . . . . . . . . . . . . 104 

5.35 Circuitul echivalent pentru inductoare integrate cuplate (LTSpice) . . . . . 106 

5.36 Simularea modelului aproximativ 1 s¸i 2 - Y11 s¸i Y12 . . . . . . . . . . . . . 108 

5.37 Problema CHRF201 - Ret¸eaua de discretizare adaptată . . . . . . . . . . . 108 

5.38 Rezultate Chamy s¸i SPICE - Y11 s¸i Y12 - pentru CHRF201 . . . . . . . . . . 109 

5.39 Rezultate Chamy s¸i Fredho - Y11 - pentru CHRF201 . . . . . . . . . . . . . 109 

5.40 Rezultate Chamy s¸i Fredho - Y12 - pentru CHRF201 . . . . . . . . . . . . . 110 

ix


Listă de tabele 

4.1 Timpii de rezolvare pentru număr diferit de core-uri . . . . . . . . . . . . . 62 

4.2 Timpii de rezolvare pentru diferite griduri de discretizare . . . . . . . . . . 62 

4.3 Rezultatele testelor pentru diferite griduri de discretizare . . . . . . . . . . 67 

4.4 Rezultatele testelor pentru diferite griduri de discretizare . . . . . . . . . . 67 

4.5 Rezulte numerice obt¸inute cu metode iterative cu precondit¸ionare . . . . . . 70 

4.6 Rezultatele numerice pentru cele două versiuni . . . . . . . . . . . . . . . 72 

4.7 Convergent¸a algoritmului AFS-VF3 pentru problema Ucoupled . . . . . . . 75 

4.8 Timpii de execut¸ie ai algortimului AFS-VF pentru problema Ucoupled . . . 76 

5.1 Parametri geometrici ai straturilor . . . . . . . . . . . . . . . . . . . . . . 78 

5.2 Materialele problemelor CODESTAR . . . . . . . . . . . . . . . . . . . . 79 

5.3 Adâncimea de pătrundere la diferite frecvent¸e pentru tronsoanele inductorului 83 

5.4 Raportul dintre semilăt¸imea t 

2 

a conductorului s¸i adâncimea de pătrundere 

pentru tronsoanele inductorului . . . . . . . . . . . . . . . . . . . . . . . . 83 

5.5 Valorile parametrilor concentrat¸i pentru fiecare simulare . . . . . . . . . . 84 

5.6 Valorile admitant¸elor pentru simularea nr.1 la diferite frecvent¸e . . . . . . . 86 

5.7 Strategii de alegerea ret¸elei de discretizare . . . . . . . . . . . . . . . . . . 91 

5.8 Strategii de alegerea ret¸elei de discretizare . . . . . . . . . . . . . . . . . . 92 

5.9 Valorile admitant¸elor la diferite frecvent¸e s¸i abaterile lor . . . . . . . . . . 96 

5.10 Convergent¸a algoritmului AFS-VF . . . . . . . . . . . . . . . . . . . . . . 97 

5.11 Materialele problemelor CHAMELEON . . . . . . . . . . . . . . . . . . . 98 



5.14 Calculul inductivităt¸ii mutuale . . . . . . . . . . . . . . . . . . . . . . . . 105 



xi


Listă abrevieri 

ADS Advanced Design System 

AFS Adaptive Frequency Sampling 

BEM Boundary Element Method 

BiCGSTAB BiConjugate Gradient Stabilized 

BiCMOS Bipolar Complementary Metal Oxide Semiconductor 

BLAS Basic Linear Algebra Supprograms 

CAD Computer Aided Design 

CIF Common Intermediate Format 

CMOS Complementary Metal Oxide Semiconductor 

CPU Central Processing Unit 

DAE Differential Algebraic Equations 

DCS Distribted Computing Toolbox 

DDM Domain Decomposition Method 

DoFs Degrees of Freedom 

DSO Distributed Solve Option 

ED Electrodynamic 

EDA Electronic Design Automation 

EMCE Electro-Magnetic Circuit Element 

EMCE ElectroMagnetic Circuit Element 

ENIAC European Nanoelectronics Initiative Advisory Council 

EQS Electro Quasi Static 

xiii

LISTĂ DE TABELE 

ES Electro Static 

ETP European Technology Platform 

FDM Finite Difference Method 

FDTD Finite-Difference Time-Domain 

FEM Finite Element Method 

FFT Fast Fourier Transfrom 

FIT Finite Integration Technique 

FMM Fast Multipole Method 

FSB Front-Side Bus 

FW Full Wave 

GMRES Generalized Minimum Residual 

GPU Graphic Processing Unit 

HPC High Performance Computing 

HPS High Performance Solver 

IC Integrated Circuit 

ILU Incomplete LU 

ITRS International Technology Roadmap for Semiconductors 

KCL Kirchhoff’s Current Law 

KVL Kirchhoff’s Voltage Law 

LAPACK Linear Algebra Package 

MCAD Mechanical Computer Aided Design 

MG Magneto Static 

MGE Maxwell Grid Equations 

MIMD Multiple Instruction Multiple Data 

MISD Multiple Instruction Single Data 

MoM Method of Moments 

MP MultiProcessing 

xiv

MPI Message Passing Interface 

MQS Magneto Quasi Static 

MtM More than Moore 

MUMPS MUltifrontal Massively Parallel Sparse 

NUMA Non-Uniform Memory Access 

ODE Ordinary Differential Equation 

PCT Parallel Computin Toolbox 

PDAE Partial Differential Algebraic Equations 

PDE Partial Differential Equations 

PEEC Partial Element Equivalent Circuit 

RAM Random Access Memory 

RFICs Radio Frequency Integrated Circuits 

SDM Spectral Decomposition Method 

SIMD Single Instruction Multiple Data 

SISD Single Instruction Single Data 

spmd Single Program Multiple Data 

SRA Strategic Research Agenda 

UMFPack Unsymmetric MultiFrontal Package 

VF Vector Fitting 

xv 

LISTĂ DE TABELE

LISTĂ DE TABELE 

Pagina goala 

xvi

Introducere 

1.1 Important¸a s¸i actualitatea temei 

CAPITOLUL 1 

Deoarece costurile pentru fabricarea componentelor de circuit integrat sunt ridicate atât 

din punct de vedere financiar, necesitând mas¸ini s¸i instrumente de măsură costisitoare, cât 

s¸i din punct de vedere al timpului de fabricat¸ie, procesul de fabricat¸ie durând între 6 s¸i 8 

săptămâni, se alege ca solut¸ie alternativă modelarea. Fat¸ă de fabricarea prototipului, pentru 

verificarea unui proiect, simularea are un cost mai scăzut fiind necesare doar un sistem de 

calcul (hardware) s¸i un program de modelare s¸i simulare a componentelor de circuit integrat 

(software). Modelarea s¸i simularea circuitelor integrate a devenit o tehnică obligatorie în 

proiectarea elctronică. Ea este baza unei tehnologii de proiectare ”automată” a circuitelor 

integrate micro- s¸i nano-electronice numită EDA (Electronic Design Automation). 

Tranzit¸ia de la microelectronică la nanoelectronică a deschis drumul spre noi descoperiri. 

Evolut¸ia circuitelor integrate stă la baza dezvoltării multor domenii complementare 

(industrie, medicină, securitate, telecomunicat¸ii, etc.), deoarece perfomant¸ele circuitelor 

integrate se reflectă în toată instrumentat¸ia folosită în aceste domenii. 

În anul 2004, Comisia Europeană a publicat un document [1], prin care s-a înfiint¸at 

Platforma Tehnologică Europeană (ETP) s¸i prin care s-a creat Agenda de Cercetare Stategică 

(SRA), ambele urmând să promoveze s¸i să sust¸ină dezvoltarea nanoelectronicii. Cele 

două proiecte s-au desfăs¸urat sub sigla Consiliului Consultativ Init¸iativa Europeană pentru 

Nanoelectronică (ENIAC). ENIAC a avut s¸i încă mai are ca obiectiv crearea unei comunităt¸i 

formată din parteneri din toate domeniile (industriali, reprezentant¸i ai cercetării, 

universităti, organizat¸ii financiare), care să asigure transferul de informat¸ie, diseminarea 

de viziuni, accesul la resurse, într-un cuvânt, să asigure dezvoltarea nanoelectronică în 

Uniunea Europeană. Comunitatea creată de ENIAC îs¸i desfăs¸oară activitatea doar la nivel 

european, însă există o comunitate s¸i la nivel global. Harta Internat¸ională a Tehnologiilor 

Semiconductoarelor (ITRS) [2] are acelas¸i rol de a crea o legătură la nivel global, însă între 

industrie s¸i comunităt¸ile ce se ocupă de cercetare. 

Dezvoltarea tehnicilor de modelare s¸i simulare cu calculatorul în proiectarea electronică 

automată a fost identificată ca una din priorităt¸ile, atât ENIAC, cât s¸i ITRS. Fără simulări 

costurile ar cres¸te s¸i mai mult, din cauza necesităt¸ii realizării mai multor iterat¸ii, până când 

sunt îndeplinite specificat¸iile de proiect. Nivelul nano poate fi abordat doar folosind sisteme 

1

1. Introducere 

de calcul de înaltă performant¸ă s¸i tehnici speciale de programare. Pentru ca tranzit¸ia de la 

nivelul micro la nivelul nano să se poată face mai us¸or, supercalculatoarele s¸i tehnicile 

speciale de programare trebuie implementate încă de la nivelul micro. 

Marea majoritate a programelor folosite de proiectant¸i pot simula componente de circuit 

integrat doar în banda de frecvent¸e 1-10GHz. Aplicat¸iile zilelor noastre solicită frecvent¸e 

de până la 60-80GHZ, iar în ultimii ani au apărut aplicat¸ii până la 300GHz [3]. Pachetele 

de programe care au la bază rezolvarea câmpului electromagnetic pornind de la ecuat¸iile 

lui Maxwell, sunt cele care pot răspunde acestei provocări, deoarece cu ajutorul lor se pot 

obt¸ine modele după o singură iterat¸ie, spre deosebire de instrumentele bazate pe analiza 

circuitelor electrice care pornind de la ecuat¸iile Kirchhoff, au nevoie de iterat¸ii suplimentare 

pentru a obt¸ine aceste modele. 

Un aspect important al proiectării eficiente a componentelor de circuit integrat, se referă 

la efectele câmpului electromagnetic. Proiectarea acestor componente, t¸inând cont de 

efectele câmpului electromagnetic, conduce la modele ce pot cont¸ine milioane de grade de 

libertate. Din acest motiv, se impune aplicarea unor tehnici de reducere a ordinului modelelelor 

extrase, care transformă modelul init¸ial într-unul echivalent din punct de vederea al 

comportării pe la terminale, dar de ordin redus. 

Pentru a avea timpi rezonabili de obt¸inere a modelelor, tehnicile de reducere a ordinului 

modelelor trebuie completate cu folosirea supercalculatoarelor s¸i a tehnicilor de calcul de 

înaltă performant¸ă. 

Evolut¸ia circuitelor integrate digitale este guvernată de ”Legea lui Moore” [4], care 

spune că numărul de tranzistoare pe unitatea de suprafat¸ă se dublează la fiecare 2 ani. Acest 

lucru a permis dezvoltarea industriei electronice la cote foarte mari, circuitele integrate 

fiind omniprezente în toate domeniile. Totodată, această cres¸tere exponent¸ială aduce cu 

ea s¸i o complexitate ridicată a circuitelor, dar s¸i un pret¸ mai scăzut. Până în anul 2020, 

strategia ”More Moore”, strategie ce se încadrează în SRA, va încerca să sustină dezvotarea 

circuitelor integrate ment¸inând costurile la acelas¸i nivel scăzut, pentru ca evolut¸ia să îs¸i 

continue ritmul de cres¸tere exponent¸ial, ment¸ionat de ”Legea lui Moore”. 

Conceptul ”More than Moore” (MtM)[5] se referă la tehnologii hibride, ce dau posibilitatea 

circuitelor integrate de a avea funct¸ii non-digitale. Dispozitivele MtM oferă conversia 

informat¸iilor non-digitale s¸i non-electronice (mecanice, termice, chimice, acustice, 

funct¸ii optice, biomedicale) în date digitale s¸i invers [6]. Tehnologiile s¸i produsele MtM 

cresc numărul de funct¸ii esent¸iale ale unui dispozitiv cu circuite integrate. Dacă strategia 

”More Moore” continuă miniaturizarea circuitelor integrate, atunci MtM aduce diversificarea 

funct¸iilor acestor circuite integrate. 

Una din funct¸iile analogice, care se integreaza pe acelasi cip cu blocurile digitale, este 

cea de radiofrecvent¸ă (comunicare fără fir - wireless). Spre deosebire de blocurile digitale, 

care cont¸in doar port¸i logice s¸i interconexiuni, cele de rafiofrecvent¸ă cont¸in pe lângă 

tranzistoare, s¸i multe componente pasive: rezistoare, condensatoare s¸i inductoare. Iată, de 

ce modelarea cu acuratet¸e s¸i eficient¸ă a inductoarelor din circuitele integrate la frecvent¸e 

tot mai înalte, subiectul prezentei teze, este de interes tot mai sporit. 

Revenind la infulent¸a ”Legii lui Moore” asupra sistemelor de calul (Figura 1.1), scăderea 

dimensiunii tranzistoarelor duce la imposibilitatea cres¸terii frecvent¸ei procesoarelor (CPU) 

supercalculatoarelor, din cauza puterii disipate foarte mari s¸i a imposibilităt¸ii degajării 

căldurii. Alternativa o reprezintă procesoarele cu mai multe core-uri (nuclee), care au 

2

1.1. Important¸a s¸i actualitatea temei 

Figura 1.1: Legea lui Moore - Numărul de tranzistoare dintr-un procesor. 

performant¸e mai scăzute decât un procesor cu o frecvent¸ă foarte mare, însă această performant¸ă 

poate fi îmbunătăt¸ită dacă se exploatează în mod eficient arhitectura multicore a procesorului. 

Exploatarea, în mod eficient, se referă la folosirea paralelismului, în conceperea 

algoritmilor. Acest tip de sisteme multiprocesor pe care se pot rula programe paralele sunt 

reprezentate, fie printr-un calculator cu unul sau mai multe procesoare (multicore sau nu), 

fie prin sisteme tip cluster de calculatoare. O alternativă multicore, diferită de cea CPU, 

o reprezintă tehnologia cu procesoare grafice (GPU). Această tehnologie poate să apară în 

ambele sisteme multiprocesor ment¸ionate anterior. 

Toate sistemele de calcul de înaltă performat¸ă (IBM Sequoia [7], K computer [8] - Top 

500 Supercomputer [9]), indiferent de tehnologie, CPU sau GPU, au în comun un concept 

care stă la baza viitoarelor programe: paralelismul. Folosirea algoritmilor paraleli are un rol 

foarte important în reducerea timpului de extragere a modelelor de ordin redus, devenind 

o necesitate în proiectarea electronică automată a viitorului, care va avea ca obiect circuite 

integrate de complexitate tot mai mare. 

Din punct de vedere al compatibilităt¸ii, programul de modelare trebuie să genereze 

modelul într-un format standard, compatibil cu alte programe. Majoritatea proiectant¸ilor 

de componente de circuit integrat preferă ca format standard modelul SPICE. 

Teza de doctorat, ”Modelarea electromagnetică a inductoarelor integrate pe sisteme 

de calcul multiprocesor”, are ca principal obiectiv folosirea acestor instrumente de 

calcul paralel, pentru îmbunătăt¸irea tehnologiei de modelare electromagnetică a componentelor 

pasive de circuit integrat, urmărind atât scăderea timpului s¸i a efortului de calcul, 

cât si obt¸inerea unei precizii acceptabile pentru modelele obt¸inute. Tema tezei este de ac- 

3

1. Introducere 

tualitate s¸i prezintă o important¸ă ridicată datorită faptului că pe de o parte tot mai multe 

circuite integrate cont¸in inductoare sau au efecte inductive relevante, iar, pe de alta parte, 

foarte multe probleme de complexitate industrială nu pot fi abordate cu tehnicile clasice 

secvent¸iale, din cauza timpului foarte mare de execut¸ie [10]. 

1.2 Structura lucrării 

Teza este alcătuită din s¸ase capitole. Primul capitol reprezintă o intoducere în care sunt 

prezentate important¸a s¸i actualitatea temei de cercetare, structura tezei de doctorat. 

Capitolul doi prezintă stadiul actual al modelării inductoarelor integrate. Sunt tratate 

atât modelelele cu parametri concentrat¸i, cât s¸i modelele cu parmetri distribuit¸i, care presupun 

rezolvarea numerică ecuat¸iilor câmpului electromagnetic în regimuri dinamice. 

Capitolul trei prezintă descrierea s¸i analiza procesului de modelare al inductoarelor 

integrate, ales pentru a fi studiat în vederea paralelizării. Sunt prezentate toate etapele 

procesului de modelare: modelarea fizică, modelarea matematică, modelarea numerică s¸i 

metoda de reducerea ordinului modelului. 

Capitolul patru prezintă avantajele folosirii sistemelor multiprocesor, în modelarea inductoarelor 

spiralate. In prima parte a acestui capitol, sunt introduse arhitecturile calculatoarelor 

paralele folosite, atât din punct de vedere hardware, cât s¸i software. În a doua 

parte, sunt prezentate metodele de rezolvare directă s¸i iterativă a sistemelor liniare rezultate 

folosind tehnici de calcul paralel. În finalul acestui capitol, sunt propuse două abordări 

paralele ale algoritmului de reducere a ordinului modelului, pentru care sunt prezentate s¸i 

rezultatele obt¸inute pe probleme de test. 

Capitoul cinci prezintă un studiu de caz pe trei probleme reale, în care se prezintă procesul 

de modelare electromagnetică, validarea lui experimentală s¸i perfomant¸ele abordărilor 

paralele propuse în capitolul anterior. 

Ultimul capitol, face o sinteza a concluziilor întregii lucrări, pune în evident¸ă principalele 

contribut¸ii originale ale tezei s¸i se încheie cu lista de lucrări publicate de autor. 

Teza cont¸ine în anexe codurile programelor dezvoltate de autor. Acestea împreună 

cu sursele acestui document s¸i modelele dezvoltate de autor au fost arhivate pe pagina 

personală a autorului din intranetul LMN: 

http://ro.wiki.lmn.pub.ro/index.php/Utilizator:Iulian 

4

Stadiul actual al modelării inductoarelor spiralate 

integrate 

CAPITOLUL 2 

Stimulată de cererea mare de aplicat¸ii fără fir, dezvoltarea circuitelor integrate de înaltă 

frecvent¸ă a devenit un subiect de cercetare foarte important al zilelor noastre. Există o mare 

varietate de circuite integrate, clasificate în două categorii: circuite analogice s¸i circuite 

digitale. Din punct de vedere tehnologic, circuitele integrate pot fi realizate sub formă 

hibridă sau sub formă monolitică. 

Circuitele integrate hibride sunt circuite electronice în miniatură alcătuite din dipozitive 

individuale (tranzistoare, diode, rezistoare, inductoare, condensatoare) [11]. 

Circuitele integrate monolitice se obt¸in integral pe aceeas¸i plăcut¸ă de material semiconductor 

(cip sau ”chip”) [11]. Cipul este alcătuit dintr-o combinat¸ie de mai multe straturi 

(straturi de difuzie, straturi de contact, straturi izolatoare), fiecare strat fiind realizat prin 

fotolitografie. 

Acest studiu se va concentra pe cea mai importantă componentă pasivă integrată de 

înaltă frecvent¸ă: inductorul spiralat. 

În general, cea mai întâlnită tehnologie de fabricat¸ie a circuitelor integrate este tehnologia 

CMOS [12] [10]. Principalele avantaje ale acestei tehnologii sunt consumul redus 

de putere, us¸urint¸a în procesul de proiectare s¸i performant¸ele din ce în ce mai bune 

obt¸inute odată cu scalarea dispozitivelor (Legea lui Moore). Consumul redus de putere 

s¸i performant¸ele bune se datorează tranzistoarelor din dispozitivul CMOS, care comută 

mult mai repede între starea pornit/oprit, deoarece componentele sunt foarte mici s¸i foarte 

aproape una de cealaltă. Tehnologia BiCMOS [13] adaugă noi avantaje, cum ar fi imunitatea 

la zgomot, liniaritatea, buna conectivitate cu alte dispozitive, capacitate de stocare 

mare, o mai bună optimizare a performant¸elor s¸i un grad de integrare mai ridicat. Procesul 

de fabricat¸ie este unul complex, ce implică sute de pas¸i care trebuie executat¸i într-o 

secvent¸ă bine definită, cu un control foarte riguros al parametrilor tehnologici. Pentru a 

obt¸ine un randament bun, adică un pret¸ nu foarte ridicat, însă cu păstrarea performant¸elor, 

procesul de fabricat¸ie trebuie să fie foarte bine planificat. 

De-a lungul anilor tehnologiile de fabricat¸ie a inductoarelor spiralate au evoluat, însă 

din cauza costului ridicat al realizării de prototipuri, s-au dezvoltat diferite tehnici de modelare 

a acestor inductoare. Tehnicile de modelare au rolul de a extrage modele ce permit 

studierea comportamentului componentei modelate în diferite situat¸ii (conectarea într-un 

5

2. Stadiul actual al modelării inductoarelor spiralate integrate 

circuit), înainte ca aceasta să fie realizată practic. În prezent, se evident¸iză două tehnici de 

a inductoarelor: 

1. modelul de circuit cu parametri concentrat¸i; 

2. modelul de circuit cu parametri distribuit¸i. 

Pentru a putea face o comparat¸ie din care să rezulte avantajele s¸i dezavantajele folosirii 

lor, în continuare, se vor prezenta tehnici de modelare pentru inductoarele integrate, atât cu 

parametri concentrat¸i, cât s¸i cu parametri distribuit¸i. 

2.1 Modele cu parametri concentrat¸i 

Circuitele care cont¸in un număr finit de elemente ideale simple, caracterizate de parametrii 

lor rezistivi, capacitivi sau inductivi, sunt numite circuite cu parametri concentrat¸i. 

Elementele pot fi pasive (rezistoare, inductoare, condensatoare) sau active (surse, generatoare). 

Acest studiu se va concentra asupra avantajelor s¸i dezavantajelor folosirii modelelor 

cu parametri concentrat¸i pentru inductoarelor spiralate. 

Modelul pentru un inductor spiralat cont¸ine o serie de paramtetri, ce sunt într-o strânsă 

legătură cu proprietăt¸ile geometrice ale spirei. În funct¸ie de cerint¸ele aplicat¸iei forma spiralei 

poate fi [14]: rectangulară (Figura 2.1a), octogonală (Figura 2.1b), hexagonală (Figura 

2.1c) s¸i circulară (Figura 2.1d). 

Din punct de vedere tehnologic, bobinele cu formă rectangulară sunt cel mai simplu de 

realizat, însă, dezavantajul vine din faptul că adaugă un cont¸inut mare de zgomot din cauza 

unghiurilor drepte. Forma circulară oferă cele mai bune performant¸e, dar, îngreunează 

procesul de fabricat¸ie, fapt pentru care nu se foloses¸te decât pentru realizarea inductoarelor 

mari. Compromisul între dificultatea procesului de fabricat¸ie s¸i performant¸e îl oferă 

bobinele cu formă octogonală s¸i hexagonală. 

Teoria circuitelor electrice cu parametrii concentrat¸i se elaborează prin particularizarea 

teoriei câmpului electromagnetic, în anumite ipoteze simplificatoare [15]: 

1. fenomenul de propagare nu se manifestă, condit¸ie îndeplinită dacă frecvent¸a este 

destul de mică, astfel încât lungimea undei electromagnetice λ, să fie mult mai mare 

decât lungimea circuitului L: 

L ≪ λ = c · T = c 

f 

; (2.1) 

2. energia câmpului electric este localizată numai în dielectricul condensatoarelor, iar 

energia câmpului magnetic este localizată numai în miezul bobinelor, ceea ce presupune 

că se neglijează atât induct¸ia electrică, implicit curentul de deplasare, peste tot 

în circuit cu except¸ia condensatoarelor, cât si induct¸ia magnetică, cu except¸ia bobinelor; 

3. se neglijează repartit¸ia neuniformă a curentului variabil în timp pe sect¸iunea conductoarelor. 

La viteze mari de variat¸ie în timp a curentului electric electric de conduct¸ie 

s¸i la valori mari ale conductivităt¸ii σ, permeabilităt¸ii µ s¸i a celei mai mici dimensiunii 

6

2.1. Modele cu parametri concentrat¸i 

Figura 2.1: Forme inductoare: (a) pătratică, (b) octogonală, (c) hexagonală, (d) circulară 

d a sect¸iunii transversale a unui conductor izolat, densitatea de curent este mai mare 

la suprafat¸a conductorului. Acest efect, numit pelicular, este neglijabil dacă e satisfăcută 

condit¸ia, ca diametrul conductorului d să fie mult mai mic decât adâncimea 

de pătrundere δ: 

d 

δ 

≪ 1; δ = 

1 

√ πfµσ . (2.2) 

Practic, modelarea se rezumă la găsirea unui circuit echivalent, care pentru a avea o 

acuratet¸e ridicată trebuie să modeleze principalele efecte parazite, într-o gamă de frecvent¸e 

cât mai extinsă. 

În anul 1996, Yue propune unul din primele modele cu parametri concetrat¸i pentru 

inductorul spiralat [16]. Acesta se dores¸te a fi un model cu acuratet¸e ridicată, care să t¸ină 

cont de principalele efecte ale câmpului electromagnetic: curent¸ii turbionari din spirala 

conductoare s¸i capacităt¸ile parazite aparute între spire, dar s¸i cele apărute între spirală s¸i 

substraturile inductorului. Cât¸iva ani mai târziu, în anul 2000, autorul publică în lucrarea 

[17], întreg procesul de dezvoltare al modelului propus în lucrarea precedentă [16] (Figura 

2.2). 

Parametri concentrat¸i ai modelului din Figura 2.2 sunt definit¸i astfel: 

• rezistent¸a serie Rs: 

Rs = 

ρ · l 

w · δ · (1 − e−t/δ , (2.3) 

) 

unde ρ rezistivitatea metalului, l lungimea totală a spiralei, w lăt¸imea liniei (Figura 

7


Figura 2.2: Modelul cu parametri concentrat¸i pentru inductorul spiralat 

2.1 (a)), adâncimea de pătrundere δ, t grosimea metalului (se constată, deci, că se 

încearcă modelrea efectului pelicular, chiar s¸i pe un model cu parametri concentrat¸i); 

• inductivitatea serie Ls, calculată folosind algoritmul Greenhouse [18], care a devenit 

o metodă de referint¸ă pentru calculul inductant¸ei proprii; 

• capacitatea serie Cs: 

Cs = (N − 1) · w 2 · 

εOx 

tOx M1−M2 

, (2.4) 

unde N numărul de spire, tOx M1−M2 grosimea stratului de oxid dintre stratul de 

metal al spiralei s¸i metalul folosit pentru legături; 

• capacitatea stratului de oxid COx: 

COx = 1 εOx 

· l · w · 

2 tOx 

unde tOx grosimea stratului de oxid dintre spirală s¸i substrat; 

• capacitatea stratului de Si CSi: 

, (2.5) 

CSi = 1 

2 · l · w · CSub , (2.6) 

unde CSub capacitarea substratului pe unitatea de suprafat¸ă; 

• rezistent¸a stratului de Si RSi: 

RSi = 

2 

l · w · GSub 

unde GSub conductant¸a substratului pe unitatea de suprafat¸ă. 

, (2.7) 

Parametrii parazit¸i sunt aproximat¸i folosind modele simple de câmp uniform. Aparit¸ia 

adâncimii de pătrundere, care depinde de frecvent¸ă, face ca modelul să nu fie riguros cu 

parametri concentrat¸i. 

8

Factorul de calitate Q este calculat cu formula: 

Q = 

ω · Ls 

· 

Rs 

Rp + 

ω·Ls 

Rs 

Rp 

2 × 

+ 1 · Rs 

2.1. Modele cu parametri concentrat¸i 

 

1 − R2 S · Co 

− ω 

LS 

2 · LS · Co 

 

, (2.8) 

unde Co = Cp + Cs. În relat¸ia factorului de calitate Q (2.8) primul termen cont¸ine 

informat¸ia referitoare la energia magnetică stocată s¸i pierderile rezistive în spirala conductoare. 

Al doilea termen este factorul de pierderi în substrat reprezentând energia disipată în 

stratul semiconductor de Si. Ultimul termen este factorul de rezonant¸ă. 

Desigur, principalul neajuns al acestui model este acela că este valabil numai pentru 

frecvent¸e de maxim 1GHz. 

O analiză comparativă a metodelor, pentru calculul inductivităt¸ilor bobinelor spiralate 

plane, este prezentată în [19]. Rezultatele acestei lucrări sunt implementate într-un calculator 

on-line de inductivităt¸i [20]. În anul 2001, raportul [21] prezintă analiza formulelor 

de calcul a inductivităt¸ilor proprii s¸i mutuale, dintre tronsoanele conductoare. 

În 2002, este adusă o îmbunătăt¸ire a modelului pentru inductorul spiralat de lucrarea 

[22], care propune un nou model cu parametri concentrat¸i (Figura 2.3), numit circuitul π. 

O schemă mai exactă de modelare a efectul pelicular s¸i a curent¸ilor turbionari, se obt¸ine 

prin adăugarea unui grup LskRsk paralel (Figura 2.3). Banda de frecvent¸e cres¸te până la 

3GHz. 

Grupul LskRsk paralel modelează aproximativ dependent¸a adâncimii de pătrundere în 

funct¸ie de frecvent¸ă, iar acest lucru se reflectă în factorul de calitate, care are valori imprecise 

la frecvent¸e de ordinul gigahertzilor. 

Figura 2.3: Modelul cu parametri concentrat¸i pentru inductorul spiralat cu adăugarea unui 

grup LskRsk paralel. 

În 2003, lucrarea [23] prezintă un studiu privind cercetările ultimilor ani în domeniul 

proiectării s¸i modelării inductoarelor spiralate. Circuitul echivalent propus de autori (Figura 

2.4), prezintă, pe lângă elementele cunoscute, s¸i un circuit cuplat mutual, care modelează 

curent¸ii indus¸i în substrat. 

Acest studiu demonstrează că forma cea mai bună pentru inductoarele spiralate este 

cea circulară, iar frecvent¸a maximă, în care factorul de calitate are valori acceptabile, este 

9


Figura 2.4: Modelul cu parametri concentrat¸i pentru inductorul spiralat. 

de 2.4GHz. Acestea nu reprezintă o solut¸ie, deoarece forma circulară implică procese 

tehnologice destul de complicate. 

Tot în acelas¸i an, lucrarea [24] introduce un nou model pentru inductorul spiralat, denumit 

s¸i circuitul 2π (Figura 2.5). Modelul înlătură dependent¸a de frecvent¸ă, calculând 

valorile elementelor de circuit cu ajutorul unor fomule derivate din teoria circuitelor s¸i teoria 

câmpului, formule ce au la bază forma geometrică a inductorului. Folosirea a două 

modele π înlant¸uite, care cont¸in elemente de circuit independente de frecvent¸ă permit analiza 

tranzitorie s¸i lărgesc banda de frecvent¸e până la 4GHz. 

Figura 2.5: Modelul cu parametri concentrat¸i pentru inductorul spiralat 2π. 

Un an mai târziu, mergând pe aceeas¸i idee de a folosi circuitul echivalent 2π cu elemente 

de circuit independente de frecvent¸ă, lucrarea [25] prezintă o metodă de modelare 

a caracterului distribuit al sistemului, prin extract¸ia valorilor elementelor de circuit din 

măsurătorile paramentrilor de împrăs¸tiere S pentru circuitul cu două sect¸iuni. Modelele 

extrase cu ajutorul acestei metode sunt valabile în banda de frecvent¸e 0.1-10GHz. Chiar 

dacă metoda de modelare este una empirică, ea demonstrează că există modele cu un număr 

relativ redus de parametri concentrat¸i, pentru o plajă de frecvent¸e destul de largă. 

În 2005, lucrarea [26] propune extragerea elementelor circuitului echivalent folosind 

teoria liniei de transmisie. Folosind serii Taylor s¸i aproximări rat¸ionale se demostrează că 

10

2.2. Modele cu parametri distribuit¸i 

se pot obt¸ine valori foarte acceptabile pentru elementele de circuit, în banda de frecvent¸ă 

0.1-25GHz. O analiza a scalabilităt¸ii modelelor cu parametri concentrat¸i este prezentată în 

[27]. 

În 2008, lucrarea [28] continuă ideea de a extrage valorile elementelor circuitului de 

circuit din măsurătorile parametrilor ret¸elei (S sau Y). Cu toate acestea banda de frecvent¸e 

rămâne destul de îngustă pentru aplicat¸iile actuale. Acest studiu demonstrează, că ipotezele 

simplificatoare, ale teoriei circuitelor cu parametri concentrat¸i, sunt prea restrictive pentru 

situat¸iile practice: de exemplu, conform ipotezei 3, la frecvent¸e de 60GHz, doar circuitele 

cu lungimi mult mai mici de 500µm se pot trata folosind teoria cu parametri concentrat¸i. 

Această limitare nu poate fi satisfăcută, deoarece există aplicat¸ii în care inductoarele integrate 

au dimensiuni mai mari de 500µm [29], iar lungimea de undă scade odată cu cres¸terea 

frecvent¸ei. 

În concluzie, se constată, că ipotezele simplificatoare ale teoriei circuitelor cu parametri 

concentrat¸i, nu mai pot fi satisfăcute de circuitele integrate actuale, deoarece aplicat¸iile 

implică frecvent¸e mari de lucru, astfel încât nu se mai poate neglija nici un efect al vreuneia 

din componentele câmpului electromagnetic. Prin urmare, teoria cu parametri concetrat¸i 

nu poate răspunde cerint¸elor circuitelor integrate de înaltă frecvent¸ă, astfel încât, în acest 

context, o nouă teorie trebuie abordată, teorie care să ia în calcul toate efectele câmpului 

electromagnetic sau să fie mai put¸in restrictivă decât teoria cu parametri concentrat¸i. 

2.2 Modele cu parametri distribuit¸i 

Teoria liniilor de transmisie furnizează un model tipic cu parametri distribuit¸i [30]. 

Prin parametri distribuit¸i ai unui circuit electric, se înt¸elege, că proprietăt¸ile circuitului 

(rezistent¸e, inductivităt¸i, capacităt¸i) sunt distribuite, în mod continuu în spat¸iul circuitul sau 

pe o parte a acestuia. În general, teoria liniilor de transmisie este folosită pentru aplicat¸ii 

cu frecvent¸e de lucru foarte mari, însă ea poate fi folosită s¸i la frecvent¸e joase, pentru linii 

lungi (de exemplu, liniile de transport de energie electrică). Principala condit¸ie a acestei 

teorii, este ca lungimea de undă λ (2.1) să fie comparabilă cu lungimea circuitului L sau mai 

mică decât aceasta. Astfel, la 60GHz, având o lungime de undă de 500µm, se pot aborda 

circuite cu lungimi comparabile cu această valoare [29][31], spre deosebire de teoria cu 

parametri concentrat¸i, ce impune o lungime a circuitului mult mai mică decât lungimea de 

undă. 

Modelul cu parametri distribuit¸i oferă o acuratet¸e mai mare decât modelul cu parametri 

concentrat¸i, însă complexitatea modelului este mult mai mare. Acuratet¸ea modelului provine 

din faptul că se ia în considerare interact¸iunea reciprocă a efectelor câmpului electromagnetic, 

iar complexitatea provine din faptul că modelul este descris de ecuat¸ii cu derivate 

part¸iale. Modelul cu parametri distribuit¸i, descris de ecuat¸iile lui Maxwell, completat cu 

relat¸iile consitutive de material s¸i cu condit¸iile pe frontieră, este un model continuu, infinit 

dimensional. Pentru a obt¸ine un model discret, cu o dimensiune finită, se foloses¸te o 

metodă numerică pentru a discretiza ecuat¸iile lui Maxwell, dintre care cele mai importante 

sunt: FEM (metoda elementului finit), FDM (metoda diferent¸elor finite) s¸i BEM (metoda 

elmentelor de frontieră), numită s¸i MoM (metoda momentelor). 

Metoda elementului finit (FEM) reprezintă unul din cele mai populare instrumente 

pentru rezolvarea ecuat¸iilor diferent¸iale în diferite domenii, printre care s¸i electromagnetis- 

11


mul. În continuare, se va prezenta principiul general al metodei, după care va fi prezentat 

un exemplu de problemă, având ca scop prezentarea modului de discretizare a ecuat¸iilor lui 

Maxwell, care sunt un sistem de ecuat¸ii diferent¸iale cu derivate part¸iale. 

Principalul avantaj al acestei metode este că poate trata probleme cu o complexitate ridicată 

a geometriei. Acest lucru se datorează folosirii ret¸elelor de discretizare nestructurate 

(unstructured meshes), care pot fi alcătuite, în funct¸ie de tipul problemei 1D, 2D, 3D, din 

diferite elemente geometrice simple, respectiv segmente, triunghiuri sau patrulatere, tetraerdre, 

prisme, piramide sau hexaedre (triunghiulare sau patrulatere) (Figura 2.6). Folosirea 

ret¸elelor de discretizare nestructurate permite modelarea obiectelor ce prezintă curbe, în 

timp ce alte metode, cum ar fi metoda diferent¸elor finite (FDM), nu pot aborda astfel de 

obiecte, decât introducând mari aproximări, din cauza restrict¸iei ret¸elei de discretizare, care 

trebuie sa fie cartezian. 

Figura 2.6: Forma elementelor finite. (a) unidimensionale. (b) bidimensionale. (c) tridimensionale. 

În plus, folosirea formei triunghiulare pentru elementul finit, permite rafinarea ret¸elei de 

discretizare pe anumite port¸iuni, rezultând o ret¸ea adaptivă (Figura 2.7) [32]. Prin utilizarea 

ret¸elei adaptive se îmbunătăt¸es¸te acuratet¸ea solut¸iei, dar cres¸te s¸i dimensiunea modelului, 

lucru ce impune folosirea unor sisteme de calcul de înaltă performant¸ă. Algoritmii de generare 

a ret¸elelor de disctretizare adaptive se bazează pe estimarea erorii, folosind indicatori 

de eroare [33][34], astfel încât, iterează următoarea secvent¸ă de pas¸i: 

1. calculeză solut¸ia numerică pentru ret¸eaua actuală; 

2. calculează indicatorii de eroare pentru fiecare element; 

3. rafinează ret¸eua, prin divizarea elementelor care au cel mai mare indicator de eroare. 

Metoda elementului finit are mai multe avantaje, totus¸i, dezavantajul metodei este pus 

în evident¸ă la rezolvarea problemelor tranzitorii în domeniul timpului. După discretizarea 

spat¸ială cu FEM se obt¸ine un sistem de ecuat¸ii diferent¸iale ordinare, care trebuie integrate 

numeric. Din păcate, acest sistem are o formă, care impune folosirea metodelor implicite de 

integrare, deci, la fiecare pas de timp trebuie rezolvat un sistem liniar de mari dimensiuni, 

lucru ce este inadmisibil de costisitor, din punct de vedere al resurselor computat¸ionale. 

În schimb, discretizarea directă a ecuat¸iilor lui Maxwell prin diferent¸e finite sau tehnica 

12

Figura 2.7: Ret¸ea de discretizare adaptiv 


integralelor finite (FIT), conduce la metoda FDTD, care are caracter explicit, astfel, efortul 

de calcul la fiecare iterat¸ie fiind mult mai mic. Deci, pentru un acelas¸i model, metoda elementului 

finit va avea nevoie de mai multe resurse, atât din punct de vedere al procesorului, 

cât s¸i din punct de vedere al memoriei. 

Algoritmul de rezolvare al ecuat¸iilor cu derivate part¸iale cu metoda elementului finit, 

presupune execut¸ia unei serii de pas¸i. Se consideră ecuat¸ia în domeniul Ω de forma 

Lφ = f , (2.9) 

unde L este un operator diferent¸ial (de regulă liniar de ordinul doi, de tip eliptic, cum este 

de exemplu operatorului Lapalce), f este sursa câmpului s¸i φ câmpul necunoscut, de regulă, 

un potent¸ial. 

În electromagnetism, acestă formă apare în rezolvarea problemelor din regimurile statice, 

stat¸ionare sau MQS, EQS, ED, cu variat¸ie armonică în timp, după reprezentarea în 

complex. În aceste situat¸ii, problema este descrisă de ecuat¸ii de tip scalar sau vectorial, 

eliptic (Poisson, Lapalce, Helmhotz), parabolic (cum este ecuat¸ia difuziei câmpului în regim 

MQS) sau hiperbolic (cum este ecuat¸ia de propagare a undelor electromagnetice). Necunoscutele 

pot fi potent¸ialele scalar s¸i/sau vectorial sau componenetele câmpului electric 

s¸i/sau magnetic. 

Metoda elementelor finite înlocuies¸te domeniul continuu cu un număr finit de subdomenii 

de formă geometrică foarte simplă, în interiorul cărora solut¸ia are variat¸ie spat¸ială 

polinomială. 

Primul pas al analizei cu elemente finite constă în discretizarea domeniului, care presupune 

descompunerea domeniului Ω în elemente, care se vor nota cu e. Gradul de discretizare 

reprezintă un factor foarte important al metodei, deoarece o discretizare densă poate 

conduce la un timp de rezolvare foarte mare sau chiar imposibilitatea rezolvării, din motive 

de insuficinent¸ă a memoriei. În schimb, discretizarea insuficient de fină duce la o solut¸ie 

13


numerică lipsită de acuratet¸e. Fiecare element este caracterizat de parametri geometrici, 

ce indică pozit¸ia nodurilor, dar s¸i parametri topologici, care indică nodurile ce definesc o 

latură. Solut¸ia numerică a problemei este descrisă de gradele de libertate, care indică, de 

regulă, valoarea solut¸iei în noduri sau circulat¸ia ei de-a lungul muchiilor. 

Pornind de la valorile gradelor de libertate se interpoleaza solut¸ia în intregul domeniu de 

calcul, folosind un set de funct¸ii de bază, cu carcater polinomial. Acest set este definitoriu 

pentru metoda de elemente finite folosită. Cu cât gradul polinoamelor este mai mare, cu 

atât ordinul metodei aplicate este mai mare [35]. Acest al doilea pas constă în alegerea 

funct¸iilor de interpolare, numite s¸i funct¸ii de formă [36]. Expresia solut¸iei numerice din 

elementul e are forma: 

φ e n 

= N e j φ e j = [N e ] T [φ e ] , (2.10) 

j=1 

unde n este numărul de noduri ale elementului, φ e j reprezintă gradele de libertate, adică 

valoarea solut¸iei φ e în nodul j al elementului, iar N e j (x) funct¸ia de interpolare a nodului j, 

numită s¸i funct¸ia de bază. 

Pasul al treilea îl reprezintă generarea sistemului de ecuat¸ii algebrice liniare [37], pentru 

care se foloses¸te forma slabă a ecuat¸iei obt¸inută fie prin metoda reziduurilor ponderate 

(metodă de proiect¸ie), fie prin metoda variat¸ională (minimizarea funct¸ionalei de energie). 

Metoda Rayleigh-Ritz se aplică atunci când există o funct¸ională de energie, al cărui minim 

corespunde solut¸iei, cum se întâmplă în problemele stat¸ionare de câmp electromagnetic. 

Metoda Galerkin face parte din familia metodelor de proiect¸ie s¸i este cea mai des folosită 

abordare în analiza cu elemente finite. În cazul problemelor stat¸ionare, descrise de ecuat¸ii 

de tip eliptic, cele două metode sunt perfect echivalente, generând acelas¸i sistem de ecuat¸ii 

liniare. 

Se consideră ˜ φ aproximarea solut¸iei φ, pentru care reziduul are forma 

r = L ˜ φ − f . (2.11) 

Metoda reziduului ponderat impune condit¸ia 

 

Ri = wir dΩ = 0 i = 1, n, (2.12) 

Ω 

unde Ri reziduul ponderat al integralei s¸i wi reprezintă funct¸iile pondere ”de test”, care în 

cazul metodei Galerkin se aleg identice cu funct¸iile de bază. Înlocuind r s¸i wi în formula 

(2.13), se obt¸ine reziduul ponderat al elementului e 

R e 

i = N e i (L ˜ φ e − f) dΩ i = 1, n. (2.13) 

Ω e 

În relat¸ia reziduului ponderat (2.13) se înlocuies¸te expresia elmentului e (2.10) 

R e 

i = N e i L[N e ] T dΩ [φ e 

] − fN e i dΩ i = 1, n. (2.14) 

Ω e 

Această relat¸ie este de forma a(u, w) = f(w) pentru orice w apartine unui spat¸iu liniar H 

(de tip Hilbert). Această ultimă relat¸ie se numes¸te forma slabă a ecuat¸iei s¸i este descrisă de 

14 

Ω e


funct¸ionala biliniara a(u, w), simetrică s¸i pozitivă, s¸i de funct¸ionala liniara f(w). Dacă se 

considera spat¸iul liniar H, ca unul finit dimensional, de exemplu, cel generat de funct¸iile 

de bază, atunci forma slabă poate fi scrisă matriceal: 

[R e ] = [K e ][φ e ] − [b e ] (2.15) 

unde [Re ] vector n × 1, [Ke ] matrice n × n, unde Ke i,j sunt definit¸i de relat¸ia (2.16), s¸i [be ] 

vector n × 1, cu elemente be i definite de relat¸ia (2.17): 

K e 

i,j = N e i LN e j dΩ , (2.16) 

Ω e 

b e 

i = 

Ωe fN e i dΩ , (2.17) 

Matricea [K e ] poartă numele de matrice de rigiditate, datorită faptului că această metodă a 

fost aplicată prima dată în mecanică. 

Folosind valorile elementului e, se poate extinde relat¸ia (2.15) ca o sumă a tuturor 

elementelor 

R = 

M 

[R e ] = 

e=1 

M 

[K e ][φ e ] − [b e ] . (2.18) 

e=1 

Egalând cu zero fiecare proiect¸ie a reziduului din relat¸ia (2.18) se obt¸ine sistemul de ecuat¸ii 

M 

[K e ][φ e ] − [b e ] = [0] , (2.19) 

e=1 

care poate fi scris sub formă compactă ca 

[K][φ] = [b] . (2.20) 

Aces¸ti pas¸i, de generare a sistemului de ecuat¸ii (2.20), reprezintă etapa de preprocesare 

a analizei cu elemente finite. Următoarea etapă constă în rezolvarea sistemului de 

ecuat¸ii (2.20) folosind fie metode directe, fie metode iterative de rezolvare. Ultima etapă o 

reprezintă interpretarea rezultatelor, s¸i anume calcularea s¸i vizualizarea diferitelor mărimi 

derivate asociate problemei, această etapă fiind postprocesarea. 

Prezentarea metodei elementului finit, făcută anterior, are un caracter principial s¸i relativ 

superficial, deoarece nu tratează în detaliu problema condit¸iilor de frontieră. Pentru a 

lămuri acest aspect vor fi prezentate câteva exemple preluate din [32], care detaliază aplicarea 

metodei elementului finit. Un exemplu de analiză cu elemente finite în domeniu 2D 

este calculul rezistent¸ei unei plăci conductoare (Figura 2.8). 

În regim electrocinetic, potent¸ialul scalar satisface o ecuat¸ie Laplace generalizată, relatia 

(2.9) căpătând, în domeniul bidimenional S al plăcii, forma unei ecuat¸ii cu derivate 

part¸iale de ordinul doi, de tipul: 

− ∂ 

∂x (αx 

∂φ ∂ 

) 

∂x ∂y (αy 

∂φ 

) + βφ = f (x, y) ∈ S (2.21) 

∂y 

15


care poate fi rescrisă ca 

Figura 2.8: Placă conductoare în domeniu 2D. 

− ∇ · (α∇φ) + βφ = f pe S (2.22) 

s¸i completată cu condit¸ii pe frontieră Dirichlet (2.23) s¸i Neumann (2.24): 

φ = p pe L1 , (2.23) 

ˆn · (α∇φ) + γφ = q pe L2 . (2.24) 

Reziduul ponderat, ”funct¸ia de test” wi (2.13), scris pentru domeniul S, devine 

 

wi[−∇ · (α∇φ) + βφ − f]dS = 0 , (2.25) 

care se rescrie ca 

 

S 

S 

 

wi[−∇ · (α∇φ) + βφ]dS = 

S 

wifdS . (2.26) 

Întegrând prin părt¸i folosind identitatea lui Green, relat¸ia anterioară devine 

∇ · [wi(α∇φ)] = α∇wi · ∇φ + wi∇ · (α∇φ) . (2.27) 

Folosind teorema lui Gauss pentru domeniu 2D 

 

 

∇ · FdS = 

S 

L1+L2 

ˆn · Fdl (2.28) 

cu F = wiα∇φ, se obt¸ine forma slabă a ecuat¸iilor (2.22), (2.23) s¸i (2.24) 

 

 

 

(α∇wi · ∇φ + βwiφ)dS = wi(q − γφ)dl + wifdS . (2.29) 

S 

S 

L2 

16


Această etapă mai poate fi numită, s¸i trecerea de la forma tare (2.22), (2.23) s¸i (2.24), 

la forma slabă (2.29), ecuat¸ie integral-diferent¸ială ce cont¸ine s¸i condit¸iile pe frontieră. În 

metoda Galerkin se aleg funct¸iile de interpolare identice cu funct¸iile de bază. Deci, folosind 

relat¸ia (2.10) ce descrie elementul, s¸i înlocuind wi în forma slabă se obt¸ine: 

 

(α∇N e i · ∇N e j + βN e i N e 

j )dS − N e i (q − γN e 

j )dl = N e i fdS . (2.30) 

S 

În relat¸ia 2.31, se separă cunoscutele de necunoscute 

 

(α∇N 

S 

e i · ∇N e j + βN e i N e 

j )dS + N 

L2 

e i γN e 

j dl = 

N e 

i qdl + N e i fdS , 

L2 

L2 

S 

S 

(2.31) 

unde în membrul stâng se vede funct¸ionala biliniară, iar, în membrul drept funct¸ionala 

liniară. Relat¸ia (2.31), matriceal devine 

unde 

S 

[K e ][φ e ] = [b e ] (2.32) 

K e 

i,j = (α∇N e i · ∇N e j + βN e i N e 

j )dS + 

b e 

i = 

L2 

N e 

i qdl + 

L2 

N e i γN e j dl , (2.33) 

N 

S 

e i fdS . (2.34) 

Scriind relat¸ia (2.19), pentru toate elementele, se obt¸ine sistemul liniar Kφ = b. Indicele j 

parcurge toate nodurile, însă indicele i parcurge doar nodurile în care φ e i nu este cunnoscut 

(nodurile de pe curba L2, cele de pe curba L1 fiind cunoscute din condit¸ia Dirichlet). Deci, 

o parte din vectorul φ se cunoas¸te, astfel că sistemul liniar se poate rescrie 

[KD | Ke][φD φe] T = KDφD + Keφe = b . (2.35) 

KD s¸i φD sunt cunoscute, datorită condit¸iiei Dirichlet, s¸i, în consecint¸ă, sistemul de rezolvat 

se rescrie 

Keφe = b − KDφD . (2.36) 

Dimensiunea sistemului liniar ce trebuie rezolvat (numărul de necunoscute - grade de 

libertate) este egal cu numărul nodurilor interioare plus numărul nodurilor de pe frontieră 

Neumann. Nodurile de pe frontiera Dirichlet având potent¸ial fix, nu generează grade de 

libertate. În solut¸ia numerică aceste condit¸ii vor fi îndeplinite exact, în timp ce condit¸iile 

Neumann sunt îndeplinite aproximativ, pe cât de bine posibil. 

Condit¸iile de frontieră de tip Neumann intervin în ecuat¸ia rezolvată, motiv pentru care 

ele se numesc ”naturale”, în schimb condit¸iile Dirichlet trebuie satisfăcute de funct¸iile de 

forma, motiv pentru care ele se numesc ”esent¸iale”. Această separare este esent¸ială pentru 

17


Figura 2.9: Distribut¸ia potent¸ialului în placă conductoare 

metoda elmentului finit. În lucrarea [35], sunt date expresii ale funct¸iilor de bază pentru 

diferite grade ale polinoamelor de interpolare. Folosind coordonatele baricentrice, în 

cazul triunghiurilor s¸i tetraedrelor, contribut¸iile elementelor la matricea sistemului capătă 

expresii analitice compacte. 

Revenind la problema init¸ială, rezistent¸a plăcii conductoare, se poate calcula în etapa 

de postprocesare prin aproximarea potent¸ialului electrocinetic (Figura 2.9), ca solut¸ie a 

ecuat¸iilor (2.22)-(2.24), în care α este conductivitatea σ, β = 0, γ =0 si q = 0, în două 

moduri: 

• integrând componenta normală a densităt¸ii de curent pe o sect¸iune a plăcii, pentru a 

obt¸ine curentul: 

 

I = J · ndS . (2.37) 

S 

Resistent¸a se obt¸ine din legea lui Ohm R = U/I, unde U e definit ca diferent¸ă 

de potent¸ial între potent¸ialele plăcii conductoare (Figura 2.8, linie continuă s¸i linie 

întreruptă). 

• calculând puterea totală disipată în placă 

 

P = J · EdV, (2.38) 

apoi rezistent¸a se calculează ca R = U 2 /P . 

V 

Folosirea potent¸ialului scalar, reprezintă modul tipic de rezolvare a problemelor statice, 

însă pentru probleme de câmp, din regimurile magnetic stat¸ionar, MQS s¸i general variabil, 

este necesară folosirea potent¸ialului vector s¸i a ecuat¸iilor vectoriale pentru câmpuri. 

Modelele cu elemente nodale dau, în aceste cazuri, rezultate eronate. Cea mai bună metodă 

de aproximare a câmpului electromagnetic, în acest caz, foloses¸te elemente de muchie 

[38]. Funct¸iile de bază pentru elementele de muchie sunt construite astfel încât componenta 

tangent¸ială este continuă pe frontiera elementelor, în timp ce componenta normală poate 

avea s¸i discontinuităt¸i. Din acest punct de vedere, principala diferent¸ă între problemele 

18


scalare s¸i cele vectoriale, constă în alegerea funct¸iei de bază (wi). Expresii ale funct¸iilor de 

bază vectoriale cu elemente de muchie, de diferite ordine, sunt prezentate lucrarea în [35]. 

Un exemplu de utilizare a elementelor de muchie este rezolvarea ecuat¸iei vectoriale 

Helmholtz de tip rot − rot pentru E, în regim general variabil, cu variat¸ie armonică în 

funct¸ie de timp: 

∇ × (µ −1 ∇ × E) − (ω 2 ε − jωσ)E = −jωJ S pe S, (2.39) 

ˆn × E = P pe L1, (2.40) 

ˆn × (µ −1 ∇ × E) + γˆn × ˆn × E = Q pe L2, (2.41) 

unde relat¸ia (2.40) reprezintă o condit¸ie Dirichlet s¸i relat¸ia (2.41) o condit¸ie Robin, iar J S 

este sursă de curent. 

La fel ca în cazul problemei statice (2.22)-(2.24), folosind identitatea lui Green, se 

rescrie ecuat¸ia (2.39) cu ajutorul reziduului ponderat (”funt¸ia de test”) wi: 

∇ · [wi × (µ −1 ∇ × E)] = µ −1 (∇ × wi) · (∇ × E) 

−wi · ∇ × (µ −1 ∇ × E) 

(2.42) 

Termenul divergent¸ă din relat¸ia (2.42) este integrat folosind teorema lui Gauss pentru domenii 

2D (2.28), rezultând forma slabă: 

 

S 

[µ −1 (∇ × wi) · (∇ × E) − (ω 2 

ε − jωσ)wi · E]dS 

 

+ wi · (Q − γˆn × ˆn × E)dl = −jω wi · J S dS . 

L2 

S 

(2.43) 

Principala diferent¸ă, fat¸ă de problema statică constă în alegerea funct¸iilor de bază, care în 

cazul anterior erau funct¸ii nodale, iar în acest caz, funct¸ia wi = N e i (x) este de element 

de muchie. Elementele de muchie vor reprezentă gradele de libertate. Solut¸ia E e (x) se 

dezvoltă pentru toate elementele de pe muchie (analog relat¸iei 2.10): 

E e = 

n 

j=1 

N e j E e j , (2.44) 

Se aplică metoda Galerkin, alegând funct¸iile de test wi(x) = N e i (x), apoi se înlocuies¸te 

în (2.43), s¸i, separând cunoscutele de necunoscute, se obt¸ine: 

 

+ 

L2 

care matriceal poate fi scris 

 

[µ 

S 

−1 (∇ × N e i ) · (∇ × N e j ) − (ω 2 ε − jωσ)N e i · N e j ]dS 

γ(ˆn × N e i ) · ˆn × N e 

j )dl = −jω N e i · J S 

dS − N e i · Qdl , 

S 

L2 

(2.45) 

[K e ][φ e ] = [b e ] . (2.46) 

19


Rezolvarea problemei se reduce la rezolvarea acestui sistem complex de ecuat¸ii algebrice 

liniare. Elementele matricei [Ke ] pot fi scrise sub forma 

K e 

ij = [µ 

S 

−1 (∇ × N e i ) · (∇ × N e j ) − (ω 2 ε − jωσ)N e i · N e j ]dS 

 

+ γ(ˆn × N e i ) · ˆn × N e (2.47) 

j )dl , 

termenii liberi 

iar necunoscutele 

L2 

b e 

i = −jω N 

S 

e i · J S 

dS − N 

L2 

e i · Qdl , (2.48) 

φ e j = E e j . (2.49) 

Indexul j merge până la numărul total de muchii din ret¸eaua de discretizare n, iar indexul 

i, reprezintă elementele în care E este cunoscut, din condit¸ia Dirichlet (2.40) pe L1. 

Un alt exemplu este o problemă variabilă în timp pentru ecuat¸ia undei electromagnetice 

[32] într-o zonă fără pierderi, cu condit¸ii de frontieră nule, având ca sursă, condit¸ia init¸ială: 

∇ × 

 

1 

µ ∇ × E 

 

+ ε ∂2E = 0 

∂t2 pe S, (2.50) 

ˆn × E = 0 pe L1, (2.51) 

E(r, t = 0) = E0(r) pe S, (2.52) 

∂E(r, t) 

|t=0 = 0 

∂t 

pe S. (2.53) 

Pe lângă condit¸ia pe frontieră (2.51), apar s¸i condit¸iile init¸iale (2.52) s¸i (2.53), deoarece 

avem o ecuat¸ie de ordinul doi variabilă în timp (2.50). Câmpul electric se dezvoltă în 

elementele de muchie. Discretizarea trebuie făcută s¸i în timp, spre deosebire de cazul 

anterior, în care ea s-a facut doar în spat¸iu. Sistemul rezultat este un sistem cu ecuat¸ii 

diferent¸iale ordinare (ODE): 

Sφ(t) + c −2 

0 M ∂2 φ(t) 

∂t 

= 0, (2.54) 

unde S este matricea de rigiditate, iar M matricea de masă. Pentru a rezova acest sistem 

pot fi folosite diferent¸e finite centrate: 

M(φ n+1 − 2φ n + φ n−1 ) = −(c0∆t) 2 Sφ n 

(2.55) 

s¸i trebuie specificate condit¸iile init¸iale φ 1 s¸i φ 2 , însă principalul dezavantaj al acestei metode 

este acela că la fiecare pas de timp trebuie calculată inversa matricei M (2.56), operat¸ie ce 

poate fi costisitoare atât din punct de vedere al timpului, cât s¸i din punct de vedere al 

resurselor sistemului de calcul: 

φ n+1 = 2φ n − φ n−1 − (c0∆t) 2 M −1 Sφ n . (2.56) 

20


În concluzie, indiferent de tipul aplicat¸iei, analiza cu elemente finite conduce la rezolvarea 

unui sistem liniar care, de regulă, are matricea rară, simetrică s¸i pozitiv definită, bine 

condit¸ionată, ceea ce garantează o rezolvare ce implică un consum mai redus de resurse de 

calcul. 

O altă metodă de discretizare a ecuat¸iilor lui Maxwell, este metoda momentelor (MoM) 

[39], cunoscută s¸i ca metoda elementului de frontieră (BEM). Din punct de vedere al memoriei 

s¸i efortului de calcul, metoda momentelor este mai eficientă decât metoda elementului 

finit, deoarece implică calculul valorilor, doar pentru elementele aflate pe frontiera 

domeniului de calcul s¸i pe interfet¸ele dintre subdomeniile omogene. 

Făcând o analogie cu metoda elementului finit, rezolvarea unei probleme de electromagnetism 

cu metoda momentelor, implică aproape aceeas¸i secvent¸ă de pas¸i. Se consideră 

ecuat¸ia în domeniul Ω: 

Lφ = f , (2.57) 

unde L este un operator, de această dată, integral, f este sursa câmpului s¸i φ câmpul necunoscut. 

Aceasta este deosebirea fundamentală între cele două metode. Dacă în FEM 

se pornes¸te de la ecuat¸iile diferent¸iale, care se reformulează în forma slabă, în BEM se 

folosesc ecuat¸iile integrale ale câmpului electromagnetic. Aceste ecuat¸ii se scriu folosind 

funct¸ia Green a domeniului de calcul, pentru un operator specific problemei. Această etapă 

presupune, deci, inversarea operatorului difernt¸ial. Solut¸ia φ problemei (2.57) se dezvoltă 

ca în metoda elementului finit: 

φ = 

n 

cjvj , (2.58) 

j=1 

unde cj coeficient¸i necunoscut¸i, iar vj funct¸ii de bază. Înlocuind (2.58) în (2.57), se obt¸ine: 

n 

cjLvj = f . (2.59) 

j=1 

Pentru a determina necunoscutele cj, se alege, ca solut¸ie a unui sistem matriceal, un set de 

funct¸ii de test (pondere) wi. Considerând produsul scalar al relat¸iei (2.59) cu wi, rezultă 

n 

cj〈wi, Lvj〉 = f i = 1, m . (2.60) 

j=1 

Cele mai folosite funct¸ii de test, pentru metoda momentelor, sunt: 

• funct¸ia Dirac 

wi(x) = δ(x − xi) , (2.61) 

cu xi reprezentând un set de puncte în domeniul solut¸iei. Relat¸ia (2.61) reprezintă 

satisfacerea ecuat¸iei integrale pe un anumit set de puncte. Formularea este cunoscută 

sub numele de ”potrivirea punctului”. 

21


• funct¸ia 

wi(x) = 

1 x în Ωi 

0 în afară 

(2.62) 

unde Ωi subdomeniul i. Relat¸ia (2.62) reprezintă satisfacerea ecuat¸iei integrale pe 

fiecare subdomeniu. Formularea este cunoscută sub numele de ”colocarea subdomeniului”. 

• funct¸ia de test aceeas¸i cu funct¸ia de bază 

cunsocută sub numele de formularea Galerkin. 

• funct¸ie de test Lvi 

cunoscută ca formularea celor mai mici pătrate. 

wi(x) = vi(x) , (2.63) 

wi(x) = Lvi(x) , (2.64) 

Folosind funct¸iile de test se trece la forma matriceală a relat¸iei (2.60): 

unde S matricea sistemului cu elemente 

b coloana termenilor liberi cu elemente 

[S][c] = [b] , (2.65) 

Sij = 〈wi, Lvj〉 , (2.66) 

bi = 〈wi, f〉 , (2.67) 

iar c vectorul necunoscutelor. 

Pentru a arăta modul de implementare al metodei MoM, se va prezenta un exemplu de 

calcul al potent¸ialului electric, preluat din [32]. 

În electrostatică, potent¸ialul electrostatic φ este determinat în vid de densitatea de sarcina 

ρ, care este sursă de câmp electric, conform ecuat¸iei lui Poisson: 

∇ 2 φ = − ρ 

ε0 

(2.68) 

această fiind forma difierent¸ială de ordinul doi, a ecut¸iei fundamentale a electrostaticii. 

q 

Solut¸ia ecuat¸iei Poisson este superpozit¸ia contribut¸iilor φ = 4πε0|x−x ′ , sarcinilor elemen- 

| 

tare q = ρvdV în x ′ : 

 

φ(x) = 

V 

ρ(x ′ )dV ′ 

4πε0|x − x ′ . (2.69) 

| 

expresie numită integrala coulombiană a potent¸ialului. Potent¸ialul produs de o sarcină 

punctiformă este chiar funct¸ia Green. 

22


Dacă potent¸ialul φ este cunoscut, relat¸ia (2.69) poate fi privită ca o ecuat¸ie integrală 

de variabilă ρ. Această formulare integrală este potrivită pentru probleme de calcul de 

capacităt¸i, unde potent¸ialul este cunoscut pe frontierele conductoare, iar sarcina există doar 

pe aceste frontiere s¸i distribut¸ia sa este necunoscută. Potent¸ialul, notat cu φS, va avea, 

valori egale cu 0 pe o armatura conductoare s¸i valori egale cu 1 pe cealaltă. Ca alternativă 

la rezolvarea ecuat¸iei Laplace, pentru potent¸ialul în vid, se poate calcula densitatea de 

sarcină ρS pe S, rezolvând ecuat¸ia integrală 

 

S 

ρs(x ′ ) 

4πε0|x − x ′ | dS′ = φS(x) . (2.70) 

Pentru un condesator 2D, integrala pe suprafat¸ă se reduce la o integrală pe linie s¸i se 

foloses¸te, ca pondere, potent¸ialul logaritmic, care are expresia potentialului coulombian, 

din problemele plan-paralele, produs de o sarcină distribuită lineic: 

− 1 

2πε0 

 

ρl(x 

S 

′ )ln|x − x ′ |dl ′ = φS(x) . (2.71) 

În electrostatică, funct¸ia Green G(x, x ′ ) reprezintă potent¸ialul electric în punctul x produs 

de o sarcină din punctul x ′ . Într-un domeniu 3D, ea este 

G(x, x ′ ) = 1 

|x − x 

4πε0 

′ | . (2.72) 

Aplicând principiul superpozit¸iei, se obt¸ine solut¸ia, în formă integrală, a ecuat¸iei (2.57), 

pentru domeniu 3D 

 

φ(x) = G(x, x ′ )ρs(x ′ )dV ′ . (2.73) 

În general, problema diferent¸ială (2.57) se poate rescrie în formă integrală ca 

 

φ(x) = 

G(x, x ′ )f(x ′ )dV ′ . (2.74) 

După aplicarea algoritmului metodei momentelor, sistemul Sc = b, ce caracterizează 

această problemă, va avea elemente de forma 

 

 

Sij = wi(x)φk(x)dS = wi(x)G(x, x ′ )f(x ′ )dS dS ′ , 

 

(2.75) 

bi = wi(x) ¯ (φ)(x)dS , (2.76) 

unde ¯ φ(x) este cunoscut, el fiind potent¸ialul pe suprafet¸ele conductoare. 

În concluzie, algoritmul MoM discretizează nu forma slabă a ecuat¸iilor diferent¸iale, 

cum se întâmplă în cazul FEM, ci ecuat¸iile integrale ale câmpului. Aceasta este s¸i principala 

sa dificultate, deoarece, pentru obt¸inerea ecuat¸iilor integrale, este necesară cunoas¸terea 

funct¸iei Green a operatorului problemei rezolvate. Un alt dezavantaj, este acela că matricea 

sistemului liniar, rezultat în urmă aplicării MoM, este densă (plină), ceea ce implică 

un necesar mai mare de memorie, spre deosebire de FEM, la care matricea este rară, dar 

23


de dimensiuni mai mari. De asemenea, s¸i rezolvarea sistemului dens necesită o cantitate 

de memorie mai mare decât rezolvarea unui sistem cu matrice rare. Mai mult, matricea 

sistemului nu este nici măcar garantat simetrică, în toate cazurile. Pentru a reduce atât consumul 

de resurse, cât s¸i timpul de rezolvare s-au dezovltat metode rapide de rezolvare: FFT 

sau FMM, ambele folosite ca metode iterative de rezolvare. 

Metoda diferent¸elor finite, cu varianta ei diferent¸e finite în domeniul timpului (FDTD), 

este o metodă numerică de rezolvare a ecuat¸iilor câmpului bazată pe discretizarea ecuat¸iilor 

cu derivate part¸iale prin diferent¸e finite. Restrict¸ia fundamentală a acestei metode constă în 

faptul că solut¸ia este calculată într-o ret¸ea de discretizare structurată, obt¸inută prin produsul 

cartezian al unor ret¸ele unidimensionale după directiile x, y s¸i z. O restrict¸ie asemănătoare 

este impusă s¸i de metoda Integrătilor Finite (FIT), care poate fi aplicată atât în domeniul 

timpului (FIT-TD), cât s¸i în cel al frecvent¸ei (FIT-FD). Principiul acestei metode va fi prezentat 

în capitolul următor. 

Ca s¸i concluzie generală, indiferent de metoda numerică folosită pentru discretizarea 

ecuat¸iilor lui Maxwell (MoM [39], FDTD [40], FEM [41], FIT [42]), problema se va reduce, 

tot timpul, la rezolvarea unui sistem liniar. De aceea, tipul matricei sistemului (rară, 

plină, simetrică, nesimetrică, complexă, reală, pozitiv definită, diagonal dominantă, etc), 

rezultată în urma aplicării metodei numerice, este foarte important în alegerea unei metode 

”adecvate” de rezolvare, directă sau iterativă. 

Modelarea efectelor inductive reprezintă un aspect important al obt¸inerii modelului 

de ordin redus, sub forma unui circuit cu parametri concentrat¸i, pentru un dispozitiv de circuit 

integrat. Istoric, prima metoda de modelare inductivă a fost propusa de Ruehli, care a 

introdus prin metoda PEEC [43] [44], conceptul de inductivitate part¸ială pentru modelarea 

3D a dispozitivelor din circuitele integrate. Această metodă: discretizează conductoarele în 

segmente elementare (de formă paralelipipedică) s¸i forma integrală a ecuat¸iilor câmpului, 

evaluează elementele part¸iale de circuit ce descriu cuplajele electrice s¸i magnetice s¸i asamblează 

sistemul provenit din ecuact¸iile Kirchhoff pentru curent¸i s¸i tensiuni. Modelul rezultat 

este descris de matrice pline ce cont¸in inductivităt¸ile part¸iale, proprii s¸i mutuale. 

Principalele dezavantaje ale acestei metode sunt matricele pline (a căror aproximare rară 

nu este pasivă, deci nici stabilă), s¸i inductivitatea part¸ială care este doar o mărime de calcul, 

nu s¸i o mărime fizică riguros definită, care să poată fi măsurată pentru o comparat¸ie cu date 

experimentale. 

FastHenry [45] este o tehnică de accelerare a extragerii matricei inductant¸elor part¸iale 

din PEEC, bazată pe dezvoltarea în multipoli, care s-a dovedit foarte eficientă în cazurile 

practice. 

În lucrarea [46] este introdus modelul K, model caracterizat de matricea K a reluctantelor 

magnetice (numită gres¸it s¸i a susceptant¸elor), definită ca inversa matrice inductivităt¸ilor 

part¸iale H = L −1 . În lucrarea [47], acest subiect a fost reluat s¸i s-a demonstrat că 

matricea K poate fi aproximată robust (fără pierderea pasivităt¸ii) cu o matrice rară s¸i că ea 

este matrice simetrică de tip M (cu termenii nediagonali negativi s¸i cu cei diagonali pozitivi 

s¸i dominant¸i) s¸i în consecint¸ă ea este diagonal dominantă. Principalul dezavantaj este că 

matricele K nu pot fi direct simulate în SPICE. Lucrarea [48] demonstrează instabilitatea 

numerică a metodei K propuse în lucrările citate anterior (instabilitatea provine din anularea 

unor termeni negativi de pe diagonală care face ca matricea K să fie pozitiv definită) s¸i 

propune un nou algoritm care are la bază tot metoda K, prin care se obt¸in matrice K rare, 

24


dar care în acelas¸i timp păstrează s¸i stabilitatea numerică. 

Init¸ial metoda VPEC este propusă în lucrarea [49] pentru a două conductoare, însă 

Hao Yu preia acest subiect s¸i propune o metodă VPEC [50], metodă care are la bază tot 

varianta K a metodei PEEC, pentru N conductoare. Această metodă exprimă parametrii 

K folosind potent¸ialul magnetic vector s¸i înlocuiet¸e inductant¸ele cu reluctant¸e magnetice. 

În final, modelul obt¸inut este caracterizat de matrice rare s¸i permite simularea în SPICE. 

Practic se pornes¸te de la modelul PEEC, se calculează inversa matricei L, se obt¸ine modelul 

cu matrice pline VPEC, se generează modelul VPEC cu matrice rare, pentru ca în final să 

se facă simularea în SPICE. 

În concluzie, metoda PEEC are ca principale dezavantaje folosirea inductivităt¸ii part¸iale, 

discretizarea conductorului s¸i cunoas¸terea funct¸iei Green (vezi prezentarea MoM), în timp 

ce metoda VPEC are ca principal dezavantaj calculul inversei matricei inductivităt¸ilor 

part¸iale L −1 . 

Metoda circuitelor echivalente Magneto-Electrice (MEEC) [51] [52] reprezintă o alternativă 

ce evită dezavantajele metodelor PEEC s¸i VPEC. Această metodă foloses¸te conceptul 

de element electromagnetic de circuit [53] s¸i tehnica de descompunere în subdomenii 

[54]. În cazul tipic al unui inductor integrat (Figura 3.1), domeniul de calcul este alcătuit 

din trei subdomenii care conform metodei MEEC pot fi simulate în regimuri diferite (stratul 

de oxid de siliciu în FW, EQS+MS pentru stratul de siliciu s¸i ES+MS pentru stratul de 

aer). Avantajele acestei metode sunt: conceptul de inductivitate part¸ială este eliminat, conductorul 

nu este discretizat în segmente (de fapt el este discretizat într-un sistem de bucle 

fundamentale, fiecare dintre acestea satisfăcând conservarea curentului), nu este necesară 

calcularea inversei matricei inductivităt¸ilor, scrierea cu matrice rare este robustă, permite 

folosirea calculului paralel pentru descompunerea în subdomenii s¸i permite simularea directă 

în SPICE. Prin folosirea discretizării în bucle, complexitatea problemei este redusă s¸i 

este mics¸orat corespunzător atât efortul de calcul cât s¸i necesarul de memorie. 

De cele mai multe ori, metodele de discretizare numerică s¸i de modelare prezentate mai 

sus se găsesc în programe comerciale sau open-source, care cont¸in la rândul lor metode de 

rezolvare corespunzătoare sistemelor liniare de rezolvat, generate în urma dicretizării. În 

continuare se vor prezenta pe scurt câteva din cele mai importante programe de modelare 

pentru inductoarele integrate, evident¸iind folosirea sistemelor multiprocesor. 

ANSYS HFSS 

ANSYS HFSS (High Frequency Structural Simulator) [55] este un program al firmei americane 

Agilent, ce foloses¸te pentru simularea câmpului electromagnetic în domeniu 3D, 

special conceput pentru modelarea componentelor din circuitele integrate (Figura 2.10 

[56]). Programul cont¸ine o suită de metode de rezolvare, proprii, pentru rezolvarea sistemelor 

liniare rezultate în urma discretizării ecuat¸iilor lui Maxwell cu metoda elementelor 

finite, metode de rezolvare ce pot fi selectate manual în funct¸ie de tipul de simulare executat. 

HFSS a fost dezvoltat sub îndurmarea profesorului Zoltan Cendes în Universitatea 

Carnegie Mellon în colaborare cu firma ANOSOFT, însă, ulterior, a fost vândut, în final 

ajugând sub tutela companiei ANSYS. 

Date de intrare: geometria poate fi importată prin programul AnsoftLinks dintr-un 

fis¸ier schemă (layout file generat cu Cadence, Mentor Graphics, Synopsys, Zuken, Altium 

- AnsoftLinks for ECAD [57]) sau dintr-un fis¸ier CAD (generat cu ProE, STEP, IGES - 

25


Figura 2.10: Captură din ANSYS HFSS. 

AnsoftLinks for MCAD [58]). Ret¸eaua de discretizare este generat în mod automat, având 

s¸i posibilitatea de a-l specifica manual. 

Date de ies¸ire: în afara vizualizării câmpului electromagnetic, se mai pot extrage două 

tipuri de date: 

• sub forma unor fis¸iere ce cont¸in funct¸ii de circuit s¸i parametri de împăs¸tiere (S, Y , 

Z); 

• sub formă unui fis¸ier ce cont¸ine descrierea, în limbaj SPICE, a circuitului echivalent 

pentru dispozit modelat. 

HFSS poate accelera modelarea, obt¸inând timpi de execut¸ie mai mici, prin folosirea 

calculului de înaltă performant¸ă (HPC) astfel: 

• pe sisteme cu unul sau mai multe procesoare multicore, programul dispune de multiprocesare 

(MP - multiprocessing), aceasta constând în apelarea operat¸iilor de algebră 

liniară paralele, în procesul de factorizare, discretizare sau de calcul al câmpului; 

• pe sisteme tip cluster, programul dispune de următoarele tehnici: 

– descompunerea domeniului (DDM - domain decomposition method) îmaparte 

o problemă mare ce nu poate încapea în memoria unui singur sistem de calcul, 

accesând memoria fiecărui nod din cluster ca o memorie globală (memorie 

comună distribuită - distributed shared memory - subcapitolul 4.1). Această 

metodă poate fi privită mai mult ca o metodă de abordare a problemelor foarte 

mari, s¸i mai put¸in ca o metodă de accelerare; 

– descompunerea spectrală (SDM - spectral decomposition method) distribuie 

subseturi din seria de frecvent¸e, fiecare nod din cluster rezolvând sistemul liniar 

doar pentru subsetul primit. În funct¸ie de numărul de frecvent¸e, dar s¸i 

de configurat¸ia hardware a nodurilor clusterului, timpul de simulare se reduce 

foarte mult; 

26

SONNET 


– metoda de rezolvare distribuită (DSO - distributed solve option) constă în împărt¸irea 

sarcinii de rezolvare în sarcini indepente (împărt¸irea pe subdomenii a problemei), 

mai mici, ce pot fi executate în paralel pe noduri diferite. Această metodă 

poate fi folosită în combinat¸ie cu medoda DDM. 

Figura 2.11: Captură din SONNET. 

SONNET [59] este un program de modelare electromagnetică, ce îs¸i propune să răspundă 

cerint¸elor ridicate de simularea componentelor din circuitele integrate de înaltă frecvent¸ă 

(Figura 2.11 [60]). Teoria de la baza acestui program [61] constă în rezolvarea ecuat¸iilor 

lui Maxwell cu ajutorul metodei momentelor. 

Date de intrare: geometria poate fi desenată în mediul grafic oferit de SONNET, însă, 

geometriile pot fi importate din fis¸iere în format .DXF [62] sau .GDSII [63], precum s¸i 

formatul Gerber [64]. Ret¸eaua de discretizare se generează automat, având s¸i posibilitatea 

de a-l specifica s¸i manual. 

Date de ies¸ire: se pot vizualiza răspunsul, câmpul electromagnetic, densitatea de curent, 

dar se poate extrage s¸i circuitul echivalent SPICE al dispozitivului modelat. În plus, 

aceste date se pot exporta în fis¸iere compatibile cu CADENCE, SPECTRE etc. 

Din punct de vedere al folosirii resurselor hardware, SONNET foloses¸te procesarea pe 

64 de bit¸i. Din punct de vedere al calculului de înaltă performant¸ă (HPC), SONNET poate 

exploata arhitectura sistemelor multiprocesor astfel: 

• pe sisteme cu unul sau mai multe procesoare multicore, programul perimte procesarea 

paralelă pentru a rezolva părt¸i individuale ale matrice momentelor (solver distribuit), 

la fiecare frecvent¸ă. Folosind instrumentul SONNET Desktop Solver (DST) se 

pot folosi până la maxim 3 core-uri, în timp ce instrumentul SONNET High Performance 

Solver (HPS) poate folosi până la 12 core-uri. 

27


• pe sisteme de tip cluster se poate folosi Sonnet emCluster. Cu ajutorul acestui instrument, 

fiecare nod al clusterului va rezolva simultan o serie de sisteme liniare, 

corespunzătoare unui subset de frecvent¸e din banda de frecvent¸ă setată pentru simulare. 

Programul ce administrează transferul de date în cluster se numes¸te Sonnet 

Networking, însă se poate folosi s¸i unul extern Platform LSF [65]. 

Momentum 

Advanced Design System (ADS) [66], de la Agilent, este un program de proiectare s¸i simulare 

a circuitelor electronice pentru aplicat¸ii de înaltă frevent¸ă, cu microunde s¸i digitale de 

mare viteză. Momentum 3D Planar EM Simulator [67] reprezintă o extensie a programului 

ADS, extensie cu ajutorul căreia se pot modela componentele pasive din circuitele 

integrate, printre care s¸i inductoare spiralate (Figura 2.12 [68]). Programul foloses¸te metoda 

momentelor, pentru a discretiza ecuat¸iile lui Maxwell, în acest fel, obt¸inându-se un 

model ce include efectele câmpului magnetic. 

Figura 2.12: Captură din ADS-Momentum. 

Date de intrare: geometria poate fi desenată sau importată (fis¸iere ODB++ [69][70], 

Gerber, .GDSII) în interfat¸a grafică a programului ADS. Ret¸eaua de discretizare este generat 

automat, dar poate fi specificat s¸i manual. 

Date de ies¸ire: se pot vizualiza parametri de împrăs¸tiere S. În plus, după ce componenta 

a fost simulată, ea poate fi salvată s¸i utilizată în circuitele simulate cu ADS. 

Pentru sistemele cu unul sau mai multe procesoare, metodele de rezolvare folosesc 

procesarea pe 64 bit¸i s¸i procesarea paralelă pentru operat¸iile de algebră liniară. În ceea ce 

prives¸te sistemele tip cluster, instrumentul Momentum Turbo Element distribuie un subset 

de frecvent¸e, fiecare nod rezolvând simultan sistemul liniar pentru subsetul de frecvent¸e 

primit. Managerul ce se ocupă de distribut¸ia sarcinilor (în acest caz a frecvent¸elor), în 

cluster, este un instrument adit¸ional Platform LSF sau SunGrid. 

ASITIC 

ASITIC(Analysis and Simulation of Spiral Inductors and Transformers for ICs) [71] [72] 

este un program CAD folosit pentru optimizarea s¸i modelarea componentelor pasive din 

28


circuitele integrate de înaltă frecvent¸ă: inductoare spiralate (Figura 2.13 [73]), transformatoare, 

condensatoare. În procesul de modelare sunt incluse efecte ale câmpului electromagnetic: 

pierderi s¸i cuplaje inductive, pierderi prin curent¸i turbionari, efectul pelicular, efectul 

de proximitate. Programul, dezvoltat de Ali M. Nicknejad, de la Universitatea Berckley, 

poate rula pe toate platformele existente (Linux, Windows, SunOS) s¸i este legat de câteva 

biblioteci externe: operat¸ii de algebra liniară BLAS [74] s¸i LAPACK [75], Fastest FFT in 

the West FFTW [76] s¸i pachetul de integrare numerică QUADPACK [77]. 

Figura 2.13: Captură din ASITIC. 

Date de intrare: geometria dispozitivului de modelat, folosind comenzi specifice ASI- 

TIC, s¸i, opt¸ional, se poate specifica fis¸ierul tehnologic de fabricat¸ie, fis¸ier ce descrie dispunerea 

straturilor dispozitivului. 

Date de ies¸ire: datele de ies¸ire pot fi de trei tipuri: 

• date rezultate în urma analizei: factorul de calitate Q al inductorului spiralat, vizualizarea 

grafică a curetului în inductor, frevent¸a de rezonant¸ă a inductorului, parametrii 

admitant¸ă Y s¸i impedant¸ă Z, pentru un dispozitiv cu două porturi, calculat¸i la o 

frecvent¸ă sau pentru o serie de frecvent¸e; 

• date rezultate în urma optimizării: geometria optimă a inductorului spiralat cu sau 

fără constrângeri; 

• date de export: geometria inductorului modelat în format CIF sau format Sonet. 

Programul ASITIC foloses¸te formularea PEEC pentru a asambla sistemul liniar echivalent 

ecuat¸iilor lui Maxwell [78]. Pentru sisteme mici, se foloses¸te metoda directă de 

rezolvare, eliminarea lui Gauss, însă pentru sisteme mari, autorul recomandă folosirea metodelor 

iterative de rezolvare. Din punct de vedere al calculului de înaltă performant¸ă 

(HPC), programul ASITIC foloses¸te biblioteca LAPACK ca instrument paralel de calcul, 

pentru a executa operat¸ii de algebră liniară. 

29


COMSOL 

COMSOL Multiphysics [79] este un program de modelare aplicabil în mai multe domenii 

ale ingineriei, în particular, s¸i pentru modelarea electromagnetică, având la bază metoda 

elementului finit. 

Figura 2.14: Captură din COMSOL. 

Date de intrare: geometria dispozitivului poate fi desenată, cu un editor grafic încorporat, 

dar, poate fi s¸i importată din diferite formate. Tot ca date de intrare pot fi considerate toate 

etapele preprocesării, repsectiv ret¸eaua de discretizare, stabilirea regimului câmpului, sursele 

acestuia, valoarea constantelor de material, condit¸iile de frontieră s¸i alegerea ordinului 

elementelor finite. 

Date de ies¸ire: datele de ies¸ire se obt¸in în etapa de postprocesare a metodei elementului 

finit, în care se pot calcula s¸i afis¸a, grafic s¸i numeric, diferite mărimi derivate, asociate 

problemei analizate (Figure 2.14 [80]). 

Programul COMSOL dispune de o bogată bibliotecă de metode de rezolvare atât directe, 

cât s¸i iterative. Pentru utilizarea tehnicilor de calcul paralel [81], programul are nevoie 

de o licent¸ă suplimentară Floating Network Licenses. Calculul paralel este folosit în 

cazul solverului paralel PARDISO (solver direct), iar calculul distribuit în cazul solverului 

distribuit MUMPS (solver direct). 

Chamy 

Chamy este un program de modelare electromagnetică a componentelor pasive din circuitele 

integrate de înaltă frecvent¸ă s¸i extragerea modelelor parametrice de ordin redus 

corespunzătoare. El este dezvoltat în cadrul Laboratorului de Metode numerice din UPB, 

în cadrul mai multor programe europene [82][83][84][85][86]. 

Pentru discretizarea ecuat¸iilor lui Maxwell s¸i obt¸inerea sistemului matriceal, este folosită 

metoda numerică FIT [42][87][88]. Extragerea modelului de ordin redus, folosind 

sistemul matriceal rezultat, se face cu ajutorul algoritmului AFS-VF, un algoritm ce reduce 

30

2.3. Concluzii 

la minimum efortul de calcul. Caracteristica definitorie a acestui program este că admite 

condit¸ii de frontiera de tip EMCE, care permit cuplarea dispozitivului analizat cu circuite 

electrice s¸i magnetice exterioare. Ideea s¸i teoriile folosite de acest program vor fi dezvoltate 

în capitolul următor. 

Date de intrare: geometria dispozitivului se defines¸te într-un limbaj specific programului. 

Ret¸eaua de discretizare poate fi generat automat, sau poate fi specificat manual. De 

asemenea, există posibilitatea de a crea o ret¸ea adaptivă, mai dens în zonele de interes. 

Date de ies¸ire: parametri de împrăs¸tiere (S, Y , Z) se pot vizuliza, dar se pot salva în 

format Touchstone, cunoscut s¸i ca formatul SnP. De asemenea, programul generează un 

fis¸ier ce cont¸ine circuitul echivalent SPICE al dispozitivului analizat. 

Pentru sistemele cu unul sau mai multe procesoare, metoda de rezolvare (UMFPack 

[89] foloses¸te procesarea paralelă apelând operat¸ii de algebră liniară paralele, din biblioteca 

LAPACK. 

Implementarea unui mod de rezolvare, ce foloses¸te procesarea paralelă s¸i distribuită s¸i 

exploatează eficient un sistem multiprocesor tip cluster a fost una din sarcinile autorului s¸i 

reprezintă subiectul central al acestei teze de doctorat. 

2.3 Concluzii 

Acest capitol a prezentat stadiul actual atât al metodelor de modelare, cât s¸i celor mai 

importante programe de modelare existente. Prima parte a acestui capitol a prezentat metoda 

de modelare cu parametri concentrat¸i, concluzionân că ipotezele simplificatoare ale 

acestei teorii sunt prea restrictive pentru modelarea componentelor din circuitele integrate 

de înaltă frecvent¸ă, implicit s¸i a inductoarelor spiralate. S-a stabilit că pentru inductoarele 

spiralate, cea mai bună metodă de modelare, este metoda ce foloses¸te modele cu parametri 

distribuit¸i. În acest sens au fost prezentate principalele metode de discretizare a ecuat¸iilor 

lui Maxwell. 

Partea finală a acestui capitol a prezentat câteva din programele de modelare electromagnetică, 

programe ce urmăresc fluxul de proiectare EDA (design flow EDA). As¸a cum 

s-a putut observa majoritatea programelor existente folosesc tehnici de calul paralel s¸i distribuit 

pe diferite sisteme multiprocesor. Majoritatea programelor prezentate, au raportat 

un timp de 6 ori mai mic la rularea pe un cluster cu 8 noduri, decât la rularea pe un singur 

nod. 

Prin prezentarea caracteristicilor de multiprocesare a programelor de modelare electromagnetică, 

se demonstrează încă o dată că tema acestei teze este de actualitate s¸i prezintă 

un interes ridicat din partea cercetătorilor. 

31


Modelarea inductoarelor spiralate integrate 

CAPITOLUL 3 

Modelarea electromagnetică a componentelor pasive din circuitele integrate de înaltă 

frecvent¸ă, presupune extragerea unui circuit electric liniar cu parametri concentrat¸i (alcătuit 

din elementele ideale R, L, C, surse comandate liniar, cu parametri independent¸i de frecvent¸ă), 

care să aibă o comportare pe la borne cât mai apropiată de comportamentul componentei 

reale. Pentru a realiza acest lucru, este necesară modelarea aproximativă a tuturor efectelor 

câmpului electromagnetic de înaltă frecvent¸ă, cum sunt: efectul pelicular, curent¸ii turbionari, 

întarzierea prin propagare, etc. Acest lucru necesită rezolvarea numerică ecuat¸iilor 

lui Maxwell care descriu toate aceste efecte ale câmpului elctromagnetic. Prin modelare 

nu se urmăres¸te doar obt¸inerea solut¸iei numerice, ci extragerea modelului de ordin redus. 

În cazul de fat¸ă nu are relevant¸ă variat¸ia sptială a solut¸iei, ci doar comportarea sistemului 

pe la bornele sale. Pentru a atinge acest obiectiv, sunt parcurse mai multe etape ale modelării 

electromagnetice [90]: modelarea fizică, matematică, analitcă, numerică, iar în final 

reducerea ordinului [91]. Tehnologia de extragerea modelelor electromagnetice de ordin 

redus folosită în prezenta teză, a fost dezvoltat pe parcursul mai multor ani în Laboratorul 

de Metode Numerice (LMN) din UPB, de colective internat¸ionale conduse de prof. Daniel 

Ioan [52] [92] [93] [94] [95] [96] [97] [54] [98] [99]. 

3.1 Modelarea fizică 

Modelele descrise de ecuat¸iile lui Maxwell, în formă generală, pot fi foarte complexe 

pentru probleme care nu necesită tratarea tuturor aspectelor câmpului electromagnetic 

(ecuat¸iile în formă generală cont¸in s¸i aspecte mecanice [90], aspecte ce nu interesează 

pentru modelarea bobinelor integrate), astfel încât pentru o modelare eficientă se adoptă 

ipoteze simplificatoare. Aplicărea acestor ipoteze înseamnă stabilirea regimurilor câmpului 

electromagnetic. Regimurile ce interesează din punct de vedere al modelării inductoarelor 

spiralate considerând medii liniare din punct de vedere dielectric magnetic s¸i conductiv, 

sunt descrise în cele ce urmează. 

33

3. Modelarea inductoarelor spiralate integrate 

Regimul general variabil (FW sau ED) 

Regimul general variabil al câmpului electromagnetic este descris de ecuat¸iile lui Maxwell 

pentru medii imobile (v = 0), astfel fiind considerat¸i atât curent¸ii de deplasare, cât s¸i 

fenomenul de indut¸ie electromagnetică: 

rotE = − ∂B 

∂t 

(3.1) 

rotH = J + ∂D 

∂t 

(3.2) 

divD = ρ (3.3) 

divB = 0 (3.4) 

B = µH (3.5) 

D = εE (3.6) 

J = σE (3.7) 

divJ = − ∂ρ 

. 

dt 

(3.8) 

unde relat¸ia (3.8) reprezintă consecint¸a relat¸iilor (3.3) s¸i (3.2). Acest regim este utilizat 

pentru problemele, ce nu pot fi analizate separat, din punct de vedere electric s¸i magnetic. 

Impunând anumite valori particulare, degenerate, ale constanteleor de material, ecuat¸iilor 

acestui regim, se obt¸in celelate regimuri ale câmpului electromagnetic. 

Regimul electric cvasistat¸ionar (EQS) 

În regim electric cvasistat¸ionar (în literatura de specialitate mai este numit s¸i amagnetic 

sau capacitiv), câmpul magnetic este neglijat, fiind considerat doar câmpul electric. Deci, 

considerând câmpul magnetic nul, ecuat¸iile lui Maxwell corespunzătoare acestui regim 

sunt (formal µ = 0) : 

rotE = 0 (3.9) 

divD = ρ (3.10) 

D = εE (3.11) 

J = σE (3.12) 

divJ = − ∂ρ 

. 

dt 

(3.13) 

Aceste ecuat¸ii descriu efectele capacitive s¸i de conduct¸ie. În modelarea componentelor 

din circuitele integrate, acest regim poate fi folosit pentru a obt¸ine un model ce nu cont¸ine 

efecte inductive. 

Regimul magnetic cvasistat¸ionar (MQS) 

Spre deosebire de regimul electric cvasistat¸ionar, regimul magnetic cvasistat¸ionar (în 

literatura de specialitate numit s¸i anelectric sau inductiv), neglijează câmpul electric, considerând 

doar câmpul magnetic. Ecuat¸iile, în acord cu ipoteza anterior amintită, cores- 

34

punzătoare acestui regim sunt (formal ε = 0): 

3.1. Modelarea fizică 

rotE = − ∂B 

∂t 

(3.14) 

rotH = J (3.15) 

divB = 0 (3.16) 

B = µH (3.17) 

J = σE (3.18) 

divJ = 0 . (3.19) 

unde relat¸ia (3.19) reprezintă consecint¸a relat¸iei (3.15). Acest regim descrie toate efectele 

inductive (efectul pelicular, curet¸i turbionari) s¸i de conduct¸ie, însă, singur, nu prezintă 

interes pentru modelarea componentelor de circuit integrat, deoarece neglijează efectele 

capacitive, care sunt foarte importante pentru acest gen de aplicat¸ii. În combinat¸ie cu regimul 

EQS, rezultă un regim hibrid numit regimul electro-magneto-cvasistat¸ionar (EMQS), 

regim în care părt¸ile conductoareale domeniului (conductoarele metalice) sunt studiate în 

regim MQS, iar restul domeniului (dielectrici) în regim EQS. Această abordare este foarte 

folosită în programele de modelare a compomentelor de circuit integrat [100][101], deoarece 

modelul obt¸inut în acest regim este echivalent celui obt¸inut in regim FW, însă are o 

dimensiune mai mică [102]. 

Regimul electrostatic (ES) 

Regimul electrostatic reprezintă o particularizare a regimului EQS, în care, pe lângă 

faptul că nu există mis¸care s¸i mărimile sunt constante în timp, se adaugă s¸i ipoteza că nu 

au loc transformări energetice. În acest caz, ecuat¸iile ce carcaterizează acest regim sunt (se 

obt¸in considerând, în ecuat¸iile lui Maxwell, µ = 0, σ = 0): 

Acest regim descrie doar efectele capacitive. 

Regimul electrocinetic (EC) 

rotE = 0 (3.20) 

divD = ρ (3.21) 

D = εE . (3.22) 

Regimul electrocinetic descrie doar efectele de conduct¸ie, el fiind caracterizat de ecuat¸iile: 

obt¸inute considerând formal, µ = 0 s¸i ε = 0. 

rotE = 0 (3.23) 

divJ = 0 (3.24) 

J = σE . (3.25) 

35


Regimul magneto-stat¸ionar (MG) 

Acest regim reprezintă o particularizare a regimului MQS, în ipotezele: nu există 

mis¸care, mărimile sunt constante în timp. În acest caz, ecuat¸iile devin: 

rotH = J (3.26) 

divB = 0 (3.27) 

B = µH (3.28) 

(3.29) 

Acest regim descrie doar efectele inductive s¸i se obt¸ine din ecuat¸iile lui Maxwell, considerand 

ε = 0. Dacă nu au loc transformări energetice, J = 0, regimul devine magnetostatic 

(MS). 

Regimurile EC, MG s¸i ES sunt utile pentru extragerea parametrilor concentrat¸i de circuit 

RLC. Mai mult, prin combinat¸ii pe subdomenii cu regimurile variabile se obt¸in modele 

de ordin mai redus, a căror analiză numerică necesită resurse mai mici de calcul. 

Regimul general variabil armonic în timp. În circuitele de radiofrecvent¸ă, semnalele 

electrice au o variat¸ie sinusoidală în timp. Dacă se reprezintă în complex toate componetele 

câmpului elctromagnetic, atunci ecuat¸iile lui Maxwell capătă forma compelxă: 

rotE = −jωB (3.30) 

rotH = J + jωD (3.31) 

divD = ρ (3.32) 

divB = 0 (3.33) 

B = µH (3.34) 

D = εE (3.35) 

J = σE (3.36) 

divJ = −jωρ . (3.37) 

obt¸inute, înlocuind în (3.1)-(3.8) ∂ cu jω. 

∂t 

Problemele analizate constau din unul sau două inductoare spiralate, plasate într-un 

circuit integrat cu substrat de siliciu (tehnologia BiCMOS). Deci, fiecare problemă va avea 

trei subdomenii rectangulare: Si, SiO2 s¸i Aer, conductoarele din Al, aflându-se în stratul 

de oxid (Figura 3.1). După numele proiectelor, pentru care au fost proiectate, problemele 

vor fi numite fie CHRF [86], fie CDST [82]. 

Domeniului de calcul, care este alcătuit din trei straturi, din materiale diferite, i se impun 

condit¸iile de interfat¸ă [103], ele asigurând conservarea componentelor câmpului, care 

se conservă la trecerea de la un strat la altul. Forma locală, pe suprafet¸ele de discontinuitate, 

a legilor generale, ale elctromagnetismului, exprimă condit¸iile de interfat¸ă pentru două 

straturi, din materiale diferite: 

n × (H2 − H1) = Jinterfata = 0, (3.38) 

n × (E2 − E1) = 0, (3.39) 

n · (D2 − D1) = ρinterfata, (3.40) 

n · (B2 − B1) = 0. (3.41) 

36 

(3.42)

Figura 3.1: Geometria tipică a unui inductor spiralat integrat 


Curentul poate exista doar în conductoare, as¸a că densitatea de curent pe suprafat¸ă Jinterfata 

este de zero, la fel si ρinterfata, care este neglijabilă. Folosind relat¸ia 3.40, se constată că pe 

interfat¸a dintre două straturi dielectrice, potet¸ialul electric trebuie să fie acelas¸i, adică vor fi 

satisfăcute relat¸iile: 

dV2 

V1 = V2; ε2 

dn 

dV1 

= ε1 

dn 

. (3.43) 

As¸a cum se întamplă la câmpul electric, în plus, la trecerea dintr-un mediu în altul, se conservă 

s¸i componenta tangent¸ială a intensităt¸ii câmpului magentic s¸i componenta normală a 

induct¸iei magnetice. 

Problemele vor fi analizate în gama de frecvent¸e 1-60GHz, deci alegerea regimului de 

funct¸ionare, trebuie să tină cont de frecvent¸ă, astfel încât modelul să cont¸ină toate efectele 

relevante ale câmpului electromagnetic atât la frecvent¸e joase, cât s¸i la frecvent¸e înalte. 

La frecvent¸e joase, de maxim 1GHz, comportarea substratului de siliciu s¸i a aerului 

poate fi descrisă prin combinarea regimurilor statice. În acest caz, efectele capacitive pot 

fi neglijate, însă câmpul magnetic trebuie luat în considerare, deoarece nu pot fi neglijate 

efectele inductive ale coductoarelor aflate deasupra (inductoarele). Deci, regimul cel mai 

potrivit pentru substratul semiconductor de rezistivitate mică, la frecvent¸e joase, reprezintă 

combinat¸ia dintre regimurile EC s¸i MS, ce descriu efectele conductive, respectiv inductive. 

În schimb, dacă substratul semiconductor are rezistivitate mare, cea mai portivită este 

combinat¸ia ES+EC, sau, s¸i mai bine EQS, pentru a descrie efectele capacitive s¸i conductive. 

Aerul, având conductivitate foarte mică, este modelat cel mai bine în regimurile ES+MS, 

pentru a descrie efectele capcitive s¸i cele inductive care au loc prin intermediul lui. 

Potrivit tezei de doctorat [104], la frecvent¸e de peste 5GHz, efectele capacitive nu mai 

37


pot fi neglijate, deci, trebuie considerat s¸i câmpul electrostatic. Efectele capacitive din substratul 

semiconductor, mai ales când acesta are rezistivitate mare, s¸i cele rezistive pot fi 

descrise de combinat¸ia între regimurile ES s¸i EC, însă, conform lucrării [105] considerarea 

ES+EC prezintă avantaje doar la frecvent¸e sub 1GHz, totus¸i, pentru a descrie aceste efecte, 

poate fi folosit regimul EQS. Pentru substrat omogen, modelul generat de regimul EQS 

este perfect echivalent cu modelul generat de ES+EC, însă pentru substrat neomogen trebuie 

considerat regimul EQS. Considerând s¸i efectele inductive, regimul electromagnetic 

potrivit, reprezintă combinat¸ia dintre regimurile EC+ES+MS, pentru substrat omogen, s¸i 

EQS+MS pentru substrat neomogen. 

În lucrarea [106], se demonstrează că, la frecvent¸e de peste 20GHz, regimul EQS este 

invalid, pentru substrat de siliciu cu rezistivitate mare. Deci, pentru a descrie toate efectele 

câmpului electromagnetic din substratul de siliciu, la frecvent¸e de 60GHz, trebuie considerat 

regimul FW. Tot regim FW trebuie folosit s¸i în modelarea starului de oxid SiO2, 

însă, pentru modelarea conductoarelor, cel mai potrivit model este MQS, deoarece, în Al, 

curent¸ii de deplasare au densitatea (JD = ωεE) mult mai mică decât cei de conduct¸ie 

Jc = σE. De exemplu, la 60 GHz, ωε(≈ 10 −3 ) ≪ σ(≈ 10 7 ). În consecint¸ă, se neglijează 

curent¸ii de deplasare, ceeea ce înseamnă regim MQS. 

Figura 3.2: Efectele câmpului electromagnetic 

Procedând astfel, vor fi modelate următoarele efecte ale câmpului de înalta s¸i joasă 

frecvent¸ă [107] (Figura 3.2 [78]): 

• efectul pelicular din interiorul conductoarelor; 

• efectul de proximitate între conductoare; 

• efectul de pierderi prin curent¸i turbionari în substratul semiconductor; 

• efectul inductiv al bobinei; 

• efectul capacitiv dintre spire; 

38


• efectul rezistiv din conductoare, afectat la frecvent¸e înalte de efectul pelicular; 

• efectul de propagare de-a lungul conductorului; 

• radiat¸ia spre exterior. 

Figura 3.3: Domeniu de calcul 

Domeniul de calcul, care cont¸ine inductorul de modelat, se descompune în subdomenii 

(Figura 3.3), fiecare având propriul regim al câmpului electromagnetic. Pentru a extrage 

modelul inductorului, care să considere toate efectele câmpului electromagnetic de 

frecvent¸ă înaltă, trebuie rezolvată o problemă de câmp electromagnetic, bine formulată s¸i 

cuplată cu o problemă de circuit electric exterior. Orice problemă de câmp are ca date 

cunoscute: domeniul de calcul, proprietăt¸ile de material s¸i sursele de câmp, care satisfac 

condit¸iile de unicitate. 

Figura 3.4: Domeniu de calcul 

Domeniul de calcul DΣ (Figura 3.4) are formă paralelipipedică s¸i este construit prin 

reuniunea ”cărămizilor” omogene DΣj . Materialele ”cărămizilor” se consideră a fi liniare 

39


s¸i izotrope, caracterizate de conductivitatea electrică σ, permeabilitatea electrică ε s¸i permitivitatea 

magnetică µ, constante de material cunoscute pentru fiecare DΣj . Câmpul electromagnetic 

din circuitele integrate nu are surse interne de câmp, în consecint¸ă, condit¸iile 

de frontieră s¸i condit¸iile init¸iale, altfel spus condit¸iile de unicitate, completează formularea 

corectă a problemei de câmp. Prin intermediul condit¸iilor de frontieră, se asigura cuplajul 

cu exteriorul, care se face prin suprafat¸a terminalelor fizice ale dispozitivului Sk. Deoarece, 

dispozitiviele (inductoarele) sunt componente pasive de circuit, realizate din materiale liniare, 

se admit ipotezele că nu există surse interne de câmp s¸i că nu există câmp init¸ial, adică 

problema nu necesită condit¸ii init¸iale. 

Necunoscutele problemei sunt componentele câmpului electromagnetic, descris de 

ecuat¸iile lui Maxwell în regim general variabil (FW), respectiv: E, D, B, H, J, ρ. 

Pentru proiectantul de circuite integrate, componetele câmpului electromagnetic s¸i modul 

cum variază ele în spat¸iu sau timp, nu are o prea mare relevant¸ă. Ce prezintă interes, 

este modul în care o componetă interactionează cu exteriorul. Mai exact, care sunt relat¸iile 

constitutive între curent¸ii s¸i tensiunile componentei respective. 

Figura 3.5: Sistemul de modelat (MIMO). 

Se vor considera primele m terminale, din cele n terminale ale dispozitivului, alimentate 

în tensiune, iar restul de (n − m − 1) alimentate în curent, astfel că se pot defini 

semnalele de intrare, acestea reprezentând s¸i sursele de câmp, ca fiind: 

 

vk(t) = Edr, k = 1, m (3.44) 

 

CK⊂∂DΣ 

ik(t) = Hdr, k = m + 1, n − 1 , (3.45) 

s¸i semnalele de ies¸ire 

 

vk(t) = 

∂SK 

CK⊂∂DΣ 

 

ik(t) = 

∂SK 

Hdr, k = 1, m (3.46) 

Edr, k = m + 1, n − 1 . (3.47) 

40

3.2. Modelarea matematică 

Vectorul intrărilor s¸i vectorul ies¸irilor sistemului modelat (Figura 3.5), vor avea componentele: 

⎡ ⎤ ⎡ ⎤ 

⎢ 

u = ⎢ 

⎣ 

v1 

. 

vm 

im+1 

. 

in−1 

3.2 Modelarea matematică 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ , y = ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

i1 

. 

im 

vm+1 

. 

vn−1 

⎥ . 

⎥ 

⎦ 

Modelul dispozitivului (inductorului), obt¸inut în urma procesului de modelare, trebuie 

să fie compatibil cu alte componente de circuite. Acest lucru se realizează prin condit¸ii 

de frontieră care trebuie să asigure, în mod consistent, cuplajul dintre problema internă de 

câmp s¸i problema externă de circuit electric. Aceste condit¸ii de frontieră sunt introduse 

prin Elementul Electromagnetic de Circuit. 

Al. Timotin a introdus conceptul de Elementul Electromagnetic de Circuit în [108], ca 

o generalizare a elementului multipolar de circuit. Acest concept a fost readus în atent¸ia 

cercetătorilor s¸i folosit pentru a simula cuplajele electromagnetice în [109]. 

Definit¸ia 1 Elementul electromagnetic de circuit (EMCE - Figura 3.6) este un domeniu 

simplu conex mărginit de o suprafat¸ă Σ alcătuită din n ′ părt¸i disjuncte S ′ 1, S ′ 2, . . . , S ′ n 

numite terminale electrice, s¸i n ′′ părt¸i disjuncte S ′′ 

1 , S ′′ 

2 , . . . , S ′′ 

n numite terminale magnetice 

pe care sunt îndeplinite următoarele condit¸ii de frontieră: 

n · rotE(P, t) = 0, pentru ∀ P ∈ Σ − ∪S ′′ 

k, (3.48) 

n · rotH(P, t) = 0, pentru ∀ P ∈ Σ − ∪S ′ k, (3.49) 

n × E(P, t) = 0, pentru ∀ P ∈ ∪S ′ k, (3.50) 

n × H(P, t) = 0, pentru ∀ P ∈ ∪S ′′ 

k, (3.51) 

unde n este vectorul normal la suprafat¸a Σ în punctul P . 

Condit¸ia (3.48) interzice cuplajul magnetic, prin suprafat¸a dintre interiorul s¸i exteriorul 

domeniului, exceptând suprafet¸ele terminalelor magnetice. Condit¸ia (3.49) interzice 

cuplajele galvanice s¸i capacitive prin suprafat¸a externă elementului, exceptând suprafet¸ele 

terminalelor electrice. Condit¸iile (3.50) s¸i (3.51) interzic variat¸iile potent¸ialului electric, 

respectiv magnetic pe orice terminal electric, respectiv magnetic. 

Condit¸iile (3.48), (3.49), (3.50), (3.51) sunt mai put¸in restrictive decât ipotezele simplificatoare 

folosite în teoria circuitelor. Cu ajutorul acestor condit¸ii este descrisă interact¸iunea 

dintre elementul electromagnetic de circuit s¸i exteriorul său. Trebuie ment¸ionat faptul ca 

interact¸iunea are loc numai prin terminalele electrice s¸i cele magnetice. 

Terminalele electrice sunt de două tipuri: excitate în curent s¸i excitate în tensiune. 

Acelas¸i lucru se întâmplă s¸i în cazul terminalelor magnetice, care sunt excitate în flux 

magnetic s¸i tensiune magnetică. 

41


Figura 3.6: Elementul Electromagnetic de Circuit 

Pentru fiecare terminal electric k, intensitatea curentului electric este definit de relat¸ia 

 

ik(t) = Hdr pentru k = 1, 2, . . . , n, (3.52) 

Γ ′ k 

unde Γ ′ k este curba închisă orientată ce mărgines¸te suprafat¸a terminalului electric S′ k . 

Pentru fiecare terminal electric k, potent¸ialul electric este definit de relat¸ia 

 

vk(t) = Edr pentru k = 1, 2, . . . , n, (3.53) 

C ′ k 

unde C ′ k este o curbă arbitrară plasată pe frontiera domeniului ce unes¸te terminalul S′ k de 

terminalul de referint¸ă S ′ n. 

Pentru fiecare terminal magnetic k, fluxul magnetic este definit de relat¸ia 

 

˙ϕk(t) = Edr pentru k = 1, 2, . . . , n, (3.54) 

unde Γ ′′ 

k 

Γ ′′ 

k 

este curba închisă orientată ce mărgines¸te suprafat¸a terminalului magnetic S′′ 

k . 

Pentru fiecare terminal magnetic k, potet¸ialul magnetic este definită de relat¸ia (3.55). 

 

uk(t) = Hdr pentru k = 1, 2, . . . , n, (3.55) 

unde C ′′ 

k 

C ′′ 

k 

este o curbă arbitrară plasată pe frontiera domeniului, ce unes¸te terminalul S′′ 

k de 

terminalul de referint¸ă S ′′ 

n. 

Puterea transferată prin terminale de un element electromagnetic de circuite este dată de 

Teorema lui Timotin (Teorema transferului de putere printr-o suprafat¸ă de separat¸ie) [108]: 

P = 

n ′ −1 

k=1 

n 

vk · ik + 

′′ 

dϕk 

uk 

dt 

42 

k=1 

(3.56)

3.3. Modelarea numerică (FIT) 

Teorema lui Timotin completează formularea corectă a problemei de câmp electromagnetic 

cu condit¸ii de frontieră adecvate. În concluzie, problema de câmp asociată unui 

element electromagnetic de circuit descris de ecuat¸iile lui Maxwell, condit¸ii pe frontieră 

(3.53)(3.52)(3.54)(3.55), condit¸ii init¸iale nule, cu terminalele excitate în tensiune s¸i curent 

sau flux are solut¸ie unică. 

În concluzie, semnalele de ies¸ire ale terminalelor sunt univoc determinate de evolut¸ia în 

timp a semnalelor de intrare. Fiind o problemă liniară, operatorii de impedant¸ă, admitant¸ă 

s¸i hibrizi, care leagă semnalele de intrare de cele de ies¸ire, vor fi operatori liniari. Dacă 

elemenul funct¸ionează în regim armonic, atunci aces¸ti operatori se reprezintă în complex, 

ca matrice de impedant¸e sau admitant¸e complexe, dependente de frecvent¸ă. 

Obiectivul final al modelării inductoarelor nu constă în rezolvarea problemei de câmp, 

formulată anterior, ci în extragerea din solut¸ia ei a unui model compact de ordin redus. 

Pentru a obt¸ine modelul compact de ordin redus, se aplica tehnici de reducerea ordinului 

modelelor (Figura 3.7). În procesul de modelare, descris anterior, primul pas de reducere 

a ordinului modelelor, trece de la modelul infinit continuu, la un model finit discret, dar 

de dimensiune foarte mare, prin discretizarea ecuat¸iilor lui Maxwell folosind o metoda 

numerică. Se impune, deci, aplicarea unei noi metode de reducerea ordinului modelelor, 

care are ca rezultat, modelul compact, care are un ordin foarte mic în comparat¸ie cu ordinul 

modelului discret. Modelul compact este un circuit echivalent SPICE, care cont¸ine toate 

efectele câmpului electromagnetic, dar care se poate conecta într-un circuit cu parametri 

concentrat¸i. 

Practic, problema obt¸inerii modelului de ordin redus, are ca date de intrare geometria 

dispozitivului de modelat, iar ca date de ies¸ire modelul compact. 

Figura 3.7: Modelul continuu, modelul discret s¸i modelul compact 

3.3 Modelarea numerică (FIT) 

Modelarea numerică are ca scop discretizarea problemei de câmp formulată în subcapitolele 

anterioare. Cuplajul dispozitivului cu un circuit exterior se face prin terminalele 

aflate pe suprafat¸a frontierei domeniului elementului electromagnetic de circuit, în interiror 

comportamentul fiind descris de ecuat¸iile lui Maxwell în regim general variabil. Această 

problemă conduce la un model continuu ce are un număr infinit de grade de libertate, astfel 

încât se impune aplicarea unei metode numerice în scopul obt¸inerii unui model discret cu 

număr finit de grade de libertate. 

43


În capitolul precedent, au fost prezentate astfel de metode numerice mai put¸in s¸i Tehnica 

Integrărilor Finite (FIT) [42]. În teza de doctorat [110], a fost prezentată aplicarea metodei 

FIT pentru modelarea interconexiunilor din circuitele integrate de înaltă frecvent¸ă. Designul 

(layout-ul) dispozitivelor de circuit integrat este carcaterizat de geometria Manhattan, 

iar metoda FIT este adecvată pentru calcului câmpului electromagnetic în astfel de structuri. 

FIT este o metodă numerică destinată problemelor de câmp bazate pe discretizarea 

spat¸ială fără funct¸ii de formă. Ret¸eaua de discretizare este format din două ret¸ele ortogonale 

decalate de tip Yee [111] în care centrele celulelor primare sunt noduri ale celulelor 

secundare. Gradele de libertate sunt variabilele globale - tensiuni electrice s¸i magnetice, 

fluxuri electrice s¸i magnetice - corespunzătoare muchiilor s¸i, respectiv, fet¸elor ret¸elei de 

discretizare. 

Figura 3.8: Ret¸eaua de discretizare duală 

Obiectivul folosirii metodei FIT este acela de a obt¸ine sistemul de ecuat¸ii de stare al 

dispozitivului, pentru ca apoi acest sistem să poată fi folosit pentru extragerea modelului de 

ordin redus. Pentru obt¸inerea ecuat¸iilor lui Maxwell, în formă discretă, se aplică forma globală 

a legilor generale ale câmpului electromagnetic pe elementele ret¸elei de discretizare, 

fet¸e, respectiv frontiere ale acestora, iar, legile fluxului pe celulele elementare: 

⎧ 

rotE = − 

⎪⎨ 

⎪⎩ 

∂B 

∂t 

divB = 0 

rotH = J + ∂D 

∂t 

divD = ρ 

=> divJ = − ∂ρ 

⎧ 

∂B 

Edr = − ∂t 

⎪⎨ 

=⇒ 

⎪⎩ 

dt 

dA 

 

 

BdA = 

 

0 

∂D 

Hdr = (J + ∂t )dA 

 

DdA = ρdv 

=> JdA = − ∂ρ 

dt dv 

⎧ 

Cv = − 

⎪⎨ 

=⇒ 

⎪⎩ 

dϕ 

dt 

D ′ ϕ = 0 

C ′ u = i + dψ 

dt 

Dψ = q 

=> Di = − dq 

(3.57) 

dt 

s¸i relat¸iile consitutive, care sunt descrise cu ajutorul operatorilor Hodge: 

⎧ 

⎨ 

⎩ 

B = µH 

D = εE 

J = σE 

=⇒ 

⎧ 

⎨ 

⎩ 

ϕ = Mµu = M −1 

v u 

ψ = Mεv 

i = Mσv 

44 

(3.58)


Relat¸iile (3.57) formează sistemul de ecuat¸ii ale lui Maxwell pe griduri (MGE). Completând 

sistemul MGE cu relat¸iile constitutive (3.58), se va putea sintetiza un circuit electric 

echivalent s¸i un circuit magnetic echivalent, pentru fiecare celulă a ret¸elei de discretizare 

(Figura 3.9) 

(a) Graful circuitului electric (b) Graful circuitului magnetic 

Figura 3.9: Circuitele echivalente FIT 

Principalul avantaj al metodei FIT este acela că nu introduce erori în procesul discretizare 

a ecut¸iilor lui Maxwell, toate erorile fiind date doar de aproximările operatorilor 

Hodge. Din punct de vedere numeric, sistemul MGE are următoarele caracteristici: 

1. matricele de coeficient¸i sunt rare, având cel mult 6 elemente nenule pe linie; 

2. matricele C s¸i D, corespunzătoare operatorilor discret¸i rot s¸i div, sunt topologice, 

având doar valorile 0, 1, -1; 

3. sunt ecuat¸ii mimetice, în sensul că în ecuat¸iile lui Maxwell, operatorii rot s¸i div sunt 

înlocuit¸i cu matricle C s¸i D, care reprezintă forma discretă a operatorilor de derivare 

spat¸ială; 

4. conservative, în sensul că forma discretă a ecuat¸iei care descrie conservarea sarcinii 

(dar s¸i a energiei), este o consecint¸ă directă a ecuat¸iilor discretizate. 

Aceste caracteristici asigură ca problema nu are solut¸ii numerice false, ceea ce face ca 

impementările pe calculator, să fie robuste s¸i stabile. 

În ceea ce prives¸te gradele de libertate, se observă imediat că: 

• numărul tensiunilor electrice (dimensiunea lui v) este egal cu numărul de laturi din 

ret¸eaua primară Nb; 

• numărul tensiunilor magnetice (dimensiunea lui u) este egal cu numărul de laturi din 

ret¸eaua secundară N ′ b ; 

45


• numărul fluxurilor magnetice (dimensiunea lui ϕ) este egal cu numărul de fet¸e din 

ret¸eaua primară Nf; 

• numărul fluxurilor electrice (dimensiunea lui ψ) este egal cu numărul de fet¸e din 

ret¸eaua secundară N ′ f . 

Generarea sistemului matriceal de stare 

Pentru a evita confuzia dintre operatorul discret C s¸i matricea capacităt¸ilor, acesta se va 

nota cu B. Elementele operatorilor Hodge Mσ, Mv, Mε reprezintă conductant¸a electrică, 

reluctant¸a magnetică s¸i capacitatea electrică. Notându-le Ge, Rm = G−1 m , Ce, relat¸iile 

constitutive se vor scrie sub forma: 

ceea ce permite scrierea sistemului MGE sub forma 

ϕ = Gmu, (3.59) 

ψ = Cev, (3.60) 

i = Gev. (3.61) 

dψ 

dt + i − B′ u = 0 , (3.62) 

dϕ 

+ Bv 

dt 

= 0 . (3.63) 

Eliminând vectorii de flux din ecuat¸iile (3.63) s¸i (3.63), se ajunge la sistem de ecuat¸ii, 

similiar cu cel al unui circuit electric 

dv 

Ce 

dt + Gev − B ′ u = 0, (3.64) 

Gm 

care scrise sub formă matriceală devin 

 

Ce 

0 

 

0 d v Ge 

+ 

Gm dt u 

−B ′ 

B 

 

v 

0 u 

Notând 

se obt¸ine forma compactă 

 

Ce 0 

C = 

0 Gm 

du 

dt 

+ Bv = 0 . (3.65) 

 

Ge −B 

G = 

′ 

 

B 0 

= 0 . (3.66) 

x = 

 

v 

u 

(3.67) 

C dx 

+ Gx = 0 . (3.68) 

dt 

Acest sistem are o structură foarte rară deoarece fiecare rând al matricei C cont¸ine cel 

mult un element nenul ce reprezintă o capacitate sau o reluctant¸ă magnetică, iar fiecare rând 

al matricei G cont¸ine cel mult 5 elemente nenule, dintre care patru cu valori întregi din matricele 

topologice s¸i unul real pozitiv care reprezintă o conductant¸ă electrică ce poate fi zero 

într-un izolator s¸i este întotdeauna 0 în ret¸eaua de discretizare magnetică. Printr-o ordonare 

potrivită se pot plasa toate elementele nenule din matricea C pe diagonala ei păstrând nule 

46


restul elementelor. Această structură permite o reprezentare compactă foarte eficientă a 

matricelor C s¸i G. Trebuie remarcat s¸i că această abordare are avantajul de a permite o 

modelare us¸oară a regimurilor ES, MS, EQS s¸i MQS, anulând blocurile corespunzătoare 

din matricele C s¸i G. 

Se observă că ecuat¸ia (3.64) este legea lui Kirchhoff în tensiuni aplicată tuturor nodurilor 

circuitului magnetic având ca graf ret¸eaua secundară, iar ecuat¸ia (3.65) este legea lui 

Kirchhoff în tensiuni aplicată nodurilor unui circuit electric având ca graf ret¸eaua primară. 

Acest sistem pare incomplet deoarece lipses¸te ecuat¸ia Kirchhoff în curent¸i s¸i incorect deoarece 

setul de noduri al ret¸elei de discretizare nu este un sistem de bucle independente. 

Aceste aspecte nu reprezintă însă o problemă deoarece ecuat¸iile în curent¸i, des¸i neformulate 

explicit, sunt o consecint¸ă a ecuat¸iilor (3.66) în regimuri dinamice. Deci, în cazurile particulare 

stat¸ionare s¸i cvasistat¸ionare ecuat¸iile pot să nu aibă solut¸ie unică. La acest moment, 

sistemul de ecuat¸ii algebrice diferent¸iale nu este complet, deoarece numărul de ecuat¸ii nu 

este egal cu numărul de necunoscute. Ecuat¸iile adit¸ionale, care completează sistemul, provin 

din forma discretă a condit¸iilor de frontieră. 

Efectul condit¸iilor de frontieră asupra ecuat¸iilor de stare 

Condit¸iile de frontieră sunt cele care completează formularea corectă a problemei de 

câmp. În subcapitolul precendent, s-a arătat faptul că elementul electromagnetic de circuit 

asigură compatibilitatea între problema de câmp s¸i cea de circuit. Tot elelementul 

electromagnetic de circuit este cel care impune condit¸iile de frontieră, dar în acelas¸i timp 

completează s¸i sistemul de ecuat¸ii. 

În prima parte se va considera un dispozitiv excitat în curent neglijând efectele parazite, 

după care se va studia excitarea în tensiune s¸i modul în care se introduc efectele parazite 

adăugând o condit¸ie de frontieră suplimentară pentru terminalele magnetice. As¸adar, se 

consideră un sistem cu 2n terminale, primele n fiind terminale de intrare, iar ultimele n fiind 

terminale de ies¸ire. Pentru terminalele 1...k, se cunoas¸te excitat¸ia în curent ik = jk(t), în 

timp ce al n-lea terminal este conectat la masă având vn = 0. Se ignoră cuplajele parazite, 

deci, toate terminalele sunt excitate în curent, iar toate mărimile de ies¸ire sunt mărimi 

electrice. 

Condit¸ia de frontieră (3.48) este satisfăcută în mod natural, deoarece nici o latură a 

ret¸elei de discretizare magnetice nu traversează frontiera domeniului, deci componenta normală 

a densităt¸ii fluxului magnetic pe suprafat¸a de frontieră este întotdeauna nulă. Condit¸ia 

de frontieră (3.49) este satifăcută atunci când componenta normală a curentului este zero 

pe orice punct al frontierei necuprins în interiorul suprafet¸ei terminalelor, ceea ce duce la: 

ik = 0, pentru ∀ k ∈ Σ − ∪S ′′ 

k 

(3.69) 

Trebuie remarcat faptul că această condit¸ie fixează ca nul doar curentul de conduct¸ie, ci s¸i 

curentul de deplasare astfel încât cuplajul electric prin suprafat¸a exterioară necuprinsă în 

terminale nu se poate face nici galvanic, nici prin polarizare, nici prin efecte capacitive, 

nici prin induct¸ie. 

A treia condit¸ie de frontieră (3.50) fort¸ează echipotent¸ialitatea terminalelor se poate 

vedea că ea este satisfăcută dacă între orice două puncte de pe un terminal, tensiunea electrică 

este nulă. Aceasta se reduce de fapt la a asigura că toate nodurile unui terminal au 

47


acelas¸i potent¸ial electric sau că pe orice latură din terminal, căderea de tensiune este nulă: 

vb = 0, pentru ∀ b ∈ S1...n 

(3.70) 

Pentru terminalele excitate în curent, condit¸ia neomogenă de frontieră se poate scrie 

folosind elementele operatorilor Hodge sub forma: 

jk(t) = 

im = 

 

 

dvm 

Cem + Gemvm , (3.71) 

dt 

m∈Sk 

m∈Sk 

care exprimă curentul total injectat în fiecare terminal k prin suma curent¸ilor corespunzători 

tuturor laturilor electrice conectate direct la terminalul k s¸i care sunt fie pe frontieră, fie 

ortogonale pe ea. Matriceal, relat¸ia (3.71) se poate scrie sub forma 

dv 

Sc 

dt + SGv = j, (3.72) 

unde j este vectorul curent¸ilor de excitat¸ie injectat¸i în terminale. 

Se defines¸te matricea de conexiune latură-terminal, S, ale cărei elemente sij sunt +1 sau 

-1, dacă există o conexiune între latura j s¸i terminalul k, se poate scrie termenii matriceali 

ai relat¸iei (3.72) ca fiind: 

SC = SC ′ e, SG = SG ′ e. (3.73) 

unde termenii C ′ e s¸i G ′ e sunt matrice pătrate ale operatorilor Hodge, cu aceeas¸i dimensiune 

ca s¸i v. 

Relat¸ia (3.69) se poate scrie în aceias¸i termeni, punând jk(t) = 0 în (3.71), ceea ce, de 

fapt, se reduce la a extinde matricea S, prin adăugarea câte unui rând pentru fiecare nod 

de pe suprafat¸a frontierei, cu except¸ia terminalelor, iar vectorul j este extins cu valori nule. 

În acest fel, se impune legea lui Kirchhoff în curent¸i, pe toate nodurile frontierei. Prin 

adăugarea condit¸iilor de frontieră exprimate de relat¸ia (3.72), se obt¸ine sistemul de stare: 

unde 

⎡ 

Ce 0 

⎤ 

C dx 

dt 

C = ⎣ 0 Gm⎦ 

, G = ⎣ B 0 

SC 0 

0 

care în formă extinsă devine 

⎡ ⎤ 

Ce 0 

⎣ 0 Gm⎦ 

SC 0 

d 

dt 

 

v 

+ 

u 

+ Gx = y, (3.74) 

⎡ 

⎡ 

Ge −B ′ 

SG 

Ge −B ′ 

⎣ B 0 

0 

SG 

⎤ 

⎦ 

⎤ ⎡ ⎤ 

0 

⎦ , y = ⎣0⎦ 

, 

j 

(3.75) 

⎡ ⎤ 

0 

v 

= ⎣0⎦ 

. (3.76) 

u 

j 

Această formă cuprinde relat¸iile constitutive ale tuturor laturilor electrice s¸i magnetice, 

legile Faraday s¸i Ampere-Maxwell aplicate pe ret¸eaua de discretizare, legile lui Kirchhoff 

în tensiuni s¸i în curent¸i în toate nodurile s¸i condit¸iile de excitare a terminalelor. Dacă terminalele 

sunt excitate în curent, mărimile de ies¸ire sunt tensiunile electrice de la terminalele 

de ies¸ire 

vk(t) = 

(3.77) 

48 

m∈Ct 

vm


unde Ck este mult¸imea de laturi care formează calea de la terminalul de curent k la terminalul 

de referint¸ă. Scrisă matriceal, relat¸ia (3.77) devine 

v ′ = SEv, (3.78) 

unde SE reprezintă matricea de conexiune cale-latură. Adăugând relat¸ia (3.74), se poate 

defini complet sistemul liniar, invariabil în timp al dispozitivului excitat în curent, fără 

cuplaje parazite, pe baza sistemului de stare: 

 

dx C + Gx = y 

dt 

v ′ (3.79) 

= SEv, 

unde 

⎡ 

Ce 0 

0 Gm 

⎤ 

⎢ 

C = ⎢ 

⎣S 

′ ⎥ ⎢ 

⎥ 

C 0 ⎦ , G = ⎢ B 0 

⎣S 

0 0 

′ G 0 

0 

⎡ 

Ge −B ′ 

SE 

⎤ 

⎥ 

⎦ , 

⎡ ⎤ 

0 

⎢ 

y = ⎢0 

⎥ 

⎣0⎦ 

. 

e 

(3.80) 

Dacă dispozitivul este excitat în tensiune, mărimile de ies¸ire vor fi curent¸ii prin terminalele 

de ies¸ire, definit¸i pe baza legii lui Ampere: 

 

ik(t) = H · dr , (3.81) 

relat¸ie care se poate scrie în formă discretă ca 

ik(t) = 

Γk 

m∈Γk 

um 

(3.82) 

unde Γk este o mult¸ime de laturi ce cuprinde conturul terminalului k. În acest caz, relat¸ia 

(3.74) se completeză cu 

i ′ = SJu, (3.83) 

în care SJ este matricea de conexiuni laturi-contur. În acest caz, sistemul este descris de 

ecuat¸iile de stare 

dx C + Gx = y 

dt 

i ′ = SJu 

. (3.84) 

Pentru a lua în calcul s¸i cuplajele parazite, se introduce a condit¸ia de frontieră (3.51). 

Condit¸ia ce garantează satisfacerea acestei relat¸ii este ca terminalele magnetice să fie echipotent¸iale, 

adică între oricare două noduri ale unui terminal, tensiunea magnetică să fie nulă 

ub = 0, pentru ∀ b ∈ S ′′ 

k . (3.85) 

Această condit¸ie se poate îndeplini elegant dacă, în structura ret¸elei de discretizare, se 

asigură în circuitul magnetic, pentru fiecare terminal k, un nod conectat la nodurile magnetice 

de sub suprafat¸a corespunzătoare acestuia. Pentru a găsi o relat¸ie care să completeze 

ecuat¸iile de stare, se exprima condit¸ia de frontieră neomogenă pe baza operatorilor Hodge. 

Presupunând că terminalele magnetice sunt excitate în flux, relat¸ia (3.85) se poate exprima, 

pentru fiecare terminal k, sub forma 

fk(t) = 

ϕm = 

Gmum, (3.86) 

m∈S ′ k 

49 

m∈Sk”


pentru toate laturile magnetice conectate direct la terminalul k. În formă matriceală, această 

relat¸ie este: 

SM = S”G ′ m , (3.87) 

unde G ′ m este matricea operatorilor magnetici Hodge. 

Mărimile de ies¸ire ale unui astfel de sistem sunt potent¸ialele magnetice ale terminalelor, 

cuprinse în vectorul de potent¸iale magnetice w ale terminalelor de ies¸ire care se poate 

exprima sub forma 

w = S”Mu , (3.88) 

unde matricea S ′ M este matricea de conexiune dintre laturile magnetice s¸i calea terminalelor 

C”k. Prin urmare, ecuat¸iile de stare în acest caz devin 

 

dx C + Gx = y 

dt (3.89) 

z = Dx, 

în care 

⎡ 

Ce 0 

0 Gm 

S ′ C 0 

⎢ 

C = ⎢ 

⎣ 0 0 

0 0 

este vectorul semnalelor de intrare, 

⎤ 

⎡ 

Ge −B ′ 

⎥ ⎢ 

⎥ ⎢ B 0 

⎥ , G = ⎢ 

⎢S 

⎦ ⎣ 

′ G 0 

0 

este vectorul semnalelor de ies¸ire s¸i 

S ′ E 

0 SM 

⎡ 

0 

⎢ 

⎢0 

y = ⎢ 

⎢j 

⎣ 

′ 

e ′ 

⎤ 

⎥ 

⎦ 

f 

⎡ 

v ′ 

z = ⎣ i ′ ⎦ 

w 

x = 

⎤ 

⎥ , 

⎦ 

⎡ 

SE 

D = ⎣ 0 

0 

⎤ 

0 

SJ ⎦ , 

SM” 

(3.90) 

⎤ 

 

v 

u 

este vectorul variabilelor de stare. 

Nu este obligatoriu ca excitat¸ia să fie făcută de acelas¸i tip de mărimi. În cazul dispozitivelor 

cu excitat¸ie hibridă (de exemplu cu terminale excitate s¸i în tensiune, s¸i în curent), 

ecuat¸iile de semistare se ajustează în mod corespunzător pe baza relat¸iilor caracteristice a 

fiecărui tip de ecuat¸ie. 

Relat¸iile de mai sus sunt suficiente pentru generarea matricelor, însă ele trebuie postprocesate 

pentru a asigura tensiunile nule pe terminale. Dacă, pentru fiecare terminal k, 

sunt Nntk noduri s¸i Nbtk laturi, terminalul k va avea Nftk = Nbtk − Nntk + 1, ceea ce 

corespunde la Nbtk = Nftk + Nntk − 1 tensiuni nule. Astfel, postprocesarea presupune 

eliminarea a Nbtk mărimi de stare s¸i a celor Nbtk ecuat¸ii de stare corespunzătoare lor pentru 

fiecare terminal k. 

50

3.4. Reducerea ordinului modelului prin es¸antionarea adaptivă a frecvent¸elor cu procedura Vector Fitting 

În domeniu frecvent¸ă, sistemul de stare (3.89) devine un sistem liniar complex 

 

(sC + G)x = Bu 

y = Lx + Du 

, (3.91) 

având structura bloc din Figura 3.10. 

Solut¸ia sistemului (3.91), caracterizează complet distribut¸ia câmpului electromagnetic 

în domeniul de calcul, astfel încât ea furnizează un model complet al comportamentului 

dispozitivului modelat pentru frecvent¸a considerată. 

Figura 3.10: Structura sistemului de stare 

Primul bloc serves¸te la caracterizarea componentelor câmpului electric de-a lungul 

fiecărei laturi a ret¸elei de discretizare, iar al doilea bloc permite caracterizarea componentelor 

câmpului magnetic. În primele ecuat¸ii N ′ f , sunt cuprinse ecuat¸iile Ampere-Maxwel 

aplicate pe fet¸ele ret¸elei de discretizare magnetice. Următoarele Nf ecuat¸ii sunt corespunzătoare 

legii lui Faraday aplicată pe toate fet¸ele ret¸elei de discretizare primare. Ultimul 

bloc caracterizează conservarea curentului (sarcinilor) în toate nodurile din interiorul 

ret¸elei de discretizare primare. O variantă îmbunătăt¸ită de generare a ecuat¸iilor de stare cu 

FIT pentru EMCE, este prezentată în [97]. 

Deoarece matricele sistemului pot ajunge s¸i la dimensiuni de peste 1.000.000, rezolvarea 

unui astfel de sistem fiind foarte costisitioare atât din punct de vedere al puterii de 

calcul, cât s¸i a memoriei sistemului de calcul, se impune aplicarea unei noi metode de 

reducere a ordinului modelelor. 

3.4 Reducerea ordinului modelului prin es¸antionarea adaptivă 

a frecvent¸elor cu procedura Vector Fitting 

Algoritmul care va fi folosit în teză pentru reducerea ordinului modelului se numes¸te 

Es¸antionarea Adaptivă a Frecvent¸elor cu Vector Fitting (AFS-VF) [95], algoritm ce îs¸i propune 

să extragă modelul de ordin redus, pentru componente pasive ale unui circuit integrat, 

cu un efort minim de calcul. Efortul de calcul se reduce aducând la minimum numărul de 

sisteme de rezolvat. Un efort mic de calcul duce la un timp de executie mic s¸i, în final, la 

o modelare mai rapidă componentei pasive de circuit integrat. Cele două părt¸i importante 

ale algoritmului sunt: 

51


• procedura Vector Fitting (VF); 

• procedura de Es¸antionare Adaptivă a Frecvent¸elor (AFS). 

3.4.1 Procedura Vector Fitting 

Init¸ial, procedura VF a fost propusă în lucrarea [112], ca o metodă de interpolare a 

răspunsurilor în frecvent¸ă prin îmbunătăt¸irea iterativă a unei aproximat¸ii rat¸ionale. 

Pornind de la o funct¸ie g(s) complexă, de variabilă complexă s, se caută aproximarea 

ratională: 

f(s) = a0 + a1 · s + · · · + aN · s N 

b0 + b1 · s + · · · + bN · s N 

(3.92) 

astfel încât astfel încât f(s) să aproximeze funct¸ia g(s) în sensul celor mai mici pătrate. 

Funct¸ia f(s) poate fi rescrisă sub forma: 

f(s) = 

N cn 

+ d + sh (3.93) 

s − an 

n=1 

unde an polii, cn reziduurile s¸i iar termenii d s¸i h sunt numere reale. 

Procedura VF implică două etape: o etapă de identificare a polilor s¸i o etapă de identificare 

a reziduurilor. 

În relat¸ia (3.93) se înmult¸esc ambii membri cu forma rat¸ională a unei funt¸ie necunoscute 

σ(s), rezultând : 

σ(s) · f(s) 

σ(s) 

⎡ 

 

⎢ 

= ⎢ 

⎣ 

N 

n=1 

cn + d + sh 

s−ān 

N 

n=1 

¯cn + 1 

s−ān 

⎤ 

⎥ 

⎦ . (3.94) 

În lucrarea [112] se demonstrează că polii an ai lui f(s) sunt egali cu zerourile lui σ(s). 

Înmult¸ind al doilea rând al relat¸iei (3.94) cu f(s) rezultă relat¸ia: 

 

N 

 

N 

 

cn 

¯cn 

+ d + sh = 

+ 1 · f(s). (3.95) 

s − ān 

s − ān 

n=1 

scrisă simbolic devine: 

n=1 

(σf)fit(s) = σfit(s)f(s). (3.96) 

Ecuat¸ia neliniară (3.95), are ca necunoscute cn, d, h, ¯cn. Cu ajutorul acestei ecuat¸ii, 

scrisă pentru un set de frecvent¸e, se poate formula o problemă liniară supradeterminată de 

tipul A · x = b. 

52


Aproximarea rat¸ională pentru funct¸ia f(s) se poate obt¸ine dacă se rescrie relat¸ia (3.95): 

rezultând: 

N+1 

(s − zn) 

N+1 

(s − ¯zn) 

n=1 

n=1 

(σf)fit(s) = h · 

N 

, (σ)fit(s) = 

, 

N+1 

(s − ān) 

(s − ān) 

(3.97) 

n=1 

f(s) = (σf)fit(s) 

(σ)fit(s) 

= h · 

N+1 

n=1 

 

(s − zn) 

N 

. (3.98) 

(s − ¯zn) 

Astfel polii lui f(s) sunt egali cu zerourile lui σfit(s), pentru că polii init¸iali s-au simplificat. 

Calculând zerourile funct¸iei σfit(s) se obt¸ine un set de poli pentru funct¸ia f(s). 

Etapa a doua are ca obiectiv obt¸inerea reziduurilor. Reziduurile pot fi calculate direct 

din relat¸ia (3.97), însă pentru o acuratet¸e mai bună se pornes¸te de la aproximarea rat¸ională 

a lui f(s) (3.93), în care se înlocuiesc polii f(s) cu zerourile lui σ(s). Analog, se obt¸ine o 

problema liniară supradeterminată având ca necunoscute cn, d, h. 

Lucrarea [113] prezintă o metodă îmbunatăt¸ită de relocare a polilor pentru o convergent¸ă 

mai rapidă a procedurii. Lucrarea [114] prezintă o implementare mai eficientă a procedurii 

VF, implementare ce exploateză raritatea sistemului de ecuat¸ii rezultat în urma aplicării 

metodei celor mai mici pătrate, prin aplicarea directă a decompunerii QR. A treia versiune 

a procedurii VF cont¸ine o funct¸ie care fort¸ează pasivitatea modelului obt¸inut, pasivitate ce 

asigură stabilitatea modelelului rat¸ional. În [115], [116], [117] s¸i [118] sunt propuse astfel 

de metode care să fort¸eze pasivitatea modelului rat¸ional, dar care să s¸i accelereze execut¸ia 

procedurii VF. 

3.4.2 Algoritmul AFS-VF 

Algoritmul AFS cu VF propus în [95] îs¸i propune să obt¸ină caracteristica în frecvent¸ă 

cu efort minim de calcul (Figura 3.11). Practic, algoritmul AFS-VF constă în alegerea unui 

număr optim de es¸antioane pe baza cărora se va extrage o aproximare rat¸ională a formei 

semnalului prin Vector Fitting. 

În [119] se analizează eficient¸a algoritmului AFS cu VF, ajungându-se la concluzia că 

trebuie folosit un set suplimentar de puncte de test, pentru a controla eroarea pe intervalele 

definite de punctele din setul de es¸antioane. Controlând eroarea pe aceste intervale, 

numărul total de frecvent¸e este cel mai mic posibil, obt¸inându-se astfel, un timp de calcul 

mai mic pentru extragerea caracteristicii în frecvent¸ă. 

Pornind de la sistemul de stare: 

dx(t) 

C + Gx(t) = Bu(t) 

dt , (3.99) 

y(t) = Lx + Du(t) 

se obt¸ine relat¸ia dintre reprezentările complexe ale semnalelor de intrare/ies¸ire, numită 

matrice de transfer (3.100) 

n=1 

n=1 

Y(ω) = HF IT (ω) = L(G + jωC) −1 B . (3.100) 

53


(a) Calcul în 64 puncte (b) Calcul în 15 puncte (AFS-VF) 

Figura 3.11: Reducerea efortului de calcul folosind algoritmul AFS-VF 

Deci, pentru a calcula matricea de transfer, trebuie rezolvat un sistem liniar de ecuat¸ii 

de tipul Ax = b, având A = G + jωC matricea sistemului, iar b = B termenii liberi, 

pentru fiecare frecvent¸ă. 

Algoritmul poate fi descris prin următorii pas¸i (Figura 4.2): 

1. Având ca dată de intrare, sistemul de stare, obt¸inut în urma procesului de discretizare 

a ecuat¸iilor cu derivate part¸iale ale elmentului multipolar, alege setul init¸ial de 

frecvent¸e de es¸antionare S. Marchează toate intervalele ca necesitând a fi rafinate. 

2. Rezolvă sistemele de ecuat¸ii liniare pentru setul init¸ial de frecvent¸e (calculul lui 

HF IT (S)). 

3. Aplică VF pentru HF IT (S). Se evaluează HV F (S). Ordinul modelului redus este 

. 

căutat astfel încât εV F > HF IT (S)−HV F (S) 

HF IT (S) 

4. Alege frecvent¸e de test ce constituie mult¸imea S ′ , câte una în fiecare interval ce 

trebuie rafinat. 

5. Rezolvă sistemele de ecuat¸ii liniare pentru setul de test S ′ . 

6. Calculează HF IT (S ′ ) s¸i evaluează eroarea (Pasul 3) pentru fiecare frecvent¸ă de test. 

Dacă această eroare este mai mare decât valoarea impusă, atunci marchează frecvent¸a 

de test ca fiind imprecisă. 

7. Actualizează S prin mutarea frecvent¸elor de test în mult¸imea frecvent¸elor de es¸antionare. 

Marchează ca intervale ce necesită rafinare numai intervalele, care au unul din capete 

o fostă frecvent¸ă de test imprecisă. 

8. Dacă există intervale de rafinat s¸i numărul de frecvent¸e din lista actualizată nu a 

depăs¸it numarul maxim impus, reia de la pasul 4, altfel, opres¸te iterat¸iile. 

9. Aplică VF final, pentru mult¸imea de frecvent¸e din S. 

54


Figura 3.12: Algoritm AFS-VF - schema logica 

Analizând algoritmul AFS-VF, se constată ca pas¸i critici, din punct de vedere al timpului 

de calcul, pas¸ii, în cadrul cărora se rezolvă sistemele de ecuat¸ii liniare, sunt paralelizat¸i. 

Abordări paralele ale acestor pas¸i vor fi prezentate în capitolul următor. De asemenea, la 

primul pas al algoritmului, se cunosc atât frecvent¸ele de es¸antionare S, cât s¸i frecvent¸ele de 

test S ′ . Deci, pentru a îmbunătăt¸i performant¸ele algoritmului paralel, doar la primul pas, se 

pot rezolva ambele seturi de frecvent¸e. 

În lucrarea [120], este propusă o variantă paralelă a procedurii VF. Analiza algoritmului 

a arătat că procedura VF are un timp de execut¸ie mic, iar acest lucru se datorează faptului 

că problemele abordate în această teză au 2, maxim 4 porturi. Procedura VF paralelă se 

adresează problemelor cu un număr mai mare de porturi, în cazul unei probleme cu număr 

mic de porturi, această procedura putând fi chiar mai lentă decât procedura secvent¸ială. 

Experimentele numerice au aratat, că cele mai bune rezulate se obt¸in pentru valori ale 

tolerant¸elor: εV F = 10 −4 , respectiv εAF S = 10 −2 sau εV F = 10 −5 , respectiv εAF S = 10 −3 . 

55


3.5 Concluzii 

În cadrul acestui capitol, a fost prezentat întreg procesul dezvoltat de echipa de cercetare 

LMN din UPB pentru modelarea componentelor pasive ale circuitelor integrate de 

înalta frecvent¸ă. Prima etapă a procesului de modelare furnizează sistemul matriceal de 

stare. Acest sistem matriceal este considerat dată de intrare pentru a doua etapă a procesului 

de modelare, etapă ce constă în extragerea modelului de ordin redus cu ajutorul algortimului 

AFS-VF. Rezultatul final al întregului proces de modelare este un model rat¸ional 

pe baza căruia este sintetizat un model echivalent SPICE cu parametri concentrat¸i [121] 

ce poate fi conectat într-un circuit exterior s¸i simulate împreună folosind un program de 

simulare a circuitelor. 

Acest proces de modelare a fost studiat, de autor, în vederea paralelizării. Procedura de 

extragere a modelului de ordin redus, pentru componente pasive de circuit integrat, a fost 

identificată ca fiind partea cea mai costisitoare din punct de vedere al timpului de execut¸ie. 

Tocmai de aceea în capitolul următor vor fi prezentate noi abordări ale acestui algoritm, 

abordări care au rolul de a reduce timpul de obt¸inere al modelului de ordin redus. 

56

Folosirea sistemelor multiprocesor în modelarea 

inductoarelor spiralate 

CAPITOLUL 4 

Prima parte a acestui capitol cont¸ine o scurtă prezentare a arhitecturii sistemelor multiprocesor 

s¸i a tehnicilor de programare paralelă, corespunzătoare lor. În a doua parte se 

prezintă metode de rezolvare, directe s¸i iterative, a sistemelor liniare mari generate pe parcursul 

procesului de modelare electromagnetică, folosind calculul paralel. Ultima parte 

prezintă abordările paralele, propuse de autor, pentru algoritmul de extragerea modelului 

de ordin redus (AFS-VF). 

4.1 Arhitectura hardware s¸i software a sistemelor multiprocesor 

În 1972, Michael Flynn a introdus o clasificare generală a sistemelor de calcul din 

punct de vedere al fluxurilor de instruct¸iuni s¸i de date, numită ”Taxonomia lui Flynn” [122]. 

Această clasificare identifică patru clase de sisteme de calcul: 

• SISD - flux unic de instruct¸iuni s¸i de date; 

• MISD - fluxuri multiple de instruct¸iuni, flux unic de date; 

• SIMD - flux unic de instruct¸iuni, fluxuri multiple de date; 

• MIMD - fluxuri multiple de instruct¸iuni, fluxuri multiple de date. 

În prezent, sistemul MIMD este cel mai des întalnit pentru calculul paralel. În funct¸ie 

de arhitectura memoriei se pot distinge două tipuri de sisteme MIMD (Figura 4.1): 

• memorie comună [123] (shared memory - Figura 4.1a) - un sistem de calcul multiprocesor, 

în care mai multe unităt¸i de procesare (multi-core CPUs) au acces la o 

memorie globală. Interconexiunea dintre procesor s¸i memorie se face printr-o magistrală 

(FSB) cu viteză foarte mare de transfer; 

57

4. Folosirea sistemelor multiprocesor în modelarea inductoarelor spiralate 

(a) Memorie comună (b) Memorie distribuită 

Figura 4.1: Calculatoare MIMD 

• memorie distribuită [123] (distributed memory - Figura 4.1b) - un sistem de calcul 

tip cluster, alcătuit din mai multe sisteme de calcul (noduri) interconectate printr-o 

ret¸ea de mare viteză. 

Combinat¸ia celor două concepte, ment¸ionate anterior, se numes¸te memorie comună distribuită 

(distributed shared memory) [124]. Memoria comună distribuită prezintă s¸i ea două 

aspecte. Primul aspect încearcă să ascundă partea de memorie distribuită, prezentând memoria 

ca o memorie comună globală. Acest aspect este cunoscut sub numele memorie cu 

acces neuniform (NUMA) [124]. Celălalt aspect, cunoscut sub numele de cluster cu multiprocesoare 

simetrice (symmetric multiprocessor - SMP) [124], scoate în evident¸ă faptul că 

memoria distribuită este alcătuită din memoria comună a fiecărui nod. 

Datorită evolut¸iei arhitecturii sistemelor de calcul paralelismul s-a dezvoltat s¸i în partea 

de programe. Marea majoritatea a programelor pot fi îmbunătăt¸ite cu ajutorul unei forme 

de paralelism, divizându-l, până la un anumit nivel, în părt¸i independente ce pot fi rulate 

simultan. În urma procesului de divizare, numit descompunere [123], se identifică două 

tipuri de paralelism: 

• descompunerea domeniului, în literatura de specialitate fiind cunoscut ca paralelismul 

datelor (data parallelism) - fiecare proces execută acelas¸i cod având date de 

intrare diferite. Acest tip de paralelism este întâlnit, cel mai adesea, sub numele de 

paradigma Single Program Multiple Data (SPMD); 

• descompunerea funct¸ională, în literatura de specialitate fiind cunoscut ca paralelismul 

sarcinilor (task parallelism) - părt¸i independente de cod sunt rulate simultan, 

însă fiecare parte are o funct¸ie bine definită. De asemenea, s¸i acest tip de paralelism 

este atribuit unei paradigme, paradigma Master/Slave. 

Folosirea combinată, a celor două tipuri de paralelism, poate duce la o mai buna exploatare 

a resurselor hardware, rezultând programe cu mai multe nivele de paralelism. Caracteristica 

ce măsoară gradul de paralelism (gradul de descompunere), se numes¸te granularitate. 

În funct¸ie de gradul de granularitate, putem avea programe cu granularitate: 

• grosieră - descompunere cu un număr mic de sarcini independente; 

• fină - descompunere cu un număr mare de sarcini de executat. 

As¸adar, combinând tipurile de paralelism, programele paralele vor putea avea unul sau 

mai multe nivele de granularitate. 

58

4.1.1 Sistemul de calcul multiprocesor ATLAS 

4.1. Arhitectura hardware s¸i software a sistemelor multiprocesor 

Laboratorul de Modelare Numerică (LMN din cadrul UPB) dispune de un astfel de sistem 

de calcul multiprocesor, clusterul ATLAS [125]. Toate simulările, testele s¸i programele 

paralele acestei lucrări, au fost executate pe acest sistem multiprocesor, ce se încadreaza în 

clasa de sisteme MIMD, pe care, în funct¸ie de software-ul folosit, pot fi implementate toate 

tipurile de paralelism ment¸ionate anterior. 

Din punct de vedere al resurselor hardware, clusterul ATLAS este alcătuit din 14 noduri, 

dintre care 6 cu câte două procesoare INTEL s¸i 8 cu câte două procesoare AMD, conectate 

printr-o ret¸ea de mare transfer InfiniBand. Configurat¸ia nodurilor este: 

• 2 x CPU INTEL Xeon Nehalem 2.66GHz 8MB cache, 24GB RAM; 

• 2 x CPU AMD Opteron Barcelona 2.3GHz 2MB cache and 16GB. 

Sistemul de operare folosit este Linux Fedora, iar, mediul folosit pentru dezvoltarea 

programeleor paralele din această teză a fost MATLAB [126], însot¸it de cele două toolboxuri: 

Parallel Computing Toolbox [127] s¸i Distributed Computing Server [128]. Mai sunt 

disponibile s¸i licent¸e pentru pachetul COMSOL Multiphysics, AC/DC s¸i RF. Toate resursele 

software folosite sunt pe 64 bit¸i. 

Figura 4.2: Structura clusterului ATLAS 

Cele 14 noduri ale clusterului au funt¸ii diferite: 

1. 8 noduri, 4 cu procesoare INTEL, 4 cu procesoare AMD, sunt folosite ca noduri de 

calcul pentru programele paralele; 

2. 3 noduri de acces MATLAB; 

3. 2 noduri de test, unde sunt rulate s¸i testate programele paralele, înainte de a fi rulate 

pe întreg clusterul; 

59


4. 1 nod folosit ca server de fis¸iere, server MATLAB DCS. 

În totalitate, clusterul ATLAS dispune de: 

• 112 core-uri CPU s¸i 240 core-uri GPU; 

• 272GB memorie RAM; 

• 10TB memorie HDD. 

Modul de funct¸ionare al clusterului depinde de mediul de programare s¸i bibliotecile 

folosite. Pentru calcul paralel, în cadrul unui singur nod poate fi folosit, se poate folosi 

OpenMP [129], pentru paralelizarea ciclurilor for (concept cunoscut sub numele de embarrassingly 

parallel), sau biblioteca LAPACK [130] pentru a accesa operat¸ii BLAS paralele. 

Ambele metode pot fi regăsite s¸i în mediul MATLAB, prin toolbox-ul PCT, prima sub numele 

parfor, iar a doua metodă este folosită implicit, putând fi modificat numărul de coreuri, 

cu ajutorul funct¸iei maxNumCompThreads. Calculul distribuit este folosit pe întreg 

clusterul (în cazul de fat¸ă doar pe nodurile dedicate calculului) prin intermediul standardului 

Message Passing Interface (MPI) [131]. În cazul MATLAB, serverul DCS este cel care 

se ocupă de comunicarea între nodurile de calcul, însă sunt oferite funct¸ii preimplementate 

ce au la bază standardul MPI. 

Combinat¸ia calculului paralel cu cel distribuit, reprezintă gama de programe hibride, 

care pot avea unul sau mai multe nivele de paralelism. 

Clusterul ATLAS, mai dispune de o altă componentă de calcul paralel, s¸i anume o 

placă cu unităt¸i de procesare grafică (GPU).Placă cu GPU se numet¸e NVIDIA Tesla C1060 

([132]) s¸i are următoarele specificat¸ii: 

• 240 core-uri (unităt¸i de procesare); 

• 1.296 GHz frecvent¸a de lucru a fiecărui core; 

• 4GB memorie RAM. 

Conform ”Taxonomiei lui Flynn”, placa cu GPU se încadrează în clasa de sisteme cu 

arhitectură SIMD, s¸i este destinată a fi folosită cu paradigma paralelismul datelor. Placa cu 

GPU poate fi programată cu ajutorul limbajulu CUDA, însă există s¸i posibilitatea de apela 

funct¸ii preimplementate din biblioteci CUDA. 

4.2 Rezolvarea directă s¸i iterativă, în paralel, a sistemelor 

lineare mari 

În capitolul precedent, partea de rezolvare a sistemelor de ecuat¸ii, a fost identificată 

ca parte critică a algoritmul de modelare magnetică. În acest subcapitol, se va prezenta 

un studiu referitor la metodele de rezolvare pentru sistemele de ecuat¸ii liniare cu matrice 

rare de mari dimensiuni, generate prin discretizarea ecuat¸iilor câmpului elctromagnetic. 

Deoarece în partea critică trebuie rezolvate mai multe sisteme Aix = bi, provenite din 

60

4.2. Rezolvarea directă s¸i iterativă, în paralel, a sistemelor lineare mari 

(a) Domeniu problemă (b) Bobine în formă ”U” 

Figura 4.3: Problemă de test Ucoupled 

sistemul de stare pentru o listă de frecvent¸e S = n 

i=1 fi, se vor studia în primă fază 

posibilităt¸ile de a rezolva mai multe sisteme în paralel. 

Pentru testele efectuate în cadul acestui subcapitol, s-a considerat o problemă de test 

cu două inductoare simple plasate într-un domeniu alcătuit din 3 straturi (Aer, SiO2, Si - 

Figura 4.3a). Problemă considerată se va numi Ucoupled [133], s¸i are două conductoare în 

formă ”U” (Figura 4.3b) plasate în stratul de SiO2. 

Există două moduri de rezolvarea a unui sistem liniar Ax = b: cu metode directe sau 

cu metode iterative. Alegerea uneia sau a alteia diferă de tipul matricei sistemului A care 

poate fi: reală sau complexă, simetrică sau nesimetrică, pătrată sau dreptunghiulară, rară 

sau densă, pozitiv definită sau nu, structurată sau nu. 

4.2.1 Rezolvarea directă 

Majoritatea metodelor directe de rezolvare ale unui sistem liniar, execută factorizarea 

LU a matricei A s¸i încearcă reducerea costurilor, memorie s¸i timp de calcul, minimizând 

umplerea cu elemente nenule a factorilor triunghiulari L s¸i U, în procesul de eliminare. 

Practic, o metodă directă este alcătuită din patru pas¸i [134]: 

1. preordonare, aplicată pentru a reduce umplerea cu elemente nenule; 

2. factorizare simbolică, determină structura elementelor nenule din factorii L s¸i U, fără 

valori numerice; 

3. factorizarea numerică, calcularea efectivă cu valori numerice a factorilor L s¸i U; 

4. rezolvarea sistemelor triunghiulare rezultate: 

 

y = L\b 

A · x = b ⇒ 

x = U\y 

61 

(4.1)


Pentru simulări, a fost folosită o metodă directă, ce respectă tiparul de mai sus, s¸i anume 

solverul UMFPack [89] dezvoltat de Tim Davis. Implementarea din MATLAB a acestui 

solver poate fi considerată o implementare paralelă, deoarece, prin intermediul bibliotecii 

LAPACK [130], solverul are acces la operat¸ii BLAS paralele, ce se folosesc de faptul că 

procesorul sistemului de calcul are două sau mai multe core-uri. Se va executa, ca test, 

rezolvarea unor sisteme liniare de mai multe dimensiuni, generate cu FIT, folosind de la 1 

la 8 core-uri. 

Nr. DoFs Tip nod 

1 2 3 

Nr. core-uri 

4 5 6 7 8 

6317 

INTEL 

AMD 

0.4 

0.87 

0.33 

0.7 

0.33 

0.62 

0.28 

0.61 

0.27 

0.58 

0.27 

0.6 

0.27 

0.62 

0.28 

0.53 

17069 

INTEL 

AMD 

3.3 

6.21 

2.25 

4.21 

2.24 

3.67 

1.61 

3.28 

1.61 

3.11 

1.47 

2.95 

1.45 

3.25 

1.32 

2.85 

42269 

INTEL 26.61 16.57 16.54 10.22 10.23 8.37 8.6 7.56 

56927 

AMD 49.19 30.3 23.92 20.02 18.87 17.18 18.58 15.6 

INTEL 53.61 30.29 30.95 18.83 19.24 15.39 15.44 14.37 

AMD 93.38 55.02 43.3 35.65 32.19 30.24 30.62 26.73 

Tabelul 4.1: Timpii de rezolvare pentru număr diferit de core-uri 

În Tabelul 4.1 se găsesc timpii corespunzători rezolvării unui singur sistem, pentru 

număr diferit de core-uri. Se poate conclude, că numărul optim de threads-uri pentru rezolvarea 

unui sistem este 8, s¸i că timpul de rezolvare pentru un core este de aproximativ 4 ori 

mai mic decât timpul de rezolvare pentru 8 core-uri, T8 core = 4 · T1 core 

Următorul test, care va consta tot în rezolvarea unui sistem liniar, însă, de această dată 

se va urmări performant¸ele solverului, din punct de vedere al timpului de execut¸ie s¸i al 

consumului de memorie. 

Test 1 2 3 4 5 

Grid 15x15x15 25x25x25 37x37x37 38x38x38 39x39x39 

Nr. DoFs 6317 84719 283907 308111 333653 

INTEL 

Timp [s] 0.26 31.68 430.80 494.31 3108 

AMD 

Mem. [MB] 24 3414 22280 22365 swap 

Timp [s] 0.48 63.16 - - - 

Mem. [MB] 23 3442 mem. err. mem. err. mem. err. 

Tabelul 4.2: Timpii de rezolvare pentru diferite griduri de discretizare 

Privind rezultatele numerice (Tabelul 4.2) pentru problema Ucoupled, se poate observa, 

că pe configurat¸ia cu procesor AMD, nu au putut fi rezolvate sistemele mari, cu mai mult de 

283907 grade de libertate, din cauza necesarului mare de memorie, care a depăs¸it memoria 

fizică instalată (configurat¸ia AMD dispune de 16GB memorie RAM). Din cauza structurii 

matricei s¸i a umplerilor cu elemente nenule a factorilor L s¸i U (Figura 4.4), de pe parcurs, 

solverul UMFPack necesită o cantiate mare de memorie pentru rezolvare. 

62


(a) Înainte de factorizare (b) Umplerea după factorizare 

Figura 4.4: Matricea FIT înainte s¸i după factorizarea LU. 

Pentru rezolvarea sistemului cu 333653 grade de libertate (DoFs), a fost folosită s¸i o 

parte din memoria swap, iar acest lucru se vede în timpul mare de rezolvare. Zona de 

memorie swap este rezervată pe hard disk-ul respectivului nod, iar viteza de citire/scriere 

din această zonă de memorie este mult mai mică decât viteza de citire/scriere din memoria 

RAM. Acest lucru face ca s¸i timpul de rezolvare pentru sistemul 333653 grade de libertate, 

executat pe configurat¸ia cu procesor INTEL, să fie de aproximativ 6 ori mai mare decât 

timpul de rezolvare al sistemului cu 308111 grade de libertate. Pentru configurat¸ia cu 

procesor INTEL, intrarea în swap a fost de maxim 1GB, în timp ce configurat¸ia cu procesor 

AMD, ar fi avut nevoie 6GB din memoria swap, pentru a rezolva sistemul cu 283907 grade 

de libertate, lucru care ar fi dus la un timp de rezolvare foarte mare. Deci, intrarea în zona 

de memorie swap este un caz care trebuie evitat. 

4.2.2 Rezolvarea iterativă paralelă 

Principalul motiv pentru care s-a decis investigarea metodelor iterative, a fost acela că 

ele au nevoie, în principiu datorită absent¸ei umplerilor, de o cantitate mai mică de memorie 

decât metodele directe, pentru rezolvarea unui sistem de ecuat¸ii liniare, lucru care ar 

permite rezolvarea unor sisteme cu mai multe grade de libertate s¸i, implicit, folosirea unor 

griduri de discretizare mai dense. 

Au fost studiate două metode iterative, destinate rezolvării sistemelor nesimetrice: metoda 

reziduului minimal generalizat (Generalized Minimum Residual - GMRES) [135] s¸i 

o metodă îmbunătăt¸ită a gradient¸ilor conjugat¸i (BiConjugate Gradient Stabilized - BiCGS- 

TAB) [136]. Deoarece sistemele sunt foarte mari s¸i numărul de iterat¸ii, pe care trebuie să 

le parcurgă fiecare metodă, este mare, se impune folosirea unei tehnici de calcul paralel, 

pentru a reduce timpul de execut¸ie. 

Principala condit¸ie a paralelismului, este ca iterat¸iile de executat să fie independente, 

ceea ce nu se întâmplă în cazul metodelor iterative, unde iterat¸iile depind una de cealaltă s¸i 

nu pot fi executate în paralel (simultan). As¸adar, trebuie găsită o altă solut¸ie de aplicare a 

tehnicilor de calcul paralel. 

63


Fie solut¸ia init¸ială x(0), calculează vectorul reziduu r = bAx(0) 

ρ0 = r, v(1) = r/ρ, β = ρ 

for k=1 to n număr maxim de iterat¸ii do 

for j=1 to k do 

h(j) = (Av(k)) ′ v(j)) 

end 

v(k + 1) = Av(k) − k 

h(j, k)v(j) 

j−1 

ortogonalizare Gram-Schmidt 

h(k + 1, k) = v(k + 1) 

v(k + 1, k) = v(k + 1)/h(k + 1, k) 

end 

Figura 4.5: Pseudocod algoritm GMRES 

Fie solut¸ia init¸ială x(0), calculează vectorul reziduu r = bAx(0) 

ρ0 = 1, ρ1 = r(0) ′ r(0), α = 1, ω = 1, p = 0, v = 0 

for k=1 to n număr maxim de iterat¸ii do 

β = (ρk/ρk−1)(α/ω) 

p = r + β(p − ωv) 

v = Ap 

α = ρk/((r(0) ′ v) 

s = r − αv 

t = As 

ω = (t ′ s)(t ′ t) 

x(k) = x(k − 1) + αp + ωs 

r = s − ωt 

end 

Figura 4.6: Pseudocod algoritm BiCGSTAB 

Analizând algoritmii celor două metode, GMRES (Figura 4.5) s¸i BiCGSTAB (Figura 

4.6), se observă faptul că la fiecare iterat¸ie, se folosesc operat¸ii de algebră liniară: operat¸ii 

vector-vector (BLAS 1) s¸i operat¸ii matrice-vector (BLAS 2), operat¸ii ce se găsesc, ca instrumente 

de programare, în biblioteca Basic Linear Algebra Subprograms (BLAS) [74]. 

În funct¸ie de dotările sistemului de calcul, se pot folosi diferite biblioteci, ce utilizează 

o formă de paralelism, pentru a apela operat¸ii BLAS paralele: 

• pentru sistemele cu mai multe procesoare, se poate folosi biblioteca BLAS multithreaded 

(ATLAS [137], Goto BLAS , LAPACK [75]); 

• pentru sistemele cu placa GPU, cele mai cunoscute sunt bibliotecile CUBLAS [138] 

(pentru matrice dense) sau CUSPARSE [139](pentru matrice rare). 

Pentru testele realizate în această lucrare, s-au folosit implementările GMRES s¸i Bi- 

CGSTAB din MATLAB, respectiv din biblioteca CUSP. Pentru a putea accesa metodele 

iterative din biblioteca CUSP [140], paralelizate cu tehnologia da calcul paralel GPU, au 

64


fost scrise programe, ce asigură rezolvărea unui sistem, dar s¸i etapele premergătoare rezolvării: 

transferul s¸i compatibilitatea datelor, între MATLAB s¸i formatul acceptat pentru 

procesarea GPU. 

Mai exact, contribut¸ia autorului este realizarea fis¸ierelor ce cont¸in funct¸ii mex s¸i funct¸ii 

MATLAB, ce fac posibilă apelarea metodelor iterative din biblioteca CUSP. 

|-- cuda_programs 

| |-- iterative_solver.m 

| |-- matrix_conv 

| | ‘-- csc2coo_matrix.m 

| ‘-- solvers 

| |-- solver_complex_mex.cu 

| ‘-- solver_real_mex.cu 

|-- main_test_script.m 

|-- make_install.m 

|-- matrices 

| ‘-- matrices.mat 

‘-- read_me_first.txt 

Figura 4.7: Structura suitei de programe 

Aceste fis¸iere au fost organizate într-o suită de programe (Figura 4.7). Cu ajutorul acestor 

programe, se pot rezolva atât sisteme liniare reale rare, cât s¸i sisteme liniare complexe 

rare. 

Fiecăre funct¸ie a suitei de programe are un rol bine definit: 

1. read me first.txt - cont¸ine informat¸ii referitoare la instalarea s¸i utilizarea suitei 

de programe (Anexa C.1); 

2. make install.m - fis¸ierul de instalare (Anexa C.2); 

3. main test script.m - fis¸ier model de apelarea solverelor iterative (Anexa C.3); 

4. iterative solver.m - funct¸ie MATLAB, ce apelează funct¸ia de conversie a 

matricei (funct¸ie MATLAB), din format CSC în format COO, s¸i funct¸ia de rezolvare 

a sistemului (funct¸ie mex) (Anexa C.4); 

5. csc2coo matrix.m - funct¸ie MATLAB, ce convertes¸te o matrice în format CSC 

în format COO (vezi [141] pentru formate matrice rare - CSC, COO, CSR) (Anexa 

C.5); 

6. solver complex mex.cu (Anexa C.6)s¸i solver real mex.cu (Anexa C.7) 

sunt funct¸ii mex, ce contin codul, care calculează rezultatul sistemului, dar, realizează 

s¸i transferul de informat¸ii din mediul MATLAB către placa GPU s¸i invers. 

Rezultatele obt¸inute cu metodele iterative paralele GMRES s¸i BiCGSTAB, în cazul sistemului 

generat cu metoda FIT pentru problema Ucoupled, sunt inexacte, principala cauză fiind 

condit¸ionărea slabă a sistemului. De aceea, în subcapitolul următor se vor testa metode 

65


iterative cu precondit¸ionare. Totus¸i, pentru a ilustra utilitatea metodelor iterative paralele, 

ele au fost aplicate rezolvării unor sisteme de ecuat¸ii liniare generate de programul profesional 

COMSOL, care foloseste metoda elementelor finite, deci, în funct¸ie de complexitatea 

modelului, poate genera matrice rare, simetrice, pozitiv definite, diagonal dominante. 

Figura 4.8: Problema Ushape 

Pentru problemă de test (Problema Ushape - Figura 4.8), a fost considerat un domeniu, 

similar cu cel definit pentru celelalte probleme, respectiv trei straturi Aer, SiO2, Si, s¸i o 

bobină în formă ”U”, aflată în stratul de SiO2. Matricele rezultate din acest model sunt rare, 

pătrate s¸i diagonal dominante (Figura 4.9). Pentru a putea ”aduce” sistemul matriceal în 

mediul MATLAB, a fost folosit toolbox-ul COMSOL Live Link for MATLAB. Contribut¸ia 

autorului, constă în scrierea unei funct¸ii (Anexa D, care să exporte sistemul de stare din 

mediul COMSOL în mediul MATLAB. 

(a) FEM1 (b) FEM2 test (c) FEM3 test 

Figura 4.9: Structura matricelor problemei Ushape pentru diferite griduri de discretizare 

A fost aleasă forma sistemului de stare, în care matricele sunt rare: 

 

MC dx(t) 

dt = MAx(t) + MBu(t) 

, (4.2) 

y(t) = Cx + Du(t) 

unde matricele MC s¸i MA sunt mai rare decât în alte forme ale sistemului de stare oferite 

de Comsol [142]. Astfel, folosind sistemul de stare rezultat, ca dată de intrare pentru algoritmul 

AFS-VF, se poate obt¸ine modelul SPICE (modelul de ordin redus) pentru problema 

66


modelată. În prima variantă, modelul cont¸ine efectele câmpului electromagnetic modelate 

cu metoda FIT, în schimb, acest model va cont¸ine efectele modelate cu metoda FEM. 

Au fost executate teste, pe două tipuri de platformă de calcul: 

• CPU - folosind nodul Psi, având configurat¸ia 2 x Intel Xeon i7 CPUs, 2.66 GHz cu 8 

MB memorie cache, un total de 8 cores per nod, s¸i 24 GB memorie RAM; 

• GPU - folosind NVIDIA Tesla C1060 [132], 240 cores, 1.296 GHz per core, 4GB 

memorie RAM. 

Testul a constat în rezolvarea unui sistem complex A · x = b, folosind solverul GMRES 

cu restart, pentru care a fost calculat norma reziduului rezultatului final, R = norm(b−A∗x) 

, 

norm(b) 

s¸i accelerarea, S = TCP U . Pentru GPU, testul a fost rezolvat pentru două valori de restart 

TGP U 

50 (GPU1), respectiv 5000 (GPU2), iar pentru CPU valoarea de restart a fost setată la 50. 

Problemă FEM1 FEM2 FEM3 

No. of DoFs 7196 11568 19486 

Results Timp [s] R Timp [s] R Timp [s] R 

GMRES 

CPU 

GPU1 

5086 

62 

7.6e-2 

9.1e-2 

11860 

161 

7.4e-2 

4.0e-2 

26766 

452 

2.8e-2 

3.8e-2 

GPU2 3165 7.3e-6 476 2.98e-5 15875 3.73e-6 

Speedup1 82 73 59 

Speedup2 1.6 24 1.7 

Tabelul 4.3: Rezultatele testelor pentru diferite griduri de discretizare 

Rezultatele obt¸inute pentru CPU s¸i GPU1 arată o accelerare foarte bună, în condit¸iile 

în care acuratet¸ea este aproximativ aceeas¸i. În mod normal, în aceleas¸i condit¸ii de rulare, 

rezultatele ar fi trebuit să fie identice, însuă, din cauza implementării algoritmului GMRES, 

pot apărea mici diferent¸e. Testul GPU2 arată că se pot obt¸ine rezultate cu o acuratet¸e mai 

bună, însă, după cum se poate vedea s¸i în Tabelul 4.3, costurile, din punct de vedere al 

timpului de execut¸ie, sunt destul de ridicate. 

Acelas¸i test a fost executat pentru o alta problemă, din colect¸ia de exemple COMSOL, 

ce constă într-o bobina spiralată aflată într-un domeniu cu Aer (Figura 4.10). 

Problem FEM1 FEM2 FEM3 

No. of DoFs 9874 10452 14569 

Results Time [s] Norm Time [s] Norm Time [s] Norm 

GMRES 

CPU 

GPU 

2652 

1694 

1.3e-6 

4.2e-4 

2646 

1081 

1.0e-6 

5.4e-4 

28213 

2127 

3.9e-2 

4.9e-4 

Speedup 1.57 2.45 13.26 

Tabelul 4.4: Rezultatele testelor pentru diferite griduri de discretizare 

S¸i în cazul acestei probleme (Tabelul 4.4), s-a observat, că pe GPU obt¸in performant¸e 

mai bune decât pe CPU. Un alt lucru, de asemnea important, este acela, că pentru ambele 

67


Figura 4.10: Problema cu bobina spiralată 

probleme, Ushape s¸i Bobină Spiralată, discretizate cu gridul FEM3, s-a consumat o cantitate 

mai mare de 4GB memorie. Concluzia imediată este, că pe GPU a fost consumată o 

cantitate mai mică sau cel put¸in egală cu 4GB, placa GPU având o memorie fizică de doar 

4GB. 

După o investigat¸ie a codului s-a descoperit că în realitate solverul GMRES din biblioteca 

CUSP foloses¸te nu doar memoria plăcii GPU, ci s¸i memoria RAM a calculatorului 

pentru a executa anumite operat¸ii ale algortimului de rezolvare - norma s¸i produsul scalar 

(dot product). Aceste operat¸ii ret¸in doar o valoare as¸a că folosirea procesării GPU nu este 

eficientă, ele fiind mai potrivit de executat pe CPU folosind memoria RAM. În acest fel solverul 

implementat pe GPU reus¸es¸te să rezolve sisteme care necesită o cantitate de memorie 

mai mare decât cea fizic instalată. 

În concluzie, s-a demonstrat că solverele GPU sunt mai performante din punct de vedere 

al timpului de execut¸ie decât solverele seriale CPU. Pe parcursul cercetărilor s-a observat că 

perfomant¸ele s¸i acuratet¸ea solverelor GPU depind puternic de: tolerant¸ă impusă, numărul 

maxim de iterat¸ii s¸i valorea de restart a metodei iterative. De asemenea, s-a observat că solverele 

GPU nu reus¸esc să obt¸ină rezultate exacte pentru sistemele generate cu metoda FIT, 

una din principalele cauze fiind condit¸ionarea slabă a matricei sistemului. Următorul pas 

în investigarea metodelor iterative reprezintă investigarea metodelor de precondit¸ionare. 

4.2.3 Rezolvarea iterativă cu precondit¸ionare 

Spre deosebire de metodele directe, metodele iterative nu aduc modificări matricei A, 

ci ele caută, succesiv, cea mai bună aproximare a solut¸iei x. Vectorul reziduurilor 

rk = b − A · xk, (4.3) 

indică cât de aproape este solut¸ia de la iterat¸ia k, de solut¸ia reală x. Solut¸ia de la iteratia 

k + 1 se calculează adăugând solut¸iei anterioare o corect¸ie ce depinde de acest reziduu, de 

exemplu, în cazul cel mai simplu (metoda iterativă Richardson): 

xk+1 = xk + rk = xk + b − A · xk . (4.4) 

68


Se constată că la fiecare iterat¸ie efortul de calcul este mic s¸i se reduce practic la o 

înmult¸ire matrice-vector. Deoarece, în cazul unui sistem mare, metodele iterative au nevoie 

de un număr mare de iterat¸ii pentru a obt¸ine solut¸ia, se pot folosi, pentru îmbunătăt¸irea 

convergent¸ei, metode de precondit¸ionare. Metodele de precondit¸ionare folosesc o matrice 

M ce aproximează inversa matricei A [143], cu ajutorul căreia se obt¸ine un sistem a cărui 

rezolvare necesită mai put¸ine iterat¸ii: 

M · A · x = M · b. (4.5) 

Cu cât matricea M este mai aproape de inversa matricei A, cu atât numărul de iterat¸ii 

este mai mic. La limită, este suficientă o singura iterat¸ie, dar acesta este de fapt cazul 

metodeleor directe. 

Matricea M trebuie să fie la rândul ei rară s¸i să poată fi calculată fără efort prea mare 

de calcul. Folosind precondit¸ionarea, relat¸ia (4.4) devine: 

M · A · x = M · b. (4.6) 

Matricea noului sistem A1 = M · A, are proprietăt¸i mai bune decât matricea A, în cazul 

matricelor FIT, un număr de condit¸ionare mai mic [143]. Numărul de condit¸ionare poate fi 

calculat cu formula: 

ncond = A −1 · A, (4.7) 

s¸i el furnizează informat¸ii referitoare la cât de bine sau cât slab condit¸ionată este matricea 

A. În mediul Matlab, numărul de condit¸ionare poate fi calculat cu ajutorul comenzii 

condest(A), dar, este evident că acest calcul cere un efort mare pentru matrice de mari 

dimensiuni. 

După mai multe teste, ca metodă de precondit¸ionare, a fost folosită factorizarea incompletă 

ilu [144], iar pentru rezolvare metoda reziduului minimal generalizat (Generalized 

Minimum Residual - GMRES) [135]: 

• GMRES cu precondit¸ionare ilu, apelate din MATLAB[126] (iluMAT ); 

• GMRES cu precondit¸ionare ilu, apelate din toolbox-ul pentru MATLAB, ILUPACK 

[145] (iluP ACK). 

Factorizarea incompletă aproximează, până la un anumit punct indicat printr-o limită 

setată manual, factorii L s¸i U. Factorii L s¸i U sunt folosit¸i ca matrice de precondit¸ionare 

pentru apelul funt¸iei GMRES (în Matlab: x = gmres(A, b, [], tol, no it, 

L, U);). 

ILUPACK execută următorii pas¸i: 

1. preordonarea matricei sistemului folosind AMD, METIS, RCM, MMD, AMF (pentru 

detalii vezi site http://www.icm.tu-bs.de/˜bolle/ilupack/doc/ 

matlab.html); 

2. calculul inversei matricei preordonate, folosind factorizarea incompletă cu pivotare 

diagonală; 

69


3. aplicarea unei strategii recursive, ce aplică in mod repetat pas¸ii 1s¸i 2, pentru calculul 

complementului Schur, ce are ca rezultat factorii incomplet¸i L s¸i U; 

4. rezolvarea sistemului folosind factorii L s¸i U rezultat¸i la pasul 4. 

Pentru testele executate în cadrul acestei etape, au fost utilizate matricele FIT pentru 

problema Ucoupled.În Tabelul 4.5, se găsesc rezultatele, pentru rezolvarea unui sistem liniar, 

obt¸inute pentru cele două metode iterative cu precondit¸ionare: iluP ACK s¸i iluMAT . 

Grid 10x10x10 15x15x15 20x20x20 25x25x25 30x30x30 

DoFs 4631 17069 42269 84719 148895 

mem. [GB] 0.32 1.3 8 14 mem err 

iluP ACK Timp [s] 2.82 37.15 427.25 7638 - 

R 3.8e-12 2.1e-11 6.4e-12 4.2e-12 - 

mem. [GB] 0.4 2 mem err - - 

iluMAT Timp [s] 2.1 44.5 - - - 

R 7.68e-13 3.15e-12 - - - 

Tabelul 4.5: Rezulte numerice obt¸inute cu metode iterative cu precondit¸ionare 

Consumul mare de memorie în cazul metodelor iterative cu precondit¸ionare, se datorează 

condit¸iilor impuse metodei de precondit¸ionare, anume factorizarea incompletă. 

Condit¸iile restrictive ale factorizării incomplete au dus la umplerea, cu valori nenule, a 

matricei de precondit¸ionare, lucru care se traduce în consum mare de memorie. Deci, folosirea 

unor condit¸ii mai slabe pentru precondit¸ionare ar duce la un consum mai mic de 

memorie, însă timpul de execut¸ie al precondit¸ionării rămâne acelas¸i, deci, s¸i timpul total de 

rezolvare rămâne ridicat. 

În Tabelul 4.5, timpii prezentat¸i pentru rezolvarea sistemului, reprezintă suma timpului 

pentru obt¸inerea matricei de precondit¸ionare adunat cu timpul pentru rezolvarea efectivă 

a sistemului folosind metoda iterativă. Trebuie ment¸ionat faptul că timpul de rezolvare 

al sistemului a fost mult mai mic decât timpul de calcul al matricei de precondit¸ionare, 

metoda iterativă reus¸ind să ajungă la rezultatul final după 3-4 iterat¸ii. 

În Figura 4.11 sunt centralizate performant¸ele metodelor de rezolvare prezentate în 

acest subcapitol. Concluzia acestui subcapitol este că metoda directă (solverul UMFPack), 

obt¸ine cele mai bune rezultate, pentru matricele generate folosind metoda FIT. Găsirea unei 

tehnici competitive de precondit¸ionare, pentru aceste matrice, necesită studii suplimentare, 

această problemă rămânˆnd deschisă. Drept urmare, acest solver va fi folosit pentru simulările 

din subcapitolele ce urmează. 

4.2.4 Rezolvarea, în paralel, a mai multor sisteme liniare 

Rezolvarea, în paralel, a mai multor sisteme liniare reprezintă etapa premergătoare 

paralelizării algoritmului AFS-VF. Pentru această sect¸iune, se consideră ca test rezolvarea 

sistemului pentru problema Ucoupled pentru o listă de frecvent¸e. Din problema Ucoupled 

discretizată cu un grid 22 × 22 × 22, rezultă un sistem cu 56927 grade de libertate. Acest 

sistem trebuie rezolvat pentru un număr de frecvent¸e nfrec, din banda 1 − 60GHz. Pentru 

70


(a) Memorie (b) Timp 

Figura 4.11: Performant¸e metode de rezolvare directe vs iterative 

rezolvarea unui sistem, a fost nevoie de 1.7GB memorie, însă, deoarece configurat¸ia cu 

procesoare INTEL s-a dovedit a fi mai rapidă, testul următor, va fi executat folosind numai 

nodurile cu acest tip de procesor. 

Se vor rula testele folosind cele două versiuni paralele: 

• abordarea cu un singur nivel de granularitate, unde 1 worker (unitate de lucru) = 1 

core (notată cu 1LvlGr); 

• abordarea cu două nivele de granularitate, unde 1 worker = 1 nod cu 8 core-uri al 

cluster-ului (notată cu 2LvlGr). Primul nivel reprezintă rezolvarea simultană a sistemelor, 

iar al doilea nivel reprezintă rezolvarea cu UMFPACK, folosind 8 core-uri. 

Speedup-ul (accelererea) este calculat după formula: 

S = Ts 

= 

Tp 

nfreq ∗ T1 

, (4.8) 

Tp 

unde Ts reprezintă timpul serial, T1 timpul de rezolvare al unui sistem pentru o frecvent¸ă, 

nfrec numărul de frecvent¸e, iar Tp timpul paralel. 

Pentru un singur sistem cu 56927 grade de libertate, timpul de rezolvare obt¸inut este 

T1 = 13.41. Timpii paraleli (Tabelul 4.6) au fost obt¸inut¸i rulând cele două versiuni pe 4 noduri 

din cluster-ul Atlas, rezultând 32 workersi pentru versiunea cu un nivel de granularitate 

s¸i 4 workersi pentru versiunea cu două nivele de granularitate. 

Din punct de vedere al speedup-ului (Tabelul 4.6), se poate spune că abordarea cu un 

singur nivel de granularitate (1LvlGr) obt¸ine performant¸e mai bune fat¸ă de abordarea cu 

două nivele de granularitate (2LvlGr), doar atunci când avem un număr mic de sisteme de 

rezolvat (sub 10). 

Pentru a avea o imagine mai clară asupra perfomant¸elor celor două versiuni, vom face 

o analiză a eficient¸iei acestora. 

Analiza eficient¸ei folosirii versiunilor paralele 

Se consideră notat¸iile: 

71


Timp [s] 

Speedup 

nfrec 10 20 30 40 59 

Ts 134.1 268.2 402.3 536.4 791.19 

Tp 1LvlGr 67.57 67.87 69.33 122.13 123.02 

Tp 2LvlGr 40.57 68.30 105.73 132.18 196.20 

S1LvlGr 1.98 3.95 5.80 4.39 6.43 

S2LvlGr 3.31 3.93 3.80 4.06 4.03 

Tabelul 4.6: Rezultatele numerice pentru cele două versiuni 

• [n] - partea întreagă lui n; 

• {n} - parte fract¸ionară a lui n; 

• nfrec - numărul de frecvent¸e; 

• nworker - numărul de workersi pentru versiunea 1LvlGr; 

• 8 ∗ nworker - numărul de workersi pentru versiunea 2LvlGr; 

⎧ 

1 dacă nfrec < nworker 

⎪⎨ 

• nit = 

⎪⎩ 

nfrec 

nworker 

nfrec 

nworker 

dacă 

nfrec 

nworker 

 

+ 1 dacă 

 

= 0 

nfrec 

nworker 

 

= 0 

- numărul de iterat¸ii. 

Din testele efectuate pe durata cercetării, a rezultat că timpul de rezolvare al unui sistem 

cu 1 core este de aproximativ 4 ori mai mare decât timpul de rezolvare al unui sistem cu 8 

core-uri: T1 = 4 ∗ T8. 

Făcând un simplu calcul, se poate aproxima, ce implementare va fi mai rapidă. Acest 

lucru se poate face comparând timpii de execut¸ie obt¸inut¸i pentru fiecare implementare, 

timpi ce se vor numi timpi paraleli Tp. Timpul paralel se calculează după formula: Tp = 

nit ∗ Ti, unde nit se obt¸ine după definit¸ia de mai sus, iar Ti reprezintă timpul de rezolvare 

al unui sistem. 

În concluzie, vom avea număr de iterat¸ii diferit, s¸i, implcit, timpi paraleli diferit¸i pentru 

fiecare versiune. Pentru versiunea 1LvlGr, timpul paralel devine: 

iar pentru versiunea 2LvlGr, timpul paralel este: 

Exemplul 1 

nfrec = 10 

Tp1 = nit1 ∗ T1, (4.9) 

Tp2 = nit2 ∗ T8. (4.10) 

nworker = 4 workersi pentru 2LvlGr 

8 ∗ nworker = 32 workersi pentru 1LvlGr 

T1 este timpul de rezolvare al unui sistem pentru 1LvlGr, iar timpul T8 este timpul de rezolvare 

al unui sistem pentru 2LvlGr 

72

4.3. Paralelizarea Es¸ationării Adaptive a Frecvent¸elor cu Vector Fitting(AFS-VF paralel) 

T1 = 4 ∗ T8 

Tp1 = nit1 ∗ T1 = 1 ∗ T1 = 1 ∗ 4 ∗ T8 pentru 1LvlGr 

Tp2 = nit2 ∗ T8 = 3 ∗ T8 pentru 2LvlGr 

În acest caz timpul paralel pentru 2LvlGr este mai mic decât timpul paralel pentru 

1LvlGr (se verifică, vezi Tabelul 4.6). 

În ceea ce prives¸te rezolvarea sistemelor pentru o listă de frecvent¸e, au fost propuse 

două abordări. Rezultatele testelor au arătat, că înainte de a utiliza una din abordările 

paralele, poate fi făcut un calcul prin care să se aproximeze timpul de execut¸ie, pentru a 

vedea, care din cele două versiuni este mai portrivită pentru a rezolva respectivul caz. 

Un alt lucru foarte important, pentru decizia utilizării uneia dintre versiunile propuse, 

este acela că pentru versiunea 1LvlGr (1 worker = 1 core), 1 worker va avea la dispozit¸ie 

doar 1 

24 

din memoria totală a nodului respectiv, adică, în cazul nodurilor INTEL, = 3GB 

8 8 

memorie RAM. Această limitare reprezintă un important dezavantaj, deoarece folosind 

această versiune, se vor putea rezolva doar sisteme care necesită o cantitate de maxim 3 GB 

memorie (aproximativ 85000 grade de libertate), ceea ce înseamnă că gridul de discretizare 

nu poate fi foarte dens, rezultând simulări cu erori mai mari. 

De asemenea, s-a observat faptul că, pentru un număr mic de frecvent¸e (mai mic de 10), 

versiunea cu două nivele de granularitate obt¸ine performant¸e mai bune decât versiunea cu 

un singur nivel de granularitate. 

4.3 Paralelizarea Es¸ationării Adaptive a Frecvent¸elor cu 

Vector Fitting(AFS-VF paralel) 

As¸a cum a fost prezentat în Capitolul 3, pasul critic al algoritmului AFS-VF, implică 

rezolvarea unui sistem liniar de ecuat¸ii, de tip A · x = b, pentru o serie de frecvent¸e. Acest 

lucru se întâmplă, din cauza sistemelor de rezolvat, care au o dimensiune foarte mare (pot 

depăs¸i 10 6 grade de libertate), ceea ce implică timpi de rezolvare foarte mari. 

Folosind tehnici de calcul paralel s¸i distribuit, autorul propune două versiuni paralele 

ale algoritmului AFS-VF [146], obiectivul folosirii lor, fiind acela de a reduce la minimum 

timpul de modelare. Practic, cele două versiuni propuse urmăresc algoritmul serial, însă, 

pasul critic este executat folosind abordările paralele ment¸ionate în subcapitolul anterior. 

Rezultă, două abordări, cu un nivel de granularitate, respectiv cu două nivele de granularitate, 

ambele cont¸inând aceeas¸i succesiune de pas¸i: 

1. citirea datelor de intrare - încărcarea sistemului matriceal în memoria fiecarui worker 

(unitate de lucru); 

2. distribuirea listei de frecvent¸e - fiecare worker primes¸te un set de frecvent¸e, pentru 

care sistemul trebuie rezolvat; 

3. rezolvarea simultană pentru fiecare set de frecvent¸e primit; 

4. asamblarea răspunsului - pregătirea datelor de ies¸ire într-un format compatibil cu 

restul programului. 

73


Diferent¸a dintre cele două versiuni constă în abordarea hardware-ului s¸i software-ului 

sistemului de calcul, din punct de vedere al granularităt¸ii. Nivelul de granularitate are o 

mare influent¸ă asupra performant¸elor algoritmului paralel, deoarece un nivel de granularitate 

prea mare ar încetini execut¸ia programului (din cauza timpilor de comunicare), iar un 

nivel de granularitate prea mic, nu ar exploata la maxim resursele de calcul. 

Prima abordare, propusă de autor, este construită cu un singur nivel de granularitate, iar, 

dacă se ia în calcul numărul de sarcini în care este împart¸it pasul de executat, se poate spune 

că se foloses¸te granularitate grosieră. A doua abordare, propusă, este construită cu două 

nivele de granularitate: primul nivel cu granularitate mare, constând in rezolvarea simultană 

a mai multor sisteme, iar cel de-al doilea, cu granularitate fină, constând în rezolvarea 

sistemului folosind procesarea multicore. 

Altfel spus, prima abordare (Figura 4.12a) foloses¸te, ca unitate de lucru (worker), coreurile 

fiecărui nod din cluster, iar a doua abordare (Figura 4.12b) foloses¸te ca unitate de 

lucru la primul nivel nodurile cluster-ului, iar la al doilea nivel core-urile procesoarelor. 

(a) Un nivel de granularitate (b) Două nivele de granularitate 

Figura 4.12: Abordări paralele ale AFS-VF 

Performat¸a algoritmului AFS-VF paralel poate fi s¸i ea calculată, pornind de la analiza 

făcută în subcapitolul anterior. Timpul de execut¸ie al algoritmului AFS-VF paralel poate fi 

aproximat cu formula: 

Tp AF S = 

nit AF 

S 

i=1 

Tpi 

(4.11) 

unde Tp AF S, reprezintă timpul paralel de execut¸ie al algoritmului AFS-VF, Tpi reprezintă 

timpul paralel pentru fiecare iterat¸ie (calculat folosind formulele 4.9 s¸i 4.10, prezentate mai 

sus), iar nit numărul de iterat¸ii. 

Exemplul 2 Presupunem cazul prezentat în Tabelul 4.7, pentru 4 puncte de start. Avem ca 

date de intrare: 

nitAF = 2 S 

nworker = 4 workersi pentru 2LvlGr 

74

4.3. Paralelizarea Es¸ationării Adaptive a Frecvent¸elor cu Vector Fitting(AFS-VF paralel) 

8 ∗ nworker = 32 workersi pentru 1LvlGr 

T1 este timpul de rezolvare al unui sistem pentru 1LvlGr, iar timpul T8 este timpul de 

rezolvare al unui sistem pentru 2LvlGr, T1 = 4 ∗ T8 

Observat¸ia 1 Trebuie ment¸ionat faptul că implementările paralele rezolvă la prima iterat¸ie 

un număr de sisteme egal cu suma dintre numărul punctelor de start s¸i numărul de sisteme 

S ′ de rezolvat pentru prima iterat¸ie din tabelul de convergent¸ă. 

Pentru 1LvlGr avem nitAF S 

= 2 timpi paraleli de calculat: 

Tp1 = nit1 ∗ T1 = 1 ∗ T1 = 1 ∗ 4 ∗ T8 

(numărul de frecvent¸e, pentru iterat¸ia 1, este 4+3=7, vezi Tabelul 4.7) 

Tp2 = nit2 ∗ T1 = 1 ∗ T1 = 1 ∗ 4 ∗ T8 

(numărul de frecvent¸e, pentru iterat¸ia 2, este 6, vezi Tabelul 4.7) 

Tp AF S 1LvlGr = 2 

i=1 

Pentru 2LvlGr avem nitAF S 

Tpi = Tp1 + Tp2 = 4 ∗ T8 + 4 ∗ T8 = 8 ∗ T8 

= 2 timpi paraleli de calculat: 

Tp1 = nit1 ∗ T8 = 2 ∗ T8 

(numărul de frecvent¸e, pentru iterat¸ia 1, este 4+3=7, vezi Tabelul 4.7) 

Tp2 = nit2 ∗ T8 = 2 ∗ T8 

(numărul de frecvent¸e, pentru iterat¸ia 2, este 6, vezi Tabelul 4.7) 

Tp AF S 2LvlGr = 2 

i=1 

Tpi = Tp1 + Tp2 = 2 ∗ T8 + 2 ∗ T8 = 4 ∗ T8 

În acest caz timpul paralel pentru 2LvlGr este mai mic decât timpul paralel pentru 

1LvlGr. 

εAF S εV F Nr. pct. Convergent¸a 

1e-3 1e-5 4 

1e-3 1e-5 8 

iterat¸ie 1 2 

S ′ 3 6 

S + S ′ 7 13 

iterat¸ie 1 

S ′ 7 

S + S ′ 15 

Tabelul 4.7: Convergent¸a algoritmului AFS-VF3 pentru problema Ucoupled 

În Tabelul 4.7 este prezentată convergent¸a algoritmului AFS-VF3 pentru problema Ucoupled, 

cu grid 20 × 20 × 20, 56927 grade de libertate, s¸i parametri diferit¸i (εAF S, εV F , 

numărul punctelor de start). Se poate observa, că numărul de sisteme S ′ , care trebuie rezolvat 

pentru fiecare iterat¸ie, este mai mic de 10 pentru primul caz, cu 4 puncte de start, s¸i 

mai mare 10 pentru al doilea caz, cu 8 puncte de start. 

În Tabelul 4.8 sunt prezentat¸i timpii de execut¸ie, în cazul mai sus ment¸ionat, ai algoritmului 

AFS-VF pentru problema Ucoupled. Se poate observa, că aproximările făcute, sunt 

adevărate, implementarea cu două nivele de granularitate obt¸inând timpi mai mici în cazul 

cu 4 pucte de start (unde avem sub 10 puncte per iterat¸ie) s¸i timpi mai mari în cazul cu 8 

puncte de start (unde avem peste 10 puncte per iterat¸ie). 

75


U coupled 

Grid 20 × 20 × 20 

DoFs 42269 

Nr. in/out 2 

Nr. pct. Timp [s] 

Ts 141.8 

4 Tp 1LvlGr 90.39 

Tp 2LvlGr 60.27 

Ts 157.64 

8 Tp 1LvlGr 47.76 

59.27 

Tp 2LvlGr 

Tabelul 4.8: Timpii de execut¸ie ai algortimului AFS-VF pentru problema Ucoupled 

De asemenea, abordările paralele ale algoritmului AFS-VF, păstrează limitările rezolvării, 

în paralel, a mai multor sisteme, respectiv implementarea cu un singur nivel de 

granularitate poate folosi doar 1 din memoria totală pentru rezolvarea unui sistem. Din 

8 

punct de vedere al abordării problemelor de dimensiuni mari, abordarea cu două nivele de 

granularitate este superioară, deoarece oferă o cantitate de memorie mai mare pentru rezolvarea 

unui sistem. Însă, pentru sisteme mici, poate fi folosită metoda de calcul a accelerării, 

pentru a determina alegerea optimă între cele două aborda˘ri. 

4.4 Concluzii 

În introducerea acestui articol au introduse câteva not¸iuni legate de sistemele multiprocesor 

actuale, dar s¸i tehnici de programare paralelă a acestor sisteme. Studiu referitor 

la metodele de rezolvare a oferit informat¸ii pret¸ioase legate de tipul solverului ce trebuie 

ales pentru o rezolvare cu acuratet¸e ridicată a sistemelor cu matrice rare generate cu ajutorul 

Chamy. În finalul acestui capitol au fost propuse doă implementări paralele ale algoritmului 

AFS-VF, cu un nivle de granularitate, respectiv cu două nivele de granularitate, prezentând 

atât avantajele cât s¸i dezavantajele folosirii lor. De asemenea, a fost prezentat s¸i o metodă 

de calcul a eficient¸ei acestor implementări. 

Despre eficient¸a folosirii implementărilor paralele, se va vorbi s¸i în capitolul următor 

pentru fiecare strutură de test modelată. 

76

Studii de caz - rezultate numerice s¸i validarea lor 

experimentală 

CAPITOLUL 5 

Pentru validarea perfomant¸elor implementărilor paralele ale AFS-VF au fost analizate 

trei structuri de test: CDST-SP-MIDDLE, CHRF217 s¸i CHRF201. Acestea au fost concepute 

s¸i realizate în tehnologia CMOS, de parteneri industriali ai CHAMELEON RF s¸i 

CODESTAR, s¸i caracterizate experimental de aces¸tia. 

Prima etapă a procesului de modelare electromagnetică constă în modelarea geometrică. 

Geometria dispozitivelor se extrage din fis¸ierele .gds, care descriu prin coordonate 

din planul orizontal xOy măs¸tile prin care se realizează acele dispozitive. Coordonatele 

pe axa y se obt¸in din fis¸ierul de tehnologie, fis¸ier ce cont¸ine dimensiunea s¸i dispunerea 

straturilor în dispozitiv (Figura 5.1 s¸i Tabelul 5.1). Aceste date sunt asamblate în fis¸ierul de 

geometrie folosit în Chamy. 

Următoarea etapă constă în modelarea fizică, prezentată în Capitolul 3, în care au fost 

identificate principalele fenomene fizice care apar în funct¸ionarea dispozitivului s¸i sursele 

câmpului electromagnetic, în regimul cel mai potrivit pentru analiza dispozitivului. Tot 

în acelas¸i capitol a fost prezentată s¸i modelarea matematică, în care au fost prezentate 

ecuat¸iile ce descriu fenomenele fizice, condit¸iile de frontieră, s¸i a fost formulată corect 

problema ce va fi rezolvată, identificându-se datele s¸i rezultatele ei. 

Modelarea aproximativă este cea de-a treia etapă procesului de modelare electromagnetică 

s¸i ea constă în rezolvarea analitică a problemei, pentru a extrage modelul cu parametri 

concentrat¸i al dispozitivului analizat. Modelarea numerică presupune rezolvarea 

problemei de câmp electromagnetic folosind modelul discretizat. Validarea se face prin 

compararea celor două solut¸ii (analitică s¸i numerică), dar verificarea cea mai puternică se 

realizează prin comparat¸ia cu rezultatele experimentale. 

Modelarea numerică va fi făcută cu ajutorul programului Chamy, bazat pe tehnica integrărilor 

finite (FIT), prezentată anterior. Chamy generează în mod automat o ret¸ea de 

discretizare minimală, însă pentru a obt¸ine rezultate cât mai exacte, va fi folosită o ret¸ea de 

discretizare adaptată. Datele de ies¸iere ale acestui program, în care a fost încorporată procedura 

paralelă AFS-VF, constau în: modelul de ordin redus sub forma unui circuit SPICE 

s¸i caracteristica în frecvent¸ă a dispozitivului modelat. Scopul acestui capitol este de a valida 

s¸i evalua cantitativ versiunea Chamy+AFS-VF paralel prin comparat¸ie cu versiunea 

secvent¸ială a programului Chamy-VF. 

77

5. Studii de caz - rezultate numerice s¸i validarea lor experimentală 

Figura 5.1: Dispunerea straturilor în tehnologia folosită pentru problemele CODESTAR s¸i 

CHAMELEON 

Strat Grosime [µm] Material 

aer 725 Aer 

prot2 1 Nitride 

prot1 0.9 Oxide1 

met4 3.1 alum1 în Oxide2 

via3 1 tun1 în Oxide2 

met3 0.64 alum2 în Oxide2 

met1-met2 3.305 Oxide2 

nwell 3 SUB5 în SUB1 

substrat 725 SUB1 

Tabelul 5.1: Parametri geometrici ai straturilor 

78

5.1. Inductorul spiralat pătrat - CDST-SP-MIDDLE 

5.1 Inductorul spiralat pătrat - CDST-SP-MIDDLE 

Problema CDST-SP-MIDDLE se referă la un inductor spiralat pătrat ce are amble terminale 

excitate în tensiune, iar substratul de Si conectat la GND. Geometria 2D, în coordonate 

xOz, a dispozitivului provine din fis¸ierul .gds (Figura 5.2a - vedere din Layouteditor 

[63]). Coordonata pe axa Oy provine din fis¸ierul de tehnologie, obtinându-se astfel geometria 

3D (Figura 5.2b - vedere din COMSOL) a dispozitivului de modelat. 

(a) Layout (b) Vedere 3D 

Figura 5.2: Problema CDST-SP-MIDLLE 

Caracteristicile materialelor folosite pentru clasa de probleme CODESTAR sunt prezentate 

în Tabelul 5.2. 

Material Tip µr εr σ [S/m] 

alum1 Al-conductor 1 1 6.60 · 10 7 


tun1 W-conductor 1 1 3.33 · 10 6 

SUB1 (Si) semi-conductor 1 11.7 5 

SUB5 (Si) semi-conductor 1 11.7 3.33 · 10 3 

Oxide1 izolator 1 3.9 0 

Oxide2 izolator 1 4.1 0 

Nitride izolator 1 7.5 0 

Tabelul 5.2: Materialele problemelor CODESTAR 

Conform tehnologiei de fabricat¸ie (Figura 5.1) inductorul cont¸ine materialele prezentate 

în Figura 5.3. 

Dimensiunile inductorului spiralat (Figura 5.4) sunt: s = 3µm, w = 20µm, dout = 

200µm, din = 114µm, p1 = 69.80µm s¸i p2 = 112.8µm. Inductorul se află în stratul met4 

iar conductoarele de aduct¸ie în stratul met3. 

79


5.1.1 Modelarea aproximativă 

Figura 5.3: Materialele inductorului spiralat 

Figura 5.4: Dimensiunile inductorului spiralat 

Pentru obt¸inerea solut¸iei analitice se va folosi modelul cu parametri concentrat¸i (Figura 

5.5) propus în lucrările [17] s¸i [16]. 

Parametri concentrat¸i ai modelului sunt definit¸i astfel: 

• rezistent¸a serie de curent continuu: 

Rs = 

ρ · l 

w · t = 

1 

6.6·107 · 1122 · 10−6 20 · 10−6 + 

· 3.1 · 10−6 1 

1.25·107 · (69.8 + 112.8) · 10−6 + 

20 · 10 −6 · 0.64 · 10 −6 

+2 · 

1 

3.33·10 6 · 1 · 10 −6 

20 · 10 −6 · 19.8 · 10 −6 

= 0.274 + 1.141 + 2 · 0.00075 = 1.42Ω , 

80 

(5.1)


Figura 5.5: Modelul cu parametri concentrat¸i pentru inductorul spiralat 

unde ρ rezistivitatea metalului, l lungimea conductorului, w lăt¸imea liniei, t grosimea 

metalului. Inductorul este cont¸inut în 3 straturi: 42 care cont¸ine înfăs¸urarea cu 

lungimea de 1122µm s¸i grosimea 3.1µm (grosimea stratului met4), 39 care cont¸ine 

conductoarele de aduct¸ie ale inductorului cu lungime p1 + p2 (69.8µm + 112.8µm) 

s¸i grosimea 0.64µm (grosimea stratului met3). Pentru stratul 42 via3 grosimea va 

fi de 19.8µm, deoarece suprafat¸a perpendiculară a conductorului care este străbătută 

de curent are dimensiunile 20 × 19.8µm 2 . 

• inductivitatea serie este calculată folosind calculatorul on-line [147], ce are la bază 

formula Wheeler modificată [148]: 

Ls = 1.053nH (5.2) 

Această valoare este credibilă deoarece acest calcualtor indică valori calculate s¸i cu 

alte două metode care se abat de la aceasta doar cu +/-1%, respectiv 1.043nH s¸i 

1.061nH. La frecvent¸e mari, datorită efectului pelicular, valoarea inductant¸ei scade, 

dar nu cu mai mult de 5%, cât reprezintă inductant¸a internă a conductorului, care se 

anulează la efect pelicular net. La frecvent¸e foarte mari câmpul magnetic pătrunde 

doar part¸ial în substratul semiconductor, iar acest efect poate scadea inductant¸a cu 

până la 20-30%. 

• capacitatea serie: 

Cs = (N − 1) · w 2 · 

= (2 − 1) · (20 · 10 −6 ) 2 · 

εOx 

tOx M3 M4 

= 

3.9 · 8.85 · 10−12 

1 · 10 −6 

= 13.81 · fF , 

(5.3) 

unde N este numărul de spire, iar tOx M3 M4 grosimea stratului de oxid dintre stratul 

met4 s¸i met3. Formula ar trebui să t¸ină cont de efectele capacitive parazite apărute 

81


între spirele inductorului: 

Cs = (N − 1) · εOx · (dout + 2 · dout) · t 

4 · s 

= (2 − 1) · 3.9 · 8.85 · 10−12 · (200 + 2 · 200) · 3.1 · 10 −12 

4 · 3 · 10 −6 

= 

= 5.35 · fF , 

(5.4) 

unde t grosimea stratului de metal al spiralei, s distant¸a dintre spire. Probabil, capacitatea 

reală este cuprinsă între aceste două valori limită. 

• capacitatea stratului de oxid: 

COx = 1 εOx 

· l · w · 

2 tOx 

= 1 

2 · 1305.6 · 10−6 · 20 · 10 −6 · 

3.9 · 8.85 · 10 

· 

−12 

(1 + 0.64 + 3.305) · 10−6 = 91.13fF , 

(5.5) 

unde tOx este grosimea stratului de oxid dintre spirală s¸i substrat (calculată presupunând 

câmpul electric uniform sub conductor s¸i nul în rest) sau 

COx = 1 

2 · d2out · εOx 

= 

tOx 

1 

2 · (200 · 10−6 ) 2 · 

3.9 · 8.85 · 10 

· 

−12 

(1 + 0.64 + 3.305) · 10−6 = 139.60fF , 

(5.6) 

calculată presupunând câmpul electric uniform în stratul de oxid de sub toata aria 

inductrului. Capacitatea reală este probabil cuprinsă între aceste două valori extreme. 

• capacitatea stratului de Si(nwell): 

CSi = 1 

2 · d2 out · CSub = 1 

2 · (200 · 10−6 ) 2 · 34.52 · 10 −6 

= 690.40fF , 

unde capacitatea substratului pe unitatea de suprafat¸ă CSub = ε 

tNwell 

34.52µF/m2 ; 

• rezistent¸a stratului de Si(nwell): 

RSi = 

2 

d 2 out · GSub 

= 

= 11.7·8.85·10−12 

3·10 −6 

(5.7) 

2 

(200 · 10−6 ) 2 · 1.11 · 109 (5.8) 

= 45.05mΩ , (5.9) 

unde conductant¸a substratului de Nwell pe unitatea de suprafat¸ă GSub = σNwell 

tNwell = 

3.33·10 3 

3·10 −6 = 1.11 · 10 9 S/m 2 . Dacă se neglijează efectul structurilor V din stratul nwell 

(Figura 5.2a), atunci Csub = ε 

tSi = 178.820nF/m2 , Gsub = σ 

tSi = 6.8 · 103 S/m 2 . 

Cu aceste valori CSi = 3.58fF s¸i RSi = 7.353kΩ. Probabil că în realitate valorile 

acestor doi parametri sunt cuprinse între aceste limite. 

82 

=


Pentru a modela influent¸a efectului pelicular asupra rezistent¸ei Rs se calculează adâncimea 

 

1 

de pătrundere δ = πfµσ 

portul dintre semilăt¸imea t 

2 

care are valori dependente de frecvent¸ă ca în Tabelul 5.3. Ra- 

a conductorului s¸i adâncimea de pătrundere are valorile din 

Tabelul 5.4 (valorile supraunitare indică de câte ori cres¸te rezistent¸a în c.c.). În concluzie 

pentru frecvent¸e mai mari decât 1.6GHz, la care t = δ trebuie luat în considerare efectul 

2 

pelicular. 

Frecvent¸a 1GHz 10GHz 40GHz 60GHz 

Material δ [µm] 

alum1 1.96 0.62 0.31 0.25 

Tabelul 5.3: Adâncimea de pătrundere la diferite frecvent¸e pentru tronsoanele inductorului 

Frecvent¸a 1GHz 10GHz 40GHz 60GHz 

Material t/2δ 

alum1 0.80 2.50 5.00 6.13 

Tabelul 5.4: Raportul dintre semilăt¸imea t a conductorului s¸i adâncimea de pătrundere 

2 

pentru tronsoanele inductorului 

Figura 5.6: Circuitul echivalent pentru inductorul integrat (LTSpice) 

Pasul următor reprezintă simularea circuitului din Figura (5.6) în SPICE . Ecuat¸iile ce 

caracterizează circuitul liniar sunt: 

I1 = Y11V1 + Y12V2 

I2 = Y21V1 + Y22V2 . 

83 

(5.10)


Pentru obt¸inerea caracteristicii în frecvent¸ă din SPICE, circuitul trebuie simulat de două ori 

astfel: 

1. cu V2 = 0 se obt¸ine I1 = Y11V1 s¸i I2 = Y21V1, adică Y11 s¸i Y21; 

2. cu V1 = 0 se obt¸ine I1 = Y12V1 s¸i I2 = Y22V1, adică Y12 s¸i Y22. 

Pentru a se studia efectul diferitelor variat¸ii parametrice asupra caracteristicii de frecvent¸ă, 

au fost efectuate mai multe simulari, pentru diferite valori ale parametrilor circuitului (Tabelul 

5.5). În acest tabel au fost marcate cu bold valorile modificate la fiecare simulare fat¸ă 

de cea de referint¸ă (nr. 1). 

Nr. Rs [Ω] Ls [nH] Cs [fF] COx [fF] CSi [fF] RSi [Ω] 

1 1.42 1.053 5.35 139.60 690.40 45.05·10 −3 

2 8.705 1.053 5.35 139.60 690.40 45.05·10 −3 

3 1.42 1.000 5.35 139.60 690.40 45.05·10 −3 

4 1.42 1.053 13.81 139.60 690.40 45.05·10 −3 

5 1.42 1.053 5.35 91.13 690.40 45.05·10 −3 

6 1.42 1.053 5.35 139.60 3.58 7.353 ·10 3 

7 3.5 1.053 5.35 139.60 690.40 45.05·10 −3 

8 3.5 1.053 5.35 139.60 3.58 7.353·10 3 

Tabelul 5.5: Valorile parametrilor concentrat¸i pentru fiecare simulare 

Rezultatele simulărilor au fost comparate cu simularea de referint¸ă numărul 1 s¸i cu 

măsurătorile. 

Simularea 1 

Interesează doar Y11 = Y22 s¸i Y 12 = Y21 care din circuit rezultă: 

Dacă ω ≈ 0 atunci 

1 

Y11 ≈ jω(Cs + Cox) + 

Rs + jωLs 

= −ω2Ls(Cs + COx) + jω(Cs + COx)Rs + 1 

, 

Rs + jωLs 

1 

Y12 ≈ jωCs + 

Rs + jωLs 

= −ω2LsCs + jωCsRs + 1 

. 

Rs + jωLs 

Y11 ≈ Y12 ≈ 1 

Pulsat¸iile teoretice de rezonant¸ă au expresiile: 

Y11 : ωr = 

Rs 

(5.11) 

(5.12) 

, (5.13) 

(5.14) 

1 

, (5.15) 

Ls(Cs + COx) 

Y12 : ωr = 

84 

1 

√ LsCs 

. (5.16)


Din caracteristica de frecvent¸ă rezultă că frecvent¸a de rezonant¸ă este la 450MHz pentru 

măsurători s¸i la 250MHz pentru simularea nr. 1 (Figura 5.7). 

(a) Y11 Real (b) Y11 Imaginar 

(c) Y21 Real (d) Y21 Imaginar 

Figura 5.7: Simularea 1 - Y11 s¸i Y21 

La frecvent¸a minimă de 50MHz, Re(Y11) = 1 

Rs 

= 1 

1.42 

= 0.704 este aproximativ egală 

cu valoarea simulată SPICE 0.667, însă aceste valori sunt de aproximativ 2 ori mai mari 

decât valaorea măsurată 0.329. Asta înseamnă că rezistent¸a Rs din modelul cu parametri 

concentrat¸i ar trebui să fie de două ori mai mare. Explicat¸ii posibile: efectul pelicular 

s¸i de pierderi prin curent¸i turbionari, neomogenitatea trecerii via3, abateri geometrice ale 

conductivităt¸ii sau erori de procesarea rezultatelor experimentale, inclusiv rezistent¸a de 

contact. 

La frecvent¸a maximă de 40GHz, Re(Y11) = Rs 

(ωLs) 2 = 5.37e-3 valoarea simulată SPICE 

fiind 7.57e-5, iar valoarea măsurată 5.511e-3. O explicat¸ie posibilă a acestor discrepant¸e 

este efectul pelicular (creste rezistent¸a de 6.13 ori), iar datorită frecvent¸ei foarte mari s¸i 

efectul pierderilor prin curent¸i turbionari în substrat. 

Frecvent¸ele de rezonant¸ă teoretice sunt: 

Y11 : fr = ωr 

2 · π = 

1 

1 

· 

1.053 · 10−9 · (5.35 + 139.6) · 10−15 2π 

Y12 : fr = ωr 

2 · π = 

1 

1 

√ · 

1.053 · 10−9 · 5.35 · 10−15 2π 

= 67GHz , (5.17) 

= 13GHz . (5.18) 

Rezultatele simulărilor sunt mai apropiate de măsurători decât aceste estimări teoretice, 

85


însă tot există o diferent¸ă de circa 2 ori. Pentru a avea o concordant¸ă mai bună a frecvent¸ei 

de rezonant¸ă ar trebui ca teoretic valorile capacităt¸ilor să fie de circa 4 ori mai mici. Nu este 

prea clară nici influent¸a subsratului de Si s¸i dacă parametrii RSi s¸i CSi trebuie calculat¸i cu 

caracteristicile stratului de nwell. 

Pentru a identifica mai exact care este parametrul care generează inadvertent¸ele fată de 

măsurători au fost efectuate mai multe simulări, conform Tabelului 5.6. 

f [Hz] 

Măsurat Simulat SPICE 

Y11 Y12 Y11 Y12 

Re Im Re Im Re Im Re Im 

5e7 3.299e-1 -3.966e-2 3.297e-1 4.058e-2 6.675e-1 -1.553e-1 -6.675e-1 1.554e-1 

5e8 1.340e-1 -1.670e-1 -1.130e-1 1.680e-1 1.096e-1 -2.547e-1 -1.096e-1 2.551e-1 

40e9 5.511e-3 6.077e-3 5.551e-4 3.984e-3 7.573e-5 3.265e-2 -2.028e-5 2.433e-3 

Tabelul 5.6: Valorile admitant¸elor pentru simularea nr.1 la diferite frecvent¸e 

Simularea 2: a fost considerată rezistent¸a ce t¸ine cont de efectul pelicular de la frecvent¸a 

maximă de 40GHz:Rs2 = 6.13Rs. Din cauza efectului pelicular, Rs are valori variabile 

între (1 ÷ 6.13)Rs. Surpriza pozitivă constă în faptul că graficele simulărilor 1 s¸i 2 (Figurile 

5.8 s¸i 5.9) încadrează la frecvent¸e mici caracteristica de frecvent¸ă măsurată s¸i că are loc 

o cres¸tere a frecvent¸ei de ”rezonant¸ă” de la 250Mz la 1050Mhz, depăs¸ind chiar s¸i valoarea 

măsurată de 450MHz. Pentru o valoare mai bună a acestei frecvent¸e ar trebui ca Rs să fie 

între limitele de 1.4 s¸i 8.73 Ω, de exemplu să aibă valoarea Rs = 3.5 Ω, corespunzătoare 

mediei lor geometrice. Cu această valoare s-ar îmbunătăt¸i foarte mult comportarea de la 

frecvent¸e mici. 

(a) Real (b) Imaginar 

Figura 5.8: Simularea 1 s¸i 2 - Y11 

Simularea 3: studiază scăderea inductivităt¸ii Ls cu aproximativ 5%. Se constată din 

Figura 5.10 că această modificare nu influent¸ează sensibil carcteristica de frecvent¸ă. 

86






Figura 5.10: Simularea 1 s¸i 3 - Y11 s¸i Y21 

87


Simularea 4: se studiază influent¸a modificării capacităt¸ii Cs. Se constat din Figura 5.11 

că modificarea acestui parametru (cres¸terea lui de 2.5 ori) nu aduce schimbări relevante în 

caracteristica de frecvent¸ă. 






Simularea 5: se studiază influent¸a modificării capacităt¸ii COx. Se constată din Figurile 

5.12 s¸i 5.13 că acestui parametru cu circa 50% nu modifică sensibil caracteristica de 

frecvent¸ă. La frecvent¸e mari se ameliorează parte imaginară a admitant¸ei Y11. 

88




Simularea 6: se studiază influent¸a stratului de Si (simulările precedente au considerat 

doar partea se Si − nwell) care duce la modificării capacităt¸ii CSi s¸i a rezitent¸ei RSi. 

Din Figura 5.14 se constată că modificarea parametrilor CSi s¸i RSi aduce o îmbunătăt¸ire a 

caracteristicii părt¸ii imaginare a lui Y11 la frecvent¸e înalte. 




89


Simularea 7 s¸i 8: Pentru aceste două simulări se va studia modificarea rezistent¸ei Rs 

folosind parametrii simulărilor 1, respectiv 6. Din Figura 5.15 se constată că modificare 

modificare a rezistent¸ei Rs aduce o îmbunătăt¸ire a caracteristicii lor de frecvent¸ă atât la 

frecvent¸e joase s¸i medii, cât s¸i la fecvent¸e înalte (în cazul Im(Y11). Eroarea relativa globala 

în normă euclidiană fat¸ă de măsurători este de 4% pentru simularea 7 s¸i 2% pentru 

simularea 8. 




Concluzia generală a acestui studiu este că valorile parametrilor Rs, RSi s¸i CSi sunt 

esent¸iale pentru modelarea corectă a inductorului. Rezistent¸a Rs este dependentă de frecvent¸ă 

s¸i puternic afectată de efectele câmpului electromagnetic la frecvent¸e înalte, deci valoarea 

ei influent¸ează caracteristica în toata gama de frecvent¸e. Din simulările efectuate s-a putut 

observa că rezistet¸a RSi s¸i capacitatea CSi substratului influent¸ează comportamentul dispozitivului 

la frecvent¸e înalte. În consecint¸ă, modelul cu parametri concentrat¸i independent¸i 

de frecvent¸ă nu poate da rezultate foarte precise pe o gamă largă de frecvent¸e. 

5.1.2 Modelarea numerică 

Modelarea numerică este următoarea etapă în procesul de modelare electromagnetică a 

inductorului CDST-SP-MIDDLE (Figura 5.16a), care va fi făcută cu ajutorul programului 

Chamy, bazat pe metoda FIT. Această etapă presupune obt¸inerea modelului discretizat pentru 

câmpul electrodinamic din domeniului de calcul de tip EMCE, domeniu care cont¸ine 

90


(a) Geometria dispozitivului în Chamy (b) Ret¸ea de discretizare minimală (planul xy) 

Figura 5.16: Inductorul integrat CDST-SP-MIDDLE 

inductorul s¸i are dimensiunile de 400 microni dupa axele Ox, Oz, s¸i 10+2×725 microni 

dupa axa Oy. 

În funct¸ie de elementele cont¸inute de dispozitivul modelat, respectiv conductoare s¸i 

straturi, programul generează în mod automat o ret¸ea de discretizare minimală (Figura 

5.16b), care trebuie îndesită, în limita resurselor hardware, pentru a obt¸ine rezultate cât mai 

exacte. Se impune, deci, dezvoltarea unei strategii de alegere a ret¸elei de discretizare (ret¸ea 

adaptată). 

În primă fază se va studia discretizarea de-a lungul axei Oy. Ret¸eaua minimală, cu 

10 × 11 × 11, are majoritatea nodurilor de pe axa Oy concentrate în stratul de oxid (Figura 

5.16b). Se vor evalua două strategii de îndesire a ret¸elei, prin adăugare de noduri în straturile 

de Si s¸i Aer (Tabel 5.7). Prima strategie este de a adăuga noduri uniform distribuite, 

iar a doua constă în adăugarea unor noduri distribuite neuniform, în progresie geometrică. 

Aceste noduri sunt mai dese în apropierea planului inductorului, unde câmpul este mai 

intens s¸i mai neuniform, dar mai rare în zona îndepărtată de inductor (Figura 5.17b). 

Nr. Tip discretizare 

Ret¸ea de discretizare 

x y z 

1 minimal 10 11 11 

2 uniform pe y 10 29 11 

3 uniform pe y 10 89 11 

4 neuniform pe y 10 29 11 

Tabelul 5.7: Strategii de alegerea ret¸elei de discretizare 

Din Figura 5.18 se observă că rezultatele sunt mai bune pentru ret¸ele de discretizare cu 

mai multe noduri (ceea ce era de as¸teptat). O a doua concluzie este că distribut¸ia neuniformă 

cu 29 de noduri dă rezulate la fel de bune ca distribut¸ia uniformă cu 89 de noduri. 

Suplimentar, s-a testat cres¸terea numărului de noduri, distribuite în mod neuniform, 

de la 29 la 49, însă rezultatele nu s-au modificat sensibil, deci adăugarea de noi noduri 

91


(a) Uniform distribuite (b) Neuniform distribuite 

(a) Partea reală Y11 

Figura 5.17: Ret¸ea de discretizare pe axa Oy 

(b) Partea imaginară Y11 

Figura 5.18: Caracteristicile de frecvent¸ă pentru diferite distribut¸ii ale nodurilor pe Oy 

nu aduce îmbunătăt¸iri relevante. Din acest motiv, în continuare va fi folosită discretizarea 

neuniformă cu 29 noduri pe axa Oy, fără a specifica explicit acest lucru. 

Pentru discretizarea în planul xOz se vor testa, pe lângă ret¸eaua minimală, două strategii 

cu ret¸ea aproximativ uniformă s¸i una neuniformă, mai exact adaptată, confom Tabelului 

5.8 (în care cazurile vor fi numerotate în continuarea Tabelului 5.7). 

Nr. Tip discretizare 

Ret¸ea de discretizare 

x y z 

4 minimal pe xz 10 29 11 

5 uniform pe xz 27 29 27 

6 adaptat pe xz 23 29 22 

Tabelul 5.8: Strategii de alegerea ret¸elei de discretizare 

92


(a) Minimal (b) Uniform distribuit 


(c) Adaptat 

Figura 5.19: Ret¸ea de discretizare pe axa xz 


Figura 5.20: Caracteristicile de frecvent¸ă pentru diferite ret¸ele în planul xOz 

93


Din rezultate (Figura 5.20), se observă că discretizarea uniformă în planul xOz nu reprezintă 

o solut¸ie acceptabilă. Principala cauză a acestor rezultate foarte slabe o reprezintă 

modificarea nodurilor ret¸elei minimale, care trec prin puncte cheie ale dispozitivului, respectiv 

extremităt¸ile inductorului. Prima concluzie este că orice ret¸ea de discretizare adaptată, 

trebuie să pornească de la distribut¸ia minimală a nodurilor de discretizare. Cazul 6 

t¸ine cont de acestă observat¸ie (Figura 5.19c) s¸i după cum se poate observa în Figura 5.20 

rezultatele pentru această ret¸ea adaptată sunt cele mai bune de până acum, în comparat¸ie cu 

măsurătorile. Ca s¸i în cazul axei Oy, noile noduri din ret¸eaua adaptată au fost adăugate la 

ret¸eaua minimală, mai ales în apropierea inductorului: în progresie geometrică, pe măsura 

depărtării de conductor. Sect¸iunea conductorului a fost împartită în patru celule, de un nod 

plasat în mijlocul acestuia. Un nod intermediar a fost plasat s¸i în mijlocului interstit¸iului 

dintre spire. În continuare, pentru simulările din cazurile 7 s¸i 8 va fi folosită ret¸eaua neu- 



Figura 5.21: Caracteristicile de frecvent¸ă pentru diferite ret¸ele în planul xOz 

niformă, adaptată cu 23 × 29 × 22 noduri. Cazul numărul 8 t¸ine cont de neomogenizarea 

conductivităt¸ii materialului tun1 (stratul via3), considerând conductivitatea sa echivalentă 

de valoare σtun1 = 6e3 S/m. Rezulatele sunt prezentate în Figura 5.21. Se constată o 

îmbunătăt¸ire a caracteristicii de frecvent¸ă, mai ales la frecvent¸e mici s¸i medii, atunci când 

se t¸ie cont de neomogenizarea materialului tun1. 



Figura 5.22: Efectul tehnicii FredHo asupra caracteristicii de frecvent¸ă 

94


Cazul numărul 9 ia în considerare efectul pelicular din conductor, folosind metoda FredHo 

[149]. Rezultatele sunt prezentate în Figura 5.22. Se constată că rezulatele nu sunt 

îmbunătăt¸ite sensibil. 

În Figura 5.23 sunt prezentate comparativ caracteristicile de frecvent¸ă rezultate în urma 

măsurătorilor s¸i cele rezultate în urma simulărilor modelului cu parametri distribuit¸i (Chamy 

nr. 8) s¸i concentrat¸i (SPICE nr. 8). Eroarea medie pătratică relativă, calculată folosind 

, este de circa 2% pentru ambele simulări, SPICE 

norma Frobenius rmsYi simulat−Yi masurat 

maxYi..n masurat 

s¸i Chamy, însă se poate observa că modelul cu parametri distribuit¸i are o comportare mai 

apropiată de măsurători decât modelul cu parametri concentrat¸i, mai ales în pozit¸ia minimului/maximului 

părt¸ilor imaginare Y11 s¸i Y12. Partea imaginară are mare iportant¸ă pracatică 

pentru proiectant, deoarece ea descrie fenomenul de rezonant¸ă s¸i factorul de calitate 

al dispozitivului.Partea imaginară are mare iportant¸ă pracatică pentru proiectant, deoarece 

ea descrie fenomenul de rezonant¸ă s¸i factorul de calitate al dispozitivului. Acest lucru este 

evident¸iat s¸i de Tabelul 5.9 care cont¸ine valorile simulate s¸i cele măsurate pentru diferite 

frecvent¸e s¸i abaterile dintre ele (cu bold erorile cele mai mici). 



Figura 5.23: Caracteristicile de frecvent¸ă Y11: măsurate, simulate ale modelului cu parametri 

concentrat¸i s¸i distribuit¸i 

Studiul prezentat în acest capitol validează procedura de modelare cu parametri distribuit¸i 

propusă de autor în această teză de doctorat. Rezulatele simulării modelului extras se abat 

doar cu 2% fat¸ă de rezulatatele experimentale, ceea ce este pe deplin satisfăcător, conform 

cerint¸elor industriale s¸i preciziei solicitate de proiectant¸ii de circuite integrate. O astfel 

de acuratet¸e este net superioară celei obt¸inută în cadrul proiectelor europene Codestar s¸i 

Chameleon RF. Progresele se datorează atât evolut¸iei performant¸elor componentelor hardware 

ale sistemeleor de calcul (viteză s¸i memorie), dar s¸i dezvoltării unor noi metode de 

modelare s¸i a algoritmilor, precum s¸i programelor (paralele s¸i distribuite) asociate. 

Chiar dacă modelul cu parametri concentrat¸i propus de autor are un ordin de mărime 

al erorii tot de 2%, totus¸i procedura de extract¸ie a sa este mai put¸in robustă. După cum s-a 

văzut, s¸i fundamentarea sa teoretică nu este la fel de solidă ca a modelului cu parametri 

distribuit¸i. 

95


Măsurat 

SPICE 

Chamy 

Frecvent¸a 50MHz 450MHz 40GHz 

Y11 M 0.32999-0.03966j 0.14743-0.17131j 0.0055114+0.00607j 

Y12 M -0.32972+0.04058j -0.14713+0.17165j 0.0005551+0.00398j 

Y11 S 0.28311-0.02670j 0.16602-0.14087j 0.0000179-0.00155j 

Y12 S -0.28310+0.02674j -0.16591+0.14092j -0.0000499+0.00243j 

Y11 C 0.36724-0.04045j 0.19816-0.17535j 0.0009145+0.00716j 

Y12 C -0.36724+0.04047j -0.19805+0.17564j -0.0000624-0.00245j 

Abateri Y11 S − Y11 M -0.0469+0.0130j 0.0186+0.0304j -0.0055-0.0076j 

SPICE Y12 S − Y12 M 0.0466-0.0138j -0.0188-0.0307j -0.0006- 0.0016j 

Abateri Y11 C − Y11 M 0.0373-0.0008j 0.0507-0.0040j -0.0046+0.0011j 

Chamy Y12 C − Y12 M -0.0375-0.0001j -0.0509+ 0.0040j -0.0006-0.0064j 

Tabelul 5.9: Valorile admitant¸elor la diferite frecvent¸e s¸i abaterile lor 



Figura 5.24: Caracteristicile de frecvent¸ă Y12: măsurate, simulate ale modelului cu parametri 

concentrat¸i s¸i distribuit¸i 

5.1.3 Performant¸ele procedurii de extract¸ie a modelului 

Pe lângă acuratet¸e, un alt aspect important al modelării numerice îl reprezintă timpul 

de calcul consumat pentru extract¸ia modelului s¸i necesarul de memorie. În cazul de test 

CDST-SP-MIDDLE, ret¸eaua adaptată cu 23×29×22 noduri a dus la obt¸inerea unui model 

discretizat cu 78363 grade de libertate (DoFs). Timpul de rezolvare pentru un singur sistem 

liniar cu aceste necunoscute complexe a fost este de 34s pe un nod din clusterul ATLAS, 

iar cantitatea de memorie necesară a fost de 3.3GB. 

Algoritmul de rezolvare AFS-VF a avut nevoie de 3 iterat¸ii (Tabelul 5.10) pentru a 

obt¸ine modelul final, care are ordinul q = 7. Implementarea serială a obt¸inut modelul de 

ordin redus în 580s, pe când implementarea paralelă cu două nivele de granularitate a avut 

nevoie doar de 194s, adică s-a obt¸inut cu o accelerare de 3. Implementarea cu un nivel 

de granularitate nu a putut executa acest test deoarece necesarul de memorie (3.3 · 8 = 

96


iterat¸ie 1 2 3 

1e-2 1e-4 4 

ordin 

S 

3 6 7 

′ 3 6 4 

S + S ′ 7 13 17 

Tabelul 5.10: Convergent¸a algoritmului AFS-VF 

5.2. Inductorul spiralat hexagonal - CHRF217 

26.4GB) depăs¸este memoria fizic instalată (24GB). Pentru execut¸ia implementării paralele 

au fost folosite 4 noduri din clusterul Atlas, ceea ce înseamnă că ideal se poate obt¸ine o 

accelerare maximă de valoare 4. Având în vedere accelerarea obt¸inută, se poate spune 

că implementarea paralelă exploatează eficient resursele de calcul. Desigur, accelerarea 

depinde foarte mult de convergent¸a algoritmului respectiv numărul de iterat¸ii s¸i numărul de 

sisteme de rezolvat la fiecare iterat¸ie. 

Concluzia acestei analize este că paralelizarea calculului reduce timpul de execut¸ie s¸i 

permite în consecint¸ă extragerea unor modele mai precise. Dacă timpul de extract¸ie necesar 

pentru procedura paralelă AFS-VF este comparat cu cel init¸ial solicitat de algoritmul VF 

secvential (fără AFS) se constată o scădere a acestui timp de circa 16 ori, atunci când 

se foloses¸te un cluster alcătuit din patru noduri interconectate [150]. Această observat¸ie 

evident¸iază cres¸terea performant¸elor procedurii de modelare electromagnetică. 

5.2 Inductorul spiralat hexagonal - CHRF217 

Problema CHRF217 cont¸ine un inductor spiralat hexagonal ce are un terminal excitat 

în tensiune, iar celălat conectat la masă. Geometria 2D, în coordonate xOz, a dispozitivului 

care provine din fis¸ierul .GDS este prezentată în Figura 5.25 s¸i 5.26. Dispunerea 

straturilor pe axa Oy (Figura 5.1 s¸i Tabelul 5.1) provine din fis¸ierul de tehnologie. Pentru 


Figura 5.25: Problema CHRF217 - Inductor spiralat hexagonal 

97


clasa de probleme CHRF sunt folosite aproape aceleas¸i materiale ca în cazul problemelor 

CODESTAR, în Tabelul 5.11 se găsesc materialele ale căror proprietăt¸i sunt diferite. Dimensiunile 

inductorului spiralat (Figura 5.27) sunt: s = 2µm, w = 13µm, dout = 186µm, 

din = 100µm, p1 = 50µm s¸i p2 = 69µm. Inductorul se află în stratul met4. 

Material Tip µr εr σ [S/m] 



tun1 W-conductor 1 1 5.21 · 10 6 



Tabelul 5.11: Materialele problemelor CHAMELEON 

Figura 5.26: Modelarea geometrică 3D a structurii CHRF217 

Figura 5.27: Dimensiunile inductorului spiralat hexagonal 

98



Modelarea aproximativă se va face folosind acelas¸i model propus in subcapitolul anterior. 

Parametri concentrat¸i ai modelului sunt definit¸i astfel: 


1 

3.23·107 · 1019 · 10−6 13 · 10−6 1 

2.15·10 + 

· 3.1 · 10−6 7 · 315 · 10−6 13 · 10−6 + 

· 0.64 · 10−6 1 

5.21·10 +4 · 

6 · 1 · 10−6 13 · 10−6 1 

5.21·10 + 2 · 

· 13 · 10−6 6 · 1 · 10−6 13 · 10−6 · 20 · 10−6 = 0.782 + 1.76 + 0.0044 + 0.0015 = 2.55Ω 

Rs = 

(5.19) 





• capacitatea stratului de Si: 

Cs = (3 − 1) · (13 · 10 −6 ) 2 · 

Ls = 1.754nH (5.20) 

4.1 · 8.85 · 10−12 

4 · 10 −6 

= 3.066fF , 

COx = 1 

2 · 1338 · 10−6 · 13 · 10 −6 · 

· 4.1 · 8.85 · 10−12 

5 · 10 −6 

= 63.11fF , 

CSi = 1 

2 · (186 · 10−6 ) 2 · 178.820 · 10 −9 

= 3.093fF , 

unde capacitatea substratului pe unitatea de suprafat¸ă Csub = 178.820nF/m 2 ; 


RSi = 

2 

(186 · 10 −6 ) 2 · 6.8 · 10 3 

(5.21) 

(5.22) 

(5.23) 

(5.24) 

= 8.5kΩ , (5.25) 

unde conductant¸a substratului de Si pe unitatea de suprafat¸ă Gsub = 6.8 · 10 3 S/m 2 

99


Nr. Rs [Ω] Ls [nH] Cs [fF] COx [fF] CSi [fF] RSi [kΩ] 

1 2.55 1.754 3.066 63.11 3.093 8.5 

2 5.89 1.754 3.066 63.11 3.093 8.5 


Adâncimea de pătrundere la 60GHz este δ = 0.11µm, astfel că există efect pelicular. 

Raportul dintre semilăt¸imea conductorului s¸i adâncimea de pătrundere este t/2δ = 13.63, 

deci rezistent¸a Rs cres¸te de aproximativ 13 ori la frecvent¸e înalte. Conform procedurii 

aplicate în cazul inductorului pătrat, se adoptă într-una din simulări rezistent¸ă inductorului 

egală cu media geometrică a valorilor limită, adică Rs = 5.89Ω. 

Au fost făcute două teste folosind datele din Tabelul 5.12. Din dispozitivul modelat în 

problema CHRF217, interesează doar bobina hexagonală, element dipolar caracterizat de 

admitant¸a complexă Y11. Se constată din rezultatele simulărilor SPICE (Figura 5.28), ca s¸i 

în cazul inductorului spiralat pătrat, că pentru rezistent¸a Rs nou calculată se obt¸in rezultate 

mai bune, ea fiind mai apropiată de rezistent¸a reală a inductorului de circa 12.5 Ω obt¸inută 

când se t¸ine cont de nomogenitatea trecerii via3. 


Figura 5.28: Simularea modelului aproximativ 1 s¸i 2 - Y11 


Deoarece metoda FIT folosita de Chamy se aplică problemelor cu geometrie rectangulară 

de tip Manhattan, forma conductorului a fost aproximată cu structură de blocuri 

rectangulare prezentată în Figura 5.26 s¸i 5.29. Pentru discretizarea problemei CHRF217 

au fost folosite strategiile dezvoltate în subcapitolul anterior, în final fiind folosită o ret¸ea 

adaptată cu 47 × 21 × 39 noduri (Figura 5.30). 

100


Figura 5.29: Geometria Manhattan a problemei CHRF217 - Vedere în planul xOz 

(a) Planul xOy (b) Planul xOz 

Figura 5.30: Problema CHRF217 - Ret¸eaua de discretizare adaptată 


Figura 5.31: Simularea SPICE s¸i Chamy - Y11 

101


Pentru o modelare numerică corectă, trebuie să se t¸ină cont de neomogenitatea conductivităt¸ii 

trecerii via3, considerând conductivitatea sa echivalentă de valoare σtun1 = 

3e3S/m. În Figura 5.31 sunt prezentate comparativ caracteristicile de frecvent¸ă rezultate în 

urma simulărilor modelului cu parametri distribuit¸i (Chamy) s¸i concentrat¸i (SPICE). 

Se constată, as¸a cum era de as¸teptat, că modelul Chamy obt¸ine rezultate mai bune decât 

modelul SPICE. Concluzia finală a acestui studiu este că modelul cu parametri concentrat¸i 

nu poate modela cu acuratet¸e efectele de înaltă frecvent¸ă, una din principalele cauze fiind 

faptul că nu se t¸ine cont de stratul de nwell care apare în substrat. Eroarea medie părtatică 

globală este de 22% la modelul cu parametri concentrat¸i s¸i 15% la modelul cu parametri 

distribuit¸i, însă modelul cu parametri distribuit¸i mai poate fi îmbunătăt¸it, îndesind ret¸eaua 

de discretizare. 


Modelul discretizat cu ret¸eaua adaptată cu 47 × 21 × 39 noduri, a generat un sistem cu 

209346 grade de libertate. Timpul de rezolvare pentru un astfel de sistem liniar cu necunoscute 

complexe a fost de 198s pe un nod din clusterul ATLAS, iar cantitatea de memorie 

necesară a fost de 12GB. Algoritmul de rezolvare AFS-VF a avut nevoie de 3 iterat¸ii (Ta- 


iterat¸ie 1 2 3 

1e-3 1e-5 4 

ordin 

S 

3 6 10 

′ 3 6 10 

S + S ′ 7 13 23 


belul 5.13) pentru a obt¸ine modelul final, care are ordinul q = 10. Implementarea serială a 

obt¸inut modelul de ordin redus în 4554s. Implementărea cu un singur nivel de granularitate 

nu a putut rezolva această problemă din cauza limitării memoriei. Implementarea paralelă 

cu două nivele de granularitate a avut nevoie doar de 1386s, obt¸inându-se o accelerare de 

3.3. La fel ca în cazul precedent, pentru execut¸ia implementării paralele au fost folosite 4 

noduri din clusterul Atlas. Accelerarea obt¸inută se apropie de accelerarea maximă teoretică, 

deci, se poate spune că implementarea paralelă exploatează s¸i de această dată eficient 

resursele de calcul. 

5.3 Inductoare spiralate cuplate - CHRF201 

Problema CHRF201 cont¸ine două inductoare spiralate pătrate cuplate aflate la distant¸a 

de 14µm. Fiecare inductor are un terminal excitat în tensiune iar celălalt conectat la masă, 

rezultând un element diport de circuit electric. Geometria dispozitiviului este reprezentată 

în Figurile 5.32a) s¸i 5.32b. 

Straturile de material ale dispozitivului sunt dispuse în mod similar cu cele ale inductorului 

hexagonal CHRF217. Cele două inductoare sunt identice, cu câte cinci spire, s¸i 

dimensiunile: s = 3µm, w = 5µm, dout = 300µm, din = 226µm, p1 = 51µm s¸i 

102

5.3. Inductoare spiralate cuplate - CHRF201 


Figura 5.32: Problema CHRF201 - Inductoare spiralate cuplate 

p2 = 91µm, grosimea t = 3.1µm, iar distant¸a dintre inductoare este de h = 14µm. Inductoarele 

se află în stratul met4, iar conductoarele de aduct¸ie în stratul met3. 


Pentru modelarea aproximativă a problemei CHRF201 se vor folosi două modele cu 

parametri concentrat¸i de tip Pi, pentru fiecare inductor, la care se adaugă două elemente: 

un condensator C12, care modelează efectele capacitive apărute între cele două inductoare, 

s¸i o inductivitate mutuală, care modelează cuplajul între cele două inductoare. În cazul 

câmpului electric uniform, capacitatea condensatorului este egală cu C12 = εOx∗S 

, unde 

h 

A = t · dout aria comună spirelor s¸i h distant¸a dintre spire. 

În literatura de specialitate sunt prezentate mai multe metode pentru calculul inductivităt¸ii 

mutuale [21]: 

• formula lui Neumann - inductivitatea mutuală între două conductoare filiforme cu 

m1, respectiv m2 segmente înfăs¸urate în n1 s¸i respectiv n2 spire, se calculează cu 

formula: 

m1 m2 

Mij = n1n2 Lij 

i=1 

j=1 

(5.26) 

unde Lij este inductivitatea part¸ială între segmentele Ci s¸i Cj, calculată astfel: Lij = 

 

µ 

4π 

Ci 

Cj 

dri·drj 

|dRij| ; 

• formularea lui Grover - inductivitatea part¸ială mutuală între două fire paralele are 

expresia: 

Lij = mu 

4π [αsinh−1 

 

α 

 

− βsinh 

d 

−1 

 

β 

− γsinh 

d 

−1 

 

γ 

 

+ δsinh 

d 

−1 

 

δ 

d 

− √ α2 − d2 + β2 − d2 + γ2 − d2 − √ δ2 − d2 (5.27) 

] 

considerând sinh −1 = ln(x + √ x 2 + 1), α = l + m + δ, β = l + δ s¸i γ = m + δ, 

unde l s¸i m lungimile conductoarelor, d distant¸a între conductoare s¸i δ spat¸iul dintre 

conductoare (Figura 5.33); 

103


Figura 5.33: Pozit¸ionarea conductoarelor paralele 

• formularea Kalantarov [151] reduce expresia anterioară la inductivitatea dintre două 

conductoare paralele, identice, de lungime l aflate la distant¸a h = d (Figura 5.33), 

care are expresia: 

M = µl 

2π 

 

ln l + √ l 2 + h 2 

h 

− 

√ l 2 + h 2 

l 

+ h 

 

l 

. (5.28) 

În [151] este prezentată o metodă mai simplă de calcul a inductivităt¸ii mutuale între 

doă inductoare dreptunghiulare, bazată pe teorema celor patru dreptunghiuri. Pentru a 

putea aplica această metodă, în primă fază, se aproximează fiecare bobină cu o înfăs¸urare 

mediană cu dimensiunile: 

• latura medie spirei echivalente 

a = dout + din 

2 

• noua distant¸a între inductoarele mediate 

b = h + dout − din 

2 

= 300 + 226 

2 

300 − 226 

= 14 

2 

= 263µm ; (5.29) 

= 51µm . (5.30) 

Figura 5.34: Problema CHRF201 echivalentă cu inductoare medii 

Problema se va reduce la două inductoare pătrate de latură a aflate la distant¸a b (Figura 

5.34). Conform acestei metode inductivitatea mutuală se calculează ca: 

Mki = Nki − Gki . (5.31) 

104


Dacă circuitele dreptunghiulare considerate k s¸i i nu au port¸iuni care se suprapun, as¸a cum 

este cazul problemei CHRF201, atunci valorile Gki sunt egale cu zero. Mărimea Nki se 

calculează ca sume algebrice de termeni de forma: 

Nk = µlk 

2π (ln2Sk 

lk 

− ϕk) , (5.32) 

unde lk este perimetrul dreptunghiului k, Sk aria sa, iar ϕ mărime ce se determină pe baza 

raportului dintre lungimea s¸i lăt¸imea dreptunghiului (α = L 

l ). 

Astfel, pentru problema CHRF201 avem 

N13 = 1 

[N(123) + N(2) − N(12) − N(23)] . (5.33) 

2 

În Tabelul 5.14 se găsesc valorile calculate ale celor 4 termeni Nki, iar în final inductivitatea 

mutuală dintre cele două înfăs¸urări este M = n1n2N13 = 25 · (−0.04085) = 

1.02125nH. 

ki l [µm] S [µm 2 ] α ϕ N [nH] 

123 1680 151751 2.19 0.0689 -2.9191 

2 628 13413 5.15 0.0438 -1.2691 

12 1154 82582 1.19 0.0739 -2.0532 

23 1154 82582 1.19 0.0802 -2.0532 

Tabelul 5.14: Calculul inductivităt¸ii mutuale 

Revenind la problema init¸ială, inductivitatea mutuală satisface relat¸ia 

M = k Ls1Ls2 . (5.34) 

unde k este coeficientul de cuplaj inductiv. Având inductoarele identice, acest coeficient 

este determinat ca raportul dintre inductivitatea mutuală M s¸i cea proprie Ls (k = M 

Ls ) 

Circuitul echivalent SPICE al inductoarelor cuplate este prezentat în Figura 5.35, iar 

parametri lui se calculează folosind formulele adoptate în subcapitolul anterior: 


Rs = 

1 

3.23·107 · 5034 · 10−6 5 · 10−6 + 

· 3.1 · 10−6 1 

2.15·107 · 142 · 10−6 5 · 10−6 1 

5.21·10 + 2 · 

· 0.64 · 10−6 6 · 1 · 10−6 5 · 10−6 · 4.5 · 10−6(5.35) = 6.93 + 2.06 + 0.0044 + 0.017 = 9Ω 



iar factorul de cuplaj inductiv este k = 1.02125 

13.94 

Ls = 13.94nH (5.36) 

105 

= 0.0732;


Figura 5.35: Circuitul echivalent pentru inductoare integrate cuplate (LTSpice) 



• capacitatea stratului de Si: 

Cs = (5 − 1) · (5 · 10 −6 ) 2 · 

4.1 · 8.85 · 10−12 

4 · 10 −6 

= 0.907fF , 

COx = 1 

2 · 5178 · 10−6 · 5 · 10 −6 · 

· 4.1 · 8.85 · 10−12 

5 · 10 −6 

= 93.941fF , 

CSi = 1 

2 · (300 · 10−6 ) 2 · 178.820 · 10 −9 

= 8.047fF , 

unde capacitatea substratului pe unitatea de suprafat¸ă Csub = 178.820nF/m 2 ; 


RSi = 

(5.37) 

(5.38) 

(5.39) 

2 

(300 · 10−6 ) 2 · 6.8 · 103 (5.40) 

= 3.268kΩ , (5.41) 

unde conductant¸a substratului de Si pe unitatea de suprafat¸ă Gsub = 6.8 · 10 3 S/m 2 ; 

106

• capacitatea condensatorului adăugat între inductoare: 

C12 = 4.1 · 8.85 · 10−12 · 3.1 · 10 −6 · 30010 −6 · 

14 · 10 −6 

= 2.410fF . 


(5.42) 

Adâncimea de pătrundere la 60GHz este δ = 0.11µm, astfel că există efect pelicular. 

Raportul dintre semilăt¸imea conductorului s¸i adâncimea de pătrundere este t/2δ = 13.63, 

deci rezistent¸a Rs cres¸te de aproximativ 13 ori la frecvent¸e înalte. Conform procedurii 

aplicate în cazul inductorului pătrat, se adoptă într-una din simulări rezistent¸ă inductorului 

Rs = 12Ω. 

Nr. Rs [Ω] Ls [nH] Cs [fF] COx [fF] CSi [fF] RSi [kΩ] k C12 fF 

1 9 13.94 0.907 93.941 8.047 3.268 0.0732 2.410 

2 12 13.94 0.907 93.941 8.047 3.268 0.0732 2.410 


Folosind datele din Tabelul 5.15 s¸i circuitul SPICE din Figura 5.35, au fost făcute două 

simulări. Din rezultatele simulărilor (Figura 5.36), se constată că în cazul rezistent¸ei Rs 

nou calculate se obt¸in rezultate mai bune. De asemenea, se mai observă că modelul cu parametri 

concentrat¸i nu poate modela efectele de înaltă frecvent¸ă datorate efectului pelicular, 

curent¸ilor turbionari sau neomogenităt¸ii substratului sau distribuirii spat¸iale a fenomenelor 

inductive, capacitive s¸i rezistive. 


Pentru discretizarea problemei CHRF201 a fost folosită o ret¸ea adaptată cu 62×22×38 

noduri (Figura 5.37). 

Modelarea numerică a t¸inut cont de neomogenitatea materialului trecerii via3, considerând 

conductivitatea σtun1 = 6e3S/m. Rezultatele simulărilor, prezentate în Figura 5.38, 

arată clar superioritatea modelului Chamy, mai ales la frecvent¸e înalte, unde surprinde 

comportarea specifică a caracteristicii de frecvent¸ă a dispozitivului. Modelul cu parametri 

concentrat¸i nu reus¸es¸te să faca acest lucru, nici măcar din punct de vedere calitativ. Eroarea 

medie pătratică globală pentru modelul SPICE este de 20%, pe când modelul Chamy are 

o eroare de 14%. Concluzia este că, în acest caz, numai, un model cu parametri distribuit¸i 

poate modela cu acuratet¸e efectele de înaltă frecvent¸ă. Rezulatatele obt¸inute cu Chamy ar 

fi s¸i mai bune la frecvente mici, dacă s-ar adăuga la model rezistenta de contact, care ar 

face ca Re(Y11) = 1 să coincidă cu cea măsurată la frecvent¸a minimă de 50MHz. 

Rs 

107




Figura 5.36: Simularea modelului aproximativ 1 s¸i 2 - Y11 s¸i Y12 

(a) Planul xOy (b) Planul xOz 

Figura 5.37: Problema CHRF201 - Ret¸eaua de discretizare adaptată 

108




Figura 5.38: Rezultate Chamy s¸i SPICE - Y11 s¸i Y12 - pentru CHRF201 


Figura 5.39: Rezultate Chamy s¸i Fredho - Y11 - pentru CHRF201 

109


În Figurile 5.39 s¸i 5.40 sunt prezentate rezultatele obt¸inute, folosind în Chamy metoda 

Fredho. Se observă că aceeas¸i ret¸ea de discretizare adaptivă, ce generează un sistem linear 

cu acelas¸i număr de grade de libertate, reduce eroarea medie pătratică globală de la 14% la 

10%. Cel mai probabil, rezultatele mai pot fi îmbunătăt¸ite îndesind gridul în planul xOz, 

însă această tehnică este limitată de memoria RAM avută la dispozit¸ie în sistemul de calcul 

pe care se face modelarea. 


Figura 5.40: Rezultate Chamy s¸i Fredho - Y12 - pentru CHRF201 


Folosind ret¸eaua adaptată cu 62 × 22 × 38 noduri, a fost obt¸inut modelul discretizat, un 

sistem cu 283733 grade de libertate. Timpul de rezolvare pentru un astfel de sistem liniar 

cu necunoscute complexe a fost de 324s pe un nod din clusterul ATLAS, iar cantitatea de 

memorie necesară a fost de 16GB. 


iterat¸ie 1 2 3 4 

1e-2 1e-4 4 

ordin 

S 

3 6 12 15 

′ 3 6 12 4 

S + S ′ 7 13 25 29 


Algoritmul de rezolvare AFS-VF a avut nevoie de 4 iterat¸ii (Tabelul 5.16) pentru a 

obt¸ine modelul final, care are ordinul q = 15. Implementarea serială a obt¸inut modelul de 

ordin redus în 9399s. Implementarea paralelă cu două nivele de granularitate a avut nevoie 

doar de 2598s, obt¸inându-se o accelerare de 3.61. Pentru acest test au fost folosite 4 noduri 

din clusterul Atlas. Accelerarea obt¸inută se apropie de accelerarea maximă teoretică, deci, 

se poate spune că implementarea paralelă exploatează s¸i de această dată eficient resursele 

de calcul. 

110

5.4 Concluzii 

5.4. Concluzii 

Studiul celor trei probleme de test reprezintă validarea experimentală a procedurii de 

modelare cu parametri distribuit¸i prezentată în teză, dar, în acelas¸i timp, demonstrează 

eficient¸a folosirii implementărilor paralele propuse de autor. În ceea ce prives¸te modelarea 

cu parametri concentrat¸i, au fost propuse îmbunătăt¸iri pentru un model al inductoarelor 

integrate existent în literatura de specialitate. El a fost validat pentru inductoare pătrate 

s¸i hexagonale. Totus¸i acest model cu parametri concentrat¸i nu reus¸es¸te să modeleze cu 

acuratet¸e efectele de înaltă frecvent¸ă, as¸a cum s-a văzut mai ales la ultima structură de test. 

În schimb, procedura de modelare electromagnetică bazată pe rezolvarea ecuat¸iilor lui 

Maxwell cu FIT permite extragerea în mod robust a unor modele de ordin redus, care au o 

acuratet¸e acceptabilă din punct de vedere industrial, t¸inând cont s¸i de abaterile geoemetriei 

s¸i parametrilor de material, inerente în tehnologiile micro- s¸i nano- electronice s¸i care au 

ordine de mărime de circa 10%. 

111


Concluzii finale s¸i contribut¸ii originale 

CAPITOLUL 6 

Modelarea electromagnetică a componentelor pasive din circuitele integrate de înaltă 

frecvent¸ă (până la 60GHz), folosind metode numerice, se reduce în final la rezolvarea unor 

sisteme de ecuat¸ii algebrice liniare de foarte mari dimensiuni. În bibliotecile matematice 

disponibile, comercial sau în domeniul public, există sute chiar s¸i mii de rutine pentru 

rezolvarea unor astfel de sisteme. Acestea au fost dezvoltate de persoane sau colective cu 

cele mai avansate competente în domeniul matematic s¸i/sau al calculatoarelor. Fiecare din 

aceste rutine este potrivită pentru o anumită clasă de matrice. 

Observând aceasta realitate, obiectivul tezei nu a constat în dezvoltarea unei rutine suplimenatre, 

fat¸ă de cele disponibile, ci a fost acela de a pune la punct o tehnologie eficientă 

de modelare s¸i simulare a bobinelor spiralate din circuitele integrate, care sa poată fi executată 

pe sisteme de calcul multiprocesor cu arhitecturi ierarhice, hibride (cluster, CPU, 

GPU). O astfel de tehnologie este solicitată de proiectant¸ii de circuite integrate de foarte 

înalta frecvent¸ă, angajat¸i de partenerii nos¸tri industriali. 

Eficient¸a diverselor metodele de rezolvare a sistemelor liniare depinde de caracteristicile 

s¸i proprietăt¸ile matricei sistemului. Încercarea de a alege rutinele fără studierea acestor 

caracteristici, ca s¸i paralelizarea automată, fără întelegerea granulat¸iei intrinseci a algoritmului 

de modelare, s-a dovedit a fi sortita es¸ecului. Trebuie să mai remarcam, că proprietăt¸ile 

matricelor obtinut¸e prin discretizarea ecuat¸iilor câmpului electromagnetic sunt în 

strânsă legătură cu modul în care este formulată problema, condit¸iile ei de frontieră s¸i metodele 

numerice folosite pentru discretizare. De regulă, se obtin matrice rare cu aproape 1 

milion de necunoscute. 

Dacă toate acestea au fost stabilite anterior, atunci trebuie, în principiu, identificate din 

bibliotecile matematice, acele rutine potrivite pentru proprietăt¸ile concrete. În perspectivă 

inversă, dacă se alege o metoda directă sau iterativa s¸i de precondit¸ionare recunoscută ca 

fiind foarte eficientă, ar trebui ca atunci când se formulează problema de câmp s¸i se decide 

metoda de discretizare, să se urmarească obt¸inerea proprietăt¸ilor cerute de metoda de 

rezolvare aleasă. Această corelat¸ie între formularea problemei de câmp electromagnetic 

s¸i tehnica de rezolvare numerică de rezolvare a ei, în paralel, presupune cunos¸tint¸e de inginerie 

electrică ce nu sunt la îndemana matematicienilor sau a informaticienilor, care au 

dezvoltat rutinele de rezolvare. Pe de altă parte inginerul, care se ocupă de modelarea electromagnetică, 

trebuie să înteleagă nu doar aspectele fizice s¸i ingineres¸ti, să poată identifica 

113

6. Concluzii finale s¸i contribut¸ii originale 

ipotezele simplificatoare acceptabil, ci să aibă cunos¸tint¸ele de matematică s¸i informatică, 

necesare întelegerii modului de funct¸ionare s¸i utilizare a acestor rutine de rezolvare. 

Tehnologia de modelare electromagnetică a bobineleor spiralate din circuitele integrate 

de înaltă frecvent¸ă, prezentată în teză, a fost pusă la punct s¸i validată experimental folosind 

rezultatele măsurătorilor puse la dispozit¸ie de partenerii nos¸tri industriali, pentru structuri 

de test proiectate s¸i realizate de aces¸tia. Dintre toate alternativele evaluate, în final, s-a 

dovedit a fi cea mai eficientă s¸i precisă, tehnologia care se bazează pe rezolvarea numerică 

a ecuat¸iilor lui Maxwell, cu condit¸ii de frontieră de tip EMCE, folosind metoda FIT 

în domeniul frecvent¸ei s¸i extragând modelul de ordin redus cu tehnica Es¸antionării Adaptive 

a Frecvent¸ei AFS-VF. Ea a fost impelementată pe sistemul hibrid ATLAS, folosind 

tehnicile de paralelizare cele mai potrivite pentru etapele acestei tehnologii. Pentru acesta 

s-au folosit paradigme de programare, adecvate arhitecturii sistemului de calcul: progrmare 

distribuita (MPI pentru cluster), programare paralelă (Open MP, LAPACK pentru 

CPU multicore), dar s¸i programare masiv paralela (CUDA, Open CL pentru GPU). 

Procedurile de modelare electromagnetică dezvoltate în LMN s¸i prezentate în teză au 

condus la accelerarea procesului de 5-10 s¸i chiar de 100 ori, fat¸ă de situat¸ia existentă înainte 

de a începe aceste cercetări. În concluzie, putem afirma fără dubiu, că obiectivele tezei au 

fost pe deplin realizate. 

Principalele contribut¸ii originale aduse prin teza de doctorat: 

1. Realizarea unui studiu critic asupra metodelor de modelare elctromagnetică a inductoarelor 

din circuitelele integrate de înaltă frecvent¸ă. 

2. Modelarea folosind un program dezvoltat în cadrul LMN (Chamy) s¸i un program 

comercial (COMSOL) a unui set de structuri inductive de test, virtuale s¸i reale, în 

vederea identificarii celei mai eficiente tehnologii TCAD de modelare electromagnetică. 

Pe nivelul inferior, cele două programe au fost folosite doar pentru generarea 

matricelor sistemului liniar, care au fost rezolvate apoi cu diverse metode, pe sisteme 

de calcul multiprocesor. Pe nivelul cel mai înalt, frecvent¸ele, pentru care se 

realizează simularea, au fost generate de un algoritm adaptiv distribuit implementat 

de autor. S-au identificat s¸i caracterizat subdomeniile omogene ale problemei de 

câmp s¸i condit¸iile ei de frontieră, de tip EMCE, rezultând terminalele electrice s¸i 

cele magnetice (hooks), prin care dispozitivele analizate interactionează cu mediul 

electromagnetic zgomotos. 

3. S-a studiat eficient¸a diferitelor metode directe s¸i iterative cu s¸i fără preconditionare, 

pentru rezolvarea în paralel (pe sisteme cu arhitecturi ierarhice hibride: cluster, CPU, 

GPU) a sistemelor de mari dimensiuni, cu matrice rare generate prin discretizarea 

ecuat¸iilor câmpului elctromagnetic s¸i s-au identificat solut.iile cele mai eficiente pentru 

tehnologia de modelare propusă. Acestea au fost incluse în programul TCAD 

numit Chamy, dezvoltat în cadrul LMN. Testele efectuate pe sistemul de calcul multiprocesor 

ATLAS au dovedit o o accelerare substant¸iala¸ a procesului de modelare. 

4. A fost dezvoltat, în MATLAB, un program distribuit de extragerea a modelului de 

ordin redus. Metoda cea mai eficientă s-a dovedit a fi AFS-VF - Es¸antionarea Adaptivă 

a Frecvent¸elor cu Vector Fitting - AFS-VF. Acestea au fost incluse în programul 

114

TCAD Chamy, dezvoltat de echipa LMN. Chiar dacă numărul de terminale ale componenetelor 

inductive este redus (3 -10), modelul original are sute de mii de grade de 

libertate, ceea ce evidentiază complexitatea fenomenelor interne (nu numai inductive 

ci s¸i rezistive s¸i capacitive distribuite), dar face ca acest model să fie de neutilizat fără 

proiectant¸i. Metoda AFS-VF a reusit să reducă numarul variabilelor de stare la 5-20, 

ceea ce evidentază eficient¸a sa extraordinară. 

5. A fost modelată structura de test CDST-SP-MIDDLE, constând dintr-o bobină spiralată 

cu spire pătrate, realizată în tehnologia CMOS. Rezultatele au fost validate prin 

comparat¸ie cu rezultatele măsurătorilor efectuate de partenerii nos¸tri industriali. Fat¸ă 

de rularea secvent¸ială, folosind 4 noduri din cluster, s-a obt¸inut o accelerare de 3. 

6. A fost modelată structura de test CHRF217, constând dintr-o bobină spiralată cu 

spire hexagonale realizată în tehnologia CMOS. Rezultatele au fost validate prin 

comparat¸ie cu rezultatele măsurătorilor efectuate de partenerii nos¸tri industriali. 

7. A fost modelată structura de test CHRF201, constând dintr-o pereche de bobine cuplate, 

realizate în tehnologia CMOS. Rezultatele au fost validate prin comparat¸ie cu 

rezultatele măsurătorilor efectuate de partenerii nos¸tri industriali. Rezultatele numerice 

au acuratet¸e mai mare decât cele obtinut¸e init¸ial, în cadrul proiecteleor, s¸i sunt 

obt¸inute mult mai rapid. 

Contribut¸iile orginale aduse de autor au fost comunicate în lucrări publicate împreună 

cu alt¸i membri ai echipei de cercetare LMN. 

Lista lucrărilor publicate de autor 

1. I. Andrei, E. Căciulan, D. Dan, G. Ciuprina and D. Ioan, ”Matlab Based Parallel 

Deterministic Optimization of the Loneys Solenoid”, Acta Electrotehnica – Special 

Issue – Selected papers from the 3 rd International Conference of Modern Power Systems 

(MPS 2010), Vol. 51, No. 5, pp. 9-14, Mediamira Science Publisher, Cluj- 

Napoca, Romania, 2010, ISSN 1841-3323. 

2. I. Andrei, E. Căciulan and D. Dan, ”Parallel and Distributed Computations Applied 

to the Deterministic Optimization of the Loney’s Solenoid”, Proceedings of the 11 th 

International Workshop on Optimization and Inverse Problems in Electromagnetism 

(OIPE 2010), pp:90-91, September 14-18, 2010, Sofia, Bulgaria, ISBN 978-954- 

438-855-3. 

3. G. Ciuprina, D. Ioan, I.A. Lazăr, M.I. Andrei, ”Adaptive Frequency Sampling for the 

Effective Extraction of Reduced Models for HF-ICs Passive Components”, Proceedings 

of National Symposium of Theoretical Electrical Engineering (SNET 2010), 

Bucharest, 2010, ISSN 2067-4147. 

4. I.A. Lazăr, M.I. Andrei, E. Căciulan, G. Ciuprina and D. Ioan, ”Parallel algorithms 

for the efficient extraction of fitting based reduced order models”, Proceedings of the 

7 th International Symposium on Advanced Topics in Electrical Engineering (ATEE 

2011), pp:1-6, 12-14 May, Bucharest, 2011, ISSN: 2068-7966 

115

6. Concluzii finale s¸i contribut¸ii originale 

5. D. Ioan, G. Ciuprina, C.B. Dit¸ă and M.I. Andrei, ”Electromagnetic Models of Integrated 

Circuits with Coupled Magnetic Circuits”, Proceedings of the International 

Conference on Electromagnetics in Advanced Applications (ICEAA 2012), September 

2-7, 2012, Cape Town, South Africa. 

6. G. Ciuprina, D. Ioan, C.B. Dit¸ă and M.I. Andrei, ”Frequency Dependent Models for 

Planar On-Chip Inductors”, Book of Abstracts, Scientific Computing in Electrical 

Engineering (SCEE 2012), 11-14 September, 2012, Zurich, Switzerland. 

7. G. Ciuprina, D. Ioan, C.B. Dit¸ă and M.I. Andrei, ” Optimal terminals identification 

for domain partitioning of electro-magnetic circuit elements”, Proceedings of 12 th 

International Workshop on Optimization and Inverse Problems in Electromagnetism 

(OIPE 2012), 19-21 September, 2012, Ghent, Belgium. 

Lucrări trimise pentru publicare: 

1. G. Ciuprina, C.B. Dit¸ă, M.I. Andrei and D. Ioan, ”Hierarchical Sparse Circuits for 

the Modeling of Homogeneous Domains in High Frequency ICs”, în curs de publicare 

la Editura Politehnica Press 

2. M.I. Andrei and C.B. Dit¸ă, ”Using Multiprocessors Systems for Electromagnetic 

Modelling of Spiral Inductors”, lucrare trimisă pentru Buletinul UPB, ID 1698. 

Lucrări în pregătire: 

1. Parallel extraction of reduced order models for integrated inductors by AFS-VF 

2. Parallel iterative electromagnetic modeling of spiral inductors 

116

Definire schedulere 

ANEXA A 

În această anexă se prezintă modul în care se pot defini schedulere pentru folosirea MATLAB 

paralel (versiunea 2012a). Scheduler-ul ”local” este predefinit s¸i permite folosirea calculului paralel 

prin MATLAB PCT. ”JobManager”-ul este cel livrat cu MATLAB DCS, iar ”Torque” este un 

scheduler open-source [152]. 

Observat¸ia 2 Înainte de a defini schedulere trebuie pornit¸i workersii din Control Center (cc.lmn.pub.ro). 

A.1 Definire scheduler JobManager 

Pentru a defini un Job Manager (1 worker = 1 core) merget¸i la meniul Parallel −→ Manage 

Cluster Profiles −→ New −→ MATLAB Job Scheduler (MJS). Putet¸i redenumi numele schedulerului 

(click dreapta −→ Rename). Butonul Edit permite accesul la modificarea scheduler-ului nou 

definit. Modificat¸i câmpurile astfel: 

• Hostname of the machine where MJS is running: 

tau-ib:28000 

• The name of MJS: 

Greeks 

• Range of number of workers to run job: 

[1 32] 

Numărul maxim de workersi poate fi cel mult 64 sau numărul de workers¸i pornit¸i, altfel primit¸i 

eroare la Validare. Done, apoi revenit¸i s¸i selectat¸i scheduler-ul nou definit s¸i validati-l (click dreapta 

Validate). 

117

A. Definire schedulere 

A.2 Definire scheduler Torque 

Pentru a defini un Torque (1 worker = 1 nod) merget¸i la meniul Parallel −→ Manage Cluster 

Profiles −→ New-¿ Torque. Putet¸i redenumi numele scheduler-ului (click dreapta −→ Rename). 

Butonul Edit permite accesul la modificarea scheduler-ului nou definit. Modificat¸i câmpurile astfel: 

• Number of workers available on cluster: 

4 (num\u arul de noduri pornite) 

• Root of MATLAB installation for wrokers: 

/usr/local/matlab 

• Range of number of workers to run job: 

[1 32] sau puteti lasa necompletat 

• Remote shell command to call UNIX: 

ssh 

• Remote copy command: 

scp 

Administrarea scheduler-ului Torque se poate face executaând comenzi numai pe nodul Tau. 

Comanda: 

pbsnodes 

listează toate nodurile. Interesează doar opt¸iunea STATE, care poate fi DOWN (atunci când schedulerul 

Torque nu îl consideră worker), FREE (starea normală) sau OFFLINE. 

Pentru a scoate un nod din grupul celor care primesc joburi Torque trebuie marcat ca OFFLINE: 

sudo pbsnodes -o nume_nod.lmn.pub.ro 

unde nume nod se înlocuies¸te cu numele nodului (Beta, Delta, ...). 

Pentru a activa un nod ca worker (FREE) se execută comanda: 

sudo pbsnodes -c nume_nod.lmn.pub.ro 

118

AFS-VF paralel 

În această anexă sunt prezentate funct¸iile ce formează algoritmul AFS-VF paralel. 

B.1 Cod pm sys2snp vf3 v*.m 

ANEXA B 

%% ============================ 

% Aceasta este versiunea paralela a functiei "sys2snp_vf3" 

%scrisa de dna. prof. Gabriela Ciuprina 

% Mihail-Iulian ANDREI 

% iulian@lmn.pub.ro 

% Ultima verificare 18 Iul 2012 

%% ============================ 

function [frequency_response,frequency_data,trfct] = pm_sys2snp_vf3_v3 ... 

(matrices, frequency_data, method, snp_info, avfitParams, sched, ... 

sched_type, nr_workers, solver_used); 

%% No of terminals 

B = matrices.nominal.B; 

trfct = []; 

m = size(B,2); 

nofreq = length(frequency_data.frequency_points); % no of frequency points 

% check is the frequencies are in rad/sec 

switch lower(frequency_data.frequency_unit) 

case ’hz’ 

omega = 2*pi*frequency_data.frequency_points; 

case ’khz’ 

omega = 2*pi*frequency_data.frequency_points*1e3; 

case ’mhz’ 


case ’ghz’ 


otherwise % rad/sec 

119

B. AFS-VF paralel 

end 

omega = frequency_data.frequency_points; 

%% ====================Matlapool================================= 

matlabpool (’open’, sched, nr_workers, ’FileDependencies’,... 

{’compute_list_frequencies_v2.m’ ’compute_list_frequencies_v3.m’}); 

sourcespath = genpath(’/home/iulian/library_sol/taux2’); 

addpath(sourcespath); 

% matlabpool (’open’, sched, nr_workers); 

tic; 

tt = cputime; 

%% %%%%%%%%%%%%%%%%%%%%%%%%%% COMPUTE THE ANSWER %%%%%%%%%%%%%%%%%%% 

disp(’Compute the answer ...... wait’); 

if frequency_data.AFS.flag 

doafs = 1; 

else 

doafs = 0; 

end 

if isempty(frequency_data.AFS.max) 

doafs = 0; 

elseif frequency_data.AFS.max == 0 

doafs = 0; 

end 

if ˜doafs 

disp(’Compute the answer for exactly the frequencies’); 

% compute the answer for exactly the frequencies that are in 

% frequency_data.frequency_points 

if m == 1 

frequency_response = zeros(nofreq,1); %SISO 

else 

frequency_response = zeros(m,m,nofreq); %MIMO 

end 

for k = 1:nofreq 

y = compute_one_frequency(matrices,method,omega(k)); 

if m == 1 % SISO 

if ˜isempty(y) 

frequency_response(k) = y; 

else 

frequency_response(k) = 0; 

end 

else % MIMO 

if ˜isempty(y) 

frequency_response(:,:,k) = y; 

else 

120

B.1. Cod pm sys2snp vf3 v*.m 

frequency_response(:,:,k) = 0; 

end 

end 

end 

else 

disp(’Adaptive Frequency Sampling (AFS) is used. Iulian’); 

listf = sort(omega); 

%==============Crearea listei de frevente=========================== 

listf_new = frequency_list(omega); 

if strcmp(solver_used,’umfpack’) 

fprintf(’=======>umfpack used \n’); 

yf = compute_list_frequencies_v2(matrices, listf_new,... 

m, nr_workers, sched_type); 

elseif strcmp(solver_used,’taucs’) 

fprintf(’=======>taucs used \n’); 

yf = compute_list_frequencies_v3(matrices, listf_new, m,... 

nr_workers, sched_type); 

else 

fprintf(’=======>ERROR Unknown solver \n’); 

end 

matrices.nominal 

if m ==1 

i_2 = 0; 

for i_1=1:2:length(yf) 

i_2=i_2+1; 

yf_1(i_2) = yf(i_1); 

end 

i_2 = 0; 


i_2=i_2+1; 

yf_2(i_2) = yf(i_1); 

end 

resp = yf_1; 

resp_rest = yf_2; 

else 

i_2 = 0; 


i_2=i_2+1; 

yf_1(:,:,i_2) = yf(:,:,i_1); 

end 

i_2 = 0; 


i_2=i_2+1; 

yf_2(:,:,i_2) = yf(:,:,i_1); 

121


end 

end 

resp = yf_1; 

resp_rest = yf_2; 

[listf,listy,trfct] = do_afs_nerecursiv(omega, resp, ... 

frequency_data.AFS, matrices, method, snp_info, avfitParams, ... 

nr_workers, resp_rest, sched_type, solver_used); 

nop = length(listf); 

frequency_response = listy; 

if m == 1 

frequency_response = conj(frequency_response’); 

end 

frequency_data.frequency_points = listf/(2*pi)*1e-9; 

frequency_data.frequency_unit = ’GHz’; 

if nop >= frequency_data.AFS.max 

fprintf(’************** WARNING **************: ... 

afs - max no of iterations = %d reached \n’, frequency_data.AFS.max); 

fprintf(’No of computed points = %d \n’,nop); 

end 

nofreq = length(listf); 

end 

t2=toc; 

tt2 = cputime; 

fprintf(’Time for computing frequency response = %e \n’, t2); 

fprintf(’Time for computing frequency response = %e \n’, tt2-tt); 

fprintf(’Number of computed frequencies = %d \n’, nofreq); 

disp(’sys2snp - FINISHED’); 

matlabpool close; 

end 

%% do_afs_nerecursiv Function 

function [listx,listy,trfct] = do_afs_nerecursiv(listx, listy,... 

AFSinfo, matrices, method, snp_info, avfitParams, nr_workers, ... 

resp_rest, sched_type, solver_used); 

lx = length(listx); 

interval_flags = ones(1,lx-1); 

% 1 inseamna interval "verde", trebuie pus 

% in interiorul lui un punct 

no_test = nnz(interval_flags); 

idx_iter = 0; 

flag_ordin = 0; 

mm = size(matrices.nominal.B,2); 

iteratie = 0; 

122

while and(lx 1 

old_poles = poles; 

old_residues = residues; 

old_kinf = kinf; 

old_prop = prop; 

end 

frequency_data.frequency_unit = freq_unit; 

frequency_data.frequency_points = frequency_points; 

123


response = value; 

avfitParams.idx = idx_iter; 

transferFunction = auto_vfit3_fromfreqdata(frequency_data,... 

response,snp_info,avfitParams); 

ordin(idx_iter) = transferFunction.order; 

poles = transferFunction.poles; 

residues = transferFunction.residues; 

kinf = transferFunction.kinf; 

prop = transferFunction.prop; 

if idx_iter > 1 

if ordin(idx_iter) == ordin(idx_iter - 1) 


end 

end 

end 

%% =======================Partea paralela====== 

idx_2 = 0; 

test_yinterpp = []; 

for idx_1=1:lx-1 

if interval_flags(idx_1) ˜= 0 

idx_2 = idx_2+1; 

x1 = listx(idx_1); 

x2 = listx(idx_1+1); 

if mm == 1 % SISO 

y1 = listy(idx_1); 

y2 = listy(idx_1+1); 

else 

y1 = listy(:,:,idx_1); 

y2 = listy(:,:,idx_1+1); 

end 

if strcmpi(AFSinfo.type,’vfitlinf’)% 

test_omega(idx_2) = (x1+x2)/2; 

if mm == 1 %SISO 

yinterp = 0; 

omega_crt = test_omega(idx_2); 

for k2 = 1:transferFunction.order 

yinterp = yinterp + residues(k2)/... 

(1i*omega_crt - poles(k2)); 

end 

yinterp = yinterp + kinf + 1i*omega_crt*prop; 

test_yinterpp(idx_2) = yinterp; 

else 

yinterp = zeros(mm,mm); 

omega_crt = test_omega(idx_2); 

for k2 = 1:transferFunction.order 

124

end 

end 

end 

end 


yinterp = yinterp + residues(:,:,k2)./... 

(1i*omega_crt - poles(k2)); 

end 

yinterp = yinterp + kinf + 1i*omega_crt*prop; 

%yinterp = reshape(yinterp,mm,mm); 

test_yinterpp = [test_yinterpp yinterp]; 

if mm == 1 

test_yinterp = test_yinterpp; 

else 

idx_2 = 0; 

for idx_1=1:2:length(test_yinterpp) 

idx_2 = idx_2+1; 

test_yinterp(:,1,idx_2) = test_yinterpp(:,idx_1); 

test_yinterp(:,2,idx_2) = test_yinterpp(:,idx_1+1); 

end 

end 

if iteratie == 1 

test_resp = resp_rest 

else 

if strcmp(solver_used,’umfpack’) 

fprintf(’=======>umfpack used \n’); 

test_resp = compute_list_frequencies_v2 (matrices,... 

test_omega, mm, nr_workers, sched_type); 

elseif strcmp(solver_used,’taucs’) 

fprintf(’=======>taucs used \n’); 

test_resp = compute_list_frequencies_v3 (matrices,... 

test_omega, mm, nr_workers, sched_type); 

else 

fprintf(’=======>ERROR Unknown solver \n’); 

end 

end 

for idx_1=1:length(test_resp) 

if interval_flags(idx_1) ˜= 0 

if mm == 1 

norm1 = norm(test_resp(idx_1)-test_yinterp... 

(idx_1),’fro’); 

norm2 = norm(test_resp(idx_1),’fro’); 

if ãnd(AFSinfo.err*norm2 < eps, norm1 < eps) 

if norm1 > AFSinfo.err*norm2 

flag_test(idx_1) = 1; 

125


end 

end 

end 

else 

norm1 = norm(test_resp(:,:,idx_1)-test_yinterp... 

(:,:,idx_1),’fro’); 

norm2 = norm(test_resp(:,:,idx_1),’fro’); 

if ãnd(AFSinfo.err*norm2 < eps, norm1 < eps) 

if norm1 > AFSinfo.err*norm2 

flag_test(idx_1) = 1; 

end 

end 

end 

end 

listx_test = test_omega; 

listy_test = test_resp; 

%=======================Sfarsit Partea paralela====== 

%% 

% asambleaza noua lista de frecventa si flagurile intervalelor 

lx_new = lx + no_test; 

listx_new = zeros(1,lx_new); 


listy_new = zeros(1, lx_new); 

else 

listy_new = zeros(mm,mm,lx_new); 

end 

interval_flags_new = zeros(1,lx_new - 1); 

idx = 0; 

idx_test = 0; 

for k = 1:lx-1 

if interval_flags(k) == 1 

% adauga capatul din stanga si pct intermediar 

idx_test = idx_test + 1; 

idx = idx + 1; 

listx_new(idx) = listx(k); 


listy_new(idx) = listy(k); 

else 

listy_new(:,:,idx) = listy(:,:,k); 

end 

interval_flags_new(idx) = flag_test(idx_test); 

% flagul acestui noi interval depinde de flagul pct de test 


listx_new(idx) = listx_test(idx_test); 


listy_new(idx) = listy_test(idx_test); 

126

end 


else 

listy_new(:,:,idx) = listy_test(:,:,idx_test); 

end 

interval_flags_new(idx) = flag_test(idx_test); 

else % pastreaza doar capatul din stanga 


listx_new(idx) = listx(k); 


listy_new(idx) = listy(k); 

else 

listy_new(:,:,idx) = listy(:,:,k); 

end 

interval_flags_new(idx) = 0; 

% acest interval nu a fost si nu va mai fi divizat 

end 

% adauga ultimul punct 


listx_new(idx) = listx(lx); 


listy_new(idx) = listy(lx); 

else 

listy_new(:,:,idx) = listy(:,:,lx); 

end 

lx = lx_new; 

listx = listx_new; 

listy = listy_new; 

interval_flags = interval_flags_new; 

no_test = nnz(interval_flags); 

if flag_ordin == 1 

if no_test ˜= 0 

er_poles = norm(old_poles - poles)/norm(poles); 

er_tf = snp_info.tol_poles; 

if er_poles < er_tf 

no_test = 0; 

% se va opri, atentie ultimul vfit e... 

% facut pe penultimul set de puncte 

disp(’ =============================... 

========================================================= 

disp(’ - STOP DUE TO THE UNCHANGE OF... 

THE REDUCED ORDER MODEL FOR TWO CONSECUTIVE ITERATIONS - 

disp(’ - and relative difference of ... 

the poles vector less than 1 % - ’); 

disp(’ =============================... 

========================================================= 

else 

127


end 

end 

end 

end 


%%%% vector fit final + sinteza 

frequency_data.frequency_unit = ’rad/s’; 

frequency_data.frequency_points = listx; 

response = listy; 

avfitParams.idx = idx_iter+1; 

if mm == 1 

response = conj(response’); 

end 

%avfitParams.minOrder = 1; 

trfct = auto_vfit3_fromfreqdata(... 

frequency_data,response,snp_info,avfitParams); 

if or(strcmpi(AFSinfo.type,’vfit’),strcmpi(AFSinfo.type,’vfitlinf’)) 

disp(’ordin’); 

disp(ordin); 

end 

disp(’nr puncte noi evaluate’); 

disp(nr_pct_noi_testate); 

disp(’nr total puncte’); 

disp(nr_pct_testate); 

disp(’Polii functiei de transfer pentru modelul final’); 

disp(trfct.poles); 

end 

B.2 Cod compute list frequencies v*.m 

%% ============================ 



% Ultima verificare 22 Sep 2011 

% testat pe Matlab 2011 

% solver folosit umfpack 

%% ============================ 

function [y] = compute_list_frequencies_v2(matrices, list_test, mm, ... 

nr_workers, sched_type) 

% y - vectorul ce retine raspunsul obtinut in urma rezolvarii sistemelor 

% matrices - contine matricele sistemului de semi-stare (C,G,B,L,D) 

% list_test - contine lista frecventelor pentru care trebuie rezolvat 

128

% sistemul (de fapt lista contine 2*pi*f) 

% mm - numarul de intrari 

% nr_workers - numarul de workersi 

B.2. Cod compute list frequencies v*.m 

fprintf(’---------------compute_list_frequencies_v2--------------------’); 

% matricele sistemului de semi-stare 

n = length(list_test); 

C = matrices.nominal.C; 

G = matrices.nominal.G; 

B = matrices.nominal.B; 

L = matrices.nominal.L; 

D = matrices.nominal.D; 

tic; 

%% Partea paralela 

spmd 

res =[]; 

res_frec =[]; 

% In cazul folosirii scheduler-ului "Torque" numarul 

% de threads-uri se seteaza pe numarul de core-uri disponibile (8), 

% in cazul scheduler-ului "Jobmanager" numarul de threads-uri 

% ramane setat pe 1. 

sched_type_lab = sched_type 

if strcmp(sched_type_lab,’Torque’) 

maxNumCompThreads(8); 


else 



end 

maxNumCompThreads 

%% Distributia frecventelor 

list_testt = list_test; %aduce lista de frecvente in memoria workersilor 

dist = codistributor1d(); % stabilirea schemei de distributie 

% distributia frecventelor 

list_test_distributed = codistributed (list_testt); 

% crearea unui vector local pe fiecare worker, care contine 

% una sau mai multe frecvente primite in urma distributiei frecventelor 

list_test_local = getLocalPart(list_test_distributed); 

%% Rezolvarea sistemelor 

for i=1:1:length(list_test_local) 

K = 1i*list_test_local(i)*C+G; 

tic 

129


end 

toc 

end 

x = K\B; 

toc 

xx = L*x+D; 

res = [res xx]; 

res_frec = [res_frec list_test_local(i)]; 

%% Asamblarea raspunsului 

end 

% Aducerea raspunsului in spatiul local 

ff=[]; 

fff=[]; 

for i=1:nr_workers 

ff = [ff res{i}]; 

fff = [fff res_frec{i}]; 

end 

% Asamblarea raspunsului sub forma de vector de matrice 

y= []; 

k=0; 

if mm == 1 

for i=1:n 

y(i) = ff(1,i); 

end 

else 

for i=1:2:2*n 

k=k+1; 

y(1,1,k) = ff(1,i); 

y(1,2,k) = ff(1,i+1); 

y(2,1,k) = ff(2,i); 

y(2,2,k) = ff(2,i+1); 

end 

end 

fprintf(’---------------END compute_list_frequencies_v2---------’); 

%% Eliberarea memoriei 

% Stergerea tuturor variabilelor folosite in aceasta functie 

clear functions 

B.3 Funct¸ie profilare 

Cu ajutorul acestei funct¸ii se pot măsura timpii de execut¸ie ai unei alte funt¸ii atât cei paraleli, cât s¸i 

cei secvent¸iali, folosind profiler-ul MATLAB. 

130

%%%%%%%%%%%%%%%%%%%%%%% 

%% Mihail-Iulian ANDREI 


% 28 Jun 2011 

%%%%%%%%%%%%%%%%%%%%%%% 

B.3. Funct¸ie profilare 

%% Instructions 

% Step 1: put ’profile on -timer real’ before profiled function. 

% Step 2: put ’profile off’ 

% ’profiled_info = profile(’info’);’ 

% after profiled function. 

% Step 3: assign the name of profiled function ’func_name = ’name_of_your_fun 

% Step 4: call this function ’t = profile_function(func_name, profiled_info); 

% WARNING: If the following message is received ’The profiler has already 

% been started. TIMER cannot be changed.’ call ’profile off’ in command 

% line of MATLAB. 

function [t_profile] = profile_function (func_name, profiled_info); 

for i=1:length(profiled_info.FunctionTable) 

if strcmpi(profiled_info.FunctionTable(i).FunctionName, func_name) 

t_profile = profiled_info.FunctionTable(i).TotalTime; 

end 

end 

clear functions; 

end 

131


Solver iterativ paralel GPU 

ANEXA C 

Această anexă cont¸ine suita de programe ce ofera accesul la solvere iterative paralele cu GPU. 

C.1 Readme file 

CUDA Programs 

1. Requirements 

- Matlab 

- CUDA Driver (and additional software) 

- CUDA (tested on 4.1 version) along with Thrust 1.5 

- CUSP library 

- gcc ver. 3.6 (see specifications for Matlab Mex if you want to use other 

version 

and modify "make_install.m" file) 

2. Install 

In the "make_install.m" file, specify the path of "nvcc" compiler for 

every command and the path for CUDA libraries. Then, execute 

"make_install.m" file. 

3. Using CUDA Programs 

Include the CUDA Programs folder to your Matlab sources, by adding 

the following code to your programs: 

sourcespath = genpath(’specify you PATH to cuda_programs’); 


You can call iterative solvers by this command: 

x = iterative_solver (A, b, no_it, rel_tol, solver_used); 

where 

x - solution 

A - Coefficient matrix A (A must be sparse real or complex) 

b - right hand side b 

133

C. Solver iterativ paralel GPU 

no_it - number of iterations 

rel_tol - tolerance 

solver_used - choose solver: 

1 - GMRES 

2 - GMRES with PRECONDITIONER 

3 - BiCGstab 

4 - CG 

OBS: For GMRES and GMRES with PRECONDITIONER you can modify the 

restart value and after run "make_install.m" file. See cuda files 

for more details about monitor. 

4. Uninstall 

Remove all files. 

C.2 Installation file 

%============================ 

%Mihail-Iulian ANDREI 


% Last check 24 Feb 2012 

%============================ 

%% Run this m-file to install all functions 

current_path = pwd; 

%% Complie solver files 

install_folder = strcat(current_path, ’/cuda_programs/solvers’); 

chdir(install_folder); 

%%Matlab 2011 

%system(sprintf(’/home/iulian/cuda_local/cuda/bin/nvcc ... 

--compiler-bindir /usr/lib64/ccache/gcc34 -I"%s/extern/include"... 

--cuda "solver_complex_mex.cu" --output-file "solver_complex_mex.cpp"’... 

, matlabroot)); 

%mex -I/home/iulian/cuda_local/cuda/include/ 

-L/home/iulian/cuda_local/cuda/lib64 -lcudart -lcusparse 

-largeArrayDims solver_complex_mex.cpp 

%%Matlab 2012 

% system(sprintf(’/home/iulian/cuda_41/cuda/bin/nvcc 

-I"%s/extern/include" --cuda "solver_complex_mex.cu" 

--output-file "solver_complex_mex.cpp"’, matlabroot)); 

%mex -I/home/iulian/cuda_41/cuda/include/ 

-L/home/iulian/cuda_41/cuda/lib64 -lcudart -lcusparse 

-largeArrayDims solver_complex_mex.cpp 

%%Matlab 2012, Cuda 4.1, Cusp 0.3.0 

134

C.2. Installation file 

system(sprintf(’/usr/local/cuda/bin/nvcc -I"%s/extern/include" 

--cuda "solver_complex_mex.cu" --output-file "solver_complex_mex.cpp"’ 

, matlabroot)); 

mex -I/usr/local/cuda/include/ -L/usr/local/cuda/lib64 -lcudart 

-lcusparse -largeArrayDims solver_complex_mex.cpp 

fprintf(’----------->Complex solver DONEreal solver DONEsolvers DONE


C.3 Example file 

clear all; 

clc; 

%% Add source programs path 

sourcespath = genpath(’/home/iulian/cuda_solvers_poland/cuda_programs’); 


%% Load matrices from a file 

chdir(’/home/iulian/cuda_solvers_poland/matrices’); 

load ’utm300.mat’; 

chdir(’..’); 

%% Data 

% Coefficient matrix A and right hand side b (Ax=b) 

A=Problem.A; 

b = Problem.b; 

%% Choosing solver 

% 1 - GMRES 

% 2 - GMRES with PRECONDITIONER 

% 3 - BiCGstab 

% 4 - CG 

n=length(A); 

solver_used = 1; 

k=1; 

no_it = n*k; 

rel_tol = 1e-11; 

%% Solver from MATLAB 

tic 

%x0= bicgstab(A,b, rel_tol, no_it); 

%x0= gmres(A,b, [], rel_tol, no_it); 

toc 

%% GMRES solver with CUDA 

x1 = iterative_solver (A, b, no_it, rel_tol, solver_used); 

%% Compute norm 

%norm(b-A*x0)/norm(b) 

norm(b-A*x1)/norm(b) 

C.4 Solver call file 

%% ============================ 

136



% Last check 02 July 2012 

%% ============================ 

C.4. Solver call file 

function [x] = iterative_solver (A, b, no_it, rel_tol, solver_used, M) 

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 

% solves Ax=b 

%%Input data 

% A - coeffcient matrix 

% b - vector 

% no_it - number of iterations 

% rel_tol - tolerance 

% solver_used - 1 GMRES with restart 

% 2 Preconditioned GMRES with restart 

% 3 BiCGSTAB 

% 4 Conjugate Gradients 

% OBS. GMRES and BiCGSTAB for unsymmetric A matrix and CG for symmetric 

% M - preconditioner matrix (if M is missing identity matrix is used) 

%% Output data 

% x - solution vector 

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 

% check the preconditioner 

if (nargin < 6) || isempty(M) 

M = sparse([0]); 

end 

[i, j, x, no_nonzeros_A, no_cols_A, no_rows_A] = csc2coo_matrix(A); 

[i_M, j_M, x_M, no_nonzeros_M, no_cols_M, no_rows_M] = csc2coo_matrix(M); 

% Check conversion only 

%%TO FIX if the last line is zero you will get an error 

% ver = sparse(i_M,j_M,x_M); 

% ver=full(ver) 

% if ver==M 

% 1 

% else 

% 2 

% end 

if isreal(A) 

%Call real solver 

% rows and cols vectors from 0 index 

tic 

x = solver_real_mex(i-1, j-1, x, no_nonzeros_A, b, no_it,... 

rel_tol, solver_used, i_M-1, j_M-1, x_M, no_nonzeros_M); 

toc 

137


else 

% Call complex solver 

% rwos and cols vectors from 0 index 

tic 

[x_re, x_im] = solver_complex_mex(i-1, j-1, x, no_nonzeros_A, b,... 

no_it, rel_tol, solver_used, i_M-1, j_M-1, x_M, no_nonzeros_M); 

toc 

% assembly solution 

x = x_re+1i*x_im; 

end; 

clear functions 

end 

C.5 CSC to COO convert procedure 

function [j, i, x, no_nonzeros_A, no_cols_A, no_rows_A] = csc2coo_matrix(A) 

if ˜issparse(A) 

error(’A matrix must be sparse’); 

end; 

A = A’; 

[i, j, x] = find(A); 

no_nonzeros_A = nnz(A); 

no_cols_A = size(A(1,:),2); 

no_rows_A = size(A(:,1),1); 

if ˜isreal(A) 

x = x’; 

end 

clear functions; 

end 

C.6 Complex solvers file 

/*============================ 

Mihail-Iulian ANDREI 

iulian@lmn.pub.ro 

Last check 02 July 2012 

============================ */ 

/* This mex-file was written in order to call Cusp based on 

CUDA solvers. Cusp is a library which contains real and 

complex sparse solvers (GMRES, BiCGSTAB and CG) based on 

CUDA computations (http://code.google.com/p/cusp-library/). */ 

138

#include "mex.h" 

#include "matrix.h" 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

// where to perform the computation 

typedef cusp::host_memory host_MemorySpace; 

typedef cusp::host_memory gpu_MemorySpace; 

// which ing point type to use 

typedef double ValueType_real; 

typedef cusp::complex ValueType_complex; 

//sparse_matrix 

typedef struct sparse_matrix { 

int *row; 

int *col; 

double *val_re; //Real Part 

double *val_im; //Imaginary Part 

int* csr_row; 

int nnz; 

} sparse_matrix; 

//global variable 

sparse_matrix A_gpu; 

/*C code*/ 

void print_sparse_complex_matrix(sparse_matrix x){ 

int i; 

139 

C.6. Complex solvers file


for (i=0; i

C.6. Complex solvers file 

/* solve system */ 

// set stopping criteria: 

// iteration limit "no_it" 

// relative tolerance "rel_tol" 

// default_monitor - no information 

// verbose_monitor - display information 

cusp::default_monitor monitor(b, no_it, rel_tol); 

int restart = 50; 

mexPrintf("restart =%d\n",restart); 

// solve the linear system A*x=b with the GMRES 

cusp::krylov::gmres(A, x, b,restart, monitor); 

/* default_monitor */ 

// if (monitor.converged()){ 

// std::cout


cusp::coo_matrix 

C(dimension, dimension, AA.nnz); 

for (i=0;i

} 

//cusp::print(D); 


// conver matrix from COO to CSR or HYB 

cusp::csr_matrix M = D; 

//cusp::print(M); 

mexPrintf("Custom M PRECONDITIONER.\n"); 


cusp::krylov::gmres(A, x, b,restart, monitor, M); 

/* save solution */ 

//cusp::print(x); 

for (i=0;i



/* solve system */ 

// set stopping criteria: 

// iteration limit "no_it" 

// relative tolerance "rel_tol" 

// default_monitor - basic information 

// verbose_monitor - display information 


// set preconditioner (identity) 

cusp::identity_operator 

M(A.num_rows, A.num_rows); 

// cusp::precond::diagonal M(A); 

// solve the linear system A*x=b with BiCGstab 

cusp::krylov::bicgstab(A, x, b, monitor, M); 


// if (monitor.converged()){ 

// std::cout


/* create Ax=b data */ 

// create an empty sparse matrix structure (COO format) 



for (i=0;i


// std::cout


//cusp::print(b); 

// allocate storage for solution "x" 

cusp::array1d x(dimension, 

ValueType_complex(0,0)); 


//TO DO return 0 

/*save solution*/ 

for (i=0;i A matrix 

v1 = mxGetPr(prhs[0]); 


148

A_host.val_re = mxGetPr(prhs[2]); 

A_host.val_im = mxGetPi(prhs[2]); 

A_host.nnz = (int)mxGetScalar(prhs[3]); 

// mem alloc 

A_host.row = (int *)malloc(A_host.nnz*sizeof(int)); 

A_host.col = (int *)malloc(A_host.nnz*sizeof(int)); 

// convert vector from double to int 

for (i=0; i M matrix 



M_host.val_re = mxGetPr(prhs[10]); 

M_host.val_im = mxGetPi(prhs[10]); 

M_host.nnz = (int)mxGetScalar(prhs[11]); 

// mem alloc 

M_host.row = (int *)malloc(M_host.nnz*sizeof(int)); 

M_host.col = (int *)malloc(M_host.nnz*sizeof(int)); 


for (i=0; i


/* Choosing solver */ 

// 1 - GMRES 

// 2 - GMRES with PRECONDITIONER 

// 3 - BiCGstab 

// 4 - CG 

// 5 - CG_m not ready yet 

if (solver_used==1) { 

mexPrintf("GMRES complex solver.\n"); 

if (M_host.nnz != 0){ 

mexPrintf("Solver without preconditioner.\n"); 

} 

solve_gmres(A_host, b_host, b_length, no_it_r, rel_tol_r, 

result_re, result_im); 

} 

else if (solver_used==2){ 

mexPrintf("GMRES with PRECONDITIONER complex solver.\n"); 

solve_gmres_pre(A_host, b_host, b_length, no_it_r, rel_tol_r, 

result_re, result_im, M_host); 

} 


mexPrintf("BiCGstab complex solver.\n"); 

solve_bicgstab(A_host, b_host, b_length, no_it_r, rel_tol_r, 


} 


mexPrintf("CG complex solver.\n"); 

solve_cg(A_host, b_host, b_length, no_it_r, rel_tol_r, 


} 


mexPrintf("WARNING CG-M complex solver is not ready yet.\n"); 

solve_cg_m(A_host, b_host, b_length, no_it_r, rel_tol_r, 


} 

else { 

mexPrintf("Invalid solver."); 

} 

} 

C.7 Real solvers file 

/*============================ 

Mihail-Iulian ANDREI 

iulian@lmn.pub.ro 

Last check 02 July 2012 

============================ */ 

/* This mex-file was written in order to call Cusp based 

on CUDA solvers. Cusp is a library which contains real and 

150

C.7. Real solvers file 

complex sparse solvers (GMRES, BiCGSTAB and CG) based on CUDA 

computations (http://code.google.com/p/cusp-library/). */ 

#include "mex.h" 

#include "matrix.h" 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

#include 

// where to perform the computation 

typedef cusp::host_memory host_MemorySpace; 

typedef cusp::host_memory gpu_MemorySpace; 

// which ing point type to use 

typedef double ValueType; 

//sparse_matrix 

typedef struct sparse_matrix { 

int *row; 

int *col; 

double *val; 

int* csr_row; 

int nnz; 

} sparse_matrix; 

//global variable 

sparse_matrix A_gpu; 

/*C code*/ 

void print_sparse_matrix(sparse_matrix x){ 

int i; 

for (i=0; i


} 

} 

void print_full_vector(double *x, int n){ 

int i; 

for (i=0; i Option 1 

void solve_gmres(sparse_matrix AA, double *bb, int dimension, 

int no_it, double rel_tol, double *x_res) { 

int i; 





for (i=0;i

(see Examples for more infos) 


int restart = 200; 


cusp::krylov::gmres(A, x, b,restart, monitor); 

// print info - convergenge_monitor and default_monitor 

// convergenge_monitor 

//monitor.print(); 


if (monitor.converged()){ 

std::cout


C.row_indices[i] = AA.row[i]; 

C.column_indices[i] = AA.col[i]; 

C.values[i] = AA.val[i]; 

} 

cusp::csr_matrix A = C; 

// cusp::print(C); 

cusp::array1d 

b(dimension, ValueType(0)); 

for (i=0;i

solve the linear system A*x=b with the GMRES 

cusp::krylov::gmres(A, x, b,restart, monitor, M); 

//save solution 


for (i=0;i


} 

} 

// BiCGstab solver ====> Option 3 

void solve_bicgstab(sparse_matrix AA, double *bb, 

int dimension, int no_it, double rel_tol, double *x_res) { 

int i; 





for (i=0;i

gpu_MemorySpace> M(A, .1); 

// cusp::precond::smoothed_aggregation M(A); 

// solve the linear system A*x=b with BiCGstab 

cusp::krylov::bicgstab(A, x, b, monitor, M); 

// print info - convergenge_monitor and default_monitor 

// convergenge_monitor 

//monitor.print(); 

// default_monitor 

if (monitor.converged()){ 

std::cout


for (i=0;i

std::cout


cusp::array1d 

x(dimension, ValueType(0)); 

//TO DO return 0 

/*save solution*/ 

for (i=0;i A matrix 



A_host.val = mxGetPr(prhs[2]); 

160

A_host.nnz = (int)mxGetScalar(prhs[3]); 

/*mem alloc*/ 

A_host.row = (int *)malloc(A_host.nnz*sizeof(int)); 

A_host.col = (int *)malloc(A_host.nnz*sizeof(int)); 

/*convert vector from double to int*/ 

for (i=0; i M matrix 



M_host.val = mxGetPr(prhs[10]); 

M_host.nnz = (int)mxGetScalar(prhs[11]); 

// mem alloc 

M_host.row = (int *)malloc(M_host.nnz*sizeof(int)); 

M_host.col = (int *)malloc(M_host.nnz*sizeof(int)); 


for (i=0; i


// 5 - CG_m not ready yet 

if (solver_used==1) { 

mexPrintf("GMRES real solver.\n"); 

solve_gmres(A_host, b_host, b_length, no_it_r, rel_tol_r,result); 

} 


mexPrintf("GMRES with PRECONDITIONER real solver.\n"); 

solve_gmres_pre(A_host, b_host, b_length, no_it_r, 

rel_tol_r,result, M_host); 

} 


mexPrintf("BiCGstab real solver.\n"); 

solve_bicgstab(A_host, b_host, b_length, no_it_r, 

rel_tol_r,result); 

} 


mexPrintf("CG real solver.\n"); 

solve_cg(A_host, b_host, b_length, no_it_r, rel_tol_r, 

result); 

} 


mexPrintf("CG-M real solver is not ready yet.\n"); 

solve_cg_m(A_host, b_host, b_length, no_it_r, rel_tol_r 

,result); 

} 

else { 

mexPrintf("Invalid solver."); 

} 

} 

162

Save state space function 

ANEXA D 

Cu ajutorul acestei funct¸ii se exportă sistemul matriceal de stare din modelul COMSOL, în mediul 

MATLAB. 

%%============================ 

%Mihail-Iulian ANDREI 


% Last check 02 July 2012 

%%============================ 

%% 1 - Add State Space to your Comsol model. 

% Open Study tree, open Solver Configuration, right click on Solver -> Othe 

% State Space parameters: Input parameters V0 

% Output parameters mod1.V 

% Check MA, MB, C, D, Static Off, and Mc 

% then right click on Study and choose Compute 

% Save model as m-file: File -> Save as m-file 

% 2 - Start Comsol server on the same machine with Matlab (consol server -ckl 

% 3 - Start MATLAB and go to your folder (be sure that you have a copy of thi 

% 4 - Write the name of your model and run the save_state_v*.m file. 

clear all; 

clc; 

% Add to sources Matlab-Comsol interface files. 

sourcespath = genpath(’/usr/local/comsol/mli/’); 


% Connect to Comsol Server. 

mphstart(2036); 

% Put your m-file name here. 

model = test 

%% MA 

x_MA = model.sol(’sol1’).feature(’sp1’).getSparseMatrixVal(’MA’); 

163

D. Save state space function 

i_MA = model.sol(’sol1’).feature(’sp1’).getSparseMatrixRow(’MA’); 

j_MA = model.sol(’sol1’).feature(’sp1’).getSparseMatrixCol(’MA’); 

M_MA = model.sol(’sol1’).feature(’sp1’).getM(’MA’); 

N_MA = model.sol(’sol1’).feature(’sp1’).getN(’MA’); 

nnz_MA = model.sol(’sol1’).feature(’sp1’).getNnz(’MA’); 

x_MA = double(x_MA); 

i_MA = double(i_MA); 

% indicii i si j sunt indexati de la 0 iar Matlabul lucreaza cu indici pornind d 

i_MA =i_MA+1; 

j_MA = double(j_MA); 

j_MA = j_MA+1; 

MA_res = sparse(i_MA, j_MA, x_MA, M_MA, N_MA, nnz_MA); 

%% MB 

x_MB = model.sol(’sol1’).feature(’sp1’).getSparseMatrixVal(’MB’); 

i_MB = model.sol(’sol1’).feature(’sp1’).getSparseMatrixRow(’MB’); 

j_MB = model.sol(’sol1’).feature(’sp1’).getSparseMatrixCol(’MB’); 

M_MB = model.sol(’sol1’).feature(’sp1’).getM(’MB’); 

N_MB = model.sol(’sol1’).feature(’sp1’).getN(’MB’); 

nnz_MB = model.sol(’sol1’).feature(’sp1’).getNnz(’MB’); 

x_MB = double(x_MB); 

i_MB = double(i_MB); 

i_MB =i_MB+1; 

j_MB = double(j_MB); 

j_MB = j_MB+1; 

MB_res = sparse(i_MB, j_MB, x_MB, M_MB, N_MB, nnz_MB); 

%% Mc 

x_Mc = model.sol(’sol1’).feature(’sp1’).getSparseMatrixVal(’Mc’); 

i_Mc = model.sol(’sol1’).feature(’sp1’).getSparseMatrixRow(’Mc’); 

j_Mc = model.sol(’sol1’).feature(’sp1’).getSparseMatrixCol(’Mc’); 

M_Mc = model.sol(’sol1’).feature(’sp1’).getM(’Mc’); 

N_Mc = model.sol(’sol1’).feature(’sp1’).getN(’Mc’); 

nnz_Mc = model.sol(’sol1’).feature(’sp1’).getNnz(’Mc’); 

x_Mc = double(x_Mc); 

i_Mc = double(i_Mc); 

i_Mc =i_Mc+1; 

j_Mc = double(j_Mc); 

j_Mc = j_Mc+1; 

Mc_res = sparse(i_Mc, j_Mc, x_Mc, M_Mc, N_Mc, nnz_Mc); 

%% C 

x_C = model.sol(’sol1’).feature(’sp1’).getSparseMatrixVal(’C’); 

i_C = model.sol(’sol1’).feature(’sp1’).getSparseMatrixRow(’C’); 

j_C = model.sol(’sol1’).feature(’sp1’).getSparseMatrixCol(’C’); 

M_C = model.sol(’sol1’).feature(’sp1’).getM(’C’); 

164

N_C = model.sol(’sol1’).feature(’sp1’).getN(’C’); 

nnz_C = model.sol(’sol1’).feature(’sp1’).getNnz(’C’); 

x_C = double(x_C); 

i_C = double(i_C); 

i_C =i_C+1; 

j_C = double(j_C); 

j_C = j_C+1; 

C_res = sparse(i_C, j_C, x_C, M_C, N_C, nnz_C); 

%% D 

x_D = model.sol(’sol1’).feature(’sp1’).getSparseMatrixVal(’D’); 

i_D = model.sol(’sol1’).feature(’sp1’).getSparseMatrixRow(’D’); 

j_D = model.sol(’sol1’).feature(’sp1’).getSparseMatrixCol(’D’); 

M_D = model.sol(’sol1’).feature(’sp1’).getM(’D’); 

N_D = model.sol(’sol1’).feature(’sp1’).getN(’D’); 

nnz_D = model.sol(’sol1’).feature(’sp1’).getNnz(’D’); 

x_D = double(x_D); 

i_D = double(i_D); 

i_D =i_D+1; 

j_D = double(j_D); 

j_D = j_D+1; 

D_res = sparse(i_D, j_D, x_D, M_D, N_D, nnz_D); 

C = Mc_res; 

G = -MA_res; 

B = MB_res; 

L = C_res; 

D = D_res; %% D=0 

%% Save the matrices into a file 

save(’state_space_matrices.mat’, ’C’, ’G’,’B’, ’L’, ’D’); 

%% Disconnect from Comsol Server 

import com.comsol.model.* 

import com.comsol.model.util.* 

ModelUtil.disconnect; 

165


Bibliografie 

[1] E. Commission, “Vision 2020 - Nanoelectronics at the Centre of Change,” 

2004. ftp://ftp.cordis.europa.eu/pub/nanotechnology/docs/ 

e-vision-2020.pdf. 

[2] ITRS, “International technology roadmap for semiconductors.” http://www.itrs. 

net/. 

[3] Leibniz-Institut for innovative Microelectronics, “Innovations for High Perfommance Microelectronics 

- Annual report,” 2011. http://www.ihp-microelectronics.com/ 

downloads/94/IHP_AR_2011.pdf. 

[4] G. E. Moore, “Cramming more components onto integrated circuits,” Electronics, vol. 38, 

April 1965. Reprinted 10.1109/N-SSC.2006.4785860. 

[5] W. Arden, M. Brillouet, P. Cogez, M. Graef, B. Huizing, and R. Mahnkopf, 

“More than Moore - white paper.” http://www.itrs.net/Links/2010ITRS/ 

IRC-ITRS-MtM-v2%203.pdf. 

[6] E. Commission, “Vision 2020 - Nanoelectronics at the Centre of Change,” 

2004. ftp://ftp.cordis.europa.eu/pub/nanotechnology/docs/ 

e-vision-2020.pdf. 

[7] IBM, “Sequoia - Bluegene/Q.” http://en.wikipedia.org/wiki/IBM_Sequoia. 

[8] Fujitsu, “K computer- SPARC64.” http://en.wikipedia.org/wiki/K_ 

computer. 

[9] TOP500.Org, “TOP 500 Supercomter sites.” http://http://top500.org/. 

[10] A. M. Niknejad, Electromagnetics for High-Speed Analog and Digital Communication Circuits. 

Cambridge University Press, 2007. 

[11] A. Manolescu, A. Manolescu, T. Muresan, L. Turic, and I. Mihut, Circuite liniare integrate. 

Editura Didactica si Pedagogica, 1983. http://www.scribd.com/doc/45193777/ 

Circuite-Integrate-Liniare. 

[12] R. J. Baker, CMOS Circuit Design, Layout, and Simulation, 3rd Edition. Wiley-IEEE Press, 

2010. http://books.google.ro/books?id=kxYhNrOKuJQC&printsec= 

frontcover&hl=ro&source=gbs_ge_summary_r&cad=0#v=onepage&q&f= 

false. 

167

BIBLIOGRAFIE 

[13] A. R. Alvarez, BiCMOS Technology and Applications. Kluwer Academic Publishers, 

1993. http://books.google.ro/books?id=jrQhYxzZ0gwC&printsec= 

frontcover&hl=ro&source=gbs_ge_summary_r&cad=0#v=onepage&q&f= 

false. 

[14] X. Huo, P. C. H. Chan, K. J. Chen, and H. C. Luong, “The design of CMOS radio-frequency 

integrated circuits,” Communications Engineer, vol. 2, Aug.-Sep 2004. http://lmn. 

pub.ro/˜iulian/files/bibliografie/1_1_Yue.pdf. 

[15] C. Mocanu, Teoria Circuitelor Electrice. Editura Didactica si Pedagogica, 1979. 

[16] C. P. Yue, C. Ryu, J. L. T. H. Lee, and S. S. Wong, “A physical model for planar spiral 

inductors on silicon,” International Electron Devices Meeting, 1996. http://iulian. 

lmn.pub.ro/wiki_iulian/bibliografie/1996_Yue.pdf. 

[17] C. P. Yue and S. Simon, “Physical modeling of spiral inductors on silicon,” IEEE Transactions 

on Electron Devices, vol. 47, March 2000. http://iulian.lmn.pub.ro/ 

wiki_iulian/bibliografie/2000_Yue200_ED.pdf. 

[18] H. Greenhouse, “Design of planar rectangular microelectronic inductors,” IEEE Transactions 

on Parts, Hybrids and Packaging, vol. 10, no. 2, pp. 101–109, 1974. http: 

//ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber= 

1134841&contentType=Journals+%26+Magazines&queryText% 

3DDesign+of+Planar+Rectangular+Microelectronic+Inductors. 

[19] S. Mohan, M. Hershenson, S. Boyd, and T. Lee, “Simple Accurate Expressions for Planar 

Spiral Inductances,” IEEE Journal of Solid-State Circuits, vol. 34, no. 10, pp. 1419–1424, 

1999. http://smirc.stanford.edu/papers/JSSC99OCT-mohan.pdf. 

[20] S. University, “Integrated Spiral Inductor Calculator.” http://www-smirc. 

stanford.edu/spiralCalc.html. 

[21] H. Kim and C. C.-P. Chen, “Be Careful of Self and Mutual Inductance Formulae,” 2001. 

http://ccf.ee.ntu.edu.tw/˜cchen/research/CompInduct9.pdf. 

[22] C.-J. Chao, S.-C. Wong, C.-H. Kao, M.-J. Chen, L.-Y. Leu, and K.-Y. Chiu, “Characterization 

and modeling of on-chip spiral inductors for Si RFICs,” IEEE Transactions on Semiconductor 

Manufacturing, vol. 15, February 2002. http://iulian.lmn.pub.ro/wiki_ 

iulian/bibliografie/2002_Chao2002_SM.pdf. 

[23] J. N. Burghartz and B. Rejaei, “On the design of RF spiral inductors on silicon,” IEEE Transactions 

on Electron Devices, vol. 50, March 2003. http://iulian.lmn.pub.ro/ 

wiki_iulian/bibliografie/2003_Burghartz2003_ED.pdf. 

[24] Y. Cao, R. A. Groves, X. Huang, N. D. Zamdmer, J.-O. Plouchart, R. A. Wachnik, 

T.-J. King, and C. Hu, “Frequency-independent equivalent-circuit model for 

on-chip spiral inductors,” IEEE Journal of Solid-State Circuits, vol. 38, March 

2003. http://iulian.lmn.pub.ro/wiki_iulian/bibliografie/2003_ 

Cao2003_IEEESolidStateCircuits.pdf. 

[25] A. C. Watson, D. Melendy, P. Francis, K. Hwang, and A. Weisshaar, “A comprehensive 

compact-modeling methodology for spiral inductors in silicon-based RFICs,” IEEE Transactions 

on Microwave Theory and Techniques, vol. 52, March 2004. http://iulian.lmn. 

pub.ro/wiki_iulian/bibliografie/2004_Watson2004_IEEEMTT.pdf. 

168

BIBLIOGRAFIE 

[26] K.-Y. Lee, S. Mohammadi, P. Bhattacharya, and L. Katehi, “Scalable compact models for 

embedded passives,” European Microwave Conference, vol. 1, Oct. 2005. http://lmn. 

pub.ro/˜iulian/files/bibliografie/2005_Lee-CC38.pdf. 

[27] I. Lai and M. Fujishima, “A New On-Chip Substrate-Coupled Inductor Model Implemented 

With Scalable Expressions,” IEEE Journal of Solid-State Circuits, vol. 41, no. 11, 

pp. 2491–2499, 2006. http://mmw.dsl.hiroshima-u.ac.jp/files/activ_ 

lit/2006/01717672.pdf. 

[28] H.-H. Chen, H.-W. Zhang, S.-J. Chung, J.-T. Kuo, and T.-C. Wu, “Accurate systematic 

model-parameter extraction for on-chip spiral inductors,” IEEE TRANSACTIONS ON 

ELECTRON DEVICES, vol. 55, Nov. 2008. http://iulian.lmn.pub.ro/wiki_ 

iulian/bibliografie/1_Yue200_ED.pdf. 

[29] B.-J. Huang, C.-H. Wang, C.-C. Chen, M.-F. Lei, P.-C. Huang, K.-Y. Lin, and H. Wang, 

“Design and Analysis for a 60-GHz Low-Noise Amplifier with RF ESD Protection,” 

IEEE Transactions on Microwave Theory and Techniques, vol. 57, no. 2, pp. 298–305, 

2009. http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber= 

4738429&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_ 

all.jsp%3Farnumber%3D4738429. 

[30] A. K. Goel, High-Speed VLSI Interconnections. Wiley-IEEE Press, 2007. 

http://www.google.ro/books?id=A4VB1aH2-LEC&dq=High+Speed+ 

VLSI+Interconnections.+Wiley+Series&lr=&hl=ro&source=gbs_ 

navlinks_s. 

[31] J.-W. Kim1, H. Takao, K. Sawada, and M. Ishida, “Integrated Inductors for RF Transmitters 

in CMOS/MEMS Smart Microsensor Systems,” Sensors, vol. 7, pp. 1387–1398, 2007. 

http://www.mdpi.com/1424-8220/7/8/1387. 

[32] A. Bondeson, T. Rylander, and P. Ingelstrom, Computational Electromagnetics. Springer, 

2005. http://read.pudn.com/downloads163/sourcecode/math/740254/ 

Computational%20Electromagnetics.pdf. 

[33] M. Salazar-Palma, T. K. Sarkar, L.-E. Garcia-Costillo, and T. Roy, 

Iterative and Self-Adaptive Finite-Elements in Electromagnetic Modeling. 

Arctech House, 1998. http://www.amazon.com/ 

Iterative-Self-Adaptive-Finite-Elements-Electromagnetic-Modeling/ 

dp/089006895X. 

[34] P. Monk, Finite Element Methods for Maxwells Equations. Oxford: 

Clarendon Press, 2003. http://www.amazon.de/ 

Maxwells-Equations-Numerical-Scientific-Computation/dp/ 

0198508883. 

[35] S. Zaglmayr, “High Order Finite Element Methods for Electromagnetic 

Field Computation.” http://www.amazon.de/ 

Maxwells-Equations-Numerical-Scientific-Computation/dp/ 

0198508883. 

[36] I. Munteanu, G. Ciuprina, and F. Tomescu, Modelarea numerica a campului electromagnetic 

prin programe Scilab. Printhech Bucuresti, 2000. 

169

BIBLIOGRAFIE 

[37] J.-M. Jin, The Finite Element Method in Electromagnetics. John Wiley 

and Sons. New York, 2002. http://www.amazon.com/ 

The-Finite-Element-Method-Electromagnetics/dp/0471438189. 

[38] Nedelec, J., “Mixed finite element in 3D in H(div) and H(curl),” vol. 1192, pp. 321–325, 

1986. http://www.springerlink.com/content/q2345243722w3g22/. 

[39] R. F. Harrington, Field Computation by Moment Methods. Wiley-IEEE Press, April 2007. 

http://eu.wiley.com/WileyCDA/WileyTitle/productCd-0780310144. 

html. 

[40] A. H. Mohammadian, V. Shankar, and W. F. Hall, “Computation of electromagnetic scattering 

and radiation using a time-domain finite-volume discretization procedure,” Computer 

Physics Communications, vol. 68, no. 13, pp. 175–196, 1991. http://www. 

sciencedirect.com/science/article/pii/001046559190199U. 

[41] G. Pelosi, “The finite-element method, Part I: R. L. Courant - Historical Corner,” IEEE 

Antennas and Propagation Magazine, vol. 49, no. 2, pp. 180–182, 2007. http:// 

ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=4263187. 

[42] T. Weiland, “A discretization method for the solution of Maxwells equations for sixcomponent 

fields,” Electronics and Communications, vol. 31, no. 3, 1977. 

[43] A. Ruehli, T. J. Watson, and Y. Heights, “Inductance Calculations in a Complex Integrated 

Circuit Environment,” IBM Journal of Research and Development, vol. 16, 

no. 5, pp. 470 – 481, 1972. http://ieeexplore.ieee.org/xpl/login.jsp? 

tp=&arnumber=1128204&url=http%3A%2F%2Fieeexplore.ieee.org% 

2Fxpls%2Fabs_all.jsp%3Farnumber%3D1128204. 

[44] A. Ruehli, “Equivalent Circuit Models for Three-Dimensional Multiconductor Systems,” 

IEEE Transactions on Microwave Theory and Techniques, vol. 22, no. 3, pp. 216 – 221, 




[45] M. Kamon, M. J. Tsuk, and J. White, “FastHenry: A Multipole-Accelerated 

3-D Inductance Extraction Program,” 30th Conference on Design Automation, 

pp. 678 – 683, 14-18 June, 1993. http://ieeexplore.ieee.org/ 

xpl/articleDetails.jsp?tp=&arnumber=1600305&contentType= 

Conference+Publications&queryText%3DA+multipole-accelerated+ 

3-d+inductance+extraction+program. 

[46] A. Devgan, H. Ji, and W. Dai, “How to efficiently capture on-chip inductance effects: 

introducing a new circuit element K,” IEEE/ACM International Conference on Computer 

Aided Design ICCAD-2000, pp. 150 – 155, 2000. http://ieeexplore.ieee. 

org/xpl/articleDetails.jsp?tp=&arnumber=896465&contentType= 

Conference+Publications&queryText%3DHow+to+Efficiently+ 

Capture+On-Chip+Inductance+Effects%3A+Introducing+a+New+ 

Circuit+Element+K. 

[47] H. Ji, A. Devgan, and W. Dai, “KSim: a stable and efficient RKC simulator for capturing 

on-chip inductance effect,” IBM Journal of Research and Development, vol. 16, no. 5, 

170

BIBLIOGRAFIE 

pp. 470 – 481, 1972. http://ieeexplore.ieee.org/xpl/login.jsp?tp= 

&arnumber=913336&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls% 

2Fabs_all.jsp%3Farnumber%3D913336. 

[48] T.-H. Chen, C. Luk, H. Kim, and C. C.-P. Chen, “INDUCTWISE: Inductance- 

Wise Interconnect Simulator and Extractor,” IEEE/ACM International Conference 

on Computer Aided Design ICCAD 2002. , pp. 215 – 220, 10-14 Nov., 


913336&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all. 

jsp%3Farnumber%3D913336. 

[49] A. Pacelli, “A local circuit topology for inductive parasitics,” IEEE/ACM International Conference 

on Computer Aided Design ICCAD 2002. , pp. 208 – 214, 10-14 Nov., 2002. http: 

//ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber= 

905676&contentType=Journals+%26+Magazines&queryText% 

3DEquipotential+shells++for+efficient+inductance+extraction. 

[50] H. Yu and L. He, “Vector potential equivalent circuit based on PEEC inversion,” Proceedings 

Design Automation Conference, pp. 718 – 723, 2003. http://ieeexplore.ieee. 

org/xpl/articleDetails.jsp?tp=&arnumber=1219113&contentType= 

Conference+Publications&queryText%3DVector+Potential+ 

Equivalent+Circuit++Based+on+PEEC+Inversion. 

[51] D. Ioan, G. Ciuprina, C. B. Dita, and Mihail-Iulian Andrei, “Electromagnetic Models of Integrated 

Circuits with Coupled Magnetic Circuits,” Proceedings of International Conference 

on Electromagnetics in Advanced Applications ICEEA 2012, pp. 768 – 771, 2-7 September 

2012. 

[52] D. Ioan, G. Ciuprina, and M. Radulescu, “Algebraic Sparsefied Partial Equivalent Electric 

Circuit (aspeec),” Scientific Computing in Electrical Engineering, vol. 9, no. 1, 2006. 

[53] G. Ciuprina, D. Ioan, D. Mihalache, and A. Stefanescu, “The Electromagnetic Circuit Element 

- Key of Modelling EM Coupled Integrated Components,” Revue Roumaine de sciences 

techniques - electrotechnique et energetique, vol. 54, no. 1, pp. 37 – 46, 2009. 

[54] D. Ioan, G. Ciuprina, and L. M. Silveira, “Effective Domain Partitioning With 

Electric and Magnetic Hooks,” IEEE Transactions on Magnetics, vol. 45, no. 3, 


4787316&url=http%3A%2F%2Fieeexplore.ieee.org%2Fiel5%2F20% 

2F4787272%2F04787316.pdf%3Farnumber%3D4787316. 

[55] ANSYS, “ANSYS HFSS.” http://www.ansys.com/Products/Simulation+ 

Technology/Electromagnetics/High-Performance+Electronic+ 

Design/ANSYS+HFSS. 

[56] ANSYS, “Getting Started with HFSS: A Silicon Spiral Inductor.” http: 

//www.egr.uh.edu/courses/ECE/ECE6351-5317/SectionJackson/ 

5113/HFSS%20spiral%20inductor.pdf. 

[57] Ansoft, “AnsoftLinks for EDA CAD.” http://www.ansys.com/Products/ 

Simulation+Technology/Electromagnetics/Product+options/ 

AnsoftLinks+for+ECAD. 

171

BIBLIOGRAFIE 

[58] Ansoft, “AnsoftLinks for Mechanical CAD.” http://www.ansys.com/Products/ 

Simulation+Technology/Electromagnetics/Product+options/ 

AnsoftLinks+for+MCAD. 

[59] S. S. Inc, “Sonnet - high frequency electromagnetic software.” http://www. 

sonnetsoftware.com/. 

[60] SONNET, “SONNET Tutorial.” http://www.rit.edu/˜w-eta/docs/ 

Project-2-SONNET-tutorial-Planar%20Inductor.pdf. 

[61] J. C. Rautio and R. F. Harrington, “An Electromagnetic Time-Harmonic Analysis of Shielded 

Microstrip Circuits,” IEEE Transactions on Microwave Theory and Techniques, vol. 35, 

pp. 726–730, 1987. http://www.sonnetsoftware.com/products/em/pdf/ 

sonnet_theory.pdf. 

[62] Autodesk, “Drawing eXchange Format.” http://www.faqs.org/faqs/graphics/ 

fileformats-faq/part3/section-45.html. 

[63] Juspertor, “Graphic Database System ii.” http://www.layouteditor.net/. 

[64] Ucamco, “Gerber Format Specification,” 2012. http://www.ucamco.com/ 

downloads.aspx. 

[65] I. P. Computing, “Platform LSF.” http://www.platform.com/ 

workload-management/high-performance-computing. 

[66] A. EEsof EDA Design Software, “Advanced Design System ADS.” http://www.home. 

agilent.com/agilent/product.jspx?nid=-34346.0.00&cc=RO&lc=eng. 

[67] A. EEsof EDA Design Software, “Momentum 3D Planar EM Simulator for ADS.” 

http://www.home.agilent.com/agilent/product.jspx?nid=-33748. 

0.00&cc=RO&lc=eng. 

[68] “Spiral Inductor Design.” http://bmf.ece.queensu.ca/mediawiki/index. 

php/Spiral_Inductor_Design. 

[69] A. C. S. INC, “Translators and Processors for ODB++.” http://www.artwork.com/ 

odb++/odb++_overview.htm. 

[70] EE Times, “ODB++ spec tapped for CAD-to-CAM data exchang.” 

http://www.eetimes.com/electronics-news/4042914/ 

ODB--spec-tapped-for-CAD-to-CAM-data-exchange. 

[71] A. M. Nicknejad, “Asitic: Analysis and simulation of spiral inductors and transformers for 

ics.” http://rfic.eecs.berkeley.edu/ñiknejad/asitic.html. 

[72] A. M. Nicknejad and R. G. Meyer, “Analysis, Design, and Optimization of Spiral Inductors 

and Transformers for Si RF ICs,” IEEE Journal of Solid-State Circuits, vol. 33, no. 10, 1998. 

http://rfic.eecs.berkeley.edu/files/jssc_oct98.pdf. 

[73] A. M. Niknejad, “Sample ASITIC Sessions.” http://rfic.eecs.berkeley.edu/ 

ñiknejad/doc-05-28-01/sample.html. 

[74] Netlib, “BLAS: Basic Linear Algebra Subprograms).” http://www.netlib.org/ 

blas/. 

172

BIBLIOGRAFIE 

[75] Netlib, “LAPACK - Parallel Basic Linear Algebra Subprograms.” http://www.netlib. 

org/scalapack/pblas_qref.html. 

[76] M. Frigo and S. G. Johnson, “FFTW: an adaptive software architecture for the 

FFT,” IEEE International Conference on Acoustics, Speech and Signal Processing, 

vol. 3, pp. 1381–1384, 1998. http://ieeexplore.ieee.org/ 

xpl/articleDetails.jsp?tp=&arnumber=681704&contentType= 

Conference+Publications&queryText%3DFftw%3A+an+adaptive+ 

software+architecture+for+the+%EF%AC%80t. 

[77] R. Piessens, “Quadpack: A Subroutine Package for Automatic Integration,” Springer Series 

in Computational Mathematics, 1983. 

[78] A. M. Nicknejad, “PhD thesys Analysis, Simulation and Applications of Passive Devices on 

Conductive Substrates.” http://rfic.eecs.berkeley.edu/ñiknejad/pdf/ 

NiknejadPhD.pdf. 

[79] “COMSOL Multiphysics.” http://www.comsol.com/. 

[80] COMSOL Model Gallery, “Integrated Square-Shaped Spiral Inductor.” http://www. 

comsol.com/showroom/gallery/129/. 

[81] K. Juethner, “White paper: Dramatically Improve Compute-Intense Applications in the Supercomputing 

Cloud,” 2011. 

[82] CODESTAR, “Compact modelling of on-chip passive structures at high frequencies.” 

http://magwel.com/codestar/. 

[83] EST3, “Early Stage Research Training at an EaSTern European Site with Tradition in Computational 

Science and Engineering.” http://est3.lmn.pub.ro/. 

[84] ToK4nEDA, “Transfer of Knowledge for nano-Electronic Design Automationy.” http: 

//tok.lmn.pub.ro/. 

[85] COMSON, “COupled Multiscale Simulation and Optimization in Nanoelectronics.” http: 

//comson.org/. 

[86] “Comprehensive high-accuracy modeling of electromagnetic effects in complete nanoscale 

rf blocks.” http://www.hitech-projects.com/euprojects/chameleon% 

20RF/. 

[87] T. Weiland, “Time domain electromagnetic field computation with finite difference methods,” 

International Journal of Numerical Modelling: Electronic Networks, Devices and Fields, 

vol. 9, 1996. 

[88] O. Podabrad, M. Clemens, and T. Weiland, “New flexible subgridding scheme for the finite 

integration technique,” IEEE Transactions on Magnetics, vol. 39, May 2003. 

[89] T. A. Davis, “Algorithm 832: UMFPACK, an unsymmetric-pattern multifrontal method,” 

ACM Transactions on Mathematical Software, vol. 30, no. 2, pp. 196–199, 2004. 

[90] D. Ioan, Modelarea dispozitivelor electromagnetice. http://www.lmn.pub.ro/ 

˜daniel/cursmde.pdf. 

173

BIBLIOGRAFIE 

[91] D. Ioan, G. Ciuprina, M. Radulescu, and M. Piper, “All Levels Strategy to Reduce the 

Model Order of On-chip Passive Components,” IEEE Conference on Electromagnetic Field 

Computation - CEFC 2004, June 6-9 Seoul, Korea, 2004. http://www.lmn.pub. 

ro/˜gabriela/BookMOR/MORbook_draft_25ian2008_IoanCiuprina.pdf. 

[92] G. Ciuprina, D. Ioan, and D. Mihalache, “Reduced Order Electromagnetic Models based 

on dual Finite Integrals Technique,” Mathematics in Industry, vol. 11, no. 3, 2007. http: 

//www.springerlink.com/content/w7877p3776778735/. 

[93] Fernández Villena, Jorge and Ciuprina, Gabriela and Ioan, Daniel and Silveira, Luis Miguel, 

“On the efficient reduction of complete EM based parametric models,” pp. 1172–1177, Nice, 

France 2009. 

[94] A. Stefanescu, D. Ioan, and G. Ciuprina, “Parametric Models of Transmission Lines Based 

on First Order Sensitivities,” Mathematics in Industry, vol. 14, no. 1, 2008. http://www. 

springerlink.com/content/j5m5852775350123/. 

[95] I. A. Lazar, G. Ciuprina, and D. Ioan, “Effective extraction of accurate reduced order models 

for hf-ic using multi-CPU arhitectures,” Inverse Problems in Science and Engineering, 

vol. 20, no. 1, 2010. 

[96] G. Ciuprina, D. Ioan, I.-A. Lazar, and C. B. Dita, “Vector Fitting Based Adaptive Frequency 

Sampling for Compact Model Extraction on HPC Systems,” IEEE Transactions on Magnetics, 

vol. 48, no. 2, 2012. http://ieeexplore.ieee.org/xpl/login.jsp? 

tp=&arnumber=6136613&url=http%3A%2F%2Fieeexplore.ieee.org% 

2Fiel5%2F20%2F6136479%2F06136613.pdf%3Farnumber%3D6136613. 

[97] G. Ciuprina, D. Ioan, D. Mihalache, and E. Seebacher, “Domain Partitioning Based Parametric 

Models for Passive On-Chip Components,” Mathematics in Industry, vol. 14, no. 1, 

2008. http://www.springerlink.com/content/u752673865q282h5/. 

[98] D. Ioan, W. Schilders, G. Ciuprina, N. van der Meijs, and W. Schoenmaker, “Models for 

integrated components coupled with their EM environment,” COMPEL: The International 

Journal for Computation and Mathematics in Electrical and Electronic Engineering, vol. 27, 

no. 4, 2008. http://www.emeraldinsight.com/journals.htm?articleid= 

1733474&show=html. 

[99] D. Ioan, M. Radulescu, and G. Ciuprina, “Fast Extraction of Static Electric Parameters with 

Accuracy Control,” MATHEMATICS IN INDUSTRY, vol. 4, 2004. http://direct.bl. 

uk/bld/PlaceOrder.do?UIN=188206874&ETOC=RN&from=searchengine. 

[100] FastImp, “A Fast Impedance Extraction Tool.” http://www.mit.edu/people/ 

zhzhu/fastImp.html. 

[101] Zhenhai Zhu and Ben Song and Jacob White, “Algorithms in FastImp: A fast and wideband 

impedance extraction program for complicated 3-D geometries,” IEEE Transaction on 

Computer Aided Design of Integrated Circuits and Systems, vol. 24, no. 4, pp. 981–998, 




174

BIBLIOGRAFIE 

[102] D. Ioan and G. Ciuprina and M. Rdulescu, “Algebraic Sparsefied Partial Equivalent 

Electric Circuit (ASPEEC),” vol. 9, pp. 45–50, 2006. http://www.springer. 

com/mathematics/computational+science+%26+engineering/book/ 

978-3-540-32861-2?cm_mmc=Google-_-Book%20Search-_-Springer-_ 

-0. 

[103] J. R. Reitz and F. J. Milford, “Foundations of Electromagnetic theory,” 1960. http: 

//books.google.ro/books/about/Foundations_of_electromagnetic_ 

theory.html?id=Au8Y9Dcw4VgC&redir_esc=y. 

[104] Ranjit Gharpurey, “PhD thesis: Modeling and Analysis of Substrate Coupling in Integrated 

Circuits,” 1995. http://citeseerx.ist.psu.edu/viewdoc/summary?doi= 

10.1.1.22.453. 

[105] T. Smedes and N. P. Van Der Meijs and A.J. van Genderen, “Boundary Element Methods 

for Capacitance and Substrate Resistance Calculations in a VLSI Layout Verification Package,” 

International Conference on Software for Electrical Engineering Analysis and Design, 

pp. 337–344, 1993. 

[106] G. Veronis, Y.-C. Lu, and R. Dutton, “Modeling of wave behavior of substrate noise coupling 

for mixed-signal ic design,” Proceedings of the 5th International Symposium on Quality 

Electronic Design, pp. 303–308, 2004. http://ieeexplore.ieee.org/xpl/ 

login.jsp?tp=&arnumber=1283690&url=http%3A%2F%2Fieeexplore. 

ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D1283690. 

[107] C. Mocanu, Bazele electrotehnicii - Teoria câmpului electromagnetic. Editura Didactica si 

Pedagogica, Bucuresti, 1991. 

[108] A. Timotin, “Elementul electromagnetic pasiv de circuit,” Revue Roumaine des sciences techniques, 

vol. 21, no. 2, 1971. 

[109] D. Ioan and I. Munteanu, “Missing link rediscovered: The electromagnetic circuit element 

concept,” JSAEM Studies in Applied Electromagnetics and Mechanics, vol. 8, Oct. 1999. 

http://lmn.pub.ro/˜iulian/files/bibliografie/IoanJSAEM99.pdf. 

[110] A. R. Stefanescu, “Teza de doctorat: modele parametrice pentru interconexiunile din circuitele 

analogice de inalta frecventa.” 

[111] M. Clemens and T. Weiland, “Discrete Electromagnetism with the Finite Integration Technique,” 

Progress In Electromagnetics Research, vol. 32, pp. 65–87, 2001. http: 

//www.jpier.org/PIER/pier.php?citedby=00080103. 

[112] B. Gustavsen and A. Semlyen, “Rational approximation of frequency domain responses by 

vector fitting,” IEEE Transactions on Power Delivery, vol. 14, July 1999. http://lmn. 

pub.ro/˜iulian/files/bibliografie/vector_fitting1.pdf. 

[113] B. Gustavsen, “Improving the pole relocating properties of vector fitting,” IEEE Transactions 

on Power Delivery, vol. 21, July 2006. http://lmn.pub.ro/˜iulian/files/ 

bibliografie/vector_fitting2.pdf. 

[114] D. Deschrijver, M. Mrozowski, T. Dhaene, and D. D. Zutter, “Macromodeling of multiport 

systems using a fast implementation of the vector fitting method,” IEEE Microwave and 

Wireless Components Letters, vol. 18, June 2008. http://lmn.pub.ro/˜iulian/ 

files/bibliografie/vector_fitting3.pdf. 

175

BIBLIOGRAFIE 

[115] A. Semlyen and B. Gustavsen, “A half-size singularity test matrix for fast and reliable passivity 

assessment of rational models,” IEEE Transactions on Power Delivery, vol. 24, Jan 

2009. 

[116] B. Gustavsen, “Fast passivity enforcement for pole-residue models by perturbation of residue 

matrix eigenvalues,” IEEE Transactions on Power Delivery, vol. 23, Oct. 2008. http: 

//lmn.pub.ro/˜iulian/files/bibliografie/vector_fitting5.pdf. 

[117] B. Gustavsen and A. Semlyen, “Fast passivity assessment for s-parameter rational models via 

a half-size test matrix,” IEEE Transactions on Microwave Theory And Techniques, vol. 56, 

Dec. 2008. http://lmn.pub.ro/˜iulian/files/bibliografie/vector_ 

fitting6. 

[118] B. Gustavsen, “Fast passivity enforcement for s-parameter models by perturbation of residue 

matrix eigenvalues,” IEEE Transactions on Advanced Packaging, vol. 39, May 2003. http: 

//lmn.pub.ro/˜iulian/files/bibliografie/vector_fitting7. 

[119] G. Ciuprina, D. Ioan, I.-A. Lazar, and Mihai-Iulian Andrei, “Adaptive frequency sampling 

for the effective extraction of reduced models for hf-ics passive components,” Lucrarile 

Simpozionului National de Electrotehnica Teoretica, Dec 2010. http://lmn.pub.ro/ 

˜iulian/files/bibliografie/SNET2010_LMN_final_v2.pdf. 

[120] A. Chinea, “A parallel Vector Fitting implementation for fast macromodeling of highly complex 

interconnects,” IEEE 19th Conference on Electrical Performance of Electronic Packaging 

and Systems (EPEPS), 25-27 Oct. 2010. http://ieeexplore.ieee.org/xpl/ 

login.jsp?tp=&arnumber=5642556&url=http%3A%2F%2Fieeexplore. 

ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5642556. 

[121] T. Palenius and J. Roos, “Comparison of reduced-order interconnect macromodels for timedomain 

simulation,” IEEE Transactions on Microwave Theory and Techniques, vol. 52, 

no. 9, pp. 2240 – 2250, 2004. http://direct.bl.uk/bld/PlaceOrder.do?UIN= 

188206874&ETOC=RN&from=searchengine. 

[122] M. J. Flynn, “Some computer organizations and their effectiveness,” IEEE Transactions on 

Computers, vol. C-21, Sept. 1972. 

[123] U. of Illinois, “Introduction to MPI.” http://www.citutor.org. 

[124] U. of Illinois, “Multilevel Parallel Programming.” http://www.citutor.org. 

[125] “ATLAS Cluster.” http://atlas.lmn.pub.ro/index.php/Main_Page. 

[126] MathWorks, “Matlab.” http://www.mathworks.com. 

[127] MathWorks, “Matlab Parallel Computing Toolbox.” http://www.mathworks.com/ 

products/parallel-computing/?s_cid=HP_FP_ML_parallel. 

[128] MathWorks, “Matlab Distributed Computing Server.” http://www.mathworks.com/ 

products/parallel-computing/?s_cid=HP_FP_ML_parallel. 

[129] ARB, “The OpenMP - API specification for parallel programming.” http://openmp. 

org/wp/. 

[130] Netlib, “LAPACK - Linear Algebra PACKage.” http://www.netlib.org/lapack/. 

176

BIBLIOGRAFIE 

[131] MPI, “The Message Passing Interface standard.” http://www.mcs.anl.gov/ 

research/projects/mpi/. 

[132] NVIDIA, “Tesla C1060.” http://www.nvidia.co.uk/object/tesla_c1060_ 

uk.html. 

[133] A. Stefanescu, R. Popescu, and G. Ciuprina, “Evaluation of LMN solving capabilities for 

sparse complex linear systems of equations, arising from the modeling of passive on-chip 

components,” tech. rep., 2009. internal report. 

[134] T. Davis, Direct Methods for Sparse Linear Systems. SIAM, 2006. 

[135] Y. Saad and M. H. Schultz, “GMRES: A Generalized Minimal Residual Algorithm for Solving 

Nonsymmetric Linear Systems,” SIAM Journal on Scientific and Statistical Computing, 

vol. 7, July 1986. http://dx.doi.org/10.1137/0907058. 

[136] H. A. van der Vorst, “Bi-CGSTAB: A Fast and Smoothly Converging Variant of Bi-CG for 

the Solution of Nonsymmetric Linear Systems,” SIAM Journal on Scientific and Statistical 

Computing, vol. 13, no. 2, 1992. http://dx.doi.org/10.1137/0913035. 

[137] ATLAS, “Automatically Tuned Linear Algebra Software.” http://math-atlas. 

sourceforge.net/. 

[138] NVIDIA, “CUBLAS: CUDA Basic Linear Algebra Subroutines.” http://developer. 

nvidia.com/cublas. 

[139] NVIDIA, “CUSPARSE: CUDA Sparse Matrix library.” http://developer.nvidia. 

com/cusparse. 

[140] N. Bell and M. Garland, “Cusp: Generic parallel algorithms for sparse matrix and graph 

computations,” 2012. Version 0.3.0, http://cusp-library.googlecode.com. 

[141] D. B. Kirk and W. mei W. Hwu, Programming Massively Parallel Processors: A Hands-on 

Approach. Morgan Kaufmann Publishers, 2010. 

[142] MathWorks, “Livelink for matlab, user’s guide,” 2011. Version 4.2. 

[143] K. Chen, Matrix Preconditioning Techniques and Applications. Cambridge University Press, 

2005. 

[144] T. C. Henk, T. F. Chan, Henk, A. Van, and D. Vorst, Approximate And Incomplete Factorizations. 

1994. http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10. 

1.1.45.946. 

[145] M. Bollhfer and Y. Saad, “Multilevel preconditioners constructed from inverse-based ILUs,” 

Journal of Scientific Computing, vol. 27, pp. 1627–1650, 2006. http://www.icm. 

tu-bs.de/˜bolle/ilupack/. 

[146] I.-A. Lazar, Mihail-Iulian Andrei, E. Caciulan, G. Ciuprina, and D. Ioan, “Parallel algorithms 

for the efficient extraction of fitting based reduced order models,” Proceedings of the 

7th International Symposium on ADVANCED TOPICS IN ELECTRICAL ENGINEERING, 

vol. 7, May 2011. 

[147] S. University, “Integrated Spiral Inductor Calculator.” http://www-smirc. 

stanford.edu/spiralCalc.html. 

177

BIBLIOGRAFIE 

[148] S. S. Mohan, M. del Mar Hershenson, S. P. Boyd, and T. H. Lee, “Simple Accurate Expressions 

for Planar Spiral Inductances,” IEEE Journal of Solid-State Circuits, vol. 34, no. 10, 

1999. http://smirc.stanford.edu/papers/JSSC99OCT-mohan.pdf. 

[149] G. Ciuprina, D. Ioan, C. Dita, and M.I. Andrei, “Frequency Parametrized Dependent Models 

for Planar On-Chip Inductors,” Book of Abstracts, Scientific Computing in Electrical 

Engineering (SCEE 2012), 11- 14 Sept., 2012, Zurich, Switzerland. 

[150] M.I. Andrei and C. Dita, “Using Multiprocessor Systems for Electromagnetic Modelling of 

Spiral Inductors,” Buletinul Stiintific, Seria C, Inginerie Electrica si Stiina Calculatoarelor. 

trimis pentru publicare. 

[151] P. Kalantarov and L. Teitlin, Calculul inductant¸elor- Indreptar. Printhech Tehnica, Bucuresti, 

1958. 

[152] Adaptive Computing, “TORQUE Resource Manager.” http://www. 

adaptivecomputing.com/products/open-source/torque/. 

178

TEZ˘A DE DOCTORAT - Mihail-Iulian ANDREI

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?