Appunti di Calcolo Numerico - Esercizi e Dispense - UniversitÃ degli ...

Annamaria Mazzia 

Appunti di Calcolo Numerico 

Dipartimento di Metodi e Modelli Matematici per le Scienze Applicate 

Università degli Studi di Padova 

Creative Commons Attribuzione- Non commerciale -Non opere derivate 2.5 Italia License 

a.a. 2010/2011

Annamaria Mazzia: Appunti di Calcolo Numerico, 

Dipartimento di Metodi e Modelli Matematici per le Scienze Applicate 

Università degli Studi di Padova 

VERSIONE A.A. 2010/2011 . 

SITO DELLE DISPENSE: 

http://dispense.dmsa.unipd.it/ 

E-MAIL: 

mazzia@dmsa.unipd.it 

Questo lavoro è stato rilasciato sotto la licenza CREATIVE COMMONS ATTRIBUZIONE- NON COMMERCIALE - 

NON OPERE DERIVATE 2.5 ITALIA LICENSE, 

Per leggere una copia della licenza visita il sito web (http://creativecommons.org/licenses/ 

by-nc-nd/2.5/it/) 

Foto di copertina: Pietre... 

Per ricordare l’etimologia della parola CALCOLO: dal latino Calculus – pietruzza, lapillo – a sua volta diminuitivo 

di Calx, nel senso originario di ghiaia, sasso, perchè gli antichi, per fare i loro conti, utilizzavano 

pietruzze al posto di cifre aritmetiche. (definizione tratta dal Vocabolario Etimologico della Lingua Italiana di 

O. Pianigiani http://www.etimo.it)

INDICE 

Indice 

iii 

1 Struttura dell’elaboratore 1 

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 La preistoria del computer: Babbage e Lovelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.3 Gli albori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.4 Architettura del Computer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.5 Software e Sistema Operativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.5.1 Per capire meglio il sistema operativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

1.6 Il file system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

1.7 Un po’ di storia sui sistemi operativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

1.8 Lavorare in ambiente Linux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

1.9 Editor di testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

2 Richiami di analisi 13 

2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.5 Teoremi utili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

3 Rappresentazione dei numeri nel calcolatore 19 

3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 

3.2 Aritmetica di macchina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

3.3 Conversione di base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

3.4 Rappresentazione IEEE dei numeri di macchina . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

3.5 Precisione numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

3.6 Propagazione degli errori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

3.7 Instabilità e malcondizionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

3.7.1 Instabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

3.7.2 Malcondizionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

4 Zeri di funzione 37 

4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

4.2 Metodo delle Bisezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

4.3 Metodo del Punto Fisso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4.4 Il Metodo di Newton-Raphson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

4.5 Convergenza di un metodo iterativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 

4.6 Complessità computazionale di uno schema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.7 Il metodo delle secanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.8 Confronto tra i metodi di Newton-Raphson e la Regula Falsi . . . . . . . . . . . . . . . . . . . . . 50 

4.9 Metodo di Newton-Raphson per radici multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

iii

INDICE 

4.10 Controllo sugli scarti e grafici di convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

4.11 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

5 Interpolazione 61 

5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

5.2 Interpolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

5.3 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

5.3.1 Funzioni base monomiali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

5.3.2 Polinomi di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

5.3.3 Formula dell’errore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

5.3.4 Differenze divise e formula di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

5.4 Considerazioni sull’interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

5.4.1 Fenomeno di Runge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

5.4.2 Malcondizionamento nell’interpolazione con funzioni base monomiali . . . . . . . . . 72 


6 Approssimazione 77 

6.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 

6.2 Retta di regressione lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 

6.3 Approssimazione polinomiale ai minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 

6.4 Approssimazioni di tipo esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 


7 Metodi diretti per la soluzione di sistemi lineari 85 

7.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

7.2 Elementi di Algebra Lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 

7.3 Metodo di eliminazione di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

7.3.1 Sostituzione all’indietro e in avanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

7.3.2 Eliminazione di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 

7.4 Strategie di pivoting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 

7.5 Fattorizzazione triangolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 

7.5.1 Fattorizzazione LDU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 

7.5.2 Fattorizzazione di Gauss senza pivoting . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

7.5.3 Fattorizzazione di Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 


8 Metodi Iterativi per la soluzione di sistemi lineari 103 

8.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 

8.2 Metodi iterativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 

8.3 Norme di vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 

8.4 Norme di matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

8.5 Autovalori e autovettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

8.6 Metodi classici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 

8.6.1 Convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 

8.6.2 Controllo della convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 

8.6.3 I metodi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

8.6.4 Convergenza dei metodi di Jacobi, Gauss-Seidel, rilassamento . . . . . . . . . . . . . . . 115 


9 Integrazione numerica 121 

9.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 

9.2 Formula dei trapezi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 

9.3 Formule di Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 

iv

Indice 

9.3.1 Formula di Cavalieri-Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 

9.3.2 Sull’errore della formula di Cavalieri-Simpson . . . . . . . . . . . . . . . . . . . . . . . . 127 

9.4 Formule composte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 

9.4.1 Formula composta dei trapezi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 

9.4.2 Confronti tra la formula dei trapezi e di Cavalieri-Simpson . . . . . . . . . . . . . . . . . 132 

9.5 Estrapolazione di Richardson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 

9.6 Approssimazione di Romberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 

9.7 Introduzione alle formule di quadratura di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 

9.7.1 Proprietà delle formule di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 

9.7.2 Formule di Gauss-Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 

9.7.3 Altre formule di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 

9.7.4 Applicazione delle formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 

9.7.5 Sulla funzione peso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 


10 Equazioni alle derivate ordinarie 145 

10.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 

10.2 Sulle equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 

10.3 Metodo di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 

10.4 Metodo di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 

10.5 Metodo di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 

10.6 Studio dell’errore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 

10.7 Errori di troncamento locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 

10.8 Convergenza e stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 

10.8.1 Convergenza di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 

10.8.2 Stabilità di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 

10.8.3 Convergenza di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 

10.8.4 Stabilità di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 

10.8.5 Convergenza di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 

10.8.6 Stabilità di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 

10.8.7 Sulla stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 


11 Introduzione al FORTRAN 77 159 

11.1 Introduzione alla programmazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 

11.2 FORTRAN: FORmula TRANslator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 

11.3 Problemi e Algoritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 

11.4 Elementi di un linguaggio di programmazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 

11.5 Prime regole sul FORTRAN77 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 

11.6 Le variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 

11.7 I tipi di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 

11.8 Espressioni aritmetiche e funzioni elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 

11.9 I predicati elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 

11.10 Struttura alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 

11.11 Programma sul metodo di punto fisso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 

11.12 I sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 

11.12.1 Le functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 

11.12.2 Le subroutines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 

11.13 Il formato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 

11.14 Files di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 

11.15 Vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 

11.16 Ciclo do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 

11.16.1 I vettori nei sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 

v

INDICE 

11.16.2 Leggere i dati di input da file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 

11.17 Matrici in FORTRAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 

11.17.1 Le matrici nei sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 

11.17.2 Memorizzazione delle matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 

11.18 La formula dei trapezi in FORTRAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 


12 Cenni su Gnuplot 191 

12.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 

12.2 Grafici di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 

12.3 Salvare i grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 

12.4 Grafici da files di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 

12.5 Script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 

12.6 Print . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 

13 Primi passi in MATLAB® 201 

13.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 

13.2 Avvio di MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 

13.2.1 Matrici e vettori in MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 

13.3 Comandi utili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 

13.4 MATLAB® per scrivere ed eseguire programmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 

13.4.1 Strutture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 

13.5 Dati di input . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 

13.5.1 Programma sul metodo delle bisezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 

13.6 Dati di output . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 

13.7 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 

13.8 Sulle potenzialità di MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 

13.9 Applicazioni di MATLAB® nel Calcolo Numerico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 

13.9.1 Sull’instabilità numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 

13.9.2 Sull’interpolazione e approssimazione di dati . . . . . . . . . . . . . . . . . . . . . . . . . 214 

13.9.3 Confronto tra schemi per equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . 220 

14 Tabelle e grafici con il foglio elettronico 223 

14.1 Il foglio elettronico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 

14.2 Inserire funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 

14.3 Formule ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 

14.4 Fare grafici nel foglio elettronico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 

14.4.1 Grafici multicolonna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 

14.5 Inserire dati da files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 

Bibliografia 241 

vi

C A P I T O L O 

1 

STRUTTURA DELL’ELABORATORE 

I computer sono incredibilmente 

veloci, accurati e stupidi. Gli uomini 

sono incredibilmente lenti, 

inaccurati e intelligenti. L’insieme 

dei due costituisce una forza 

incalcolabile. 

Albert Einstein 

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 La preistoria del computer: Babbage e Lovelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.3 Gli albori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.4 Architettura del Computer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.5 Software e Sistema Operativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.5.1 Per capire meglio il sistema operativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

1.6 Il file system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

1.7 Un po’ di storia sui sistemi operativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

1.8 Lavorare in ambiente Linux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

1.9 Editor di testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

1.1 Introduzione 

Se dobbiamo comprare un computer, abbiamo solo l’imbarazzo della scelta tra i tanti disponibili sul 

mercato. Ma in base a quali criteri scegliamo un computer? 

Le caratteristiche fondamentali di un computer si possono riassumere in poche parole-chiave: processore, 

sistema operativo, memoria. Cosa significano esattamente? E, prima ancora, cosa significa 

Computer? 

1

1. STRUTTURA DELL’ELABORATORE 

Figura 1.1: Stralci di volantini pubblicitari per l’acquisto di un computer. 

Definizione 1.1.1 

Computer = elaboratore elettronico digitale 

Dispositivo elettronico che elabora le informazioni, immesse sotto forma di dati 

numerici, secondo una sequenza di istruzioni preordinate (programma). 

G Elaboratore: macchina capace di immagazzinare ed elaborare dati in base 

ad una serie di istruzioni (programmi) memorizzate sul computer 

G elettronico: utilizza componenti elettroniche per elaborare le informazioni 

G digitale: elabora e memorizza segnali digitali basati su cifre binarie: 0 e 1 

Hardware 

Software 

In generale, un computer esegue operazioni logiche e aritmetiche e ha una memoria per conservare i dati. 

Un programma contiene le informazioni relative alle operazioni da eseguire. 

Si definisce hardware la struttura fisica del computer cioè i i suoi componenti elettronici e i dispositivi 

fisici che lo compongono. 

Si chiama, invece, software l’insieme delle istruzioni (i programmi) che consentono all’hardware di 

svolgere i propri compiti (per esempio, il sistema operativo – Windows, Linux, etc – è un tipo di software; 

programmi applicativi come Word, Excel, LaTex sono dei software). 

Attraverso un computer, elaboriamo dati (numeri, suoni, video, fotografie) in modo da ottenere informazioni 

(lettere, tabelle, risultati di procedimenti numerici. . . ). Alcune di queste informazioni possono 

diventare dati da elaborare di nuovo al computer. 

1.2 La preistoria del computer: Babbage e Lovelace 

Charles 

Babbage 

La seconda metà del diciannovesimo secolo fu un tempo di grande fermento in numerosi campi, dall’ingegneria 

ai trasporti, dalla comunicazione all’architettura... Furono scoperti nuovi materiali, la forza animale 

fu sostituita dalla forza motrice, le navi a vapore iniziarono a competere con quelle a vela, la rete ferroviaria 

si espanse sempre più, il telegrafo elettrico rivoluzionò le comunicazioni... In questo contesto, ingegneri, architetti, 

matematici, astronomi, marinai, banchieri, agenti assicurativi... – chiunque avesse a che fare con il 

calcolo – si basava su tavole di calcolo per eseguire i calcoli meno banali. Tuttavia, si sa, gli uomini possono 

sbagliare e il timore che su quelle tavole ci fossero degli errori era giustificato: un errore non trovato poteva 

diventare un disastro nelle numerose applicazioni in cui le tavole di calcolo venivano usate! 

Già nel 1812 Charles Babbage 1 era consapevole dell’inaccuratezza dei calcoli fatti dall’uomo. Nel suo 

lavoro, Babbage doveva verificare l’esattezza di tavole di calcolo che sarebbero state usate da banchieri come 

da marinai. Le navi avrebbero identificato la loro posizione in mare mediante quelle tavole! Eliminare il 

rischio dell’errore umano divenne per lui un desiderio sempre più grande. Egli stesso scrisse che, mentre 

1 Charles Babbage (1791-1871), inventore e matematico inglese, è senza dubbio il primo ad avere avuto il concetto del moderno 

calcolatore. 

2

1.3. Gli albori 

era seduto nella stanza della Società Analitica, a Cambridge, lavorando, mezzo addormentato, su una tavola 

dei logaritmi, arrivò un altro membro della società che gli chiese cosa stesse sognando. E lui rispose : – Sto 

pensando che tutte queste tavole – riferendosi alle tavole dei logaritmi – potrebbero essere calcolate da una 

macchina! 

Nel 1821, Babbage e il suo amico e astronomo John Herschel stanno controllando delle tabelle calcolate 

a mano. Errore dopo errore, Babbage esclama : – Volesse Dio che questi calcoli venissero eseguiti da una 

macchina a vapore! 

Il suo desiderio di creare una macchina per eseguire calcoli si concretizzò in due progetti, quello della 

Macchina alle Differenze e quello della Macchina Analitica 2 . La Macchina alle Differenze doveva calcolare 

in modo automatico funzioni polinomiali ma non venne mai completata per il suo costo eccessivamente 

elevato. La Macchina Analitica, invece, doveva essere una macchina di calcolo programmabile, e si può considerare 

come la prima idea del moderno computer. Anche questo progetto, tuttavia, rimase incompiuto. 

Solo nel 2002 è stato possibile costruire una macchina che rispondesse al progetto di Babbage. 

Nel 1833, Babbage incontrò Ada Lovelace 3 , figlia del famoso poeta Lord Byron. Lovelace, appena diciassettenne, 

aveva parecchie conoscenze matematiche, inusuali per l’epoca, e si entusiasmò talmente tanto per 

il progetto di Babbage, da intuire altre potenzialità della macchina stessa, come la capacità dei numeri di 

poter rappresentare altre entità quali le lettere dell’alfabeto o le note musicali, e che dalla manipolazione dei 

numeri la macchina avrebbe esteso la propria potenza oltre il mondo della matematica. Sempre la Lovelace 

intuì che la soluzione dei problemi matematici si sarebbe effettuata attraverso delle procedure di calcolo 

(quelli che noi chiamiamo programmi). 

Alla luce degli sviluppi che si sono avuti nel ventesimo secolo, la visione di Babbage e della Lovelace 

appare profetica. 

Ada Lovelace 

1.3 Gli albori 

Il 1800 si chiude con una grande invenzione: nel 1896, Guglielmo Marconi inventa la radio. Il 1900 si apre 

con altre importanti invenzioni: il triodo, il registratore magnetico, la televisione, fino ad arrivare intorno alla 

metà del 1900 con il transistor (nel 1947) e il circuito integrato (nel 1958). La nuova tecnologia elettromeccanica 

ed elettronica si rivelò decisiva per lo sviluppo dei computer, grazie allo studio sistematico della teoria dei 

circuiti elettrici. Il più noto tra gli studiosi di questa teoria fu l’americano Claude Shannon 4 . Il suo contributo 

fondamentale fu quello di elaborare un metodo sistematico per progettare reti logiche capaci di eseguire le 

operazioni logico-aritmetiche desiderate: detto più semplicemente, egli mostrò come trasformare una assegnata 

operazione matematica in un circuito elettrico costruito con interruttori e relè di commutazione (quelli 

usati nelle telecomunicazioni). Nel 1948, il suo articolo A Mathematical Theory of Communication pubblicato 

sulla rivista The Bell System Technical Journal getta le basi teoriche dell’informatica. Per prima volta 

viene usato il termine bit come abbreviazione di binary digit, termine suggeritogli dal chimico e statistico J. 

W. Tukey. 

Il lavoro di Shannon diede l’avvio allo studio delle tecniche indispensabili per progettare in modo 

sistematico tutti i circuiti logici di base necessari per realizzare i circuiti di calcolo dei futuri computer. 

Da un punto di vista propriamente ”pratico“ invece, la nascita e lo sviluppo dei calcolatori elettronici 

inizia nel 1938: il tedesco Konrad Zuse 5 costruisce Z1, una macchina costruita e pensata in maniera completamente 

meccanica, tutta da migliorare, ma che può essere considerata come il primo calcolatore. Zuse 

passa subito al progetto Z2, dove l’aritmetica meccanica è sostituita da relè elettromeccanici. L’inizio della 

seconda guerra mondiale interrompe bruscamente il lavoro di Zuse, che viene chiamato alle armi, ma riesce 

2 Osserviamo che l’invenzione del telaio meccanico a schede, in cui il tipo di tessuto veniva scelto (o programmato) in base a delle 

schede inserite nella macchina, è un precursore del progetto di Babbage. 

3 Augusta Ada Lovelace (1815-1852) fu la figlia del famoso poeta Lord Byron. I genitori si separono subito dopo la sua nascita e 

la bambina crebbe insieme alla madre (Lord Byron partì dall’Inghilterra senza farvi più ritorno e morì in Grecia quando Ada aveva otto 

anni). Poichè la madre era appassionata di matematica e non voleva che la figlia seguisse la strada del padre, incoraggiò la figlia in questa 

direzione, impartendole un’istruzione legata alla matematica e alla musica. Nel 1835 sposò William King, di dieci anni più anziano. Nel 

1838 il marito ricevette il titolo nobiliare di Conte di Lovelace. Ebbero tre figli. La Lovelace morì di cancro a soli 37 anni. 

4 Claude Shannon (1916-2002) fu fisico e matematico del MIT. 

5 Konrad Zuse, ingegnere civile (1910-1995). 

3


von 

Neumann 

a persuadere l’Istituto di Ricerca Aerodinamica del Terzo Reich a continuare i suoi studi. Completa quindi la 

costruzione dello Z2 e inizia a lavorare sullo Z3, che è il primo computer che Zuse costruisce per essere usato 

e non per verificare le proprie idee. Lo Z3 ha non solo l’unità aritmetica ma anche la memoria realizzata con 

relè elettromeccanici, ben 2600. Z3 fu la prima macchina di calcolo programmabile e venne usata dall’industria 

aerea per risolvere sistemi di equazioni e altri sistemi matematici ricavati da problemi di vibrazione 

degli apparecchi aerei messi sotto stress. 

Quando Zuse propose di passare all’uso di un computer basato su valvole elettroniche, la proposta fu 

respinta perchè i tedeschi si consideravano così vicini alla vittoria della guerra che ulteriori sforzi nella ricerca 

non apparivano necessari. 

Il lavoro di Zuse, comunque, andò avanti con la costruzione dello Z4, di S1 e S2. E, soprattutto, fu 

completamente indipendente dai lavori di John Eckert e John Mauchly negli Stati Uniti e di A. Turing in 

Inghilterra. 

In Inghilterrra, Turing 6 si occupò di problematiche riguardanti un macchina di calcolo digitale astratta, 

con una memoria senza limiti, mentre negli USA Eckert e Mauchly 7 costruirono l’ENIAC (Electronic Integrator 

and Computer). L’ENIAC fu costruito, con progetto di Eckert, in piena seconda guerra mondiale, a 

partire dal 1943, presso il Ballistic Research Laboratory e fu completato nel febbraio del 1946. La macchina 

era pensata per compiere operazioni di carattere generale, ma fu costruita con lo scopo preciso di compilare 

tabelle per le traiettorie di bombe. L’ENIAC conteneva circa 18 . 000 valvole termoioniche e misurava circa 2 

metri e mezzo di altezza per 24 metri di lunghezza! La macchina era più di mille volte veloce di tutti i predecessori 

elettromeccanici costruiti fino a quel momento e poteva eseguire 5000 addizioni al secondo. Le sue 

operazioni erano controllate da un programma che veniva inserito dall’esterno mediante nastri perforati. 

Intanto, nel 1944 aveva iniziato a collaborare nella costruzione dell’ENIAC, John von Neumann 8 . Egli si 

accorse che l’architettura della macchina andava rivista e che la programmazione del computer mediante un 

numero enorme di cavi e interruttori rendeva lenta e poco flessibile la programmazione stessa. Sostenne, 

quindi, che il programma non dovesse essere rigidamente predisposto nell’hardware tramite interruttori e 

cavi e neanche letto mediante nastri perforati, ma risiedesse in una memoria su cui poter scrivere e accedere 

velocemente insieme ai dati da elaborare. Von Neumann per primo descrisse l’architettura dei calcolatori in 

termini logico-funzionale, secondo uno schema astratto non legato ai dispositivi fisici utilizzati per le varie 

operazioni. E il suo schema, sostanzialmente invariato, è l’architettura adottata dai calcolatori dei nostri 

giorni! 

Prima di von Neumann, il calcolatore veniva controllato mediante programmi non modificabili, registrati 

su nastro perforato o cablati in una configurazione di cavetti e interruttori. Con von Neumann si presenta 

un’architettura di riferimento precisa. 

Il primo calcolatore costruito seguendo l’architettura di von Neumann entrò in funzione nel 1948 

all’Università di Manchester e venne chiamato Manchester Mark I. 

Inizia, in tal modo, una nuova fase per i calcolatori: i programmi che controllano le operazioni da svolgere 

risiedono nella memoria del calcolatore insieme ai dati e possono essere modificati dinamicamente nel corso 

dell’elaborazione. 

Dal 1948 fino ai nostri giorni, lo sviluppo dei calcolatori elettronici ha avuto ritmi esponenziali: l’invenzione 

del circuito integrato alla fine degli anni cinquanta permise non solo di ridurre via via lo spazio fisico 

occupato dai computer ma anche di ottenere computer sempre più potenti tanto che, in due suoi lavori, del 

1965 e del 1975, Gordon Moore 9 stabilì che il numero dei transistor inseribili su un chip raddoppia appros- 

6 Alan Turing (1912-1954), matematico inglese, si interessò di logica matematica e di teoria della probabilità. Introdusse il concetto 

di una macchina astratta, detta macchina di Turing e pose questioni riguardanti l’intelligenza artificiale 

7 John Presper Eckert (1919-1995) e John William Mauchly (1907-1980) lavorarono a quello che si può considerare il vero primo 

calcolatore elettronico. 

8 John von Neumann (1903-1957) ungherese, studiò prima a Berlino, poi a Zurigo e infine a Budapest, dove ricevette il dottorato in 

matematica. Nel 1930 si trasferì alla Università di Princeton dove insegnò matematica. Il suo nome è legato a studi in diversi settori: 

teoria dei giochi, matematica applicata, logica... Occupa un ruolo fondamentale nello sviluppo dei calcolatori elettronici. Ricevette 

numerosi premi e riconoscimenti in tutto il mondo. 

9 Gordon Moore è nato nel 1929 in California. Di lui basti ricordare che ha stabilito la legge di Moore, è co-fondatore della Intel 

Corporation e nel 2008 ha ricevuto la medaglia d’onore dell’IEEE per il suo pioneristico contributo nei processi dei circuiti integrati, 

e per la leadership nello sviluppo della memoria del MOS (semiconduttore metal-ossido), del microprocessore e dell’industria dei 

semiconduttori. 

4

1.4. Architettura del Computer 

simativamente ogni 24 mesi (legge di Moore). Nel 1971 tre ingegneri della Intel tra cui l’italiano Federico 

Faggin 10 inventarono il microprocessore, vale a dire un’intera CPU in un singolo circuito integrato: su una 

piastrina di 4×3 millimetri riuscirono a inserire 2250 transistor, che formavano il cuore di un intero computer: 

questo microprocessore fu chiamato Intel 4004 ed era capace di eseguire 60 . 000 operazioni al secondo. 

Se pensiamo che il processore Intel Pentium 4 introdotto nel 2000 ha 42 . 000 . 000 processori e l’Intel Itanium 

2 (con 9MB di cache) introdotto nel 2004 ha 592 . 000 . 000 transistors, ci accorgiamo di come la legge di 

Moore, dal 1968 ad oggi, sia stata rispettata. 

1.4 Architettura del Computer 

L’architettura del Computer si può riassumere in tre unità: 

G il processore, che fornisce la capacità di elaborazione delle informazioni; 

G la memoria (centrale e di massa) 

G i dispositivi di input/output, che comunicano attraverso un canale detto BUS, costituito da un insieme 

di linee elettriche digitali. 

Il processore è composto da blocchi con funzionalità diverse: 

G CPU (Central Processing Unit), unità centrale di elaborazione 

G cache 

G varie interfacce 

Se il processore è integrato su un unico chip prende il nome di microprocessore. Sia la CPU sia gran parte 

dei dispositivi che servono per l’attività della CPU sono realizzati con la tecnologia dei circuiti integrati, 

che possono essere disposti in una singola scheda detta scheda madre. Questa scheda può essere dunque 

considerata la parte più importante del computer. 

La CPU esegue tutte le operazioni di elaborazione numerica e di controllo e rappresenta la parte centrale 

del computer. 

A sua volta si suddivide in 

G unità logico-aritmetica (ALU), che svolge tutti i calcoli logici ed aritmetici; 

G unità floating-point (FPU) (Floating Point Unit), che consente di eseguire le operazioni su numeri reali; 

G unità di controllo (CU), che sovrintende all’elaborazione dei dati e alle operazioni di input e output; 

G registri, cioè memoria locale per memorizzare dati e lo stato di avanzamento delle istruzioni. Abbiamo, 

ad esempio, il registro di Program Counter, di Program Status Word, il registro Istruzioni, Indirizzi 

Memoria. . . 

Ogni elaboratore contiene un circuito di temporizzazione (clock) che genera un riferimento temporale 

comune per tutti gli elementi del sistema. 

Un ciclo-macchina è il tempo richiesto per svolgere un’operazione elementare (ed è un multiplo del periodo 

del clock). La velocità di elaborazione di un processore dipende dalla frequenza del clock. I processori 

10 Federico Faggin è nato nel 1940 a Vicenza e si è laureato in fisica all’Università di Padova. Nel 1968 si è trasferito prima a Palo Alto 

presso la Fairchild Semiconductor e poi nel 1970 nella Intel. Oggi è presidente e CEO (Chief Executive Officer) della Foveon. 

5


RAM 

attuali hanno valori di frequenza del clock che variano tra gli 8 MHz e i 3500 MHz (1 MHz = 1 milione di 

istruzioni al secondo). 

La memoria serve per conservare le istruzioni da eseguire e per scrivere/leggere i dati elaborati. Si 

suddivide in memoria principale e memoria secondaria. 

La memoria principale (o di lavoro) è la memoria in grado di conservare dinamicamente dati e 

programmi che il processore sta utilizzando. A sua volta la memoria principale può essere di due tipi: 

G memoria di sola lettura (read-only memory): ROM. Viene scritta una volta per tutte dal produttore del 

sistema e contiene programmi e informazioni specifiche per il sistema; è utilizzata per memorizzare 

parametri di configurazione del sistema, utili all’avvio del computer; 

G memoria per scrittura-lettura (random access memory): RAM. Serve alla CPU per lavorare con i 

programmi inseriti dall’utente. 

Poichè la RAM conserva i dati solo fino a quando il computer rimane acceso (infatti è detta memoria 

di tipo volatile, perchè se ne perde il contenuto quando la macchina viene spenta), per conservare dati e 

programmi per tempi lunghi e a sistema spento, si utilizza la memoria di massa (o secondaria) – dischi 

come l’Hard Disk, CDROM, DVD, pendrive USB. . . . 

La RAM può essere pensata come una sequenza di celle (locazioni), ognuna identificata da un indirizzo e 

capace di contenere informazioni binarie. 

L’unità minima indirizzabile della memoria è detta parola (word) e può variare da macchina a macchina. 

In genere una parola vale un byte, cioè 8 bit. 

Bit è l’unità elementare di informazione. 

Per esempio: 0/1, sì/no. 

1 byte = 8 bit 

1 Kilobyte (KB) = 2 10 byte = 1024 byte (circa 10 3 ) 

1 Megabyte (MB) = 2 20 byte (circa 10 6 ) 

1 Gigabyte (GB) ≈ 10 9 byte (un miliardo di byte) 

1 Terabyte (TB) ≈ 10 12 byte (mille miliardi di byte) 

1 Petabyte (PB) ≈ 10 15 byte (un milione di miliardi di byte) 

Il computer scambia informazioni con il “mondo esterno” per mezzo delle periferiche di input/output 

(monitor, mouse, stampante, web-cam,...). 

Input è l’inserimento di dati nel computer per l’elaborazione. Output è il trasferimento di dati dal 

computer a dispositivi che permettono all’utente di vedere/ascoltare i risultati dell’elaborazione. 

1.5 Software e Sistema Operativo 

Un software è una sequenza di istruzioni per eseguire le varie elaborazioni sui dati. 

Ci sono diverse 

categorie di software: software per il sistema operativo, software di base, software di tipo applicativo. 

Il sistema operativo è costituito dall’insieme dei programmi essenziali per far funzionare la macchina. 

Esso utilizza piccoli programmi già presenti nel calcolatore per accedere ai singoli dispositivi fisici. Questi 

programmi prendono il nome di Device Driver e sono memorizzati nel BIOS (Basic Input Output System). 

Il BIOS si trova nella ROM del Computer. 

Il sistema operativo, da una parte, permette di rendere fruibile all’utente le molteplici risorse del computer 

(gestione della memoria, della stampante, della tastiera,...); dall’altra rende il computer uno strumento 

amichevole e utile per affrontare le molteplici attività che gli si richiedono. 

I compiti affidati al sistema operativo sono molteplici: 

G agire da intermediario tra l’utente e l’harware del computer 

G controllare e coordinare l’utilizzo dell’hardware tra i programmi applicativi 

G fornire gli strumenti per l’uso corretto delle risorse di tipo hardware e software del sistema 

G nascondere i dettagli legati alla gestione delle risorse del sistema. 

6

1.5. Software e Sistema Operativo 

Cenni storici 

I primi sistemi operativi iniziarono a vedersi intorno alla metà degli anni cinquanta quando si cominciò 

a individuare una serie di programmi standard di comune utilizzo indipendenti dall’applicazione specifica 

richiesta al computer. 

L’evoluzione dei sistemi operativi ha influenzato anche lo sviluppo dell’hardware in quanto per supportare 

certe funzioni del sistema operativo sono necessari meccanismi hardware ad hoc (basti pensare alla 

gestione della memoria o delle interruzioni). 

I primi computer come lo Z3 di Zuse o l’ENIAC non avevano sistema operativo. Per inserire un programma 

(scritto in linguaggio macchina) bisognava azionare un gruppo di interruttori o modificare collegamenti 

tramite opportuni cavi e spinotti. Ci rendiamo conto, quindi, di quanto fosse difficile usare il computer per 

risolvere problemi mediante l’esecuzione di un programma perchè oltre alla competenza specifica del problema 

da risolvere, si richiedeva una grande conoscenza tecnica della macchina su cui si doveva lavorare. Il 

programma doveva contenere non solo le istruzioni per la risoluzione del problema (per esempio un sistema 

di equazioni) ma anche le istruzioni per gestire le unità di input e output e delle altre periferiche collegate al 

computer. Infine, poteva essere eseguito un solo programma alla volta. 

Considerando gli elevatissimi costi per la realizzazione e la gestione dei primi computer, il calcolo auto- 

7


Sul software 

Memoria 

cache 

matico era una risorsa preziosa a disposizione di pochi utenti. Tutto ciò portò ad un ripensamento del modo 

di utilizzare i computer e nacquero le prime idee di sistema operativo. 

Per prima cosa si pensò di creare delle librerie con le istruzioni necessarie per eseguire le operazioni 

più comuni legate alla gestione delle periferiche del computer (ingresso e uscita dei dati, accesso alla 

memoria,...). 

Ulteriori progressi si ebbero quando il sistema operativo iniziò a sfruttare anche il disco fisso ed ebbe 

inizio la cosiddetta multiprogrammazione, in base alla quale nella memoria centrale venivano tenuti attivi 

contemporaneamente alcuni processi e i loro dati pronti per essere eseguiti. Ad ogni momento, uno solo di 

questi processi veniva eseguito, tuttavia, quando il processo in esecuzione richiedeva un’istruzione di ingresso 

o di uscita, esso veniva sospeso attivando le unità periferiche necessarie per l’esecuzione dell’istruzione 

data. Questa tecnica richiedeva una elevata capacità della memoria centrale e solo pochi sistemi potevano 

funzionare in modo adeguato. 

Uno dei primi sistemi che iniziò ad utilizzare la multiprogrammazione fu il sistema OS/360 realizzato per 

i computer IBM 360. Questo sistema operativo fu importante per due motivi: 

G si cercò di realizzare un sistema operativo uniforme e compatibile per macchine IBM molto diverse tra 

loro per quando riguarda l’hardware sottostante: fino a quel momento ogni macchina aveva il proprio 

sistema operativo, che cambiava da macchina a macchina! 

G lo sviluppo di questo sistema operativo fu molto delicato e complesso e aprì lo studio delle 

problematiche relative all’ingegneria del software. 

Nonostante questi progressi, la multiprogrammazione non permetteva molta interattività tra utente e 

computer: di fatto l’utente consegnava i dati e il programma da eseguire (un pacco di schede perforate) all’operatore 

del computer e accedeva ai risultati dopo qualche ora se non addirittura dopo giorni e giorni, risultati 

che riceveva in forma cartacea ad esecuzione avvenuta (non c’era ancora il monitor per la visualizzazione 

su video dei risultati). 

Per risolvere questo tipo di problemi, l’uso delle schede fu sostituito da appositi terminali sempre collegati 

al computer e furono cambiate le modalità di gestione dell’unità centrale modificando i sistemi operativi 

esistenti. Si arrivò all’interazione con il computer non più mediante schede perforate bensì tramite tastierastampante 

o tramite tastiera-monitor. 

Alla fine del 1950 si introdusse il concetto di time-sharing che permetteva l’esecuzione di più processi 

in modo da poter soddisfare le esigenze di più utenti contemporaneamente. Con il time-sharing si assegna, 

infatti, un piccolo intervallo di tempo a ciascun processo dando l’impressione che ciascun processo vada 

avanti parallelamente agli altri. 

Gli sviluppi del sistema operativo ottenuti da allora fino ad oggi si possono così riassumere: il sistema 

operativo fornisce funzioni di base per la gestione delle risorse, quali: 

G uso del processore (multitasking: l’uso della CPU è permesso ad un programma alla volta per brevi 

intervalli di tempo, quindi l’utente può eseguire più programmi contemporaneamente) 

G uso della memoria centrale (memoria virtuale) 

G riconoscimento e gestione degli utenti (multiutenza) 

G gestione delle periferiche (drivers) 

G file system 

G interfaccia grafico. 

Il software di base (o general purpose) può avere funzioni varie: editor di testo, elaborazione di testi, fogli 

elettronici, posta elettronica, internet. 

Il software applicativo è costituito da programmi che hanno obiettivi specifici come intrattenimento, 

controllo di sistemi, progettazione (CAD), risoluzione di problemi matematici. 

Per migliorare le prestazioni di un computer si inserisce una memoria intermedia tra CPU e RAM, detta 

cache. Si trova all’interno del processore. È più veloce della RAM ma anche più costosa. 

1.5.1 Per capire meglio il sistema operativo 

Immaginiamo un ristorante con un capo-cuoco, il suo aiutante, una cucina, i camerieri e i clienti. I clienti 

scelgono un piatto dal menu, un cameriere prende l’ordine e lo porta al capo-cuoco. Il capo-cuoco riceve 

l’ordine e assegna al suo aiutante il compito di preparare il piatto. L’aiutante si dedicherà alla preparazione 

8

1.6. Il file system 

del piatto, compito che potrà richiedere più attività. Il capo-cuoco, intanto, supervisiona la preparazione dei 

piatti e gestisce le risorse (limitate) dei posti nel ristorante. 

G il capo-cuoco rappresenta il sistema operativo, 

G i clienti sono gli utenti, 

G le ricette associate ai piatti corrispondono ai programmi, 

G gli ingredienti sono l’input del programma, 

G il piatto è l’output del programma, 

G il menu e il cameriere sono l’interfaccia verso il sistema operativo, 

G l’aiutante corrisponde al processore (CPU) (Se abbiamo più processori, ci sono più aiutanti), 

G la cucina corrisponde al computer, 

G pentole, fornelli etc, sono le parti che compongono il computer. 

L’aiuto cuoco, quindi, rappresenta la CPU mentre il tavolo da lavoro, su cui appoggia gli ingredienti e la 

ricetta per preparare il piatto, rappresenta la memoria centrale. Prima di iniziare a lavorare, il cuoco deve 

svolgere alcune mansioni (sempre le stesse ogni volta: pulire il tavolo, controllare lo stato di pentole, tegami, 

coltelli. . . , ricevere le ordinazioni). Supponiamo che queste mansioni siano incise su un pezzo del tavolo da 

lavoro: corrispondono alla memoria ROM (quella che non può essere alterata). La RAM invece è la parte del 

tavolo che può essere alterata a piacimento (spostare pentole, tegami, ingredienti). 

Quando il ristorante chiude, il tavolo deve essere pulito e sgombro altrimenti si rovina tutto quello che vi 

rimane, ad eccezione di ciò che vi è stato inciso. Perciò il cuoco conserva in dispense e frigoriferi i vari ingredienti 

rimasti e gli utensili da lavoro: le dispense e i frigoriferi rappresentano i dischi (Hard Disk, CDROM, 

pen drive USB . . . ) per immagazzinare i dati. 

1.6 Il file system 

Il sistema operativo gestisce le informazioni su dispositivi di memoria secondaria (dischi). 

La gestione delle informazioni avviene mediante file 11 . Un file costituisce un insieme di informazioni 

della stessa natura e logicamente correlate. In genere un file contiene un programma (programma sorgente 

o programma eseguibile), oppure una sequenza di dati. 

L’informazione è rappresentata da files, organizzati in maniera gerarchica (pensiamo ad una struttura ad 

albero) in directories (cartelle). Una directory è un file che svolge il ruolo di ”raccoglitore“. 

I files possono contenere dati (abbiamo i cosiddetti files di testo) oppure programmi (i files di 

applicazioni). 

Un file è caratterizzato da: 

G posizione (path, o percorso): sequenza delle directories che portano al file 

dir1 / dir2 /.../.../ 

G nome: individua univocamente il file all’interno della cartella (o directory) 

G estensione: la parte del nome del file che segue l’ultimo punto . (dati.txt prova.f matrice.dat 

welcome.html foto.jpeg ) 

G dimensione: quantità di informazione contenuta nel file 

G altre informazioni (data di creazione, data di ultima modifica, permessi di scrittura, lettura. . . ) 

L’intera gestione dei file è a carico di un componente del sistema operativo detto file system. 

1.7 Un po’ di storia sui sistemi operativi 

Tra i numerosi sistemi operativi, il sistema Unix è quello che ha maggiormente influenzato questo settore 

dell’informatica. Il sistem Unix venne sviluppato sul finire degli anni sessanta nei laboratori della AT & 

T. La filosofia di base era di realizzare un sistema semplice rispetto agli altri in uso e adatto per la ricerca e 

lo sviluppo. La prima versione fu scritta in linguaggio Assembly e dipendeva dal tipo di macchina su cui si 

11 File in inglese significa archivio. Il termine compare nei primi anni cinquanta e inizialmente si riferisce a un pacco di schede 

contenente informazioni omogenee. È il sistema operativo a realizzare il concetto astratto di file nella gestione dei dispositivi di memoria 

di massa. 

9


doveva applicare. Successivamente venne scritto in larga parte in un linguaggio di alto livello, il C, progettato 

appositamente per il sistema Unix. In tal modo il sistema operativo diventava facilmente portabile su macchine 

di tipo diverso senza dipendere eccessivamente dalle caratteristiche dell’hardware su cui veniva fatto 

funzionare. Diversamente dalle abitudini del tempo, l’azienda AT & T distribuì Unix nelle università e rese 

disponibili i codici sorgenti utilizzati per realizzarlo. Questo portò ad una sua ulteriore innovazione grazie a 

tutti i ricercatori delle università che iniziarono a sperimentarlo. 

Quando furono messi in commercio i primi microcomputer (a partire dal 1975), fu necessario sviluppare 

sistemi operativi appositamente progettati per sfruttare le poche risorse disponibili essendo le risorse di 

calcolo di tali macchine molto limitate. Inoltre, queste macchine erano pensate più per gli appassionati che 

per il personale tecnico esperto e quindi era importante creare un sistema operativo che fosse d’uso relativamente 

semplice. In questo campo si distinsero Bill Gates e Paul Allen, che iniziarono la loro attività scrivendo 

il linguaggio di programmazione Basic per il micromputer Altair. Nel 1975 crearono una ditta... la Microsoft. 

Un altro microcomputer, popolare nei primi anni ottanta, fu l’Apple sviluppato da Steve Wozniak e Steve 

Jobs. Per questa macchina svilupparono un sistema più semplice ed efficiente di quello usato per l’Altair, che 

si ispirava vagamente al sistema Unix. 

I sistemi operativi per i microcomputer dovevano essere più semplici di quelli impiegati per i grandi computer, 

in quanto la macchina veniva utilizzata da un solo utente e le periferiche collegate erano poche e semplici. 

Il problema maggiore ero quello di gestire i file su floppy disk (gli antenati dei CD-ROM e dei DVD, in 

uso fino ad una decina di anni fa) o su nastri magnetici e mettere a disposizione dell’utente un linguaggio 

di programmazione semplice, come il Basic. Tuttavia, il confine tra linguaggio di programmazione e sistema 

operativo non era ancora ben definito e, una volta avviato, il sistema era pronto per ricevere sia comandi del 

sistema operativo, sia istruzioni in linguaggio Basic. 

I microcomputer iniziarono ad avere un grosso successo tanto che all’inizio degli anni ottanta, l’IBM pensò 

di entrare in questo settore (prima si era solo occupata di grandi computer e di software), introducendo 

il personal computer, IBM PC, realizzando in tal modo una macchina che servisse non solo per gli appassionati 

e per giocare (uno dei fattori che aveva determinato il successo dei microcomputer) ma anche come 

strumento di studio, per i professionisti e per la gestione di piccole aziende. 

L’IBM incaricò Bill Gates di realizzare un sistema operativo per il nuovo personal computer. Il successo 

dell’IBM PC portò al successo anche di Bill Gates: i profitti della Microsoft iniziarono a crescere in modo 

esponenziale. Il sistema realizzato dalla Microsoft prese il nome di MS-Dos e divenne il sistema operativo 

più diffuso al mondo grazie alla standardizzazione dei personal computer lanciato dall’IBM. 

Il sistema MS-Dos non era di facile da usare perchè l’utente interagiva con il computer solo attraverso 

comandi testuali la cui sintassi non era così semplice da ricordare (qualche anno più tardi fu lanciata sul 

mercato una versione più amichevole). 

Nel 1984, invece, dalla Apple fu prodotto il personal computer Macintosh che adottava un tipo di interfaccia 

grafico progettato per interagire in modo semplice e intuitivo con l’utente. Il Macintosh utilizzava un 

interfaccia grafico chiamato GUI (Graphic User Interface) composto da icone, finestre, menù... Gli oggetti 

dell’ambiente operativo erano rappresentati con simboli grafici di facile intuizione senza dover comprendere 

a fondo tutti i tecnicismi informatici. L’interfaccia GUI non era un’invezione della Apple perchè era stata 

già sperimentata nel corso degli anni settanta dalla Xerox, che però non aveva intuito le potenzialità di questo 

lavoro, lasciandone invece la fortuna e il successo alla Apple che, insieme ad esso, introdusse il mouse. 

Ovviamente, queste novità furono molto apprezzate e la Microsoft, per colmare questa lacuna, lanciò un 

altro sistema operativo basato su interfaccia grafica: nel 1985 nacque il primo Windows 1.0 che trovò pochi 

consensi perchè troppo lento e instabile. Nel 1986, con la comparsa di nuovi microprocessori, il sistema 

Windows cominciò a funzionare in modo adeguato tanto che le versioni di Windows 3.1 e di Windows 95 

portarono al sopravvento del sistema operativo Windows rispetto al Macintosh. 

Accanto a questi sistemi operativi, e forse anche per ridurre lo strapotere della Microsoft, si deve vedere 

la strada percorsa da un informatico di Helsinki (data di nascita 1969), Linus Benedict Torvalds, che ha 

introdotto il sistema Linux. 

Durante gli studi universitari, Torvalds si era interessato di sistemi operativi e aveva studiato una versione 

semplificata di Unix, chiamata Minix. Questo sistema poteva funzionare su personal computer e veniva 

distributo con i programmi sorgenti disponibili. Torvalds migliorò il sistema Minix, in modo da poterlo utilizzare 

come alternativa a Windows, nella logica di non realizzare profitti (cioè non diventare milionario) ma 

10

1.8. Lavorare in ambiente Linux 

di realizzare un sistema utilizzabile gratuitamente da tutti e migliorabile con il contributo di tutti (la filosofia 

dell’open source). Nel 1991 fu completata la prima versione del sistema, che fu chiamata Linux e venne messa 

a disposizione di tutti. Torvalds si riservò il compito di coordinare i diversi miglioramenti via via introdotti 

dagli altri sviluppatori. 

Tra le tante distribuzioni attualmente in uso ricordiamo: Debian, Ubuntu, Fedora, Gentoo, Slackware. . . 

Linux si è dimostrato e si dimostra tuttora un valido sistema operativo, affidabile, sicuro e di buone 

prestazioni, in grado di gestire situazioni multiutente e multitasking. 

Ed è il sistema operativo di riferimento del corso di Calcolo Numerico. 

1.8 Lavorare in ambiente Linux 

Una volta entrati nel sistema (tramite login e password), si apre l’ambiente grafico e di qui possiamo 

lavorare (per esempio, aprire una finestra di editor, lavorare in Office, navigare in Internet ....). 

Per aprire nuove directories (cartelle), per spostare files, per eseguire programmi FORTRAN, ... è bene 

lavorare tramite una finestra di terminale o shell. 

La finestra di terminale (shell) mostra il prompt dei comandi. 

Un esempio di prompt è la login dell’utente (ad esempio studente) + chiocciola + nome della macchina 

su cui si sta lavorando (ad esempio george) + attuale directory di lavoro (se non compare nessun nome, è 

perchè ci troviamo nella home directory, la directory principale dell’utente) + un simbolo (% o $, a seconda 

della macchina): 

studente@george:~ $ 

Vediamo ora alcuni comandi essenziali (comandi da scrivere dopo il prompt, in una finestra di terminale 

– dopodichè si clicca il tasto di Invio): 

G ls mostra l’elenco dei files e delle directories contenuti nella directory attuale ( ls sta per list): 

Esempio: 

studente@george:~ $ ls 

Un volta cliccato Invio, compare l’elenco delle directories presenti nello spazio di lavoro disponibile per 

l’utente studente sulla macchina george, ad esempio (i numeri a sinistra delle directories o files sono 

indicatori dello spazio che occupano in memoria): 

5 appunti/ 4 mail/ 

2 calcolonumerico/ 4 movies/ 

3 fortran/ 1 varie/ 

3 foto/ 57 prova.pdf 

G Per cambiare directory, si deve digitare cd nome-directory 

(cd sta per change directory). Esempio: per entrare nella directory foto, scriviamo 

studente@george:~ $ cd foto 

Una volta cliccato il tasto di Invio, si è entrati nella directory foto: 

studente@george:~/foto $ 

Il comando cd .. fa tornare nella directory precedente. 

Per creare una nuova directory: mkdir nomedirectory (mkdir sta per make directory). 

Per copiare un file dentro una directory: cp nomefile nomedirectory (cp sta per copy). 

Per trasferire un file in una directory mv nomefile nomedirectory (mv sta per move). 

Per rinominare un file (o una directory): mv nomevecchio nomenuovo . 

Per cancellare un file si usa il comando rm nomefile. 

G Per cancellare una directory, dobbiamo prima cancellare tutti i files della directory e poi usare il 

comando rmdir nomedirectory. 

11


G Per sapere in quale directory ci troviamo, si usa il comando pwd. Esempio: siamo nella directory foto, 

che è una sottodirectory della home di studente. Con il comando pwd si ha: 

studente@george:~/foto $ pwd 

studente@george:~/foto $ /home/studente/foto 

Esempio 1.8.1 Abbiamo due directory chiamate uno e due e il file prova.f nella directory uno. 

Vogliamo copiare il file dalla directory uno alla directory due. 

Se ci troviamo nella home, cioè nell’ambiente di partenza, dobbiamo scrivere 

cp uno/prova.f due 

studente@george:~ $ cp uno/prova.f due 

Se ora passiamo nella directory due e facciamo ls, vedremo il file prova.f 

studente@george:~ $ cd due 

studente@george:~/due $ ls 

total 1 

1 prova.f 

Se siamo nella directory uno, dobbiamo scrivere 

cp prova.f ../due per ottenere lo stesso risultato. 

Se siamo nella directory due, dobbiamo scrivere 

cp ../uno/prova.f . Il punto finale serve per copiare il file prova.f nella directory in cui ci 

troviamo. 

Con cp abbiamo due file identici, quello nella directory uno e quello copiato nella directory due. 

Possiamo anche scrivere cp prova.f prova2.f: in questo modo creiamo il file prova2.f nella 

stessa directory in cui si trova prova.f. 

Se vogliamo trasferire il file dalla directory uno alla directory due (in questo modo avremo solo un file 

alla fine del procedimento), dobbiamo usare il comando mv. 

Riassumendo 

G ls : lista dei files e delle directory 

G cd : per cambiare directory 

G mkdir: per creare una nuova directory 

G cp: per copiare files 

G mv: per trasferire o rinominare files 

G rm: per cancellare files 

G rmdir: per cancellare directories 

1.9 Editor di testo 

Se vogliamo scrivere su un file un documento di testo, abbiamo bisogno di un editor di testo. Sotto Linux 

ne troviamo diversi: vi, emacs, kedit, gedit, nedit.... I più semplici da utilizzare sono gedit e nedit. 

Sotto Linux esiste anche il pacchetto Office (del tutto simile all’equivalente Microsoft) per scrivere 

documenti in word, creare tabelle, etc. . . . Anche il programma Gnumeric è molto utile per creare tabelle. 

Per visualizzare grafici, invece, c’è il pacchetto Gnuplot. 

12


2 

RICHIAMI DI ANALISI 

La teoria attrae la pratica come il 

magnete attrae il ferro. 

Carl Friedrich Gauss 

2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

2.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.5 Teoremi utili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 


Quando si descrivono teoremi, si danno definizioni o, semplicemente, si discute di matematica, è 

abbastanza usuale prendere in prestito lettere dell’alfabeto greco. 

È importante, quindi, saperle riconoscere e chiamarle in maniera corretta: 

A α Alfa N ν Nu 

B β Beta Ξ ξ Xi 

Γ γ Gamma O o Omicron 

∆ δ Delta Π π Pi 

E ɛ Epsilon P ρ Rho 

Z ζ Zeta Σ σ Sigma 

H η Eta T τ Tau 

Θ θ Theta Υ υ Upsilon 

I ι Iota Φ φ Fi 

K κ Kappa X χ Chi 

Λ λ Lambda Ψ ψ Psi 

M µ Mu Ω ω Omega 

13

2. RICHIAMI DI ANALISI 

2.2 Identità trigonometriche 

Nel seguito introduciamo alcune formule trigonometriche, con la notazione: 

G sin(x) ≡ seno(x), cos(x) ≡ coseno(x), 

G tan(x) ≡ tangente(x) = sin(x) 

cos(x) , sec(x) ≡ secante(x) = 1 

cos(x) , 

cos(−θ) = cos(θ) 

cos( π 2 

− θ) = sin(θ) 

sin( 

cos( π 2 

+ θ) = −sin(θ) 

sin( 

cos(π − θ) = −cos(θ) 

cos(π + θ) = −cos(θ) 

cos(θ + φ) = cos(θ)cos(φ) − sin(θ)sin(φ) 

sin(2θ) = 2sin(θ)cos(θ) 

sin 2 (θ) + cos 2 (θ) = 1 

sin(−θ) = −sin(θ) 

π 

2 

− θ) = cos(θ) 

π 

2 

+ θ) = cos(θ) 

sin(π − θ) = sin(θ) 

sin(π + θ) = −sin(θ) 

sin(θ + φ) = sin(θ)cos(φ) + cos(θ)sin(φ) 

cos(2θ) = cos 2 (θ) − sin 2 (θ) 

tan 2 (θ) + 1 = sec 2 (θ) 

2.3 Regole su funzione esponenziale e logaritmica 

Assumiano a,b ∈ R, con a > 0 e b > 0. Si ha: 

1 x = 1 

a x+y = a x a y 

a x y = (a x ) y 

a log a (x) = x a 0 = 1 

a x−y = a x /a y 

a x b x = (ab) x 

log a (x y) = log a (x) + log a (y) 

log a (x/y) = log a (x) − log a (y) 

log a (x y ) = y log a (x) 

log a (a x ) = x 

log b (x) = log a (x) 

log a (b) 

b x = a x log a (b) 

2.4 Derivate e integrali 

Siano f e g due funzioni dipendenti dalla variabile reale x mentre c ∈ R sia una costante. Indichiamo la 

derivata di f con il simbolo d f 

d x o mediante f ′ . Si ha: 

d (k f ) 

= k f ′ 

d x 

regola della costante 

d (f + g ) 

= d f 

d x d x + d g 

d x 

regola della somma 

d (f /g ) 

= f ′ g − f g ′ 

d x g 2 

regola del quoziente 

d (f g ) 

= f g ′ + f ′ g 

d x 

regola del prodotto 

d f r 

d x = r f r −1 f ′ regola della potenza 

Tra le regole di integrazione, invece, ricordiamo quella di integrazione per parti: 

∫ 

∫ 

f g ′ dx = f g − f ′ g dx 

14

2.5. Teoremi utili 

Diamo ora una tabella delle derivate e degli integrali delle funzioni più note (per gli integrali lasciamo 

fuori la costante di integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x), arccos(x) ≡ arcocoseno(x), 

cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), ar ccot(x) ≡, arcocotangente(x). 

f 

f f ′ f f ′ 

1 

ln(x) 

e x 

e x 

x 

sin(x) cos(x) cos(x) −sin(x) 

1 

tan(x) 

cos 2 (x) (= 1 

sec2 (x)) cot(x) − 

sin 2 (x) 

1 

1 

1 

1 

tan(x) 

−cot(x) 

cos(x) 

cos(x) 

sin(x) 

sin(x) 

1 

1 

arcsin(x) arccos(x) − 

1 − x 

2 

1 − x 

2 

1 

arctan(x) 

1 + x 2 ar ccot(x) − 1 

1 + x 2 

x r x r +1 

∫ 

f d x f 

∫ 

f d x 

r + 1 (r ≠ 1) x−1 ln|x| 

e x e x ln|x| x ln|x| − x 

sin(x) −cos(x) cos(x) sin(x) 

tan(x) 

1 

ln| | 

cos(x) 

cot(x) ln|sin(x)| 

1 

cos(x) 

1 

ln| 

cos(x) + tan(x)| 1 

sin(x) 

1 

ln| 

sin(x) + cot(x)| 

1 

cos 2 (x) 

tan(x) 

1 

sin 2 (x) 

−cot(x) 

tan(x) 

cos(x) 

1 

cos(x) 

cot(x) 

sin(x) 

− 1 

sin(x) 

arcsin(x) x arcsin(x) + 1 − x 2 arccos(x) x arccos(x) − 1 − x 2 

arctan(x) x arctan(x) − 1 2 ln(1 + x2 ) ar ccot(x) xar ccot(x) − 1 2 ln(1 + x2 ) 

1 

 

1 − x 

2 

2.5 Teoremi utili 

arcsin(x) 

1 

1 + x 2 arctan(x) 

Richiamiamo, nel seguito, teoremi che trovano applicazione nel Calcolo Numerico. 

Utilizzeremo, inoltre, le seguenti notazioni per funzioni di una sola variabile definite in un insieme X ⊂ R. 

L’insieme delle funzioni continue in X verrà denotato con il simbolo C (X ). L’insieme delle funzioni continue 

in X , che hanno le prime n derivate pure esse continue, sarà indicato con C n (X ). 

Notazioni 

usate per le 

funzioni 

continue 

15

2. RICHIAMI DI ANALISI 

Teorema 2.5.1 (Teorema di Rolle) a Sia 

f ∈ C ([a,b]) e differenziabile in ]a,b[. 

Se f (a) = f (b) = 0, allora esiste un punto ξ ∈]a,b[ 

tale che f ′ (ξ) = 0 

a Michel Rolle (1652- 1719) fu un matematico francese. È 

conosciuto per il teorema che porta il suo nome. Si deve a lui 

la notazione della radice n-sima per mezzo del simbolo n x. 

Teorema 2.5.2 (Teorema del Valor Medio) 

Se f ∈ C ([a,b]) ed è differenziabile in ]a,b[, 

allora esiste un punto ξ ∈]a,b[ tale che 

f ′ f (b) − f (a) 

(ξ) = 

b − a 

Teorema 2.5.3 (Teorema del Valor Medio del Calcolo Integrale) Se f ∈ C ([a,b]) e g è integrabile in [a,b] e 

g (x) non cambia segno in [a,b], allora esiste un punto ξ ∈]a,b[ tale che 

∫ b 

a 

f (x)g (x) d x = f (ξ) 

∫ b 

a 

g (x) d x 

Per g ≡ 1, questo teorema ci dà il valore medio della funzione f sull’intervallo [a,b], dato da f (ξ) = 

1 ∫ b 

a 

b − a 

f (x) d x 

Teorema 2.5.4 (Teorema di Rolle generalizzato) Sia f ∈ C ([a,b]) n volte differenziabile in ]a,b[. Se f si annulla 

in n +1 punti distinti x 0 , x 1 ,..., x n in ]a,b[, allora esiste un punto ξ ∈]a,b[ in cui la derivata n-sima della 

f si annulla: f (n) (ξ) = 0. 

Teorema 2.5.5 (Teorema del Valore Intermedio) 

Sia f ∈ C ([a,b]) e sia K un valore compreso tra f (a) 

e f (b). Allora esiste almeno un punto ξ ∈]a,b[ tale 

che f (ξ) = K . 

Quindi per funzioni continue, un valore compreso tra i due estremi dell’insieme di definizione, è un valore 

assunto dalla funzione stessa (in uno o più punti). 

Come conseguenza di questo teorema, se f (a)f (b) < 0 (la funzione assume segno opposto agli estremi 

dell’intervallo [a,b]) allora esiste almeno un punto ξ tale che f (ξ) = 0, cioè esiste almeno una radice 

dell’equazione f (x) = 0 nell’intervallo [a,b]. 

16

2.5. Teoremi utili 

Teorema 2.5.6 (Formula di Taylor) 1 

Sia f ∈ C 2 ([a,b]) e sia x 0 un punto dell’intervallo [a,b]. Allora, per qualunque x ∈ [a,b] si può scrivere: 

f (x) = f (x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2 

f ′′ (ξ x ) 

2 

dove ξ x è un opportuno punto di [a,b] che si trova sul segmento individuato da x 0 e x. 

La formula appena scritta si dice formula di Taylor di centro x 0 nel punto x. 

La formula di Taylor appena scritta si può generalizzare se la funzione f è derivabile n +1 volte. Si ha così 

la formula polinomiale di Taylor di centro x 0 : 

dove 

f (x) = f (x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 ) 

2! 

(x − x 0 ) 2 + ... + f (n) (x 0 ) 

(x − x 0 ) n + R n 

n! 

R n (x) = f (n+1) (ξ x ) 

(x − x 0 ) n+1 

(n + 1)! 

con ξ x un opportuno punto di [a,b] che si trova sul segmento individuato da x 0 e x. 

1 Brook Taylor (1685 - 1731) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle differenze finite. 

L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne riconosciuta solo nel 1772 da Lagrange. 

17


3 

RAPPRESENTAZIONE DEI NUMERI NEL CALCOLATORE 

Tutti noi ogni giorno usiamo la 

matematica: per prevedere il tempo, 

per dire l’ora, per contare il denaro. 

Usiamo la matematica anche per 

analizzare i crimini, comprendere 

gli schemi, prevedere i 

comportamenti. Usando i numeri, 

possiamo svelare i più grandi 

misteri della vita! 

NUMB3RS 

3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 

3.2 Aritmetica di macchina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

3.3 Conversione di base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

3.4 Rappresentazione IEEE dei numeri di macchina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

3.5 Precisione numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

3.6 Propagazione degli errori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

3.7 Instabilità e malcondizionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

3.7.1 Instabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

3.7.2 Malcondizionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 


Molte volte, si pensa che i risultati numerici ottenuti da un calcolatore elettronico, specie se sono ottenuti 

come output di un sofisticato software, non contengano errori e, se ne abbiano, siano da ritenersi 

trascurabili. In realtà, quando si esegue un programma al calcolatore, bisogna prima di tutto aver verificato 

che sia stato scritto correttamente (il programma deve, cioè, tradurre correttamente il problema matematico 

che si vuole risolvere). Inoltre, bisogna tener conto che i risultati numerici sono sempre affetti da 

un certo tipo di errore (che può dipendere, per esempio, dall’arrotondamento – π è un numero con infinite 

cifre decimali ma il calcolatore lo può vedere solo come un numero con finite cifre decimali, introducendo 

cosí un errore nei risultati – o dal troncamento – molte formule non possono essere usate così 

19

3. RAPPRESENTAZIONE DEI NUMERI NEL CALCOLATORE 

come sono ma devono necessariamente essere semplificate: basti pensare ad una somma di infiniti termini). 

Non tenere conto di questi fattori può portare a risultati davvero disastrosi, come può essere verificato 

andando a controllare la pagina web dedicata ai disastri dovuti a uno scorretto calcolo numerico: 

http://www.ima.umn.edu/~arnold/disasters/disasters.html 

La pagina web è del prof. Douglas N. Arnold, dell’Università del Minnesota, e viene introdotta con la 

seguente frase (traducendo): Stai seguendo con attenzione il tuo corso di analisi numerica o di calcolo scientifico? 

Se no, potrebbe essere un caro errore. Nel seguito, ci sono esempi dalla vita reale di ciò che può succedere 

quando gli algoritmi numerici non sono applicati correttamente. 

Vediamo alcuni di questi disastri numerici. 

Esempio sul 

disastro del 

missile 

Patriot 

Il 25 febbraio 1991, durante la prima Guerra del Golfo, un missile Patriot fallì l’intercettazione di un missile 

Scud iracheno. Questo errore costò la vita di 28 soldati, un centinaio di feriti e la distruzione di un capannone 

americano. La causa del disastro fu dovuto ad errori di arrotondamento nel sistema operativo del 

Patriot: ad ogni secondo che passava si introduceva un ritardo infinitesimo che comportava un errore nella 

valutazione della traiettoria del missile Scud. Col passare delle ore il ritardo accumulato fu tale da far intercettare 

una posizione del tutto diversa da quella in cui si trovava il missile da abbattere. Difatti, il computer 

Figura 3.1: Il disastro del missile Patriot 

L’esplosione 

dell’Ariane 5 

Il disastro del 

Mars Climate 

Orbiter 

usato per controllare il missile Patriot era basato su un’aritmetica a 24 bit. Per i calcoli, il tempo veniva registrato 

dall’orologio interno del sistema in decine di secondi e successivamente moltiplicato per 1/10 per 

ottenere i secondi, utilizzando 24 bit in virgola fissa. Il numero 1/10 in base 2 ha infinite cifre decimali: la 

sua espansione binaria è infatti 0.0001100110011001100110011001100.... In 24 bit esso veniva registrato come 

0.00011001100110011001100 introducendo un errore di 0.0000000000000000000000011001100..., che, in 

base 10, significa circa 0.000000095. 

Gli errori di arrotondamento nella conversione del tempo causarono un errore nel calcolo della traiettoria: 

il tempo di 100 ore calcolato in secondi diede il valore 359999.6567 invece di 360000, un errore di 0.3433 

secondi che portò il Patriot 687 metri fuori della traiettoria del missile Scud! 

Il 4 giugno 1996, dopo una spesa di 7 miliardi di dollari, e dopo appena 40 secondi dal suo lancio, esplose 

il razzo Ariane 5, nella Guiana Francese. Il razzo e il suo carico erano valutati per oltre 500 milioni di dollari. 

Perciò il costo totale della missione era stato di oltre 7 miliardi e mezzo di dollari. Fu scoperto che l’errore 

era nel software e, in particolare, nella componente del Sistema di Riferimento Inerziale, che era stato preso 

dal software dell’Ariane 4. Certe parti del software dell’Ariane 5 erano state aggiornate rispetto al software 

dell’Ariane 4, ma non si era aggiornato quanto preso dal software dell’Ariane 4. 

In particolare, il fallimento dell’Ariane 5 è dovuto ad un errore di conversione da un sistema a 64 bit a 

virgola mobile ad uno a 16 bit a virgola fissa. 

La velocità orizzontale del razzo rispetto alla piattaforma misurato in 64 bit era un numero più grande 

del massimo consentito nell’aritmetica a 16 bit. Si ebbe quindi un errore di overflow che causò l’arresto del 

software di controllo del volo 37 secondi dopo il lancio del razzo. Dopo 3 secondi il razzo si distrusse. 

Il disastro del veicolo spaziale della missione Mars Climate Orbiter non si trova sulla pagina web del prof. 

Douglas, ma i dettagli della storia si possono trovare, ad esempio, sul sito http://marsprogram.jpl. 

nasa.gov/msp98/orbiter. 

20

3.2. Aritmetica di macchina 

Figura 3.2: L’esplosione di Ariane 5 

Il 23 settembre 1999 si perdono le tracce del veicolo spaziale Mars Climate Orbiter. Gli obiettivi di questa 

missione della NASA erano sia di monitoraggio dei cambiamenti climatici sia di supporto per la missione 

Mars Polar Lander. I costi della Climate Orbiter e della Polar Lander erano di un totale di oltre 320 milioni di 

dollari. 

Si era ipotizzato di entrare nell’atmosfera di Marte ad una altezza di circa 150 km mentre il veicolo spaziale 

entrò ad una altezza di circa 60 km. Per un errore di conversione delle unità di misura, il velivolo entrò 

nell’atmosfera con una traiettoria inferiore rispetto a quella pianificata. La velocità del mezzo era molto 

elevata e portò alla distruzione non solo del veicolo spaziale ma anche della stessa Polar Lander. 

Diversi furono i motivi che portarono al fallimento di questa missione. Il principale è dovuto al fallimento 

dell’operazione di riconoscere e correggere un errore nel trasferimento di informazioni tra il team che lavorava 

sul veicolo spaziale, che si trovava in Colorado e il team della missione di navigazione, che lavorava 

in California. Un team usava le unità inglesi (inches, feet, pounds) mentre l’altro usava le unità metriche. 

L’errore fu, appunto, nella conversione delle unità di misura tra unità inglesi e unità metriche! 

Figura 3.3: La Mars Climate Orbiter 

3.2 Aritmetica di macchina 

Un qualunque numero reale può essere rappresentato accuratamente da una sequenza di infinite cifre 

decimali. 

Ad esempio: 

1 

3 = 0.3333333... = ( 0 

10 0 + 3 

10 1 + 3 

10 2 + 3 

10 3 + 3 

10 4 ... ) 

× 10 0 21


( 3 

π = 3.14159265358979... = 

10 0 + 1 

10 1 + 4 

10 2 + 1 

10 3 + 5 ) 

10 4 ... × 10 0 

Osserviamo che abbiamo scritto 1/3 e π in base 10, usando, quindi, le cifre 0,1,2,...,9 per poterli 

rappresentare. 

In genere, un numero reale x può essere rappresentato in base N come 

x = x m N m + x m−1 N m−1 + ... + x 1 N + x 0 + x −1 N −1 + x −2 N −2 + ... x −n N −n 

} {{ } 

parte intera 

} {{ } 

parte frazionaria 

Esempio 

dove m e n sono interi naturali e x k , k = m,m − 1,...,−n sono interi naturali compresi tra 0 e N − 1. 

In base 10, il numero 726.625, scritto in forma estesa è dato dalla forma: 

7 × 10 2 + 2 × 10 1 + 6 + 6 × 10 −1 + 2 × 10 −2 + 5 × 10 −3 

Tuttavia, i calcolatori hanno una memoria finita per poter rappresentare i numeri. Ciò significa che solo 

una sequenza finita di cifre possono essere usate. Inoltre, i calcolatori lavorano in base binaria, quindi ogni 

numero può essere rappresentato mediante una sequenza di 0 e 1. 

Avendo in mente questi due fattori, possiamo ora capire la rappresentazione dei numeri al calcolatore, 

per cui ad ogni numero reale x è associato il numero di macchina denotato come f l(x), in rappresentazione 

floating point – virgola mobile. 

3.3 Conversione di base 

Nel seguito, non affronteremo gli aspetti teorici del passaggio da una base ad un altra per rappresentare 

lo stesso numero, ma vedremo l’implementazione pratica per convertire un numero dalla base 10 alla base 2 

e viceversa. 

Il passaggio di un numero dalla rappresentazione in base 2 alla rappresentazione in base 10 è semplice, in 

quanto si tratta di scrivere il numero come combinazione delle opportune potenze di 2. Vediamo un esempio. 

Esempio 3.3.1 Sia 10001000.010 il numero scritto in base 2. 

Se lo scriviamo mediante le potenze di 2 si ha: 

10001000.010 = 1 · 2 7 + 0 · 2 6 + 0 · 2 5 + 0 · 2 4 + 1 · 2 3 + 0 · 2 2 + 0 · 2 1 + 0 · 2 0 + 

} {{ } 

parte intera 

0 · 2 −1 + 1 · 2 −2 + 0 · 2 −2 

= 2 7 + 2 3 + 2 −2 = 128 + 8 + 0.25 = 136.25 

Questo è quindi lo stesso numero ma rappresentato in base 10. 

} {{ } 

parte frazionaria 

Il passaggio di un numero dalla rappresentazione in base 10 a quella in base 2 si effettua, invece, in due 

passi. 

GSi prende la parte intera del numero e la si divide per 2: se il resto della divisione è zero, allora la corrispondente 

cifra binaria sarà 0; se il resto è diverso da zero, la corrispondente cifra binaria sarà 1. Si ripete 

22

3.4. Rappresentazione IEEE dei numeri di macchina 

la procedura sul risultato avuto dalla divisione, fino a quando si arriva a 1. In tal modo, calcoliamo le cifre 

binarie a partire da x 0 (il primo resto ottenuto) e andando avanti con indice crescente. 

GSi prende la parte frazionaria del numero e la si moltiplica per 2. Se il risultato dell’operazione ha la 

parte intera diversa da zero, allora la corrispondente cifra binaria vale 1, altrimenti vale 0. Si ripete la procedura 

sulla parte frazionaria del risultato appena ottenuto e si continua fino a quando si arriva allo zero (o se 

si vede che c’è una periodicità nei risultati). Le cifre binarie vengono costruite da x −1 con indice decrescente. 

Esempio 3.3.2 Vogliamo convertire il numero 725.625 dalla base 10 nella base 2. 

Per la parte intera si ha: 

Per la parte decimale si ha : 

: 2 = quoziente resto 

.625 × 2 = 1.250 x 

725 362 1 x −1 = 1 

0 

.250 × 2 = 0.50 x 

362 181 0 x −2 = 0 

1 

.5 × 2 = 1.0 x 

181 90 1 x −3 = 1 

2 

.0 × 2 = 0.0 

90 45 0 x 3 

1 0 1 x 9 

45 22 1 x 4 

22 11 0 x 5 

11 5 1 x 6 

5 2 1 x 7 

2 1 0 x 8 

In base 2 il numero diventa 1011010101.101. 

Osserviamo che un numero può avere una rappresentazione finita in base 10 e infinita in base 2. Vediamo 

in dettaglio un esempio: 

Esempio 3.3.3 Scriviamo il numero 11 , che è 1.1 in base 10, nella base 2. 

10 

Per la parte intera: 

Per la parte decimale: 

: 2 = quoziente resto 

.1 × 2 = 0.2 x 

1 0 1 x −1 = 0 

0 

.2 × 2 = 0.4 x −2 = 0 

.4 × 2 = 0.8 x −3 = 0 

.8 × 2 = 1.6 x −3 = 1 

.6 × 2 = 1.2 x −4 = 1 

.2 × 2 = 0.4 x −5 = 0 

.4 × 2 = 0.8 x −6 = 0 

.8 × 2 = 1.6 x −7 = 1 

.6 × 2 = 1.2 x −8 = 1 

.2 × 2 = 0.4 x −9 = 0 

Osserviamo che nella parte decimale si ripetono all’infinito le cifre 0011. Il numero in base 2 si scrive quindi 

come: 1.00011 

} {{ } 0011 } {{ } ... 

3.4 Rappresentazione IEEE dei numeri di macchina 

Lo sviluppo dei calcolatori ha promosso e sviluppato l’uso del sistema binario, in cui ciascun numero è 

rappresentato da una successione di cifre binarie (0 e 1). Ma come avviene la rappresentazione di un nume- 

23


ro nel calcolatore? Come rappresentare un numero a infinite cifre in maniera accurata utilizzando solo un 

numero finito di cifre? 

Lo standard IEEE (Institute of Electrical and Electronics Engineers), oggi utilizzato dalla maggior parte dei 

calcolatori, è dato dalla rappresentazione in virgola mobile (floating point). Esiste anche un tipo di rappresentazione 

in virgola fissa (fixed point), ma in genere è preferita quella in floating point, e noi ci soffermeremo 

solo su questa. 

Riprendiamo l’esempio proposto in Sezione 3.2, dove abbiamo scritto 1 in base 10 come 

3 

( 

1 

0 

3 = 0.3333333... = 10 0 + 3 

10 1 + 3 

10 2 + 3 

10 3 + 3 ) 

10 4 ... × 10 0 

Questo è un esempio di numero scritto in virgola mobile: un qualunque numero x, in base 10, si può 

scrivere sotto la forma x = f 10 e dove f rappresenta la mantissa del numero e e è l’esponente (intero) della 

base con cui stiamo rappresentando il numero stesso, che dà informazioni sulla parte intera del numero. 

Ci sono diverse rappresentazioni in virgola mobile, tutte equivalenti tra loro. Per esempio 12.5 = 1.25 × 

10 1 = 0.125 × 10 2 = 0.000125 × 10 5 . Si parla di virgola mobile normalizzata quando la mantissa è del tipo 

1.qual cosa. 

La rappresentazione in virgola mobile normalizzata in base 2 è quella utilizzata nello standard IEEE: i 

numeri si possono scrivere nella forma x = f 2 e . Al calcolatore, tuttavia, non possiamo rappresentare numeri 

con una mantissa a infinite cifre, perciò f = ±1.f −1 f −2 ... f −n e e = ±e Ne−1 e Ne−2 ...e 0 ., dove f −1 , f −2 ,..., f −n , 

e e Ne−1 ,e Ne−2 ,...,e 0 sono le cifre che caratterizzano rispettivamente la mantissa e l’esponente del numero 

in virgola mobile normalizzata in base 2, e quindi possono valere 1 o 0. Abbiamo n cifre per la mantissa (in 

realtà sono n + 1 ma poichè la rappresentazione è normalizzata f 0 = 1) e Ne per l’esponente. Nel sistema 

binario, le cifre vengono chiamate bits ( binary digits): quindi n bits sono riservati per la mantissa, Ne per 

l’esponente. 

Un numero in floating point nella rappresentazione IEEE viene scritto come 

x = ±(1 + f −1 2 −1 + f −2 2 −2 + ... + f −n 2 −n ) × 2 e 

dove 

G 1+ f −1 2 −1 + f −2 2 −2 +...+ f −n 2 −n è la mantissa, normalizzata, cui sono riservati 

un numero n di bits, 

G e è la potenza della base 2 cui sono riservati un numero Ne di bits ed è 

limitato a variare in un determinato intervallo [L,U ]. 

Il primo 1 della mantissa (che corrisponde a f 0 ) non viene messo in memoria ma c’è. La rappresentazione 

in virgola mobile può essere schematizzata nel modo seguente (s, e ed f rappresentano i bits riservati 

rispettivamente per il segno della mantissa, le cifre per l’esponente e quelle per la mantissa): 

s e e e e e ··· ··· e f f f f f ··· ··· f 

}{{} 

segno 

} {{ } 

cifre dell’esponente 

} {{ } 

cifre della mantissa 

Abbiamo 1 bit riservato al segno (si ha 0 per il segno + e 1 per il segno −), un numero Ne di bits per 

l’esponente 2 e , e un numero n di bits per la mantissa. 

La scelta del numero di bits da riservare all’esponente e alla mantissa si basa su un compromesso tra la 

dimensione dell’esponente (e quindi il più piccolo e il più grande numero rappresentabile) e la dimensione 

della mantissa (e quindi la precisione del numero rappresantibile, più o meno cifre decimali). 

Nel sistema IEEE, la rappresentazione in singola precisione è a 32 bits mentre quella in doppia precisione 

è a 64 bits. La suddivisione dei bits tra esponente e mantissa viene ripartita nel modo seguente: 

24

3.4. Rappresentazione IEEE dei numeri di macchina 

s Ne n # totale bits 

Singola precisione 1 8 23 32 

Doppia precisione 1 11 52 64 

Gli esponenti possono essere sia positivi sia negativi ma si preferisce memorizzarli come interi positivi 

(senza segno). Abbiamo dunque bisogno di una tecnica che permetta di rappresentare esponenti negativi 

come interi positivi. La tecnica utilizzata nello standard IEEE è chiamata di biasing (distorsione): un numero 

positivo (detto bias) viene aggiunto all’esponente (sia esso positivo o negativo) in modo che il risultato finale 

sia sempre positivo. Ed è questo valore che viene memorizzato per rappresentare l’esponente. L’esponente 

viene quindi rappresentato in forma biased (parziale, influenzata da un altro numero): se e è l’esponente 

effettivo, noi memorizziamo il valore b + e dove b è il bias dato b = 0111...1 

} {{ } 

, vale a dire b = 1 + 2 + 2 2 + ... + 

Ne bits 

2 Ne−2 + 0 · 2 Ne−1 = 1 − 2Ne−1 

= 2 Ne−1 − 1 (si veda la nota alla pagina seguente per capire perchè si ha questo 

1 − 2 

valore per b). 

Per trovare il limite superiore e inferiore entro cui può variare e, dobbiamo tener conto del fatto che, nella 

rappresentazione IEEE, due patterns di bits sono riservati per rappresentare numeri speciali quali lo zero, 

infinito e il Not-a-Number, precisamente 0000...0 e 1111...1. 

Quindi, b + e non può essere uguale nè a 0000...0, nè a 1111...1. Ciò significa che il massimo esponente 

che si può rappresentare è dato sottraendo a 1111...1 il valore 1 in base 2, cioè da 1111...1 − 0000...01 = 

1111...10. 

Si ha b + e ≤ 1111...10, o equivalentemente, 0111...1 + e ≤ 1111...10, da cui ricaviamo 

e ≤ 1111...10 − 0111...1 = 0111...1 = b 

. 

Il limite superiore U è proprio uguale a b. 

Per il limite inferiore abbiamo: 0000...0 

−b < e ⇔ −b + 0000...01 ≤ e. 

Quindi il limite inferiore è L = −(b − 1). 

In singola precisone, b = 0111...1 

} {{ } 

: in base 10 b = 127 10 , da cui l’intervallo [L,U ] = [−126,127]. 

8 bits 

In doppia precisione, invece, b = 1023 10 da cui [L,U ] = [−1022,1023]. 

Per quanto riguarda la mantissa, sono ad essa riservati n bits. Considerando anche l’1 della 

normalizzazione, la precisione è di n + 1 bits. 

Il più grande numero che si può rappresentare è, quindi 1 

n∑ 

1.111...1 

} {{ } 

×2 U = ( 2 −k ) × 2 U = 1 − 2−(n+1) 

k=0 

1 − 2 −1 2 U = (2 − 2 −n )2 U ≈ 2 U+1 

n bits 

Il più piccolo numero positivo rappresentabile è dato, invece, da: 

1.000...0 

} {{ } 

×2 L = 2 L 

n bits 

Se si vuole rappresentare un numero al di fuori di questo intervallo si ha overflow o underflow. 

In singola e doppia precisione abbiamo, per il più grande e il più piccolo numero positivo rappresentabile, 

i seguenti valori: 

1 È il risultato di una somma del tipo S = 1 + a + a 2 + ... + a n e vale il risultato S = 1 − a(n+1) , con a = 1 1 − a 

2 = 2−1 . Osserviamo, inoltre, 

che, dati n valori w 1 , w 2 ,..., w n usiamo la seguente simbologia per indicare la loro somma: 

. 

n∑ 

w i = w 1 + w 2 + w 3 + ... w n 

i=1 

25


Singola precisione Doppia precisione 

Massimo ≈ 3.4 × 10 38 ≈ 10 308 

Minimo ≈ 1.2 × 10 −38 ≈ 2.2 × 10 −308 

Esempio 3.4.1 Vogliamo scrivere il numero 5.75 10 in formato IEEE in singola precisione. 

Effettuiamo prima la conversione in base 2: 

Per la parte intera: 

Per la parte decimale: 

5 2 1 x 0 

.75 × 2 = 1.50 x −1 = 1 

2 1 0 x 1 

.5 × 2 = 1.0 x −2 = 1 

1 0 1 x 2 .0 × 2 = 0.0 

Quindi 5.75 10 = 101.11 2 = 1.0111 × 2 2 . 

Memorizziamo ora il numero in singola precisione: 

Per l’esponente, essendo p = 2, si ha: 

(b + p) 10 = (127 + 2) 10 = 129 10 = 10000001 2 

Per la mantissa, m = 23 e si deve trascurare l’1 della normalizzazione, quindi memorizzeremo le cifre 0111 

e poi avremo tutti 0. 

0 1 1 1 0 0 0 ... 0 0 0 0 0 0 0 0 0 0 

Il segno è positivo, quindi s = 0 

Perciò la memorizzazione, considerati i bits per il segno, l’esponente e la mantissa è: 

0 1 0 0 0 0 0 0 1 0 1 1 1 0 ... 0 0 0 0 0 

}{{} 

s 

} {{ } 

esponente 

} {{ } 

manti ssa 

Consideriamo, ora, la rappresentazione dei numeri speciali. 

Per convenzione si pone uguale a 0 la rappresentazione che vede tutti zero sia nel segno, sia nell’esponente 

che nella mantissa (non dimentichiamo che il valore 1 della normalizzazione non è messo in memoria 

ma c’è e quindi non potremmo mai avere il valore 0, perciò lo si pone per convenzione). 

Per i valori ±∞ si considerano tutti 1 nello spazio dedicato all’esponente, tutti 0 nello spazio dedicato alla 

mantissa e 0 o 1 per il segno, a seconda che sia + o −∞. 

0 / 1 1 1 1 ... 1 1 0 0 0 ... 0 0 

}{{} 

s 

} {{ } 

esponente 

} {{ } 

mantissa 

I valori ±∞ si hanno se si fa una divisione per zero o si fa un calcolo che comporta overflow. 

Si ha invece il Not-a-Number (NaN) come risultato di operazioni non definite, come 0/0 o log0. 

A seconda della macchina si ha: 

NaNS, che produce un segnale di errore 

0 1 1 1 ... 1 1 0 1 1 ... 1 1 

}{{} 

s 

} {{ } 

esponente 

} {{ } 

mantissa 

NaNQ, con il quale il calcolo continua comunque... 

0 1 1 1 ... 1 1 1 0 0 ... 0 0 

}{{} 

s 

} {{ } 

esponente 

} {{ } 

mantissa 

26

3.5. Precisione numerica 

3.5 Precisione numerica 

Un numero può avere una rappresentazione finita o infinita. Basti pensare al valore di π o a 2 in base 10. 

Abbiamo anche visto che un numero può avere rappresentazione finita in una base ma infinita in un’altra. 

Quando rappresentiamo un numero al calcolatore è possibile memorizzare solo un certo numero di cifre: 

in che modo lo esprimiamo? 

Per lasciare maggiore generalità al discorso, consideriamo una base N . 

Sia x = ±( ∑ ∞ 

k=0 x −k N −k )N p il numero esatto (può avere infinite cifre decimali e lo rappresentiamo come 

somma di infiniti termini). 

In floating-point esso sarà espresso come x ∗ = ±( ∑ t−1 

k=0 x∗ −k N −k )N p∗ , esso, cioè, sarà arrotondato (non 

possiamo avere infinite cifre decimali e, difatti, la somma considera solo t termini). 

Ci sono due modi per arrotondare un numero 

G troncamento: x ∗ = tr onc(x), dove p ∗ = p e x ∗ −k = x −k per k = 0,..., t − 1. Le altre cifre, x −t , x −t−1 ,... 

sono ignorate. 

G arrotondamento simmetrico: x ∗ = ar r (x) = tr onc(x + 1 2 N −t+1 N p ), aggiungiamo un’unità a x −t+1 se 

x −t ≥ N /2. 

L’errore assoluto |x − x ∗ | che si commette approssimando il numero x con x ∗ sarà 2 

⎧ 

⎨N N p nel troncamento 

|x − x ∗ | ≤ 1 

⎩ 

2 N 1−t N p nell’arrotondamento 

Per l’errore relativo |x − x∗ | 

, invece, si ha: 

|x| 

⎧ 

|x − x ∗ | 

⎨N 1−t nel troncamento 

≤ 1 

|x| ⎩ 

2 N 1−t nell’arrotondamento 

Il valore 1 2 N 1−t è il numero conosciuto come precisione di macchina. 

Nel caso della rappresentazione IEEE di un numero, si ha t−1 = n, (ricordiamo che nella rappresentazione 

IEEE si memorizza il numero normalizzato), da cui l’errore di arrotondamento relativo che si commette è 

|x − x ∗ | 

≤ 2 −(n+1) . 

|x| 

In singola precisione (n = 23), avremo 

Esempio 

|x − x ∗ | 

≤ 2 −24 ≈ 5.96 × 10 −8 

|x| 

ciò significa che avremo 8 cifre decimali corrette. 

In doppia precisione (n = 52) avremo 

|x − x ∗ | 

≤ 2 −53 ≈ 1.11 × 10 −16 

|x| 

ciò significa che avremo 16 cifre decimali corrette. 

2 Evitiamo di effettuare tutti i passaggi che portano alle formule dell’errore assoluto e relativo, che sono il risultato di maggiorazioni 

di serie geometriche. 

27


3.6 Propagazione degli errori 

Prima di vedere come si propagano gli errori nelle operazioni elementari di moltiplicazione, divisione, 

addizione e sottrazione, vediamo il concetto di cifre significative. 

Le cifre significative sono quelle che danno un’informazione effettiva sul valore del numero, 

indipendentemente dalla parte esponenziale. 

Se scriviamo il numero in virgola mobile normalizzata, le cifre significative sono date dalle cifre della 

parte frazionaria. La bontà delle cifre va diminuendo procedendo da sinistra verso destra e questo può portare 

ad una perdita di cifre significative, come possiamo vedere studiando la propagazione degli errori nelle 

operazioni elementari. 

Supponiamo che i numeri su cui lavoriamo siano affetti da errore (di arrotondamento), mentre le operazioni 

siano eseguite in modo esatto. Indichiamo con il simbolo o una qualunque delle operazioni elementari 

{×,/,+,−} e indichiamo con f l(x) il numero x rappresentato in floating point e arrotondato, quindi 

f l(x) = x(1 + e x ) dove e x è l’errore di arrotondamento. 

Allora f l(x o y) = f l(x)o f l (y) = x(1 + e x )o y(1 + e y ). 

G Moltiplicazione 3 x(1 + e x ) × y(1 + e y ) = x × y(1 + e x )(1 + e y ) ≈ x × y(1 + e x + e y ) 

Sulla cancellazione 

Quindi l’errore nel prodotto è dato da e x y = e x + e y 

G Divisione (con y ≠ 0) 4 x(1 + e x ) 

y(1 + e y ) = x y (1 + e x)(1 − e y + e 2 y + ...) ≈ x y (1 + e x − e y ) 

Si ha e x/y = e x − e y : gli errori si accumulano additivamente 

G Addizione (e, analogamente, Sottrazione) 

x(1 + e x ) + y(1 + e y ) = x + y + xe x + ye y = (x + y)(1 + x 

x + y e x + 

y 

x + y e y ) 

L’errore è e x+y = 

x 

x + y e x + 

y 

x + y e y , una combinazione lineare che dipende da x e y. 

– x y > 0 =⇒ |e x+y | ≤ |e x | + |e y | 

– x y < 0 =⇒ |x| 

|x + y| e |y| 

possono essere molto grandi e, in tal caso, ci sarà un’amplificazione 

|x + y| 

notevole dell’errore. Si ha il fenomeno di cancellazione se non si fa attenzione al numero di cifre 

significative dei numeri che vengono sommati. 

Supponiamo di avere due numeri molto vicini tra loro, in cui le prime p + 2 cifre della parte frazionaria 

sono buone mentre le altre sono corrotte. Inoltre, le prime p cifre siano le stesse per entrambi i numeri 

(usiamo i simboli v v v v v e w w w w w w per esprimere le cifre corrotte): 

f l(x) = 1.d −1 d −2 ...d −p b −(p+1) b −(p+2) v v v v × 2 e 

f l(y) = 1.d −1 d −2 ...d −p b ′ −(p+1) b′ −(p+2) w w w w × 2e 

Quando andiamo a fare la sottrazione le prime p cifre buone si annullano. Da p + 2 cifre buone, ne abbiamo 

ora solo 2 e tutte le altre sono quelle corrotte. Con la normalizzazione il risultato diventa del tipo (ora qqqqq 

sono le cifre corrotte): 

f l(x − y) = 1.b −1 ′′ b′′ −2qqqqqq × 2e 

3 Nei calcoli sono trascurabili le potenze maggiori o uguali a due per e x e e y 

4 1 

Possiamo scrivere = (1 − e y + e 2 y 

1 + e + ...) come risultato della formula polinomiale di Taylor della funzione f (e 1 

y ) = di 

y 1 + e y 

centro 0. 

28

3.6. Propagazione degli errori 

Ricordiamo, infine, che in aritmetica di macchina non valgono più la proprietà distributiva o associativa 

del prodotto. 

Esempio 3.6.1 Sia x = 0.1103 e y = 0.009963. Se consideriamo un sistema decimale a 4 cifre, 

normalizzando i numeri, abbiamo x = 1.103 · 10 −1 e y = 9.963 · 10 −3 

Facendo la sottrazione di questi due numeri, abbiamo 1.103 · 10 −1 − 9.963 · 10 −3 = 0.1103 − 0.009963 = 

0.100337. Facendo l’arrotondamento a 4 cifre abbiamo il valore 1.0034 · 10 −1 . 

|0.100337 − 0.10034| 

L’errore relativo che commettiamo è: ≈ 2.99 × 10 −5 . Questo errore è minore della 

0.100337 

precisione di macchina (considerata la base 10 e le 4 cifre) 1 2 · 10−3 . 

Tuttavia, se non teniamo conto delle cifre significative ma tronchiamo i numeri alle prime 4 cifre, abbiamo 

la sottrazione di 0.1103 − 0.0099 = 0.1004. 

|0.100337 − 0.1004| 

Questa volta l’errore relativo è ≈ .63 × 10 −3 . L’errore è maggiore della precisione di 

0.100337 

macchina. 

Esempio 3.6.2 Sia da risolvere l’equazione ax 2 +bx+c = 0 con a = 1, b = −56 e c = 1, quindi x 2 −56x+1 = 0, 

in una macchina a 4 cifre decimali (normalizzata). 

Applicando la formula x 1/2 = −b ± b 2 − 4ac 

abbiamo x 1/2 = 28 ± 783 = 28 ± 27.98213716 = 

{ 2a 

0.01786284073 

. L’arrotondamento delle due radici in virgola mobile normalizzata a 4 cifre decimali 

55.98213716 

dà: x 1 = 1.7863 · 10 −2 e x 2 = 5.5982 · 10 1 . 

Consideriamo ora la macchina a 4 cifre decimali per risolvere l’equazione: 

x 1 = 28 − 783 = 2.8 · 10 1 − 2.7982 · 10 1 = 0.0018 · 10 1 = 0.018 = 1.8 · 10 −2 

x 2 = 28 + 783 = 2.8 · 10 1 + 2.7982 · 10 1 = 5.5982 · 10 1 

La radice x 2 è arrotondata correttamente, mentre la variabile x 1 no, per effetto della cancellazione. 

Poichè vale x 1 x 2 = c/a, nel nostro caso deve valere x 1 x 2 = 1 da cui x 1 = 1/x 2 = 1/(5.5982·10 1 ) = 1.7863·10 −2 

Esempio 3.6.3 Vediamo come non valga più la relazione (a − b) 2 = a 2 − 2ab + b 2 . 

Sia a = 15.6 e b = 15.7 e la macchina sia a 3 cifre decimali (non normalizzata, per cui scriveremo la parte 

frazionaria come 0.qual cosa). 

(a − b) = (a − b) ∗ + e a−b . Abbiamo (a − b) ∗ = 15.6 − 15.7 = −0.1. 

Quindi (a − b) 2 = +0.01 = 0.1 · 10 −1 . 

Consideriamo ora a 2 − 2ab + b 2 = 243.36 − 489.84 + 246.49 = 0.24336 · 10 3 − 0.48984 · 10 3 + 0.24649 · 10 3 

Considerando la macchina a 3 cifre decimali, abbiamo: 0.243 · 10 3 − 0.490 · 10 3 + 0.246 · 10 3 = −0.1 · 10 1 

I risultati sono completamente diversi! 

29


Esempio 3.6.4 Consideriamo il problema di approssimare la derivata della funzione f (x) = sin x nel punto 

x = 1.2. 

Supponiamo di non poter valutare direttamente la derivata della f e di volerla approssimare applicando 

la formula polinomiale di Taylor: 

f (x 0 + h) = f (x 0 ) + h f ′ (x 0 ) + h2 

2 f ′′ (x 0 ) + h3 

6 f ′′′ (x 0 ) + h4 

24 f IV (x 0 ) + ... 

Allora 

f ′ (x 0 ) = f (x 0 + h) − f (x 0 ) 

− ( h h 

2 f ′′ (x 0 ) + h2 

6 f ′′′ (x 0 ) + h3 

24 f IV (x 0 ) + ...) 

Approssimiamo, quindi, la f ′ (x 0 ) calcolando f (x 0 + h) − f (x 0 ) 

. 

h 

L’errore di discretizzazione che si commette è 

|f ′ (x 0 ) − f (x 0 + h) − f (x 0 ) 

| = | h h 

2 f ′′ (x 0 ) + h2 

6 f ′′′ (x 0 ) + h3 

24 f IV (x 0 ) + ...| 

Supponendo di conoscere il valore della derivata seconda in x 0 , per piccoli valori di h possiamo dare una 

stima dell’errore di discretizzazione, 

|f ′ (x 0 ) − f (x 0 + h) − f (x 0 ) 

| ≈ h h 

2 |f ′′ (x 0 )| 

Ci aspettiamo, anche senza conoscere il valore di f ′′ (x 0 ) (purchè diverso da 0) che l’errore di discretizzazione 

diminuisca proporzionalmente con il passo h, al decrescere di h. 

Nel nostro caso, in cui f (x) = sin(x), noi conosciamo il valore esatto della derivata in 1.2, vale a dire 

cos(1.2) = 0.362357754476674... 

Il valore che otteniamo approssimando la derivata con la formula che abbiamo ricavato, per h = 0.1 non è 

molto accurato. Ci aspettiamo che diminuendo il passo h l’errore che commettiamo diminuisca. 

Riportiamo gli errori della formula (in valore assoluto) e confrontiamoli con l’errore di discretizzazione 

h 

2 |f ′′ (x 0 )| (i conti sono fatti in singola precisione): 

h errore 

h 

2 |f ′′ (x 0 )| 

1.e-1 4.7167e-2 4.6602e-2 

1.e-2 4.6662e-3 4.6602e-3 

1.e-3 4.6608e-4 4.6602e-4 

1.e-4 4.6603e-5 4.6602e-5 

1.e-5 4.6602e-6 4.6602e-6 

1.e-6 4.6597e-7 4.6602e-7 

L’errore commesso dall’algoritmo decresce come h e, in particolare, come h 2 |f ′′ (1.2)| = 0.46602h. 

Possiamo pensare di ottenere un’accuratezza grande quanto vogliamo a condizione di prendere valori di h 

sempre più piccoli. In realtà, per valori di h molto piccoli, gli errori iniziano ad aumentare! 

h errore 

h 

2 |f ′′ (x 0 )| 

1.e-8 4.3611e-10 4.6602e-9 

1.e-9 5.5947e-8 4.6602e-10 

1.e-10 1.6697e-7 4.6602e-11 

1.e-11 4.6603e-5 4.6602e-12 

1.e-12 1.3006e-4 4.6602e-13 

1.e-13 4.2505e-4 4.6602e-14 

1.e-16 3.6236e-1 4.6602e-16 

1.e-18 3.6236e-1 4.6602e-19 

30

3.6. Propagazione degli errori 

In Figura 3.6 vediamo come la curva dell’errore inizialmente segue la retta descritta dall’errore di discretizzazione 

ma poi si allontana da essa. Perchè questo diverso comportamento per valori di h molto piccoli? 

L’errore che noi valutiamo è dato dalla somma dell’errore di discretizzazione e dell’errore di arrotondamento. 

Per valori di h grandi, l’errore di discretizzazione descresce al diminuire di h e domina l’errore di 

arrotondamento. Ma quando l’errore di discretizzazione diventa molto piccolo, per valori di h minori di 

10 −8 , allora l’errore di arrotondamento inizia a dominare e ad aumentare sempre più al diminuire di h. 

Questo è un motivo per cui si deve richiedere ad un algoritmo che l’errore di discretizzazione sia quello 

che debba prevalere. Nell’errore di arrotondamento, per h via via più piccoli, si verifica un errore di cancellazione: 

f (x 0 + h) è praticamente uguale a f (x 0 ) per h molto piccoli! per cui l’errore che calcoliamo è 

|f ′ (x 0 ) − 0| = f ′ (x 0 ) = 0.3623577544.... 

Una strategia per evitare la cancellazione è di scrivere diversamente la differenza f (x 0 +h)− f (x 0 ). Nel caso 

di f (x) = sin(x) ricorriamo alla formula trigonometrica per cui sin(φ) − sin(ψ) = 2cos( φ + ψ )sin( φ − ψ ). 

2 2 

Vediamo come migliorano le cose inserendo nel grafico 3.6 anche la curva dell’errore che otteniamo utilizzando 

questa espressione trigonometrica. L’errore continua a diminuire anche quando la formula precedente 

dà un errore crescente. Sempre in Figura 3.6, e in riferimento alla formula “non buona”, abbiamo 

considerato la curva dell’errore di arrotondamento in modo da confrontare l’andamento effettivo dell’errore 

con un limite superiore teorico dell’errore computazionale totale dato dalla somme degli errori 

di discretizzazione e di arrotondamento. La rappresentazione di f (x) è affetta da errore per cui avremo: 

f (x) = f ∗ (x)+e x . L’errore di arrotondamento è f (x 0 + h) − f (x 0 ) 

= f ∗ (x 0 + h) − f ∗ (x 0 ) 

+ e x 0 +h − e x0 

. Maggiorando 

e x con la precisione di macchina ɛ, l’errore di arrotondamento è dato da 2ɛ/h: per h piccoli è 

h 

h 

h 

l’errore che predomina! 

Figura 3.4: Errore di discretizzazione ed effettivo approssimando f ′ (x 0 ) con il rapporto incrementale 

f (x 0 + h) − f (x 0 ) 

. 

h 

31


Figura 3.5: Errori di discretizzazione, di arrotondamento, ed errore effettivo approssimando f ′ (x 0 ) con il 

rapporto incrementale f (x 0 + h) − f (x 0 ) 

, ed errore che si commette applicando la formula trigonometrica 

h 

per cui f (x 0 + h) − f (x 0 ) = sin(x 0 + h) − sin(x 0 ) = 2cos(2x 0 + h/2)sin(h/2). 

3.7 Instabilità e malcondizionamento 

3.7.1 Instabilità 

In generale è impossibile evitare un accumulo lineare degli errori di arrotondamento durante un calcolo, 

ed è accettabile che ci sia una crescita lineare moderata, del tipo 

E n ≈ c 0 nE 0 

dove E n misura l’errore relativo dell’n-sima operazione dell’algoritmo 5 e c 0 sia una costante non molto 

grande. 

Se invece avviene una crescita di tipo esponenziale 

E n ≈ c n 1 E 0 

allora l’algoritmo è instabile. Algoritmi del genere devono essere evitati! 

Definizione 3.7.1 Un procedimento numerico si dice instabile se gli errori che vi sono associati non rimangono 

limitati ma crescono fino a distruggere completamente la soluzione. 

5 Per algoritmo intendiamo un procedimento di calcolo. Per una definizione più approfondita si veda pag. 161 al Capitolo 11. 

32

3.7. Instabilità e malcondizionamento 

Esempio 3.7.1 Consideriamo l’integrale 

∫ 1 

x n 

y n = 

0 x + 10 dx 

per valori di n = 1,2,...,30. Osserviamo che, poichè x ∈ [0,1], la funzione integranda varia pure essa 

nell’intervallo [0,1] per cui 0 < y n < 1. 

Analiticamente, si ha: 

∫ 1 

x n + 10x n−1 ∫ 1 

x n−1 ∫ 

(x + 10) 

1 

y n + 10y n−1 = 

dx = 

dx = x n−1 dx = 1 

0 x + 10 

0 x + 10 

0 

n 

Vale anche∫la relazione 

1 

1 

y 0 = 

dx = ln(11) − ln(10). 

0 x + 10 

Possiamo pensare, quindi, di calcolare numericamente il valore di y n attraverso il seguente algoritmo: 

1. valutare y 0 = ln(11) − ln(10) 

2. per n = 1,2,...,30 valutare y n = 1 n − 10y n−1 

Questa formula ricorsiva dovrebbe dare l’esatto valore se non fossero presenti errori di arrotondamento che 

ci allontanano completamente dalla soluzione vera. I numeri che generiamo, infatti, tendono a zero mentre 

l’errore si moltiplica. Infatti 

y 1 = 1 − 10y 0 

y 2 = 1 2 − 10(1 − 10y 0) = 1 2 − 10 + (−10)2 y 0 

y 3 = 1 3 − 10( 1 2 − 10 + 102 y 0 ) = −10 3 y 0 + cost ante 

. . . . 

y n = (−10) n y 0 + cost ante n 

L’algoritmo quindi, considerati gli errori di arrotondamento, presenta un errore E n con crescita di tipo 

esponenziale. Difatti otteniamo valori che via via si allontanano dall’intervallo di ammissibilità [0,1]. 

I risultati che ricaviamo sono i seguenti (osserviamo che sono leggermente diversi a seconda dal linguaggio 

usato, proprio per effetto dell’instabilità). 

Da un programma in Fortran: 

Da un programma Matlab: 

n y n 

0 9.5310e-2 

1 4.6898e-2 

2 3.1021e-2 

3 2.3122e-2 

4 1.8778e-2 

... .... 

7 -3.0229e-1 

8 3.1479e+0 

9 -3.1368e+1 

10 3.1378e+2 

18 3.1377e+10 

27 -3.1377e+19 

30 3.1377e+22 

n y n 

0 9.5310e-2 

1 4.6898e-2 

2 3.1018e-2 

3 2.3154e-2 

4 1.8465e-2 

... .... 

7 1.1481-2 

8 1.0194e-2 

9 9.1673e-3 

10 8.3270e-3 

18 -9.1694e+1 

27 -9.1699e+9 

30 -9.1699e+13 

33


Se invece, considero y n−1 = 1 

10 ( 1 n − y n), partendo da un valore di n molto grande e andando a ritroso, 

l’errore diminuisce. Perciò, dato un valore di accuratezza ɛ > 0 e fissato un intero n 1 è possibile determinare 

l’intero n 0 tale che, partendo da y n0 = 0 e andando a ritroso, gli integrali y n saranno valutati con un errore 

in valore assoluto minore di ɛ per 0 < n ≤ n 1 . Infatti: 

y n0 = 0 

y n0 −1 = 1 1 

10 

n 0 

y n0 −2 = 1 

10 ( 1 

n 0 − 1 − 1 

10 

. . . 

y n = 

1 

) = 

n 0 

1 

(−10) n 0−n n 0 

+ cost ante n0 −n 

1 

(−10) 2 n 0 

+ cost ante 

1 

L’errore al passo n dipende, quindi, (in valore assoluto) da 

10 n 0−n . 

Se richiediamo una tolleranza ɛ = 10 −6 , per calcolare y n0 allora dovrà essere 

1 

10 n < ɛ cioè 10 n 1−n 0 

< ɛ 

0−n 1 

Passando al logaritmo in base 10: 

n 1 − n 0 < logɛ =⇒ n 0 > n 1 − logɛ 

Per n 1 = 20 si ricava n 0 = 26. 

Questa volta i calcoli danno gli stessi risultati sia in Matlab sia in Fortran: 

n y n n y n 

26 0.000000 11 7.62944e-3 

25 3.84615e-3 10 8.32797e-3 

24 3.61538e-3 9 9.16720e-3 

23 3.80513e-3 8 1.01944e-2 

22 3.96731e-3 7 1.14806e-2 

21 4.14872e-3 6 1.31377e-2 

20 4.34703e-3 5 1.53529e-2 

19 4.56530e-3 4 1.84647e-2 

18 4.80663e-3 3 2.31535e-2 

17 5.07489e-3 2 3.10180e-2 

16 5.37486e-3 1 4.68982e-2 

15 5.71251e-3 0 9.53102e-2 

14 6.09542e-3 

13 6.53332e-3 

12 7.03898e-3 

Osserviamo come il valore y 0 coincida con il valore teorico noto. 

L’esempio appena visto ci porta a dare alcune considerazioni sui criteri su cui si deve basare un algoritmo: 

un algoritmo deve essere accurato, efficiente e robusto, accurato nel senso che bisogna essere in grado 

di sapere la grandezza dell’errore che si commette nell’algoritmo stesso; efficiente in termini di velocità di 

esecuzione e di richiesta di spazio di memoria per le variabili utilizzate; robusto nel dare il risultato corretto 

entro un livello di tolleranza dell’errore che sia accettabile. 

34

3.7. Instabilità e malcondizionamento 

Figura 3.6: Esempio: malcondizionamento 

3.7.2 Malcondizionamento 

Definizione 3.7.2 Un problema si dice malcondizionato se a piccole variazioni nei dati di input del problema 

corrispondono forti variazioni nei dati di output. 

Quando il problema è molto sensibile alle variazioni dei dati di input, producendo risultati molto diversi tra 

loro, allora nessun algoritmo, per quanto robusto e stabile, potrà dare una soluzione robusta al problema 

stesso. 

Esempio 3.7.2 Il problema del calcolo delle radici di un polinomio p(x) di grado n è un esempio di 

problema malcondizionato. 

Sia p(x) = a 0 + a 1 x + a 2 x 2 +...+ a n x n . I dati di input del problema sono i coefficienti a 0 , a 1 ,..., a n . I dati di 

output sono le radici del polinomio. 

Si può provare che a piccole variazioni sui dati iniziali, corrispondono grandi variazioni sui risultati. 

Vediamo il caso del polinomio p(x) = (x − 1)(x − 2)···(x − 10). Chiaramente, tale polinomio ha radici 

1,2,...,10. Se perturbiamo il polinomio variando il coefficiente a 9 del valore di 0.00001, considerando quindi 

il polinomio p(x) + 0.00001x 9 , le radici corrispondenti si discostano di poco da quelle del polinomio di 

partenza, come si può notare in Figura 3.7.2. Ma se variamo il coefficiente a 9 del valore 0.0001, considerando 

cioè il polinomio p(x)+0.0001x 9 allora le radici corrispondenti a x 7 , x 8 , x 9 , x 10 non saranno più reali ma 

avranno anche una parte immaginaria. 

La piccola variazione sui dati di ingresso, quindi, provoca una grande variazione sui dati in uscita, proprio 

perchè il problema è malcondizionato. 

35


indice di 

condizionamento 

Una quantità che misura il grado di sensibilità di un problema – fornendoci indicazioni sul fatto che a 

piccole variazioni sui dati di ingresso del problema ci possono essere piccole o grandi variazioni sui dati di 

uscita – si chiama indice di condizionamento (o numero di condizionamento) del problema. 

Diamo la definizione nel caso in cui il nostro problema si possa identificare come una funzione f : R −→ 

R. Il valore y = f (x) è il valore di uscita del problema f . Vogliamo vedere cosa succede se il dato di ingresso 

non è più x ma x + ∆x. ∆x rappresenta quindi una perturbazione sul dato iniziale. Assumiamo x ≠ 0, y ≠ 0. 

Applichiamo la formula di Taylor di centro x. Si ha: 

f (x + ∆x) = f (x) + f ′ (x)∆x +O(∆x 2 ) ≈ f (x) + f ′ (x)∆x 

La variazione sul dato d’uscita è data dalla differenza f (x + ∆x) − f (x). Chiamiamo questa differenza con 

∆y. Quindi ∆y = f (x + ∆x) − f (x) ≈ f ′ (x)∆x (utilizziamo il risultato ottenuto dalla formula di Taylor). 

Se utilizziamo gli errori relativi, abbiamo (e sapendo che y = f (x)): 

∆y 

y 

∆y 

y 

≈ f ′ (x)∆x 

f (x) 

Moltiplico poi numeratore e denominatore a secondo membro per x 

≈ x f ′ (x) ∆x 

f (x) x 

Al limite per ∆x → 0, questa uguaglianza approssimata (abbiamo usato il simbolo ≈) diventa una vera 

uguaglianza. Questo suggerisce di definire l’indice di condizionamento di f mediante la formula 

(cond f )(x) = 

x f ′ (x) 

∣ 

f (x) 

∣ 

Questo numero ci dice quanto grandi sono le perturbazioni relative per y confrontate con le relative 

perturbazioni di x. 

Per x = 0 e y ≠ 0, non ha senso considerare l’errore relativo ∆x , e si considera l’errore assoluto su x. In tal 

x 

caso, si definisce indice di condizionamento la quantità 

(cond f )(x) = 

f ′ (x) 

∣ 

f (x) 

∣ 

Per x = y = 0 si considera invece l’errore assoluto sia per x che per y, dimodochè l’indice di 

condizionamento diventa 

(cond f )(x) = |f ′ (x)| 

Esempio 3.7.3 Sia f (x) = x 1/α , con x > 0 e α > 0. Calcoliamo l’indice di condizionamento applicando la 

formula (poichè abbiamo supposto x > 0, si ha f (x) ≠ 0). Risulta 

∣ (cond f )(x) = 

x f ′ ∣∣∣∣∣∣ 

(x) 

x 1 ∣ ∣∣∣∣∣∣ ∣ 

f (x) 

∣ = α x1/α−1 

= 1 α 

x 1/α 

Per α grande, (cond f )(x) tende a zero, quindi abbiamo un problema bencondizionato. Se, invece α è molto 

piccolo si ha un problema malcondizionato (se α = 10 −10 , si ha f (x) = x 1010 e (cond f )(x) = 10 10 , un valore 

molto grande). 

36


4 

ZERI DI FUNZIONE 

Non so come il mondo potrà 

giudicarmi ma a me sembra 

soltanto di essere un bambino che 

gioca sulla spiaggia, e di essermi 

divertito a trovare ogni tanto un 

sasso o una conchiglia più bella del 

solito, mentre l’oceano della verità 

giaceva insondato davanti a me. 

Isaac Newton 

4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

4.2 Metodo delle Bisezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

4.3 Metodo del Punto Fisso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4.4 Il Metodo di Newton-Raphson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

4.5 Convergenza di un metodo iterativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 

4.6 Complessità computazionale di uno schema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.7 Il metodo delle secanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.8 Confronto tra i metodi di Newton-Raphson e la Regula Falsi . . . . . . . . . . . . . . . . . . . . . . 50 

4.9 Metodo di Newton-Raphson per radici multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

4.10 Controllo sugli scarti e grafici di convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

4.11 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 


Il problema di calcolare la radice quadrata di un numero è un problema molto antico. Già gli antichi 

Babilonesi, intorno al 1700 a.C., se lo erano posto e avevano trovato la soluzione: per calcolare b, partivano 

da un certo valore x che si avvicinava alla soluzione, dividevano b per questo numero, e facevano poi la 

media, iterando il procedimento. L’algoritmo si può schematizzare nel modo seguente: 

G partire da x 0 prossimo a b; 

G considerare x 1 = 1 2 (x 0 + b x 0 

); 

G generalizzando: x n+1 = 1 2 (x n + b x n 

). 

37

4. ZERI DI FUNZIONE 

Per esempio, per calcolare 2 ≈ 1.41421356237310, sapendo che il valore che dobbiamo approssimare è 

compreso tra 1 e 2, possiamo partire da x 0 = 1.5, ottenendo: 

x 0 = 1.5 

x 1 = 1 2 (1.5 + 2 

1.5 ) = 1.41666667 

x 2 = 1 2 (1.41666667 + 2 

1.41666667 ) = 1.41421569 

x 3 = 1 2 (1.41421569 + 2 

1.41421569 ) = 1.41421356 

Il metodo usato dai Babilonesi non è altro che il metodo di Newton-Raphson (che vedremo più avanti) 

per trovare gli zeri della funzione f (x) = x 2 − b. 

I metodi numerici discussi in questo Capitolo servono per trovare approssimazioni numeriche ad 

equazioni del tipo f (x) = 0. 

4.2 Metodo delle Bisezioni 

Sia data una funzione f continua in un intervallo [a,b], con f (a) e f (b) che assumono valori di segno 

opposto. Allora, per il teorema del Valore Intermedio (si veda il Teorema 2.5.5 con K = 0), esiste almeno un 

punto ξ ∈]a,b[ tale che f (ξ) = 0. 

Assumiamo, per semplicità che ci sia una sola radice ξ nell’intervallo ]a,b[ (nel caso ci sia più di una 

radice, la procedura che ora descriviamo vale sempre, e ci permette di calcolare una di queste radici). 

Il metodo delle bisezioni (detto anche metodo dicotomico) si chiama così perchè, ad ogni passo, viene 

dimezzato l’intervallo precedente, cercando in tal modo di racchiudere la radice ξ in sottointervalli sempre 

più piccoli. 

G Si pone a 1 = a e b 1 = b. Si prende il punto medio dell’intervallo [a 1 ,b 1 ], c 1 = a 1 + b 1 

. 

G Se f (c 1 ) = 0 allora abbiamo trovato la radice dell’equazione, altrimenti si va a controllare il segno di 

f (c 1 ). 

– Se f (c 1 ) e f (a 1 ) hanno lo stesso segno, allora ξ si trova nell’intervallo ]c 1 ,b 1 [ (applicando di nuovo 

il teorema del Valore Intermedio). In tal caso porremo a 2 = c 1 e b 2 = b 1 . 

– Se, invece, f (c 1 ) e f (b 1 ) hanno lo stesso segno, allora ξ si trova nell’intervallo ]a 1 ,c 1 [ In tal caso 

porremo a 2 = a 1 e b 2 = c 1 . 

G Riapplichiamo questa procedura appena descritta sul sottointervallo [a 2 ,b 2 ] 

G Fermiamo il procedimento ad una certa iterazione n, se f (c n ) = 0 o se l’ampiezza del sottointervallo 

è sufficientemente piccola, cioè b n − a n 

≤ tol l dove tol l è una certa tolleranza prefissata. In tal caso 

2 

assumiamo c n come approssimazione della radice ξ. 

Osserviamo che, ad ogni passo, viene dimezzato l’intervallo in cui si trova la radice ξ, da cui 

|ξ − c n | ≤ b − a 

2 n . 

Da questa relazione, si può determinare il numero di iterazioni n necessarie per calcolare un’approssimazione 

della radice ξ entro una certa tolleranza tol richiesta. Infatti 

Ma 

b − a 

2 n ≤ tol =⇒ |ξ − c n | ≤ tol 

b − a 

2 n ≤ tol ⇐⇒ 2 n ≥ b − a =⇒ n ≥ 

tol 

log((b − a)/tol ) 

. 

log(2) 

L’algoritmo di bisezione può essere descritto nel modo seguente (sotto forma di pseudo-codice). Se il 

metodo non converge (perchè, ad esempio, la funzione che abbiamo scelto non assume segno opposto agli 

estremi dell’intervallo), il procedimento iterativo potrebbe entrare in stallo (pensiamo ad un programma da 

fare eseguire al calcolatore) e quindi conviene introdurre un numero massimo di iterazioni, che viene indicato 

con itmax. 

2 

38

4.3. Metodo del Punto Fisso 

Figura 4.1: Metodo delle Bisezioni 

Dati di input: a, b, tol , i tmax 

Dati di output: soluzione approssimata c o messaggio di fallimento 

1 verificare che f (a)f (b) < 0, altrimenti non si può implementare il metodo ; 

2 n ←− 1 ; 

3 c ←− (a + b)/2 ; 

4 scar to ←− |b − a|/2 ; 

5 Fintantochè n ≤ i tmax e ( f (c) ≠ 0 e scar to > tol ) 

6 n ←− n + 1 (incrementa n) ; 

7 Se f (a)f (c) > 0 allora 

8 a ←− c 

9 altrimenti 

10 b ←− c 

11 Fine-Se 

12 aggiorna c ; 

13 aggiorna scar to ; 

14 Fine-Fintantochè 

15 Se f (c) = 0 o scar to ≤ tol allora 

16 c è la soluzione approssimata 

17 altrimenti 

18 n > i tmax ; 

19 il metodo è fallito dopo i tmax iterazioni ; 

20 Fine-Se 

4.3 Metodo del Punto Fisso 

Il problema f (x) = 0 può essere reso equivalente alla ricerca del punto fisso di una opportuna funzione g 

(vale a dire del problema g (x) = x). 

( x 

) 2−sin(x) ( x 

) 2−sin(x)+x 

Ad esempio, da f (x) = 

= 0, aggiungendo ad ambo i membri x, otteniamo = x 

( 2 

2 

x 

) 2 

da cui poniamo g (x) = − sin(x) + x. Le radici della f coincidono con i punti fissi della g . 

2 

Definizione 4.3.1 Data una funzione g , si definisce punto fisso della g , quel punto 

ξ che soddisfa la relazione g (ξ) = ξ 

39


Una funzione può ammettere uno o più punti fissi o non ammetterne affatto. 

Un modo per calcolare un punto fisso di una funzione g è dato da iterazioni successive sulla funzione g 

stessa. 

Esempio 4.3.1 Supponiamo che la funzione g sia g (x) = cos(x). Prendiamo come valore iniziale x 0 = 1. 

Con una calcolatrice, andiamo a calcolare (in modalità radianti!) il suo coseno: ricaviamo x 1 = cos(x 0 ) = 

g (x 0 ) = 0.54030230. Successivamente, calcoliamo il coseno di x 1 , ottenendo x 2 = cos(x 1 ) = 0.857553216. 

Osserviamo che x 2 = cos(x 1 ) = cos(cos(x 0 )) e non cos 2 (x 0 )! Abbiamo innescato, in questo modo, un procedimento 

iterativo per cui x n+1 = cos(x n ) = g (x n ). Con la calcolatrice, basta digitare sulla funzione cos ogni 

volta in modo da avere i nuovi valori della successione x n+1 . I primi numeri che otteniamo non sono molto 

importanti. Quelli importanti sono quelli che si hanno dopo 15, 30 o 100 passi. Nel nostro caso, abbiamo 

n x n 

5 0.7013687746 

11 0.7356047404 

13 0.7414250866 

14 0.7375068905 

15 0.7401473356 

29 0.7390893414 

30 0.7390822985 

56 0.7390851333 

57 0.7390851332 

58 0.7390851332 

Perchè i valori di x tendono a 0.7390851332? Cosa ha di speciale questo numero? È un punto fisso per la 

funzione cos(x). 

Esempio 4.3.2 Consideriamo la funzione g (x) = 1 2 x + 2. Partendo da x 0 = 0 si ha 

n x n 

1 x 1 = 1 2 · 0 + 2 = 2 

2 x 2 = 1 2 · 2 + 2 = 3 

3 x 3 = 1 2 · 3 + 2 = 3.5 

4 x 4 = 1 2 · 3.5 + 2 = 3.75 

5 x 5 = 1 2 · 3.75 + 2 = 3.875 

6 x 6 = 1 2 · 3.875 + 2 = 3.9375 

I numeri 2, 3, 3.5, 3.75, 3.875, 3.9375 sembrano avvicinarsi a ξ = 4. Difatti, per valori crescenti di n, per x n 

1 

che tende a ξ, si ha, da una parte ξ = lim n→∞ x n+1 = lim n→∞ 

2 x n + 2 = 1 2 ξ + 2 da cui, ξ = 1 ξ + 2, cioè ξ = 4. 

2 

Scopriamo quindi che se l’iterazione x n+1 = g (x n ) converge a ξ, ξ è punto fisso per la funzione g . 

Da un punto di vista geometrico, i grafici di y = x (bisettrice del primo e terzo quadrante) e di y = g (x) si 

intersecano in ξ. 

Tuttavia, non sempre questo schema iterativo, applicato a funzioni che ammettono uno o più punti fissi, 

40


converge. Vediamo con un esempio. 

Esempio 4.3.3 Sia g (x) = x 2 . Analiticamente troviamo due punti fissi per questa funzione. Dovendo essere 

ξ = ξ 2 , si ricava ξ 2 − ξ = 0, vale a dire ξ(ξ − 1) = 0: quindi ξ = 0 e ξ = 1 sono i due punti fissi per questa 

funzione. 

Partendo da x 0 = 0.5, si ha la successione di valori 0.25, 0.0625, 0.00390625, rapidamente il metodo converge 

a ξ = 0 

Se si prende come punto iniziale un valore x 0 ∈] − 1,1[, la successione converge a ξ = 0. Le sole successioni 

che convergono a ξ = 1 solo le ovvie successioni generate da x 0 = ±1. Se si prende come punto iniziale x 0 tale 

che |x 0 | > 1 allora lo schema iterativo x n+1 = x 2 n diverge a +∞. Partendo da x 0 = 2, si ha 4, 16, 256, 65536... 

Questo esempio è significativo per capire come ciascun punto fisso ξ abbia un proprio bacino di attrazione: 

se si prende x 0 in questo bacino, allora i valori x n tendono a ξ. Un punto fisso può dunque attirare o 

respingere i valori x n prodotti dallo schema iterativo. 

Prima di passare a studiare quando lo schema di punto fisso converge, cerchiamo di capire se, data una 

funzione g , essa ammetta uno o più punti fissi o non ne ammetta affatto. Sia data una funzione continua g 

definita in un intervallo [a,b]. Se g (a) = a o g (b) = b allora essa ammette a e b come punti fissi. Supponiamo 

quindi che sia g (a) > a e g (b) < b. Definiamo la funzione continua Φ(x) mediante la relazione 

Φ(x) = g (x) − x 

Allora Φ(a) = g (a) − a > 0 e Φ(b) = g (b) − b < 0. Per il Teorema del Valore Intermedio esiste almeno un punto 

ξ ∈]a,b[ tale che Φ(ξ) = 0, vale a dire g (ξ) − ξ = 0, cioè g (ξ) = ξ. Esiste almeno un punto fisso per la funzione 

g . 

Questo risultato si può generalizzare nel seguente teorema. 

Teorema 4.3.1 Data una funzione g definita in [a,b], continua e tale che a ≤ g (x) ≤ b per ogni x ∈ [a,b], allora 

g ammette almeno un punto fisso. 

Infatti, dalle ipotesi, i valori della funzione g sono contenuti nell’intervallo [a,b] e, in particolare a ≤ g (a) ≤ b 

e a ≤ g (b) ≤ b. Ci riconduciamo, quindi, a quanto abbiamo detto prima per dimostrare che esiste almeno un 

punto fisso per g . 

Ora, oltre alle ipotesi precedenti (che ci assicurano l’esistenza del punto fisso) supponiamo che la g sia di 

classe C 1 in [a,b] e che esista una costante m < 1 tale che |g ′ (x)| ≤ m < 1 per ogni x ∈ [a,b]. In questo caso il 

punto fisso per la g è unico. 

Che esista almeno un punto fisso è assicurato dal teorema precedente. Supponiamo, allora, che esistano 

due punti fissi ξ e η, con ξ ≠ η, per la funzione g . Si ha 

|ξ − η| = |g (ξ) − g (η)| 

Applicando il teorema del Valor Medio, esiste un punto c compreso tra ξ e η per cui 

|g (ξ) − g (η)| = |g ′ (c)(ξ − η)| ≤ |g ′ (c)||ξ − η| 

Ma per ipotesi |g ′ (c)| ≤ m < 1 da cui 

|ξ − η| ≤ m|ξ − η| < |ξ − η| 

Si arriva ad una contraddizione. L’assurdo deriva dall’aver supposto ξ ≠ η. Quindi ξ = η e il punto fisso è 

unico. Riassumiamo questo risultato nel seguente teorema. 

Teorema 4.3.2 Data una funzione g di classe C 1 in [a,b], con a ≤ g (x) ≤ b per ogni x ∈ [a,b], e con |g ′ (x)| ≤ 

m < 1 per ogni x ∈ [a,b] allora esiste ed è unico il punto fisso della g in tale intervallo. 

41


Osserviamo che, data una funzione che ammette punto fisso, le ipotesi dei teoremi precedenti possono essere 

rilassate in un intorno del punto fisso. 

Possiamo ora provare un teorema di convergenza per lo schema del punto fisso. 

Teorema 4.3.3 A partire da un punto iniziale x 0 , lo schema iterativo x n+1 = g (x n ) converge al punto fisso ξ di 

g se e solo se |g ′ (x)| < 1 in un intorno di ξ. 

Dimostrazione. 

Dalle relazioni 

ξ = g (ξ) 

x n+1 = g (x n ) 

sottraendo membro a membro e, applicando il teorema del Valore Medio (con ξ n un opportuno punto del 

segmento che congiunge ξ a x n ), otteniamo: 

ξ − x n+1 = g (ξ) − g (x n ) = g ′ (ξ n )(ξ − x n ) 

Possiamo scrivere questa relazione per n = 0,1,... ottenendo 

ξ − x 1 = g ′ (ξ 0 )(ξ − x 0 ) 

ξ − x 2 = g ′ (ξ 1 )(ξ − x 1 ) 

ξ − x 3 = g ′ (ξ 2 )(ξ − x 2 ) 

. = . . . 

ξ − x n = g ′ (ξ n−1 )(ξ − x n−1 ) 

Moltiplicando, ora, membro a membro e prendendo i valori assoluti, abbiamo: 

|ξ − x 1 | · |ξ − x 2 | · ... · |ξ − x n | = 

|g ′ (ξ 0 )| · |g ′ (ξ 1 )| · |g ′ (ξ 2 )| · ... · |g ′ (ξ n−1 )| · |ξ − x 0 | · |ξ − x 1 | · ... · |ξ − x n−1 | 

La relazione appena trovata può essere semplificata, dividendo ambo i membri per |ξ − x 1 | · |ξ − x 2 | · ... · 

|ξ − x n−1 | ottenendo: 

|ξ − x n | = |g ′ (ξ 0 )| · |g ′ (ξ 1 )| · |g ′ (ξ 2 )| · ·... · |g ′ (ξ n−1 )||ξ − x 0 | 

Assumiamo, ora che |g ′ (x i )| ≤ m per i = 0,1,...,n − 1. Abbiamo dunque una relazione che lega l’errore al 

passo n con l’errore iniziale. 

|ξ − x n | ≤ m n |ξ − x 0 | 

Perchè il metodo converga, l’errore deve tendere a zero per n che tende all’infinito. Se m < 1 è assicurata la 

convergenza (quindi, se in un intorno del punto fisso, la derivata prima è minore di 1, lo schema converge). 

Se invece m > 1 in un intorno del punto fisso, lo schema non può convergere al punto fisso. 

Se vale m = 1 nulla si può dire a priori, ma bisogna vedere caso per caso cosa succede nell’intorno del 

punto fisso. ✔ 

Negli esempi precedenti: 

42 

g (x) g ′ (x) 

cos(x) −sin(x) 

1 

2 x + 2 1 

2 

x 2 2x


Figura 4.2: Il metodo di punto fisso: esempi con g (x) = cos(x) (a sinistra), e g (x) = 1 x + 2 (a destra) 

2 

Nel primo caso (esempio 4.3.1) −sin(0.7390851332) = −0.673612, perciò in un intorno del punto fisso la 

derivata è minore di 1 in valore assoluto e si ha convergenza. 

Nell’esempio 4.3.2 g ′ (x) = 1 qualunque sia x: si ha convergenza. 

2 

Nel terzo caso (esempio 4.3.3), g ′ (x) = 2x da cui g ′ (0) = 0 e g ′ (1) = 2. In un intorno del primo punto fisso, 

vale m < 1, in un intorno del secondo punto fisso m > 1 e non si potrà mai avere convergenza ad esso. 

Il bacino di attrazione si ha quindi se vale m < 1. 

Da un punto di vista grafico, le iterazioni dello schema di punto fisso si possono vedere sotto forma di 

ragnatela. Le iterazioni, infatti, si muovono avanti e indietro tra il grafico della y = g (x) e il grafico della 

bisettrice y = x. L’esempio 4.3.1, con g (x) = cos(x), è rappresentato in Figura 4.2 (a sinistra): partendo da 

(x 0 , x 0 ) sulla retta y = x, applicando l’algoritmo si ha x 1 = g (x 0 ). Perciò: 

G da (x 0 , x 0 ) si va su o giù fino a raggiungere (x 0 , x 1 ) sulla curva g ; 

G da (x 0 , x 1 ) si arriva a (x 1 , x 1 ) sulla bisettrice y = x. 

Questi due passi vengono ripetuti per tutte le altre iterazioni. Da x 1 si arriva sulla curva a g (x 1 ). Ora l’altezza 

è x 2 . Da qui si va sulla bisettrice al punto (x 2 , x 2 ). E così via. Lo scopo delle iterazioni, infatti, è di arrivare al 

punto (ξ,ξ) ≈ 0.7390851332 che è il punto di intersezione tra il grafico di g e la bisettrice y = x. Osserviamo 

che, per questo esempio, i valori della successione si avvicinano a ξ muovendosi a destra e a sinistra rispetto 

ad esso. Si parla di convergenza oscillante. 

Nell’esempio 4.3.2, si devono intersecare due linee rette. Notiamo, anche dalla Figura 4.2 (a destra), che i 

valori delle iterazioni si trovano tutti da un lato rispetto al punto fisso: si parla di convergenza monotona. 

In generale, quando 0 ≤ g ′ (x) < 1 in un intorno del punto fisso, si ha convergenza monotona. Se, invece, 

−1 < g ′ (x) < 0 in un intorno del punto fisso, si ha convergenza oscillante. 

Analogamente, in Figura 4.3, si possono osservare le conclusioni già viste per l’esempio 4.3.3, in cui g (x) = 

x 2 : si ha convergenza monotona verso ξ = 0 partendo da un punto iniziale in valore assoluto minore di uno, 

e divergenza monotona a infinito, partendo da |x 0 | > 1. 

Esempio 4.3.4 Consideriamo ora g (x) = x−sin(x) nell’intervallo [0,2π]. Data la periodicità della funzione 

seno, g ammette più di un punto fisso. Infatti da ξ = ξ − sin(ξ) si ha 0 = sin(ξ) da cui ξ = 0, ξ = π e ξ = 2π. 

Studiamo ora la derivata prima g ′ (x) = 1 − cos(x). Si ha g ′ (0) = 1 − 1 = 0, g ′ (π) = 1 − (−1) = 2 e g ′ (2π) = 

1−1 = 0. Da queste informazioni, deduciamo che qualunque sia il punto iniziale x 0 la successione generata 

dallo schema del punto fisso non potrà mai convergere a π, come si vede anche dalla Figura 4.4. 

Nel caso in cui il metodo di punto fisso converge, si possono ricavare delle maggiorazioni per l’errore che 

si commette approssimando ξ mediante x n . 

43


Figura 4.3: Il metodo di punto fisso: esempio con g (x) = x 2 . Si noti la convergenza monotona a ξ = 0 (a 

sinistra) e la divergenza monotona da ξ = 1 (a destra) 

Figura 4.4: Il metodo di punto fisso: esempio con g (x) = x − sin(x). ξ = 0 e ξ = 2π sono punti fissi attrattivi, al 

contrario di ξ = π in cui g ′ (ξ) = g ′ (π) = 2 

Infatti, possiamo scrivere l’errore ξ − x n nel modo seguente: 

ξ − x n = g (ξ) − g (x n−1 ) 

Applicando il teorema del valor medio e considerando, come prima, |g ′ (x)| ≤ m < 1 in un intorno del punto 

fisso, si ha: 

|ξ − x n | ≤ m|ξ − x n−1 | (4.1) 

Possiamo scrivere ξ − x n−1 nel modo seguente aggiungendo e sottraendo x n : 

ξ − x n−1 = ξ − x n + x n − x n−1 

ξ − x n−1 = g (ξ) − g (x n−1 ) + x n − x n−1 

|ξ − x n−1 | ≤ m|ξ − x n−1 | + |x n − x n−1 | 

(1 − m)|ξ − x n−1 | ≤ |x n − x n−1 | 

|ξ − x n−1 | ≤ 1 

1 − m |x n − x n−1 | 

44 

Andando a sostituire questa maggiorazione nella disuguaglianza (4.1), si ha 

|ξ − x n | ≤ m 

1 − m |x n − x n−1 |

4.4. Il Metodo di Newton-Raphson 

Abbiamo così trovato una maggiorazione dell’errore che lega l’errore al passo n con il valore assoluto della 

differenza tra due iterazioni successive |x n − x n−1 | (quest’ultima quantità prende il nome di scarto). 

Generalmente, per vedere se il metodo di punto fisso converge al punto fisso entro una certa tolleranza 

prestabilita, il controllo da fare è proprio sullo scarto d n = |x n − x n−1 |. Sfruttiamo questo fatto per vedere 

come implementare l’algoritmo dello schema di punto fisso (sotto forma di pseudo-codice; per i dettagli 

sull’implementazione in Fortran si vada a pag. 170): 

Dati di input: x 0 , tol ,i tmax 

Dati di output: x n soluzione approssimata o messaggio di fallimento 

1 n ←− 1 contatore delle iterazioni; 

2 d n ←− 2tol (una quantità iniziale > tol ) ; 

3 Fintantochè n ≤ i tmax e d n > tol 

4 incrementa n di 1; 

5 applicare l’algoritmo di punto fisso x n = g (x n−1 ) ; 

6 aggiorna d n ; 


8 Se d n ≤ tol allora 

9 x n è la soluzione approssimata 

10 altrimenti 

11 n > i tmax ; 

12 il metodo è fallito dopo i tmax iterazioni ; 

13 Fine-Se 

4.4 Il Metodo di Newton-Raphson 

Il metodo di Newton-Raphson 1 è uno dei metodi più potenti e più famosi per risolvere equazioni non lineari. 

Ci sono diversi approcci per introdurre questo metodo – tra questi c’è anche quello di vedere il metodo 

di Newton-Raphson come un particolare schema di punto fisso, come vedremo in seguito. 

Supponiamo ora che la derivata prima e seconda di f esistano e siano continue e assumiamo che la 

derivata prima f ′ sia valutabile con sufficiente facilità. 

Lo schema di Newton-Raphson è uno schema iterativo che produce una successione di approssimazioni 

x 0 , x 1 ,..., x n della radice della funzione f . 

Sia x n l’iterata corrente. Applicando la formula di Taylor di centro x n si ha: 

f (x) = f (x n ) + f ′ (x n )(x − x n ) + f ′′ (ξ x )(x − x n ) 2 /2 

dove ξ x è un punto (che non conosciamo) compreso tra x e x n . 

Sia x = ξ, dove ξ è radice di f , f (ξ) = 0. Se f fosse lineare, avremmo f ′′ ≡ 0 e quindi potremmo trovare la 

radice risolvendo direttamente 

0 = f (ξ) = f (x n ) + f ′ (x n )(ξ − x n ) 

ottenendo, con semplici passaggi, 

ξ = x n − f (x n) 

f ′ (x n ) 

1 Il metodo fu descritto da Isaac Newton in due suoi scritti del 1669 e del 1671, anche se era riferito solo a polinomi (in particolare a 

x 3 − 2x − 5 = 0). Il metodo di Newton fu pubblicato per la prima volta nel 1685. Nel 1690 Joseph Raphson ne pubblicò una descrizione 

semplificata in termini di approssimazioni successive x n piuttosto che di sequenze di polinomi. Fu solo nel 1740 che Thomas Simpson 

descrisse il metodo di Newton come un metodo iterativo per risolvere equazioni non lineari (e non solo polinomi) e diede una versione 

generalizzata per sistemi di due equazioni. 

Isaac Newton (1643-1727), inglese, fu fisico, matematico, astronomo, alchimista, inventore, filosofo naturalista. È visto come uno dei 

più grandi scienzati nella storia dell’umanità. 

Su Joseph Raphson (1648-1715) non si hanno molti dettagli. Pare che Newton stesso gli permettesse di vedere e studiare i suoi scritti 

matematici. Il suo lavoro del 1690 Analysis aequationum universalis gli valse l’ingresso nella Royal Society, nel 1691 benchè fosse uno 

studente (si laureò nel 1692) piuttosto anziano (aveva 43 anni). 

45


Per una funzione non lineare, il discorso da fare è molto simile. 

La nuova approssimazione x n+1 vogliamo che sia uguale al valore x n più una certa quantità h che ci 

permetta di arrivare alla soluzione desiderata. 

Applicando la formula di Taylor di centro x n , deve essere 

f (x n+1 ) = f (x n + h) = f (x n ) + f ′ (x n )h + f ′′ (ξ h )h 2 /2 

Vogliamo che sia f (x n+1 ) = 0, da cui, trascurando il termine in h 2 , ricaviamo 

h = − f (x n) 

f ′ (x n ) 

Utilizziamo questo valore di h per la nuova approssimazione x n+1 = x n + h mediante la formula 

x n+1 = x n − f (x n) 

f ′ , n = 0,1,2,... (4.2) 

(x n ) 

L’interpretazione geometrica del metodo di Newton è che x n+1 è l’intercetta, sull’asse delle x, della 

tangente della f a x n (vedi figura 4.5). 

Figura 4.5: Il metodo di Newton-Raphson applicato alla funzione f (x) = (x/2) 2 − sin(x) con x 0 = 1.3 

Lo schema di Newton-Raphson si può vedere come un caso particolare dello schema del punto fisso applicato 

alla funzione g (x) = x − f (x)/f ′ (x). Perchè lo schema del punto fisso converga, deve essere |g ′ (x)| < 1 

in un intorno di ξ. Nel caso specifico abbiamo: 

|g ′ (x)| = |1 − f ′ (x) 2 − f (x)f ′′ (x) 

f ′ (x) 2 | = | f (x)f ′′ (x) 

f ′ (x) 2 | 

Supponendo f ′ (ξ) ≠ 0 (che è il caso in cui la radice non è multipla), si ha |g ′ (ξ)| = 0, poichè al numeratore 

f (ξ) = 0 (essendo ξ radice della f ). Per continuità, allora, vale |g ′ (x)| < 1 in un intorno di ξ. Pertanto il metodo 

di Newton-Raphson è generalmente convergente. 

46

4.5. Convergenza di un metodo iterativo 

Per vedere come si riduce l’errore via via che le approssimazioni si avvicinano a ξ, consideriamo l’errore 

cambiato di segno ɛ n , per cui x n = ξ + ɛ n . Sostituendo in (4.2) abbiamo 

ɛ n+1 + ξ = ɛ n + ξ − f (ξ + ɛ n) 

f ′ (ξ + ɛ n ) 

ɛ n+1 = ɛ n − f (ξ + ɛ n) 

f ′ (ξ + ɛ n ) 

Applicando la formula polinomiale di Taylor sia su f sia su f ′ di centro ξ, si ha: 

ɛ n+1 = ɛ n − f (ξ) + ɛ n f ′ (ξ) + ɛ 2 n f ′′ (ξ)/2 + ... 

f ′ (ξ) + ɛ n f ′′ (ξ) + ... 

Poichè f (ξ) = 0, raccogliendo i termini si ricava: 

ɛ n+1 = ɛ n f ′ (ξ) + ɛ 2 n f ′′ (ξ) − ɛ n f ′ (ξ) − ɛ 2 n f ′′ (ξ)/2 + ... 

f ′ (ξ) + ɛ n f ′′ (ξ) + ... 

= ɛ2 n f ′′ (ξ)/2 + ... 

f ′ (ξ) + ɛ n f ′′ (ξ) + ... 

Trascurando i termini ɛ n f ′′ (ξ)+... al denominatore e le potenze maggiori o uguali a ɛ 3 n al numeratore si trova: 

ɛ n+1 = f ′′ (ξ) 

2f ′ (ξ) ɛ2 n = Aɛ2 n 

ponendo A = f ′′ (ξ) 

2f ′ (ξ) . 

L’ultima relazione che abbiamo ottenuto ci dice che l’errore al passo n + 1 è proporzionale, secondo il 

fattore A, al quadrato dell’errore al passo precedente. Perciò se partiamo da un errore iniziale dell’ordine 

di 10 −2 , al passo successivo l’errore è proporzionale a 10 −4 e poi a 10 −8 fino a 10 −16 in tre sole iterazioni. Il 

numero delle cifre significative raddoppia ad ogni passo del metodo. Si parla di convergenza quadratica. 

Nel caso in cui ξ sia una radice multipla, allora f ′ (ξ) = 0 allora A = ∞: se il metodo converge, la convergenza 

non sarà più quadratica ma avremo una convergenza di tipo lineare, come vedremo meglio in 

seguito. 

Se in ξ vi è un punto di flesso, non orizzontale, per cui f (ξ) = 0, f ′ (ξ) ≠ 0, f ′′ (ξ) = 0, allora A = 0 e ci 

aspettiamo una convergenza superiore a quella quadratica. 

Sulla 

convergenza 

4.5 Convergenza di un metodo iterativo 

Un metodo iterativo si dice: 

G linearmente convergente se esiste una costante M < 1 tale che, per n sufficientemente grande, vale 

|x n+1 − ξ| ≤ M|x n − ξ| 

G a convergenza quadratica se esiste una costante M tale che, per n sufficientemente grande, vale 

|x n+1 − ξ| ≤ M|x n − ξ| 2 

G a convergenza superlineare se esiste una successione di costanti M n → 0 tale che, per n 

sufficientemente grande, vale 

|x n+1 − ξ| ≤ M n |x n − ξ|. 

In generale un metodo ha ordine di convergenza p se si possono definire due costanti p ≥ 1 e M > 0 tali 

che 

|x n+1 − ξ| 

lim 

n→∞ |x n − ξ| p = M 47


La costante M prende il nome di costante asintotica dell’errore o fattore di convergenza. 

Nel caso del metodo di Newton-Raphson, generalmente vale p = 2 e la costante asintotica dell’errore è 

quella che abbiamo definito come A presa in valore assoluto, cioè M = 

f ′′ (ξ 

∣ 

2f ′ (ξ) 

∣ . 

Nel metodo del punto fisso, la convergenza è lineare. Infatti, considerando l’errore cambiato di segno, la 

relazione x n+1 = g (x n ) si può scrivere, in modo equivalente, come 

ξ + ɛ n+1 = g (ξ + ɛ n ) e, applicando la formula (polinomiale) di Taylor si ha 

ξ + ɛ n+1 = g (ξ) + ɛ n g ′ (ξ) + ... 

ξ + ɛ n+1 = ξ + ɛ n g ′ (ξ) + ... 

ɛ n+1 = ɛ n g ′ (ξ) + ... e, al limite per n → ∞ 

ɛ n+1 = g ′ (ξ)ɛ n 

La costante asintotica per lo schema di punto fisso vale, dunque, M = |g ′ (ξ)|. 

Il metodo delle bisezioni, invece, può essere visto come un metodo lineare, con M = 1 2 (considerando 

che, ad ogni passo, si riduce della metà l’intervallo in cui viene cercata l’approssimazione della radice). 

Esempio 4.5.1 Consideriamo l’equazione f (x) = 2x − cos(x) + 1 = 0 che ammette come unica radice ξ = 0. 

Poichè f ′ (x) = 2 + sin(x), il metodo di Newton-Raphson diventa: 

x n+1 = x n − 2x n − cos(x n ) + 1 

2 + sin(x n ) 

Partendo da x 0 = 0.5 e richiedendo una tolleranza pari a 10 −10 nei risultati (interrompiamo l’algoritmo 

quando d n < 10 −10 ), si ha: 

I valori generati dall’algoritmo tendono a ξ = 0. 

n x n d n 

0 0.5 

1 0.4730746270E-01 0.4526925E+00 

2 0.5462695134E-03 0.4676119E-01 

3 0.7458221874E-07 0.5461949E-03 

4 0.1395426403E-14 0.7458222E-07 

5 0.7647622253E-17 0.1387779E-14 

Considerando che f ′′ (x) = cos(x) possiamo valutare la costante asintotica M = |f ′′ (ξ)| 

2|f ′ (ξ)| = |cos(ξ)| 

2(|2 + sin(ξ)|) = 

1 

4 = 0.25 

Da un punto di vista teorico, applicando il teorema del valor medio, si ha 

f (ξ) − f (x n ) = f ′ (ξ n )(ξ − x n ) 

dove ξ n è un punto, che non conosciamo, compreso tra ξ e x n . Per x n vicino a ξ possiamo considerare 

ξ n ≈ x n , da cui ricaviamo (essendo f (ξ) = 0): 

−f (x n ) ≈ f ′ (x n )(ξ − x n ) 

. Sostituendo questa espressione nell’iterazione di Newton-Raphson si ha: 

x n+1 = x n − f (x n) 

f ′ (x n ) ≈ x n + (ξ − x n ) 

vale a dire 

x n+1 − x n = ξ − x n cioè d n+1 = ɛ n 

Ma in condizioni di convergenza, d n+1 < d n da cui, per l’errore, vale la maggiorazione ɛ n < d n . 

48

4.6. Complessità computazionale di uno schema 

Perciò gli scarti sono molto vicini agli errori e possono essere utilizzati sia per controllare il numero di 

iterazioni da effettuare per approssimare la radice entro una certa tolleranza sia per approssimare M. 

Nel nostro esempio 

d 2 

(d 1 ) 2 = 0.2282 d 3 

(d 2 ) 2 = 0.2498 d 4 

(d 3 ) 2 = 0.2500 d 5 

(d 4 ) 2 = 0.2495 

4.6 Complessità computazionale di uno schema 

Un altro elemento da considerare per valutare l’efficienza numerica di uno schema iterativo è la sua complessità 

computazionale. Un metodo, infatti, può avere un elevato ordine di convergenza ma avere anche un 

costo computazionale molto elevato. Viceversa, un metodo può avere un basso ordine di convergenza ma 

essere anche semplice computazionalmente e, quindi, molto vantaggioso da questo punto di vista. 

Si definisce indice di efficienza E dello schema iterativo la quantità 

E = p 1/s 

dove s indica il numero di volte in cui bisogna calcolare la funzione e la sua derivata prima ad ogni iterazione 

e p è l’ordine di convergenza del metodo. 

4.7 Il metodo delle secanti 

La conoscenza della derivata prima della f per applicare il metodo di Newton-Raphson potrebbe essere 

semplice ma a volte potrebbe rivelarsi un’operazione molto costosa e alquanto complicata. 

Il metodo delle secanti è una variante del metodo di Newton-Raphson dove, al posto della derivata prima, 

si considera una sua approssimazione. 

Scriviamo la formula ricorsiva 

x n+1 = x n − f (x n) 

C n 

Per C n = f ′ (x n ) abbiamo la formula di Newton-Raphson, che possiamo anche chiamare della tangente 

variabile perchè è il coefficiente angolare della retta tangente a (x n , f (x n )) che interseca l’asse delle x in x n+1 . 

Vediamo altre scelte di C n : 

G C n = f ′ (x 0 ) il valore di C n è costante e dà vita al metodo della tangente fissa. 

G C n = f (x 1) − f (x 0 ) 

: abbiamo sempre una costante che approssima la derivata f ′ (x 0 ) utilizzando i valori 

x 1 − x 0 

di x 1 e x 0 . Lo schema è detto della secante fissa. 

G C n = f (x n) − f (x n−1 ) 

. La derivata f ′ (x n ) è approssimata utilizzando il rapporto incrementale della f 

x n − x n−1 

valutata in x n e x n−1 . Abbiamo il metodo delle secante variabile, che chiameremo nel seguito anche 

metodo 2 della Regula Falsi. 

In forma estesa, l’iterazione n + 1 della Regula Falsi si scrive come: 

x n+1 = x n − f (x n)(x n − x n−1 ) 

f (x n ) − f (x n−1 ) 

49


Figura 4.6: Il metodo della Regula Falsi applicato alla funzione f (x) = (x/2) 2 − sin(x) con x 0 = 1.3 e x 1 = 1.35 

Notiamo che, per innescare il metodo occorrono due valori iniziali, x 0 e x 1 . Ma è richiesta solo la 

valutazione della funzione f a ciascun passo (nessuna conoscenza della derivata prima). 

Da un punto di vista geometrico, nel metodo delle secanti il valore x n+1 è dato dall’intercetta sull’asse 

delle x della retta passante per x n , f (x n ) e x n−1 , f (x n−1 ). Per quanto riguarda l’accumulo degli errori di arrotondamento, 

conviene utilizzare la formula così come è stata scritta in quanto è più sicura rispetto alla forma 

compatta in cui vengono raccolti i termini, data da 

x n+1 = x n−1 f (x n ) − x n f (x n−1 ) 

f (x n ) − f (x n−1 ) 

in quanto in quest’ultima, si può avere il fenomeno della cancellazione numerica per x n ≈ x n−1 e 

f (x n )f (x n−1 ) > 0. 

Per quanto riguarda l’ordine di convergenza si può dimostrare che si ha convergenza superlineare poichè 

vale la relazione 

ɛ n+1 = A 

dove p = 1 + 5 

2 

p 

p + 1 ɛ 

p 

n 

ɛ n+1 = A 0.618 ɛ 1.618 

n 

= 1.618 e A è la costante asitontica del metodo di Newton-Raphson, da cui 

4.8 Confronto tra i metodi di Newton-Raphson e la Regula Falsi 

Sebbene il metodo di Newton-Raphson abbia ordine di convergenza più elevato della Regula Falsi, 

quest’ultimo è computazionalmente più efficiente. Si ha infatti 

Metodo p s E 

 

Newton-Raphson 2 2 2 ≈ 1.414 

Regula Falsi 1.618 1 1.618 

2 Attenzione! In letteratura viene descritto un altro metodo (simile ma non lo stesso) con il nome della Regula Falsi o Falsa Posizione 

che genera i valori x n+1 in modo che la radice ξ sia sempre compresa tra le iterazioni successive. 

50

4.8. Confronto tra i metodi di Newton-Raphson e la Regula Falsi 

Vediamo ora come applicare i due metodi e le differenze che si hanno. 

Esempio 4.8.1 Consideriamo la funzione f (x) = 0 con f (x) = (x/2) 2 − sin(x). La derivata prima è f ′ (x) = 

(x/2) − cos(x) Consideriamo come x 0 = 1.3 per entrambi i metodi e x 1 = 1.35 per la Regula Falsi. Come 

criterio di arresto, consideriamo una tolleranza tol = 1.e − 8, cioè andremo avanti con le iterazioni fino a 

quando troveremo che lo scarto d n = |x n − x n−1 | sarà minore di tol. Otteniamo i seguenti risultati per il 

metodo di Newton-Raphson 

Per la Regula Falsi: 

n x n f (x n ) f ′ (x n ) d n d n /d 

n−1 

2 

0 1.3 -0.541058185 0.382501171 

1 2.714526871831 1.42796213 2.26744846 1.41452687 

2 2.084760792766 0.215754599 1.53401376 0.629766079 0.314743565 

3 1.944113685369 0.0137718957 1.33676314 0.140647107 0.35462739 

4 1.933811265085 7.60156095E-05 1.32199993 0.0103024203 0.520808008 

5 1.933753764621 2.37200355E-09 1.32191743 5.7500464E-05 0.541742396 

6 1.933753762827 -1.00668172E-16 1.79436599E-09 0.542710632 

n x n f (x n ) 

f (x n ) − f (x n−1 ) 

d n d n /d 

x n − x n−1 

1.618 

n−1 

0 1.3 -0.541058185 

1 1.35 -0.520098358 0.419196552 

2 2.590702853065 1.15448972 1.34970922 1.24070285 

3 1.735341043061 -0.233640901 1.62285784 0.85536181 0.603386215 

4 1.879309845941 -0.0698346071 1.1377902 0.143968803 0.185374473 

5 1.940687248331 0.00919996444 1.28768192 0.0613774024 1.41231076 

6 1.933542654410 -0.000279035921 1.32673746 0.00714459392 0.653100215 

7 1.933752971771 -1.04570967E-06 1.3217654 0.000210317362 0.623935239 

8 1.933753762918 1.19824825E-10 1.32191686 7.91146198E-07 0.704441455 

9 1.933753762827 -1.00668172E-16 9.0644825E-11 0.676026603 

Attraverso gli scarti, abbiamo fatto una stima della costante asintotica dell’errore, considerando che, al 

limite per k → ∞, x n → ξ. Le ultime colonne delle tabelle, infatti, valutano i rapporti d n /dn−1 2 e d n/dn−1 1.618. 

Diamo un’ulteriore stima di tali costanti facendo uso della definizione teorica e considerando ξ ≈ x n . 

Per il metodo di Newton-Raphson dobbiamo calcolare M = |f ′′ (ξ)| 

2|f ′ mentre per la Regula Falsi dobbiamo 

(ξ)| 

considerare il valore M 0.618 . 

Poichè f ′′ (x) = 1/2+sin(x), abbiamo, per ξ ≈ x 6 (di Newton-Raphson) o, equivalentemente per ξ ≈ x 9 (della 

Regula Falsi), in pratica ξ ≈ 1.933753762827, f ′ (ξ) = 1.32191743 e f ′′ (ξ) = 1.4348509. Otteniamo quindi: 

M ≈ 0.542715784 e M 0.618 ≈ 0.685434221 

Esempio 4.8.2 Sia data f (x) = sin(x). Nell’intervallo ] − π/2,π/2[ la f ha esattamente una radice, ξ = 0. 

Il metodo di Newton applicato alla funzione f , diventa: 

x n+1 = x n − tan(x n ), n = 0,1,2,... 

Se scegliamo come valore iniziale x 0 = x ∗ tale che tan(x ∗ ) = 2x ∗ , allora x 1 = −x 0 , x 2 = −x 1 = x 0 ... Si ha una 

situazione di stallo: i valori della successione saranno, alternativamente, x ∗ e −x ∗ e non avremo convergenza 

alla radice ξ = 0. Il valore critico x ∗ vale 1.165561185207 e lo si può trovare numericamente applicando 

il metodo del punto fisso a alla funzione g (x) = arctan(2x). 

a Se si considera g (x) = tan(x)/2 si trova il punto fisso 0 in quanto g ′ (x ∗ ) > 1 per g (x) = tan(x)/2. 

51


Vediamo dunque cosa accade applicando il metodo di Newton-Raphson e la Regula Falsi utilizzando come 

x 0 = x ∗ ( e x 1 = −x 0 nella Regula Falsi). Facciamo i conti in singola precisione a , richiedendo un’accuratezza 

dell’ordine ɛ = 10 −8 . 

Abbiamo le seguenti tabelle. 

Per Newton-Raphson 

Per la Regula Falsi: 

n x n f (x n ) f ′ (x n ) d n 

0 1.1655612 0.919009745 0.394234866 

1 -1.1655612 -0.919009745 0.394234866 2.3311224 

2 1.1655612 0.919009745 0.394234866 2.3311224 

3 -1.1655612 -0.919009745 0.394234866 2.3311224 

. 

. 

. 

n 1.1655612 0.919009745 0.394234866 2.3311224 

n+1 -1.1655612 -0.919009745 0.394234866 2.3311224 

n x n f (x n ) 

f (x n ) − f (x n−1 ) 

x n − x n−1 

d n 

0 1.1655612 0.919009745 

1 -1.1655612 -0.919009745 0.788469732 

2 0.000000024087 0.000000024087 0.788469732 1.1655612 

3 -0.000000006462 -0.000000006462 3.05485912E-08 2.38417108E-08 

4 0.000000000000 0.0000000000000 6.46195142E-09 

Poche iterazioni sono necessarie perchè la Regula Falsi converga alla soluzione esatta. 

Perchè il metodo di Newton-Raphson converga il valore iniziale x 0 deve essere scelto tale che |x 0 | < x ∗ . 

a Lavorando in doppia precisione non si riesce a osservare il comportamento ciclico ma si ha convergenza o divergenza a 

seconda che si abbia un’iterata |x k | < o > x ∗ . 

. 

. 

Quando 

Newton- 

Raphson dà 

risultati 

scarsi 

Questo esempio ci permette di capire il significato di metodo generalmente convergente e il fatto che le proprietà 

di convergenza di un metodo possono valere localmente, cioè quando si è sufficientemente vicini alla 

radice. 

Da un punto di vista pratico occorre prestare molta attenzione anche alla scelta del punto iniziale per il 

metodo di Newton-Raphson. Dal momento che la formula richiede una divisione per f ′ (x n ), occorre evitare 

di prendere un punto iniziale in cui la f abbia una tangente (e quindi f ′ ) con pendenza vicina allo zero. In tal 

caso, infatti, ci si può allontanare dalla radice e il metodo può non convergere. 

Esempio 4.8.3 Consideriamo f (x) = x 5 − 6, per la quale f ′ (x) = 5x 4 , il cui grafico è in Figura 4.7 (a destra). 

Se partiamo da un punto iniziale prossimo allo zero, poichè la tangente alla f è quasi orizzontale, non si 

riesce ad avere convergenza se non dopo molte iterazioni: partendo da x 0 = 0.01 e richiedendo una tolleranza 

10 −8 , sono necessarie 88 iterazioni per arrivare a ξ = 1.430969081115725849. Vediamo in tabella, come 

cambia il numero delle iterazioni al variare di x 0 : 

x 0 0.05 0.1 0.5 0.8 1.0 1.4 1.5 2. 3. 10. 20. 100. 

iterazioni 59 46 18 10 7 4 4 6 8 14 17 24 

52

4.9. Metodo di Newton-Raphson per radici multiple 

Figura 4.7: Il metodo di Newton-Raphson applicato alla funzione f (x) = sin(x) con x 0 = x ∗ (a sinistra). La 

funzione f (x) = x 5 − 6 (a destra) 

4.9 Metodo di Newton-Raphson per radici multiple 

Definizione 4.9.1 Data una funzione f (x) = 0, una radice ξ è multipla di molteplicità r se vale: f (ξ) = f ′ (ξ) = 

... = f r −1 (ξ) = 0 e f r (ξ) ≠ 0. 

Quando si ha una radice multipla, il metodo di Newton-Raphson diventa un metodo del primo ordine in 

quanto la formula che lega l’errore al passo n + 1 con l’errore al passo n diventa 3 : 

ɛ n+1 = r − 1 ɛ n 

r 

da cui la costante asintotica è M = r − 1 . Per poter avere un metodo che sia di nuovo a convergenza 

r 

quadratica, occorre modificare l’algoritmo, ottenendo la formula di Newton-Raphson modificata, nel modo 

seguente: 

x n+1 = x n − r f (x n) 

f ′ (x n ) 

4.10 Controllo sugli scarti e grafici di convergenza 

Da un punto di vista pratico, il controllo per verificare la convergenza o meno della successione x n generata 

dallo schema iterativo viene effettuato sullo scarto d n = |x n − x n−1 | piuttosto che sull’errore ɛ n = |ξ − x n |, 

poichè, se avessimo informazioni sull’errore, conosceremmo anche il valore di ξ (che, in generale, non è 

noto). 

Nel caso del metodo di Newton-Raphson, quando è di ordine 2, abbiamo visto che il controllo sullo scarto 

va bene (si veda quanto detto a pag. 49). 

Vediamo cosa succede per metodi lineari. Sia tol l la tolleranza richiesta per approssimare ξ utilizzando 

gli scarti. Sappiamo che, per n grande e se il metodo converge, vale la relazione 

ɛ n+1 ≈ Mɛ n 

dove M < 1 è la costante asintotica. 

3 Il procedimento da seguire è del tutto simile a quanto è stato fatto nell’ipotesi in cui f ′ (ξ) ≠ 0. Come esercizio, si consiglia di provare 

a ricavare questo risultato. 

53


Riscriviamo la precedente formula come: 

|ξ − x n+1 | ≈ M|ξ − x n | = M|ξ − x n + x n+1 − x n+1 | ≤ M (|ξ − x n+1 | + |x n+1 − x n |) 

Quindi 

ɛ n+1 ≤ M(ɛ n+1 + d n+1 ) 

(1 − M)ɛ n+1 ≤ Md n+1 

Supponendo d n+1 ≤ tol l, vale 

ɛ n+1 ≤ 

M 

1 − M d n+1 ≤ M 

1 − M tol l 

M 

Perciò, per 

1 − M < 1 (quindi per M < 1/2), se d n+1 ≤ tol l anche ɛ n+1 ≤ tol l. Se, invece, M ≥ 1/2, allora 

l’errore può essere più grande della tolleranza richiesta. 

Per quanto riguarda il metodo della secante variabile, poichè è superlineare, in base alla definizione, 

ɛ n+1 ≈ M n+1 ɛ n con M n+1 → 0, perciò si può vedere come un caso limite di convergenza lineare con fattore di 

convergenza che tende a zero, e quindi il controllo dello scarto permette un buon controllo dell’errore. 

Quando si implementa un metodo iterativo, si può fare il grafico semilogaritmico di convergenza del 

metodo, ponendo sull’asse delle ascisse i valori delle iterazioni e sull’asse delle ordinate i logaritmi (in base 

10) degli scarti. 

Asintoticamente possiamo sostituire l’errore con lo scarto, nella definizione di ordine di convergenza di 

un metodo, per cui d n ≈ Md p n−1 . 

Nel caso in cui p = 1, si ha: 

d n ≈ Md n−1 

d n−1 ≈ Md n−2 

d n−2 ≈ Md n−3 

. . . . 

d 2 ≈ Md 1 

d 1 ≈ Md 0 

Partendo ora dalla prima relazione abbiamo: 

d n ≈ Md n−1 ≈ M 2 d n−2 ≈ M 3 d n−3 ≈ ... ≈ M n d 0 

Troviamo una relazione tra d n e d 0 . Passando ai logaritmi: 

log 10 (d n ) = n log 10 (M) + log 10 (d 0 ) 

Abbiamo un’equazione del tipo y = ax + b dove y = log 10 (d n ) e x = n, che rappresenta l’equazione della retta 

nel nostro grafico semilogaritmico, e la pendenza della retta vale a = log 10 (M). Dalla pendenza della retta 

possiamo dunque risalire al valore della costante asintotica M. 

Nel caso in cui p ≠ 1 il discorso si fa più complicato (e non staremo qui ad analizzarlo nei dettagli). Per 

esempio, per p = 2, si trova una curva che dipende da 2 n . 

54

4.11. Esercizi 

Esempio 4.10.1 In Figura 4.8, riportiamo un esempio di grafico con i profili di convergenza per i metodi 

di Newton-Raphson, secante variabile e punto fisso per trovare lo zero della funzione f (x) = x + ln(x) 

(applicando lo schema di punto fisso alla funzione g (x) = e −x ). 

Figura 4.8: Profili di convergenza a confronto 

4.11 Esercizi 

Esercizio 4.11.1 Si vuole risolvere l’equazione x = g (x) con lo schema del punto fisso; sapendo che 

g (x) = x 2 − 5x + 9 

(a) calcolare analiticamente il valore del punto fisso; 

(b) determinare il fattore di convergenza M dello schema del punto fisso; 

(c) calcolare le approssimazioni x 1 , x 2 e x 3 partendo prima da x 0 = 1 e poi da x 0 = 2.5 e giustificandone 

il diverso comportamento. 

Svolgimento 

(a) ξ è punto fisso della funzione g se verifica g (ξ) = ξ. 

Imponiamo dunque la condizione g (ξ) = ξ. Ricaviamo ξ 2 − 5ξ + 9 = ξ, ovvero ξ 2 − 6ξ + 9 = 0, cioè 

(ξ − 3) 2 = 0, da cui ξ = 3 è punto fisso della g . 

55


Figura 4.9: Esercizio sullo schema di punto fisso 

(b) Il fattore di convergenza è M = g ′ (ξ). 

Poichè g ′ (x) = 2x − 5, si ha g ′ (ξ) = g ′ (3) = 1. 

Osserviamo che, a priori, non si può dire se lo schema del punto fisso converge o meno proprio 

perchè nel punto fisso la derivata prima vale esattamente 1, ma bisogna vedere caso per caso a seconda 

del punto iniziale da cui si fa partire il metodo. 

(c) 

Per x 0 = 1 si ha 

k x k g (x k ) 

0 1 5 

1 5 9 

2 9 45 

3 45 1809 

Per x 0 = 2.5 si ha 

k x k g (x k ) 

0 2.5 2.75 

1 2.75 2.8125 

2 2.8125 2.84765625 

3 2.84765625 2.870864868 

Per x 0 = 1 il metodo non converge, mentre per x 0 = 2.5 il metodo converge. La diversità di comportamento 

si giustifica graficamente, come si può vedere dalla Figura 4.9, osservando che per x 0 = 1 i 

valori ottenuti dallo schema si allontanano sempre più dal punto fisso. Nel secondo caso, al contrario, 

i valori si avvicinano con monotonia al punto fisso. 

Esercizio 4.11.2 Si vuole risolvere l’equazione f (x) = 0 con f (x) = (x − 1) 2 + 3ln(x), nell’intervallo [0.5,2] 

con gli schemi di Newton-Raphson e della Regula Falsi. 

(a) Dimostrare esistenza e unicità della soluzione nell’intervallo considerato. 

(b) Calcolare le approssimazioni x 1 , x 2 e x 3 con lo schema di Newton-Raphson, partendo da x 0 = 0.5; 

(c) Calcolare le approssimazioni x 2 e x 3 con lo schema della Regula-Falsi partendo da x 0 = 0.5 e x 1 

calcolato al punto b). 

Stimare, inoltre il fattore di convergenza del metodo di Newton-Raphson assumendo ξ ≈ x 3 . 

Svolgimento 

(a) La funzione ammette valori opposti all’estremo dell’intervallo. Infatti f (0.5) = −1.82944154 e f (2) = 

3.07944154. Quindi, per il teorema del valor intermedio, esiste almeno una radice. Inoltre f ′ (x) = 2(x − 

1) + 3 x = 2x2 − 2x + 3 

è sempre positivo nell’intervallo dato, (la parabola 2x 2 − 2x + 3 ha discriminante 

x 

56


negativo e quindi è sempre positiva). Perciò, da f ′ (x) > 0 concludiamo che la f è crescente. Di qui 

l’unicità della radice. 

(b) Partendo da x 0 = 0.5, il metodo di Newton-Raphson fornisce i seguenti valori: 

k x k f (x k ) f ′ (x k ) 

0 0.50000000E+00 -0.18294415E+01 0.50000000E+01 

1 0.86588831E+00 -0.41401211E+00 0.31964267E+01 

2 0.99541173E+00 -0.13775443E-01 0.30046517E+01 

3 0.99999643E+00 

Per stimare la costante asintotica dell’errore del metodo di Newton-Raphson assumendo ξ ≈ x 3 , 

occorre usare la formula 

M ≈ |f ′′ (x 3 )| 

2|f ′ (x 3 )| 

dove, nel caso specifico, vale f ′ (x) = 2(x − 1) + 3 x e f ′′ (x) = 2 − 3 x 2 . 

Usando il valore trovato per x 3 si ricava M ≈ 0.16667004E + 00. 

(c) Partendo da x 0 e x 1 del metodo di Newton-Raphson, la Regula Falsi dà: 

k x k f (x k ) 

f (x n ) − f (x n−1 ) 

x n − x n−1 

0 0.50000000E+00 -0.18294415E+01 - 

1 0.86588831E+00 -0.41401211E+00 0.38684741E+01 

2 0.97291038E+00 -0.81656072E-01 0.31054906E+01 

3 0.99920448E+00 

Esercizio 4.11.3 Provare, anche solo graficamente, che l’equazione 

f (x) = sin(x) + x − 1 = 0 

ammette una sola radice ξ nell’intervallo [0,1]. 

(a) Dire se lo schema del punto fisso con g (x) = arcsin(1 − x) può convergere. 

(b) Partendo da x 0 = 0.1 calcolare le approssimazioni x 1 , x 2 e x 3 con lo schema di Newton-Raphson; 

(c) Dare una stima del fattore di convergenza. 

Svolgimento 

Graficamente, da f (x) = 0 si ha sin(x) = 1 − x. Se si studia l’intersezione delle due curve, sin(x) e 1 − x 

nell’intervallo [0,1], si può osservare una sola intersezione, cioè una sola radice della f (fare il grafico delle 

due funzioni). 

Analiticamente, la funzione f (x) assume valori di segno opposto agli estremi dell’intervallo dato: 

f (0) = sin(0) + 0 − 1 = −1 

f (1) = sin(1) + 1 − 1 = 0.8414709848 

La derivata prima della f è f ′ = cos(x)+1: è funzione continua e sempre positiva nell’intervallo [0,1]. Quindi 

f è una funzione crescente e interseca l’asse delle x solo una volta in [0,1], vale a dire ammette un’unica 

radice. 

(a) Da f (x) = 0 si ha sin(x) + x − 1 = 0 o, equivalentemente, sin(x) = 1 − x, da cui x = arcsin(1 − x). 

Consideriamo perciò lo schema del punto fisso con g (x) data da g (x) = arcsin(1 − x). La derivata di 

g (x) è g ′ 1 

(x) = √ . 1 − (1 − x) 

2 

57


Nell’intervallo [0,1] valgono le seguenti disuguaglianze: 

0 ≤ x ≤ 1 =⇒ 0 ≥ −x ≥ −1 =⇒ 1 ≥ 1 − x ≥ 0 =⇒ 

=⇒ 1 ≥ (1 − x) 2 ≥ 0 =⇒ −1 ≤ −(1 − x) 2 ≤ 0 =⇒ 0 ≤ 1 − (1 − x) 2 ≤ 1 =⇒ 

√ 

=⇒ 0 ≤ 1 − (1 − x) 2 1 

≤ 1 =⇒ 1 ≤ √ 

1 − (1 − x) 

2 

Perciò g ′ (x) è sempre maggiore di 1 e lo schema del punto fisso non può convergere. 

(b) Da f (x) = sin(x) + x − 1 si ha f ′ (x) = cos(x) + 1 e f ′′ (x) = −sin(x). Il metodo di Newton-Raphson è: 

x k+1 = x k − sin(x) + x − 1 

cos(x) + 1 . 

Utilizziamo la notazione M 1 e M 2 per indicare la stima della costante asintotica dell’errore mediante le 

formule 

M 1 = |x k+1 − x k | 

|x k − x k−1 | 2 o M 2 = |f ′′ (x k )| 

2|f ′ (x k )| 

Partendo da x 0 = 0.1 si ottengono i seguenti valori: 

k x k f (x k ) f ′ (x k ) |x k − x k−1 | 

0 0.1 -0.80016658E+00 0.19950042E+01 - 

1 0.50108517E+00 -0.18537249E-01 0.18770618E+01 0.40108517E+00 

2 0.51096084E+00 -0.23565955E-04 0.18722750E+01 0.98756733E-02 

3 0.51097343E+00 -0.38737166E-10 - 0.12586802E-04 

(c) La stima del fattore di convergenza è dato da M 1 = 0.12905712E+00 o da M 2 = 0.13059731E+00, a 

seconda della strada scelta per dare la stima. 

Esercizio 4.11.4 Data l’equazione f (x) = ln(x) + x 2 − x = 0, 

(a) si provi, anche solo graficamente, che l’equazione ammette l’unica radice ξ = 1 nell’intervallo 

[0.7,2.3]; 

(b) si applichino due iterazioni del metodo dicotomico (o delle bisezioni) a partire dall’intervallo dato, 

chiamando con x 0 l’ultimo valore ottenuto con tale metodo; 

(c) a partire da x 0 del punto (b) si calcoli l’approssimazione x 1 con il metodo di Newton-Raphson; 

(d) a partire da x 0 e x 1 del punto (c) si calcolino le approssimazioni x 2 e x 3 con il metodo della Regula 

Falsi; 

(e) considerata la radice esatta ξ = 1, si calcoli la costante asintotica di convergenza del metodo della 

Regula Falsi. 

Svolgimento 

(a) Da f (x) = 0 si ricava ln(x) = x − x 2 , per cui graficamente si può vedere che le due curve si intersecano 

in un solo punto, che vale ξ = 1. 

Analiticamente, invece, la funzione f (x) assume valori di segno opposto agli estremi dell’intervallo 

dato: 

f (0.7) = −0.566674943938732 

f (2.3) = 3.8229091229351 

58


Inoltre f è continua, quindi ammette almeno una radice nell’intervallo dato. La derivata prima è: 

f ′ (x) = 1 x + 2x − 1, che possiamo anche scrivere come f ′ (x) = 1 + 2x2 − x 

: numeratore e denominatore 

x 

sono entrambi sempre positivi nell’intervallo dato, (la parabola 2x 2 − x + 1 ha discriminante negativo 

∆ = −7, di conseguenza, per ogni x reale si ha 2x 2 − x + 1 > 0). Da f ′ (x) > 0 per ogni x segue che f è 

crescente e, quindi, ammette un’unica radice. 

(b) Applichiamo il metodo delle bisezioni a partire dall’intervallo dato (utilizziamo la notazione x s per 

indicare l’estremo sinistro dell’intervallo, x d per indicare l’estremo destro dell’intervallo, x c , il punto 

medio dell’intervallo considerato): 

iter. x s f (x s ) segno x d f (x d ) segno x c f (x c ) 

1 0.7 -0.566674944 - 2.3 3.822909123 + 1.5 1.155465108 

2 0.7 -0.566674944 - 1.5 1.155465108 + 1.1 0.205310180 

Il valore x 0 è dunque x 0 = 1.1. 

(c) Il metodo di Newton-Rapshon è x k+1 = x k − f (x k) 

f ′ (x k ) dove f ′ = 1/x +2x −1. Partendo da x 0 = 1.1, si ricava 

x 1 = 1.1 − 0.20531018 

2.1090909 = 1.002654656 

(d) Applicando il metodo della Regula Falsi si ha: 

k x k f (x k ) 

f (x k ) − f (x k−1 ) 

x k − x k−1 

1 1.002654656 0.5312842078E-02 0.2054513650E+01 

2 1.000068720 0.1374413812E-03 0.2001364094E+01 

3 1.000000046 

(e) Considerato che la radice esatta è ξ = 1, la costante asintotica di convergenza della Regula Falsi si calcola 

utilizzando l’espressione M = | f ′′ (ξ) 

2f ′ (ξ) |0.618 . Da f ′ (x) = 1 x + 2x − 1 segue f ′ (1) = 2 e f ′′ (x) = − 1 x 2 + 2, 

da cui f ′′ (1) = 1, per cui M = 1 0.618 

= 0.4245481. 

4 

59


5 

INTERPOLAZIONE 

Non vi è alcuna incompatibilità fra 

l’esatto e il poetico. Il numero è 

nell’arte come nella scienza. 

L’algebra è nell’astronomia e 

l’astronomia confina con la poesia. 

L’anima dell’uomo ha tre chiavi che 

aprono tutto: la cifra, la lettera, la 

nota. Sapere, pensare, sognare. 

Victor Hugo 

5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

5.2 Interpolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

5.3 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

5.3.1 Funzioni base monomiali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

5.3.2 Polinomi di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

5.3.3 Formula dell’errore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 

5.3.4 Differenze divise e formula di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

5.4 Considerazioni sull’interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

5.4.1 Fenomeno di Runge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

5.4.2 Malcondizionamento nell’interpolazione con funzioni base monomiali . . . . . . . . . . 72 



Il censimento della popolazione italiana, dall’unità d’Italia al 2001, ha visto un incremento della 

popolazione, come si può vedere in Tabella 5.1. Gli stessi dati sono riportati in Figura 5.1. 

Ci si può chiedere se questi dati possono essere utili (considerandoli tutti o solo una parte) per dare una 

ragionevole stima della popolazione nel 1975 o nel 1995 o per predire a quanto ammonterà nel 2015. Per far 

ciò, possiamo seguire due strade: 

G cercare una funzione che passi esattamente per i dati assegnati (detti anche punti di appoggio): questo 

procedimento prende il nome di interpolazione ed è il soggetto di questo Capitolo; 

61

5. INTERPOLAZIONE 

Anno 1861 1871 1881 1901 1911 1921 1931 

Popolazione 22176 27300 28952 32963 35842 39397 41043 

Anno 1936 1951 1961 1971 1981 1991 2001 

Popolazione 42398 47516 50624 54137 56557 56778 56996 

Tabella 5.1: Dati forniti dall’ISTAT, tratti da http://dawinci.istat.it/daWinci/jsp/dawinci.jsp: 

popolazione residente dell’Italia ai confini ai confini attuali ai censimenti dal 1861 al 2001. Popolazione in 

migliaia. 

Figura 5.1: Censimento della popolazione residente in Italia. 

G cercare una funzione che, “in qualche modo” passi vicino ai dati assegnati: si parla di approssimazione 

(che vedremo nel prossimo Capitolo). 

In particolare, dato l’insieme dei punti (x i , y i ), i = 0,1,...,n, dove y i è il valore assunto da una funzione f 

in x i o il valore di un dato sperimentale, cerchiamo una funzione v(x) che, in maniera ragionevole si addica 

all’insieme dei dati. Se i dati sono accurati, ha senso richiedere che la funzione interpoli i dati (cioè passi 

esattamente per le coppie di punti): v(x i ) = y i . Nell’approssimazione, invece, si cerca una funzione più 

semplice v(x) che sia vicina ad una funzione più complicata f (x) o ad una serie di dati. 

5.2 Interpolazione 

Una funzione di interpolazione v(x) serve per vari scopi. 

G Possiamo usare la v(x) per trovare valori approssimati y in punti x diversi da quelli assegnati 

x 0 , x 1 ,... x n . Se x si trova all’interno dell’intervallo che contiene le ascisse dei dati assegnati si parla 

di interpolazione. Se invece x si trova all’esterno dell’intervallo si ha estrapolazione. Nell’esempio della 

popolazione italiana, si interpolano i dati per stimare la popolazione nel 1975 o nel 1995, si applica 

invece un procedimento di estrapolazione se si vuole stimare la popolazione del 2012. 

G Se le coppie di dati assegnati si riferiscono ad una funzione f (x), la funzione di interpolazione può 

essere utile per approssimare le derivate o gli integrali della f . 

Assumiamo che la funzione v di interpolazione sia una combinazione lineare di funzioni base di un 

qualche appropriato spazio di funzioni, cioè si possa scrivere come 

62 

v(x) = c 0 φ 0 (x) + ... + c n φ n (x)

5.3. Interpolazione polinomiale 

dove c i , i = 0,1,...,n sono i coefficienti incogniti (o parametri) da determinare in base ai dati in possesso, 

mentre φ i sono le funzioni base che assumiamo linearmente indipendenti 1 . 

Esempi di interpolazione sono dati dall’interpolazione polinomiale, dall’interpolazione polinomiale a 

tratti, dall’interpolazione trigonometrica. Noi ci limitiamo a studiare l’interpolazione polinomiale: date n +1 

coppie di punti (x i , y i ), per i = 0,1,...,n, andremo a cercare un polinomio p(x) di grado n per cui p(x i ) = y i . 

Parleremo, dunque, di polinomio di interpolazione p(x) (v(x) ≡ p(x)). 

Il processo di interpolazione si basa su due stadi: 

G costruire la funzione interpolante, cioè determinare i coefficienti c 0 , c 1 ,...,c n per un’assegnata base 

φ 0 ,φ 1 ,...,φ n ; 

G valutare la funzione interpolante in un assegnato punto x. 

Il primo punto è fatto una volta per tutte, una volta fissata la base e noto l’insieme dei punti da interpolare. Il 

secondo punto può essere applicato tutte le volte che si vuole valutare la funzione interpolante. 

5.3 Interpolazione polinomiale 

L’interpolazione polinomiale è il tipo di interpolazione più semplice. I polinomi, infatti, sono facili da 

costruire e da valutare, sono facili da sommare e moltiplicare (e il risultato è sempre un polinomio) e sono 

altrettanto facili da differenziare e integrare (e il risultato è sempre un polinomio). 

Sia p(x) = p n (x) un polinomio di grado n dato da 

p n (x) = c 0 + c 1 x + ... + c n x n 

Date n + 1 coppie di punti (x 0 , y 0 ), (x 1 , y 1 ), ..., (x n , y n ), vogliamo trovare gli n + 1 coefficienti c 0 ,c 1 ,...c n 

tali che p(x i ) = y i , i = 0,...,n. 

Ricordiamo che, un polinomio di grado n ha n+1 coefficienti e che, date n+1 coppie di punti, il polinomio 

interpolatore sarà di grado n. 

Assumiamo, inoltre, che le ascisse delle coppie dei punti siano distinte, cioè x i ≠ x j , per i ≠ j . 

5.3.1 Funzioni base monomiali 

Utilizziamo come funzioni base i monomi x 0 , x 1 , x 2 ,..., x n . 

Esempio 5.3.1 Sia n + 1 = 2: abbiamo quindi due coppie di dati 

x i 1 2 

y i 1 3 

Cerchiamo quindi un polinomio di primo grado (una retta) che passi per i punti assegnati, della forma 

p(x) = p 1 (x) = c 0 + c 1 x. 

Le condizioni di interpolazione diventano: 

p 1 (x 0 ) = y 0 ⇐⇒ c 0 + 1c 1 = 1 

p 1 (x 1 ) = y 1 ⇐⇒ c 0 + 2c 1 = 3 

Abbiamo due equazioni in due incognite c 0 e c 1 . Risolvendo il sistema 2 × 2 otteniamo c 1 = 2 e c 0 = −1, 

quindi p 1 (x) = 2x − 1. 

1 Le funzioni φ 0 ,φ 1 ,...,φ n si dicono linearmente indipendenti se vale: c 0 φ 0 (x) + ...c n φ n (x) ≡ 0 per ogni x se e solo se tutti i 

coefficienti sono nulli c 0 = ... = c n = 0. 

63


Figura 5.2: Interpolazione lineare e quadratica 

Esempio 5.3.2 Consideriamo adesso un ulteriore coppia di punti per cui i dati che abbiamo sono n + 1 = 3 

e 

x i 1 2 4 

y i 1 3 3 

Il problema è ora diverso rispetto a quello appena risolto, perchè la terza coppia di punti specifica una 

valore y 2 ben diverso da quello predetto da p 1 in x 2 = 4. Difatti p 1 (x 2 ) = 7, nell’esempio precedente, mentre 

ora al valore di x 2 = 4 deve corrispondere y 2 = 3. 

Cerchiamo il polinomio di grado 2, quindi, della forma p 2 (x) = c 0 + c 1 x + c 2 x 2 che passa attraverso i punti 

dati. 

Le condizioni di interpolazione adesso sono: 

⎧ 

⎪⎨ p 2 (x 0 ) = c 0 + 1c 1 + 1c 2 = 1 

p 2 (x 1 ) = c 0 + 2c 1 + 4c 2 = 3 

⎪⎩ 

p 2 (x 2 ) = c 0 + 4c 1 + 16c 2 = 3 

Abbiamo un sistema lineare di 3 equazioni in 3 incognite, la cui soluzione è: 

c 0 = − 7 3 , c 1 = 4, c 2 = − 2 3 . 

Il polinomio è p 2 (x) = (−2x 2 + 12x − 7)/3. Per x = 3 si ha p 2 (3) = 11 = 3.666666667, valore ben diverso da 

3 

p 1 (3) = 5. Del resto le curve che abbiamo ottenuto coincidono solo nei punti d’appoggio comuni a entrambe, 

per il resto l’una è una retta, l’altra è un polinomio di secondo grado (si veda Figura 5.2). 

Generalizzando gli esempi precedenti, date n + 1 coppie di punti, il polinomio di interpolazione di grado 

n sarà costruito risolvendo un sistema lineare di n equazioni nelle n incognite c 0 ,c 1 ,...,c n : 

⎧ 

p n (x 0 ) = y 0 ⇐⇒ c 0 + c 1 x 0 + c 2 x0 2 + ... + c n x0 n = y 0 

64 

p ⎪⎨ n (x 1 ) = y 1 ⇐⇒ c 0 + c 1 x 1 + c 2 x1 2 + ... + c n x1 n = y 1 

p n (x 2 ) = y 2 ⇐⇒ c 0 + c 1 x 2 + c 2 x2 2 + ... + c n x2 n = y 2 

. 

⎪⎩ 

p n (x n ) = y n ⇐⇒ c 0 + c 1 x n + c 2 xn 2 + ... + c n xn n = y n


In forma compatta, sotto forma matriciale 2 le equazioni del sistema si possono scrivere come 

⎛ 

1 x 0 x0 2 ... x n ⎞ 

⎛ ⎞ ⎛ ⎞ 

0 

1 x 1 x1 2 ... x1 

n c 0 y 0 

1 x 2 x 2 2 

... x2 

n c 1 

⎜ 

⎝ 

. 

. 

⎜ 

. 

⎟⎝ 

⎟ 

. ⎠ = y 1 

⎜ 

⎝ 

⎟ 

. ⎠ 

. ⎠ 

1 x n xn 2 ... xn 

n c n y n 

La matrice dei coefficienti è una matrice ben nota in letteratura e prende il nome di matrice di Vandermonde. 

3 È una matrice con determinante diverso da zero, e quindi il sistema ammette una ed una sola 

soluzione. Osserviamo che la prima colonna ha tutti gli elementi uguali a 1, la seconda colonna ha le ascisse 

dei punti di appoggio, la terza colonna ha i quadrati di esse, e così via. 

Perciò, date n+1 coppie di punti di appoggio (x i , y i ), i = 0,...,n, con ascisse distinte 

x i , esiste un unico polinomio interpolatore p(x) di grado al più n tale che p(x i ) = y i , 

i = 0,...,n. 

Tuttavia, la matrice di Vandermonde non ha buone proprietà: difatti è una matrice malcondizionata, e 

questo lo si osserva al crescere di n in quanto la soluzione del sistema diventa inaccurata 4 , qualunque metodo 

venga utilizzato per risolverlo. 

Questo approccio ci è servito per dimostrare che il polinomio di interpolazione esiste ed è unico, ma 

non è utile nella pratica a causa del malcondizionamento. Sarebbe preferibile, quindi, poter usare funzioni 

base diverse dai monomi in modo da evitare il malcondizionamento, avere meno operazioni dal punto di 

vista computazionale e poter manipolare in maniera più efficiente le funzioni basi φ i in vista di una loro 

applicazione nella differenziazione e integrazione numerica. 

5.3.2 Polinomi di Lagrange 

Scriviamo il polinomio p(x) con i coefficienti c i uguali alle ordinate dei punti d’appoggio y i , c i ≡ y i : 

p(x) = p n (x) = y 0 φ 0 (x) + ... y n φ n (x) 

Una base di funzioni che ci permette una simile rappresentazione è data dai polinomi di Lagrange. 5 

I polinomi di Lagrange L j (x), per j = 0,1,...,n sono polinomi di grado n che, nei nodi x i , soddisfano la 

relazione 

{ 

0 se i ≠ j 

L j (x i ) = 

1 se i = j 

Allora il polinomio p n (x) = ∑ n 

j =0 L j (x) · y j è tale che p n (x i ) = y i cioè soddisfa la condizione di 

interpolazione, per ogni i = 0,...,n. 

2 Questo argomento verrà approfondito nel Capitolo 7, dove rimandiamo per i dettagli. 

3 Alexandre-Theophile Vandermonde, (1735-1796), abbandonò una carriera da violinista per dedicarsi alla matematica quando 

aveva 35 anni. Si occupò di vari problemi di algebra, di topologia, calcolo combinatoriale, e teoria dei determinanti. 

4 Una matrice A è malcondizionata quando, a piccole variazioni sui coefficienti della matrice, corrispondono grandi variazioni nella 

soluzione del sistema lineare Ax = b 

5 Joseph Louis Lagrange (1736-1813) nacque a Torino (come Giuseppe Luigi Lagrangia) e si trasferì in Francia, a Parigi, dove divenne 

cittadino francese adottando la traduzione francese del suo nome. Matematico e astronomo, diede un importante contributo alla 

meccanica classica e celeste e alla teoria dei numeri. 

65


I polinomi di Lagrange sono definiti dalla relazione: 6 

L j (x) = 

n∏ 

k=0 

k≠j 

(x − x k ) 

(x j − x k ) 

Introduciamo anche il polinomio F (x) di grado n + 1 (che ci servirà in seguito), che si annulla nelle n + 1 

ascisse dei dati assegnati. 

F (x) = 

n∏ 

(x − x k ) 

k=0 

In forma estesa abbiamo 

L j (x) = (x − x 0)···(x − x j −1 )(x − x j +1 )···(x − x n ) 

(x j − x 0 )···(x j − x j −1 )(x j − x j +1 )···(x j − x n ) = n∏ 

k=0 

k≠j 

x − x k 

x j − x k 

Esempio 5.3.3 Siano date le tre coppie di punti dell’esempio precedente (1,1), (2,3), (4,3). I polinomi di 

Lagrange sono: 

(x − 2)(x − 4) (x − 2)(x − 4) 

L 0 (x) = = 

(1 − 2)(1 − 4) 3 

(x − 1)(x − 4) (x − 1)(x − 4) 

L 1 (x) = = − 

(2 − 1)(2 − 4) 2 

(x − 1)(x − 2) (x − 1)(x − 2) 

L 2 (x) = = 

(4 − 1)(4 − 2) 6 

Il polinomio si scrive, quindi come 

p 2 (x) = L 0 (x) · 1 + L 1 (x) · 3 + L 2 (x) · 3 = 1 3 (x − 2)(x − 4) − 3 2 (x − 1)(x − 4) + 3 (x − 1)(x − 2) 

6 

Raccogliendo i termini ritroviamo p 2 (x) = (−2x 2 + 12x − 7)/3, lo stesso polinomio ottenuto con le funzioni 

base monomiali, e ciò è dovuto all’unicità del polinomio interpolatore. 

Formula 

dell’errore 

5.3.3 Formula dell’errore 

Supponiamo, ora, che le ordinate y i siano i valori di una funzione f valutata nei punti di appoggio x i . Conosciamo, 

quindi, una funzione f e di questa funzione vogliamo fare l’interpolazione sostituendola mediante 

un polinomio di grado n tale che p(x i ) = f (x i ) = y i , i = 0,...,n. 

Quale errore si commette interpolando la funzione f con un polinomio di grado n? 

Consideriamo un ulteriore punto t distinto dai punti di appoggio e compreso nell’intervallo I individuato 

dai valori minimo e massimo delle ascisse dei punti di appoggio. 

f (t) − p(t) 

Definiamo la quantità S che dipende da t, data da S = e la funzione G(x) = f (x)−p(x)−SF (x). 

F (t) 

6 Ricordiamo che, dati n valori w 1 , w 2 ,..., w n usiamo la seguente simbologia per indicare la loro somma e il loro prodotto, rispettivamente: 

. 

n∑ 

w i = w 1 + w 2 + w 3 + ... + w n 

i=1 

n∏ 

w i = w 1 · w 2 · w 3 · ... · w n 

i=1 

66


Figura 5.3: Polinomi di Lagrange L 0 (x), L 1 (x), L 2 (x), con x 0 = 1, x 1 = 2, x 2 = 4. 

La funzione G si annulla non solo negli n + 1 punti d’appoggio poichè G(x i ) = f (x i ) − p(x i ) − SF (x i ) = 0 

per i = 0,...,n ma anche in t a causa di come è stato definito S. Si annulla, quindi, in n + 2 punti. 

Per il teorema di Rolle, la derivata prima si annulla n + 1 volte in I . Applicando ripetutamente il teorema 

di Rolle sulle derivate successive, si arriva alla derivata n + 1-sima di G, che si annulla almeno 1 volta in I . Sia 

ξ il punto in cui G (n+1) (ξ) = 0. Ma 7 

G (n+1) (ξ) = f (n+1) (ξ) − S(n + 1)! 

Si ha perciò: 

f (n+1) (ξ) − S(n + 1)! = 0 

ovvero 

f (t) − p(t) 

F (t) 

= S = f (n+1) (ξ) 

(n + 1)! 

Considerando, ora, x al posto di t, e scrivendo ξ come funzione di x (in quanto il valore di ξ dipende da 

x) e scrivendo in forma estesa il polinomio F (x), otteniamo 

f (x) − p(x) = f (n+1) (ξ(x)) 

(n + 1)! 

n∏ 

(x − x i ) 

i=0 

Abbiamo in questo modo trovato una formula per l’errore, detta anche formula del resto. Il resto normalmente 

è incognito ma se conosciamo la f e una maggiorazione della f (n+1) , allora possiamo maggiorare il 

resto. 

Allo stesso modo, possiamo limitare l’errore di interpolazione se troviamo un limite superiore per |F (x)|. 

5.3.4 Differenze divise e formula di Newton 

Uno dei punti forti della rappresentazione di Lagrange è che se alcuni dati cambiano (ad esempio il valore 

di y j per un certo j ) allora il cambiamento è immediatamente visibile nell’intero polinomio di interpolazione. 

Uno dei punti deboli, invece, è la procedura per valutare p n (x). Con la formula di Newton abbiamo un utile 

compromesso. 

Differenze 

divise e 

formula di 

Newton 

7 La derivata n + 1-sima di un polinomio di grado n è una quantità nulla, mentre la derivata n + 1-sima di un polinomio di grado 

n + 1, quale è F (x), vale (n + 1)!. 

67


Le funzioni base che ora consideriamo sono 

j∏ 

−1 

φ j (x) = (x − x i ) j = 0,1,...,n 

i=0 

Quindi vogliamo scrivere il polinomio di interpolazione come: 

p(x) = c 0 + c 1 (x − x 0 ) + c 2 (x − x 0 )(x − x 1 ) + ... + c n (x − x 0 )(x − x 1 ) · ...(x − x n−1 ) 

dove c 0 , c 1 ...c n sono delle costanti da definire in modo opportuno. 

Esempio 5.3.4 Consideriamo sempre le tre coppie di punti degli esempi precedenti, (1,1), (2,3) e (4,3). 

Per costruire p 2 (x) abbiamo bisogno di φ 0 , φ 1 e φ 2 : 

φ 0 (x) = 1 

φ 1 (x) = (x − x 0 ) = (x − 1) 

φ 2 (x) = (x − x 0 )(x − x 1 ) = (x − 1)(x − 2) 

La condizione di interpolazione in x 0 = 1 porta a: 

f (x 0 ) = 1 = p 2 (x 0 ) = p 2 (1) = c 0 φ 0 (1) + c 1 φ 1 (1) + c 2 φ 2 (1) = c 0 · 1 + c 1 · 0 + c 2 · 0 

Quindi c 1 = 1 = f (x 0 ). 

In x 1 = 2 abbiamo: 

f (x 1 ) = 3 = p 2 (x 1 ) = p 2 (3) = f (x 0 ) + c 1 φ 1 (2) + c 2 φ 2 (2) = f (x 0 ) + c 1 · 1 + c 2 · 0 

Ricaviamo quindi c 1 = f (x 1) − f (x 0 ) 

= 3 − 1 = 2. Chiamiamo questa quantità differenza divisa del primo 

x 1 − x 0 2 − 1 

ordine tra x 0 e x 1 e la indichiamo con f [x 0 , x 1 ]. Quindi 

f [x 0 , x 1 ] = f (x 1) − f (x 0 ) 

x 1 − x 0 

Infine, 

f (x 2 ) = 3 = p 2 (x 2 ) = p 2 (4) = f (x 0 ) + f [x 0 , x 1 ]φ 1 (4) + c 2 φ 2 (4) 

= f (x 0 ) + f [x 0 , x 1 ](4 − 1) + c 2 (4 − 1)(4 − 2) 

Per ottenere una formula per c 2 che abbia carattere generale, riscriviamo l’equazione precedente utilizzando 

i simboli x 0 , x 1 , x 2 per le ascisse. 

In x 1 si ha f (x 1 ) = p 2 (x 1 ) = f (x 0 ) + f [x 0 , x 1 ](x 1 − x 0 ). 

In x 2 si ha f (x 2 ) = p 2 (x 2 ) = f (x 0 ) + f [x 0 , x 1 ](x 2 − x 0 ) + c 2 (x 2 − x 0 )(x 2 − x 1 ). 

Sottraendo membro a membro la prima equazione dalla seconda si ricava: 

f (x 2 ) − f (x 1 ) = f [x 0 , x 1 ](x 2 − x 0 − x 1 + x 0 ) + c 2 (x 2 − x 0 )(x 2 − x 1 ) 

f (x 2 ) − f (x 1 ) = f [x 0 , x 1 ](x 2 − x 1 ) + c 2 (x 2 − x 0 )(x 2 − x 1 ) 


f (x 2 ) − f (x 1 ) − f [x 0 , x 1 ](x 2 − x 1 ) = c 2 (x 2 − x 0 )(x 2 − x 1 ) 

f (x 2 ) − f (x 1 ) 

x 2 − x 1 

− f [x 0 , x 1 ] x 2 − x 1 

x 2 − x 1 

= c 2 (x 2 − x 0 ) 

Ma f (x 2) − f (x 1 ) 

x 2 − x 1 

f (x 2 ) − f (x 1 ) 

x 2 − x 1 

− f [x 0 , x 1 ] = c 2 (x 2 − x 0 ) 

= f [x 1 , x 2 ] è la differenza divisa del primo ordine tra x 1 e x 2 da cui 

f [x 1 , x 2 ] − f [x 0 , x 1 ] = c 2 (x 2 − x 0 ) =⇒ c 2 = f [x 1, x 2 ] − f [x 0 , x 1 ] 

x 2 − x 0 

68


La quantità chiamata c 2 prende il nome di differenza divisa del secondo ordine e si indica con 

f [x 0 , x 1 , x 2 ] = f [x 1, x 2 ] − f [x 0 , x 1 ] 

x 2 − x 0 

. 

Facendo le opportune sostituzioni si ricava c 2 = − 4 6 = − 2 3 . 

Quindi, p 2 (x) = f (x 0 ) + f [x 0 , x 1 ](x − x 0 ) + f [x 0 , x 1 , x 2 ](x − x 0 )(x − x 1 ) Nell’esempio considerato: p 2 (x) = 

1 + 2(x − 1) − 2 (x − 1)(x − 2) 

3 

Date le stesse coppie di punti, abbiamo visto come cambia la rappresentazione (usando come funzioni 

base i monomi, poi i polinomi di Lagrange e ora la formulazione di Newton) ma il polinomio finale è sempre 

lo stesso essendo unico il polinomio interpolatore. 

Da questo esempio, si può vedere come la rappresentazione secondo Newton sia di tipo ricorsivo: il polinomio 

p 1 (x) = f (x 0 ) + f [x 0 , x 1 ](x − x 0 ) (che si ha arrestandosi ai primi due passi del procedimento appena 

effettuato) è un polinomio, in tal caso una retta, che interpola i dati (x 0 , y 0 ), e (x 1 , y 1 ). Il polinomio p 2 (x) è dato 

dalla somma di p 1 (x) e del termine f [x 0 , x 1 , x 2 ](x − x 0 )(x − x 1 ). Quindi, una volta determinato il polinomio 

p n−1 che interpola i primi n dati, possiamo usare questa rappresentazione per costruire p n che interpola i 

dati precedenti cui si aggiunge la coppia (x n , y n ). 

Il coefficiente c j del polinomio interpolatore di Newton si chiama differenza divisa di ordine j e viene 

indicata con f [x 0 , x 1 ,..., x j ]. 

Perciò: 

f [x 0 ] = c 0 , f [x 0 , x 1 ] = c 1 , ..., f [x 0 , x 1 ,..., x n ] = c n 

La notazione utilizzata ci permette di capire anche da quali coppie di punti dipende il coefficiente c j . 

Dati i punti x 0 , x 1 ,..., x n , per indici i e j arbitrari con 0 ≤ i ≤ j ≤ n, si ha 

f [x i ] = f (x i ) 

f [x i ,..., x j ] = f [x i+1,... x j ] − f [x i ,..., x j −1 ] 

x j − x i 

La formula interpolatoria alle differenze divise di Newton è dunque data da 

p n (x) = f [x 0 ] + f [x 0 , x 1 ](x − x 0 ) + f [x 0 , x 1 , x 2 ](x − x 0 )(x − x 1 ) + ... 

+ f [x 0 , x 1 ,..., x n ](x − x 0 )(x − x 1 )···(x − x n−1 ) 

Da un punto di vista computazionale i coefficienti si ricavano mediante la tabella delle differenze divise, 

tenendo presente che per calcolare f [x 0 , x 1 ,..., x n ] dobbiamo aver calcolato tutte le differenze divise 

f [x j −k ,..., x j ], con 0 ≤ k ≤ j ≤ n. 

69


x i f [·] f [·,·] f [·,·,·] f [·,·,·,·] f [·,·,·,·,·] 

x 0 f (x 0 ) 

f [x 0 , x 1 ] 

x 1 f (x 1 ) f [x 0 , x 1 , x 2 ] 

f [x 1 , x 2 ] f [x 0 , x 1 , x 2 , x 3 ] 

x 2 f (x 2 ) f [x 1 , x 2 , x 3 ] f [x 0 , x 1 , x 2 , x 3 , x 4 ] 

f [x 2 , x 3 ] f [x 1 , x 2 , x 3 , x 4 ] 

x 3 f (x 3 ) f [x 2 , x 3 , x 4 ] 

x 4 f (x 4 ) 

. 

. 

f [x 3 , x 4 ] 

. 

. 

I coefficienti della diagonale principale sono i coefficienti c j del polinomio interpolatore di Newton. 

. 

. 

Esempio 5.3.5 Costruiamo la tabella delle differenze divise per i dati (1,1), (2,3) e (4,3). 

x i f [·] f [·,·] f [·,·,·] 

1 1 

2 

2 3 − 2 3 

0 

4 3 

Il polinomio p 2 (x) si scrive: p 2 (x) = 1 + 2(x − 1) − 2 (x − 1)(x − 2). 

3 

Se vogliamo aggiungere altri dati, per esempio, la coppia (5,4), dobbiamo aggiungere una riga alla tabella 

della differenza divisa e un termine al polinomio che abbiamo già ricavato per ottenere quello di grado 

superiore interpolante tutti i dati che abbiamo a disposizione. 

x i f [·] f [·,·] f [·,·,·] f [·,·,·,·] 

1 1 

2 

2 3 − 2 3 

0 

1 

4 3 

3 

1 

5 4 

1 

4 

Il polinomio p 3 (x) è p 3 (x) = p 2 (x) + 1 (x − 1)(x − 2)(x − 4). 

4 

Il concetto di differenza divisa può essere visto come un’estensione del concetto di derivata di una 

funzione. 

Si ha, infatti, che, per f derivabile, la diffenza divisa del primo ordine f [x 0 , x 1 ] può essere vista come un 

rapporto incrementale e quindi, al limite per x 1 → x 0 , si ha f ′ (x 0 ). 

70

5.4. Considerazioni sull’interpolazione polinomiale 

La differenza divisa k-sima e la derivata k-sima di f sono legate tra loro. Si può provare, infatti, per k ≥ 1 

che vale la relazione 

f [x 0 , x 1 ,..., x k ] = f (k) (ξ) 

k! 

dove ξ è un punto appartente all’interno dell’intervallo individuato dagli estremi di x 0 ,..., x k . Quando i punti 

coincidono, si ha 

f [ x 0,x 0 ,...,x 0 

} {{ } 

] = f (k) (x 0 ) 

k! 

k+1 volte 

Questa formula serve per calcolare il polinomio di interpolazione che interpola non solo una certa funzione 

f ma anche le sue derivate in alcuni punti assegnati (si veda l’esercizio 5.5.3 a fine Capitolo). 

Se al polinomio p n (x) aggiungiamo la coppia di dati (x, f (x)) si ha p n+1 (x) = f (x) = p n (x) + 

f [x 0 , x 1 ,..., x n , x](x − x 0 )(x − x 1 ) · ...(x − x n ). L’ultima differenza divisa non si può calcolare, poichè dipende 

da x (che è la nostra variabile), ma ci è utile per capire quanto vale l’errore che commettiamo nell’approssimare 

f (x) mediante il polinomio interpolatore, applicando la rappresentazione di Newton. Inoltre, dato che 

il polinomio interpolatore è unico (fissate le coppie di dati del problema), anche l’errore che si commette è lo 

stesso, qualunque sia la strategia utilizzata per arrivare ad esso. Quindi possiamo eguagliare l’errore trovato 

utilizzando i polinomi di Lagrange con l’errore trovato nella rappresentazione di Newton, ottenendo: 

f (n+1) (ξ(x)) n∏ 

n∏ 

(x − x i ) = f [x 0 , x 1 ,..., x n , x] (x − x i ) 

(n + 1)! 

i=0 

i=0 

Derivata 

k-sima della 

f 

Formula 

dell’errore 

5.4 Considerazioni sull’interpolazione polinomiale 

5.4.1 Fenomeno di Runge 

Data una funzione f , si pensa che il polinomio di interpolazione possa approssimare bene la funzione, 

soprattutto se si aumenta il numero dei punti di appoggio. In realtà questo non è sempre vero e un semplice 

e famoso esempio ce lo fa capire. Sia data la funzione di Runge 8 1 

f (x) = e consideriamo il polino- Fenomeno di 

1 + x2 Runge 

mio di interpolazione di questa funzione per valori crescenti di n prendendo punti di appoggio equidistanti 

nell’intervallo [−5,5]. Partiamo da n + 1 = 2 con i punti equidistanti x 0 = −5, x 1 = 0 e x 2 = 5. Si ha la tabella 

x i −5 0 5 

y i = f (x i ) 3.846154e − 2 1. 3.846154e − 2 

Costruiamo quindi il polinomio di interpolazione p 2 (x) (utilizzando l’approccio di Lagrange o di Newton, i 

risultati non cambiano). Raddoppiamo il numero dei punti aggiungendo un punto tra x 0 e x 1 e uno tra x 1 e 

x 2 . Abbiamo n + 1 = 5 e i valori della tabella 

x i −5 −2.5 0 2.5 5 

y i = f (x i ) 3.846154e − 2 1.379310e − 1 1. 1.379310e − 1 3.846154e − 2 

Con lo stesso procedimento, costruiamo i polinomi di interpolazione di grado 8 e 16. In Figura 5.4 sono riportati 

i grafici della funzione di Runge (in nero) e dei polinomi interpolanti di grado 2, 4 e 8. Si può osservare 

che solo in un sottointervallo di [−5,5] al crescere di n, i polinomi convergono alla funzione. Agli estremi 

dell’intervallo [−5,5] si hanno oscillazioni che aumentano sempre più al crescere di n. Infatti in Figura 5.5 

(a sinistra) non si riesce più a distinguere il profilo della funzione di Runge perchè il polinomio di interpolazione 

di grado 16 ha delle oscillazioni molto alte. Tuttavia, se restringiamo questo grafico in un intorno 

dell’origine, possiamo vedere come il polinomio p 16 si avvicini bene alla funzione – si veda la Figura 5.5 (a 

destra)! L’esempio di Runge è utile per capire che la scelta dei nodi equidistanti non si rivela sempre la scelta 

giusta e che altri tipi di interpolazione possono dare risultati migliori. Per indagare ulteriormente su questo 

problema, si rimanda alla letteratura specializzata del settore. 

8 Carl Runge (1856-1927) fu un matematico tedesco. Fu studente di Weierstrass, Kirchhoff, Helmholtz. Iniziò poi a collaborare con 

Kronecker e poi si dedicò in particolare allo studio della soluzione numerica di equazioni algebriche e alla spettroscopia. 

71


Figura 5.4: Funzione di Runge e polinomi interpolanti di grado 2, 4 e 8. 

Figura 5.5: Funzione di Runge e polinomio interpolante di grado 16 su tutto l’intervallo [−5,5] (a sinistra) e in 

un sottointervallo (a destra) 

5.4.2 Malcondizionamento nell’interpolazione con funzioni base monomiali 

All’inizio di questo Capitolo, abbiamo introdotto il polinomio di interpolazione mediante funzioni base 

monomiali: il problema dell’interpolazione veniva risolto mediante un sistema lineare la cui matrice, di 

Vandermonde, è malcondizionata. 

Vediamo di capire questo malcondizionamento mediante un esempio. Si voglia studiare l’interpolazione 

dei seguenti dati 

x i 1010.5 1011.5 1012.5 1013 1014 1015 

y i 4 2.5 2.5 2 2 0 

Confrontando i vari algoritmi di interpolazione, osserveremo che gli algoritmi di Lagrange e delle differenze 

divise di Newton danno buoni risultati. Al contrario, il metodo che porta alla costruzione della matrice 

di Vandermonde porta a risultati disastrosi, come si può vedere in Figura 5.6. Eppure, dal punto di vista 

teorico i risultati dovrebbero essere identici. 

72


Figura 5.6: Effetti del malcondizionamento 

Perchè si hanno questi risultati? Bisogna tener conto di tre aspetti: il calcolo della matrice del sistema V ; 

la soluzione del sistema lineare V c = y; il calcolo dei valori del polinomio. 

La matrice di Vandermonde consiste di colonne che crescono di colonna in colonna - 1, x i , x 2 i , x3 i , ..., 

x 5 i . Per questo caso test, si va da 1 a elementi dell’ordine di 1015 . La matrice è molto mal condizionata. 

Perciò la soluzione del sistema lineare non può dare risultati affidabili e il vettore che fornisce i coefficienti del 

polinomio interpolatore è completamente errato. Ciò porta anche al fenomeno della cancellazione numerica 

nel calcolo del polinomio di interpolazione, per cui si ha una significativa perdita di accuratezza e il grafico 

risultante presenta un profilo altamente oscillante. 


Esercizio 5.5.1 Sia data la tabella seguente: 

x i -1 0 2 3 4 

f (x i ) 9 0 0 15 84 

(a) Scrivere la tabella delle differenze divise. 

(b) Trovare il polinomio interpolatore (con la formula di Newton) di grado non superiore a 4. 

Svolgimento 

(a) La tabella delle differenza divise è: 

(b) Il polinomio di Newton di grado 4 che interpola i dati assegnati è dunque (prendendo i valori della 

diagonale principale della tabella) 

p(x) = 9 − 9(x + 1) + 3(x + 1)x + 0.5(x + 1)x(x − 2) + (x + 1)x(x − 2)(x − 3) = 

= x 4 − 3.5x 3 + 3.5x 2 − x 

73


x i f (x i ) f (·,·) f (·,·,·) f (·,·,·,·) f (·,·,·,·,·) 

-1 9 

0 0 

0 − 9 

0 − (−1) = −9 

2 0 

3 15 

4 84 

0 − 0 

2 − 0 = 0 0 + 9 

2 − (−1) = 3 

15 − 0 

3 − 2 = 15 15 − 0 

3 − 0 = 5 5 − 3 

3 − (−1) = 0.5 

84 − 15 

4 − 3 = 69 69 − 15 

4 − 2 = 27 27 − 5 

4 − 0 = 11 2 

11/2 − 1/2 

= 1 

4 − (−1) 


x i 0 0.1 0.8 1.2 

f (x i ) 1 0.48 1.32 5.32 

(a) Scrivere la tabella delle differenze divise. 

(b) Usando i quattro punti in successione, scrivere i polinomi interpolanti (di Newton) p n (x) di grado 

non superiore ad n (con n=0,1,2,3); commentare il risultato. 

(c) Usando p n (x) stimare, per ogni n, f (0.6) e f ′ (0.6). 

(d) scrivere il polinomio p 2 (x) con la formula di Lagrange. 

Svolgimento 

(a) La tabella delle differenza divise è: 

x i f (x i ) f (·,·) f (·,·,·) f (·,·,·,·) 

0 1 

0.1 0.48 

0.48 − 1 

= −5.2 

0.1 

0.8 1.32 

1.32 − 0.48 

= 1.2 

0.7 

1.2 + 5.2 

= 8 

0.8 

1.2 5.32 

5.32 − 1.32 

= 10 

0.4 

10 − 1.2 

= 8 

1.1 

8 − 8 

1.2 = 0 

(b) I polinomi di Newton di grado 0,1,2 e 3 sono: 

p 0 (x) = 1 

p 1 (x) = 1 − 5.2x 

p 2 (x) = 1 − 5.2x + 8x(x − 0.1) = 8x 2 − 6x + 1 

p 3 (x) = 1 − 5.2x + 8x(x − 0.1) + 0x(x − 0.1)(x − 0.8) = 1 − 5.2x + 8x(x − 0.1) = p 2 (x) 

74


Il polinomio p 3 (x) coincide con p 2 (x) in quanto p 2 (x 3 ) = p 2 (1.2) = f (1.2) = f (x 3 ) cioè il polinomio 

di grado 2 interpola non solo i dati (x 0 , f (x 0 )), (x 1 , f (x 1 )) e (x 2 , f (x 2 )) ma anche (x 3 , f (x 3 )). 

(c) Per le derivate di p n (x), n = 0,1,2 si ha 

p ′ 0 (x) = 0 

p 1 ′ (x) = −5.2 

p 2 ′ (x) = 16x − 6 

La stima di f (0.6) e f ′ (0.6) è: 

n p n (0.6) p n ′ (0.6) 

0 1 0 

1 -2.12 -5.2 

2 0.28 3.6 

(d) I polimoni di Lagrange per ricavare il polinomio p 2 sono dati considerando i valori x 0 , x 1 e x 2 : 

(x − 0.1)(x − 0.8) 

L 0 (x) = 

(−0.1)(−0.8) 

L 1 (x) = 

L 2 (x) = 

x(x − 0.8) 

0.1(0.1 − 0.8) = x2 − 0.8x 

−0.07 

x(x − 0.1) 

0.8(0.8 − 0.1) = x2 − 0.1x 

0.56 

= x2 − 0.9x + 0.08 

0.08 

Il polinomio è: 

p 2 (x) = 1L 0 (x) + 0.48L 1 (x) + 1.32L 2 (x) 

= x2 − 0.9x + 0.08 

− 0.48 x2 − 0.8x 

+ 1.32 x2 − 0.1x 

0.08 

0.07 

0.56 

= 12.5(x 2 − 0.9x + 0.08) − 6.857142857(x 2 − 0.8x) + 2.357142857(x 2 − 0.1x) 

e raccogliendo i termini 

p 2 (x) = 8x 2 − 6x + 1 

Esercizio 5.5.3 Trovare il polinomio di grado non superiore a 4 che interpola i dati seguenti: f (0) = 

2, f ′ (0) = 7, f ′′ (0) = 18, f (1) = 27 f ′ (1) = 60. Stimare f (0.2) e f ′ (0.2). 

Svolgimento 

Costruiamo la tabella delle differenze divise tenendo presente che le derivate di una funzione f si possono 

avere come limite delle differenze divise: 

f [0,0] = f ′ (0) = 7 f [0,0,0] = f ′′ (0) 

2! 

Si ottiene, dunque, 

= 9 f [1,1] = f ′ (1) = 60 

75


0 2 

7 

0 2 9 

7 9 

0 2 18 8 

25 17 

1 27 35 

60 

1 27 

Il polinomio è dunque p(x) = 2 + 7x + 9x 2 + 9x 3 + 8x 3 (x − 1), vale a dire 

p(x) = 8x 4 + x 3 + 9x 2 + 7x + 2. 

La stima di f (0.2) è data da: f (0.2) ≈ p(0.2) = 3.7808. 

Per stimare f ′ (0.2) dobbiamo prima calcolare la derivata prima di p. Si ha 

p ′ (x) = 32x 3 + 3x 2 + 18x + 7, 

da cui f ′ (0.2) ≈ p ′ (0.2) = 12.056. 

76


6 

APPROSSIMAZIONE 

I numeri governano il mondo. 

Platone 

6.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 

6.2 Retta di regressione lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 

6.3 Approssimazione polinomiale ai minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 

6.4 Approssimazioni di tipo esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 



La legge di Hooke stabilisce che l’allungamento subito da una molla, costruita con materiale uniforme, 

è direttamente proporzionale alla forza applicata: F (x) = kx dove k è la costante di proporzionalità, detta 

costante elastica, e x rappresenta l’allungamento della molla. 

Supponiamo di voler determinare k per una molla che, quando è a riposo, esercita una forza di 

1,4724811N . Se applichiamo una forza pari a 2.418165N si misura un allungamento pari a 0.042m. Siano 

effettuate diverse misure, ricavando i dati di Tabella 6.1. I dati raccolti non giacciono esattamente su una 

x 0.00000 0.04200 0.08000 0.11800 0.15600 

F 1.472481 2.418165 3.363849 4.309533 5.255217 

Tabella 6.1: Dati sperimentali per la legge di Hooke 

linea retta. Per approssimare la costante elastica k, potremmo prendere una qualunque coppia di dati e fare 

il rapporto tra la forza e l’allungamento. In questo modo, tuttavia, non terremmo conto di tutte le misure 

effettuate. È più ragionevole trovare la linea retta che meglio approssima tutti i dati sperimentali e utilizzarla 

per approssimare il valore di k. Questo tipo di approssimazione sarà l’argomento di questo Capitolo. 

A differenza dell’interpolazione, in cui si cerca una funzione che passi esattamente per i dati assegnati, 

nell’approssimazione si cerca una funzione (più semplice di quella data, se vi è una funzione di partenza) che 

approssimi al meglio i dati assegnati, senza passare esattamente per questi. 

Alcuni dei motivi che spingono a cercare una funzione di approssimazione piuttosto che di interpolazione 

sono questi: 

77

6. APPROSSIMAZIONE 

Figura 6.1: Legge di Hooke: i dati sperimentali 

x i 1 2 3 4 5 6 7 8 9 10 

y i 1.2 2.3 4.5 5.1 7 8.5 10.2 13.1 12.5 16.5 

Tabella 6.2: Dati sperimentali 

G i dati a disposizione sono affetti da errore; 

G siamo interessati a vedere l’andamento dei dati su lunga scala, in una visione globale 1 

G vogliamo che la funzione dipenda da pochi parametri, sebbene questi siano determinati considerando 

tutti i dati a disposizione. 

Nel seguito studieremo l’approssimazione ai minimi quadrati. 

6.2 Retta di regressione lineare 

Supponiamo di avere i 10 dati sperimentali della Tabella 6.2 (quindi n + 1 = 10). La Figura 6.2 (a sinistra) 

mostra il grafico delle coppie di punti: appare evidente che la relazione tra x e y è di tipo lineare. Il motivo 

per cui i dati non sono esattamente su una retta è dovuto ad errori nei dati. Non ha senso, quindi, cercare una 

funzione che passi esattamente per i dati assegnati (come accade nell’interpolazione), perchè una funzione 

del genere introdurrebbe oscillazioni prive di significato fisico: lo vediamo andando a costruire il polinomio 

di interpolazione di grado 9 che passa esattamente per i dati e che vediamo in Figura 6.2 (a destra). Cerchiamo 

allora una retta (funzione lineare, poichè abbiamo visto che i dati hanno una relazione di tipo lineare) che 

meglio approssima i dati senza dover coincidere con essi. Sia p 1 (x) = a 0 + a 1 x la retta che andiamo cercando 

(dobbiamo quindi capire come trovare i due coefficienti a 0 e a 1 ). Allora p 1 (x i ) = a 0 + a 1 x i , per i = 0,1,...,n 

rappresenta il valore sulla retta che deve approssimare il valore y i dato dal problema. Per ogni dato sperimentale, 

per i = 0,1,...,n, possiamo misurare lo scarto che scaturisce dall’approssimare y i mediante a 0 + a 1 x i . 

Nell’approccio ai minimi quadrati, si cerca di minimizzare la somma dei quadrati delle differenze tra i valori 

dati y i e i valori corrispondenti p 1 (x i ) sulla retta; si cerca, cioè, di minimizzare la somma dei quadrati degli 

1 Se si hanno a disposizione n = 100 dati, anche molto accurati, una funzione interpolante può dare una buona idea localmente, 

mentre una funzione approssimante data da una retta fornisce una migliore idea del comportamento su lunga scala dei dati. 

78

6.2. Retta di regressione lineare 

Figura 6.2: Dati sperimentali (a sinistra) della Tabella 6.2 e polinomio di interpolazione (a destra). 

scarti. Introduciamo, quindi la funzione che dipende dai coefficienti incogniti a 0 e a 1 . 

S(a 0 , a 1 ) = 

n∑ [ ] 2 

(a0 + a 1 x i ) − y i 

i=0 

Per minimizzare questa funzione, occorre porre le derivate parziali della S rispetto ad a 0 e a 1 uguali a zero. 2 

Si pone dunque 

0 = ∂S(a 0, a 1 ) 

∂a 0 

= ∂ 

∂a 0 

0 = ∂S(a 0, a 1 ) 

∂a 1 

= ∂ 

∂a 1 

n∑ [ ] 2 

n∑ [ ] 

(a0 + a 1 x i ) − y i = 2 (a0 + a 1 x i ) − y i 

i=0 

i=0 

n∑ [ ] 2 

n∑ [ ] 

(a0 + a 1 x i ) − y i = 2 (a0 + a 1 x i ) − y i xi 

i=0 

Queste equazioni si semplificano nel sistema delle cosiddette equazioni normali: 

{ 

(n + 1)a0 + a 1 

∑ n 

i=0 x i = ∑ n 

i=0 y i 

a 0 

∑ n 

i=0 x i + a 1 

∑ n 

i=0 x2 i = ∑ n 

i=0 x i y i 

i=0 

Introducendo la notazione A 12 = ∑ n 

i=0 x i , A 22 = ∑ n 

i=0 x2 i , b 1 = ∑ n 

i=0 y i e b 2 = ∑ n 

i=0 x i y i e osservando che la 

matrice del sistema è simmetrica (A 12 = A 21 ), la soluzione è data da: 

a 0 = A 22b 1 − A 12 b 2 

(n + 1)A 22 − A 2 12 

a 1 = (n + 1)b 2 − A 12 b 1 

(n + 1)A 22 − A 2 12 

Nell’esempio proposto, per calcolare la retta di approssimazione ai minimi quadrati, dobbiamo calcolare 

i coefficienti delle equazioni normali. In Tabella 6.2 poniamo i valori che servono per risolvere il sistema: la 

soluzione è a 0 = −0.87333333 e a 1 = 1.62969697. La retta è rappresentata in Figura 6.3. 

La retta che abbiamo appena costruito è la retta che minimizza gli scarti verticali, supponendo affetti 

da errore le ordinate delle coppie di punti a disposizione. Essa prende pure il nome di retta di regressione 

lineare sugli scarti verticali. 

Osserviamo che il baricentro dei punti assegnati giace sulla retta ai minimi quadrati, in quanto considerando 

la prima equazione del sistema si ha, per X = ∑ n 

i=0 x i /(n + 1) e Y = ∑ n 

i=0 y i /(n + 1) (le coordinate del 

baricentro dei punti assegnati): 

Sul 

baricentro 

a 0 + a 1 X = Y 

2 Per funzioni f (x) di una variabile reale, i punti di massimo o minimo si trovano tra i punti critici della f , per i quali f ′ (x) = 0, 

studiando il segno della f ′′ . Analogo procedimento si segue per funzioni di due variabili. Per la funzione S(a 0 , a 1 ) che stiamo studiando, 

si può provare che i valori (a 0 , a 1 ) che annullano le derivate parziali della S rappresentano i valori che minimizzano la S stessa. Questo 

argomento viene approfondito nei corsi di Analisi Matematica. 

79


x i y i x 2 x 

i i y i 

1 1.2 1 1.2 

2 2.3 4 4.6 

3 4.5 9 13.5 

4 5.1 16 20.4 

5 7 25 35 

6 8.5 36 51 

7 10.2 49 71.4 

8 13.1 64 104.8 

9 12.5 81 112.5 

10 16.5 100 165 

A 12 = 55 b 1 = 80.9 A 22 = 385 b 2 = 579.4 

Tabella 6.3: Tabella per il calcolo della retta di approssimazione ai minimi quadrati 

Figura 6.3: Retta di approssimazione sugli scarti verticali. 

Se invece sono affetti da errore le ascisse delle coppie di punti, si può cercare la retta che minimizza gli 

scarti orizzontali, detta anche retta di regressione lineare sugli scarti orizzontali, (basta scambiare il ruolo 

delle x con quello delle y per ricavare, con lo stesso procedimento, la retta p 1 (y) = b 0 + b 1 y). Il baricentro dei 

punti assegnati giace anche su questa retta, da cui possiamo concludere che esso è il punto di intersezione 

delle due rette che minimizzano gli scarti verticali e orizzontali. 

6.3 Approssimazione polinomiale ai minimi quadrati 

In generale, avendo a disposizione n+1 coppie di punti, il problema di approssimazione si può ricondurre 

alla ricerca di un polinomio di approssimazione di grado m, p m (x) = a 0 + a 1 x + a 2 x 2 + ...+ a m x m con m < n. 

Quando n = m il polinomio d’approssimazione coincide con quello d’interpolazione. 

La funzione da minimizzare è 

80 

S(a 0 , a 1 ,..., a m ) = 

n∑ [ 

(a0 + a 1 x i + a 2 x 2 i + ... + a m x m ] 2 

i 

) − y i 

i=0

6.4. Approssimazioni di tipo esponenziale 

La procedura seguita per la retta viene generalizzata. Questa volta bisogna porre uguali a zero le m+1 derivate 

parziali della S rispetto ai coefficienti del polinomio p m . 

∂S 

∂a j 

= 0 

j = 0,1,...,m 

Ricaviamo, quindi 

n∑ 

2 (a 0 + a 1 x i + ... + a m x m i 

− y i )x j i 

i=0 

= 0 per j = 0,1,...,m 

In forma estesa possiamo scrivere 

n∑ 

n∑ 

x j i + a 1 

a 0 

i=0 

x j +1 

i=0 

i 

+ ... + a m 

n∑ 

x j +m = 

i 

i=0 

i=0 

n∑ 

x j i y i 

per j = 0,1,...,m 

Poichè queste equazioni si hanno per j = 0,1...,m, si ha da risolvere un sistema, che, scritto in forma 

matriciale, è: 

A T Aa = A T b 

dove A è una matrice rettangolare (n + 1) × (m + 1), data da 

⎛ 

1 x 0 x0 2 ... x m ⎞ 

0 

1 x 1 x1 2 ... x m 1 

A = 

⎜ 

⎝ 

. 

. 

. 

⎟ 

. ⎠ 

1 x n xn 2 ... xn 

m 

Le equazioni del sistema sono dette equazioni normali. Si può provare che la matrice Q = A T A è 

simmetrica, definita positiva 3 ed è non singolare, quindi il sistema ammette soluzione. 

6.4 Approssimazioni di tipo esponenziale 

Può capitare che i dati sperimentali abbiano un andamento di tipo esponenziale o ricordino una funzione 

potenza della variabile x. Allora si può richiedere che la funzione approssimante abbia una delle due forme 

seguenti (e, a seconda della rappresentazione, si ha un diverso modello): 

y(x) = ae bx 

y(x) = ax b 

modello esponenziale 

modello potenza 

con a e b opportune costanti. Per ricavare a e b si passa ai logaritmi ricavando l’equazione di una retta i cui 

coefficienti sono ottenuti con la procedura di minimizzazione ai minimi quadrati. Da questi, si ritorna poi ai 

coefficienti delle funzioni di partenza. Vediamo come. 

G Nel caso del modello esponenziale, passando ai logaritmi (in base naturale) si ha: 

ln(y) = ln(a) + bx 

Ponendo X = x, Y = ln(y), a 0 = ln(a) e a 1 = b, si ha un’equazione del tipo Y = a 0 + a 1 X . 

Quindi, dalle coppie di dati (x i , y i ) i = 0,1,...,n, si deve passare alle coppie (X i = x i , Y i = ln(y i )) 

e su queste coppie si costruisce la retta di approssimazione ai minimi quadrati con la procedura che 

abbiamo studiato in Sezione 6.2. Una volta ricavati i coefficienti a 0 e a 1 , si ha a = e a 0 

e b = a 1 . 

3 Le definizioni di matrice simmetrica e matrice definita positiva sono date nel Capitolo 7. 

81


G Nel caso del modello potenza, passando ai logaritmi (qualunque sia la base usata, il risultato non 

cambia) si ha: 

log(y) = log(a) + b log(x) 

Ponendo X = log(x), Y = log(y), a 0 = log(a) e a 1 = b, si ha un’equazione del tipo Y = a 0 + a 1 X . 

Quindi, dalle coppie di dati (x i , y i ) i = 0,1,...,n, si deve passare alle coppie (X i = log(x i ), Y i = 

log(y i )) e su queste coppie si costruisce la retta di approssimazione ai minimi quadrati. Una volta 

ricavati i coefficienti a 0 e a 1 , si ha b = a 1 mentre, con gli opportuni passaggi, si trova il valore di a. 



x i -1 0 2 3 4 

f (x i ) 9 0 0 15 84 

(a) Trovare la retta ai minimi quadrati che minimizza la somma dei quadrati degli scarti verticali. 

(b) Trovare la retta ai minimi quadrati che minimizza la somma dei quadrati degli scarti orizzontali. 

(c) Calcolare il punto di intersezione delle due rette e dire di che punto si tratta. 

Svolgimento 

(a) Il sistema da risolvere per ottenere la retta di approssimazione ai minimi quadrati è: 

{ 

na0 + ∑ n 

i=1 x i a 1 = ∑ n 

i=1 y i 

∑ n 

i=1 x i a 0 + ∑ n 

i=1 x2 i a 1 = ∑ n 

i=1 x i y i 

dove n = 5. Poichè ∑ n 

i=1 x i = 8, ∑ 5 

i=1 x2 i = 30, ∑ 5 

i=1 y i = 108 e ∑ 5 

i=1 x i y i = 372, si ha il sistema 

{ 

5a0 + 8a 1 = 108 

8a 0 + 30a 1 = 372 

La soluzione è a 0 = 3.069767442, a 1 = 11.581395349. La retta ai minimi quadrati che minimizza gli 

scarti verticali è: y = 3.069767442 + 11.581395349x. 

(b) Ricaviamo la retta di approssimazione che minimizza gli scarti orizzontali. 

{ 

nb0 + ∑ n 

i=1 y i b 1 = ∑ n 

i=1 x i 

∑ n 

i=1 y i b 0 + ∑ n 

i=1 y 2 i b 1 = ∑ n 

i=1 y i x i 

dove n = 5. Poichè ∑ n 

i=1 y i = 108, ∑ 5 

i=1 y 2 i = 7362, ∑ 5 

i=1 x i = 8 e ∑ 5 

i=1 x i y i = 372, si ha il sistema 

{ 

5b0 + 108b 1 = 8 

108b 0 + 7362b 1 = 372 

La soluzione è b 0 = 0.744452398, b 1 = 0.03960868528. La retta ai minimi quadrati che minimizza gli 

scarti orizzontali è: x = 0.744452398 + 0.03960868528y. 

82


(c) Troviamo il punto di intersezione delle due rette: 

{ 

y = 3.069767442 + 11.581395349x 

x = 0.744452398 + 0.03960868528y 

Ricaviamo x = 1.6 e y = 21.6 

Se calcoliamo il baricentro dei punti assegnati, troviamo 

∑ 5 

i=1 

X = 

x i 

= −1 + 2 + 3 + 4 

∑ 5 

i=1 

= 1.6 Y = 

y i 9 + 15 + 84 

= ) = 21.6 

5 

5 

5 

5 

Il punto di intersezione delle due rette è il baricentro dei punti assegnati. 

Esercizio 6.5.2 Sono assegnati i seguenti dati sperimentali 

x i 4.0 4.2 4.5 4.7 5.1 5.5 5.9 6.3 6.8 7.1 

y i 102.56 113.18 131.2 142 168 196.2 225 256.8 299.51 325.6 

Costruire la curva di approssimazione ai minimi quadrati della forma ax b . 

Svolgimento Per trovare la curva di approssimazione del tipo y = ax b , dobbiamo prima passare ai logaritmi: 

log(y) = log(ax b ) = log(a) + b log(x) 

In questo modo ci riconduciamo ad una retta di approssimazione ai minimi quadrati sui logaritmi dei punti 

assegnati. Consideriamo il logaritmo naturale (ma i risultati non cambiano con i logaritmi in un’altra base). 

I dati su cui lavorare sono dunque: 

log(x i ) log(y i ) 

1.386294361 4.630447993 

1.435084525 4.728979472 

1.504077397 4.876722876 

1.547562509 4.955827058 

3.931825633 5.123963980 

1.704748092 5.279134547 

1.774952351 5.416100402 

1.840549633 5.548297572 

1.916922612 5.702147806 

1.960094784 5.785669634 

Calcoliamo la retta di approssimazione ai minimi quadrati, ponendo X i = log(x i ) e Y i = log(y i ). Il sistema 

da risolvere è 

{ 

na0 + ∑ n 

i=1 X i a 1 = ∑ n 

i=1 Y i 

∑ n 

i=1 X i a 0 + ∑ n 

i=1 X 2 i a 1 = ∑ n 

i=1 X i Y i 

dove n = 10. 

Si ha ∑ n 

i=1 X i = 16.6995268, ∑ n 

i=1 X 2 = 28.2537116, ∑ n 

i i=1 Y i = 52.0472913, ∑ n 

i=1 X i Y i = 87.6541085 

Il sistema da risolvere diventa 

{ 

10a0 + 16.6995268a 1 = 52.0472913 

16.6995268a 0 + 28.2537116a 1 = 87.6541085 

che ha come soluzione a 0 = 1.84197978 e a 1 = 2.013679425. 

Ora a 0 = log(a) da cui a = e a 0 

= 6.30901637 Invece a 1 = b. Il modello y = ax b diventa quindi y = 

6.30901637x 2.013679425 . 

83


7 

METODI DIRETTI PER LA SOLUZIONE DI SISTEMI LINEARI 

All’inizio e alla fine abbiamo il 

mistero. Potremmo dire che 

abbiamo il disegno di Dio. A questo 

mistero la matematica si avvicina, 

senza penetrarlo. 

Ennio De Giorgi 

7.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

7.2 Elementi di Algebra Lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 

7.3 Metodo di eliminazione di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

7.3.1 Sostituzione all’indietro e in avanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

7.3.2 Eliminazione di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 

7.4 Strategie di pivoting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 

7.5 Fattorizzazione triangolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 

7.5.1 Fattorizzazione LDU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 

7.5.2 Fattorizzazione di Gauss senza pivoting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

7.5.3 Fattorizzazione di Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 



Si consideri la capacità C di un conduttore. Dall’elettrostatica, sappiamo che vale q = Cφ dove q rappresenta 

la carica del conduttore e φ il suo potenziale elettrostatico, quando il conduttore è isolato. Nel caso in 

cui il conduttore non sia isolato, la situazione cambia. Supponiamo di avere 4 conduttori in equilibrio elettrostatico 

all’interno di una cavità collegata a terra (a terra il potenziale elettrostatico vale zero). Supponendo 

di collegare i conduttori 2, 3 e 4 a terra, si ha φ 2 = φ 3 = φ 4 = 0 e φ 1 ≠ 0. Il conduttore 1 induce carica sugli altri 

conduttori, per cui, per ciascun conduttore vale, rispettivamente: 

85

7. METODI DIRETTI PER LA SOLUZIONE DI SISTEMI LINEARI 

q 1 = C 11 φ 1 

q 2 = C 21 φ 1 

q 3 = C 31 φ 1 

q 4 = C 41 φ 1 

Si ripete lo stesso discorso supponendo φ 2 ≠ 0 e tutti gli altri potenziali nulli. Poi sia φ 3 ≠ 0 e gli altri potenziali 

nulli. Infine φ 4 ≠ 0 e tutti gli altri nulli. 

La sovrapposizione dei 4 stati considerati corrisponde alla situazione in cui φ 1 ,φ 2 ,φ 3 ,φ 4 sono tutti diversi 

da zero. Si ha perciò: 

q 1 = C 11 φ 1 +C 12 φ 2 +C 13 φ 3 +C 14 φ 4 

q 2 = C 21 φ 1 +C 22 φ 2 +C 23 φ 3 +C 24 φ 4 

q 3 = C 31 φ 1 +C 32 φ 2 +C 33 φ 3 +C 34 φ 4 

q 4 = C 41 φ 1 +C 42 φ 2 +C 43 φ 3 +C 44 φ 4 

I coefficienti C i i si chiamano coefficienti di capacità, mentre i coefficienti C i j , con j ≠ i si chiamano 

coefficienti di induzione. 

Si può presentare il problema inverso: note le cariche q i , si vuole determinare il valore dei φ i . Si deve 

quindi risolvere un sistema lineare di 4 equazioni in 4 incognite. 

In questo Capitolo studieremo metodi diretti per la soluzione di sistemi lineari del tipo 

⎧ 

a 11 x 1 + a 12 x 2 + ... + a 1n x n = b 1 

a ⎪⎨ 21 x 1 + a 22 x 2 + ... + a 2n x n = b 2 

a 31 x 1 + a 32 x 2 + ... + a 3n x n = b 3 

(7.1) 

. = . . 

⎪⎩ 

a n1 x 1 + a n2 x 2 + ... + a nn x n = b n 

dove a i j , per i , j = 1,2,...,n e b i , per i = 1,2,...,n sono assegnati e le incognite da determinare sono 

x 1 , x 2 ,..., x n . I metodi diretti sono metodi che risolvono il problema in un numero fissato di passi, 

introducendo un errore dovuto solo all’arrotondamento. 

7.2 Elementi di Algebra Lineare 

Matrice 

Sia dato un sistema lineare come in (7.1). Per poterlo semplificare, possiamo eseguire le seguenti 

operazioni (trasformazioni elementari) : 

G L’i -sima equazione del sistema può essere moltiplicata per una qualunque costante λ ≠ 0 e l’equazione 

risultante può essere usata al posto di quella di partenza: la soluzione del sistema non cambia. 

G L’equazione j -sima, moltiplicata per una qualunque costante λ ≠ 0 e sommata all’equazione i -sima, 

può essere usata al posto dell’equazione i -sima di partenza: la soluzione del sistema non cambia. 

G Le equazione i -sime e j -sime possono essere scambiate: la soluzione del sistema non cambia. 

In questa maniera, un sistema lineare può essere trasformato in uno di più facile soluzione, come 

vedremo nell’algoritmo di eliminazione di Gauss. 

Poichè le operazioni da fare coinvolgono i coefficienti a i j e b i , conviene scrivere il sistema di equazioni 

lineari utilizzando una forma compatta mediante matrici e vettori. 

Definizione 7.2.1 Una matrice n × m è una griglia rettangolare (o array) di elementi disposti su n righe e m 

colonne. 

86

7.2. Elementi di Algebra Lineare 

Generalmente, una matrice si denota con una lettera maiuscola, per esempio A, mentre i suoi valori si 

indicano con la corrispondente lettera minuscola e i pedici che si riferiscono alla riga e colonna in cui si trova 

quel valore, per esempio a i j si riferisce all’elemento di riga i e colonna j della matrice A. 

⎛ 

⎞ 

a 11 a 12 a 13 ... a 1n 

A = [ a 21 a 22 a 23 ... a 2n 

] a i j = a 31 a 32 a 33 ... a 3n 

⎜ 

⎝ 

. 

. 

. ... 

⎟ 

. ⎠ 

a n1 a n2 a n3 ... a nn 

Esempio 7.2.1 

( ) 

2 10 5 

A = 

3 1 0 

è una matrice 2 × 3 con elementi a 11 = 2, a 12 = 10, a 13 = 5, a 21 = 3, a 22 = 1 e a 23 = 0. 

Per indicare che una matrice A ha n righe e m colonne, diremo che A ha dimensione n × m. Quando 

lavoreremo con matrici quadrate di n righe e n colonne, parleremo di dimensione n della matrice per indicare 

che il numero di righe è uguale al numero di colonne e vale n. 

I vettori si possono vedere come un caso particolare delle matrici. Si parla di vettore riga se ci riferiamo a 

una matrice 1 × n e si parla di vettore colonna se ci si riferisce a una matrice n × 1. 

Per indicare un vettore colonna e un vettore riga si usa, rispettivamente, la notazione 

⎛ ⎞ 

x 1 

x 2 

x = 

x 3 

⎜ 

⎝ 

⎟ 

. ⎠ 

x n 

x = ( x 1 x 2 x 3 ... x n 

) 

Vettori 

Vediamo, nel seguito, alcune importanti definizioni e proprietà delle matrici. 

G Due matrici A e B, di dimensione n × m, sono uguali se hanno lo stesso numero di righe e di colonne, 

e, inoltre, vale, a i j = b i j per i ,= 1,2,...,n e j = 1,2,...,m. 

G Date due matrici A e B, entrambe n × m, si definisce la matrice somma di A e B la matrice n × m A + B 

i cui elementi sono dati da a i j + b i j , per i ,= 1,2,...,n e j = 1,2,...,m. 

G Se A è una matrice n ×m e λ è un numero reale, la moltiplicazione scalare di λ per A, denotata con λA, 

è una matrice n × m i cui elementi sono λa i j per i ,= 1,2,...,n e j = 1,2,...,m. 

G Indichiamo con O la matrice i cui elementi sono tutti uguali a zero. 

G Data la matrice A, n × m, indichiamo con −A la matrice i cui elementi sono −a i j . 

Teorema 7.2.1 Date A, B e C tre matrici n × m, e λ e µ due numeri reali, valgono le seguenti proprietà: 

G A + B = B + A G(A + B) +C = A + (B +C ) 

G A +O = O + A = A G A + (−A) = −A + A = O 

Gλ(A + B) = λA + λB G(λ + µ)A = λA + µA 

Gλ(µA) = (λµ)A G1A = A 

87


Matrice 

prodotto 

G Date due matrici A di dimensione n×m e B di dimensione m×p, la matrice prodotto di A e B, denotata 

con C = AB, è una matrice i cui elementi c i j sono dati da: 

c i j = 

m∑ 

a i k b k j = a i 1 b 1j + a i 2 b 2j + ... + a i m b m j 

k=1 

per i = 1,2,...,n e j = 1,2,..., p. 

Prodotto 

matricevettore 

G Data una matrice A di dimensione n e un vettore colonna x di lunghezza n, si definisce il vettore y = Ax 

prodotto della matrice A per il vettore x, il vettore le cui componenti sono date da 

n∑ 

y i = a i j x j per i = 2,...,n 

j =1 

Dati due vettori x e y si definisce prodotto scalare x T y = ∑ n 

Prodotto 

i=1 x i y i . 

scalare tra 

G In generale, AB ≠ B A. 

vettori 

Matrice 

diagonale 

G Una matrice D si dice diagonale se è quadrata con d i j = 0 per i ≠ j . Gli elementi diversi da zero si 

trovano quindi sulla diagonale (detta diagonale principale) che si può tracciare partendo dall’elemento 

in alto a sinistra (di posto 11) e arrivando all’elemento in basso a destra (di posto nn). 

Esempio: 

⎛ 

⎞ 

1 0 0 0 

D = ⎜0 2 0 0 

⎟ 

⎝0 0 5 0 ⎠ 

0 0 0 −1 

Matrice 

Identità 

Matrice 

tridiagonale 

Matrice 

triangolare 

superiore 

Matrice 

triangolare 

inferiore 

G Si chiama matrice identità e si indica con I , una matrice diagonale i cui elementi diagonali valgono 1. 

Esempio: 

⎛ 

⎞ 

1 0 0 0 

I = ⎜0 1 0 0 

⎟ 

⎝0 0 1 0⎠ 

0 0 0 1 

G Una matrice si dice tridiagonale se gli elementi non nulli si trovano sulla diagonale principale e sugli 

elementi delle diagonali che si trovano sopra e sotto la diagonale principale. 

Esempio: 

⎛ 

⎞ 

−2 1 0 0 0 

1 −2 1 0 0 

A = 

⎜ 0 1 −2 1 0 

⎟ 

⎝ 0 0 1 −2 1 ⎠ 

0 0 0 1 −2 

G Una matrice si dice triangolare se ha tutti gli elementi nulli a parte quelli che si trovano sopra o sotto la 

diagonale principale. 

– Si definisce matrice triangolare superiore U (U sta per upper) di dimensione n, la matrice per la 

quale, per j = 1,2,...,n, si ha 

u i j = 0 per i = j + 1, j + 2,...,n 

– Si definisce matrice triangolare inferiore L (L sta per lower) di dimensione n, la matrice per la 

quale, per i = 1,2,...,n, si ha 

l i j = 0 per j = i + 1,i + 2,...,n 

88

7.2. Elementi di Algebra Lineare 

Esempi 

⎛ 

1 −2 

⎞ 

5.3 

⎛ 

1 0 

⎞ 

0 

U = ⎝0 3.2 −4⎠ L = ⎝ 2 −21 0 ⎠ 

0 0 10 

−3.4 5.7 −4 

Teorema 7.2.2 Date A matrice n × m, B matrice m × s, C matrice s × p, D matrice m × s, I m e I s le matrici 

identità, rispettivamente di dimensione m e s, e λ e µ due numeri reali, valgono le seguenti proprietà: 

G A(BC ) = (AB)C G A(B + D) = AB + AD 

GI m B = B B I s = B Gλ(AB) = (λA)B = A(λB). 

A questo punto, il sistema lineare (7.1) può essere scritto in forma matriciale come 

Ax = b 

Collegata alla soluzione di un sistema lineare è l’inversa di una matrice. 

Definizione 7.2.2 Data una matrice A di dimensione n, A si dice nonsingolare (o invertibile o regolare) se 

esiste una matrice, che indichiamo come A −1 di dimensione n tale che 

Matrice 

inversa 

A A −1 = A −1 A = I 

La matrice A −1 si chiama matrice inversa della A. Una matrice che non ha inversa si dice, invece, singolare (o 

non invertibile). 

Teorema 7.2.3 Per ogni matrice A di dimensione n nonsingolare si ha: 

G A −1 è unica 

G A −1 è nonsigolare e (A −1 ) −1 = A 

G Se B è non singolare, di dimensione n, allora (AB) −1 = B −1 A −1 

Dato il sistema Ax = b, se A è nonsingolare, si ha x = A −1 b. 

Un’altra importante matrice associata ad un’assegnata matrice A è la sua trasposta. 

Definizione 7.2.3 La trasposta di una matrice A di dimensione n × m è una matrice A T di dimensione m × n 

per cui la colonna i della trasposta coincide con la riga i della matrice A di partenza: a T i j = a j i . 

Trasposta di 

una matrice 

Esempio: 

A = 

( 1 2 

) 3 

2 5 6 

⎛ 

1 

⎞ 

2 

A T = ⎝2 5⎠ 

3 6 

Legata alla trasposta di una matrice è la seguente definizione. 

Definizione 7.2.4 Una matrice quadrata si dice simmetrica se A = A T . 

Esempio: 

⎛ 

1 4 

⎞ 

8 

⎛ 

1 4 

⎞ 

8 

A = ⎝4 2 6⎠ A T = ⎝4 2 6⎠ 

8 6 5 

8 6 5 

Teorema 7.2.4 Valgono le seguenti proprietà (per matrici per cui è possibili eseguire le seguenti operazioni): 

89


Determinante 

di una 

matrice 

G(A T ) T = A 

G(AB) T = B T A T 

G(A + B) T = A T + B T 

GSe esiste A −1 allora (A −1 ) T = (A T ) −1 

Il determinante di una matrice permette di stabilire esistenza e unicità della soluzione nei sistemi lineari. 

Data una matrice quadrata A, il suo determinante si indica mediante la notazione det(A) o |A|. 

G Se A = [a] è una matrice 1 × 1, allora det(A) = a. 

G Se A è una matrice di dimensione n, si definisce minore M i j il determinante della sottomatrice di 

dimensione n − 1 ottenuta cancellando la i -sima riga e la j -sima colonna da A. 

G Il determinante di A è dato dalla formula 

det(A) = 

det(A) = 

n∑ 

(−1) i+j a i j M i j 

j =1 

n∑ 

(−1) i+j a i j M i j 

i=1 

(fissato un qualunque i = 1,2,...,n) 

(fissato un qualunque j = 1,2,...,n) 

Il calcolo del determinante di una matrice di dimensione n richiede O (n!) moltiplicazioni. Quindi, anche per 

valori piccoli di n, le operazioni da fare diventanto proibitive. 

Teorema 7.2.5 Sia assegnata A una matrice quadrata di dimensione n. 

Se una riga o una colonna di A ha elementi tutti nulli, allora det(A) = 0. 

Se A ha due righe o due colonne con gli stessi elementi, allora det(A) = 0. 

G Denotata con Ã la matrice ottenuta scambiando due righe di A, si ha det(Ã) = −det(A). 

G Denotata con Ã la matrice ottenuta da A moltiplicando una sua riga per un numero reale λ, si ha 

det(Ã) = λdet(A). 

G Denotata con Ã la matrice ottenuta da A sommando una sua riga per un’altra che è stata moltiplicata 

per λ, si ha det(Ã) = det(A). 

G Se B è un’altra matrice di dimensione n, si ha det(AB) = det(A)det(B) 

G det(A T ) = det(A) 

G Se esiste A −1 , si ha det(A −1 1 

) = 

det(A) 

G Se A è una matrice trangolare superiore o trangolare inferiore o diagonale, allora det(A) = ∏ n 

i=1 a i i 

7.3 Metodo di eliminazione di Gauss 

Ritorniamo al sistema di equazioni (7.1), che possiamo scrivere in forma matriciale come Ax = b. 

Nel metodo di eliminazione di Gauss 1 il sistema lineare di partenza viene trasformato in uno equivalente 

di più facile soluzione in quanto la matrice del nuovo sistema ha forma triangolare (superiore o inferiore) e 

può essere risolto facilmente mediante sostituzione (all’indietro o in avanti). 

Vediamo nel dettaglio come si risolve un sistema lineare con queste tecniche. 

7.3.1 Sostituzione all’indietro e in avanti 

La matrice A sia nonsingolare e triangolare superiore, cioè 

⎛ 

⎞ 

a 11 a 12 ... a 1n 

. a .. 22 a2n 

A = 

⎜ 

. 

⎝ 

.. 

. .. ⎟ 

⎠ 

a nn 

1 Carl Friedrich Gauss fu un matematico e fisico tedesco (1777-1855) che ha dato il suo contribuito in maniera significativa in 

numerosi campi: teoria dei numeri, analisi, geometria differenziale, geodesia, magnetismo, astronomia, ottica. Al pari di Eulero, Newton 

e Archimede è considerato uno dei più grandi matematici della storia. 

In suo onore è stato dato il suo nome a una nave di ricerca tedesca, a una montagna (Gaussberg) in Antartide, a un cratere sulla luna, 

e all’unità di misura della densità di flusso magnetico o di induzione magnetica. 

90

7.3. Metodo di eliminazione di Gauss 

La soluzione del sistema Ax = b può dunque procedere dal basso verso l’alto, a partire dall’ultima riga. Le 

equazioni, infatti, sono 

a 11 x 1 + a 12 x 2 + a 13 x 3 + ... a 1n x n = b 1 

a 22 x 2 + a 23 x 3 + ... a 2n x n = b 2 

a 33 x 3 + ... a 3n x n = b 2 

. = . . . 

a nn x n = b n 

L’ultima riga si legge come a nn x n = b n . Quindi possiamo ricavare x n = b n /a nn . 

Noto il valore di x n , possiamo ricavare x n−1 dalla riga n − 1 del sistema: 

1 

a n−1n−1 x n−1 + a n−1n x n = b n−1 . Si ha x n−1 = (b n−1 − a n−1n x n ). 

a n−1n−1 

Si procede a ritroso in questo modo arrivando fino alla prima equazione che ci permette di calcolare il valore 

di x 1 . Osserviamo che tutte le divisioni per i coefficienti a i i sono possibili in quanto stiamo supponendo 

A non singolare e, poichè det A = ∏ n 

i=1 a i i ≠ 0, necessariamente ciascun a i i ≠ 0. 

Possiamo dunque scrivere l’algoritmo di sostituzione all’indietro: 

Per i = n fino a i = 1, procedendo all’indietro con passo −1 

x i = 

b i − ∑ n 

j =i+1 a i j x j 

a i i 

Un analogo algoritmo si ricava quando la matrice è triangolare inferiore. In tal caso, si parte dalla prima 

equazione per ricavare x 1 e poi si va avanti nell’equazione successiva. 

Si ha l’algoritmo di sostituzione in avanti: 

Per i = 1 fino a i = n, procedendo in avanti con passo 1 

x i = 

b i − ∑ i−1 

j =1 a i j x j 

a i i 

7.3.2 Eliminazione di Gauss 

Assumiamo, ora, che la matrice A sia piena (o densa, cioè abbia quasi tutti gli elementi non nulli). Applichiamo 

trasformazioni elementari per riga in modo da ridurre il sistema di partenza in uno equivalente di 

forma triangolare superiore, che potremo risolvere mediante sostituzione all’indietro. 

La soluzione del problema Ax = b, infatti, non cambia se moltiplichiamo una riga per una costante, se 

sottraiamo il multiplo di una riga da un’altra riga o se facciamo scambi di righe, come abbiamo detto all’inizio 

della Sezione 7.2. 

Supponiamo, per il momento, che tutti gli elementi della diagonale principale di A siano non nulli. 

G Al primo passo vogliamo eliminare gli elementi della prima colonna al di sotto della diagonale 

principale: 

91


– sottraiamo la prima equazione moltiplicata per a 21 

a 11 

dalla seconda equazione: 

a 21 x 1 + a 22 x 2 + a 23 x 3 + ... + a 2n x n = b 2 

a 21 

a 11 

(a 11 x 1 + a 12 x 2 + a 13 x 3 + ... + a 1n x n ) = a 21 

a 11 

b 1 

(a 22 − a 21 

a 11 

a 12 )x 2 + (a 23 − a 21 

a 11 

a 13 )x 3 + ... + (a 2n − a 21 

a 11 

a 1n )x n = b 2 − a 21 

a 11 

b 1 

– sottraiamo la prima equazione moltiplicata per a 31 

a 11 

dalla terza equazione. 

– ... 

– sottraiamo la prima equazione moltiplicata per a n1 

a 11 

dalla n-sima equazione. 

Come risultato di questa operazione avremo una nuova matrice con gli elementi della prima 

colonna, eccetto quello di posto 11, tutti uguali a zero. 

⎛ 

⎞⎛ 

⎞ ⎛ ⎞ 

a 11 a 12 ... a 1n x 1 b 1 

0 a (1) 

22 

... a (1) 

2n 

x 2 

⎜ 

⎝ 

. 

. ... 

⎟⎜ 

. ⎠⎝ 

⎟ 

. ⎠ = b (1) 

2 ⎜ ... 

⎟ 

⎝ ⎠ 

0 a (1) 

n2 

... a nn 

(1) x n b n 

(1) 

G Al secondo passo, consideriamo il sistema ridotto che si ha ignorando la prima equazione del sistema 

e la prima colonna della nuova matrice che abbiamo ottenuta (che ha tutti 0 al di sotto dell’elemento 

diagonale). 

A questa sottomatrice applichiamo lo stesso procedimento di prima, sottraendo, quindi, la prima 

equazione della sottomatrice moltiplicata per a(1) 32 

a (1) 

22 

via. 

Dopo questo passo, il sistema sarà equivalente a: 

⎛ 

⎞ 

a 11 a 12 ... ... a ⎛ ⎞ ⎛ ⎞ 

1n 

0 a (1) 

22 

a (1) 

23 

... a (1) x 1 

b 1 

2n 

x 2 

b (1) 

2 

. 0 a (2) 

33 

... a (2) 

3n 

x 3 

⎜ 

⎝ 

. 

. 

. ... 

⎟⎜ 

= 

b (2) 

3 . ⎠⎝ 

⎟ ⎜ ... ⎟ 

. ⎠ ⎝ ⎠ 

0 0 a (2) 

n3 

... a nn 

(2) x n b n 

(1) 

dalla seconda equazione della sottomatrice, e così 

G Dopo aver applicato questo procedimento n − 1 volte, avremo un sistema triangolare superiore 

semplice da risolvere utilizzando l’algoritmo di sostituzione all’indietro. 

⎛ 

⎞ 

a 11 a 12 ... ... a ⎛ ⎞ ⎛ 

1n 

0 a (1) 

22 

a (1) 

23 

... a (1) x 1 

2n 

x 2 

. 0 a (2) 

33 

... a (2) 

3n 

x 3 

⎜ 

⎝ 

. 

. ... ... 

⎟⎜ 

= 

. ⎠⎝ 

⎟ ⎜ 

. ⎠ ⎝ 

0 0 ... 0 a nn 

(n−1) x n 

b 1 

b (1) 

2 

b (2) 

3 

... 

b (n−1) 

n 

⎞ 

⎟ 

⎠ 

92

7.4. Strategie di pivoting 

Esempio 7.3.1 Sia A = 

( ) ( ) 

2 1 2 

e . 

3 2 

=¯ 3.5 

Per applicare il metodo di Gauss, dobbiamo moltiplicare la prima equazione per 3 e sottrarla dalla seconda 

2 

3x 1 + 2x 2 = 3.5 

− 

3 

2 (2x 1 + 1x 2 ) = 3 2 2 = 

0x 1 + 0.5x 2 = 0.5 

Il sistema 

( 

equivalente 

)( ) ( 

diventa 

) 

2 1 x1 2 

= 

0 0.5 x 2 0.5 

7.4 Strategie di pivoting 

Gli elementi diagonali generati ad ogni passo del metodo di eliminazione a (k) sono detti elementi 

i i 

pivotali. 

Nel descrivere il metodo di eliminazione di Gauss abbiamo supposto, per semplicità, che tutti gli elementi 

diagonali fossero diversi da zero. Ma una matrice può essere non singolare senza che gli elementi della 

diagonale principale siano tutti diversi da zero. 

Inoltre, andando avanti nel procedimento di eliminazione, può succedere che un elemento pivotale diventi 

nullo – e quindi la corrispondente incognita non può essere eliminata attraverso quella equazione nel 

procedimento di sostituzione all’indietro. 

C’è, infine, da considerare il fatto che si possono avere grossi errori numerici quando un elemento 

pivotale è molto piccolo. 

Cosa fare in queste circostanze? In che modo applicare l’eliminazione di Gauss? 

Si hanno le cosiddette strategie di pivoting: 

G pivoting parziale 

Mano mano che si va avanti nell’eliminazione, per i = 1,2,...,n −1 a ciascuno stadio si sceglie il più 

piccolo intero q tale che 

|a (i−1) | = max 

qi 

i≤j ≤n |a(i−1) | 

j i 

e si scambiano le righe i e q. 

Si opera, dunque, un controllo sulla colonna i -sima dalla posizione i fino alla posizione n, andando 

a cercare il coefficiente massimo in modulo. 

G pivoting totale 

Nel pivoting totale, invece, la ricerca dell’elemento più grande avviene in tutta la sottomatrice a 

destra e sotto l’elemento diagonale i -simo. Si vanno quindi a cercare i più piccoli interi q e r tali che 

|a qr 

(i−1) | = max 

i≤k,j ≤n |a(i−1) j k 

| 

Si opera, quindi, uno scambio non solo di righe ma anche di colonne in modo da portare l’elemento 

pivotale dalla riga e colonna qr al posto i i . Di questo scambio di colonne bisogna conservare 

traccia perchè vengono scambiate anche le componenti del vettore soluzione, in modo da effettuare lo 

scambio inverso una volta risolto il sistema. 

93


Il maggiore sforzo computazionale garantisce maggiore accuratezza e stabilità nei risultati, nel senso che 

gli errori di arrotondamento non sono così amplificati come potrebbe succedere senza l’adozione di una 

tecnica di pivoting. 

Esempio 7.4.1 Consideriamo il sistema 

x 1 + x 2 +x 3 = 1 

x 1 + 1.0001x 2 + 2x 3 = 2 

x 1 + 2x 2 + 2x 3 = 1 

L’esatta soluzione, corretta a 4 cifre decimali, è x = (1, −1.0001, 1.0001) T . 

L’eliminazione di Gauss senza pivoting porta al sistema 

x 1 + x 2 +x 3 = 1 

0.0001x 2 + 1x 3 = 1 

1x 2 + 1x 3 = 0 

e, infine, a 

x 1 + x 2 +x 3 = 1 

0.0001x 2 + 1x 3 = 1 

−9999x 3 = −10000 

Se usiamo un’aritmetica in base 10 con 3 cifre decimali, allora la sostituzione all’indietro ci darà: x 3 = 

−10000/ − 9999 = 1.000, x 2 = 1 − 1 

0.0001 = 0 e x 1 = 0. 

La soluzione è completamente sbagliata. 

Se, invece, facciamo lo scambio della seconda e terza riga adottando il pivoting parziale, allora avremo il 

sistema: 

x 1 + x 2 +x 3 = 1 

1x 2 + 1x 3 = 0 

0.0001x 2 + 1x 3 = 1 

e, infine, 

x 1 + x 2 +x 3 = 1 

1x 2 + 1x 3 = 0 

0.9999x 3 = 1 

Questa volta si ha (sempre lavorando con 3 cifre decimali) x 3 = 1.000, x 2 = −1.000, x 1 = 1.000, che è la 

soluzione corretta a 3 cifre decimali. 

7.5 Fattorizzazione triangolare 

Il metodo di eliminazione di Gauss, visto in forma matriciale, decompone la matrice A nel prodotto LU 

di due matrici L, trangolare inferiore, e U , triangolare superiore. 

94

7.5. Fattorizzazione triangolare 

Basta considerare, ad ogni passo, la matrice 

⎛ 

1 

0 1 

. 0 1 

. 

. 0 1 

M (k) . 

. 

. − a(k−1) k+1k 

= 

a (k−1) 

kk 

. 

. 

. − a(k−1) k+2k 

a (k−1) 

kk 

. 

. 

. 

. 

⎜ 

⎝ 

. 

. 

. − a(k−1) n k 

a (k−1) 

kk 

1 

. .. 

. .. 

⎞ 

⎟ 

1 

⎠ 

Si considera quindi la matrice A (k) = M (k) A (k−1) = M (k) M (k−1) ... M (1) A e il vettore b (k) = M (k) b (k−1) = 

M (k) M (k−1) ... M (1) b. 

Dopo n − 1 passi, avremo 

U = A (n−1) = M (n−1) ... M (2) M (1) A 

con U matrice triangolare superiore. Otteniamo quindi A = LU , con 

L = (M (n−1) ... M (2) M (1) ) −1 = [M (1) ] −1 ...[M (n−2) ] −1 [M (n−1) ] −1 

L è triangolare inferiore con elementi dati dal prodotto delle matrici M (k) generate durante l’eliminazione di 

Gauss. 

7.5.1 Fattorizzazione LDU 

L’eliminazione di Gauss è un caso particolare di fattorizzazione LDU , nella quale la matrice A viene decomposta 

nel prodotto di 3 matrici, la L che è triangolare inferiore con elementi sulla diagonale principale 

(elementi diagonali) uguali a 1, la D che è una matrice diagonale e la U che è una triangolare superiore con 

elementi diagonali uguali a 1. 

Nell’eliminazione di Gauss vista prima, nella U abbiamo inglobato anche la matrice D, per cui abbiamo 

una fattorizzazione LU . 

La decomposizione LDU è assicurata dal teorema LDU . Prima di vedere il teorema, definiamo i minori 

principali di una matrice A. 

Definizione 7.5.1 Data una matrice A si definisce minore principale di dimensione k (con 1 ≤ k ≤ n), la 

sottomatrice che si ha prendendo le prime k righe e k colonne di A. 

⎡ 

⎤ 

a 11 ... a 1k 

⎢ 

⎣ 

. 

⎥ 

. ⎦ 

a k1 ... a kk 

Minore 

principale 

Teorema 7.5.1 (LDU ) Nell’ipotesi che tutti i minori principali di A, (per i = 1,2,...,n) siano non-singolari, 

allora la matrice A è decomponibile in maniera univoca nel prodotto A = LDU 

Qualsiasi matrice non singolare può essere condotta sotto una forma tale da soddisfare il teorema LDU 

mediante opportuni scambi di righe e di colonne (abbiamo visto cosa fare quando un elemento pivotale è 

95


Matrice di 

permutazione 

nullo). Fare uno scambio di righe o di colonne significa moltiplicare la matrice A con un’opportuna matrice 

di permutazione. 

Una matrice di permutazione P è una matrice ottenuta dalla matrice identità operando scambi di righe o 

di colonne in modo che la matrice risultante abbia esattamente un unico valore diverso da zero su ogni riga 

e colonna, e tale valore sia uguale a 1. 

Esempio 7.5.1 Si consideri la matrice di permutazione P di dimensione 3 data da 

⎛ ⎞ 

1 0 0 

P = ⎝0 0 1⎠ 

0 1 0 

Qualunque sia la matrice A, di dimensione 3, moltiplicandola a sinistra per P si ottiene lo scambio della 

seconda e terza riga di A; invece, moltiplicandola a destra per P si ottiene lo scambio della seconda e terza 

colonna di A: 

⎛ ⎞⎛ 

⎞ ⎛ 

⎞ 

1 0 0 a 11 a 12 a 13 a 11 a 12 a 13 

PA = ⎝0 0 1⎠⎝a 21 a 22 a 23 

⎠ = ⎝a 31 a 32 a 33 

⎠ 

0 1 0 a 31 a 32 a 33 a 21 a 22 a 23 

⎛ 

⎞⎛ 

⎞ ⎛ 

⎞ 

a 11 a 12 a 13 1 0 0 a 11 a 13 a 12 

AP = ⎝a 21 a 22 a 23 

⎠⎝0 0 1⎠ = ⎝a 21 a 23 a 22 

⎠ 

a 31 a 32 a 33 0 1 0 a 31 a 33 a 32 

Quindi, il teorema LDU si può applicare alla matrice A o ad un’opportuna matrice PA, se si effettua il pivoting 

parziale, o a PAQ se si effettua il pivoting totale (e quindi si considerano due matrici di permutazioni P e Q). 

In genere, la matrice D viene inglobata nella L o nella U (post-moltiplicando o pre-moltiplicando le L e le 

U definite prima per la D). 

G Nel caso in cui la matrice D viene inglobata nella matrice L, la L ha elementi diagonali l i i ≠ 0, mentre 

la U ha elementi diagonali unitari. Si parla di fattorizzazione di Crout. 

G Nel caso in cui la matrice D viene inglobata nella matrice U , la U ha elementi diagonali u i i ≠ 0, mentre 

la L ha elementi diagonali unitari. Si parla di fattorizzazione di Doolittle. 

Scriviamo in forma estesa il prodotto tra matrici, nell’ipotesi di operare la fattorizzazione di Crout: 

⎛ 

⎞ ⎛ 

⎞⎛ 

⎞ 

a 11 a 12 ... a 1n l 11 0 ... 0 1 u 12 ... u 1n 

a 21 a 22 ... a 2n 

⎜ 

⎝ 

. 

. 

⎟ 

. ⎠ = l 21 l 22 ... 0 

0 1 ... u 2n 

⎜ 

⎝ 

. 

. 

⎟⎜ 

. ⎠⎝ 

. 

. 

⎟ 

. ⎠ 

a n1 a n2 ... a nn l n1 l n2 ... l nn 0 0 ... 1 

Moltiplichiamo la prima riga di L per le colonne di U ed eguagliamo i termini con gli elementi della prima 

riga di A. Otteniamo: 

l 11 · 1 = a 11 

l 11 · u 1k = a 1k , k = 2,...,n 

Quindi: l 11 = a 11 e u 1k = a 1k /l 11 . Abbiamo ricavato gli elementi della prima riga di L e U . 

Moltiplicando le successive righe di L per le colonne di U ed uguagliando i termini ai corrispondenti 

termini di A, abbiamo: 

l i j = a i j − 

j −1 ∑ 

m=1 

u i j = 1 (a i j − 

l i i 

l i m u m j i = 1,2,...n j = 1,2,...,i 

i−1 ∑ 

m=1 

l i m u m j ) i = 1,2,...,n − 1 j = i + 1,...n 

96


Si calcolano prima gli elementi della riga i -sima di L e poi quelli della riga i -sima di U , per i = 1,2,...,n. 

Trovate le matrici L e U , il sistema di partenza Ax = b è equivalente a LU x = b. 

Si pone, dunque, y = U x, ottenendo il sistema Ly = b. Si ricava facilmente y mediante sostituzione in 

avanti e da U x = y si ricava x mediante sostituzione all’indietro. 

Lo sforzo computazionale maggiore è quindi quello per il calcolo dei coefficienti di L e U . 

Nell’eliminazione di Gauss noi ricaviamo espressamente solo la U mentre le modifiche operate sulla 

colonna dei termini noti è equivalente al prodotto L −1 b (quindi da LU x = b risolviamo U x = L −1 b). 

7.5.2 Fattorizzazione di Gauss senza pivoting 

Abbiamo visto che, a volte, il metodo di eliminazione di Gauss richiede scambi di righe per evitare divisioni 

per zero. Allo stesso modo, il teorema di fattorizzazione LDU vale su matrici A non singolari o su matrici 

ottenute da A mediante moltiplicazioni a sinistra o a destra con opportune matrici di permutazione. 

Ci chiediamo se esistono matrici per le quali il metodo di eliminazione di Gauss possa essere implementato 

senza scambi di righe e per le quali l’algoritmo di eliminazione di Gauss sia stabile rispetto ad una crescita 

di errori di arrotondamento. 

Vediamo, nel seguito, alcune speciali classi di matrici per cui valgono le nostre richieste. 

Una matrice A di dimensione n si dice diagonalmente dominante in senso stretto per righe se vale la 

relazione 

|a i i | > 

n∑ 

|a i j | per ogni i = 1,2,...,n. 

j =0 

j ≠i 

Una matrice A di dimensione n si dice diagonalmente dominante in senso stretto per colonne se vale la 

relazione 

|a j j | > 

n∑ 

|a i j | per ogni j = 1,2,...,n. 

i=0 

i≠j 

Matrice diagonalmente 

dominante in 

senso stretto 

per righe 


dominante in 

senso stretto 

per colonne 

Esempio 7.5.2 

⎛ 

⎞ 

7 3 1 

A = ⎝2 10 −2⎠ 

5 0 6 

A è una matrice diagonalmente dominante in senso stretto per righe poichè vale:|7| > |3| + |1| = 4, |10| > 

|2| + | − 2| = 4 e |6| > |5| + |0|. Non è diagonalmente dominante in senso stretto per colonne in quanto sulla 

prima colonna si ha |7| = |2| + |5|. 

Esempio 7.5.3 

⎛ 

⎞ 

6 3 −4 

A = ⎝ 3 9 5 ⎠ 

−4 5 11 

A non è diagonalmente dominante in senso stretto per righe poichè, sulla prima riga si ha |6| < |3| + | − 4| = 

7. Essendo simmetrica, la matrice non può essere neanche diagonalmente dominante in senso stretto per 

colonne, perchè la relazione che abbiamo sulla prima riga vale sulla prima colonna. 

Le definizioni appena date si possono rilassare, definendo le matrici diagonalmente dominanti. 

97


Una matrice A di dimensione n si dice diagonalmente dominante per righe se vale la relazione 


dominante 

|a i i | ≥ 

n∑ 

|a i j | per ogni i = 1,2,...,n. 

j =0 

j ≠i 

Analoga è la definizione di matrice diagonalmente dominante per colonne (basta applicare la definizione 

di matrice diagonalmente dominante per righe sulla matrice A T ) 

Si hanno i seguenti teoremi. 

Teorema 7.5.2 Se A è una matrice diagonalmente dominante e non singolare, allora il metodo di eliminazione 

di Gauss può essere implementato senza alcuno scambio di righe e di colonne e i calcoli sono stabili rispetto 

alla crescita degli errori di arrotondamento. 

Teorema 7.5.3 Se A è una matrice diagonalmente dominante in senso stretto (per righe o per colonne), allora 

A è non singolare. In questo caso il metodo di eliminazione di Gauss può essere implementato senza alcuno 

scambio di righe e di colonne e i calcoli sono stabili rispetto alla crescita degli errori di arrotondamento. 

Un’altra importante classe di matrici è data dalle matrici definite positive. 

Una matrice A di dimensione n si dice 

G definita positiva se è simmetrica e vale x T Ax > 0 qualunque sia il vettore x ≠ 0 

Matrice 

definita 

positiva 

G semidefinita positiva se x T Ax ≥ 0 qualunque sia il vettore x, 

G indefinita altrimenti. 2 

Si ha un’analoga definizione per matrici definite negative e semidefinite negative. Una matrice A di 

dimensione n si dice 

Matrice 

definita negativa se è simmetrica e vale x T Ax < 0 qualunque sia il vettore x ≠ 0, 

definita 

G semidefinita negativa se x T Ax ≤ 0 qualunque sia il vettore x. 

negativa 

Dalla definizione di matrice definita positiva, deve essere x T Ax > 0 qualunque sia il vettore x, vale a dire: 

⎛ 

⎞⎛ 

⎞ 

a 11 a 12 ... a 1n x 1 

( ) 

a 21 a 22 ... a 2n 

x 2 

x1 x 2 ... x m ⎜ 

⎝ 

. 

. ... 

⎟⎜ 

. ⎠⎝ 

⎟ 

. ⎠ 

a n1 a n2 ... a nn x m 

⎛∑ n 

j =1 a ⎞ 

1j x j 

= ( ∑ n 

) 

j =1 

x 1 x 2 ... x m a 2j x j 

n∑ n∑ 

⎜ 

⎝ 

⎟ 

. ⎠ = a i j x i x j > 0 

i=1 j =1 

∑ n 

j =1 a n j x j 

Basarsi sulla definizione per verificare che una matrice sia o meno definita positiva può essere molto 

difficile. Fortunatamente, ci sono molti criteri che ci permettono di dire se una matrice è definita positiva o 

no. 

IL seguente risultato ci permette di eliminare certe matrici dalla classe delle matrici definite positive, se 

non soddisfano certi requisiti. 

Teorema 7.5.4 Se una matrice A di dimensione n è definita positiva, allora 

G A ammette la matrice inversa; 

G a i i > 0 per ogni i = 1,2,...,n 

Vediamo ora una condizione necessaria e sufficiente per matrici definite positive. 

2 Osserviamo che non tutti gli autori richiedono la simmetria per definire una matrice definita positiva, e distinguono tra matrici 

definite positive e matrici simmetriche definite positive. 

98


Teorema 7.5.5 Una matrice A simmetrica di dimensione n è definita positiva se e solo se tutti i suoi minori 

principali hanno determinante positivo. 

Teorema 7.5.6 Una matrice A simmetrica di dimensione n con elementi diagonali tutti positivi e 

diagonalmente dominante è definita positiva. 

Anche per matrici simmetriche definite positive, si può applicare il metodo di eliminazione di Gauss 

senza operare scambi di righe e di colonne e i calcoli rimangono stabili rispetto alla crescita degli errori di 

arrotondamento. Questo risultato ci serve per la fattorizzazione di Cholesky. 

7.5.3 Fattorizzazione di Cholesky 

Nel caso in cui la matrice A sia simmetrica, il teorema LDU si presenta nel seguente modo 

Teorema 7.5.7 (LDU per matrici simmetriche) Se A è una matrice simmetrica e nessuno dei suoi minori 

principali è singolare, allora A si può decomporre nel prodotto A = LDL T , dove L è triangolare inferiore con 

elementi diagonali unitari ed è univocamente determinata, L T è la sua trasposta e D è matrice diagonale. 

Dimostrazione. Poichè A è simmetrica, si ha A = A T , quindi LDU = (LDU ) T = U T D T L T = U T DL T . Si 

deduce quindi, dall’uguaglianza, che U = L T e la decomposizione diventa A = LDL T . ✔ 

Nel caso particolare in cui A sia simmetrica e definita positiva, deve valere 

x T Ax = x T LDL T x = (L T x) T DL T x = y T Dy > 0 con y = L T x per ogni x > 0. 

Perciò gli elementi di D (che è una matrice diagonale) devono necessariamente essere tutti positivi – essendo 

A definita positiva. In tal caso, posto M = LD 1/2 si ha A = M M T , il prodotto di una matrice triangolare 

inferiore con coefficienti tutti reali per la sua trasposta. Se D non fosse definita positiva (ma avesse qualche 

elemento negativo), allora neanche A sarebbe definita positiva e la matrice M sarebbe non reale. 

Quindi se A è simmetrica, si ha la decomposizione nel prodotto LL T (chiamiamo di nuovo con L la 

matrice M) con L reale se e solo se A è definita positiva. 

I coefficienti della matrice L si trovano facendo il prodotto righe per colonne ed eguagliando i termini ai 

corrispondenti elementi di A. 

Si ricava: 

l 11 = a 11 

l i 1 = a i 1 /l 11 i = 2,3,...,n 

i−1 ∑ 

l i i = √ (ai i − l 2 i k ) i = 2,3,...,n 

k=1 

l i j = 1 j∑ 

−1 

(a i j − l i k l j k ) j = 2,...,n i = j + 1,...,n 

l i i 

k=1 

Tale fattorizzazione prende il nome di fattorizzazione di Cholesky 3 . 

3 André-Louis Cholesky (1875-1918) fu un matematico francese. Fu ufficiale ingegnere e morì alla fine della prima guerra mondiale. 

99



Esercizio 7.6.1 ⎛ Sia data ⎞ la matrice 

1 0 2 

A = ⎝0 4 8 ⎠ 

2 8 29 

Provare che verifica le condizioni del teorema LDU e trovare i fattori L e L T tali che A = LL T . 

( ) 1 0 

Svolgimento La matrice A è simmetrica e soddisfa le ipotesi del teorema LDU ( infatti |a 11 | = 1, det = 

0 4 

4 e det(A) = 116 − 16 − 64 = 36) per cui è possibile scrivere la matrice A come A = LL T . Si ha, quindi: 

⎛ 

⎞⎛ 

⎞ ⎛ 

l 11 0 0 l 11 l 21 l 31 l 2 ⎞ 

11 

l 11 l 21 l 11 l 31 

⎝l 21 l 22 0 ⎠⎝ 

0 l 22 l 32 

⎠ = ⎝l 21 l 11 l21 2 + l 22 2 l 21 l 31 + l 22 l 32 

⎠ 

l 31 l 32 l 33 0 0 l 33 l 31 l 11 l 31 l 21 + l 32 l 22 l31 2 + l 32 2 + l 33 

2 

Devono quindi valere le relazioni: 

l 2 11 = 1 → l 11 = 1 

l 21 l 11 = 0 → l 21 = 0 

l 31 l 11 = 2 → l 31 = 2 

l 2 21 + l 2 22 = 4 → l 22 = 4 − 0 = 2 

l 21 l 31 + l 22 l 32 = 8 → l 32 = 8/2 = 4 

√ 

l31 2 + l 32 2 + l 33 2 = 29 → l 33 = 29 − 2 2 − 4 2 = 29 − 4 − 16 = 9 = 3 

La matrice L è dunque 

⎛ 

1 0 

⎞ 

0 

⎝0 2 0⎠ 

2 4 3 

Esercizio 7.6.2 ⎛ Data la matrice ⎞ 

0.2 1 0.2 

A = ⎝ 1 6.5 1.75⎠ 

0 2 2.25 

(a) verificare che A soddisfa le condizioni del teorema LDU ; 

(b) fattorizzare secondo Crout A = LU (prendendo u i i = 1); 

(c) usare la fattorizzazione per calcolare det(A −2 ); 

(d) usare la fattorizzazione per risolvere il sistema Ax = b, con b T = (2.8 19.25 10.75) T . 

Svolgimento 

(a) La matrice verifica le condizioni del teorema LDU in quanto i minori principali costruiti a partire 

dall’angolo superiore sinistro hanno tutti determinante diverso da zero: 

a 11 = 0.2 ≠ 0 

( ) 0.2 1 

det = 0.3 ≠ 0 det A = 0.375 ≠ 0 

1 6.5 

100


(b) La fattorizzazione di A come A = LU si costruisce imponendo: 

⎛ 

⎞ ⎛ 

⎞⎛ 

⎞ 

0.2 1 0.2 

l 11 0 0 1 u 12 u 13 

A = ⎝ 1 6.5 1.75⎠ = LU = ⎝l 21 l 22 0 ⎠⎝0 1 u 23 

⎠ 

0 2 2.25 

l 31 l 32 l 33 0 0 1 

Usando le formule di pag. 96, si ottiene 

l 11 = 0.2 

0.2u 12 = 1 =⇒ u 12 = 5 

0.2u 13 = 0.2 =⇒ u 13 = 1 

l 21 = 1 

1 · 5 + l 22 = 6.5 =⇒ l 22 = 1.5 

1 · 1 + 1.5u 23 = 1.75 =⇒ u 23 = 0.5 

l 31 = 0 

0 · 5 + l 32 = 2 =⇒ l 32 = 2 

0 · 1 + 2 · 0.5 + l 33 = 2.25 =⇒ l 33 = 1.25 

Le matrici L e U sono: 

⎛ 

0.2 0 0 

⎞ 

⎛ 

1 5 

⎞ 

1 

L = ⎝ 1 1.5 0 ⎠ U = ⎝0 1 0.5⎠ 

0 2 1.25 

0 0 1 

(c) Si ha det A = detLU = detL detU = detL = 0.375. Quindi det(A −2 ) = det(A) −2 = 0.375 −2 = 7.11111111. 

(d) Da Ax = b si ha LU x = b. 

Si pone U x = y e si hanno i due sistemi da risolvere per sostituzione in avanti e all’indietro: Ly = b e 

U x = y. 

⎛ 

⎞⎛ 

⎞ ⎛ ⎞ ⎧ 

0.2 0 0 y 1 2.8 ⎪⎨ y 1 = 2.8/0.2 = 14 

⎝ 1 1.5 0 ⎠⎝y 2 

⎠ = ⎝19.25⎠ =⇒ y 2 = (19.25 − 14)/1.5 = 3.5 

0 2 1.25 y 3 10.75 

⎪⎩ 

y 3 = (10.75 − 2 · 3.5)1.25 = 3 

⎛ ⎞⎛ 

⎞ ⎛ ⎞ ⎧ 

1 5 1 x 1 14 ⎪⎨ x 3 = 3 

⎝0 1 0.5⎠⎝x 2 

⎠ = ⎝3.5⎠ =⇒ x 2 = 3.5 − 3 · 0.5 = 2 

0 0 1 x 3 3 

⎪⎩ 

x 1 = 14 − 3 − 5 · 2 = 1 

Quindi x = (1, 2, 3) T . 

Esercizio 7.6.3 ⎛ È dato il sistema ⎞ lineare ⎛ Ax = ⎞ b dove: 

16 −8 4 

20 

A = ⎝−8 20 4 ⎠ b = ⎝ 28 ⎠ 

4 4 12.25 

28.25 

(a) Provare che la matrice è definita positiva. 

(b) Fattorizzare la matrice secondo Cholesky: A = LL T . 

(c) Usare la fattorizzazione per risolvere il sistema Ax = b e per calcolare det(A 3 ). 

Soluzione 

101


(a) La matrice è simmetrica, definita positiva in quanto gli elementi della diagonale principale sono tutti 

positivi e la matrice è diagonalmente dominante in senso stretto: 

16 > | − 8| + |4| = 12 

20 > | − 8| + |4| = 12 

12.25 > |4| + |4| = 8 

(b) Ponendo A = LL T si ricava: 

l 2 11 = 16 → l 11 = 4 

l 21 l 11 = −8 → l 21 = −2 

l 31 l 11 = 4 → l 31 = 1 

l 2 21 + l 2 22 = 20 → l 22 = 20 − 4 = 4 

l 21 l 31 + l 22 l 32 = 4 → l 32 = (4 + 2)/4 = 1.5 

l 2 31 + l 2 32 + l 2 33 = 12.25 → l 33 = 12.25 − 1 − 2.25 = 9 = 3 

La matrice L è dunque 

⎛ 

4 0 

⎞ 

0 

L = ⎝−2 4 0⎠ 

1 1.5 3 

(c) Per risolvere il sistema Ax = b, adoperiamo il metodo di sostituzione in avanti e all’indietro risolvendo 

i sistemi: Ly = b e poi L T x = y. 

Il primo sistema dà: 

⎛ 

⎞⎛ 

⎞ ⎛ ⎞ 

4 0 0 y 1 20 

⎝−2 4 0⎠⎝y 2 

⎠ = ⎝ 28 ⎠ 

1 1.5 3 y 3 28.25 

e otteniamo y 1 = 20/4 = 5, y 2 = (28 + 10)/4 = 9.5, y 3 = (28.25 − 5 − 14.25)/3 = 3. 

Nel risolvere il sistema L T x = y si ha 

⎛ 

⎞⎛ 

⎞ ⎛ ⎞ 

4 −2 1 x 1 5 

⎝0 4 1.5⎠⎝x 2 

⎠ = ⎝9.5⎠ 

0 0 3 x 3 3 

da cui x 3 = 1, x 2 = (9.5 − 1.5)/4 = 2, x 1 = (5 − 1 + 4)/4 = 2, quindi x = (2, 2, 1). 

Inoltre, da det(A) = det(LL T ) = det(L) 2 = (4 · 4 · 3) 2 = 48 2 = 2304 e da det(A 3 ) = (det(A)) 3 si ha 

det(A 3 ) = 2304 3 = 12230590464. 

102


8 

METODI ITERATIVI PER LA SOLUZIONE DI SISTEMI LINEARI 

Mi spiace ammettere che la materia 

che mi è piaciuta di meno è stata la 

matematica. Ci ho pensato su, e 

credo che la ragione sia che la 

matematica non lascia spazio alle 

discussioni. Se fai un errore, non 

puoi scamparla. 

Malcom X 

8.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 

8.2 Metodi iterativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 

8.3 Norme di vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 

8.4 Norme di matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

8.5 Autovalori e autovettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

8.6 Metodi classici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 

8.6.1 Convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 

8.6.2 Controllo della convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 

8.6.3 I metodi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

8.6.4 Convergenza dei metodi di Jacobi, Gauss-Seidel, rilassamento . . . . . . . . . . . . . . . . 115 



L’equazione che governa la conduzione del calore in una piastra metallica piana, omogenea e isotropa 

prende il nome di equazione di Poisson e si scrive come 

∂ 2 T 

∂x 2 + ∂2 T f (x, y) 

= 

∂y 

2 

ρcK H 

Si tratta di un’equazione alle derivate parziali dove T [ o C ] è la temperatura, K H [m 2 /s] è il coefficiente di diffusività 

termica, ρ [K g /m 2 ] è la densità della piastra, c [C al/K g o C ] è il calore specifico, f (x, y) [C al/m 2 s] è il 

calore aggiunto o sottratto alla piastra per unità di tempo e di area. In letteratura diverse tecniche numeriche 

permettono di risolvere il problema (ricordiamo i metodi alle differenze finite e i metodi agli elementi finiti), 

103

8. METODI ITERATIVI PER LA SOLUZIONE DI SISTEMI LINEARI 

in determinati punti (detti nodi) della piastra. Qualunque sia il metodo utilizzato, si arriva ad un sistema di 

equazioni lineari del tipo 

HT = q 

dove H rappresenta la matrice di discretizzazione del metodo, T rappresenta il vettore delle temperature nei 

nodi e q è il vettore dei termini noti che deriva dal metodo applicato. 

La matrice H puó avere una dimensione molto elevata ma ha la caratteristica di essere sparsa, cioè di 

avere pochi elementi diversi da zero per ogni riga. 

Per risolvere sistemi lineari di questo tipo, si preferisce usare metodi iterativi piuttosto che diretti. In 

questo Capitolo presentiamo alcuni dei metodi iterativi per la risoluzione di sistemi lineari. 

8.2 Metodi iterativi 

Per risolvere un sistema di equazioni lineari Ax = b, applicando un metodo diretto, e trascurando gli 

errori di arrotondamento, si ottiene la soluzione esatta del problema in un numero finito (e noto a priori) 

di operazioni. Nei metodi iterativi, invece, si parte da un’approssimazione iniziale che viene migliorata, 

mediante un procedimento iterativo, fino ad ottenere una approssimazione sufficientemente accurata della 

soluzione. L’idea di risolvere sistemi lineri con metodi iterativi risale ai tempi di Gauss (1823), ma solo con 

l’avvento dei computers (negli anni cinquanta) si può osservare il loro sviluppo, visto che diventa possibile 

risolvere sistemi lineari dove la matrice A è sparsa e di grandi dimensioni – un particolare tipo di problema 

improponibile per i metodi diretti. Difatti, nei metodi diretti, il processo di eliminazione di Gauss (o la 

decomposizione della matrice di partenza nel prodotto LU con L triangolare inferiore e U triangolare superiore) 

porta all’introduzione del cosiddetto fill-in, cioè a matrici L e U con elementi diversi da zero là dove 

la matrice di partenza A ha elementi nulli. I metodi diretti diventano quindi proibitivi perchè troppo costosi 

per quanto riguarda il numero di operazioni aritmetiche e l’occupazione di dati che devono essere salvati per 

l’implementazione numerica del metodo stesso. I metodi iterativi, al contrario, lavorano direttamente sulla 

matrice A e, dal momento che A viene coinvolta solo in termini di prodotti matrice-vettore, non c’è neanche 

bisogno di memorizzare tutta la matrice (in genere, quando la matrice è sparsa, si lavora su memorizzazioni 

in forma compatta delle matrici, memorizzando solo gli elementi non nulli che servono per il prodotto 

matrice-vettore). 

Quando abbiamo studiato gli zeri di funzione nel Capitolo 4, data un’approssimazione iniziale, si procedeva 

nell’algoritmo iterativo fino a quando lo scarto tra due approssimazioni successive non diventava 

minore di una prefissata tolleranza. 

Nel caso dei sistemi lineari, l’approccio è simile. Si parte da un vettore iniziale che approssima la soluzione 

del sistema e, mediante un certo procedimento ricorsivo, si calcola una nuova approssimazione (un 

vettore). Dobbiamo dunque essere capaci di misurare lo scarto tra due vettori in modo da capire quando la 

successione dei vettori generati dall’algoritmo tende al vettore soluzione del sistema lineare. 

A tal fine abbiamo bisogno di definire le norme di vettori e di matrici. Tratteremo solo norme di matrici e 

vettori definite nello spazio dei numeri reali (e non complessi). 

Norma 

Norme 1, ∞, 

8.3 Norme di vettori 

Il concetto di norma generalizza quello di valore assoluto (o modulo) di un numero reale (o complesso). 

Sia R n lo spazio dei vettori colonna di lunghezza n. La norma di un vettore x ∈ R n è una funzione, ‖ · ‖, 

definita in R n e a valori in R, che gode delle seguenti proprietà: 

‖x‖ > 0 per ogni x ≠ 0 

‖x‖ = 0 se e solo se x = 0 

‖αx‖ = |α|‖x‖ dove α è un reale (o complesso) arbitrario 

G ‖x + y‖ ≤ ‖x‖ + ‖y‖ 

Le principali norme vettoriali sono: 

2 

G Norma assoluta (o norma l 1 ), indicata con ‖ · ‖ 1 : ‖x‖ 1 = ∑ n 

i=1 |x i | 

G Norma massima (o norma infinito, l ∞ ), indicata con ‖ · ‖ ∞ : ‖x‖ ∞ = max 1≤i≤n |x i | 

104

8.3. Norme di vettori 

Figura 8.1: Vettori in R 2 con norma unitaria nelle norme 1, ∞ e 2. 

G Norma euclidea (o norma l 2 ), indicata con ‖ · ‖ 2 : ‖x‖ 2 = √ ∑n 

x T x = 

i=1 |x i | 2 

Tra le norme 1, ∞ e 2 valgono le seguenti relazioni (che pongono un’equivalenza tra esse). Dato un vettore 

x ∈ R n : 

‖x‖ ∞ ≤ ‖x‖ 2 ≤ n‖x‖ ∞ 

‖x‖ ∞ ≤ ‖x‖ 1 ≤ n‖x‖ ∞ 

Esempio 8.3.1 Il vettore x = (1,5,−20) T ha norme: 

‖x‖ 1 = |1| + |5| + | − 20| = 26 

‖x‖ ∞ = max(|1|,|5|,| − 20|) = 20 

√ 

‖x‖ 2 = (1 2 + 5 2 + (−20) 2 ) = 426 = 20.639767441 

Per la norma euclidea vale la diseguaglianza di Cauchy-Schwarz: 

Diseguaglianza 

di Cauchy- 

Schwarz 

x T y ≤ ‖x‖ 2 ‖y‖ 2 

Dati due vettori x e y ∈ R n , si definisce distanza tra i due vettori la norma della differenza tra i vettori. 

Quindi: 

Distanza tra 

vettori 

‖x − y‖ 1 = 

n∑ 

|x i − y i | 

i=1 

‖x − y‖ ∞ = max |x i − y i | 

1≤i≤n 

√ n∑ 

‖x − y‖ 2 = |x i − y i | 2 

i=1 

Il concetto di distanza serve per definire il limite di una successione di vettori. 

Data una successione di vettori in R n , x (k) , per k = 1,2,...,∞, si dice che la successione converge ad un 

vettore x di R n e si scrive lim k→∞ x (k) = x se, per ogni ɛ > 0, esiste un intero m tale che 

‖x (k) − x‖ < ɛ per tutti gli indici k ≥ m 

Limite di una 

successione 

di vettori 

105


8.4 Norme di matrici 

Norma 

compatibile 

Norma 

naturale 

traccia di una 

matrice 

Analogamente alla definizione di norma vettoriale, la norma di matrici quadrate di dimensione n è una 

funzione, che indichiamo con ‖ · ‖ che, per tutte le matrici A e B di dimensione n e per tutti i numeri reali (o 

complessi) α, soddisfa le seguenti proprietà: 

‖A‖ > 0 per ogni A ≠ 0 

‖A‖ = 0 se e solo se A = 0 

‖αA‖ = |α|‖A‖ 

‖A + B‖ ≤ ‖A‖ + ‖B‖ 

G ‖AB‖ ≤ ‖A‖‖B‖ 

Una proprietà importante che si richiede alle norme su matrici è che siano compatibili con norme vettoriali: 

la norma ‖A‖ di una matrice A si dice compatibile con la norma ‖x‖ di un vettore x se vale la 

relazione 

‖Ax‖ ≤ ‖A‖‖x‖ 

Alcune norme su matrici sono generate da norme su vettori: si parla allora di norma naturale o indotta 

dalla norma di vettori. In particolare, se ‖ · ‖ è una norma su vettori in R n , allora ‖A‖ = max ‖x‖=1 ‖Ax‖ è la 

norma naturale o indotta dalla norma ‖ · ‖ su vettori. 

Le norme di matrici indotte dalla norma 1 e dalla norma infinito su vettori sono: 

G Norma 1: ‖A‖ 1 = max j 

∑ n 

i=1 |a i j | (data dal massimo sulla somma delle colonne) 

G Norma infinito: ‖A‖ ∞ = max i 

∑ n 

j =1 |a i j | (data dal massimo sulla somma delle righe) 

La norma di matrice indotta dalla norma 2 è più complicata e vedremo in seguito come è definita. 

È facile vedere che le norme naturali sono norme compatibili con la norma di vettori da cui sono costruite. 

Una norma di matrici, che non è indotta, ma compatibile con la norma 2 è la cosiddetta norma euclidea 

(o di Frobenius). Tenendo presente che, data una matrice A, si chiama traccia della matrice o tr (A) la somma 

degli elementi della diagonale principale di A, la norma euclidea è data da 

G N (A) = √ tr (A T A) = √ √ ∑n 

tr (A A T ) = 

i=1 

|a i j | 2 . 

j =1 

8.5 Autovalori e autovettori 

Data una matrice quadrata A di ordine n, se esiste un numero (reale o complesso) λ e un vettore x ≠ 0 tali 

che 

Ax = λx 

Autovalore e 

autovettore 

allora λ è un autovalore e x il corrispondente autovettore della matrice A. 

Scritta in maniera equivalente, la relazione definisce il sistema lineare 

(A − λI )x = 0 

Poichè x ≠ 0 e il termine noto del sistema è il vettore di tutti zeri, il determinante della matrice del sistema 

deve necessariamente essere uguale a zero, cioè det(A − λI ) = 0. 

Lo sviluppo del determinante porta a un polinomio di grado n nell’incognita λ: 

λ n − tr (A)λ n−1 + ... + (−1) n det A = 0 

Polinomio Questo polinomio si chiama polinomio caratteristico. Le sue n radici, che chiamiamo λ 1 ,λ 2 ,...,λ n , sono gli 

caratteristico n autovalori della matrice A. 

Per le proprietà dei polinomi vale: 

106 

n∑ 

λ i = tr (A) = a 11 + a 22 + ... + a nn 

i=1 

e 

n∏ 

λ i = det A 

Alcune proprietà sugli autovalori e autovettori sono le seguenti: 

i=1

8.5. Autovalori e autovettori 

Figura 8.2: Autovalori e autovettori 

G Se λ è autovalore della matrice A, allora λ k è autovalore della matrice potenza A k (cioè A · A ··· A k 

volte). 

G Gli autovalori di una matrice A e della sua trasposta A T sono gli stessi (ma gli autovettori sono, in 

genere, diversi). 

G Se A e B sono due matrici arbitrarie regolari, allora gli autovalori di AB sono gli stessi di B A. 

Se x è un autovettore associato alla matrice A, allora Ax = λx: la matrice A trasforma il vettore x in un 

vettore le cui componenti sono moltiplicate per λ: se λ > 1, allora A ha l’effetto di allungare x di un fattore λ; 

se invece 0 < λ < 1, allora x si restringe di un fattore λ; gli effetti sono simili, ma il verso del vettore risultante 

Ax è opposto, quando λ < 0. I quattro casi che si possono presentare sono illustrati in Figura 8.2. 

Altre proprietà da tenere presenti sono le seguenti: 

G Se tutti gli n autovalori di una matrice A sono distinti, allora gli n autovettori u (1) , u (2) ,...u (n) sono 

linearmente indipendenti 1 

G Se A è una matrice simmetrica reale definita positiva, allora i suoi autovalori sono tutti reali e positivi. 

Introduciamo ora il raggio spettrale di una matrice A . 

Definizione 8.5.1 Il raggio spettrale ρ(A) di una matrice A è definito da 

ρ(A) = max |λ| 

λ autovalore di A 

Quindi il raggio spettrale è il massimo, in modulo, degli autovalori di A (ricordiamo che se λ è un 

complesso, λ = α + iβ, con i = −1, si ha |λ| = √ α 2 + β 2 ). 

Possiamo ora definire la norma 2 su matrici indotta dalla norma 2 su vettori. Si può, infatti, provare che 

√ 

G ‖A‖ 2 = ρ(A T A). 

Inoltre, per ogni norma naturale, vale il risultato 

ρ(A) ≤ ‖A‖ 

Nello studiare i metodi iterativi per risolvere i sistemi lineari, sarà di particolare importanza sapere quando 

le potenze di una matrice tendono alla matrice nulla. Matrici A, per cui (A k ) i j → 0 per k → ∞, qualunque 

sia i , j = 1,2,...,n, (consideriamo A · A ··· A k volte e gli elementi della matrice risultante tendono a zero per 

k → ∞) si dicono matrici convergenti. Diciamo che una matrice A di dimensione n è convergente se 

lim 

k→∞ (Ak ) i j = 0, i , j = 1,2,...,n 

Si ha il seguente teorema. 

Raggio 

spettrale 

Norma 2 su 

matrici 

Matrice 

convergente 

Teorema 8.5.1 Data una matrice A di dimensione n, sono equivalenti le seguenti proposizioni 

1. A è una matrice convergente. 

2. lim k→∞ ‖A k ‖ = 0, per qualche norma naturale. 

3. lim k→∞ ‖A k ‖ = 0, per tutte le norme naturali. 

4. ρ(A) < 1. 

5. lim k→∞ A k x = 0, qualunque sia il vettore x. 

1 Dati n vettori linearmente indipendenti di R n , u (1) , u (2) ,...u (n) , ogni vettore di R n si può scrivere come una loro combinazione 

lineare. Quindi esistono n coefficienti α 1 ,α 2 ,...,α n per cui x = α 1 u (1) +α 2 u (2) +...+α n u (n) . Inoltre, per vettori linearmente indipendenti 

vale il risultato: α 1 u (1) + α 2 u (2) + ... + α n u (n) = 0 se e solo se tutti i coefficienti α i sono uguali a zero, per i = 1,2,...,n. 

107


8.6 Metodi classici 

I metodi iterativi classici per la risoluzione di un sistema di equazioni lineari del tipo Ax = b si basano su 

un’idea molto semplice. 

G Si parte da un’approssimazione iniziale x (0) , commettendo un’errore e (0) = x − x (0) . L’errore e (0) è soluzione 

del sistema Ae (0) = b − Ax (0) = r (0) , dove r (0) è il residuo (ciò che resta fuori, ci dice di quanto il 

vettore Ax (0) si discosta da b). 

G Successivamente si definisce il passo x (1) come x (1) = x (0) + p (0) , dove ora p (0) è soluzione del sistema 

Mp (0) = r 0 , in cui la matrice M sia più semplice della A e, allo stesso tempo, M −1 approssimi in qualche 

modo A −1 . 

G Il procedimento viene iterato fino a convergenza. 

Da queste richieste tra loro contradditorie, si sviluppa una strategia che ci porta alla soluzione esatta x come 

limite della successione dei valori approssimati x (k) . 

Il processo iterativo si legge, infatti, come: 

x (k+1) = x (k) + M −1 (b − Ax (k) ) k = 0,1,.... 

O, equivalentemente, 

x (k+1) = (I − M −1 A)x (k) + M −1 b k = 0,1,... 

Notiamo che, ad ogni passo, non dobbiamo calcolare esplicitamente M −1 , perchè risolviamo problemi del 

tipo Mp (k) = r (k) = b − Ax (k) in modo da porre x (k+1) = x (k) + p (k) . La matrice E = I − M −1 A è detta matrice di 

iterazione del metodo. Nel seguito, per semplicità, poniamo q = M −1 b. 

Lo schema iterativo appena descritto è un metodo stazionario (cioè non dipende dall’iterazione k) e 

può essere visto come caso particolare di uno schema di punto fisso per equazioni nonlineari: la funzione 

g tale che x (k+1) = g (x (k) ) converga alla soluzione del sistema Ax = b, è data da g (x) = x + M −1 (b − Ax) o 

equivalentemente da g (x) = Ex (k) + q. 

8.6.1 Convergenza 

Per studiare la convergenza di un metodo iterativo, consideriamo, per ogni vettore x (k) , il residuo r (k) = 

b − Ax (k) e l’errore e (k) = x − x (k) . Osserviamo che si ha la relazione r (k) = Ae (k) . Infatti 

Ae (k) = A(x − x (k) ) = Ax − Ax (k) = b − Ax (k) = r (k) 

Lo schema converge quando la successione x (k) converge alla soluzione x per k → ∞, ovvero quando 

lim k→∞ e (k) = 0 qualunque sia il vettore iniziale x (0) . 

Consideriamo lo schema iterativo x (k+1) = Ex (k) + q. 

È facile vedere che per la soluzione esatta x vale la relazione x = Ex + q. 

Consideriamo x − x (k) . Si ha 

x = Ex + q 

x (k) = Ex k−1 + q 

e sottraendo si ricava 

e (k) = Ee (k−1) 

La relazione appena trovata vale, alla stessa maniera, tra l’errore e (k−1) e l’errore e (k−2) per cui possiamo 

scrivere e (k−1) = Ee (k−2) . 

Scriviamo queste relazioni dall’iterazione k fino ad arrivare all’iterazione 0. 

108

8.6. Metodi classici 

e (k) = Ee (k−1) 

e (k−1) = Ee (k−2) 

e (k−2) = Ee (k−3) 

. = . . . 

e (2) = Ee (1) 

e (1) = Ee (0) 

Partendo, ora, dalla prima relazione e, andando a sostituire, ogni volta, a secondo membro, la relazione 

successiva, si ha: 

e (k) = Ee (k−1) = E(Ee (k−2) ) = E 2 e (k−2) = E 2 (Ee (k−3) ) = E 3 e (k−3) = ... = E k e (0) 

Osserviamo che E k rappresenta la potenza k della matrice E, cioè la E · E ···E k volte. 

Il metodo converge se e (k) → 0 per k → ∞. Poichè l’errore iniziale è arbitrario, si ha che lim k→∞ e (k) = 

lim k→∞ E k e (0) = 0 se e solo se lim k→∞ E k = 0. 

Per il teorema sulla convergenza di matrici (si veda pag. 107), questo si ha se e solo se ρ(E) < 1. Si può 

dunque stabilire il seguente teorema. 

Teorema 8.6.1 Lo schema iterativo 

x (k+1) = Ex (k) + q k ≥ 0 

converge qualunque sia il vettore iniziale x 0 al vettore x = Ex + q = A −1 b se e solo se ρ(E) < 1. 

Questo risultato lo si può provare facilmente, nel caso in cui la matrice di iterazione E abbia n autovalori 

distinti e, quindi, possieda n autovettori linearmente indipendenti, per cui l’errore iniziale e (0) si può scrivere 

come e (0) = α 1 u (1) + α 2 u (2) + ... + α n u (n) , dove α 1 ,α 2 ,...,α n sono delle costanti, mentre u (1) , u (2) ...u (n) sono 

gli autovettori associati, rispettivamente, a λ 1 , λ 2 ,...,λ n . Supponiamo che gli autovalori siano in ordine decrescente 

in modulo, cioè: |λ 1 | > |λ 2 | > ... > |λ n |, per cui ρ(E) = |λ 1 |. In tal caso si può scrivere (ricordando 

che, se λ è un autovalore associato alla matrice A, con u un autovettore ad esso associato, si ha A k u = λ k u) 

e (k) = E k e (0) = E k (α 1 u (1) + α 2 u (2) + ... + α n u (n) ) 

= α 1 E k u (1) + α 2 E k u (2) + ... + α n E k u (n) 

= α 1 λ k 1 u(1) + α 2 λ k 2 u(2) + ... + α n λ k n u(n) 

mettiamo in evidenza λ k 1 

( 

= λ k 1 

α 1 u (1) + α 2 

λ k 2 

λ k 1 

) 

u (2) λ k n 

+ ... + α n 

λ k u (n) 

1 

per k → ∞ si ha λk i 

λ k → 0 per i = 2,3,...,n 

1 

≈ λ k 1 α 1u (1) 

Perciò lim k→∞ e (k) = lim k→∞ λ k 1 α 1u (1) = 0 se e solo se λ k 1 → 0 e questo si ha se e solo se |λ 1| < 0. Ma |λ 1 | = ρ(E): 

ritroviamo il risultato visto prima. 

109


8.6.2 Controllo della convergenza 

Oltre a sapere che lo schema iterativo converge, è importante conoscere quanto velocemente lo schema 

converge. A tal proposito osserviamo che, in condizioni asintotiche (per k → +∞) vale il seguente risultato 2 

‖e (k) ‖ ≈ ρ(E) k ‖e (0) ‖ (8.1) 

Scrivendo l’equazione (8.1) per l’iterazione k − 1 e facendo il rapporto tra le norme degli errori a due passi 

successivi si ha: 

‖e (k) ‖ 

‖e (k−1) ‖ ≈ ρ(E) 

Ricaviamo, quindi, che il metodo iterativo ha convergenza lineare con costante asintotica uguale al raggio 

spettrale della matrice di iterazione. 

Ci chiediamo se è possibile stabilire a priori quante iterazioni occorrono per ridurre la norma dell’errore 

iniziale di un certo fattore, ad esempio 10 (il che vuol dire ridurre l’errore di un ordine di grandezza). Vogliamo 

dunque capire quale deve essere il valore di k per cui ‖e (k) ‖ = ‖e(0) ‖ 

10 . Ma ‖e(k) ‖ ≈ ρ(E) k ‖e (0) ‖ da cui 

‖e (0) ‖ 

10 ≈ ρ(E)k ‖e (0) ‖ =⇒ 1 

10 ≈ ρ(E)k 

Applicando il logaritmo in base 10 ad ambo i membri si ha 

1 

−1 ≈ k log 10 (ρ(E)) =⇒ k ≈ − 

log 10 (ρ(E)) 

Velocità 

asintotica di 

convergenza 

cioè occorrono k iterazioni con k dato dal più piccolo intero che soddisfa la relazione appena scritta. Meno 

iterazioni occorrono fare, più veloce è il metodo. 

Si definisce perciò velocità asintotica di convergenza 

R = −log 10 (ρ(E)) = −log 10 (ρ(E k )) 

k 

Osserviamo che, essendo ρ(E) < 1, nelle ipotesi in cui il metodo converge, log 10 (ρ(E)) < 0 e, di conseguenza, 

R > 0. Se vogliamo ridurre l’errore iniziale di una certa quantità ɛ, rifacendo i conti come prima, da una parte 

vogliamo che sia ‖e (k) ‖ ≤ ɛ‖e (0) ‖, dall’altra sappiamo che ‖e (k) ‖ ≈ ρ(E) k ‖e (0) ‖. Uguagliando i termini abbiamo 

ρ(E) k ‖e (0) ‖ ≤ ɛ‖e (0) ‖ =⇒ ρ(E) k ≤ ɛ 

Passando ai logaritmi (di quantità minori di uno) si ha 

k log 10 (ρ(E)) ≤ log 10 (ɛ) =⇒ −k log 10 (ρ(E)) ≥ −log 10 (ɛ) =⇒ k ≥ −log 10 (ɛ) 

R 

Troviamo in questo modo quante iterazioni (il primo intero k che verifica la relazione precedente) occorre 

fare per poter ridurre l’errore iniziale di ɛ. 

Se si traccia un grafico semilogaritmico del profilo di convergenza dello schema iterativo, ponendo sull’asse 

delle ascisse il numero delle iterazioni e sull’asse delle ordinate la norma dell’errore, si può vedere che 

la velocità asintotica di convergenza è legata alla pendenza della retta. Infatti, riconducendoci, per semplicità, 

al caso in cui la matrice di iterazione abbia n autovalori distinti tra loro e ordinati in senso crescente, dalla 

relazione (vista a pag. 109) 

e (k) ≈ λ k 1 α 1u (1) 

2 Questa relazione vale anche per matrici con autovalori non distinti tra loro. 

110


Figura 8.3: La matrice A come somma delle matrici L, D e U . 

passando alle norme e ai logaritmi in base 10 si ha 

log 10 ‖e (k) ‖ ≈ k log 10 |λ 1 | + costante 

La pendenza del grafico è l’opposto della velocità asintotica di convergenza R. 

Nel caso in cui non è nota la soluzione esatta x, poichè ‖e (k) ‖ ≈ ‖x (k) − x (k−1) ‖ = ‖d (k) ‖ (valgono le stesse 

considerazioni viste per gli schemi iterativi per funzioni non lineari a pag. 53), ritroviamo lo stesso risultato 

sul profilo di convergenza semilogaritmico in cui si pone sull’asse delle ascisse il numero delle iterazioni e 

sull’asse delle ordinate la norma degli scarti. 

8.6.3 I metodi 

Si scriva la matrice A come somma della matrice che ha i soli elementi diagonali di A (che chiamiamo 

D), della matrice costituita dai soli elementi della parte triangolare bassa di A (che chiamiamo L) e dai soli 

elementi della parte triangolare alta di A (che denotiamo con U ), 

A = L + D +U 

In questo modo è facile ricavare i metodi iterativi di Jacobi, Gauss-Seidel e di rilassamento, che sono i metodi 

iterativi classici per la soluzione di sistemi lineari. 

Il metodo di Jacobi 

Il metodo di Jacobi 3 (o degli spostamenti simultanei - o rilassamento simultaneo) si ha ponendo M = D 

da cui la matrice di iterazione diventa E J = I − D −1 A = I − D −1 (L + D +U ) = −D −1 (L +U ). 

Scrivendo lo schema iterativo per Jacobi, si ha, in forma matriciale: 

x (k+1) = E J x (k) + D −1 b 

x (k+1) = −D −1 (L +U )x (k) + D −1 b 

Componente per componente, lo stesso metodo si scrive, per i = 1,2,...,n, come 

x (k+1) 

i 

= 

(D −1 ) i i 

1 

a i i 

⇑ 

o, equivalentemente, 

⎡ 

⎢ 

⎣ b i − 

((L+U )x (k) ) i 

n∑ 

j =1,j ≠i 

⇑ 

⎤ 

a i j x (k) 

⎥ 

j ⎦ 

3 Carl Gustav Jacob Jacobi (1804-1851) fu un grande matematico tedesco. Tra i suoi numerosi studi ricordiamo quelli sulle funzioni 

ellittiche, sulla teoria dei numeri e sulla meccanica celeste. 

111


x (k+1) 

i 

= 

(D −1 ) i i 

1 

a i i 

⇑ 

⎡ 

⎢ 

⎣ b i − 

(Lx (k) ) i 

i−1 

∑ 

j =1 

a i j x (k) 

j 

⇑ 

− 

n∑ 

(U x (k) ) i 

j =i+1 

⇑ 

⎤ 

a i j x (k) 

⎥ 

j ⎦ 

per i = 1,...,n 

La formula la si può ricavare direttamente, scrivendo, equazione per equazione, il sistema da risolvere 

Ax = b: 

a 11 x 1 + a 12 x 2 + a 13 x 3 + ... + a 1n x n = b 1 

a 21 x 1 + a 22 x 2 + a 23 x 3 + ... + a 2n x n = b 2 

. = . . . 

a i 1 x 1 + a i 2 x 2 + a i 3 x 3 + ... + a i n x n = b i 

. = . . . 

a n1 x 1 + a n2 x 2 + a n3 x 3 + ... + a nn x n = b n 

Dalla prima equazione “isoliamo” la prima incognita rispetto a tutte le altre; dalla seconda equazione 

“isoliamo” la seconda incognita e così via per le altre equazioni, ottenendo: 

a 11 x 1 = b 1 − (a 12 x 2 + a 13 x 3 + ... + a 1n x n ) 

a 22 x 2 = b 2 − (a 21 x 1 + a 23 x 3 + ... + a 2n x n ) 

. = . . . 

a i i x i = b i − (a i 1 x 1 + a i 2 x 2 + ... + a i i−1 x i−1 + a i i+1 x i+1 + ... + a i n x n ) 

. = . . . 

a nn x n = b n − (a n1 x 1 + a n2 x 2 + a n3 x 3 + ... + a nn−1 x n−1 ) 

Dividendo l’i -sima equazione per il coefficiente a i i , per i = 1,2,...,n, ricaviamo 

x 1 = 1 [b 1 − (a 12 x 2 + a 13 x 3 + ... + a 1n x n )] 

a 11 

x 2 = 1 [b 2 − (a 21 x 1 + a 23 x 3 + ... + a 2n x n )] 

a 22 . = . . 

x i = 1 [b i − (a i 1 x 1 + a i 2 x 2 + ... + a i i−1 x i−1 + a i i+1 x i+1 + ... + a i n x n )] 

a i i . = . . 

x n = 1 

a nn 

[b n − (a n1 x 1 + a n2 x 2 + a n3 x 3 + ... + a nn−1 x n−1 )] 

Se pensiamo di partire da un vettore inziale x (0) , il vettore x (1) si ottiene dalle equazioni precedenti, ponendo 

a secondo membro di ciascuna equazione le componenti del vettore x (0) . Si ricava, in tal modo, la 

formula ricorsiva dello schema di Jacobi: 

112


x (k+1) 

1 

= 1 [ ( 

)] 

b 1 − a 12 x (k) 

2 

+ a 13 x (k) 

3 

+ ... + a 1n x n 

(k) 

a 11 

)] 

x (k+1) 

2 

= 1 

a 22 

[ 

b 2 − 

. = . . . 

x (k+1) 

i 

= 1 

a i i 

[ 

b i − 

. = . . . 

x (k+1) 

n = 1 

a nn 

[ 

b n − 

( 

a 21 x (k) 

1 

+ a 23 x (k) 

3 

+ ... + a 2n x n 

(k) 

( 

)] 

a i 1 x (k) 

1 

+ a i 2 x (k) 

2 

+ ... + a i i−1 x (k) 

i−1 + a i i+1x (k) 

i+1 + ... + a i n x n 

(k) 

( 

)] 

a n1 x (k) 

1 

+ a n2 x (k) 

2 

+ a n3 x (k) 

3 

+ ... + a nn−1 x (k) 

n−1 

Ritroviamo, dunque, la formula scritta prima in forma compatta. 

La formula in funzione del residuo r (k) = b − Ax (k) è data invece da x (k+1) = x (k) + D −1 r (k) . 

Il Metodo di Gauss-Seidel 

Nell’algoritmo di Gauss-Seidel 4 si pone M = D + L ottenendo la matrice E S = I − (D + L) −1 A = I − (D + 

L) −1 (L + D +U ) = −(D + L) −1 U . Lo schema iterativo è: 

x (k+1) = E S x (k) + (D + L) −1 b 

Moltiplicando ambo i membri per (D + L) si ha 

da cui 

(D + L)x (k+1) = b −U x (k) 

Dx (k+1) = b − Lx (k+1) −U x (k) 

x (k+1) = D −1 ( b − Lx (k+1) −U x (k)) 

Componente per componente si ha 

[ 

x (k+1) = 1 

i 

a i i 

i−1 ∑ 

b i − 

j =1 

a i j x (k+1) 

j 

− 

n∑ 

j =i+1 

a i j x (k) 

j 

] 

per i = 1,...,n 

Il metodo è detto anche degli spostamenti successivi, in quanto il calcolo delle componenti del vettore 

x (k+1) è fatto utilizzando le componenti già calcolate del vettore stesso. Infatti, per i > 1, è ragionevole pensare 

che i valori già calcolati x (k+1) 

1 

, x (k+1) 

2 

,..., x (k+1) possano essere utilizzati per dare una migliore approssimazione 

del valore x (k+1) . Dalle equazioni del sistema, ragionando come per il metodo di Jacobi, possiamo quindi 

i−1 

i 

4 Philipp Ludwig von Seidel (1821-1896) fu un matematico tedesco. Il suo lavoro più importante riguarda le aberrazioni ottiche. 

113


scrivere: 

( 

) 

a 11 x (k+1) 

1 

= b 1 − a 12 x (k) 

2 

+ a 13 x (k) 

3 

+ ... + a 1n x n 

(k) 

( 

) 

a 22 x (k+1) 

2 

= b 2 − a 21 x (k+1) 

1 

+ a 23 x (k) 

3 

+ ... + a 2n x n 

(k) 

. = . . . 

a i i x (k+1) = b 

i 

i − 

. = . . . 

a nn x n 

(k+1) = b n − 

( 

a i 1 x (k+1) 

1 

+ a i 2 x (k+1) 

2 

+ ... + a i i−1 x (k+1) 

i−1 

) 

+ a i i+1 x (k) 

i+1 + ... + a i n x n 

(k) 

( 

) 

a n1 x (k+1) 

1 

+ a n2 x (k+1) 

2 

+ a n3 x (k+1) 

3 

+ ... + a nn−1 x (k+1) 

n−1 

Dividendo ambo i membri dell’equazione i -sima per a i i (per i = 1,2,...,n) si ha: 

x (k+1) 

1 

= 1 [ ( 

)] 

b 1 − a 12 x (k) 

2 

+ a 13 x (k) 

3 

+ ... + a 1n x n 

(k) 

a 11 

x (k+1) 

2 

= 1 

a 22 

[ 

b 2 − 

. = . . . 

x (k+1) 

i 

= 1 

a i i 

[ 

b i − 

. = . . . 

x (k+1) 

n = 1 

a nn 

[ 

b n − 

( 

a 21 x (k+1) 

1 

+ a 23 x (k) 

3 

+ ... + a 2n x n 

(k) 

( 

a i 1 x (k+1) 

1 

+ a i 2 x (k+1) 

)] 

2 

+ ... a i i−1 x (k+1) 

i−1 

)] 

+ a i i+1 x (k) 

i+1 + ... + a i n x n 

(k) 

( 

)] 

a n1 x (k+1) 

1 

+ a n2 x (k+1) 

2 

+ a n3 x (k+1) 

3 

+ ... + a nn−1 x (k+1) 

n−1 

Usando il residuo, lo schema di Gauss-Seidel si scrive come 

x (k+1) = x (k) + (D + L) −1 r (k) 

Il metodo di rilassamento 

Ciascuno dei metodi di Jacobi e Gauss-Seidel può essere anche rilassato tramite un fattore ω scrivendo 

x (k+1) = x (k) + ω(x (k+1) 

nonr i l − x(k) ) o, in maniera del tutto equivalente, x (k+1) = ωx (k+1) 

nonr i l + (1 − ω)x(k) , dove x (k+1) 

nonr i l 

è l’approssimazione del vettore x ottenuta tramite il metodo di Jacobi o di Gauss-Seidel. 

A differenza del metodo di Jacobi rilassato, che non produce effettivi miglioramenti rispetto al metodo 

non rilassato, il metodo di Gauss-Seidel rilassato può produrre un metodo molto più veloce in termini di 

convergenza e, quindi, preferibile rispetto al metodo senza rilassamento. Come metodo di rilassamento, 

dunque, consideriamo il metodo di rilassamento ottenuto da Gauss-Seidel. Per scelte di ω nell’intervallo 

]0,1[ si parla di metodo Sotto-Rilassato, o Under-Relaxation (e in genere è usato per ottenere convergenza 

nella soluzione di sistemi che non convergono con il metodo di Gauss-Seidel). Per valori di ω nell’intervallo 

[1,2[ si ha, invece, il metodo noto come metodo di sovra-rilassamento o SOR (Successive Over-Relaxation) – 

usato per accelerare la convergenza in sistemi che sono convergenti con il metodo di Gauss-Seidel. 

Lo schema di rilassamento, è dato da 

x (k+1) = (1 − ω)x (k) 

i 

+ ω i−1 ∑ 

[b 

i i − 

a i i 

j =1 

a i j x (k+1) 

j 

− 

n∑ 

j =i+1 

a i j x (k) 

j 

] 

per i = 1,...,n 

114


La matrice di iterazione del metodo di rilassamento si ricava scrivendo in forma matriciale l’algoritmo 

appena descritto 

x (k+1) = (1 − ω)x (k) + ωD −1 ( b − Lx (k+1) −U x (k)) 

x (k+1) = [ (1 − ω)I − ωD −1 U ] x (k) − ωD −1 Lx (k+1) + ωD −1 b 

(I + ωD −1 L)x (k+1) = [ (1 − ω)I − ωD −1 U ] x (k) + ωD −1 b 

Moltiplicando ambo i membri per D, si ricava 

La matrice di iterazione del metodo è dunque 

E = (D + ωL) −1 [(1 − ω)D − ωU ] 

E = (D + ωL) −1 [(1 − ω)D − ω(A − D − L)] 

E = (D + ωL) −1 [(D + ωL) − ωA] 

E = [ I − ω(D + ωL) −1 A ] 

(D + ωL)x (k+1) = [(1 − ω)D − ωU ] x (k) + ωb 

A questo punto, ci si può chiedere quale sia l’ω ottimale nel metodo di rilassamento. L’ω ottimale è quello 

che fa sì che il metodo di rilassamento converga nel minor numero di iterazioni (quindi, l’ω ottimale rende 

minimo il raggio spettrale della matrice di iterazione). Vedremo, per particolari matrici A, quando è possibile 

stabilire a priori quale sia l’ω ottimale per risolvere il sistema lineare Ax = b. 

8.6.4 Convergenza dei metodi di Jacobi, Gauss-Seidel, rilassamento 

Le matrici di iterazione dei tre metodi appena descritti sono scritte in Tabella 8.6.4 Perchè ci sia 

metodo matrice 

Jacobi E J = I − D −1 A = −D −1 (L +U ) 

Gauss-Seidel E S = I − (D + L) −1 A = −(D + L) −1 U 

rilassamento E ω = I − ω(D + ωL) −1 A 

Tabella 8.1: Matrici di iterazione dei metodi di Jacobi, Gauss-Seidel, rilassamento 

convergenza, il raggio spettrale della matrice di iterazione deve essere minore di uno. 

Per i metodi di Jacobi e di Gauss-Seidel si può provare la convergenza del metodo, se la matrice A ha una 

delle seguenti caratteristiche: 

G A è diagonalmente dominante in senso stretto 

G A è a diagonalmente dominante (per righe o per colonne) ed è irriducibile 5 . 

Si ha inoltre, questo risultato: 

G se A è simmetrica non singolare con elementi principali reali e positivi, allora il metodo di Gauss-Seidel 

è convergente se e solo se A è definita positiva. 

Per quanto riguarda il metodo di rilassamento, condizione necessaria per la convergenza è |ω − 1| < 1, cioè 

ω deve appartenere all’intervallo [0,2] ( per 0 < ω < 1 si ha sotto-rilassamento e per 1 ≤ ω < 2 si ha sovrarilassamento). 

( ) 

5 P Q 

cioè non può essere messa sotto la forma 

R 

115


Difatti il determinante della matrice di iterazione del metodo di rilassamento vale 6 detE ω = (1 − ω) n e, 

poichè il prodotto degli autovalori di una matrice è uguale al determinante della matrice stessa, segue 7 che 

il raggio spettrale della matrice sarà maggiore o uguale a |1 − ω| Quindi, se |1 − ω| > 1, sicuramente il metodo 

di rilassamento non convergerà. Perciò, condizione necessaria per la convergenza è |1 − ω| < 1. 

Si ha questo importante teorema. 

Teorema 8.6.2 (Ostrowski-Reich) Se A è definita positiva e ω è un numero reale nell’intervallo ]0,2[, allora il 

metodo di rilassamento è convergente. 

G La convergenza del metodo di rilassamento si ha, inoltre, per A simmetrica con elementi diagonali 

positivi ed elementi extra-diagonali negativi o nulli, se e solo se A è definita positiva. 

Un altro interessante teorema mette in relazione il metodo di rilassamento con i metodi di Jacobi e di Gauss- 

Seidel, sia per quanto riguarda la convergenza, sia per quanto riguarda il valore ottimale del parametro ω, in 

corrispondenza di matrici A che godono della cosidetta proprietà A e che siano coerentemente ordinate. 

Definizione 8.6.1 Una matrice A, di dimensione n, si dice che ha proprietà A se esiste una matrice di 

permutazione P tale che la matrice PAP T abbia la forma 

( ) 

PAP T D1 A 1 

= 

A 2 D 2 

dove D 1 e D 2 sono matrici diagonali. 

Una matrice con proprietà A si dice biciclica. 

Equivalentemente, una matrice A, di dimensione n, ha proprietà A se l’insieme dei numeri naturali 

{1,2,...,n} può essere scomposto in due sottoinsiemi non vuoti e complementari 8 S e T in modo tale che 

i coefficienti non nulli a i j ≠ 0 si hanno per i = j oppure per i ∈ S e j ∈ T oppure per i ∈ T e j ∈ S. 

Esempio 8.6.1 La matrice tridiagonale 

⎛ 

⎞ 

2 −1 0 0 

A = ⎜−1 2 −1 0 

⎟ 

⎝ 0 −1 2 −1⎠ 

0 0 −1 2 

ha proprietà A (o è biciclica): permutando la prima e quarta riga e la prima e quarta colonna, mediante la 

⎛ 

⎞ 

0 0 0 1 

matrice di permutazione P = ⎜0 1 0 0 

⎟ 

⎝0 0 1 0⎠ si ha 

1 0 0 0 

⎛ 

⎞ 

2 0 −1 0 

( ) 

PAP T = ⎜ 0 2 −1 −1 

⎟ 

2 0 

⎝−1 −1 2 0 ⎠ =⇒ D 1 = D 2 = 

0 2 

0 −1 0 2 

Possiamo scegliere S = {1,3} e T = {2,4}. 

6 Dalla definizione di E ω si ha detE ω = det[(D + ωL) −1 ((1 − ω)D − ωU )]. Poichè il determinante del prodotto di due matrici è uguale 

al prodotto dei determinanti delle matrici stesse, si ha detE ω = det[(D + ωL) −1 ]det[(1 − ω)D − ωU )] = detD −1 (1 − ω) n detD. Si arriva 

a questo risultato, tenendo presente il fatto che il determinante di una matrice triangolare è uguale al prodotto degli elementi della 

diagonale principale. 

7 Infatti, considerando λ i autovalore della matrice E ω , per i = 1,2,...,n e ρ(E ω ) il raggio spettrale, si ha detE ω = ∏ n 

i=1 λ i ≤ 

∏ n 

i=1 ρ(E ω) = ρ(E ω ) n da cui segue (1 − ω) n ≤ ρ(E ω ) n , cioè ρ(E ω ) ≥ (1 − ω). 

8 Due insiemi S e T non vuoti si dicono complementari di V = {1,2,...,n} se S ≠ , T ≠ , S ∪ T = V e, inoltre, se i ∈ S,i ∉ T e, 

viceversa, se j ∈ T, j ∉ S 

116


Definizione 8.6.2 Una matrice si dice coerentemente ordinata in relazione ad un vettore di ordinamento q, di 

lunghezza n, se per ogni coefficiente a i j non nullo, con i ≠ j , si verifica: 

G se j > i allora q j − q i = 1 

G se j 

Un’altra definizione di matrice con coerente ordinamento considera la matrice A data non dalla scomposizione 

A = L + D +U che abbiamo visto fino ad ora ma come A = D(L A + I +U A ), (osserviamo che, rispetto 

alla prima scomposizione, abbiamo messo in evidenza la matrice diagonale D e quindi le matrici triangolari 

superiore e inferiore sono L A = D −1 L e U A = D −1 U ). Sia D non singolare. Allora la matrice A è detta 

coerentemente ordinata se gli autovalori della matrice J(α) = αL A + α −1 U A , con α ≠ 0 sono indipendenti dal 

parametro α. 

( ) 

D1 A 1 

Le matrici con proprietà A (o bicicliche) nella forma A = 

(P = I nella definizione di proprietà 

A 2 D 2 

A) sono coerentemente ordinate. 

Le matrici tridiagonali sono un esempio di matrici bicicliche e coerentemente ordinate. 

Per il metodo di rilassamento si può provare il seguente risultato. 

Teorema 8.6.3 (Young) Se A è una matrice con proprietà A e coerente ordinamento e 0 < ω < 2, allora: 

G se µ è autovalore di E J , ogni λ che verifica la relazione (λ + ω − 1) 2 = λω 2 µ 2 è autovalore di E ω 

G se λ è autovalore non nullo di E ω , allora ogni µ che verifica la relazione precedente è autovalore di E J 

G se gli autovalori di E J sono reali e il metodo di Jacobi converge (ρ(E J ) < 1), esiste uno ed uno solo ω opt 

che rende ottimale il metodo di rilassamento, tale cioè che ρ(ω opt ) = min 0


Quindi se proviamo che lo schema di Jacobi converge, cioè che l’autovalore di massimo modulo della 

matrice di Jacobi è reale e in modulo minore di 1, allora, poichè per matrici bicicliche e coerentemente 

ordinate vale µ 2 = λ, dove λ è l’autovalore di massimo modulo della matrice di Gauss-Seidel, allora 

anche il metodo di Gauss-Seidel convergerà alla soluzione (da µ < 1 segue µ 2 < 1). La matrice di Jacobi 

è E J = I − D −1 A cioè 

⎛ 

⎞ ⎛ 

⎞ 

0 −2/8 −6/8 0 −1/4 −3/4 

E J = ⎝ 

det(E J − µI ) = 0. 

−7/5 0 0 

−1/5 0 0 

⎠ = ⎝ 

−7/5 0 0 

−1/5 0 0 

−µ −1/4 −3/4 

−7/5 −µ 0 

∣−1/5 0 −µ ∣ = −µ3 + 3 4 · 1 

5 µ + 1 4 · 7 

5 µ = 0 

Si ha: 0 = det(E J − µI ) = −µ 3 + ( 3 

20 + 7 

20 )µ, 

Una radice è µ = 0, e le altre due sono µ = ± 1/2 = ± 0.5 = 0.707106781. 

Gli autovalori sono tutti reali e quello di massimo modulo è µ = 0.707106781 < 1. 

C’è, dunque, convergenza per i metodi di Jacobi e di Gauss-Seidel (λ = µ 2 = 0.5). Le velocità di 

convergenza valgono 

R J = −log 10 (µ) = 0.1505149 

R S = −log 10 (λ) = 0.301029995 = −log 10 (µ 2 ) = 2R J 

⎠ 

(b) 

Lo schema di Jacobi è: 

⎧ 

x (k+1) 

1 

= 1 (30 − 2x(k) 

2 

− 6x (k) 

3 

8 ) 

⎪⎨ 

⎪⎩ 

3 

= 1 2 1.0 1.55 0.65 

(7 − x(k) 

1 

5 Partendo dal vettore x (0) con componenti 

tutte nulle, abbiamo 

k x 1 (k) 

x 2 (k) 

x 3 (k) 

0 0 0 0 

1 3.75 6.8 1.4 

x (k+1) 

2 

= 1 (34 − 7x(k) 

1 

5 ) 

x (k+1) 

Lo schema di Seidel è: 

⎧ 

⎪⎨ 

⎪⎩ 

x (k+1) 

1 

= 1 (30 − 2x(k) 

2 

− 6x (k) 

3 

8 ) 

x (k+1) 

2 

= 1 (34 − 7x(k+1) 

1 

) 

5 

x (k+1) 

3 

= 1 5 

(7 − x(k+1) 

1 

) 

Partendo dal vettore x (0) con componenti 

tutte nulle, abbiamo 

k x (k) 

1 

x (k) 

2 

x (k) 

3 

0 0 0 0 

1 3.75 1.55 0.65 

2 2.875 2.775 0.825 

Esercizio 8.7.2 ⎛ Dato⎞il sistema Ax = b con 

5 0 10 

A = ⎝0 3 15⎠ 

2 1 α 

(a) dire per quali valori di α il metodo di Jacobi converge. 

(b) trovare il valore di α in corrispondenza del quale il metodo SOR ha un valore di omega ottimo ω opt = 

3/2. Per tale valore trovare la velocità asintotica di convergenza del metodo SOR. 

118


Svolgimento 

(a) La matrice dipende dal parametro α quindi a priori non possiamo dire se Jacobi converge o meno. 

Scriviamo la matrice di iterazione del metodo di Jacobi come 

⎛ 

⎞⎛ 

⎞ ⎛ 

⎞ 

1/5 0 0 0 0 10 0 0 −2 

E J = −D −1 (L +U ) = −⎝ 

0 1/3 0 ⎠⎝0 0 15⎠ = ⎝ 0 0 −5⎠ 

0 0 1/α 2 1 0 −2/α −1/α 0 

Gli autovalori si calcolano imponendo det(E J − µI ) = 0, vale a dire 

−µ 0 −2 

0 −µ −5 

∣−2/α −1/α −µ ∣ = 0 vale a dire − µ3 + 9µ α = 0 

Ricaviamo gli autovalori µ = 0 e µ = ± 3 α 

. 

Perchè ci sia convergenza deve dunque essere 3 α 

< 1 ovvero 3 < α. Ricaviamo la relazione α > 9. 

(b) Dalla relazione dell’ω opt , ω opt = 

ordinata, si ha: 

√ 

2 

1+ 1−µ 2 J 

, valida perchè la matrice è biciclica e coerentemente 

2 

1 + 1 − 9/α = 3 2 =⇒ 1 3 = 1 − 9/α =⇒ −8 

9 = − 9 α =⇒ α = 81 8 = 10.125 

Da ω opt = 3 2 = 1.5 segue λ opt = ω opt − 1 = 0.5, da cui R = −log 10 (λ opt ) = 0.3010299957. 

119


9 

INTEGRAZIONE NUMERICA 

Dio non si preoccupa delle nostre 

difficoltà matematiche. Lui integra 

empiricamente. 

Albert Einstein 

9.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 

9.2 Formula dei trapezi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 

9.3 Formule di Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 

9.3.1 Formula di Cavalieri-Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 

9.3.2 Sull’errore della formula di Cavalieri-Simpson . . . . . . . . . . . . . . . . . . . . . . . . . 127 

9.4 Formule composte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 

9.4.1 Formula composta dei trapezi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 

9.4.2 Confronti tra la formula dei trapezi e di Cavalieri-Simpson . . . . . . . . . . . . . . . . . . 132 

9.5 Estrapolazione di Richardson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 

9.6 Approssimazione di Romberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 

9.7 Introduzione alle formule di quadratura di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 

9.7.1 Proprietà delle formule di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 

9.7.2 Formule di Gauss-Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 

9.7.3 Altre formule di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 

9.7.4 Applicazione delle formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 

9.7.5 Sulla funzione peso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 



Un’automobile effettua il giro di una pista in 84 secondi. La velocità dell’auto viene misurata ogni 6 secondi 

usando un’apparecchiatura radar per il controllo della velocità, e si hanno i valori messi in Tabella 9.1 

In base ai dati in possesso, quanto è lunga la pista? 

Sapendo che la velocità v si può scrivere come v(t) = d s (dove s rappresenta lo spostamento e t il tempo), 

d t 

per calcolare la lunghezza della pista (lo spostamento effettuato dall’auto), dobbiamo integrare tra il tempo 

121

9. INTEGRAZIONE NUMERICA 

Tempo 0 6 12 18 24 30 36 42 48 54 60 66 72 78 84 

Velocità 38 41 45 48 45 41 37 33 30 26 24 27 32 35 37 

Tabella 9.1: Dati della velocità misurati ogni 6 secondi. Il tempo è espresso in secondi e la velocità è data in 

metri al secondo. 

iniziale e quello finale la velocità. 

∫ 84 

0 

∫ s(84) 

∫ 

d s s(84) 

v(t)d t = 

s(0) d t d t = d s 

s(0) 

Essendo s(0) = 0 e s(84) = L la lunghezza della pista, si ha 

∫ 84 

0 

v(t)d t = 

∫ s(84) 

s(0) 

d s = L 

Quindi, se riusciamo a risolvere l’integrale in cui la funzione integranda è la velocità, per le uguaglianze 

date, sapremo dire quanto vale L, essendo 

∫ 84 

0 

v(t)d t = L 

Sfruttando i dati della velocità misurati ogni 6 secondi, dobbiamo essere in grado di poter risolvere 

numericamente questo integrale. 

In questo Capitolo studieremo come fare. Ci occuperemo, infatti, di approssimare l’integrale definito 

∫ b 

I = f (x)d x 

a 

dove f è una funzione definita nell’intervallo [a,b] (e f può essere nota oppure data su determinati punti 

dell’intervallo, come nell’esempio appena visto). 

Una formula di integrazione numerica (detta anche formula di quadratura numerica) approssima 

l’integrale esatto I = ∫ b 

a f (x)d x mediante ∑ n 

j =0 a j f (x j ): 

∫ b 

I = 

a 

f (x)d x ≈ 

n∑ 

a j f (x j ) 

j =0 

dove x j , j = 0,...,n sono le ascisse o punti di appoggio della formula di quadratura e a j sono i pesi della 

formula. 

9.2 Formula dei trapezi 

Consideriamo la retta che interpola la f negli estremi dell’intervallo di integrazione. 

seguiamo l’approccio di interpolazione mediante la tabella delle differenze divise: 

Per semplicità, 

a 

b 

f (a) 

f (b) 

f (b) − f (a) 

Il polinomio di interpolazione (retta) che interpola la f in a e in b (gli estremi dell’intervallo di integrazione) 

è dato da 

f (b) − f (a) 

p(x) = f (a) + (x − a) 

b − a 

b − a 

122

9.3. Formule di Newton-Cotes 

L’errore di interpolazione, utilizzando l’espressione del resto di Lagrange è dato da 

E(x) = f ′′ (ξ x ) 

(x − a)(x − b) 

2 

dove ξ x è un punto dell’intervallo [a,b]. Per quanto abbiamo studiato sull’interpolazione, sappiamo che la 

funzione f (x) si può scrivere come somma del polinomio e dell’errore: f (x) = p(x) + E(x). Nel nostro caso, 

abbiamo 

f (b) − f (a) 

f (x) = f (a) + (x − a) + f ′′ (ξ x ) 

(x − a)(x − b) 

b − a 

2 

Dovendo integrare la f tra a e b e valendo l’uguaglianza precedente, integrando ambo i membri, 

otteniamo: 

∫ b 

∫ b 

( 

) ∫ 

f (b) − f (a) 

b 

f (x)d x = f (a) + (x − a) d x + (x − a)(x − b) f ′′ (ξ x ) 

d x 

b − a 

2 

a 

ovvero 

∫ b 

a 

a 

f (a) + f (b) 

f (x)d x = (b − a) + 1 2 2 

∫ b 

a 

a 

(x − a)(x − b)f ′′ (ξ x ))d x 

Poichè il prodotto (x −a)(x −b) ha segno costante in [a,b], per il teorema del Valor Medio del calcolo integrale 

(si veda il Teorema 2.5.3) si ha 

1 

2 

∫ b 

a 

(x − a)(x − b)f ′′ (ξ x ))d x = 1 2 f ′′ (ξ) 

∫ b 

a 

(x − a)(x − b)d x = − 1 2 f ′′ (b − a)3 

(ξ) 

3! 

dove ξ è un punto interno all’intervallo [a,b]. 

La quantità E i nt = − 1 2 f ′′ (b − a)3 

(ξ) = − 1 

3! 12 f ′′ (ξ)(b − a) 3 rappresenta l’errore che si commette approssimando 

l’integrale di f in [a,b] mediante l’integrale della retta passante per f (a) e f (b), vale a dire, mediante 

l’area del trapezio sottesa dalla corda passante per f (a) e f (b). 

Indicando con M = max a≤x≤b |f ′′ (x)| possiamo maggiorare l’errore con la relazione 

(b − a)3 

|E i nt | ≤ M 

12 

La formula dei trapezi approssima l’integrale di f in [a,b] come I tr ap dato da 

I tr ap = b − a [f (a) + f (b)] 

2 

9.3 Formule di Newton-Cotes 

Se, al posto di una retta, prendiamo come funzione interpolante la f un polinomio di grado più elevato, 

otterremo altre formule di quadrature. 

Supponiamo di poter valutare la f in n + 1 punti x 0 , x 1 ,..., x n e costruiamo il polinomio interpolatore di 

grado n utilizzando la formula di Lagrange. 

Avremo p n (x) = ∑ n 

i=0 f (x i )L i (x), dove i polinomi di Lagrange sono dati dalla nota formula 

L i (x) = 

n∏ 

j =0 

j ≠i 

x − x j 

x i − x j 

123


Figura 9.1: Formula dei trapezi: l’integrale della funzione f (zona tratteggiata in blu) viene approssimata 

mediante l’area del trapezio sotteso alla retta di interpolazione per f (a) e f (b) (zona verde). 

Se i nodi sono equidistanti con passo h, possiamo scrivere x j = x 0 + j h, con j = 0,1,...,n e per un generico 

punto x compreso tra x 0 e x n vale x = x 0 + sh con 0 ≤ s ≤ n, s numero reale. 

Quindi x − x j = x 0 + sh − (x 0 + j h) = (s − j )h e x i − x j = (i − j )h, da cui il polinomio di Lagrange si può 

scrivere come 

L i (x) = 

n∏ s − j 

i − j = L i (s) 

j =0 

j ≠i 

Da f (x) = p n (x) + E(x) dove E(x) è l’errore della formula di interpolazione, passando all’integrale, 

abbiamo 

∫ b 

a 

f (x)d x = 

∫ b 

a 

p n (x)d x + 

∫ b 

a 

E(x)d x 

Il primo integrale rappresenta la formula che approssima l’integrale della f mentre il secondo integrale 

rappresenta l’errore della formula di quadratura. 

La formula di quadratura è quindi data dal valore dell’integrale di p n : 

∫ b 

∫ b n∑ 

n∑ 

I = f (x)d x ≈ f (x i )L i (x)d x = f (x i ) 

a 

a 

i=0 

i=0 

∫ b 

a 

L i (x)d x 

La formula di quadratura ha dunque come nodi i punti x i e come pesi gli integrali ∫ b 

a L i (x)d x. 

Sia x 0 = a e x n = b, tenendo presente che L i (x) = L i (s) con x = x 0 + sh, da cui d x = hd s abbiamo 

∫ b 

a 

∫ xn 

L i (x)d x = L i (x)d x = 

x 0 

Allora 

∫ b 

n∑ 

I = f (x)d x ≈ h f (x i ) 

a 

i=0 

∫ n 

0 

∫ n 

0 

L i (s)hd s = h 

L i (s)d s 

∫ n 

0 

L i (s)d s 

124


Definiamo i coefficienti di Newton-Cotes 1 le espressioni 

C (n) = 1 i 

n 

∫ n 

0 

L i (s)d s 

i = 0,1,...,n 

La formula precedente si scrive, quindi, come 

∫ b 

I = 

a 

n∑ 

n∑ 

f (x)d x ≈ nh f (x i )C (n) = (x 

i n − x 0 ) 

i=0 

L’errore della formula di quadratura è dato da 

E i nt = 

∫ b 

a 

∫ b 

E(x)d x = 

a 

i=0 

f (n+1) (ξ x ) 

(x − x 0 )(x − x 1 )···(x − x n )d x 

(n + 1)! 

f (x i )C (n) 

i 

(9.1) 

Dato un polinomio di interpolazione di grado n mediante il procedimento di Lagrange è possibile ricavare 

una formula di quadratura numerica che prende il nome di formula di Newton-Cotes. Per quanto 

riguarda l’errore si può osservare che le formule ottenute con un valore n dispari (cui corrisponde un numero 

n + 1 pari di punti di appoggio) è solo leggermente inferiore alle formule di ordine pari che le precedono 

immediatamente (cui corrisponde un numero dispari di punti di appoggio). 

Per questo motivo le formule di ordine pari sono le più usate. 

Osserviamo che per f (x) ≡ 1, qualunque sia il grado del polinomio utilizzato nelle formule di Newton- 

Cotes, l’errore di integrazione sarà zero. Nell’intervallo [a,b] ≡ [0,1], applicando l’equazione (9.1) si ha 

1 = 

∫ 1 

0 

d x = 

n∑ 

i=0 

C (n) 

i 

Troviamo che la somma dei coefficienti di Newton-Cotes vale 1. 

Per n = 1 (si hanno quindi due punti di appoggio, x 0 e x 1 ) i coefficienti di Cotes sono quelli già ricavati 

della formula dei trapezi 

Formula dei 

trapezi 

C (1) 

0 

= 1 1 

C (1) 

1 

= 1 1 

∫ 1 

0 

∫ 1 

0 

∫ 1 

L 0 (s)d s = 

L 1 (s)d s = 

0 

∫ 1 

0 

(s − 1) 

−1 d s = 1 2 

s 

1 d s = 1 2 

e la formula di integrazione diventa 

∫ b 

I = 

a 

f (x)d x ≈ h 

1∑ 

i=0 

9.3.1 Formula di Cavalieri-Simpson 

f (x i )C (1) 

i 

= (x 1 − x 0 ) f (x 0) + f (x 1 ) 

2 

Considerando n = 2 (quindi 3 punti di appoggio nell’intervallo [a,b], x 0 = a, x 1 = a + b e x 2 = b, i due 

2 

estremi dell’intervallo e il punto centrale) la formula di quadratura prende il nome di formula di Cavalieri- 

Simpson 2 

1 Roger Cotes (1682-1716) fu un matematico inglese che lavorò molto con Isaac Newton, in particolare per la correzione del suo 

famoso libro Principia. Egli inventò le formule di quadratura che prendono il suo nome e per primo introdussse quella che oggi 

conosciamo come formula di Eulero, per cui e x = cos(x) + i sin(x) nel campo complesso. 

2 Bonaventura Francesco Cavalieri (1598-1647) fu un matematico italiano. Studiò teologia e geometria. Lavorò su problemi di ottica 

e di cinematica. È famoso soprattutto per il cosiddetto principio di Cavalieri. 

Thomas Simpson (1710-1761) fu un matematico britannico, inventore della formula di quadratura per il calcolo di integrali definiti, 

sebbene questa formula fosse stata già scoperta 200 anni prima da Keplero e pare fosse usata anche da Cavalieri nel 1639 e poi riscoperta 

da James Gregory. I suoi studi riguardano anche l’astrologia. 

125


Figura 9.2: Formula di Cavalieri-Simpson: l’integrale della funzione f (zona tratteggiata in blu) viene 

approssimata mediante l’area della regione sottesa alla parabola passante per f (a), f (c) e f (b) (zona verde). 

C (2) 

0 

= 1 2 

C (2) 

1 

= 1 2 

C (2) 

2 

= 1 2 

∫ 2 

0 

∫ 2 

0 

∫ 2 

0 

L 0 (s)d s = 1 2 

L 1 (s)d s = 1 2 

L 2 (s)d s = 1 2 

∫ 2 

0 

∫ 2 

0 

∫ 2 

0 

(s − 1)(s − 2) 

d s = 1 (−1)(−2) 6 

(s)(s − 2) 

(1)(−1) d s = 4 6 

(s)(s − 1) 

d s = 1 (2)(1) 6 

La formula di Cavalieri-Simpson approssima l’integrale della f considerando come nodi x 0 = 

a, x 1 = c = a + b e x 2 = b e come pesi i coefficienti di Cotes C (2) 

0 

= 1 2 

6 , C (2) 

1 

= 4 6 , C (2) 

2 

= 1 6 , ottenendo: 

∫ b 

I = 

a 

f (x)d x ≈ (x 2 − x 0 ) 

2∑ 

i=0 

f (x i )C (2) 

i 

= b − a (f (a) + 4f (c) + f (b)) 

6 

= (b − a)( f (a) 

6 

4f (c) 

+ + f (b) 

6 6 ) 

Con la formula di Cavalieri-Simpson, dunque, l’integrale della f viene approssimato con l’integrale della 

parabola passante per i due estremi a e b e per il punto centrale dell’intervallo. 

Per quanto riguarda l’errore che si commette approssimando l’integrale della f con la formula di 

Cavalieri-Simpson, consideriamo, seguendo l’approccio visto per la formula dei trapezi, l’integrale dell’errore 

del polinomio di interpolazione di Lagrange. 

Per il polinomio di secondo grado p 2 che abbiamo considerato per interpolare la f , l’errore è dato da 

E(x) = f ′′′ (ξ x ) 

(x − a)(x − c)(x − b). 

3! 

126


Quando facciamo l’integrale, l’errore nell’approssimare l’integrale esatto con la formula di Cavalieri- 

Simpson è dunque dato da 

∫ b 

E i nt = 

a 

f ′′′ (ξ x ) 

(x − a)(x − c)(x − b)d x 

3! 

Questa volta, la funzione (x − a)(x − c)(x − b) cambia segno all’interno dell’intervallo [a,b] e non possiamo 

più applicare il teorema del valor medio come nella formula dei trapezi. In maniera più laboriosa, tuttavia, si 

ricava per l’errore la seguente formula: 

E i nt = − f IV (u) 

90 

( ) b − a 5 

= − f IV (u) 

(b − a)5 

2 2880 

dove u è un opportuno punto dell’intervallo ]a,b[. 

Osservando i valori dei coefficienti di Newton-Cotes per n = 1 e per n = 2 si può vedere come i coefficienti 

siano simmetrici e la loro somma vale 1. Questo risultato si può generalizzare per ogni n. 

9.3.2 Sull’errore della formula di Cavalieri-Simpson 

Per capire l’errore che si ha nella formula di Cavalieri-Simpson, deduciamo la stessa formula seguendo 

un’altra strada. 

Per semplificare il discorso, scegliamo l’intervallo [a,b] simmetrico rispetto all’origine, quindi del tipo 

[−t, t] con t ∈ R, sapendo che, se non fosse così, basta applicare una traslazione dell’asse x per ricondursi a 

questo caso. Scriviamo il polinomio di interpolazione che passa per i punti −t, 0 e t e che interpola anche la 

derivata prima della f in 0. 

Mediante la tabella delle differenza divise, il punto c va contato due volte e si ha: 

−t f (−t) 

f (0) − f (−t) 

0 f (0) 

t 

f ′ f (0) − f (−t) 

(0) − 

0 f (0) f ′ (0) 

t 

= t f ′ (0) − f (0) + f (−t) 

t 

t 2 

f (t) − f (0) 

− f 

f (t) − f (0) 

′ (0) 

t f (t) 

t 

= f (t) − f (0) − t f ′ (0) f (t) − 2t f ′ (0) − f (−t) 

t 

t 

t 2 

2t 3 

Il polinomio di interpolazione è, dunque 

f (0) − f (−t) 

p(x) = f (−t) + (x + t) + t f ′ (0) − f (0) + f (−t) 

t 

t 2 (x + t)x + f (t) − 2t f ′ (0) − f (−t) 

2t 3 (x + t)x 2 

L’errore di interpolazione per questo polinomio di grado 3 vale 

E(x) = f (IV ) (ξ x ) 

(x + t)x 2 (x − t) 

4! 

Quindi da f (x) = p(x) + E(x), andando a integrare tra −t e t si ha: 

∫ t 

−t 

−t 

∫ t 

∫ t 

f (x)d x = p(x)d x + E(x)d x 

−t 

−t 

Nell’integrazione del polinomio p(x) è facile vedere che i termini che dipendono da f ′ (0) portano un 

contributo nullo. Infatti 

∫ t 

( f ′ (0) 

(x + t)x − f ′ ) ∫ 

(0) 

t 

t 

t 2 (x + t)x 2 f ′ ) 

(0) 

d x = 

(x 2 + t x − x3 

t 

t − x2 d x 

−t 

= f ′ (0) 

t 

[t x2 

2 − x4 

4t 

] t 

−t 

= 0 

127


Gli integrali degli altri termini del polinomio p(x) portano alla formula di Cavalieri-Simpson. 

(omettendo i passaggi matematici) si ha 

Infatti 

∫ t 

−t 

( 

f (−t) + 

f (0) − f (−t) f (−t) − f (0) 

(x + t) + 

t 

t 2 (x + t)x + 

= 2t (f (−t) + 4f (0) + f (t)) 

6 

f (t) − f (−t) 

2t 3 (x + t)x 2 ) 

d x = 

Allora l’errore della formula di Cavalieri-Simpson coincide con l’integrale di E(x). 

Quindi E i nt = ∫ t f (IV ) (ξ x ) 

−t 

(x + t)x 2 (x − t)d x 

4! 

La funzione (x + t)x 2 (x − t) = (x 2 − t 2 )x 2 non cambia mai segno all’interno dell’intervallo [−t, t], quindi si 

può applicare il teorema del Valore Medio del calcolo integrale, per cui 

E i nt = f (IV ) (ξ) 

24 

∫ t 

−t 

(x 2 − t 2 )x 2 d x = f (IV ) [ 

(ξ) x 

5 

] t 

24 5 − t 2 x3 

3 −t 

Considerando che l’ampiezza dell’intervallo è h = 2t si ha 

E i nt = − f (IV ) (ξ) 

( h 90 2 )5 = − f (IV ) (ξ) 

2880 h5 

Troviamo la formula dell’errore per Cavalieri-Simpson. 

= − f (IV ) (ξ) 

t 5 

90 

9.4 Formule composte 

Le formule di Newton-Cotes non vanno bene su intervalli molto ampi perchè per avere risultati più accurati 

dovremmo utilizzare formule di grado elevato (in modo da utilizzare un numero elevato di punti di 

appoggio). Ci sono vari motivi che sconsigliano questa procedura: 

G i valori dei coefficienti in formule di grado elevato sono difficili da ottenere; 

G le formule di Newton-Cotes, essendo basate su polinomi di interpolazione con nodi equidistanti danno 

risultati inaccurati su intervalli ampi a causa della natura oscillatoria dei polinomi di grado elevato. 

Conviene dunque utilizzare formule di grado basso ma scomponendo l’intervallo di integrazione in più 

sottointervalli e, in ciascuno di essi, applicare la stessa formula. 

Sfruttiamo il fatto che se l’intervallo [a,b] viene diviso in n sottointervalli in modo che [a,b] = [a, x 1 ] ∪ 

[x 1 , x 2 ] ∪ [x 2 , x 3 ] ∪ ... ∪ [x n−1 ,b], allora 

∫ b 

a 

∫ x1 

∫ x2 

∫ x3 

∫ b 

f (x)d x = f (x)d x + f (x)d x + f (x)d x + ... + f (x)d x 

a 

x 1 x 2 x n 

Su ciascuno intervallo [x i−1 , x i ] per i = 1,2,...,n, approssimiamo l’integrale della f mediante una formula 

di quadratura più semplice, utilizzando pochi punti. 

9.4.1 Formula composta dei trapezi 

Suddividiamo l’intervallo [a,b] in n sottointervalli definiti dai punti d’appoggio x 0 , x 1 ,..., x n (per semplicità 

supponiamo i punti equidistanti con passo h = b − a 

n , in modo che x 0 = a e x n = b, x i = x 0 + i h, 

i = 0,...,n). 

L’integrale su [a,b] si può dunque ottenere come somma degli integrali su tali sottointervalli: 

∫ b 

a 

f (x)d x = 

n∑ 

i=1 

∫ xi 

x i−1 

f (x)d x 

128

9.4. Formule composte 

Figura 9.3: Formula composta dei trapezi, utilizzando 3 sottointervalli (4 punti). 

Ciascuno degli integrali su [x i−1 , x i ] viene approssimato utilizzando la formula dei trapezi: 

n∑ 

i=1 

∫ xi 

x i−1 

f (x)d x ≈ 

In forma estesa abbiamo 

n∑ 

i=1 

x i − x i−1 

2 

[f (x i−1 ) + f (x i )] = 

n∑ 

i=1 

I ≈ h 2 [f (x 0) + 2f (x 1 ) + 2f (x 2 ) + ... + 2f (x n−1 ) + f (x n )] 

f (a) + f (b) 

= h[ + f (x 1 ) + f (x 2 ) + ... f (x n−1 )] 

2 

h 

2 [f (x i−1) + f (x i )] 

L’errore che si commette è dato dalla somma degli errori commessi sui singoli sottointervalli 

E i nt = 

n∑ 

i=1 

−f ′′ (ξ i ) h3 

12 

Supponendo che la derivata seconda della f sia continua e limitata in [a,b] e chiamando con m e M 

rispettivamente il minimo e il massimo di f ′′ in [a,b], si ha: 

m ≤ f ′′ (ξ i ) ≤ M 

i = 1,...,n 


nm ≤ 

∑ 

n∑ 

n 

f ′′ i=1 

(ξ i ) ≤ nM =⇒ m ≤ 

f ′′ (ξ i ) 

≤ M 

n 

i=1 

Per il teorema del Valor Intermedio (teorema 2.5.5), 

qualche punto u di [a,b]. 

Applicando la relazione h = b − a , l’errore diventa 

n 

n∑ 

E i nt = 

i=1 

∑ n 

i=1 f ′′ (ξ i ) 

è un valore assunto dalla funzione in 

n 

−f ′′ (ξ i ) h3 

12 = −n f ′′ (ξ) h3 

12 = − f ′′ (ξ) 

12 (b − a)h2 = − f ′′ (ξ) 

12 

(b − a) 3 

n 2 129


Quindi per n → ∞ l’errore tende a zero come h 2 o, equivalentemente, come 1 n 2 . 

Formula composta di Cavalieri-Simpson 

Suddividiamo l’intervallo [a,b] in n sottointervalli di ampiezza costante uguale a h e su ciascuno di questi 

sottointervalli applichiamo la formula di Cavalieri-Simpson. Abbiamo, in questo modo, la formula composta 

di Cavalieri-Simpson. 

Su ogni intervallino, quindi, dobbiamo considerare gli estremi dell’intervallino e il punto centrale di esso. 

Siano a i e b i gli estremi di ciascuna suddivisione e sia c i = a i + b i 

il punto medio di ciascuna suddivisione 

2 

(quindi per i = 1,...,n). L’estremo superiore b i di ciascun intervallino, con i = 1,n − 1 coincide con l’estremo 

inferiore dell’intervallino successivo: b i = a i+1 . In tal modo, seguendo lo stesso ragionamento fatto per i 

trapezi si ha: 

∫ b 

a 

∫ b1 

∫ b2 

∫ bn 

f (x)d x = f (x)d x + f (x)d x + ... + f (x)d x 

a 1 a 2 a n 

Applicando la formula di Cavalieri-Simpson su ciascun intervallino risulta: 

∫ bi 

a i 

In tal modo 

∫ b 

a 

f (x)d x ≈ b i − a i 

6 

f (x)d x ≈ 

( 

f (ai ) + 4f (c i ) + f (b i ) ) = h 6 

n∑ h ( 

f (ai ) + 4f (c i ) + f (b i ) ) 

i=1 

6 

Si ha la formula composta di Cavalieri-Simpson. 

( 

f (ai ) + 4f (c i ) + f (b i ) ) 

Figura 9.4: Formula composta di Cavalieri-Simpson, utilizzando 3 sottointervalli (7 punti). 

130


Possiamo vedere la formula composta di Cavalieri-Simpson anche in una forma compatta. 

Considerando che, su ogni sottointervallo, dobbiamo prendere il punto medio, facciamo 

una numerazione progressiva dei punti di integrazione nel modo seguente: 

x 0 = a 

x 2i = x 0 + i h 

i = 0,...n nodi estremi dei sottointervalli 

x 2i+1 = x 0 + (i + 1 2 )h 

i = 0,...,n − 1 nodi centrali dei sottointervalli 

Quindi i nodi pari corrispondono agli estremi dei sottointervalli, mentre i nodi dispari sono 

i punti centrali di ogni sottointervallo. Per la formula di quadratura otteniamo 

∫ b 

n−1 ∑ 

∫ x2i+2 

I = f (x)d x = 

f (x)d x 

a 

i=0 

i=0 

x 2i 

n−1 ∑ h 

≈ 

6 [f (x 2i ) + 4f (x 2i+1 ) + f (x 2i+2 )] 

= h 6 [f (x 0) + 4f (x 1 ) + 2f (x 2 ) + 4f (x 3 ) + ... + 2f (x 2n−2 ) + 4f (x 2n−1 ) + f (x 2n )] 

= h n−1 

6 [f (x ∑ 

n−1 ∑ 

0) + 4 f (x 2i+1 ) + 2 f (x 2i ) + f (x 2n )] 

i=0 

i=0 

Per quanto riguarda l’errore, facendo la somma degli errori di integrazione sugli n sottointervalli, 

nell’ipotesi che la derivata quarta sia continua e limitata, si ha 3 : 

E i nt = − 1 ( ) h 5 

(f IV (ξ 1 ) + f IV (ξ 2 ) + ... + f IV (ξ n )) 

90 2 

= − h5 n−1 ∑ 

f IV (b − a)5 

n−1 ∑ 

(ξ i ) = − 

2880 

2880n 5 f IV (ξ i ) 

i=0 

i=0 

Si considera quindi il punto ξ tale che 4 

f IV (ξ) = 1 n 

n∑ 

f IV (ξ i ) 

i=1 

(b − a)5 

E i nt = − 

2880n 4 f IV (b − a)h4 

(ξ) = − f IV (ξ) 

2880 

Quindi per n → ∞ l’errore tende a zero come 

1 n 4 o, equivalentemente, come h4 . Nella formula dei trapezi 

l’errore invece decresce come 

1 . Ci aspettiamo quindi che il maggiore sforzo computazionale dia una 

n2 maggiore accuratezza nei risultati quando si applica la formula di Cavalieri-Simpson rispetto alla formula dei 

trapezi. 

3 Ricordiamo che h = b − a 

n . 

4 Si ripete lo stesso ragionamento fatto sulla derivata seconda nella formula composta dei trapezi, questa volta però sulla derivata 

quarta. Per esercizio, si consiglia di ripetere tutti i passaggi per arrivare al risultato. 

131


9.4.2 Confronti tra la formula dei trapezi e di Cavalieri-Simpson 

Esempio 9.4.1 Consideriamo f (x) = e x . Sia a = 0 e b = 1. 

Allora, per l’integrale esatto e per le formule dei trapezi e di Cavalieri-Simpson, si ha, rispettivamente: 

I = 

∫ 1 

0 

e x d x = [ e x] 1 

0 = e − 1 = 1.718281828 

I tr ap = 1 (1 + e) = 1.859140914 

2 

I C−S = 1 6 (1 + 4e1/2 + e) = 1 (1 + 6.594885083 + 2.718281828) = 1.718861152 

6 

La formula di Cavalieri-Simpson dà il risultato migliore. 

Sia ancora f (x) = e x ma gli estremi di integrazione siano a = 0.9 e b = 1. Allora 

I = 

∫ 1 

0.9 

e x d x = e − e 0.9 = 0.2586787173 

I − I tr ap = I − 0.1 

2 (e0.9 + e) = −2.2 × 10 −4 

I − I C−S = I − 0.1 

6 (e0.9 + 4e 0.95 + e) = −9.0 × 10 −9 

Ora la formula di Cavalieri-Simpson si rivela particolarmente accurata. Ciò non deve sorprendere se si va 

a vedere la formula dell’errore, con l’ampiezza dell’intervallo che da 1 si è ridotta a 0.1, per cui (b − a) 5 da 1 

vale ora 10 −5 . 

Considerato che f ′′ = f e f IV = f , queste derivate possono essere maggiorate dal valore assunto nell’estremo 

superiore dell’intervallo, cioè e. Quindi gli errori delle formule dei trapezi e di Cavalieri-Simpson sono 

maggiorate da 

|E tr ap | ≤ e 

12 (b − a)3 = 2.265 × 10 −1 (b − a) 3 

|E C−S | ≤ e 

2880 (b − a)5 = 9.438 × 10 −4 (b − a) 5 

Perciò per a = 0 e b = 1 gli errori sono maggiorati da 

|E tr ap | = 2.265 × 10 −1 

|E C−S | = 9.438 × 10 −4 

Invece per a = 0.9 e b = 1, poichè b − a = 0.1 = 10 −1 , abbiamo 

|E tr ap | = 2.265 × 10 −1 · 10 −3 = 2.265 × 10 −4 

|E C−S | = 9.438 × 10 −4 · 10 −5 = 9.438 × 10 −9 

Esempio 9.4.2 Si voglia approssimare l’integrale a 

∫ 1 

0 

e −x2 d x ≈ 0.746824. 

a È un integrale che non può essere risolto analiticamente. Se si vuole calcolare una sua approssimazione senza 

fare uso di formule di quadrature, possiamo, ad esempio, pensare di applicare la definizione di integrale ∫ b 

a f (x)d x = 

∑ 

lim n n→∞ f (a + i h(n)) · h(n), con h(n) = (b − a)/n, e considerare come approssimazione dell’integrale la somma parziale 

∑ i=0 

n 

i=0 f (a + i h(n)) · h(n) con un valore di n molto grande. Per esempio, con n = 107 otteniamo il valore 0.74682420125254. 

132


Suddividiamo l’intervallo [0,1] in 4 sottointervalli. Sia h = 1/4 = 0.25. Per la formula composta dei trapezi 

abbiamo 

I tr ap = h 2 [e0 + 2e −h2 + 2e −(2h)2 + 2e −(3h)2 + e −(4h)2 ] 

= 0.125[1 + 2e −0.1252 + 2e −0.52 + 2e −0.752 + e −1 ] 

= 0.742984 

Applichiamo ora la formula di Cavalieri-Simpson su soli 2 sottointervalli, in modo da valutare la funzione 

negli stessi punti precedenti. L’ampiezza di ciascun sottointervallo è dunque h = 0.5. 

I C−S = h 6 [e0 + 4e −(h/2)2 + 2e −(h)2 + 4e −( 3 2 h)2 + e −(2h)2 ] 

= 0.25 

3 [1 + 4e−0.1252 + 2e −0.52 + 4e −0.752 + e −1 ] 

= 0.746855 

A parità di punti (e non di sottointervalli) la formula di Cavalieri-Simpson è più accurata di quella dei 

trapezi. 

Invece considerando 4 sottointervalli nella formula di Cavalieri-Simpson dobbiamo considerare anche i 

punti interni di ascisse 0.125, 0.375, 0.625, 0.875 e il risultato che otteniamo è 0.746826, evidentemente 

maggiormente accurato. 

Esempio 9.4.3 Riprendiamo l’esempio visto all’inizio del Capitolo, in cui è misurata la velocità di 

un’automobile ogni 6 secondi e si vuole calcolare la lunghezza percorsa dalla macchina. 

In base ai dati in possesso, possiamo applicare la formula composta dei trapezi su 14 intervalli di ampiezza 

h = 6 secondi. Abbiamo (ponendo v 1 = v(0), v 2 = v(6), . . . , v 13 = v(78), v 14 = v(84)): 

( v1 + v 

) 14 

L = 6 + v 2 + v 3 + ... + v 13 = 3009 metri 

2 

Possiamo anche applicare la formula di Cavalieri-Simpson, considerando ora 7 intervalli di ampiezza pari 

a h = 12 secondi. In tal caso, otteniamo: 

L = 2(v 1 + 4v 2 + 2v 3 + 4v 4 + 2v 5 + ... + 2v 12 + 4v 13 + v 14 ) = 3010 metri 

In questo caso entrambi i risultati sono accettabili. 

Se la funzione integranda ha le derivate che sono facili da determinare e da maggiorare, la formula dell’errore 

può essere utile per determinare il numero di sottointervalli su cui applicare una formula composta 

di quadratura in modo da ottenere un’approssimazione con un errore minore di una tolleranza prefissata. 

Esempio 9.4.4 Consideriamo ∫ 1 

0 e−x2 d x. In quanti sottointervalli bisogna suddividere l’intervallo di integrazione 

per applicare la formula dei trapezi e di Cavalieri-Simpson e ottenere un errore che sia minore di 

una tolleranza ɛ = 10 −5 ? 

Per i trapezi, l’errore è maggiorato da 

|E tr ap | ≤ max 0≤x≤1 |f ′′ (x)| (b − a) 3 

12 

n 2 

Per Cavalieri-Simpson si ha 

|E C−S | ≤ max 0≤x≤1 |f IV (x)| (b − a) 5 

2880 

n 4 133


Da f (x) = e −x2 abbiamo, per le derivate: 

f ′ (x) = −2xe −x2 

f ′′ (x) = (−2 + 4x 2 )e −x2 

f ′′′ (x) = (12x − 8x 3 )e −x2 

f IV (x) = (12 − 48x 2 + 16x 4 )e −x2 

Si trova che il massimo di |f ′′ | e |f IV | in [0,1] è dato dal loro valore in x = 0, quindi abbiamo: 

|E tr ap | ≤ 2 

12n 2 = 1 

6n 2 |E C−S | ≤ 12 

2880n 4 = 1 

240n 4 

La richiesta dell’accuratezza per l’errore diventa: 

|E tr ap | ≤ 10 −5 |E C−S | ≤ 10 −5 

vale a dire, rispettivamente, 

1 

6n 2 ≤ 10−5 1 

240n 4 ≤ 10−5 

Per i trapezi, il primo intero n che verifica la disuguaglianza è n = 130, per Cavalieri-Simpson si ha, invece, 

n = 5. 

Applicando le formule su 130 intervalli per i trapezi e su 5 intervalli per Cavalieri-Simpson, otteniamo i 

risultati: 

I tr ap = 0.74682050480289 I C−S = 0.7468249482544 

9.5 Estrapolazione di Richardson 

Applichiamo la formula di Cavalieri-Simpson sull’intero intervallo [a,b]. L’errore che si commette, come 

sappiamo, vale 

E 1 = − f IV (ξ 1 ) 

90 

( ) b − a 5 

= − f IV (ξ 1 ) 

(b − a)5 

2 2880 

Suddividiamo ora l’intervallo [a,b] in due sottointervalli e applichiamo la formula composta di Cavalieri- 

Simpson. L’errore che otteniamo vale 

E 2 = − f IV (ξ 2 ) (b − a) 5 

2880 2 4 ≈ E 1 

16 

supponendo che le derivate quarte della f non siano molto diverse tra loro. 

L’errore, quindi, diventa 16 volte più piccolo passando dalla formula di Cavalieri-Simpson in un intervallo 

alla formula applicata in due sottointervalli. 

Sia I il valore esatto dell’integrale e Q 1 e Q 2 i due valori approssimati ottenuti considerando la formula 

di Cavalieri-Simpson con n = 1 e n = 2 sottointervalli. Sia ɛ l’errore, cambiato di segno, che si ha con n = 2, 

ɛ = −E 2 = −E 1 /16. Possiamo scrivere 

I + ɛ = Q 2 per n = 2 

I + 16ɛ = Q 1 per n = 1 

134

9.6. Approssimazione di Romberg 

Si può ricavare ɛ dalle due relazioni ottenendo 


ɛ = Q 1 −Q 2 

15 

I ≈ Q 2 + Q 2 −Q 1 

15 

Utilizzando le due approssimazioni Q 1 e Q 2 possiamo approssimare l’integrale esatto con una maggiore accuratezza 

mediante la formula appena scritta. Questo procedimento prende il nome di estrapolazione di 

Richardson. Può essere utilizzato per migliorare l’approssimazione di un integrale ma è basato sull’ipotesi 

che le derivate quarte della funzione integranda siano circa uguali e, quindi, va usato con cautela. 

9.6 Approssimazione di Romberg 

Ripetendo lo stesso discorso dell’estrapolazione di Richardson a partire dalla formula dei trapezi e in 

maniera sistematica, si ha l’approssimazione di Romberg. 

Supponiamo l’uguaglianza delle derivate seconde della funzione integranda f e sia 2 m il numero di 

sottointervalli in cui suddividiamo il dominio di integrazione [a,b]. 

Applicando la formula dei trapezi su 2 m−1 sottointervalli e, successivamente, su 2 m sottointervalli, l’errore 

diminuisce come 1/4. Chiamando con A m e A m−1 i risultati della formula dei trapezi rispettivamente su 2 m 

e su 2 m−1 sottointervalli e chiamando con ɛ l’errore cambiato di segno commesso con 2 m sottointervalli, 

abbiamo: 

I + ɛ = A m 

I + 4ɛ = A m−1 

L’integrale può essere dunque migliorato con il valore 

B m = A m + A m − A m−1 

. 

3 

Per m = 1 si ha: 

A 0 = b − a [f (a) + f (b)] si ha un unico intervallo 

2 

A 1 = b − a 

2 [ f (a) 

2 + f ( a + b 

2 ) + f (b) ] si hanno 2 sottointervalli 

2 

B 1 = (b − a)[ f (a) 4f ( a + b 

6 + 2 ) 

6 

) + f (b) 

6 ] 

Si ha dunque che B 1 (e quindi ciascun B m ) corrisponde al valore ottenuto con la formula di Cavalieri- 

Simpson. L’errore ottenuto con B m è dunque proporzionale a 1/n 4 . Nel passo successivo, utilizzando i valori 

B m , otteniamo la nuova approssimazione data da 

C m = B m + B m − B m−1 

15 

per m ≥ 2 

Si può dimostrare che C m coincide con la formula di Newton-Cotes con n = 4, dove l’errore è proporzionale 

a 1/n 6 e alla derivata sesta di f. 

La nuova approssimazione è data da: 

D m = C m + C m −C m−1 

63 

per m ≥ 3 

135


L’errore ora diventa proporzionale a 1/n 8 ma D m non è più un risultato delle formule di Newton-Cotes. Il 

procedimento può andare avanti per calcolare E m , F m , etc tenendo presente che al denominatore dobbiamo 

mettere il valore 4(d + 1) − 1 dove d è il valore del denominatore della formula precedente. 

Il vantaggio dell’approssimazione di Romberg si vede solo ai primi livelli dell’applicazione (in particolare 

passando da A m a B m ). Inoltre, a causa della precisione finita con cui sono eseguiti i calcoli, le formule di 

Romberg di ordine elevato diventano inefficaci se il risultato iniziale A m è già abbastanza accurato rispetto 

alla precisione numerica consentita. 

9.7 Introduzione alle formule di quadratura di Gauss 

Consideriamo di voler approssimare l’integrale dato da 

∫ b 

a 

f (x)w(x) d x 

dove [a,b] può essere finito o infinito (per esempio [−1,1], [0,+∞]). Abbiamo due funzioni, la f (x) e la w(x), 

e vogliamo integrare il prodotto di queste due funzioni. La funzione w(x), che chiamiamo funzione peso, sia 

positiva (w(x) ≥ 0). 

Vogliamo trovare dei coefficienti w i , i = 0,...n (detti pesi della formula di quadratura) e dei nodi x i , i = 

0,...n (detti nodi di quadratura) nell’intervallo [a,b] in modo da approssimare l’integrale mediante 

∫ b 

a 

f (x)w(x) d x ≈ 

n∑ 

w i f (x i ) 

0=1 

Considerando anche l’errore di quadratura: 

∫ b 

a 

f (x)w(x) d x = 

n∑ 

w i f (x i ) + E i nt (f ) 

i=0 

Diremo che la formula di quadratura ha un grado di precisione (o esattezza) polinomiale d se E i nt (f ) = 0 

per tutti i polinomi f fino al grado d (cioè se applichiamo la formula di quadratura per approssimare 

∫ b 

a 

f (x)w(x) d x con f polinomio di grado d, l’errore è nullo). Osserviamo che ora non stiamo parlando di 

formule di quadratura composte quindi n non si riferisce a suddivisioni dell’intervallo [a,b]. Per le formule 

di Newton-Cotes, si ha w(x) ≡ 1 e si può provare che il grado di precisione d è: 

d = n per le formule ottenute da polinomi di interpolazione di grado n dispari (come nei Trapezi: n = 1) 

G d = n + 1 per le formule ottenute da polinomi di interpolazione di grado n pari (come in Cavalieri- 

Simpson: n = 2) 

Diremo che la formula di quadratura è interpolatoria se vale d = n . Le formule interpolatorie sono ottenute 

per interpolazione, percorrendo la stessa strada che abbiamo visto per le formule di Newton-Cotes. 

Interpoliamo la funzione f mediante un polinomio di grado n, utilizzando i polinomi di Lagrange. Nel costruire 

i pesi dobbiamo tenere conto anche della funzione w e quindi i pesi saranno w i = ∫ b 

a L i (x)w(x) d x 

dove L i (x) è l’i -simo polinomio di Lagrange. 

Con questo approccio la formula di quadratura che ricaviamo ha al più grado di precisione d = n (o 

d = n + 1 quando w(x) ≡ 1 e per n pari, come abbiamo visto per le formule di Newton-Cotes). 

È possibile ricavare formule di quadratura che abbiano un grado di precisione d maggiore del grado del 

polinomio interpolante? E se sì come? 

A tal fine consideriamo il polinomio dei nodi F (x) = ∏ n 

i=0 (x − x i ), di grado n + 1, lo stesso che abbiamo 

introdotto nel Capitolo sull’interpolazione. 

Vale il seguente teorema. 

Teorema 9.7.1 (di W. Gautschi) Dato un intero k con 0 < k ≤ n + 1, la formula di quadratura 

∫ b 

a 

f (x)w(x) d x = 

n∑ 

w i f (x i ) + E i nt (f ) 

i=0 

ha grado di precisione (esattezza) d = n + k se e solo se sono soddisfatte entrambe le condizioni (a) e (b): 

136

9.7. Introduzione alle formule di quadratura di Gauss 

(a) la formula è interpolatoria; 

(b) il polinomio dei nodi F (x) soddisfa la relazione ∫ b 

a 

F (x)p(x)w(x) d x = 0 per ogni polinomio p di grado 

≤ k − 1. 

Osserviamo che la condizione in (b): 

G impone k condizioni sui nodi x 0 , x 1 , x 2 ,... x n . Se fosse k = 0 non ci sarebbero condizioni in più da 

considerare e avremmo d = n (cioè esattezza d = n); 

G fornisce una relazione di ortogonalità: il polinomio F è ortogonale ai polinomi di grado ≤ k −1 rispetto 

alla funzione peso w. 5 

Nel caso specifico, il punto (b) dice che: 

∫ b 

a 

∫ b 

a 

∫ b 

a 

∫ b 

a 

F (x)w(x) d x = 0 

xF (x)w(x) d x = 0 

x 2 F (x)w(x) d x = 0 

. 

x k−1 F (x)w(x) d x = 0 

G fa sì che k non possa essere maggiore o uguale a n + 2. Se fosse infatti k = n + 2, il punto (b) sarebbe: 

(b) il polinomio dei nodi F (x) soddisfa la relazione ∫ b 

a 

F (x)p(x)w(x)d x = 0 per ogni polinomio p di 

grado ≤ k − 1 = n + 1. 

Allora, si potrebbe prendere come polinomio p(x) esattamente F (x) (che ha grado n + 1) e, per la 

(b) sarebbe ∫ b 

a (F (x))2 w(x)d x = 0: ma questo è un assurdo perchè l’integrale di una funzione positiva 

non può essere nullo, e, nel nostro caso, w(x) è positiva e (F (x)) 2 , essendo il quadrato di un polinomio, 

è pure essa una funzione positiva. 

Il caso ottimale (il più alto grado di precisione che si può ottenere), si ha per k uguale al valore massimo che 

può assumere, vale a dire k = n + 1. In tal caso d = n + k = n + n + 1 = 2n + 1. Si hanno le cosiddette formule 

di Gauss. 

A seconda della scelta della funzione peso w e dell’intervallo [a,b] abbiamo diverse formule di Gauss. 

Dimostrazione. 

[del teorema di W. Gautschi] 

Dimostriamo che se d = n + k allora sono vere la (a) e la (b) (necessità). Essendo d = n + k 

la formula è esatta anche per polinomi di grado n: abbiamo dimostrato il punto (a). 

Se p è un polinomio di grado al più k − 1, allora F (x)p(x) è un polinomio (perchè prodotto 

di due polinomi) di grado al più n + 1 + k − 1 = n + k. Applichiamo a questo polinomio 

prodotto la formula di quadratura (che è esatta valendo l’ipotesi che d = n + k, quindi 

E i nt (F (x)p(x)) = 0). Quindi 

∫ b 

n∑ 

F (x)p(x)w(x) d x = F (x i )p(x i )w i . 

a 

i=0 

Ma F (x i ) = 0 essendo F il polinomio dei nodi. Perciò ∑ n 

i=0 F (x i )p(x i )w i = 0 

5 Per definizione, infatti, due funzioni u e v si dicono ortogonali rispetto alla funzione peso w (positiva), se ∫ b 

a u(x)v(x)w(x) d x = 0. 

137


Di conseguenza ∫ b 

a F (x)p(x)w(x) d x = ∑ n 

i=0 F (x i )p(x i )w i = 0 e quindi il punto (b) è provato. 

Supponiamo ora che siano vere le condizioni (a) e (b) e dimostriamo che d = n + k (sufficienza). Sia p un 

polinomio di grado n +k. Dobbiamo provare che E i nt (p) = 0. Dividiamo il polinomio p per il polinomio F : 

possiamo scrivere p(x) = F (x)q(x)+r (x) dove q(x) (quoziente) è un polinomio di grado k −1 e r (x) (resto) è 

un polinomio di grado n. Nel fare l’integrale, abbiamo 

∫ b 

a 

p(x)w(x) d x = 

∫ b 

a 

q(x)F (x)w(x) d x + 

∫ b 

a 

r (x)w(x) d x 

Il primo integrale a secondo membro vale zero a motivo dell’ipotesi (b) (q(x) è un polinomio di grado k − 1 

e quindi quell’integrale è zero). Il secondo integrale, invece, per la (a) può essere calcolato esattamente 

andando ad applicare la formula di quadratura (essendo r di grado n ed essendo la formula interpolatoria 

si ha E i nt (r ) = 0 ). Si ha 

∫ b 

∫ b 

n∑ 

p(x)w(x) d x = r (x)w(x) d x = r (x i )w i 

a 

a 

Ma r (x i ) = p(x i ) − q(x i )F (x i ) = p(x i ) (essendo F (x i ) = 0). Quindi 

∫ b 

∫ b 

n∑ 

p(x)w(x) d x = r (x)w(x) d x = p(x i )w i 

a 

a 

i=0 

i=1 

L’errore è dunque zero e la dimostrazione è completata. ✔ 

Da un punto di vista teorico la condizione (a) del teorema permette di calcolare i pesi delle formule di Gauss: 

essendo la formula interpolatoria si ha w i = ∫ b 

a L i (x)w(x) d x. 

La condizione (b) permette di calcolare i nodi x i della formula (imponendo l’ortogonalità tra F (x) e i 

polinomi di grado k = 0,1,2,...,n si ricava un sistema di n + 1 equazioni nelle incognite dei coefficienti 

del polinomio F (x). Una volta trovato il polinomio F (x) ricaviamo le radici, che sono appunti i nodi di 

integrazione 6 . 

9.7.1 Proprietà delle formule di Gauss 

Scriviamo le formule di Gauss con la notazione 

∫ b 

a 

f (x)w(x) d x = 

n∑ 

w i f (x i ) + E G i nt (f ) 

i=0 

Si ha E G (f ) ≡ 0 per f polinomio di grado ≤ 2n + 1 

i nt 

I nodi x i sono reali, distinti e contenuti nell’intervallo aperto ]a,b[. 

I pesi w i sono tutti positivi. 

Infatti, per j = 0,1,...n 0 < ∫ b 

a (L j (x)) 2 w(x) d x = ∑ n 

i=0 w i (L j (x i )) 2 

(l’errore è nullo perchè (L j (x)) 2 è un polinomio di grado 2n). Ma L j (x i ) = 0 se i ≠ j e L j (x i ) = 1 se i = j . 

Quindi ∑ n 

i=0 w i (L j (x i )) 2 = w j . Abbiamo provato che i pesi sono positivi. 

Le formule di Gauss si possono ricavare mediante interpolazione (detta di Hermite) sui nodi x i contati 

ciascuno come nodo doppio nel senso che su ciascun nodo imponiamo la condizione di interpolazione non 

solo sulla f ma anche sulla derivata prima della f . Una volta che abbiamo ricavato il polinomio di interpolazione 

p(x) (che interpola quindi per ogni nodo sia la f sia la f ′ ) e approssimato ∫ b 

f (x)w(x) d x mediante 

∫ b 

a 

p(x)w(x) d x, dalla formula che ricaviamo imponiamo che i termini che contengono la derivata prima 

siano uguali a zero (questa osservazione è dovuta a Markov, matematico russo, nel 1885). 

La formula che otteniamo (considerando che il polinomio interpola la f e la f ′ ) avrà termini del tipo: 

∫ b 

a f (x)w(x) d x = ∑ n 

i=0 w i f (x i ) + ∑ n 

i=0 C i f ′ (x i ) + E G i nt (x) 

6 Ricordiamo che un polinomio di grado n + 1 lo possiamo scrivere come a n+1 x n+1 + a n x n + ··· + a 0 ma possiamo anche dividere 

per il coefficiente di grado massimo e scriverlo in forma cosiddetta monica x n+1 + b n x n + b n−1 x n−1 + ... + b 0 , e avere quindi solo n + 1 

coefficienti (b 0 , b 1 , . . . , b n ) : le radici dei due polinomi non cambiano. 

a 

138

9.7. Introduzione alle formule di quadratura di Gauss 

Imponendo C i = 0 i = 0,1,2,...n, otteniamo n + 1 condizioni che ci permettono di ricavare i valori di x i (i 

nodi di integrazione della formula). Possiamo poi ricavare il valore dei pesi w i (che dipendono a loro volta dai 

nodi). Nel procedere con l’interpolazione sui valori della f e della f ′ , l’errore del polinomio di interpolazione 

si può scrivere come E = (F (x)) 2 f (2(n+1)) (ξ x ) 

(poichè ogni nodo è contato due volte, e supponendo che la f 

(2(n + 1))! 

sia derivabile 2(n + 1) volte e sia continua). 

Di conseguenza, l’errore nella formula di integrazione (applicando il teorema del Valor Medio in quanto 

(F (x)) 2 w(x) non cambia segno nell’intervallo di integrazione) si può scrivere come E G i nt 

E G i nt (x) = f (2(n+1)) (ξ) 

(2(n + 1))! 

∫ b 

a 

(F (x)) 2 w(x) d x 

9.7.2 Formule di Gauss-Legendre 

A seconda della funzione peso, si ha una particolare formula di Gauss. 

In genere i nodi di integrazione sono calcolati su intervalli “canonici” (spetta a noi fare il cambio di 

variabili se l’integrale è da farsi su altri intervalli).. 

Per w(x) ≡ 1 e [a,b] ≡ [−1,1] si ha la formula di Gauss-Legendre. 

I nodi della formula di quadratura, sono le radici dei cosiddetti polinomi di Legendre. 

n + 1 nodi pesi 

2 x 0,1 = ±0.57735026918962576 w 0 = w 1 = 1.0 

3 x 0 = −0.77459666924148338 w 0 = 5/9 = 0.5555555556 

x 1 = 0 w 1 = 8/9 = 0.8888888889 

x 2 = 0.77459666924148338 w 2 = 5/9 = 0.5555555556 

4 x 0 = −0.86113631159405257 w 0 = 0.3478548451374538 

x 1 = −0.33998104358485626 w 1 = 0.6521451548625461 

x 2 = 0.33998104358485626 w 2 = 0.6521451548625461 

x 3 = 0.86113631159405257 w 3 = 0.3478548451374538 

I polinomi di Legendre (e, come essi, anche tutti gli altri polinomi le cui radici sono i nodi delle altre 

formule di Gauss) hanno la caratteristica di essere polinomi mutuamente ortogonali (nel senso che presi 

due polinomi di Legendre, che chiamiamo ω n (x) e ω m (x), rispettivamente di grado n e m, con n ≠ m, si ha 

∫ b 

a ω n(x)ω m (x)w(x) d x = 0). 

I polinomi di Legendre (e, come essi, i polinomi delle altre formule di Gauss), si ricavano mediante formule 

ricorsive, cioè ogni polinomio di Legendre di grado n è legato (mediante una relazione opportuna) ai 

polinomi di Legendre di grado n − 1 e n − 2. 

9.7.3 Altre formule di Gauss 

1 

G Con w(x) = √ e [a,b] = [−1,1] si hanno le formule di Gauss-Chebychev (prima specie) in 

(1 − x 2 ) 

quanto i nodi di integrazione sono le radici dei cosiddetti polinomi di Chebychev di prima specie. 

G Con w(x) = √ (1 − x 2 ) e [a,b] = [−1,1] si hanno le formule di Gauss-Chebychev (seconda specie) in 

quanto i nodi di integrazione sono le radici dei cosiddetti polinomi di Chebychev di seconda specie. 

G Con w(x) = (1 − x) α (1 + x) β (per α > −1 e β > −1) e [a,b] = [−1,1] si hanno le formule di Gauss-Jacobi. 

G Con w(x) = x α e −x (per α > −1) e [a,b] = [0,+∞] si hanno le formule di Gauss-Laguerre. 

G Con w(x) = e −x2 e [a,b] = [−∞,+∞] si hanno le formule di Gauss-Hermite. 

139


Figura 9.5: Funzioni peso per le formule di quadratura di Gauss-Chebycev di prima e seconda specie (a 

sinistra e a destra rispettivamente) 

Figura 9.6: Funzioni peso per le formule di quadratura di Gauss-Jacobi (con α = 2 e β = 4) e di Gauss-Laguerre 

(con α = 2) (a sinistra e a destra rispettivamente) 

Figura 9.7: Funzione peso per le formula di quadratura di Gauss-Hermite. 

9.7.4 Applicazione delle formule 

Supponiamo di voler approssimare un integrale utilizzando le formule di Gauss-Legendre, ma in un 

intervallo diverso da [−1,1]. 

Dobbiamo fare un cambio di variabili. Da ∫ b 

a f (x) d x dobbiamo passare a ∫ 1 

−1 

f (t) d t. 

Poniamo x = b − a 

2 t + b + a 

2 

Per t = −1 si ha x = b − a 

2 (−1) + b + a = −b + a + b + a = 2a = a. Quindi per t = −1, si ha x = a (il primo 

2 

2 

2 

estremo di un intervallo viene trasformato nel primo estremo dell’altro intervallo). 

Per t = 1 si ha x = b − a 

2 (1) + b + a = b − a + b + a = 2b 2 

2 2 = b. 

Perciò, per t = 1, si ha x = b. 

Inoltre d x = b − a d t. Con la trasformazione di variabili si ha: 

2 

∫ b 

∫ 1 

( b − a 

f (x) d x = f 

a 

−1 2 t + b + a ) b − a 

d t 

2 2 

140


Applicando la formula di Gauss-Legendre 

∫ b 

a 

f (x) d x ≈ b − a 

2 

n∑ 

w G i 

i=0 

f ( b − a 

2 x i + b + a 

2 ) 

9.7.5 Sulla funzione peso 

Supponiamo di voler integrare una funzione g (x) in [a,b] (intervallo finito). Supponiamo che la funzione 

integranda g abbia una singolarità algebrica agli estremi (con una certa molteplicità), possiamo scrivere 

g (x) = f (x)(b − x) α (x − a) β 

Adesso, facciamo un cambiamento di variabile, da [a,b] a [−1,1], considerando la trasformazione x = 

b − a 

2 t + b + a 

2 . 

Si ha (b − x) = b − a 

b − a 

(1 − t) e (x − a) = (1 + t). 

2 2 

Allora 

∫ b 

a g (x) d x = b − a 

∫ 1 

−1 f ( b − a 

) α ( ) b − a β 

(1 − t) α (1 + t) β d t 

2 

2 

2 t + b + a ( b − a 

2 ) 2 

( ) b − a α+β+1 

∫ 1 

= 

−1 

2 

f ( b − a 

2 t + b + a 

2 )(1 − t)α (1 + t) β d t 

Posso applicare le formule di Gauss-Jacobi e “scaricare” sulla funzione peso le singolarità della funzione 

di partenza. 

Sia dato l’integrale ∫ 1 

0 f (x)(1 − x)p d x con f regolare e p intero elevato: allora (1 − x) p è una funzione che 

ha valori vicini a zero. La funzione da integrare è quasi discontinua e le formule classiche (Trapezi o Cavalieri- 

Simpson) non danno buoni risultati. Si può pensare a questo integrale come ad un integrale di tipo Jacobi (su 

cui applicare la formula di Gauss-Jacobi) con α = p e β = 0. Si fa l’opportuno passaggio di variabili in modo 

da integrare sull’intervallo [−1,1]. La formula di Gauss incorpora nella funzione peso la parte che riguarda 

(1 − x) p . 


Esercizio 9.8.1 Sia dato l’integrale I = 

∫ 0 

−2 

e −x (x + 1) dx. 

(a) Approssimare il valore dell’integrale applicando la formula dei trapezi con n = 5 suddivisioni in parti 

uguali dell’intervallo di integrazione. 

(b) Trovare una maggiorazione dell’errore commesso e, dopo aver calcolato analiticamente l’integrale 

esatto, confrontare tale stima con l’errore esatto. 

Svolgimento 

(a) Applichiamo la formula dei trapezi con n = 5 suddivisioni dell’intervallo dato. Vale, dunque, h = 0.4. I 

punti da considerare e il valore della f (x) = e −x (x + 1), sono: 

i x i f (x i ) 

0 -2 -7.3890561 

1 -1.6 -2.97181945 

2 -1.2 -0.664023385 

3 -0.8 0.445108186 

4 -0.4 0.895094819 

5 0 1 

141


La formula dei trapezi è 

I tr ap = h( f (x 0) + f (x 5 ) 

+ f (x 1 ) + f (x 2 ) + f (x 3 ) + f (x 4 )) = −2.19606715 

2 

(b) Per calcolare una maggiorazione dell’errore commesso, dobbiamo calcolare la derivata seconda della 

f . 

Da f (x) = e −x (x + 1) segue f ′ (x) = −e −x (x + 1) + e −x = −e −x x e f ′′ (x) = e −x x − e −x = e −x (x − 1). 

Poichè f ′′ (x) è sempre negativa nell’intervallo di integrazione e a noi interessa la funzione valore 

assoluto della f ′′ (x), studiamo la funzione g (x) = |f ′′ (x)| = e −x (1 − x). Si ha che g ′ (x) = e −x (x − 2) < 0 

in [−2,0], quindi g è decrescente e ha valore massimo per x = −2. Si ha dunque che M = max|f ′′ (x)| = 

|f ′′ (−2)| = 22.1671682968 

Quindi |E tr ap | ≤ M |(b − a)3 | 

12 · 5 2 = 0.591124488 

Analiticamente, è facile calcolare l’integrale esatto (per parti): 

∫ 0 

∫ 0 

I = f (x) dx = −e −x (x + 1)| 0 −2 + e −x dx = −e −x (x + 2)| 0 −2 = −2 

−2 

−2 

Quindi l’errore esatto è: |I − I tr ap | = 0.196067154, un valore minore della maggiorazione trovata 

prima. 

Esercizio 9.8.2 Sia dato l’integrale 

∫ 2 

2 

0 x − 4 d x 

(a) Dare una sua approssimazione con la formula dei trapezi e n = 4 suddivisioni in parti uguali 

dell’intervallo di integrazione. 

(b) Trovare una maggiorazione dell’errore commesso. 

(c) Confrontare l’errore esatto con la stima precedentemente trovata. 

(d) Dire in quanti sottointervalli occorre suddividere l’intervallo di integrazione per ottenere una 

maggiorazione dell’errore minore della tolleranza ɛ = 10 −5 . 

Svolgimento 

(a) Suddividendo l’intervallo di integrazione [0,2] in n = 4 parti si trova un passo h = 2/4 = 1/2 = 0.5. 

La formula dei trapezi è: 

I T = b − a f (a) + f (b) 

( + f (x 1 ) + f (x 2 ) + f (x 3 )) 

n 2 

f (0) + f (2) 

= 0.5( + f (0.5) + f (1) + f (1.5)) 

2 

= 0.5( −0.5 − 1 − 0.571428571 − 0.666666667 − 0.8) 

2 

= −1.39404762 

(b) Consideriamo la formula dell’errore: E = − f ′′ (ξ) (b − a) 3 

12 n 2 

Da f (x) = 2 

x − 4 segue f ′ (x) = 

−2 

(x − 4) 2 e f ′′ 4 

(x) = 

(x − 4) 3 . 

Per maggiorare l’errore dobbiamo considerare che vale 

|E| ≤ max 0≤x≤2 |f ′′ (x)| (b − a) 3 

12 

n 2 , da cui dobbiamo calcolare M = max 0≤x≤2 |f ′′ (x)|. 

142


La funzione (x −4) 3 4 

è continua, crescente e sempre negativa nell’intervallo [0,2]. Quindi | 

(x − 4) 3 | = 

4 

(4 − x) 3 : osserviamo il cambiamento al denominatore. Poniamo g (x) = 4 

(4 − x) 3 . Risulta g ′ (x) = 

12 

(4 − x) 4 > in [0,2], quindi la g è crescente e ha valore massimo per x = 2. Perciò M = max 0≤x≤2 |f ′′ (x)| = 

|f ′′ (2)| = 4 2 3 = 1/2 = 0.5. Si ha allora la maggiorazione dell’errore |E| ≤ M 12 

(c) L’integrale esatto si calcola facilmente: 

2 3 

4 2 = 1 

48 = 0.0208333333 

∫ 2 

I = 

0 

2 

x − 4 d x = 2ln(|x − 4|)|2 0 = 2ln(| − 2|) − 2ln(| − 4|) = 2ln(1/2) = ln(1/4) − 1.386294361 

L’errore esatto commesso con la formula dei trapezi è |I − I T | = 0.00775325793 

(d) Perchè la maggiorazione dell’errore sia minore della tolleranza ɛ = 10 −5 deve essere |E| ≤ M 12 n 2 ≤ 10−5 

cioè n 2 ≥ M 12 23 10 5 = 105 = 33333.333333. Quindi n > 182.574186, vale a dire n = 183. 

3 

2 3 

Esercizio 9.8.3 Dato l’integrale 

∫ 0.5 

1 

I = d x 

1 − x 

2 

0 

(a) si approssimi I con i valori Q 1 e Q 2 ottenuti applicando il metodo di Cavalieri-Simpson prima a tutto 

l’intervallo e poi suddividendo l’intervallo in due parti uguali; 

(b) si approssimi I usando la formula di estrapolazione di Richardson; 

(c) dopo aver calcolato analiticamente il valore esatto di I , determinare l’errore esatto commesso con 

l’estrapolazione di Richardson. 

Svolgimento 

(a) Applichiamo la formula di Cavalieri-Simpson su tutto l’intervallo, considerando che l’ampiezza 

dell’intervallo è b − a = 0.5 e h = 0.25 

Q 1 = 0.25 (f (0) + 4f (0.25) + f (0.5)) = 0.523823565 

3 

Si ha, infatti, f (0) = 1, f (0.25) = 1.03279556 e f (0.5) = 1.15470054. 

Suddividendo l’intervallo in due parti uguali, abbiamo h = 0.125, da cui i punti: x 0 = a = 0, x 1 = 

0.125, x 2 = 0.25, x 3 = 0.375, e x 4 = b = 0.5. 

Q 2 = h 3 (f (x 0) + 4(f (x 1 ) + 4f (x 3 )) + 2f (x 2 ) + f (x 4 )) = 0.523616326 

dove f (0.125) = 1.00790526, f (0.375) = 1.07871978 (essendo già in possesso degli altri valori, calcolati 

per Q 1 ) 

(b) La formula di estrapolazione di Richardson è: Q 3 = Q 2 + Q 2 −Q 1 

da cui ricaviamo Q 3 = 0.5236025101 

15 

(c) Analiticamente l’integrale esatto è: 

∫ 0.5 

1 

I = d x = 

0 1 − x 

2 arcsin(x)|0.5 0 = π/6 − 0 = 0.523598775 

L’errore esatto commesso con l’estrapolazione di Richardson è: |I −Q 3 | = 3.7351 · 10 −6 . 

143


Esercizio 9.8.4 Si calcoli I = ∫ 5 

2 sin( x) d x utilizzando il metodo di Gauss-Legendre con 3 punti di 

appoggio (x 1 = − (3/5), x 2 = 0, x 3 = (3/5); w 1 = w 3 = 5/9, w 1 = 8/9). 

Svolgimento 

Applichiamo la formula, ricordandoci che dobbiamo utilizzarla non in [2,5] ma in [−1,1]. Considerando 

che la trasformazione dall’intervallo [2,5] all’intervallo [−1,1] porta al cambiamento di variabili x = b − a 

2 t + 

b + a 

= 5 − 2 

2 2 t + 5 + 2 = 3 2 2 t + 7 2 si ha d x = 3 d t. La formula di Gauss-Legendre deve essere applicata sui nodi 

2 

trasformati dati da 3 2 x i + 7 . Perciò abbiamo 

2 

I G = 3 (w 1 f ( 3 2 2 x 1 + 7 2 ) + w 2 f ( 3 2 x 2 + 7 2 ) + w 3 f ( 3 2 x 3 + 7 ) 

2 ) 

= 1.5 ( (5/9)f (−1.161895004 + 3.5) + (8/9)f (3.5) + (5/9)f (1.161895004 + 3.5) ) 

= 1.5(0.5550723689 + 0.8491794877 + 0.4621443545) = 2.799594317 

144


10 

EQUAZIONI ALLE DERIVATE ORDINARIE 

L’universo è un’equazione 

differenziale. 

Jules Henri Poincarè 

10.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 

10.2 Sulle equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 

10.3 Metodo di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 

10.4 Metodo di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 

10.5 Metodo di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 

10.6 Studio dell’errore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 

10.7 Errori di troncamento locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 

10.8 Convergenza e stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 

10.8.1 Convergenza di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 

10.8.2 Stabilità di Eulero esplicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 

10.8.3 Convergenza di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 

10.8.4 Stabilità di Eulero implicito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 

10.8.5 Convergenza di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 

10.8.6 Stabilità di Crank-Nicolson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 

10.8.7 Sulla stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 


145

10. EQUAZIONI ALLE DERIVATE ORDINARIE 


All’inizio del ’900, van der Pol 1 studiò fenomeni non lineari e propose l’equazione differenziale 

y ′′ (t) + ɛ(y 2 (t) − 1)y ′ (t) + y(t) = 0 

Questa equazione governa l’intensità di corrente in un circuito oscillante a triodo e viene utilizzata nello 

studio di circuiti che contengano valvole termoioniche, i cosiddetti tubi a vuoto, come il tubo catodico del 

televisore o il magnetron nei forni a micro-onde. La quantità ɛ indica l’intensità dello smorzamento non 

lineare: quanto più ɛ è elevato tanto più il sistema perde energia rapidamente. 

L’equazione differenziale del secondo ordine si può ricondurre ad un sistema di equazioni differenziali 

del primo ordine. Ponendo u = (u 1 ,u 2 ) = (y, y ′ ) si ha 

( u 

′ 

1 

u ′ 2 

) ( 

) 

u 2 

= 

−ɛ((u 1 ) 2 − 1)u 2 − u 1 

Come si risolve numericamente un sistema di equazioni differenziali come quello appena scritto? In 

questo Capitolo, daremo una piccola introduzione a metodi numerici che permettono di risolvere equazioni 

differenziali del primo ordine. 

10.2 Sulle equazioni differenziali ordinarie 

Vogliamo trovare una funzione y(t) che soddisfi la seguente equazione differenziale ordinaria ( ODE: 

Ordinary Differential Equation) (del primo ordine): 

dy 

= f (t, y), 

dt a 

≤ t ≤ b 

La funzione f (t, y) è assegnata. Ci riferiamo a t come alla variabile indipendente. Allora y = y(t) è tale che 

y ′ = y ′ (t) = dy(t) è esattamente la f (t, y(t)). 

dt 

Esempio 10.2.1 Sia f (t, y) = −y + t definita per t ≥ 0 e per qualunque y reale. Si ha 

y ′ = −y + t, t ≥ 0 

Si verifica che, per qualunque scalare α la funzione y(t) = t − 1 + αe −t soddisfa la ODE. 

Se, inoltre, è assegnato un valore iniziale, per esempio y(0) = 1, allora, dovendo essere −1 + α = y(0) = 1, 

risulta α = 2. Assegnare una soluzione iniziale determina un’unica soluzione all’ODE. Si parla di problema 

a valori iniziali (IVP). 

Nel caso in cui y(0) = 1 si ricava l’unica soluzione y(t) = t − 1 + 2e −t . 

Problemi in cui abbiamo equazioni alle derivate ordinarie di ordine più elevato possono essere trasformati 

in sistemi equivalenti di equazioni del primo ordine. 

1 Balthasar van der Pol (1889-1959) fu un fisico e matematico olandese. Nel 1916 lavorò per un anno con l’ingegnere John Ambrose 

Fleming a Londra (Fleming aveva già inventato il diodo nel 1904). Si trasferì successivamente a Cambridge e iniziò una collaborazione 

con John Joseph Thomson al Cavendish Laboratory (Thomson aveva scoperto l’elettrone nel 1897). Qui divenne amico di Edward Appleton 

che, nel 1947, ricevette il premio Nobel per la fisica per i suoi contributi alla conoscenza della ionosfera – studi fatti insieme a 

van der Pol. La loro collaborazione riguardò anche lo studio di fenomeni non lineari usando circuiti triodi per verificare le loro teorie. 

Quando van del Pol rientrò in Olanda, continuò a occuparsi di ottica, elettromagnetismo, onde radio e fisica atomica. Il nome di van 

der Pol è associato con l’equazione differenziale che porta il suo nome. Questa equazione apparve per la prima volta sul suo articolo On 

relaxation oscillation pubblicato sulla rivista Philosophical Magazine nel 1926. 

146

10.3. Metodo di Eulero esplicito 

Esempio 10.2.2 La seconda legge del moto di Newton F = ma è una ODE del secondo ordine in quanto 

a = y ′′ (dove y è la coordinata della posizione). 

Allora la ODE ha la forma 

y ′′ = F /m 

con F forza e m la massa. Definendo u 1 = y e u 2 = y ′ si ha il sistema (equivalente all’equazione di prima) 

di due equazioni del primo ordine di ODE: 

( u 

′ 

) ( ) 

1 

u2 

u 

2 

′ = 

F /m 

Possiamo ora usare metodi che risolvono equazioni del primo ordine per risolvere questo sistema. La prima 

componente della soluzione u 1 ci dà il valore y dell’equazione da cui siamo partiti. La seconda componente 

u 2 ci dà la velocità y ′ . 

Sistemi del primo ordine di ODE hanno la forma 

Sistemi di 

ODE 

y ′ (t) = f(t,y) 

dove y : R −→ R n con y = (y 1 y 2 ... y n ), f : R n+1 −→ R n e y ′ (t) = dy/d t denota la derivata rispetto a t (per 

cui la i -sima componente del vettore derivata è data da y ′ i (t) = d y i (t)/d t). La funzione f è assegnata e noi 

vogliamo determinare il vettore di funzioni y che soddisfa l’ODE. 

Per semplicità noi studieremo il caso di una singola equazione scalare, n = 1. Ma l’approccio è del tutto 

simile nel caso di sistemi di equazioni del primo ordine. 

Sia data l’ODE 

y ′ = f (t, y(t)) 

a ≤ t ≤ b 

con valore iniziale 

y(a) = y a . 

Per risolvere questa ODE discretizziamo l’intervallo [a,b] in n + 1 punti equidistanti (per semplicità): t i = 

a + i h, h = 0,1,...,n, con h = (b − a)/n. 

Il passo di discretizzazione (temporale se t assume il significato della variabile temporale) è dunque h. 

Nelle applicazioni pratiche, il passo h è variabile (cioè i punti non sono equidistanti), tuttavia, per capire 

meglio come funzionano i metodi, noi useremo sempre un passo h costante. 

Sia y(t) la soluzione esatta del nostro problema a valori iniziali. Allora y(t i ) è il valore esatto della 

soluzione calcolata nel punto t i . 

Indichiamo invece con y i il valore approssimato al tempo t i che ricaviamo applicando un metodo 

numerico che risolve il problema proposto. 

10.3 Metodo di Eulero esplicito 

Con il metodo di Eulero 2 esplicito approssimiamo la derivata y ′ mediante la formula di Taylor (del 

secondo ordine) applicata al punto t i : 

y(t) = y(t i ) + (t − t i )y ′ (t i ) + (t − t i ) 2 

y ′′ (ξ i ) 

2 

2 Leonhard Euler (1707-1783) fu un matematico svizzero. Fu studente di Johann Bernoulli che comprese le sue grandi potenzialità 

e favorì i suoi studi. Eulero è noto soprattutto per i suoi contributi nel campo della geometria, della teoria dei numeri, delle equazioni 

differenziali, del calcolo delle variazioni. È lui che introdusse il simbolo f (x) per indicare le funzioni, e per la base naturale, i per la 

radice quadrata di −1, di π, il simbolo di sommatoria ∑ e altri ancora. 

147


La quantità (t − t i ) 2 

y ′′ (ξ i ) è il resto della formula di Taylor con ξ i un punto opportuno nel segmento di 

2 

estremi t e t i . 

Prendiamo come t il valore t i + h vale a dire t i+1 , da cui si ha t − t i = t i+1 − t i = h. Sostituendo si ottiene: 

y(t i+1 ) = y(t i ) + hy ′ (t i ) + h2 

2 y′′ (ξ i ) 

Esplicitando y ′ (t i ) rispetto agli altri termini si ha: 

y ′ (t i ) = y(t i+1) − y(t i ) 

− h h 2 y′′ (ξ i ) 

Ora si sostituisce il valore trovato per y ′ (t i ) nella ODE y ′ = f (t, y(t)) per t = t i : 

y(t i+1 ) − y(t i ) 

− h h 2 y′′ (ξ i ) = f (t i , y(t i )) 

Trascurando il termine h 2 y′′ (ξ i ) non abbiamo più i valori della soluzione esatta, ma otterremo i valori della 

soluzione approssimata. Scriviamo dunque: 

y i+1 − y i 

h 

= f (t i , y i ) 

La formula di Eulero esplicito è: y i+1 = y i + h f (t i , y i ). 

La formula è di tipo esplicito perchè per passare dal livello i al livello i + 1 sfruttiamo i dati che già 

conosciamo del livello i , dati che sono tutti espliciti. 

Si parte infatti da y 0 = y(t 0 ) = y(a) = y a e si ricava: 

y 1 = y 0 + f (t 0 , y 0 ) 

y 2 = y 1 + f (t 1 , y 1 ) 

. = . . . 

Un altro 

approccio 

Si arriva alla stessa formula integrando l’ODE e approssimando l’integrale della f mediante il valore in 

f (t 0 , y(t 0 )): da y ′ = f (t, y(t)) integrando ambo i membri da t 0 a t, otteniamo 

∫ t 

t 0 

∫ 

d y 

t 

d t d t = 

t 0 

f (t, y(t)) d t =⇒ 

∫ y(t) 

y 0 

d y = 

∫ t 

t 0 

f (t, y(t)) d t 

Al secondo membro, approssiamo ∫ t 

t 0 

f (t, y(t)) d t mediante il valore (t − t 0 )f (t 0 , y(t 0 )) (approssimiamo la f 

mediante la retta f (t 0 , y(t 0 ))). 

Abbiamo: 

y(t) = y 0 + (t − t 0 )f (t 0 , y 0 )) + errore della formula di quadratura. 

Per t = t 1 , numericamente: y 1 = y 0 + h f (t 0 , y 0 )). 

Ai passi successivi: y i+1 = y i + h f (t i , y i )) 

Esempio 10.3.1 Supponiamo di applicare il metodo di Eulero esplicito alla ODE y ′ = −y con passo h a 

partire dal punto iniziale t 0 = 0 e avanziamo al tempo t 1 = t 0 + h 

y 1 = y 0 + h f (t 0 , y 0 ) = y 0 − hy 0 = (1 − h)y 0 

Il valore che ottienamo y 1 è affetto da errore: y 1 ≠ y(t 1 ) Per esempio, se per t 0 si ha y 0 = 1, la soluzione esatta 

è y(t) = e −t . Per h = 0.5, si ha y 1 = 0.5 mentre y(0.5) = e −0.5 ≈ 0.60653 

148

10.4. Metodo di Eulero implicito 

Da un punto di vista geometrico (si veda la Figura 10.1), il valore in t i+1 è approssimato utilizzando il valore 

della retta la cui pendenza è data da f (t i , y i ): è come se ad ogni passo cercassimo di risolvere il problema a 

valori iniziali: 

Interpretazione 

geometrica 

y ′ (t) = f (t, y(t)) 

y(t i ) = y i 

per cui il valore che otteniamo per il tempo t i+1 è tangente alla traiettoria della soluzione di questo IVP. 

Figura 10.1: Interpretazione geometrica del metodo di Eulero esplicito. Si è considerato il problema y ′ = −y 

con y(0) = 1 la cui soluzione esatta è y(t) = e −t . I valori numerici ottenuti dal metodo di Eulero esplicito sono 

cerchiati e si trovano sulla linea spezzata che li interpola. La linea spezzata è tangente, all’inizio di ogni passo, 

alla traiettoria che passa per il corrispondente punto, soluzione del problema y ′ = −y con y(t i ) = y i . 

10.4 Metodo di Eulero implicito 

Se applichiamo la formula di Taylor di punto iniziale t i+1 , abbiamo 

y(t) = y(t i+1 ) + (t − t i+1 )y ′ (t i+1 ) + (t − t i+1) 2 

y ′′ (ξ i ) 

2 

Per t = t i , si ha t − t i+1 = t i − t i+1 = t i − (t i + h) = −h. Sostituendo, abbiamo: 

y(t i ) = y(t i+1 ) − hy ′ (t i+1 ) + h2 

2 y′′ (ξ i ) 

Otteniamo quindi 

y ′ (t i+1 ) = y(t i+1) − y(t i ) 

+ h h 2 y′′ (ξ i ) 

149


Andando a sostituire nella ODE al tempo t i+1 , si ha : 

y(t i+1 ) − y(t i ) 

+ h h 2 y′′ (ξ i ) = f (t i+1 , y(t i+1 )) 

Trascurando il termine del resto di Taylor h 2 y′′ (ξ i ) abbiamo: 

y i+1 − y i 

h 

= f (t i+1 , y i+1 )) 

La formula di Eulero implicito vale y i+1 = y i + h f (t i+1 , y i+1 )). 

La differenza rispetto alla formula esplicita è che la f è valutata non più al tempo t i ma al tempo t i+1 Quindi 

il calcolo di y i+1 dipende implicitamente da y i+1 stesso! La valutazione di y i+1 diventa quindi più laboriosa 

e complicata (se si ha un’equazione non lineare in y i+1 , la si risolve tramite un metodo di punto fisso o di 

Newton-Raphson). In termini di accuratezza si hanno risultati migliori. 

Esempio 10.4.1 Consideriamo sempre y ′ = −y con y(0) = 1 (soluzione esatta y(t) = e −t ). 

Il metodo di Eulero implicito diventa: y i+1 = y i − hy i+1 ovvero (1 + h)y i+1 = y i 

La soluzione numerica è y i+1 = 

y i 

(1 + h) . 

Per h = 0.5 ricaviamo y 1 = 0.66667 contro un valore esatto y(1) ≈ 0.60653. 

Esempio 10.4.2 Si abbia l’equazione y ′ = −y 3 con condizione iniziale y(0) = 1. Usando il metodo di Eulero 

implicito con passo h = 0.5, per ricavare y 1 otteniamo l’equazione implicita 

y 1 = y 0 + h f (t 1 , y 1 ) = 1 − 0.5y 3 1 

Questa equazione non lineare in y 1 può essere risolta mediante metodo di punto fisso (x = g (x) = 1−0.5x 3 ) 

oppure utilizzando il metodo di Newton-Raphson per F (x) = 0 con F (x) = x −1+0.5x 3 ) . L’approssimazione 

iniziale per ottenere y 1 può essere o la soluzione al passo precedente, y 0 , oppure usare il metodo di Eulero 

esplicito, che dà y 1 = y 0 − 0.5y 3 0 = 0.5. Otteniamo, come y 1 il valore finale y 1 ≈ 0.7709. 

Esempio 10.4.3 Vogliamo discretizzare il problema di Cauchy 

y ′ = −y 2 

y(0) = 1 

con passo h = 0.1 applicando il metodo di Eulero esplicito per ricavare y 1 e y 2 . 

Il metodo di Eulero esplicito è: 

y i+1 = y i + h f (t i , y i ) = y i + h(−y 2 i ) = y i − hy 2 i 

Partendo da y 0 = 1 si ricava: 

y 1 = 1 − 0.1(1 2 ) = 0.9 

y 2 = 0.9 − 0.1(0.9 2 ) = 0.819 

150

10.4. Metodo di Eulero implicito 

Per confronto, calcoliamo la soluzione esatta y(t) = 1 

t + 1 , ottenendo: 

y(t 1 ) = y(0.1) = 1/(0.1 + 1) = 0.9090909090 

y(t 2 ) = y(0.2) = 1/(0.2 + 1) = 0.8333333333 

Applichiamo ora il metodo di Eulero implicito con lo stesso passo h = 0.1. 

y i+1 = y i + h f (t i+1 , y i+1 ) = y i − hy 2 i+1 

Per ricavare y 1 la formula diventa: 

y 1 = y 0 + h f (t 1 , y 1 ) = 1 − 0.1(y 2 1 ) 

Abbiamo un’equazione non lineare in y 1 . Per trovare y 1 , possiamo pensare di applicare lo schema di punto 

fisso alla funzione g (y) = 1 − 0.1(y 2 ) partendo da y (0) = y 0 = 1, in quanto y 1 = g (y 1 ) è punto fisso per la 

funzione g . Applichiamo tre passi dello schema di punto fisso: 

y (1) = g (y (0) ) = 1 − 0.1(1 2 ) = 0.9 

y (2) = g (y (1) ) = 1 − 0.1(0.9 2 ) = 0.919 

y (3) = g (y (2) ) = 1 − 0.1(0.919 2 ) = 0.9155439 

Se prendiamo y (3) come approssimazione di y 1 ricaviamo y 1 = 0.9155439 (per confronto, il valore esatto è 

0.90909090). 

Calcoliamo ora y 2 : 

y 2 = y 1 + h f (t 2 , y 2 ) = 0.9155439 − 0.1(y 2 2 ) 

Ora la funzione di punto fisso diventa g (y) = 0.9155439 − 0.1(y 2 ). Applichiamo lo schema di punto fisso 

partendo da y (0) = y 1 = 0.9155439. 

y (1) = g (y (0) ) = 0.9155439 − 0.1(0.9155439 2 ) = 0.8317218367 

y (2) = g (y (1) ) = 0.9155439 − 0.1(0.8317218367 2 ) = 0.8463677786 

y (3) = g (y (2) ) = 0.9155439 − 0.1(0.8463677786 2 ) = 0.8439100583 

Troviamo quindi y 2 = 0.8439100583 (valore esatto 0.8333333333). 

Vediamo cosa accade in Eulero implicito se il punto iniziale del metodo di punto fisso è dato da un passo 

del metodo di Eulero esplicito. 

Per ricavare y 1 , considero come y (0) = y 0 + h f (t 0 , y 0 ) = 1 − 0.1 = 0.9 

In tal caso, l’approssimazione iniziale è quella che, nel caso di prima, era il valore y (1) . 

Applichiamo tre volte lo schema di punto fisso: 

y (1) = g (y (0) ) = 1 − 0.1(0.9 2 ) = 0.919 

y (2) = g (y (1) ) = 1 − 0.1(0.919 2 ) = 0.9155439 

y (3) = g (y (2) ) = 1 − 0.1(0.9155439 2 ) = 0.9161779367 

Quindi y 1 = 0.9161779367. 

Al secondo passo, lo schema di punto fisso è dato dalla funzione g (y) = y 1 − h(y 2 ) = 0.9161779367 − 0.1y 2 . 

Come approssimazione iniziale prendiamo y (0) = y 1 + h f (t 1 , y 1 ) = g (y 1 ) = 0.8322397355. Si ha: 

y (1) = g (y (0) ) = 0.9161779367 − 0.1(0.8322397355 2 ) = 0.8469156390 

y (2) = g (y (1) ) = 0.9161779367 − 0.1(0.8469156390 2 ) = 0.8444513267 

y (3) = g (y (2) ) = 0.9161779367 − 0.1(0.84445132672) = 0.8448681324 

Ricaviamo y 2 = 0.8448681324. 

151


10.5 Metodo di Crank-Nicolson 

Partiamo dall’ODE 3 y ′ = f (t, y(t)). Integriamo ambo i membri dell’equazione sull’intervallo [t i , t i+1 ]: 

∫ y(ti+1 ) 

y(t i ) 

dy = 

∫ ti+1 

t i 

f (t, y(t)) dt =⇒ y(t i+1 ) − y(t i ) = 

∫ ti+1 

t i 

f (t, y(t)) dt 

A secondo membro, applichiamo la formula dei trapezi trascurando l’errore di integrazione: 

y i+1 − y i = h 2 [f (t i , y i ) + f (t i+1 , y i+1 )] 

Si ha la formula di Crank-Nicolson: y i+1 = y i + h 2 [f (t i , y i ) + f (t i+1 , y i+1 )] 

Altro 

approccio 

La stessa formula la si può ricavare prendendo la media aritmetica delle formule di Eulero esplicito e 

implicito: 

y i+1 − y i = h f (t i , y i ) 

y i+1 − y i = h f (t i+1 , y i+1 ) 

sommando e dividendo per 2: 

y i+1 − y i = h 2 [f (t i , y i ) + f (t i+1 , y i+1 )] =⇒ y i+1 = y i + h 2 [f (t i , y i ) + f (t i+1 , y i+1 )] 

Esempio 10.5.1 Lo stesso esempio di prima (y ′ = −y con y(0) = 1) risolto con Crank-Nicolson dà: y i+1 = 

y i + h 2 [−y i − y i+1 )] cioè 

(1 + h 2 )y i+1 = (1 − h ( ) 2 − h 

2 )y i =⇒ (2 + h)y i+1 = (2 − h)y i =⇒ y i+1 = y i 

2 + h 

Per h = 0.5, confrontiamo i valori ottenuti dai metodi di Eulero esplicito, implicito e Crank-Nicolson, con la 

soluzione esatta: 

t i y(t i ) y i Eul. Espl. y i Eul. Impl. y i C-N 

0.0 1.000000 1.0000000 1.000000 1.000000 

0.5 0.606531 0.5000000 0.666667 0.600000 

1.0 0.367879 0.2500000 0.444444 0.360000 

1.5 0.223130 0.1250000 0.296296 0.216000 

2.0 0.135335 0.0625000 0.197531 0.129600 

2.5 0.082085 0.0312500 0.131687 0.077760 

3.0 0.049787 0.0156250 0.087791 0.046656 

3.5 0.030197 0.0078125 0.058528 0.027994 

4.0 0.018316 0.0039062 0.039018 0.016796 

3 John Crank (1916-2006) è stato un matematico inglese che si è dedicato soprattutto allo studio di soluzioni numeriche di equazioni 

alle derivate parziali, in particolare di problemi di conduzione del calore. È noto soprattutto per il lavoro svolto con Phyllis Nicolson. 

Phyllis Nicolson (1917-1968) è stata una matematica inglese. Negli anni della seconda guerra mondiale lavorò sulla teoria del 

magnetron. È nota, appunto, per il metodo di Crank-Nicolson. 

152

10.6. Studio dell’errore 

10.6 Studio dell’errore 

Nel costruire i metodi (di Eulero esplicito, implicito, Crank-Nicolson) abbiamo trascurato un termine (il 

resto della formula di Taylor o l’errore della formula dei trapezi): questo termine che abbiamo trascurato 

rappresenta l’errore di troncamento locale. Nel caso di Eulero esplicito avevamo (usando la formula di 

Taylor): 

y ′ (t i+1 ) = y(t i+1) − y(t i ) 

− h h 2 y′′ (ξ i ) = f (t i , y(t i )) 

Per costruire il metodo, abbiamo trascurato il termine del resto, vale a dire la quantità 

d i = y(t i+1) − y(t i ) 

− f (t i , y(t i )) = h h 

2 y′′ (ξ i ) = O (h) 

Questa quantità ci dice di quanto la soluzione esatta “fallisce” nel soddisfare la relazione della formula di 

Eulero esplicito e rappresenta l’errore di troncamento locale. 

Definizione 10.6.1 Si definisce errore totale di troncamento ε i la quantità: 

ε i = y(t i ) − y i . 

Ci aspettiamo che sia dello stesso ordine di grandezza dell’errore di troncamento locale. 

Definizione 10.6.2 Per effetto dell’arrotondamento, al tempo t i al posto di y i otteniamo il valore arrotondato 

y i . Si definisce errore totale di arrotondamento la quantità: 

ε i = y i − y i 

Definizione 10.6.3 L’errore globale dello schema numerico è dato dal contributo dell’errore totale di 

troncamento e dell’errore totale di arrotondamento 

ɛ i = y(t i ) − y i = ε i + ε i 

Gli errori di arrotondamento nell’approssimare la derivata prima di una funzione si comportano come 

O ( 1 ) (si veda l’esempio fatto sulla propagazione degli errori a pag. 30). Tuttavia questo aspetto diventa secondario 

nella risoluzione delle ODE sia perchè il passo h nelle applicazioni non è mai troppo (esagerata- 

h 

mente) piccolo per ragioni di efficienza sia perchè è la y e non la y ′ la funzione che dobbiamo approssimare. 

Inoltre, nell’eseguire i calcoli in doppia precisione (come si fa nei moderni linguaggi di programmazione), 

l’aspetto dovuto all’arrotondamento si vede poco rispetto ad altri fenomeni che influenzano la propagazione 

degli errori. 

10.7 Errori di troncamento locale 

G Nel metodo di Eulero esplicito: 

G Nel metodo di Eulero implicito: 

d i = y(t i+1) − y(t i ) 

− f (t i , y(t i )) = h h 

2 y′′ (ξ i ) = O (h) 

d i = y(t i+1) − y(t i ) 

− f (t i , y(t i+1 )) = − h h 

2 y′′ (ξ i ) = O (h) 

153


G Nel metodo di Crank-Nicolson (derivando la formula dai trapezi e includendo il termine dell’errore): 

y(t i+1 ) − y(t i ) = h 2 [f (t i , y(t i )) + f (t i+1 , y(t i+1 ))] − f ′′ (τ i ,ξ i ) 

h 3 

12 

dove τ i e ξ i sono opportuni punti. Ma f = y ′ da cui f ′ = y ′′ e f ′′ = y ′′′ . 

Perciò 

y(t i+1 ) − y(t i ) = h 2 [f (t i , y(t i )) + f (t i+1 , y(t i+1 ))] − y′′′ (ξ i ) 

h 3 

12 

d i = y(t i+1) − y(t i ) 

h 

10.8 Convergenza e stabilità 

Definizione 10.8.1 Un metodo si dice convergente se lim h→0 

− 1 2 [f (t i , y(t i )) + f (t i+1 , y(t i+1 ))] = − y′′′ (ξ i ) 

h 2 = O (h 2 ) 

12 

i→+∞ 

ɛ i = 0 cioè se l’errore va a zero al tendere del 

passo h a zero e di i all’infinito in modo che il prodotto i h si mantenga costante (così t 0 +i h tende ad un valore 

di t fissato: studiamo l’errore fissato t). 

Esempio 10.8.1 Vediamo come, fissato un certo istante t, possiamo fare tendere h a zero e far crescere i 

all’infinito in modo che t 0 + i h sia sempre uguale a t. Sia t 0 = 0 e t = 0.5: 

h i i h 

0.5 1 0.5 

0.25 2 0.5 

0.125 4 0.5 

0.0625 8 0.5 

. 

. 

. 

2.4414e-4 2048 0.5 

Definizione 10.8.2 Un metodo si dice stabile se l’errore iniziale si mantiene limitato al crescere di i (per i → ∞): 

con M costante positiva. 

|ɛ i | ≤ M|ɛ 0 | 

Studieremo la convergenza e la stabilità dei metodi di Eulero esplicito, implicito e Crank-Nicolson 

applicati all’equazione test y ′ = −λy (λ > 0 in modo che −λ < 0) con condizione iniziale y(0) = y 0 . 

La soluzione esatta di questo IVP è y(t) = y 0 e −λt : tende a zero per valori di t crescenti. Ci aspettiamo che 

anche la soluzione numerica si comporti in maniera simile. 

10.8.1 Convergenza di Eulero esplicito 

Per semplicità, applichiamo la formula del metodo di Eulero esplicito all’equazione test con λ = 1. 

y 1 = y 0 + h f (t 0 , y 0 ) = y 0 − hy 0 = (1 − h)y 0 

y 2 = y 1 + h f (t 1 , y 1 ) = y 1 − hy 1 = (1 − h)y 1 

. 

y i = y i−1 + h f (t i−1 , y i−1 ) = y i−1 − hy i−1 = (1 − h)y i−1 

154

10.8. Convergenza e stabilità 

Andando a ritroso troviamo una formula che lega y i direttamente a y 0 . 

y 1 = (1 − h)y 0 

y 2 = (1 − h)y 1 = (1 − h) 2 y 0 

. 

y i = (1 − h)y i−1 = (1 − h) i y 0 

La soluzione numerica al tempo t i è data da y i = (1 − h) i y 0 . Fissato un tempo t = i h, vediamo se 

cioè se 

lim 

h→0 

i→+∞ 

y i = y(t). 

i h 

⎡ 

1 

⎤ 

Osserviamo che: (1 − h) i = (1 − h) h = ⎣(1 − h) h ⎦ 

Ricordiamo la proprietà per la quale x α = e ln(xα) = e αln(x) . 

1 

ln(1 − h) 

t 

lim 

h→0 

i→+∞ 

Perciò: (1 − h) h = e ln(1−h)( 1/h) = e h 

Quando facciamo il limite per h → 0 e per i → +∞ consideriamo che, per il teorema dell’ Hôpital, vale 

Di conseguenza lim h→0 e h ln(1−h) = e −1 

Allora 

lim 

h→0 

i→+∞ 

1 

y i = lim 

h→0 

i→+∞ 

ln(1 − h) −1 

lim = lim 

h→0 h h→0 1 − h = −1 

⎡ 

y 0 (1 − h) i = lim y 0 h→0 

i→+∞ 

1 

⎤t 

⎣(1 − h) h ⎦ = y 0 e −t = y(t) 

ɛ i = 0 

In questo modo abbiamo provato che il metodo converge. Il discorso si ripete in maniera del tutto simile, 

per λ ≠ 1. 

10.8.2 Stabilità di Eulero esplicito 

Dobbiamo provare che l’errore si mantiene limitato. Sia λ > 0. Abbiamo y i+1 = y i −hλy i = (1−hλ)y i , vale 

a dire y i+1 = (1−hλ) i+1 y 0 La soluzione esatta di questo problema è y(t) = y 0 e −λt e tende a zero per valori di t 

crescenti. Vogliamo che tenda a zero anche la soluzione numerica (in modo da mantenere limitato l’errore). 

La soluzione numerica (fissato h e per i grande, cioè per valori di t crescente) tende a zero se |1−hλ| < 1 cioè 

per −1 < 1 − hλ < 1 ⇐⇒ 0 < hλ < 2 ⇐⇒ h < 2 λ . 

Il metodo di Eulero esplicito è stabile sotto condizione. 

10.8.3 Convergenza di Eulero implicito 

Il metodo di Eulero implicito applicato all’equazione test diventa: 

y i+1 = 

y i 

(1 + hλ) 

155



y 0 

y 1 = 

(1 + hλ) 

y 1 

y 2 = 

(1 + hλ) = y 0 

(1 + hλ) 2 

y 2 

y 3 = 

(1 + hλ) = y 0 

(1 + hλ) 3 

. 

y i = 

y i−1 

(1 + hλ) = y 0 

(1 + hλ) i 

In tal caso 

lim 

h→0 

i→+∞ 

y i = lim 

h→0 

i→+∞ 

y 0 

(1 + hλ) i = lim 

h→0 

i→+∞ 

⎡ 

1 

⎤ 

y 0 (1 + hλ) −i = y 0 

⎣(1 + hλ) h ⎦ 

(i passaggi sono del tutto simili a quelli visti per Eulero esplicito). 

Abbiamo provato la convergenza. 

−i h 

= y 0 e −tλ 

10.8.4 Stabilità di Eulero implicito 

y 0 

Per la stabilità, si vede che la soluzione è y i = 

(1 + λh) i 

1 

Per i → +∞, qualunque sia il valore di h, la soluzione tende a zero in quanto lim i→+∞ 

(1 + λh) i = 0 Si 

parla di metodo incondizionatamente stabile. 

10.8.5 Convergenza di Crank-Nicolson 

Il metodo di Crank-Nicolson applicato all’equazione test diventa: y i+1 = y i + hλ 

2 [−y i − y i+1 ] da cui 

Andando a ritroso si ricava 

( ) 2 − hλ 

y i+1 = y i 

2 + hλ 

( ) 2 − hλ i+1 

y i+1 = y 0 

2 + hλ 

Per verificare che il metodo converge studiamo il limite 

lim 

h→0 

i→+∞ 

⎡ 

( ) 2 − hλ i ( ) 1 ⎤ 

⎢ 2 − hλ 

= ⎣ 

h ⎥ 

⎦ 

2 + hλ 2 + hλ 

i h 

y i . Partiamo dalla relazione 

⎡ 

( ) 1 ⎤t 

⎢ 2 − hλ 

= ⎣ 

h ⎥ 

⎦ 

2 + hλ 

Ma 

( 2 − hλ 

2 + hλ 

) 1 1 2 − hλ 

ln( 

h = e h 2 + hλ ) 

156

10.8. Convergenza e stabilità 

Nel fare il limite per h → 0 e i → +∞ della quantità che si trova all’esponente, applichiamo l’Hôpital e 

ricordiamo che la derivata di 2 − hλ −λ(2 + hλ) − (2 − hλ)λ 

vale 

2 + hλ (2 + hλ) 2 = −4λ 

(2 + hλ) 2 : 


lim 

h→0 

i→+∞ 

ln( 2 − hλ 

2 + hλ ) 

lim 

h→0 

i→+∞ 

La convergenza è provata. 

h 

y i = lim 

h→0 

i→+∞ 

= lim 

h→0 

i→+∞ 

( 2 − hλ 

y 0 

2 + hλ 

2 + hλ −4λ 

2 − hλ (2 + hλ) 2 = lim −4λ 

h→0 (2 + hλ)(2 − hλ) = −λ 

) i 

= lim 

h→0 

i→+∞ 

i→+∞ 

⎡ 

( ) 1 ⎤ 

⎢ 2 − hλ 

y 0 ⎣ 

h ⎥ 

⎦ 

2 + hλ 

i h 

= y 0 e −tλ 

10.8.6 Stabilità di Crank-Nicolson 

( ) 2 − λh i 

Per la stabilità, si vede che la soluzione numerica è y i = y 0 . Per i → +∞, qualunque sia il valore 

2 + λh 

( ) 2 − λh i 

di h, la soluzione tende a zero in quanto lim i→+∞ = 0. Il metodo è incondizionatamente stabile. 

2 + λh 

10.8.7 Sulla stabilità 

La stabilità di questi metodi la si può verificare anche considerando direttamente l’errore ɛ i , dimostrando 

che gli errori al passo i e al passo i +1 verificano la stessa relazione che hanno y i+1 e y i e mostrando che l’errore 

rimane limitato sotto condizione per Eulero esplicito mentre è incondizionatamente stabile per gli altri 

metodi. In Figura 10.2 si vede come il metodo di Eulero esplicito sia stabile sotto condizione mentre i metodi 

di Eulero implicito e Crank-Nicolson sono stabili qualunque passo di discretizzazione venga utilizzato. 

Esempio 10.8.2 Consideriamo il metodo di Eulero esplicito e applichiamolo all’equazione test. Sappiamo 

che y i+1 = y i + hλy i . 

Per la soluzione esatta, sappiamo che vale y(t i+1 ) = y(t i ) + hλy(t i ) + hd i (con d i l’errore di troncamento 

locale). 

Sottraendo la prima equazione dalla seconda abbiamo 

ɛ i+1 = ɛ i + hλɛ i + hd i 

Considerato che d i = h 2 y′′ (ξ i ) e che, per studiare la stabilità, h è fissato mentre i tende a +∞, il termine hd i 

non influisce sull’andamento dell’errore e possiamo trascurarlo. Si ha allora la relazione: 

ɛ i+1 = ɛ i + hλɛ i 

Ricaviamo ɛ i = ɛ 0 (1 + hλ) i . 

Il ragionamento da fare è lo stesso che abbiamo fatto in precedenza e troviamo gli stessi risultati. Dobbiamo 

infatti verificare quando ɛ i tende a zero per i che tende a+∞. . . 

157


Figura 10.2: Confronto dei metodi di Eulero esplicito, implicito e Crank-Nicolson sull’equazione test y ′ = −y, 

prendendo come h il valore h = 2 (a sinistra) e h = 0.5 (a destra). 


Esercizio 10.9.1 Studiare la stabilità del metodo di Eulero esplicito applicato all’equazione differenziale 

y ′ = −2y + 1, con y(0) = 1 (soluzione esatta y(t) = e−2t + 1 

) 

2 

Svolgimento 

Per provare la stabilità del metodo dobbiamo verificare che l’errore iniziale si mantiene limitato per valori 

crescenti del tempo. 

Il metodo di Eulero esplicito applicato all’ODE del problema diventa 

y i+1 = y i + h(−2y i + 1) = (1 − 2h)y i + h 

La soluzione esatta soddisfa un’equazione del tipo 

y(t i+1 ) = y(t i ) + h(−2y(t i ) + 1) + hd i = (1 − 2h)y(t i ) + h + hd i 

Nel calcolare l’errore ɛ i+1 = y(t i+1 ) − y i+1 abbiamo 

ɛ i+1 = (1 − 2h)ɛ i + hd i 

Il termine hd i (d i errore locale di troncamento) si può trascurare. Abbiamo allora ɛ i+1 = (1 − 2h)ɛ i . 

Possiamo trovare con facilità che ɛ i+1 = (1 − 2h) i+1 ɛ 0 o, ancora, ɛ i = (1 − 2h) i ɛ 0 . 

Se vogliamo che l’errore rimanga limitato per i → ∞ la quantità (1 − 2h) i non deve crescere. 

Quindi deve essere |1 − 2h| < 1, vale a dire −1 < 1 − 2h < 1 cioè 2h < 2, quindi h < 1: stabilità sotto 

condizione. 

158


11 

INTRODUZIONE AL FORTRAN 77 

:–Almeno hai trovato i files? 

:– Non so nemmeno come... come 

sono fatti? 

:– Sono dentro il computer. 

:– Sono “dentro” il computer? 

. 

:– Com’è che i files non escono? 

Zoolander 

11.1 Introduzione alla programmazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 

11.2 FORTRAN: FORmula TRANslator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 

11.3 Problemi e Algoritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 

11.4 Elementi di un linguaggio di programmazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 

11.5 Prime regole sul FORTRAN77 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 

11.6 Le variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 

11.7 I tipi di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 

11.8 Espressioni aritmetiche e funzioni elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 

11.9 I predicati elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 

11.10 Struttura alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 

11.11 Programma sul metodo di punto fisso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 

11.12 I sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 

11.12.1 Le functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 

11.12.2 Le subroutines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 

11.13 Il formato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 

11.14 Files di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 

11.15 Vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 

11.16 Ciclo do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 

11.16.1 I vettori nei sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 

11.16.2 Leggere i dati di input da file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 

11.17 Matrici in FORTRAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 

11.17.1 Le matrici nei sottoprogrammi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 

11.17.2 Memorizzazione delle matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 

159

11. INTRODUZIONE AL FORTRAN 77 

11.18 La formula dei trapezi in FORTRAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 


11.1 Introduzione alla programmazione 

Prendono il nome di software quei programmi che vengono fatti eseguire al calcolatore e consentono 

all’hardware di svolgere il proprio compito. 

Esistono due categorie di linguaggi per scrivere programmi: 

G linguaggi di alto livello (come FORTRAN, C, C++) 

G linguaggi di basso livello (come assembler) 

Il linguaggio macchina, invece, è il linguaggio specifico dell’elaboratore e consiste di cifre binarie 0 e 1 che 

identificano istruzioni elementari. Ogni elaboratore ha il suo linguaggio macchina. 

I linguaggi di basso e alto livello si possono tradurre in un qualsiasi linguaggio macchina e possono essere 

utilizzati su qualsiasi elaboratore (sono portabili). 

Con i linguaggi di basso livello, i codici binari (fatti da 0 e 1) vengono sostituiti da opportune ”parole 

chiave” che permettono una corrispondenza uno-uno tra il linguaggio di basso livello e il linguaggio 

macchina. 

Con i linguaggi di alto livello, una singola istruzione può tradurre più istruzioni di linguaggio macchina. 

Inoltre un linguaggio di alto livello è facile da capire (nella sua sintassi, nelle sue regole, nel suo modo di 

essere utilizzato) da chi programma. 

Perciò, quando si programma con un linguaggio di alto livello, il programmatore deve conoscere e sapere 

bene la grammatica, la sintassi, il vocabolario del linguaggio stesso. 

Uno volta scritto il programma in modo corretto, occorre fare capire al computer che c’è un programma da 

eseguire: bisogna quindi tradurre in linguaggio macchina il programma scritto con il liguaggio di alto livello: 

questo passaggio lo si fa mediante la compilazione. Useremo un comando (un’istruzione da scrivere nella 

finestre di shell, nella stessa directory in cui si trova il programma che abbiamo scritto) che ci permetterà 

di tradurre il programma scritto nel linguaggio di alto livello (che chiamamo programma sorgente) in un 

programma equivalente scritto in linguaggio macchina e che potrà essere eseguito dal calcolatore, detto 

programma eseguibile. 

Programma sorgente 

compi l ator e 

−−−−−−−−−→ Programma eseguibile 

11.2 FORTRAN: FORmula TRANslator 

FORTRAN è una sigla per FORMula TRANslator. 

Anche se il FORTRAN si è molto evoluto, ci soffermeremo in particolare sulla versione 77 perchè (a parte 

alcuni punti ormai obsoleti) la sintassi e il modo di imparare a scrivere un programma è più semplice. 

Inoltre è possibile scaricare gratuitamente in rete compilatori del FORTRAN77 da poter installare sul proprio 

computer (anche con sistema operativo Windows). 

Un programma FORTRAN va prima scritto mediante un editor di testo, salvandolo con un nome che abbia 

l’estensione .f, per esempio prova.f. Poi va tradotto in linguaggio macchina in modo da poterlo eseguire 

al calcolatore: questo passo viene fatto attraverso la compilazione. Un compilatore è il g77. Mediante 

l’istruzione 

g77 -o prova prova.f 

tradurremo in linguaggio macchina il programma prova.f e il risultato sarà la creazione di un nuovo file 

chiamato prova che potremo eseguire. 

Possiamo scrivere anche 

g77 -o prova.exe prova.f 

160

11.3. Problemi e Algoritmi 

Possiamo mettere (o meno) un’estensione al file eseguibile. 

Per eseguire il programma prova, scriveremo (da shell) l’istruzione 

prova 

oppure 

./prova 

a seconda del calcolatore. 

Altri tipi di compilatore sono f77, gfortran. 

11.3 Problemi e Algoritmi 

Ci sono tante definizioni per problema: 

G etimologicamente, viene dal verbo greco ”pro-ballein” pro:davanti ballein:mettere, ostacolo, promontorio, 

impedimento 

G sul dizionario troviamo: Questione da risolvere partendo da elementi noti mediante il ragionamento, e 

per la quale si propongono soluzioni 1 

G o ancora quesito con cui si chiede di trovare, mediante un procedimento di calcolo, uno o più dati 

sconosciuti, partendo dai dati noti contenuti... 2 

G in senso figurato, invece, per problema si intende Questione, situazione difficile o complessa di cui 

si cerca la spiegazione o la soluzione: 3 e questione, situazione, caso difficile da risolvere e che genera 

preoccupazione, . . . , complicazione, difficoltà, ostacolo 4 

G estendendo ancora il significato, si trova Persona misteriosa, incomprensibile, il cui comportamento 

preoccupa o mette in difficoltà 5 

G . . . 

Qualunque sia la definizione che diamo, il tratto comune è di avere a che fare con una questione cui vogliamo 

dare una risposta o che vogliamo risolvere. Una delle prime cose da considerare quando si cerca di risolvere 

un problema è, dunque, come porre il problema. 

Il linguaggio naturale viene usato per descrivere un problema. Ma bisogna porre attenzione: 

G Lo stesso evento è descritto diversamente da un bambino di 3 anni rispetto a un uomo adulto. 

G Lo stesso evento viene descritto diversamente da un ingegnere, un fisico, un matematico. 

G A volte, le stesse parole possono essere usate per dire cose completamente diverse! 

C’è poi il linguaggio artificiale, che si presenta sotto forma di termini tecnici (dalla fisica, ingegneria, etc) e 

notazioni (per esempio dall’algebra, dal calcolo, dalla logica). 

Per esempio, termini come temperatura, pressione, massa, espansione isotermica e adiabatica, possono 

essere usati in un’officina per riparare il motore di un’automobile, da un medico che sta misurando la 

pressione del sangue, da un ingegnere che lavora su una turbina a gas. . . 

Una volta che il problema è stato descritto e se ne ha una buona conoscenza (con l’aiuto del linguaggio 

naturale e artificiale), si può passare alla fase di soluzione del problema stesso. 

Ecco l’approccio dell’algoritmo. Un algoritmo è una sequenza di passi che permettono di risolvere tutto 

o parte di un problema. 6 

Un algoritmo si può paragonare ad una ricetta di cucina: la ricetta consiste di due parti 

Algoritmo 

1 Dal Dizionario online della Hoepli http://dizionari.hoepli.it 

2 Dal Dizionario online della Garzanti http://www.garzantilinguistica.it 

3 Da http://dizionari.hoepli.it 

4 Da il Sabatini Colletti Dizionario della Lingua Italiana http://dizionari.corriere.it/dizionario_italiano 

5 Da http://dizionari.hoepli.it 

6 La parola algoritmo è entrata in uso negli anni ’50 in sostituzione di algorismo, termine con cui si indicava il processo di calcolo 

utilizzando i numeri arabi. Il termine algoritmo deriva dal nome di “al-Khwarizmi”, importante matematico arabo del nono secolo grazie 

al quale l’Europa imparò ad usare i numeri arabi, oltre alla notazione in base 10. Le procedure che permettevano di effettuare calcoli in 

notazione decimale presero il nome di algorismi o algoritmi. Anche la parola algebra viene da questo matematico e, in particolare, dalla 

sua opera “Al-mukhtasar fi hisab al-jabr wa al-muqabala”. 

Nel medioevo (e forse anche per qualche studente di oggi!!!), si pensava che questa parola derivasse dal greco algiros (panico, dolore) 

e arithmos (numero). 

161


G la lista degli ingredienti 

G la sequenza dei passi da fare per realizzare la ricetta 

Nel realizzare una ricetta si possono avere problemi nel cercare alcuni ingredienti. Una parte dell’esecuzione 

richiederà poco tempo, altre parti richiederanno più tempo. Alcuni passi non richiedono che si segua un 

certo ordine, altri passi richiedono che si mantenga l’ordine scritto sulla ricetta. . . Le stesse analogie troviamo 

in un algoritmo. 

11.4 Elementi di un linguaggio di programmazione 

Come tutti i linguaggi, anche un linguaggio di programmazione ha le sue regole di grammatica, sintassi, 

ortografia. . . 

Inoltre, un programma non può essere ambiguo, in quanto diventa il preciso risultato delle istruzioni in 

esse contenute. 

Alcune attività (non di programmazione) possono essere vaghe o ambigue: 

studia molto per superare l’esame. . . – quanto molto? 

compra un po’ di pane prima di tornare a casa. . . – quanto pane? 

Siamo noi che capiamo quanto dobbiamo studiare, quanto pane dobbiamo comprare, a seconda dell’esame 

da fare, della fame che abbiamo. . . 

In un programma non si può lasciare spazio al vago! Occorre essere precisi. 

I linguaggi di programmazione sono fatti da dichiarazioni (statements): 

G descrizione dei dati: che genere di dati abbiamo? Se vogliamo scrivere un programma in cui per ogni 

studente calcoliamo la media dei suoi voti, c’è un’ovvia differenza tra i nomi degli studenti (una stringa 

di caratteri) e la loro media (un numero). Si parla di tipo di dati. 

G strutture di controllo. Un programma può essere visto come una sequenza di istruzioni per risolvere 

un certo problema. Alcune istruzioni vanno ripetute, altre vanno eseguite solo in determinate 

condizioni. . . 

G lavorazione dei dati (data processing). In un programma occorre poter lavorare sui dati e poterli 

”manipolare” opportunamente. 

G dichiarazioni di ingresso e uscita (input e output). In genere, un programma è scritto in modo che i 

dati su cui si lavora possano esistere fuori del programma stesso. 

11.5 Prime regole sul FORTRAN77 

Scriviamo il nostro primo programma di prova, prova.f (apriamo un editor di testo e scriviamo le 

seguenti righe, poi salviamo il file dando il nome prova.f): 

program prova 

C 

C questo e ’ un programma di prova 

C 

write ( * , * ) ’programma di prova ’ 

write ( * , * ) ’ questo e ’ ’ un programma di prova ’ 

stop 

end 

G In FORTRAN77 tutte le istruzioni vanno scritte tra la 7-ima e la 72-sima colonna 7 ; 

G le colonne da 1 a 6 hanno un significato particolare. 

– sulla prima colonna si mette una C (o un altro carattere) se ciò che segue è una riga di commento 

7 Questo limite è dovuto al fatto che fino alla fine degli anni settanta, la programmazione veniva fatta utilizzato schede perforate, dei 

cartoncini rettangolari di dimensione standard, ciascuna delle quali era suddivisa in un numero fisso di colonne e righe (generalmente 

80 colonne e 12 righe). 

162

11.6. Le variabili 

– sulla colonna 6 si mette un carattere qualunque (meglio una lettera dell’alfabeto) se l’istruzione 

scritta sulla riga precedente è troppo lunga e va oltre la 72-sima colonna per cui si deve andare a 

capo oppure si vuole andare a capo per leggere meglio l’istruzione. Nella riga in cui si mette un 

carattere sulla colonna 6, continua l’istruzione dalla riga precedente. 

G Il programma inizia con l’istruzione program seguito dal nome del programma. 

G L’istruzione stop arresta l’esecuzione del programma. 

G L’istruzione end segnala che non vi sono altre righe nel programma. 

Con questo programma di esempio, vogliamo far scrivere al computer, sulla finestra di shell in cui eseguiamo 

il programma, le due frasi programma di prova e questo e’ un programma di prova. 

L’istruzione write(*,*) ’programma di prova’ 

rende disponibile all’esterno le informazioni contenute tra i due apici, vale a dire la stringa di caratteri 

programma di prova. 

Al posto di write(*,*) ’programma di prova’ potremmo scrivere, in modo del tutto equivalente, 

write(6,*) ’programma di prova’ 

Il primo simbolo “*” di write(*,*) o il numero “6” di write(6,*) sono due modi equivalenti per 

indicare che il dispositivo di uscita su cui mostrare la stringa di caratteri è il terminale (la finestra di shell da 

cui eseguiamo il programma). 

Vedremo che ci sono anche altri modi per rendere disponibile l’output del programma non su video ma 

su file. 

L’apice viene usato per indicare l’inizio e la fine della stringa di caratteri da stampare. Quindi, per stampare 

e’ dobbiamo usare gli apici due volte: 

write(*,*) ’questo e’’ un programma di prova’ 

11.6 Le variabili 

Scriviamo ora un programma più complicato 

program a r e a t r i a 

C programma per c a l c o l a r e l ’ area di un triangolo 

C dando in input i v a l o r i della base e dell ’ altezza 

implicit none 

real *8 a , b , area 

write ( * , * ) ’ base a ’ 

read ( * , * ) a 

write ( * , * ) ’ base ’ , a 

write ( * , * ) ’ altezza b ’ 

read ( * , * ) b 

write ( * , * ) ’ altezza ’ , b 

area =(a*b ) * 0 . 5 

write ( * , * ) ’ area del triangolo ’ , area 

stop 

end 

G L’istruzione implicit none dice che nessuna variabile può essere dichiarata implicitamente: 

dobbiamo dichiarare tutte le variabili che utilizziamo all’interno del programma! 

G Introduciamo tre variabili di tipo reale in doppia precisione, mediante real*8 a,b,c. 

G Con read(*,*) a si impone al calcolatore di prendere un valore e memorizzarlo nella variabile a, e 

questo valore lo si dà tramite tastiera. Analogamente potremmo scrivere read(5,*) a: il numero 5 

indica che l’acquisizione dei dati avviene da tastiera. 

G Prima dell’istruzione di read c’è una write che ci indica quale valore dobbiamo mettere: è importante 

altrimenti vedremmo che l’elaboratore si mette in attesa di un valore e rimane così fino a quando non 

lo riceve. Ma se noi non sappiamo che valore dargli, possiamo aspettare anche ore. . . . (vedere cosa 

succede togliendo le istruzioni di write!) 

163


integer 

real 

real*8 

double precision 

logical 

character 

variabile intera 

variabile reale in precisione semplice 

variabile reale in doppia precisione 

(occupa esattamente 8 byte 

di memoria) 

variabile reale in doppia precisione 

(accuratezza diversa a seconda 

della macchina usata) 

variabile logica 

stringhe di caratteri 

Tabella 11.1: Tipi di dati 

G Una volta dati i valori di input, si effettua un’istruzione di assegnazione: si prende il valore memorizzato 

nella variabile a lo si moltiplica per il valore di b e per 0.5 e il risultato viene memorizzato in una nuova 

variabile chiamata area. Il simbolo * è il simbolo di moltiplicazione. 

G Quando effettuiamo un’assegnazione, il valore contenuto nella variabile a sinistra del segno = viene 

perso. Nel nostro caso, in area non era memorizzato nessun valore, ma se avessimo posto in area un 

qualche valore iniziale, esso andrebbe perso perchè sostituito dall’operazione a*b*0.5. I valori di a e 

b non cambiano. 

G Nel momento in cui viene lanciato il programma, il valore delle variabili è incognito. Mediante tastiera, 

noi diamo i valori ad a e b. Mediante assegnazione, diamo il valore ad area. Una volta terminata l’esecuzione 

del programma, il valore delle variabili torna ad essere incognito. Perciò ci facciamo stampare 

il loro valore prima dell’istruzione di stop. 

11.7 I tipi di dati 

Una variabile rappresenta un ”posto” (o locazione) della memoria del calcolatore, contrassegnato da 

un nome che identifica la variabile, e dove possono essere scritte delle informazioni che l’elaboratore può 

utilizzare (per esempio il valore della variabile se la variabile è di tipo reale o intero). 

Le variabili possono essere di vario tipo: intere, reali, logiche (per le variabili logiche il valore può essere 

solo o vero o falso), complesse, di caratteri (stringhe di caratteri). 

Le variabili di tipi intero possono variare in un intervallo limitato (tra un minimo e un massimo interi 

rappresentabili). La stessa cosa vale per le variabili di tipo reale: esiste un valore minimo e massimo reale 

rappresentabile. Questi valori di minimo e massimo dipendono dall’elaboratore (si veda il Capitolo 1). 

G Osserviamo che in FORTRAN una variabile può essere scritta con i caratteri maiuscoli o minuscoli 

senza distizioni: XOLD è la stessa cosa di xold o XoLd. 

11.8 Espressioni aritmetiche e funzioni elementari 

∗∗ elevamento a potenza 

∗ moltiplicazione 

/ divisione 

+ addizione 

− sottrazione 

Tabella 11.2: Operazioni aritmetiche 

164

11.9. I predicati elementari 

Funzione FORTRAN 

sin(x) 

cos(x) 

tan(x) 

asin(x) 

acos(x) 

atan(x) 

exp(x) 

log(x) 

log10(x) 

sqrt(x) 

Significato 

sin(x) 

cos(x) 

tan(x) 

asi n(x) 

acos(x) 

at an(x) 

e x 

ln(x) 

log(x) 

x 

Tabella 11.3: Principali funzioni 

Nel fare le operazioni matematiche, in FORTRAN viene data la precedenza (priorità) agli elevamenti a 

potenza, poi alle moltiplicazioni e divisioni, infine a sottrazione e addizione. Quando due operatori hanno la 

stessa priorità vengono eseguite le operazioni partendo da sinistra e andando verso destra. Tuttavia, quando 

le espressioni sono abbastanza complicate e c’è il rischio di non capire bene quali operazioni vanno fatte 

prima e quali dopo, conviene mettere sempre le parentesi. 

In FORTRAN ci sono già molte funzioni matematiche che possiamo utilizzare per i nostri programmi. In 

Tabella 11.8, vediamo le principali funzioni. 

11.9 I predicati elementari 

Gli algoritmi che tradurremo in programmi quasi mai hanno solo istruzioni sequenziali (vale a dire istruzioni 

da eseguire l’una di seguito all’altra). Molte volte, infatti, viene eseguita una istruzione piuttosto che 

un’altra se certe condizioni sono vere. Oppure vengono ripetute alcune istruzioni fintantochè sono vere determinate 

condizioni. Gli operatori mostrati in Tabella 11.9 ci serviranno per poter scrivere istruzioni legate 

ad una condizione. 

Operatore Significato Esempio Valore 

.GT. > (a.gt.b) Vero se a > b 

Falso se a ≤ b 

.GE. >= (a.ge.b) Vero se a ≥ b 

Falso se a < b 

.LT. < (a.lt.b) Vero se a < b 

Falso se a ≥ b 

.LE. b 

.EQ. == (a.eq.b) Vero se a = b 

Falso se a ≠ b 

.NE. ∼= (a.ne.b) Vero se a ≠ b 

Falso se a = b 

Tabella 11.4: Operatori logici ( È la stessa cosa scrivere .GT. o .gt. .GE. o .ge. e così via.) 

Dato P un predicato (vale a dire una proposizione logica che può assumere solo valore vero o falso) si 

hanno gli operatori logici di Tabella 11.9. 

165


Operatore Significato Esempio 

.NOT. negazione .not.(P) 

∼ 

.AND. congiunzione (P1).and.(P2) 

& 

.OR. disgiunzione (P1).or.(P2) 

inclusiva 

| 

Tabella 11.5: Operatori logici 

Esempio 11.9.1 Sia a=5 e b=10. 

G La proposizione (a.le.b) è una proposizione vera (.true.) perchè il valore assunto da a (5) è minore o 

uguale al valore di b (10). 

G La proposizione (a.eq.b) è falsa (.false.) perchè il valore di a è diverso da quello di b 

G La proposizione (a.gt.b) è falsa. 

G La proposizione (a.ge.b) è falsa. 

G La proposizione (a.ne.b) è vera. 

G La proposizione (a.lt.b) è vera. 

Esempio 11.9.2 Sia a=5, b=10, c=2 

G (a.le.b).and.(c.le.b) è una proposizione vera perchè composta da due proposizioni vere 

G .not.(a.le.b) è una proposizione falsa. Negare (a.le.b) vuol dire scrivere (a.gt.b). Ma a non è maggiore 

stretto di b, quindi il risultato è falso. 

G .not.(b.eq.c) è una proposizione vera, in quanto stiamo negando (b.eq.c): (b.eq.c) è falsa quindi la sua 

negazione è vera. 

G (a.le.b).or.(c.ge.b) è una proposizione vera perchè basta che una delle due proposizioni sia vera per 

rendere vero l’intero predicato. 

G (a.le.b).and.(c.ge.b) è un predicato falso perchè devono essere vere tutte e due le proposizioni che la 

compongono per rendere vero il predicato. 

G (a.eq.b).and.(c.ge.b) è un predicato falso perchè composto da due proposizioni false. 

G (a.eq.b).or.(c.ge.b) è un predicato falso. 

Riassumendo 

G Negare un predicato falso dà come risultato un predicato vero. 

G Negare un predicato vero dà come risultato un predicato falso. 

G Congiungere (con .and.) due predicati veri dà come risultato un predicato vero. 

G Congiungere (con .and.) due predicati falsi dà come risultato un predicato falso. 

G Congiungere (con .and.) due predicati, uno vero ed uno falso, dà come risultato un predicato falso. 

G Disgiungere (con .or.) due predicati veri dà come risultato un predicato vero. 

G Disgiungere (con .or.) due predicati falsi dà come risultato un predicato falso. 

G Disgiungere (con .or.) due predicati, uno vero ed uno falso, dà come risultato un predicato vero. 

Importanti sono da ricordare le regole di De Morgan. Dati due predicati P1 e P2 

166

11.10. Struttura alternativa 

G ( .not. ( (P1).and.(P2) ) equivale a scrivere ( .not.(P1) .or. .not.(P2) ) 

Negare una congiunzione significa disgiungere le negazioni dei due predicati che la compongono. 

G ( .not. ( (P1).or.(P2) ) equivale a scrivere ( .not.(P1) .and. .not.(P2) ) 

Negare una disgiunzione significa congiungere la negazione dei due predicati che la compongono. 

Esempio 11.9.3 (.not.( (oggi fa freddo).and.(oggi è piovuto) ) ) = 

(oggi NON fa freddo) .or. (oggi NON è piovuto) 

(.not.( (oggi fa freddo).or.(oggi NON ho voglia di fare niente) ) ) = 

(oggi NON fa freddo) .and. (oggi ho voglia di fare tante cose) 

(.not.( it.le.100). and. ( x.ge.0.001) ) ) = ( (it.gt.100). or. (x.lt.0.001) ) 

(.not.( it.le.100). or. ( x.ge.0.001) ) ) = ( (it.gt.100). and. (x.lt.0.001) ) 

program p r e d i c a t i l o g i c i 

C programma di esempio s u l l e proposizioni logiche 

implicit none 

real *8 a , b , c 

l o g i c a l p1 , p2 , p 

write ( * , * ) ’ s c r i v i i l valore di a ’ 

read ( * , * ) a 

write ( * , * ) ’ a= ’ , a 

write ( * , * ) ’ s c r i v i i l valore di b ’ 

read ( * , * ) b 

write ( * , * ) ’b= ’ , b 

write ( * , * ) ’ s c r i v i i l valore di c ’ 

read ( * , * ) c 

write ( * , * ) ’ c= ’ , c 

p1= ( a . l t . b) 

p2=(b . gt . c ) 

write ( * , * ) ’p1= a . l t . b ’ , p1 

write ( * , * ) ’p2= b . gt . c ’ , p2 

p= p1 . and . p2 

write ( * , * ) ’p1 and p2 ’ , p 

p= . not . ( p1 . and . p2 ) 

write ( * , * ) ’ not ( p1 and p2 ) ’ , p 

p= p1 . or . p2 

write ( * , * ) ’p1 or p2 ’ , p 

p= . not . ( p1 . or . p2 ) 

write ( * , * ) ’ not ( p1 or p2 ) ’ , p 

stop 

end 

11.10 Struttura alternativa 

I programmi in cui le istruzioni devono essere eseguite una di seguito all’altra si dicono a struttura sequenziale. 

Questa struttura è pero abbastanza limitata in quanto non permette di risolvere problemi anche 

semplici. 

Supponiamo di risolvere il problema di trovare le radici di un’equazione di secondo grado ax 2 +bx +c = 0. 

G i dati di input sono i coefficienti a,b,c 

167


Ciclo if 

G si calcola il discriminante ∆ = b 2 − 4ac 

G se ∆ < 0 allora le radici sono complesse 

G se ∆ = 0 allora sappiamo che le radici coincidono 

G se ∆ > 0 allora applichiamo la formula per trovare le due radici. Sappiamo però che si può verificare 

il fenomeno di cancellazione numerica se b 2 − 4ac ≈ b 2 e quindi possiamo applicare una formula 

alternativa. . . 

Come fare a scrivere un programma che tenga conto di tutte le condizioni che abbiamo visto prima, che 

faccia quindi qualcosa piuttosto che un’altra a seconda che sia vera o falsa una certa condizione? Si ha il 

cosidetto ciclo if. 

i f ( espressione logica ) then 

{ istruzione 1a } 


{ . . . . } 

else 

{ istruzione 1b } 


{ . . . . } 

end i f 

Se è vera l’espressione logica allora si 

eseguono le istruzioni 1a, 2a, . . . . 

Altrimenti – cioè se è falsa l’espressione 

logica – allora si eseguono le istruzioni 1b, 

2b, . . . 

i f ( espressione logica ) then 



{ . . . . } 

end i f 

Se è vera l’espressione logica allora si eseguono 

le istruzioni 1a, 2a, . . . , altrimenti 

non si fa nulla. 

Ciclo if – 

struttura più 

generale 

i f ( espressione logica1 ) then 



{ . . . . } 

else i f ( espressione logica2 ) then 



{ . . . . } 

. . . . 

else 

{ istruzione 1z } 


{ . . . . } 

end i f 

Vediamo un programma che calcola le radici di un’equazione di secondo grado. 

program r a d i c i 

implicit none 

real a , b , c , delta 

real x1 , x2 

C calcolo d e l l e r a d i c i r e a l i di ax **2 +bx+c = 0 

168

11.10. Struttura alternativa 

C x = [−b +/− s q r t { b**2 − 4ac } ] / 2a 

C 

write ( * , * ) ’ c o e f f i c i e n t i di un’ ’ equazione di secondo grado ’ 

write ( * , * ) ’ a = ’ 

read ( * , * ) a 

write ( * , * ) ’ a = ’ , a 

write ( * , * ) ’b = ’ 

read ( * , * ) b 

write ( * , * ) ’b = ’ , b 

write ( * , * ) ’ c = ’ 

read ( * , * ) c 

write ( * , * ) ’ c = ’ , c 

delta=b**2 − 4 . * a* c 

i f ( delta . l t . 0 ) then 

write ( * , * ) ’ l e r a d i c i sono complesse ’ 

else 

x1= ( −b + sqrt ( delta ) ) / ( 2 . * a ) 

write ( * , * ) ’ x1 = ’ , x1 

x2= ( −b − sqrt ( delta ) ) / ( 2 . * a ) 

write ( * , * ) ’ x2 = ’ , x2 

end i f 

stop 

end 

Complichiamo la seconda parte del programma, andando a scrivere le radici coincidenti nel caso in cui 

∆ = 0 e utilizzando la formula alternativa (dalla considerazione che x 1 x 2 = c/a) per evitare il fenomeno di 

cancellazione numerica. 

i f ( delta . l t . 0 ) then 

write ( * , * ) ’ l e r a d i c i sono complesse ’ 

else i f ( delta . eq . 0 . d0 ) then 

x1= −b/ ( 2 . 0 d0*a ) 

x2=x1 

write ( * , * ) ’ l e r a d i c i sono : ’ , x1 , x2 

else 

x1= ( −b + sqrt ( delta ) ) / ( 2 . * a ) 

x2= ( −b − sqrt ( delta ) ) / ( 2 . * a ) 

write ( * , * ) ’ l e r a d i c i sono : ’ , x1 , x2 

i f ( ab ( x1 ) . gt . abs ( x2 ) ) then 

x2= c / ( x1 *a ) 

write ( * , * ) ’ x2 con formula a lternativa ’ , x2 

else 

x1= c / ( x2 *a ) 

write ( * , * ) ’ x1 con formula a lternativa ’ , x1 

end i f 

end i f 

Il ciclo if non basta per scrivere tutti i nostri programmi. Pensiamo ad un blocco di istruzioni da ripetere 

molte volte, fino a quando è vera una determinata condizione. In questo caso, si usa il ciclo do while 

(pensiamo all’algoritmo visto per il metodo di bisezione, o allo schema di punto fisso). 

Ciclo do 

while 

169


do while ( espressione logica ) 

{ istruzione 1 } 


{ . . . } 

{ istruzione n } 

end do 

Fintantochè è vera l’espressione logica 

allora esegui istruzione 1, 2, . . . , n. 

Le istruzioni 1, 2, . . . vengono ripetute ciclicamente (non una volta sola come nel ciclo if). Quando si 

esegue l’ultima istruzione posta all’interno del ciclo, si torna all’espressione logica e si controlla se è vera o 

falsa. Se è vera, si eseguono di nuovo le istruzioni 1, 2, . . . ,n. Se non è vera, si esce dal ciclo while. Occorre 

dunque prestare attenzione a non creare cicli infiniti! 

11.11 Programma sul metodo di punto fisso 

Consideriamo l’algoritmo dello schema di punto fisso 

x n+1 = cos(x n ) 

e proviamo a scrivere un programma FORTRAN che ci permetta di trovare una buona approssimazione del 

punto fisso ξ (sempre che lo schema converga). I dati di input che dobbiamo dare al programma sono: 

G l’approssimazione iniziale x 0 

G la tolleranza ε con cui vogliamo approssimare il punto fisso 

G il numero massimo di iterazioni entro cui cercare la convergenza dello schema (per evitare cicli infiniti) 

I dati di output che possiamo chiedere al programma sono: 

G l’approssimazione x n+1 ad ogni passo 

G l’iterazione n 

G lo scarto ad ogni passo: |x n+1 − x n | 

G una stima della costante asintotica dell’errore M 

Cerchiamo ora di capire come gestire le variabili per x n e x n+1 e per gli scarti ad ogni passo. Con il metodo 

di punto fisso, si crea una successione di valori: x 0 , x 1 , x 2 , . . . x n . . . . Nella teoria, per n che tende all’infinito, 

la successione può convergere al punto fisso. Nella pratica ci si arresta quando lo scarto (il valore assoluto tra 

due iterazioni successive) è minore di una certa tolleranza. A priori, tuttavia, non sappiamo quante iterazioni 

dobbiamo fare. Potremmo pensare di memorizzare le varie approssimazioni x n in un vettore che abbia una 

dimensione molto elevata. Ma ci sono due inconvenienti: 

1. Non sappiamo ancora come scrivere in un programma FORTRAN un vettore 

2. Supposto di saperlo fare, possiamo e dobbiamo evitarlo perchè non serve conservare in memoria tutti 

le approssimazioni che generiamo (x n+1 dipende dal valore x n e basta). Se ci interessano i valori generati 

dall’algoritmo, li possiamo scrivere di volta in volta sul video (meglio su un file! vedremo poi come 

scrivere dati di output su un file). 

Lavoreremo facendo uso di due variabili: xold che corrisponde a x n e xnew che corrisponde a x n+1 . Diamo 

in input il valore iniziale x 0 . Dobbiamo effettuare la prima iterazione cioè trovare x 1 = cos(x 0 ). 

G Porremo xold=x0 e poi xnew= cos(xold) per l’iterazione it=1. xnew ha il significato di x 1 . 

G Una volta fatta la prima iterazione, il valore di xold=x0 non ci interessa più. Per it=it+1=2, ci serve 

calcolare x 2 = cos(x 1 ). Proprio perchè il valore di xold non serve più assegniamo a xold il valore 

calcolato per x 1 =xnew in modo da poter sfruttare la relazione di prima. Applicheremo di nuovo la 

formula xnew= cos(xold) dove ora xnew ha il significato di x 2 e xold di x 1 . 

G Alla fine del secondo passo, quindi xnew=x 2 e xold=x 1 

G Ora x 1 non serve più. Per it=it+1=3, ci serve solo x 2 . Perciò faremo xold=xnew, xnew=cos(xold) 

e avremo xnew=x 3 . E così via. . . 

170

11.11. Programma sul metodo di punto fisso 

xold=x0 

i t e r =0 

scartonew =2.0d0* t o l l 

do while ( ( scartonew . ge . t o l l ) . and . ( i t e r . l e . itmax ) ) 

i t e r = i t e r +1 

xnew=cos ( xold ) 

scartonew=abs (xnew− xold ) 

write ( * , * ) i t e r , xnew 

xold=xnew 

end do 

Quando si entra nel ciclo do while scartonew=2.0d0*toll > toll e iter=0< itmax. Si eseguono le 

istruzioni del ciclo do while fino a quando rimane vera la proposizione (scartonew.ge.toll) .and. 

(iter.le.itmax) . Si esce dal ciclo do while quando scartonew < toll oppure quando iter > 

itmax. 

|ξ − x n | 

Sappiamo che, per lo schema di punto fisso, vale lim n→∞ = M = |g ′ (ξ)|. Poichè non conosciamo 

|ξ − x n−1 

l’errore, ma possiamo calcolare lo scarto e, per n → ∞, vale |ξ − x n | ≈ |x n − x n−1 |, abbiamo due modi per 

stimare M: 

1. calcolare il rapporto tra gli scarti a due passi successivi 

2. calcolare |g ′ (x n )| 

Per calcolare il rapporto tra gli scarti a due passi successivi introduciamo due variabili, che chiamiamo 

scartold e scartonew che corrispondono, rispettivamente, a |x n−1 −x n−2 | e |x n −x n−1 |. Le aggiorniamo in 

maniera del tutto analoga a quanto visto per xold e xnew. All’inizio, assegniamo a scartonew un valore più 

grande della tolleranza per fare in modo che si entri nel ciclo while senza problemi. Nel codice calcoliamo 

quindi due stime di M, utilizzando le variabili che chiamiamo asint1 e asint2. 

Vediamo il codice completo. 

program puntofisso 

C programma per i l calcolo del punto f i s s o per g ( x)= cos ( x ) in [ 0 , pi / 2 ] 

implicit none 

C 

C s i g n i f i c a t o d e l l e v a r i a b i l i 

C i t e r : i t e r a z i o n e del metodo del punto f i s s o 

C itmax : numero massimo di i t e r a z i o n i 

C t o l l : tolleranza p r e f i s s a t a per l ’ approssimazione 

C del punto f i s s o 

C x0 : punto i n i z i a l e della successione 

C xold : approssimazione al passo k 

C xnew : approssimazione al passo k+1 

C s c a r t o l d : scarto all ’ i t e r a t a precedente 

C scartonew : valore assoluto tra l ’ i t e r a t a corrente e quella al 

C passo precedente 

C asint1 : scartonew / s c a r t o l d − approssimazione di M 

C asint2 : abs(− sin (xnew ) ) − approssimazione di M 

integer i t e r , itmax 

real *8 x0 , xold , xnew , scartold , scartonew , t o l l 

real *8 asint1 , asint2 

write ( * , * ) ’ approssimazione i n i z i a l e ’ 

read ( * , * ) x0 

write ( * , * ) ’ x0 = ’ , x0 

itmax=100 

t o l l =1.d−10 

scartonew =2.0* t o l l 

scartold=scartonew 

i t e r = 0 

171


xold=x0 

write ( * , * ) ’ i t xnew scarto 

1 asint1 asint2 ’ 

write ( * , * ) i t e r , xold , scartonew 


i t e r = i t e r +1 

xnew=cos ( xold ) 


asint1= scartonew/ scartold 

asint2=abs(− sin (xnew ) ) 

write ( * , * ) i t e r , xnew , scartonew , asint1 , asint2 

xold=xnew 


end do 

stop 

end 

11.12 I sottoprogrammi 

Quando l’algoritmo e il problema su cui stiamo lavorando sono complicati, conviene spezzare il problema 

in sottoproblemi in modo da semplificare la programmazione. 

Analogamente, al posto di avere un unico programma in FORTRAN, conviene scrivere il programma 

facendo uso di sottoprogrammi. Si hanno due tipi di sottoprogrammi in FORTRAN: 

G subroutines 

G functions 

In tal modo un programma FORTRAN può risultare composto da: 

G programma principale 

G una o più subroutines 

G una o più functions 

11.12.1 Le functions 

Esempio di 

function gfun 

Il programma che abbiamo scritto funziona bene ma ha un punto debole: se vogliamo applicare lo schema 

di punto fisso ad un’altra funzione g , dobbiamo andare a cambiare le istruzioni xnew=cos(xold) e 

asint2=abs(-sin(xnew)). E se la funzione è complicata? E se dobbiamo valutare la stessa funzione (o le 

stesse funzioni) anche su altre parti del programma? 

Introduciamo il concetto di function in FORTRAN. Una function è del tutto simile al concetto di 

funzione scalare, che può essere definita in un sottoinsieme di R n ma ha valori in R. Difatti una function 

può avere uno o più dati di input e un solo dato di output. 

Vediamo come scrivere il programma precedente facendo uso delle functions. 

Nello stesso file (per semplicità) in cui abbiamo scritto il programma principale fisso.f, dopo le istruzioni 

stop e end che chiudono il programma principale, dopo aver lasciato qualche riga bianca per mostrare che 

finisce il programma principale, andremo a scrivere la nostra prima function 

stop 

end 

C f i n e del programma principale 

real *8 function gfun ( x ) 

C funzione di punto f i s s o 

implicit none 

real *8 x 

gfun=cos ( x ) 

return 

end 

172

11.12. I sottoprogrammi 

La funzione che stiamo scrivendo è di tipo real*8 ed è la prima cosa che scriviamo per identificarla. C’è poi 

la parola function e poi gfun(x). gfun ha un duplice significato: è il nome della function ma è anche 

il nome della variabile che contiene il risultato dell’esecuzione della function gfun. 

Il corpo della function è del tutto analogo a quello che si fa in un programma principale: implicit none, 

dichiarazione delle variabili, istruzioni. Tutte le istruzioni servono ad assegnare il valore alla variabile gfun. 

La function termina con le istruzioni return (per ritornare nel programma da cui è stata chiamata) e 

end. 

La funzione in questo caso dipende da una sola variabile, che chiamiamo x. La variabile (o le variabili) 

da cui dipende una function deve essere dello stesso tipo (dichiarata allo stesso modo) sia all’interno della 

function sia nel programma principale, ma può avere nomi diversi (x, xold). Per la derivata prima la 

function è la seguente: 

real *8 function dgfun ( x ) 

C derivata della funzione di punto f i s s o 

implicit none 

real *8 x 

dgfun= −sin ( x ) 

return 

end 

Come cambia il programma principale? 

Nella dichiarazione delle variabili dobbiamo dichiarare le due function gfun e dgfun 




real *8 gfun , dgfun 

Un’altra istruzione (opzionale) è dire che ci sono due sottoprogrammi esterni al programma principale, 

subito dopo la dichiarazione delle variabili: 





external gfun , dgfun 

Infine, nel ciclo while, dove abbiamo bisogno della funzione di punto fisso e della sua derivata, si ha: 


i t e r = i t e r +1 

xnew=gfun ( xold ) 



asint2=abs ( dgfun (xnew ) ) 

write ( * , * ) i t e r , xnew , scartonew , asint1 , asint2 

xold=xnew 


end do 


function 

dgfun 

G Una function, dunque, è un sottoprogramma del programma principale. 

G Una function viene chiamata direttamente: xnew=gfun(xold). 

G La function restituisce un valore ben preciso - il valore assunto dalla funzione stessa in funzione dei 

parametri. Perciò deve essere dichiarato il tipo della function (integer, real, real*8, . . . ) 

G La function restituisce un solo valore: gfun=cos(x). 

G La function può avere uno o più parametri in ingresso. 

G Per scrivere una function si usa l’istruzione di implicit none, si dichiarano tutte le variabili che 

sono usate all’interno della function, si scrivono tutte le istruzioni che servono (anche cicli if, o while 

se occorrono). 

G La function termina con le istruzioni di return e end. 

173


11.12.2 Le subroutines 

Possiamo pensare di cambiare ancora il programma per l’approssimazione del punto fisso, utilizzando 

un diverso approccio: la parte che riguarda le iterazioni dello schema del punto fisso la facciamo fare ad un 

sottoprogramma che chiameremo, in qualche modo, nel programma principale. Scomporre il programma 

principale in più sottoprogrammi ha il suo vantaggio nel momento in cui gli algoritmi che dobbiamo implementare 

diventano via via più complicati, oppure se una parte di un programma viene ripetuta più volte (e 

anzichè scrivere righe e righe di istruzioni da eseguire, le scriviamo solo una volta nel sottoprogramma e poi 

le richiamiamo dove occorre). 


implicit none 



external i t e r p f i s s o 


read ( * , * ) x0 

write ( * , * ) ’ x0 = ’ , x0 

itmax=100 

t o l l =1.d−10 

scartonew =2.0* t o l l 


i t e r = 0 

xold=x0 

write ( * , * ) ’ i t xkp1 scarto 

1 asint1 asint2 ’ 

write ( * , * ) i t e r , xold , scartonew 

c a l l i t e r p f i s s o ( i t e r , itmax , xold , t o l l , scartonew , scartold , xnew) 

write ( * , * ) ’ approssimazione f i n a l e ’ , xnew 

stop 

end 

Osserviamo che la subroutine è chiamata tramite l’istruzione 

call iterpfisso( iter ,itmax,xold,toll,scartonew,scartold,xnew) 

Abbiamo parametri di input: iter, itmax, xold, toll, scartonew, scartold 

G Ci sono parametri di output: xnew 

Alcuni dei parametri di input, vengono modificati all’interno della subroutine, altri no. 

G Nella dichiarazione delle variabili, non ci sono più le variabili che usiamo solo all’interno della 

subroutine (asint1, asint2, le due functions gfun e dgfun). 

Per scrivere la subroutine, lasciamo qualche riga vuota dopo le istruzioni stop e end del programma principale 

e scriviamo la subroutine prima delle functions (o dopo, non cambia niente). L’importante è che si 

scriva tutto il programma principale completo, tutta la/le subroutine complete, tutte la/le functions complete 

(senza che pezzi di subroutine o di functions o di programma principale si intersechino tra di loro nella 

scrittura!!!!) 


subroutine: 

iterpfisso subroutine i t e r p f i s s o ( i t e r , itmax , xold , t o l l , scnew , scold , xnew) 

C sottoprogramma che implementa l ’ algoritmo del metodo di punto f i s s o 

implicit none 


real *8 xnew , xold , t o l l , scnew , scold , asint1 , asint2 


external gfun , dgfun 

do while ( ( scnew . ge . t o l l ) . and . ( i t e r . l e . itmax ) ) 

i t e r = i t e r +1 


scnew=abs (xnew− xold ) 

asint1= scnew/ scold 

174

11.13. Il formato 


write ( * , * ) i t e r , xnew , scnew , asint1 , asint2 

xold=xnew 

scold=scnew 

end do 

return 

end 

G Una subroutine inizia con l’istruzione subroutine nomesubroutine(lista di parametri) 

G il nome delle subroutine non può essere uguale a quello di altre variabili utilizzate; 

G il “corpo” della subroutine è analogo a quello di un programma principale (implicit none, dichiarazione 

delle variabili, istruzioni, cicli. . . ); 

G la subroutine si chiude con le istruzioni return e end 

G la subroutine è chiamata nel programma principale tramite l’istruzione 

call nomesubroutine(parametri) 

Il fatto che noi chiamiamo una subroutine nel programma principale (call) dice che la subroutine non è un 

programma a sè stante. Quando termina l’esecuzione di ciò che è scritto all’interno della subroutine si torna 

indietro nel programma principale e si continua l’elaborazione da quel punto. L’istruzione return fa tornare 

al programma principale. Le variabili non devono avere necessariamente lo stesso nome nel programma 

principale e nella subroutine. Per esempio, possiamo scrivere: 

call iterpfisso( iter ,itmax,xold,toll,scartonew,scartold,xnew) nel programma principale 

subroutine iterpfisso(it,imx,xold,toll,scnew,scold,xnew) nella subroutine. 

L’importante è che le variabili abbiamo lo stesso significato (stesso tipo di variabile, ma anche 

stessa valenza di variabile) e devono essere messe nello stesso ordine: se per sbaglio scriviamo 

call iterpfisso(itmax,iter,xold,toll ,scartonew,scartold,xnew) nel programma principale ma poi nella subroutine 

scriviamo subroutine iterpfisso(it,imx,xold,toll,scnew,scold,xnew) , 

all’interno della subroutine io vado ad assegnare a it il valore che passato (che è quello di itmax), mentre a 

imx andiamo a passare il valore di iter (che è zero all’inizio). . . .. 

All’interno della subroutine si possono utilizzare altre variabili oltre a quelle che sono presenti tra i parametri 

della stessa. L’importante è dichiararle nella subroutine. Tali variabili non passano nel programma 

principale ma sono usate solo nella subroutine. Vedasi asint1, asint2, gfun, dgfun. 

11.13 Il formato 

Fino ad ora abbiamo stampato i risultati dei nostri programmi su video e senza aver dato nessuna 

indicazione su come visualizzare i dati. 

Per avere un output elegante e ordinato, conviene usare l’istruzione format. 

Vediamo questa istruzione direttamente all’interno di un programma d’esempio (quello del punto fisso 

appena visto nelle le righe di codice relative al ciclo do while, il resto rimane invariato) 


i t e r = i t e r +1 





write ( * , 1 0 0 ) i t e r , xnew , scartonew , asint1 , asint2 

xold=xnew 


end do 

100 format (1 x , i4 , 1 x , f15 .12 ,1 x , e14 . 6 , 1x , 2e13 . 5 ) 

Programma 

di punto fisso 

con 

l’istruzione 

format 

Nell’istruzione write, non abbiamo scritto write(*,*) ma write(*,100). Al posto del secondo 

simbolo * abbiamo messo un numero (un’etichetta). 

175


Questo numero lo si trova scritto alla fine del ciclo while (ma possiamo metterlo ovunque all’interno del 

programma - dopo la dichiarazione delle variabili e prima della end finale) a partire dalla seconda colonna. 

Dopo aver scritto il numero che contraddistingue il formato, abbiamo l’istruzione format e, tra parentesi, 

abbiamo tutte le indicazioni su come rappresentare le variabili della stampa cui ci si riferisce: 

format(1x,i4,1x,f15.12,1x,e14.6,1x,2e13.5) 

Nell’esempio particolare: 

G 1x significa: lascia uno spazio bianco sulla riga; 

G i4 significa: 4 caratteri riservati per la prima variabile che è di tipo intero (iter); 

G f15.12 : scrivi il valore della variabile xnew in formato fisso, riservando 15 caratteri per il numero di cui 

12 per la parte decimale; 

G e14.6: scrivi il valore di scartonew in formato esponenziale, riservando 14 caratteri per il numero, di 

cui 6 per la mantissa; 

G 2e13.5 : scrivi i 2 numeri successivi asint1 e asint2 nello stesso formato esponenziale, riservando a 

ciascuno di essi 13 caratteri di cui 5 per la mantissa. 

formato 

i 

e 

f 

a 

x 

Significato 

formato intero 

esponenziale 

fisso 

alfanumerico 

spazi bianchi 

Tabella 11.6: Il formato 

formato 

i 

e 

f 

a 

x 

Esempio 

i5 – 5 caratteri per un intero 

e14.6 – 14 caratteri, 6 per la mantissa 

e18.10 – 18 caratteri, 10 per la mantissa 

f14.6 – 14 caratteri, 6 per le cifre decimali 

f15.12 – 15 caratteri, 12 per le cifre decimali 

a5 – una stringa di al più 5 caratteri 

1x – 1 carattere bianco 

3x – 3 caratteri bianchi 

Tabella 11.7: Esempi di formato 

Specificando il formato, occorre prestare attenzione al fatto che non tutti i numeri possono essere stampati 

correttamente. Per esempio se un intero ha più di 5 caratteri (per esempio 100150) ma il formato per esso 

è i5, vengono stampati degli * o altri caratteri a seconda del compilatore. Se si hanno strani risultati in output 

usando un formato, togliere il formato, compilare e rieseguire il programma per verificare se l’errore dipende 

dal formato! 

Lo stesso formato può essere utilizzato da più righe di write se il formato si riferisce a variabili dello 

stesso tipo. Le stringhe di caratteri possono essere scritte mediante un formato opportuno. 

Vediamo di nuovo il programma di prima: 

i t e r = 0 

xold=x0 

write ( * , 9 8 ) ’ i t ’ , ’ xk ’ , ’ scarto ’ , ’ asint1 ’ , ’ asint2 ’ 

write ( * , 9 9 ) i t e r , xold , scartonew 


C t u t t o invariato come prima 

write ( * , 1 0 0 ) i t e r , xnew , scartonew , asint1 , asint2 

176

11.14. Files di dati 

xold=xnew 


end do 

98 format (1 x , a4 , 1 x , a15 , 1 x , a14 , 1 x , 2 a13 ) 

99 format (1 x , i4 , 1 x , f15 .12 ,1 x , e14 . 6 ) 

100 format (1 x , i4 , 1 x , f15 .12 ,1 x , e14 . 6 , 1x , 2e13 . 5 ) 

stop 

end 

Per le stringhe è stato usato un formato riservando a ciascuna stringa lo stesso numero di caratteri riservati 

alle variabili corrispondenti cui si riferiscono le stringhe. In tal modo, si riesce a creare una tabellina di 

risultati messi in colonna l’uno dopo l’altro in maniera ordinata. 

11.14 Files di dati 

Piuttosto che visualizzarli sulla finestra di shell del computer, conviene salvare i risultati in un file di dati. 

Il modo più semplice per fare questo è: 

G far sì che durante l’esecuzione del programma venga generato un file di scrittura di dati: si apre il 

file all’interno del programma principale associando ad esso un numero (label) mediante l’istruzione 

open. Per esempio, dopo la dichiarazione delle variabili, scriviamo 

open(10, file=’rispuntofisso.txt’) 

G le istruzioni di write saranno poi associate a quella label e scritte su quel file. 

Quindi, al posto di scrivere write(*,98) andremo a scrivere write(10,98) perchè dobbiamo 

scrivere la stampa dei risultati sul file contrassegnato dall’etichetta 10. 

G chiudiamo il file con l’istruzione close. 

close(10) 


C programma di punto f i s s o 

C t u t t o come prima 

C dichiarazione d e l l e v a r i a b i l i 

open(10 , f i l e = ’ rispuntofisso . txt ’ ) 


read ( * , * ) x0 

write ( * , * ) ’ x0 = ’ , x0 

C i l programma continua con l e i s t r u z i o n i gia ’ v i s t e 

C l e uniche modifiche saranno n e l l e write : 

write (10 ,98) ’ i t ’ , ’ xk ’ , ’ scarto ’ , ’ asint1 ’ , ’ asint2 ’ 

write (10 ,99) i t e r , xold , scartonew 

C ora i l c i c l o do while 

C all ’ interno abbiamo 

write (10 ,100) i t e r , xnew , scartonew , asint1 , asint2 

C f i n i s c e i l c i c l o do while 

C scriviamo i formati 

close (10) 

stop 

end 


file di dati 

Una volta che il programma è stato compilato correttamente ed eseguito, la stampa dei risultati non sarà 

più sul video ma verrà generato un file (dal nome che abbiamo dato all’interno del programma) sul quale 

troveremo i risultati che prima erano sul video. 

Se rieseguiamo il programma questo file sarà riscritto da capo. Quindi se dobbiamo eseguire il 

programma più volte per diverse simulazioni, il file di output conviene rinominarlo in modo da non perderlo. 

177


11.15 Vettori 

Quando si programma in FORTRAN, un vettore va dichiarato in un certo modo e usato in maniera quasi 

simile a come li abbiamo studiati. 

Supponiamo di voler calcolare la media di un vettore x. 

Nello scrivere il programma, dobbiamo pensare ad una lunghezza massima per il vettore che dobbiamo 

dare in input: questo perchè in FORTRAN77 si ha un’allocazione statica delle variabili (e non dinamica). 

Se diamo 20 come lunghezza massima del vettore, il programma che scriveremo potrà essere eseguito su 

vettori che avranno al più dimensione 20. 

Ci sono vari modi per dare questa dimensione massima ai vettori. Noi partiremo dal modo più semplice. 

Supponiamo di voler scrivere un programma che calcola la media delle componenti di un vettore. Come 

procedere? 

G I dati di input sono: n, la dimensione effettiva del vettore e x i per i = 1,2,...n le componenti del vettore 

x. 

G L’output è la variabile medi a = (∑ n 

i=1 x i ) 

n 

Per calcolare la variabile medi a faremo la somma in questo modo (medi a è la cosiddetta variabile di 

accumulo): 

partiamo da medi a = 0 

quindi facciamo medi a = medi a + x 1 (prima componente della somma) 

poi medi a = medi a + x 2 (il risultato è x 1 + x 2 ) 

poi medi a = medi a + x 3 (avremo x 1 + x 2 + x 3 ) 

e così via fino a medi a = medi a + x n (in medi a avremo tutta la somma dei vettori) 

Dopo si fa medi a = medi a/n e avremo il risultato finale. 

11.16 Ciclo do 

Per applicare la formula per ottenere la variabile medi a possiamo pensare a un ciclo do while scritto 

come: 

media =0.d0 

i =0 

do while ( i . l e . n) 

i = i +1 

media = media + x ( i ) 

end do 

media= media/n 

Noi non useremo questo approccio ma una struttura equivalente ad essa che prende il nome di ciclo do: 

Programma 

sulla media 

dei vettori 

media = 0 . d0 

do i =1 ,n 


end do 

media= media/n 

program mediavettori 

C programma che calcola la media d e l l e componenti di un v e t t o r e 

implicit none 

integer n , i 

real *8 x (20) , media 

write ( * , * ) ’ lunghezza e f f e t t i v a del vettore ’ 

read ( * , * ) n 

write ( * , * ) ’ lunghezza del vettore ’ , n 

i f (n . gt . 2 0 ) then 

write ( * , * ) ’n > massimo consentito ’ , n 

stop 

178

11.16. Ciclo do 

endif 

do i =1 ,n 

write ( * , * ) ’componente ’ , i , ’−sima del vettore ’ 

read ( * , * ) x ( i ) 

end do 

do i =1 ,n 

write ( * , * ) ’ elemento ’ , i , ’ = ’ , x ( i ) 

end do 

media=0.d0 

do i =1 ,n 


end do 

media =media/n 

write ( * , * ) ’media ’ , media 

stop 

end 

G Il vettore è stato dichiarato come real*8 x(20): 

il vettore può avere al più 20 componenti. 

Osserviamo che questo tipo di dichiarazione non fa distinzione tra vettore riga e vettore colonna. 

G La dimensione effettiva del vettore è data dalla variabile intera n che viene data in input (per il 

momento da tastiera); 

G Le singole componenti vengono inserite da tastiera tramite un’applicazione del ciclo do; 

G Facciamo un controllo su n, se è più piccolo o più grande della dimensione massima. Attenzione: il 

ciclo if si può usare anche per interrompere il programma! Se n > 20 interrompiamo bruscamente il 

programma mediante l’istruzione stop all’interno del ciclo if. 

Con il ciclo do che abbiamo visto, la variabile intera i varia da 1 a n (la dimensione del vettore). 

In generale la struttura del ciclo do è la seguente: 

do indice= v a l o r e i n i z i a l e , valorefinale , incremento 

{ i s t r u z i o n i } 

end do 

Quando incremento=1 possiamo evitare di scriverlo. 

Esempio 11.16.1 Vogliamo fare la somma delle componenti di indice pari del vettore x: 

sommapari=0.d0 

do i =2 ,n, 2 

sommapari=sommapari + x ( i ) 

end do 

L’indice i vale i = 2, i = 2 + 2 = 4, i = 4 + 2 = 6. . . . 

Attenzione: se valoreiniziale > valorefinale e l’incremento è positivo, non si entra nel ciclo do. 

Si può anche trovare il ciclo do scritto nella forma (ormai obsoleta, ma può capitare di trovarlo su vecchi 

programmi): 

do l a bel indice= v a l i n i z i a l e , v a l f i n a l e , incremento 


l a bel continue 

dove label è un numero (etichetta) che si trova all’inizio del ciclo e poi alla fine per chiuderlo (label 

continue). La label dell’istruzione label continue va scritta a partire dalla seconda colonna. 

179


11.16.1 I vettori nei sottoprogrammi 

I vettori si possono usare come variabili di input nelle functions (e non di output in quanto la function 

deve dare un unico valore come output e quindi non può dare un vettore) e come variabili di input e output 

nelle subroutines. 

Quando dichiariamo i vettori in un sottoprogramma, possiamo dichiararli con la loro dimensione 

effettiva. Vediamo un esempio di function che calcola la norma euclidea di un vettore. 

real *8 function norma2(n , x ) 

implicit none 

integer n , i 

real *8 x (n) 

norma2=0.d0 

do i =1 ,n 

norma2=norma2 + x ( i ) * * 2 

end do 

norma2=dsqrt (norma2) 

return 

end 

11.16.2 Leggere i dati di input da file 

È chiaro che se un vettore ha molte componenti diventa proibitivo assegnare le componenti del vettore 

tramite tastiera. . . È possibile leggere i dati di input da un file già esistente, cui viene associata una label e che 

viene aperto all’inizio del programma. Ora sono le istruzioni di read che vengono associate alla label del 

file di lettura dati. Vediamo il programma di prima come cambia (e nello stesso calcoliamo la media delle 

componenti del vettore utilizzando una function). 

program mediavettori 

C programma che calcola la media d e l l e componenti di un v e t t o r e 

implicit none 

integer n , i 

real *8 x ( 2 0 ) , media , funmedia 

open(10 , f i l e = ’ vettoreinput . dat ’ ) 

read ( 1 0 , * ) n 

i f (n . gt . 2 0 ) then 

write ( * , * ) ’n > massimo consentito ’ , n 

stop 

endif 

C nella riga seguente troviamo i l c i c l o do implicito 

read ( 1 0 , * ) ( x ( i ) , i =1 ,n) 

C analogamente possiamo applicare i l do e s p l i c i t o 

C che ora e ’ commentato 

c do i =1 ,n 

c read ( 1 0 , * ) x ( i ) 

c end do 

do i =1 ,n 

write ( * , * ) ’ elemento ’ , i , ’ = ’ , x ( i ) 

end do 

media= funmedia (n , x ) 

write ( * , * ) ’media ’ , media 

close (10) 

stop 

end 

real *8 function funmedia (n , x ) 

implicit none 

180

11.17. Matrici in FORTRAN 

integer i , n 

real *8 x (n) 

funmedia=0.d0 

do i =1 ,n 

funmedia = funmedia + x ( i ) 

end do 

funmedia =funmedia/n 

return 

end 

Per la lettura dei dati di input si può utilizzare sia il ciclo do che abbiamo visto fino ad ora sia quello che è 

chiamato do implicito. 

Essenzialmente quando si devono leggere dei dati da un file, il compilatore FORTRAN leggerà delle 

stringhe di caratteri e le convertirà in numeri. 

Ci sono delle differenze sulle modalità di come avviene la lettura mediante il do esplicito o implicito, ma 

non entriamo nei dettagli. Ciò che importa e bisogna ricordare è che ci deve essere corrispondenza tra quello 

che viene scritto sul file e le variabili a cui assegnare quei valori. Inoltre, lasciamo almeno uno spazio tra un 

valore e il successivo se li scriviamo sulla stessa riga. 

Le variabili di tipo reale vanno scritte con il punto decimale. Le variabili di tipo intero vanno scritte senza 

il punto decimale. 

Le componenti di un vettore vanno scritte o su una riga o in colonna componente per componente. 

Scriviamo sulla prima riga il valore di n e sulla seconda riga le componenti del vettore. 

4 

1. 2. 3. 4. 

Esempi di file 

vettoreinput.dat 

Oppure scriviamo sulla prima riga il valore di n e sulle righe successive le componenti del vettore. 

4 

1. 

2. 

3. 

4. 

11.17 Matrici in FORTRAN 

In FORTRAN, le matrici vanno dichiarate dando una dimensione massima sia sulle righe sia sulle colonne. 

Possiamo lavorare sia su matrici rettangolari, sia su matrici quadrate. Per semplicità, poichè noi avremo a che 

fare con matrici quadrate, descriveremo e faremo programmi solo su matrici quadrate. 

Supponiamo di voler fare il prodotto di una matrice A per un vettore x. 

Il risultato del prodotto di una matrice per un vettore è un vettore. 

Come scrivere un programma che fa questa operazione? 

G I dati di input sono: n, la dimensione effettiva della matrice A e del vettore, le componenti A(i , j ) (i 

indice di riga e j indice di colonna) per i , j = 1,2,...n della matrice, e le componenti x(i ) del vettore, 

per i = 1,2,...n. 

G L’output è il vettore y di componenti y(i ) dove y = Ax 

Sappiamo che y i = (Ax) i = ∑ n 

i=1 A i j x j . 

Traduciamo il tutto in FORTRAN con il seguente programma. 

program matrvett 

C programma per i l calcolo del prodotto di una matrice A per un 

C v e t t o r e x 

C dati di input : 

C n − dimensione e f f e t t i v a della matrice ( quadrata ) e 

C del v e t t o r e x 

Programma 

sul prodotto 

matricevettore 

181


C A − matrice di dimensione nxn 

C x − v e t t o r e di lunghezza n 

C dati di output 

C y − v e t t o r e di lunghezza n uguale al prodotto Ax 

C 

implicit none 

integer i , j , n 

real *8 A( 2 0 , 2 0 ) , x ( 2 0 ) , y (20) 

open(10 , f i l e = ’ matrvett . dat ’ ) 

open(11 , f i l e = ’ matrvett . r i s ’ ) 

C l e t t u r a della dimensione n 

read ( 1 0 , * ) n 

C l e t t u r a della matrice A 

C usiamo un c i c l o do i =1 ,n e s p l i c i t o e un c i c l o do implicito 

C leggiamo g l i elementi che s i trovano s u l l a riga i−sima 

C e la l e t t u r a viene f a t t a riga per riga 

do i =1 ,n 

read ( 1 0 , * ) (A( i , j ) , j =1 ,n) 

end do 

C 

C l e t t u r a del v e t t o r e x 

read ( 1 0 , * ) ( x ( i ) , i =1 ,n) 

C s c r i t t u r a dei dati di input sul f i l e dei r i s u l t a t i 

write ( 1 1 , * ) ’ dimensione ’ , n 

write ( 1 1 , * ) ’ matrice A ’ 

do i =1 ,n 

write ( 1 1 , * ) (A( i , j ) , j =1 ,n) 

end do 

write ( 1 1 , * ) ’ vettore x ’ 

write ( 1 1 , * ) ( x ( i ) , i =1 ,n) 

C prodotto matrice−v e t t o r e : l ’ elemento i−simo del prodotto 

C matrice−v e t t o r e e ’ dato dalla somma per j =1 ,n di A( i , j ) * x ( j ) 

do i =1 ,n 

y ( i ) = 0 . d0 

do j =1 ,n 

y ( i ) = y ( i ) + A( i , j ) * x ( j ) 

end do 

end do 

write ( 1 1 , * ) ’ vettore y=Ax ’ 

write ( 1 1 , * ) ( y ( i ) , i =1 ,n) 

stop 

end 

La matrice è stata dichiarata come real*8 A(20,20): al più 20 righe per 20 colonne. 

G Abbiamo usato un ciclo do i=1, n e un ciclo do j=1,n concatenato al primo per fare il prodotto 

matrice-vettore. 

G Per calcolare le componenti del prodotto matrice-vettore abbiamo prima posto y(i)=0.d0 in modo 

da poter fare la somma dei vari termini “accumulandoli” di volta in volta. 

G Abbiamo letto i dati di input da file. Ricordiamo che il numero che scriviamo all’interno dell’istruzione 

che apre il file open(10, file=’nomefile.dat’) lo scegliamo noi. Se apriamo più files a ciascuno 

file deve essere associato un numero diverso, in modo da poter leggere (se il file è di lettura) o scrivere 

(se il file è di scrittura) in modo appropriato. 

11.17.1 Le matrici nei sottoprogrammi 

Quando una (o più matrici) devono essere passate in un sottoprogramma (sia esso una function o una 

subroutine), all’interno del sottoprogramma si deve necessariamente dichiarare la matrice (o le matrici) con 

182

11.17. Matrici in FORTRAN 

la loro dimensione massima sulle righe. 

Facciamo un esempio e successivamente ne vedremo le ragioni. 

Scriviamo un programma in cui, mediante una subroutine, data la matrice A si crea la matrice B = A T . 

program matrtrasposta 

C programma che crea la matrice B=A^T 

C dati di input : 

C n − dimensione e f f e t t i v a della matrice ( quadrata ) 

C A − matrice di dimensione nxn 

C dati di output 

C B − matrice trasposta di A 

C 

implicit none 


real *8 A( 2 0 , 2 0 ) , B(20 ,20) 

open(10 , f i l e = ’ matrice . dat ’ ) 

open(11 , f i l e = ’ r i s t r a s p o s t a . dat ’ ) 

C l e t t u r a della dimensione n 

read ( 1 0 , * ) n 

C l e t t u r a della matrice A 

C usiamo un c i c l o do i =1 ,n e s p l i c i t o e un c i c l o do implicito 

C leggiamo g l i elementi che s i trovano s u l l a riga i−sima e 

C la l e t t u r a viene f a t t a riga per riga 

do i =1 ,n 

read ( 1 0 , * ) (A( i , j ) , j =1 ,n) 

end do 

write ( 1 1 , * ) ’ dimensione ’ , n 

write ( 1 1 , * ) ’ matrice A ’ 

do i =1 ,n 

write ( 1 1 , * ) (A( i , j ) , j =1 ,n) 

end do 

c a l l trasposta (n , A , B) 

write ( 1 1 , * ) ’ matrice trasposta B ’ 

do i =1 ,n 

write ( 1 1 , * ) (B( i , j ) , j =1 ,n) 

end do 

stop 

end 

subroutine trasposta (n , A , B) 

implicit none 


real *8 A(20 ,n) , B(20 ,n) 

do i =1 ,n 

do j =1 ,n 

B( i , j )=A( j , i ) 

end do 

end do 

return 

end 

Supponiamo di dover scrivere più sottoprogrammi che richiamano matrici e vettori. Per le matrici, in ciascuno 

dei sottoprogrammi dobbiamo dare la dimensione massima delle righe: per esempio A(20,20) nel 

programma principale e A(20,n) o A(20,20) (vanno bene entrambe le forme) nei sottoprogrammi. 

Supponiamo però di voler eseguire il programma già fatto, e che funziona bene, per una matrice di di- 

183


mensione 50 × 50. Possiamo andare ad aumentare la dimensione massima delle matrici e dei vettori da 20 a 

50, ricompilare il programma ed eseguirlo. 

Cosa può succedere? Se da qualche parte ci siamo dimenticati di correggere il 20 con il 50. . . il codice 

darà risultati sbagliati. . . Per evitare questo inconveniente possiamo usare una variabile che si chiama parameter 

per indicare la dimensione massima delle matrici. Nel programma principale (supponiamo di voler 

modificare il programma della trasposta di una matrice), scriveremo 

program matrtrasposta 

C programma che crea la matrice B=A^T 

C t u t t i g l i a l t r i commenti come prima 

C 

implicit none 

integer nmax 

parameter (nmax=20) 


real *8 A(nmax,nmax) , B(nmax,nmax) 

C t u t t o i l r e s t o i n a l t e r a t o fino alla chiamata della subroutine 

c a l l trasposta (nmax, n , A , B) 

subroutine trasposta (nmax, n , A , B) 

implicit none 

integer i , j , n ,nmax 

real *8 A(nmax, n) , B(nmax, n) 

do i =1 ,n 

do j =1 ,n 

B( i , j )=A( j , i ) 

end do 

end do 

return 

end 

Parameter 

nmax La variabile nmax è un parametro che viene definito una volta per tutte mediante l’istruzione 

parameter (nmax=20): all’interno del programma noi non possiamo cambiare il valore dato a nmax. 

Al posto di scrivere A(20,20) noi scriviamo A(nmax,nmax). Se ci sono vettori, li dichiariamo come 

x(nmax). 

Nei sottoprogrammi, dove ci sono matrici, passiamo nmax nella lista delle variabili di input del 

sottoprogramma e dichiariamo A(nmax,n). 

In questo modo, se vogliamo cambiare la dimensione massima, andiamo a cambiare solo l’istruzione 

parameter (nmax=20) Per esempio scriviamo parameter (nmax=50), compiliamo il programma e 

possiamo eseguirlo per matrici e vettori al più di dimensione 50. Ma andiamo a cambiare solo una riga di 

codice e non tutte le righe in cui sono dichiarate le matrici e i vettori. . . 

11.17.2 Memorizzazione delle matrici 

Le matrici sono memorizzate colonna per colonna - prima gli elementi di tutta la prima colonna dalla 

prima all’ultima riga, poi tutti gli elementi della seconda colonna dalla prima all’ultima riga, e così via . . . 

Sia nmax=6, A(nmax,nmax) 

A può avere al più nmax righe per nmax colonne. nmax * nmax = 36 celle di memoria sono predisposte 

per i valori della matrice, a partire da A(1,1) 

184

11.18. La formula dei trapezi in FORTRAN 

1 7 13 19 25 31 

2 8 14 20 26 32 

3 9 15 21 27 33 

4 10 16 22 28 34 

5 11 17 23 29 35 

6 12 18 24 30 36 

Cosa succede se la dimensione effettiva della matrice è n < nmax? All’interno del programma principale 

i valori della matrice vengono memorizzati nelle celle di memoria che corrispondono alla “sottomatrice” di 

dimensione n x n. 

Sia n=4. Si ha: 

1 7 13 19 25 31 

2 8 14 20 26 32 

3 9 15 21 27 33 

4 10 16 22 28 34 

5 11 17 23 29 35 

6 12 18 24 30 36 

Se nel sottoprogramma si dichiara correttamente la matrice A 

real*8 A(nmax,n) 

allora anche il passaggio della matrice avviene correttamente. 

Se nel sottoprogramma si dichiara invece 

real*8 A(n, n) 

allora la locazione di memoria all’interno del sottoprogramma è “pensata” come se fosse 

nmax=n 

1 5 9 13 

2 6 10 14 

3 7 11 15 

4 8 12 16 

Ma nelle cellette di posto 5, 6, 11 e 12 non ci sono i valori della matrice: la memorizzazione risulta non 

corretta!!! 

11.18 La formula dei trapezi in FORTRAN 

Proviamo a implementare la formula composta dei trapezi in FORTRAN. 

Scegliamo la funzione da integrare e gli estremi di integrazione e, come primo approccio, diamo in input 

il numero di suddivisioni n in cui applicare la formula composta. Inoltre, per vedere se il codice lo abbiamo 

scritto bene, daremo anche il valore esatto dell’integrale Iex (che avremo precedentemente calcolato con 

carta e penna) in modo da calcolare l’errore esatto. 

La funzione da approssimare, gli estremi di integrazione, il valore esatto dell’integrale saranno funzione 

o variabili del programma. 

G dati di input: 

– numero di suddivisioni n 

– estremi di integrazione a, b 

G dati di output: 

– valore approssimato dell’integrale (usiamo per esso la variabile i tr ap) 

– errore esatto, che chiamiamo er r tr ap. 

185


Il programma sarà così composto: 

G programma principale 

G function in cui scriviamo la funzione integranda. 

G function in cui scriviamo la primitiva della funzione integranda (per calcolare il valore esatto 

dell’integrale) 

G function in cui applichiamo la formula semplice dei trapezi e che chiamiamo trapsemplice 

Tra i dati che ci facciamo stampare sul file di output, conviene farsi stampare una specie di promemoria 

sul problema che stiamo risolvendo (formula che stiamo applicando, gli estremi di integrazione a e b, il 

valore esatto dell’integrale Iex e, come stringa di caratteri, anche quale è la funzione integranda). In tal 

modo abbiamo “memoria” del problema che vogliamo risolvere e dei risultati ad esso associati. 

Applichiamo la formula dei trapezi su ciascun intervallino. La prima volta andrà applicata sull’intervallo 

[a, a + h], poi su [a + h, a + 2h] e così via, dove h è l’ampiezza dei singoli sottointervalli, che è la stessa su 

tutti i sottointervalli avendo scelto di suddividere in parti uguali l’intervallo [a,b], quindi h = b − a . Su ogni 

n 

sottointervallo possiamo applicare la formula semplice dei trapezi in modo da avere il valore finale dell’integrale 

approssimato come somma dei contributi su ciascun sottointervallo. A tal scopo useremo, su ciascun 

sottointervallo, una function che applica la formula semplice dei trapezi. 

Possiamo quindi fare un ciclo do in modo da applicare la formula semplice all’intervallino [x0, x1], dove 

x0 rappresenta l’estremo inferiore e x1 l’estremo superiore di ciascun sottointervallo. Ogni volta aggiorneremo 

in maniera appropriata i due estremi (tenendo conto che x1 nell’intervallo successivo diventa x0: 

l’estremo superiore di ogni intervallino diventa l’estremo inferiore nell’intervallino successivo). 

Scriviamo sotto forma di pseudocodice, quello che dobbiamo fare: 

Dati di input: a, b, n 

Dati di output: i tr ap, er r tr ap 

1 h ←− (b − a)/n ; 

2 calcolare Iex ; 

3 inizializzare i tr ap: i tr ap ←− 0.d0 ; 

4 inizializzare x0 del primo sottointervallo x0 ←− a ; 

5 Per i = 1,n 

6 assegnare il valore di x1: x1 ←− x0 + h ; 

7 applicare la formula dei trapezi sull’intervallino i -simo e sommare il contributo al valore i tr ap: 

i tr ap ←− i tr ap + tr apsempl i ce(x0, x1) ; 

8 aggiornare x0: x0 ←− x1 ; 

9 Fine-Per 

10 stampare l’integrale approssimato i tr ap ; 

11 calcolare e stampare l’errore esatto er r tr ap ; 

Per le functions da scrivere, si deve tener conto che, per la funzione integranda, la function da utilizzare è 

molto semplice: basta scrivere la funzione integranda. 

Per esempio, per calcolare l’integrale ∫ 0.5 π 

0 , f (x) = π 

. Per scrivere π in Fortran, basta 

1 − x 

2 1 − x 

2 

ricordare che π = 2arcsin(1). Allora la function diventa: 

real *8 function fun ( x ) 

implicit none 

real *8 x , pi 

pi =2* asin ( 1 . ) 

fun= pi / sqrt ( 1 . 0 d0 − x * * 2 ) 

return 

end 

Per il calcolo del valore esatto dell’integrale, dobbiamo calcolare analiticamente l’integrale (faremo degli 

esempi di applicazione delle formule di quadratura con integrali di cui è possibile conoscere l’integrale esatto, 

quindi preliminarmente, avremo calcolato a mano l’integrale, andando a cercare una primitiva della funzione 

integranda). Conviene allora utilizzare una function per la primitiva, in modo da poter assegnare il valo- 

186

11.18. La formula dei trapezi in FORTRAN 

re esatto dell’integrale mediante l’istruzione Iex = F pr i m(b) − F pr i m(a), dove F pr i m è il nome dato alla 

function della primitiva. Nell’esempio, F pr i m(x) = πarcsin(x) e la function viene costruita di conseguenza. 

real *8 function Fprim ( x ) 

real *8 pi , x 

pi =2.* asin ( 1 . ) 

Fprim= pi * asin ( x ) 

return 

end 

Invece, la function trapsemplice non è nient’altro che l’applicazione della formula semplice dei trapezi 

sull’intervallo di estremi x0 e x1 dati in input alla function stessa. All’interno della trapsemplice viene 

chiamata la function della funzione integranda. 

real *8 function trapsemplice ( a , b) 

real *8 a , b , fun 

trapsemplice =(b−a ) / 2 . * ( fun ( a)+ fun (b ) ) 

return 

end 

Proviamo ora ad applicare la formula composta dei trapezi partendo da una sola suddivisione n = 1, e poi 

raddoppiando ogni volta il numero delle suddivisioni: n = 2, n = 4, n = 8, . . . In tal caso conviene modificare 

il programma scritto per applicare la formula composta dei trapezi per tute le suddivisioni richieste introducendo 

un ciclo do while che permette di calcolare la formula composta dei trapezi prima per n = 1, poi 

per n = 2 e così via, raddoppiando ogni volta il numero di suddivisioni. In questo modo, conservando i valori 

dell’errore esatto tra due suddivisioni successive, possiamo calcolare il rapporto tra l’errore alla suddivisione 

n/2 e l’errore alla suddivisione n. Memorizziamo questo rapporto nella variabile r ate e la stampiamo per 

ogni suddivisione n > 1. Dai risultati saremo in grado di capire se l’errore decresce come 1 oppure no e, 

n2 quindi, se sono verificate le ipotesi per la formula composta dell’errore come descritto a pag. 128. 

Per esempio, se vogliamo applicare la formula dei trapezi per n = 1,2,4,8,...,128 sotto forma di pseudocodice, 

abbiamo 

Dati di input: a, b 

Dati di output: i tr ap, er r tr ap, r ate per ogni suddivisione 

1 n ←− 1 ; 

2 Fintantochè n < 128 

3 inizializzare i tr ap: i tr ap ←− 0.d0 ; 

4 porre h ←− (b − a)/n 

5 ; inizializzare x0 del primo sottointervallo x0 ←− a ; 

6 applicare l’algoritmo della formula composta dei trapezi ; 

7 stampare i tr ap per quel valore di n ; 

8 calcolare l’errore esatto er r tr ap ; 

9 Se n > 1 allora 

10 calcolare il rapporto r ate tra l’errore al passo n/2 e l’errore al passo n 

11 altrimenti 

12 r ate ←− 1 (non ha significato per n = 1) 

13 Fine-Se 

14 stampare n, i tr ap, er r tr ap, r ate ; 

15 aggiornare una variabile er r tr apol d che memorizza l’errore al passo precedente: 

er r tr apol d ←− er r tr ap ; 

16 aggiornare n: n ←− 2n ; 


187



Esercizio 11.19.1 Scrivere un programma FORTRAN che, assegnate due matrici A e B di dimensione n ≤ 30, 

esegua il prodotto C=AB; memorizzi in un vettore x gli elementi della diagonale principale di C; calcoli la 

norma euclidea di x. 

I dati di input siano letti da un file chiamato input.dat. 

Scrivere, perciò, un programma che: 

a) legge la dimensione n, le matrici A e B e stampa i dati letti con commento; 

b) calcola la matrice C=AB servendosi della subroutine MATRMATR; 

c) salva gli elementi C i i in un vettore chiamato x; 

d) calcola la norma euclidea di x servendosi della function NORMAEUC; 

e) stampa la norma euclidea di x. 

(mettere a punto la subroutine MATRMATR e la function NORMAEUC.) 

Svolgimento 

program prodottomatrici 

implicit none 

integer nmax 

parameter (nmax=30) 

integer n , i , j 

real *8 A(nmax,nmax) ,B(nmax,nmax) , C(nmax,nmax) , 

real *8 normaeuc , euc 

x (nmax) 

open(20 , f i l e = ’ input . dat ’ ) 

open(21 , f i l e = ’ output . dat ’ ) 

read ( 2 0 , * ) n 

write ( 2 1 , * ) ’ dimensione n ’ , n 

write ( 2 1 , * ) ’ matrice A’ 

do i =1 ,n 

read ( 2 0 , * ) (A( i , j ) , j =1 ,n) 

write ( 2 1 , * ) (A( i , j ) , j =1 ,n) 

end do 

write ( 2 1 , * ) ’ matrice B’ 

do i =1 ,n 

read ( 2 0 , * ) (B( i , j ) , j =1 ,n) 

write ( 2 1 , * ) (B( i , j ) , j =1 ,n) 

end do 

c a l l matrmatr (nmax, n , A , B,C) 

do i =1 ,n 

x ( i )= C( i , i ) 

end do 

euc=normaeuc(n , x ) 

write ( 2 1 , * ) ’norma euclidea di x ’ , euc 

stop 

end 

subroutine matrmatr (nmax, n , A , B,C) 

implicit none 

integer nmax, n , i , j , k 

real *8 A(nmax, n) , B(nmax, n) , C(nmax, n) 

C devo f are i l prodotto di A e B 

188


C ricordo la formula C_ij = somma_k ( A_ik * B_kj ) 

do i =1 ,n 

do j =1 ,n 

C( i , j )= 0 . d0 

do k=1 ,n 

C( i , j )= C( i , j ) + A( i , k ) *B( k , j ) 

end do 

end do 

end do 

return 

end 

real *8 function normaeuc(n , x ) 

implicit none 

integer n , i 

real *8 x (n) 

normaeuc=0.d0 

do i =1 ,n 

normaeuc= normaeuc + x ( i ) * * 2 

end do 

normaeuc= sqrt (normaeuc) 

return 

end 

189


12 

CENNI SU GNUPLOT 

Il matematico sbircia dietro le spalle 

di Dio per trasmettere la bellezza 

della Sua creazione al resto delle Sue 

creature. 

Paul Erdös 

12.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 

12.2 Grafici di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 

12.3 Salvare i grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 

12.4 Grafici da files di dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 

12.5 Script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 

12.6 Print . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 


Gnuplot è un programma utile per fare grafici (sia di funzioni, sia di dati), distribuito gratuitamente per 

sistemi operativi Linux, Windows, e altri ancora. 

Nel seguito vedremo alcuni comandi essenziali di Gnuplot al fine di poter visualizzare funzioni che dipendono 

da una sola variabile e creare grafici da tabelle di dati. Le potenzialità di Gnuplot sono molto di più 

di quanto diremo e, per chi è interessato, si rimanda al sito http://www.gnuplot.info. 

Ci rifacciamo alla versione 4.2 patchlevel 6, ultima modifica Settembre 2009, in ambiente Linux. 

Per poter lavorare in ambiente Gnuplot, da una finestra di shell digitiamo gnuplot e poi clicchiamo il 

tasto di invio. L’ambiente gnuplot si presenta come nella Figura 12.1 

Per uscire dall’ambiente gnuplot, si digita exit. Per avere un help on-line si digita help. 

Tutte le istruzioni per fare e salvare grafici, si basano su comandi scritti sulla finestra del gnuplot. Si possono 

anche scrivere piú istruzioni da eseguire in un file script che viene poi lanciato in ambiente gnuplot 

(vedremo successivamente come). 

12.2 Grafici di funzioni 

Per fare il grafico di una funzione, basta scrivere il comando 

plot [a:b] f(x) 

191

12. CENNI SU GNUPLOT 

Figura 12.1: Ambiente gnuplot 

Figura 12.2: Finestra di shell dove si sta lavorando in ambiente gnuplot e grafico della funzione cos(x) 

nell’intervallo [−π,π]. 

dove, al posto di a e b scriviamo i valori numerici degli estremi dell’intervallo in cui vogliamo visualizzare la 

funzione f(x). La funzione f(x) si scrive usando le stesse notazioni del Fortran. Si apre una finestra con il 

grafico della funzione, come si può vedere nella Figura 12.2. 

Se si scrive semplicemente plot f(x) il grafico è fatto sull’intervallo [−10,10]. 

Vediamo degli esempi 

G plot [-pi: pi] cos(x) : fa il grafico della funzione cos(x) nell’intervallo [−π,π]. Osserviamo 

che pi ha il significato di π. 

G plot x**2 -2*x+1: fa il grafico della parabola x 2 − 2x + 1 nell’intervallo [−10,10] (non essendo 

stato specificato). 

G plot [0:3] log(x): fa il grafico della funzione ln(x) nell’intervallo [0,3] 

Ogni volta, il grafico viene sovrascritto, perdendo quello precedente. 

Per fare il grafico di più funzioni definite nello stesso intervallo, sulla stessa figura, basta scrivere le diverse 

funzioni seguite da una virgola: plot [a:b], f(x), g(x), h(x) 

G plot [-pi:pi] sin(x), cos(x): abbiamo i grafici delle due funzioni seno e coseno in due colori 

diversi. La legenda, in alto a destra, spiega le diverse funzioni del grafico. 

G plot x, x**2, x**3: abbiamo i grafici delle funzioni x, x 2 e x 3 nell’intervallo [−10,10]. 

192

12.2. Grafici di funzioni 

Figura 12.3: Istruzione: plot sin(x) with points pt 5 

È possibile cambiare lo stile del grafico (linee continue, punti, linee e punti), con il seguente comando: 

plot [a:b] f(x) with dove può essere: lines, points, linespoints, dots. Si può 

anche cambiare il colore (e, in alcune modalità, il tipo della linea o del punto) usando il comando with 

lt dove può variare nell’insieme {−1,0,1,...22}. 

Per esempio: 

G plot sin(x) with linespoints, cos(x) with points produce un grafico in cui sin(x) è 

rappresentata mediante linee e punti e cos(x) tramite punti (che possono essere date dal simbolo + 

o da un quadratino pieno a seconda dello spessore richiesto). 

G plot sin(x) with lines lt -1 produce un grafico con la linea di colore nero. 

Si può variare lo spessore delle linee e dei punti mediante i comandi linewidth (o, in maniera del tutto 

equivalente, lw) e pointtype (o pt) rispettivamente. Vediamo con degli esempi: 

G plot sin(x) with points pt 5: i punti hanno dimensione 5 pt (si veda la Figura 12.3). 

G plot sin(x) with lines lw 2: la linea ha un’ampiezza pari 2 volte quella di default (si veda la 

Figura 12.4). 

G plot sin(x) with linespoints lw 2 pt 5 : 

dimensione 5 pt (si veda la Figura 12.5). 

Per fare un grafico semilogaritmico o logaritmico, prima di fare il grafico, si digita il comando 

la linea è larga 2 lw mentre i punti hanno 

G set logscale: per avere un grafico logaritmico 

G set logscale y: per avere un grafico semilogaritmico lungo l’asse y. 

G set logscale x: per avere un grafico semilogaritmico lungo l’asse x. 

Dopo si scrive la funzione di cui fare il grafico in scala logaritmica (o semilogaritmica), mediante il comando 

plot. 

Vediamo un esempio: 

G set logscale y 

plot [0.1:10] x**2 

Per uscire dalla scala logaritmica, basta scrivere il comando unset logscale. 

A volte può essere utile un grafico che abbia la stessa scala lungo l’asse x e y. Il comando da utilizzare è il 

seguente: 

set size ratio -1 

Altri comandi utili sono i seguenti: 

G Per mettere un’etichetta sull’asse delle x o delle y, si scrive il comando 

set xlabel "nome da mettere su asse x" 

dove tra apici si scrive l’etichetta dell’asse delle x. Se il grafico è stato già fatto, si digita il comando 

replot. Analogamente, per scrivere un’etichetta sull’asse delle y si usa 

193


Figura 12.4: Istruzione: plot sin(x) with lines lw 2 

Figura 12.5: Istruzione: plot sin(x) with linespoints lw 2 pt 5 

set ylabel "nome da mettere su assse y" 

G Si può cambiare il tipo di formato con cui sono rappresentati i numeri sull’asse delle ascisse o delle 

ordinate. Il caso interessante da vedere si ha quando si hanno grafici semilogaritmi e si vuole usare una 

scala esponenziale per visualizzare l’asse delle y. Un esempio è: 

set format y "%4.2e" 

Si ha una rappresentazione in formato esponenziale con due cifre nella mantissa e una lunghezza totale 

del numero pari a quattro: per esempio 1.00e-11. 

12.3 Salvare i grafici 

Per conservare un grafico, ad esempio, in formato .gif, dobbiamo cambiare la modalità del terminale. Per 

vedere come è impostato il terminale nel modo default, si digita l’istruzione 

show terminal. 

194

12.4. Grafici da files di dati 

Figura 12.6: Il grafico salvato come file prova.png 

Come risposta si può avere 

terminal type is wxt 0. 

Fatta questa premessa (utile per ritornare a fare i grafici senza salvarli su file) si scrivono i seguenti 

comandi: 

set terminal gif 

set output "prova.gif" 

plot sin(x) 

Il grafico di sin(x) viene creato e salvato direttamente sul file prova.gif nella directory in cui è stato aperto 

il programma gnuplot. Se si vuole salvare un grafico in un file .jpeg o (.png), si sostituisce .gif con .jpeg (o 

.png) nei comandi precedenti 1 (si veda la Figura 12.6 per un esempio di grafico salvato come .png). 

Se è stato già creato un grafico, si può usare il comando replot per salvarlo su file: 

plot sin(x) 

set terminal gif 

set output "prova.gif" 

replot 

Per ritornare nella modalità di terminale di default si scrive 

set terminal wxt 0 

12.4 Grafici da files di dati 

A volte c’è bisogno di fare grafici da tabelli di dati (per esempio da files di output generati da programmi 

Fortran). 

1 Osserviamo che, dopo l’istruzione set terminal gif o set terminal jpeg, sulla riga dei comandi di gnuplot viene lasciato 

un messaggio con le possibili opzioni che possono essere usate. Ignoriamo questo messaggio, perchè vogliamo usare gnuplot nel 

modo più semplice possibile. 

195


Vediamo con degli esempio come creare tali grafici. Supponiamo che nel file dati.dat ci siano due 

colonne corrispondenti ai valori sull’asse delle x e delle y, rispettivamente, che vogliamo mettere in grafico. 

Il file dati.dat sia il seguente: 

1.0000 1.5403 

2.0000 3.5839 

3.0000 8.0100 

4.0000 15.3464 

5.0000 25.2837 

6.0000 36.9602 

7.0000 49.7539 

8.0000 63.8545 

9.0000 80.0889 

10.0000 99.1609 

Per fare il grafico, dobbiamo caricare il file nell’ambiente gnuplot e far capire che la prima colonna 

corrisponde ai valori da mettere sull’asse delle x e la seconda ai valori da mettere sull’asse delle y. 

Sia il file dati.dat nella directory in cui viene lanciato il programma gnuplot. In ambiente gnuplot si 

digita il comando: 

plot ’dati.dat’ 

e viene creato il grafico per punti. Se si vuole un grafico per linee o per linee e punti basta scrivere plot 

’dati.dat’ with lines o plot ’dati.dat with linespoints. Osserviamo che sul grafico, la legenda 

mostra il nome del file (nel nostro caso ’dati.dat’). Se vogliamo cambiare, si usa il comando title nel 

modo seguente: 

plot ’dati.dat’ title ‘‘nuova legenda’’ 

dove il nuovo titolo è scritto tra doppi apici. Il comando title si può usare anche per i grafici di funzioni. 

Si può lavorare sul grafico così come è stato visto per le funzioni. Se si vuole un grafico semilogaritmico 

o logaritmico, prima dell’istruzione plot si scrivono i comandi che abbiamo visto, set logscale ... 

Analogamente a quanto visto nella Sezione precedente, si può salvare il grafico su file. 

Se sul file di dati sono scritti dei commenti, le righe devono essere precedute dal simbolo cancelletto #. 

Se abbiamo dati salvati su più files, da inserire nello stesso grafico, si opera nel modo seguente. Supponiamo 

di avere i due files dati1.dat e dati2.dat. Il comando (base) in ambiente gnuplot da lanciare è: 

plot dati1.dat, dati2.dat. 

Per specificare il tipo di linea, la legenda (e tutto quello che abbiamo già visto per un grafico), basta 

inserire le istruzioni che servono relativamente a ciascuna curva. Per esempio: 

plot "dati.dat" with linespoints lw2 title "curva 1", \ 

"dati2.dat" with lines lw2 title "curva 2" 

Osserviamo che, essendo l’istruzione molto lunga, siamo andati a capo, mediante l’uso del backslash \ 

Si possono avere files in cui abbiamo più colonne di dati, la prima che corrisponde ai valori dell’asse x e 

le successive colonne da mettere sull’asse y. 

Sia dato, ad esempio, il file multi.dat: 

# x y z 

# sin(x) cos(x) 

0.00000 0.00000 1.00000 

0.31416 0.30902 0.95106 

0.62832 0.58779 0.80902 

0.94248 0.80902 0.58779 

1.25664 0.95106 0.30902 

1.57080 1.00000 0.00000 

1.88496 0.95106 -0.30902 

2.19911 0.80902 -0.58779 

196

12.5. Script 

Figura 12.7: Grafico del file dati.dat 

2.51327 0.58779 -0.80902 

2.82743 0.30902 -0.95106 

3.14159 0.00000 -1.00000 

Si può procedere in vari modi: 

G plot ’multi.dat’ using 1:2, ’multi.dat’ using 1:3 

Produce un grafico con le due curve di diverso colore, prodotte utilizzando punti. La legenda dà 

multi.dat using 1:2 per la prima curva e multi.dat using 1:3 per la seconda curva. 

G plot ’multi.dat’ using 1:2 with linespoints, ’multi.dat’ using 1:3 with 

lines 

Con questo comando specifichiamo il tipo di curva. 

G plot ’multi.dat’ using 1:2 with linespoints title "valori y", \ 

’multi.dat’ using 1:3 with lines title "valori z" 

Cambiamo la legenda per ogni curva. Nella Figura 12.8 si può osservare il grafico risultante. 

12.5 Script 

A volte, specie se le figure devono essere salvate in un file, conviene scrivere tutte le istruzioni in uno 

script, cioè in un file in cui le righe di commento sono precedute dal simbolo # mentre sulle altre righe 

scriviamo i comandi che vanno eseguiti in ambiente gnuplot. 

Ad esempio, scriviamo (con un editor che salva in formato testo – lo stesso che usiamo per scrivere i 

programmi Fortran) il file istr.gnu (possiamo dare anche un’altra estensione che ci ricordi gnuplot, per 

esempio istr.gp): 

set logscale y 

set terminal jpeg 

set output "logfig.jpeg" 

plot [1:20] exp(2)*(1/x)**2 

197


Figura 12.8: Grafico del file multi.dat mediante le istruzioni che personalizzano la legenda. 

Oppure scriviamo il file istr2.gnu: 


set output "fileprova.jpeg" 

plot ’multi.dat’ using 1:2 with lines lw 2 title "y", \ 

’multi.dat’ using 1:3 with lines lw 2 title "z" 

Un modo per eseguire queste istruzioni è scrivere, da una finestra di shell (non in ambiente gnuplot): 

gnuplot istr.gnu 

In tal modo gnuplot esegue solamente le istruzioni contenute nello script istr.gnu, e, una volta eseguite, 

si è di nuovo nella finestra di shell (non si possono eseguire altri comandi perchè noi non entriamo 

nell’ambiente gnuplot). 

Perciò questo modo di eseguire uno script è utile per generare dei files (.jpeg, .gif, .png). Se invece vogliamo 

generare dei grafici su terminale e vogliamo avere il tempo di osservarli, non conviene usare il comando 

gnuplot istr.gnu perchè non riusciremmo a vedere niente. Invece, in ambiente gnuplot, si può digitare 

il comando 

load ’istr.gnu’ 

Vengono eseguite le istruzioni dello script ma si rimane in ambiente gnuplot. Bisogna dunque stare attenti al 

fatto che non vediamo le istruzioni eseguite e che alcuni parametri, se non sono stati già resettati all’interno 

dello script, potrebbero creare problemi. 

Ad esempio, i due files precedenti vanno bene se eseguiti con il comando gnuplot da una finestra di 

shell, mentre è meglio modificarli se si vuole eseguirli mediante il comando load, aggiungendo le seguenti 

ultime 2 righe per evitare di fare altri grafici in scala semilogaritmica e di sovrascriverli sul file di output: 

set logscale y 


set output "logfig.jpeg" 

plot [1:20] exp(2)*(1/x)**2 

198

12.6. Print 

unset logscale 

set terminal wxt 0 

12.6 Print 

Gnuplot può essere usato anche come una calcolatrice: basta scrivere print seguito dalla formula da 

valutare. 

Esempi 

G print cos(pi) 

produce il risultato -1.0 

G print exp(-5) 

dà 0.00673794699908547 

G print 3.4**2 +log(3) - 4*20*7.6 

fornisce -595.341387711332 

199


13 

PRIMI PASSI IN MATLAB® 

L’universo non potrà essere letto 

finché non avremo imparato il 

linguaggio ed avremo familiarizzato 

con i caratteri con cui è scritto. È 

scritto in linguaggio matematico, e 

le lettere sono triangoli, cerchi ed 

altre figure geometriche, senza le 

quali è umanamente impossibile 

comprendere una singola parola. 

Galileo Galilei 

13.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 

13.2 Avvio di MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 

13.2.1 Matrici e vettori in MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 

13.3 Comandi utili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 

13.4 MATLAB® per scrivere ed eseguire programmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 

13.4.1 Strutture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 

13.5 Dati di input . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 

13.5.1 Programma sul metodo delle bisezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 

13.6 Dati di output . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 

13.7 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 

13.8 Sulle potenzialità di MATLAB® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 

13.9 Applicazioni di MATLAB® nel Calcolo Numerico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 

13.9.1 Sull’instabilità numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 

13.9.2 Sull’interpolazione e approssimazione di dati . . . . . . . . . . . . . . . . . . . . . . . . . . 214 

13.9.3 Confronto tra schemi per equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . 220 


MATLAB® può essere considerato un linguaggio di programmazione ad alto livello e, allo stesso tempo, 

un ambiente interattivo per lo sviluppo di algoritmi, per la visualizzazione e l’analisi di dati, e per il calcolo 

numerico. 

201

13. PRIMI PASSI IN MATLAB® 

Per chi ha già imparato a programmare in linguaggio FORTRAN, il passaggio a MATLAB® è semplice (basta 

capire come cambiano le strutture di programmazione e il modo di programmare). In più, MATLAB® ha 

le sue functions, permette di fare calcoli molto più sofisticati di quelli che può fare una calcolatrice, e permette 

di fare grafici e visualizzare i risultati in maniera diretta. Molto spesso la conoscenza di MATLAB® è 

un requisito richiesto per molte posizioni lavorative in ambito ingegneristico: a tal fine, è utile imparare 

qualcosa di MATLAB® . Ed è altrettanto importante prendere atto del fatto che non esiste un linguaggio di 

programmazione che vada bene per risolvere tutti i problemi (quindi non basta conoscere e saper usare un 

solo linguaggio di programmazione). Il FORTRAN si rivela la scelta migliore per risolvere algoritmi numerici 

complicati (un esempio tra tanti: risolvere problemi accoppiati di flusso e trasporto in mezzi porosi dove 

le incognite del problema sono dell’ordine delle migliaia e migliaia). MATLAB® è esso stesso un programma 

complesso (originariamente scritto in FORTRAN e successivamente riscritto in linguaggio C) che va bene 

per risolvere programmi d’elaborazione numerica, per lavorare con matrici (MATLAB® infatti sta per MATrix 

LABoratory “laboratorio matriciale”) e per la grafica. 

MATLAB® è un prodotto della The MathWorkse vedremo in particolare la versione 

MATLAB® 7.10.0.499 (R2010a). 

Un prodotto simile a MATLAB® ma open source è GNU Octave (si vada sul sito http://www.octave. 

org). 

Nel seguito vedremo come si lavora in MATLAB® tenendo presente che quasi tutti i comandi che daremo 

valgono alla stessa maniera anche per Octave (eccezion fatta per l’interfaccia grafico). 

13.2 Avvio di MATLAB® 

Tralasciamo la parte relativa alla procedura di installazione di MATLAB® (che dipende dal computer e dal 

sistema operativo in uso) e diamo per scontato che il programma sia presente sul proprio computer. 

In ambiente Linux, per avviare MATLAB® basta digitare il comando matlab da una finestra di terminale. 

Una volta avviato MATLAB® comparirà il prompt dei comandi in una finestra come quella mostrata in 

Figura 13.1. Per uscire dall’ambiente si digita exit dalla finestra dei comandi oppure dal menu File o ancora 

dall’icona di chiusura (x in alto a destra della finestra). 

Per imparare a usare MATLAB® , inizialmente si prende familiarità con la finestra dei comandi eseguendo 

calcoli come se fosse una calcolatrice. Vediamo che il risultato viene assegnato ad una variabile detta ans e 

che nella Workspace si trovano informazioni su di essa (si veda Figura 13.2). 

13.2.1 Matrici e vettori in MATLAB® 

I vettori si possono scrivere come vettori riga o vettori colonna. 

Per esempio: 

>>x=[1 2] 

>> x=[1 2] 

x = 

1 2 

>> y=[10 20]’ 

y = 

10 

20 

Un vettore riga x viene scritto usando le parentesi quadre e scrivendo le componenti del vettore una dopo 

l’altra. Un vettore colonna può essere creato facendo la trasposta di un vettore riga (mediante il simbolo ’ ), 

oppure mettendo un punto e virgola dopo ciascuna componente: 

202

13.2. Avvio di MATLAB® 

Figura 13.1: L’ambiente MATLAB consiste di una serie di finestre, alcune delle quali vengono aperte di default: 

la Command Window (la finestra dei comandi), la Current Folder (la directory corrente in cui si sta 

lavorando), la Workspace (lo spazio di lavoro) e la Command History (la finestra con la storia dei comandi 

dati). 

Figura 13.2: Primi calcoli in MATLAB® : osservare cosa succede nella Command Window nella Workspace e 

nella Command History. 

203


>> y=[10;20] 

y = 

10 

20 

In MATLAB® i vettori altro non sono che un caso particolare di matrice a n righe e 1 colonna (vettore 

colonna) o a 1 riga e n colonne (vettore riga). Quindi per scrivere una matrice si scrivono i valori della matrice 

riga per riga andando a capo con il punto e virgola: 

>> A=[1 2 3 4; 

5 6 7 8; 

9 10 11 12; 

13 14 15 16] 

A = 

1 2 3 4 

5 6 7 8 

9 10 11 12 

13 14 15 16 

Per matrici (e quindi per i vettori) si possono fare le operazioni di somma e prodotto in maniera molto 

semplice. Date due matrici A e B si ha 

G C=A+B: matrice somma 

G C=A-B: matrice differenza 

G C=A*B: matrice prodotto (deve essere la matrice A di dimensione n × m e la matrice B di dimensione 

m × r altrimenti si ha un messaggio di errore). 

G C=A’: matrice trasposta 

G C=A.*B : matrice i cui elementi sono C (i , j ) = A(i , j ) ∗ B(i , j ) 

Osserviamo che, per indicare un valore della matrice A basta specificare l’indice di riga e di colonna: per 

esempio 

>> A(2,2) 

ans = 

6 

Per indicare gli elementi di tutta la colonna i si usa A(:,i), mentre A(i,:) indica gli elementi della riga i. 

>> A(:,2) 

ans = 

2 

6 

10 

14 

>> A(2,:) 

ans = 

5 6 7 8 

L’operatore due punti può dunque essere usato per estrarre un’intera riga o colonna da una matrice o 

un’intera sottomatrice. Se vogliamo estrarre le ultime due righe e colonne della matrice A, si digita il comando 

204

13.3. Comandi utili 

>> M=A(3:4,3:4) 

M = 

11 12 

15 16 

In questo modo abbiamo creato la matrice M che ha come elementi quelli della sottomatrice di A con le ultime 

due righe e colonne. 

Per scrivere una matrice vuota A, invece, si usa l’istruzione A=[ ]. 

Se si vuole risolvere un sistema lineare Ax = b in MATLAB® si può semplicemente usare una function 

propria di MATLAB® “nascosta” nell’operatore \ (backslash): basta digitare il comando x= A \b, con b 

vettore colonna, per avere in x il vettore incognito. Ad esempio (si confronti con l’esercizio 7.6.2): 

>> A=[0.2 1 0.2; 1 6.5 1.75; 0 2 2.25] 

A = 

0.2000 1.0000 0.2000 

1.0000 6.5000 1.7500 

0 2.0000 2.2500 

>> b=[2.8 ; 19.25; 10.75] 

b = 

2.8000 

19.2500 

10.7500 

>> x=A\b 

x = 

1 

2 

3 

13.3 Comandi utili 

Per lavorare meglio sia nella finestra dei comandi sia, successivamente, per scrivere ed eseguire dei veri e 

propri programmi, risultano utili le seguenti funzioni: 

G who – fornisce l’elenco di tutte le variabili presenti nella finestra dei comandi (lo si può vedere anche 

nella Workspace; 

G whos – fornisce l’elenco di tutte le variabili insieme allo spazio in memoria da esse occupato; 

G help – può essere usato da solo o insieme al nome di una function di MATLAB® o creata dall’utente, e 

mostra tutte le informazioni utili per capire come usare MATLAB® o quella function; 

G clear – usata da sola cancella tutte le variabili presenti nella finestra dei comandi, seguita da un elenco 

di variabili (messe una di seguito all’altra senza virgole) cancella tutte quelle variabili; 

G il punto e virgola “;” messo dopo un’istruzione non fa vedere il risultato dell’istruzione nella finestra 

dei comandi; 

G il simbolo % è il simbolo per scrivere commenti: 

ciò che viene scritto dopo % rappresenta un 

commento; 

G diary – permette di salvare, su un file che viene chiamato diary, il contenuto di ciò che viene scritto 

nella finestra dei comandi. Il file diary si trova nella directory corrente in cui si sta lavorando; 

G diary off – chiude il file aperto mediante l’istruzione diary; 

205


G diary filediary – comando analogo a diary, ma il file non si chiamerà diary bensì filediary; 

G save filesave – salva tutte le variabili presenti nel Workspace, nel file filesave.mat; 

G load ’filesave’ – ripristina lo stato del Workspace, per esempio dopo aver chiuso la sessione di 

MATLAB® , caricando tutte le variabili che erano state salvate in filesave.mat. 

C‘e una notevole differenza di significato tra i files generati dall’istruzione diary e quelli generati mediante 

save. Ciò che salviamo con il comando diary è paragonabile a ciò che può essere scritto alla lavagna 

e di cui prendiamo appunti: scriviamo un file di testo che possiamo elaborare o da cui possiamo trarre dei 

risultati per i nostri problemi. Al contrario, quello che viene salvato mediante il comando save è costituito 

da una o più variabili, che possono essere riutilizzate nuovamente in MATLAB® nella finestra dei comandi, in 

sessioni successive a quella in cui sono state create, senza dover rieseguire tutti i comandi che hanno portato 

alla creazione delle variabili stesse. 

Il comando save è utile anche per salvare singole matrici o una lista di matrici nella directory corrente. Ci 

soffermiamo sulla possibilità di salvare i dati in formato ASCII, in modo da poter utilizzare i dati che salviamo 

non solo in MATLAB® ma anche in programmi scritti con altri linguaggi di programmazione. Supponiamo 

di avere una matrice A e di volerla salvare nel file matriceA.dat. Scriveremo il comando 

save matriceA.dat A -ascii 

Quando vogliamo caricare in MATLAB® la matrice dal file useremo il comando 

load(’matriceA.dat’) 

e in questo modo avremo la matrice nella variabile matriceA (il nome del file senza l’estensione dopo il 

punto). 

13.4 MATLAB® per scrivere ed eseguire programmi 

A differenza del FORTRAN, MATLAB® non ha subroutines e functions ma solo functions che possono 

avere uno o più variabili di ingresso e una o più variabili in uscita. 

I files in cui vengono scritti i programmi si chiamano M-files dal fatto che hanno l’estensione .m: 

prova.m, fun.m, . . . I files vanno scritti con l’editor di testo di MATLAB® o con un altro editor di testo in 

formato ASCII (quello che facciamo per il FORTRAN). 

Quello che in FORTRAN corrisponde al programma principale, in MATLAB® prende il nome di script, 

per il fatto che presenta una lista di comandi da eseguire in ambiente MATLAB® , tra cui la chiamata alle 

functions proprie di MATLAB® o definite dall’utente (sempre tramite M-files). Inoltre non bisogna dare nessuna 

istruzione di inizio e fine programma (cioè non esiste l’equivalente delle istruzioni program e stop, 

end con cui apriamo e chiudiamo un programma principale in FORTRAN). È importante vedere subito una 

importante differenza tra FORTRAN e MATLAB® : mentre in FORTRAN, siamo abituati a scrivere un programma 

in un unico file, includendo in esso anche le subroutines e le functions che ci servono, poichè poi 

dobbiamo compilare per avere il programma eseguibile, in MATLAB® le functions e gli scripts vengono 

sempre scritti su files distinti. 

Per eseguire uno script salvato in nomefile.m non c’è bisogno di dover compilare il programma (come 

invece si deve fare per il FORTRAN): basta lanciare il programma nella finestra dei comandi mediante il 

nome del file (senza l’estensione .m) o mediante il comando run(’nomefile.m’) o run(’nomefile’). 

Una function invece può essere eseguita tramite uno script oppure direttamente nella finestra dei 

comandi, specificando le variabili di ingresso e di uscita, come vedremo con qualche esempio tra breve. 

Per quanto riguarda il nome da dare alle variabili, MATLAB® è sensibile alle lettere minuscole e 

maiuscole: una variabile chiamata A è diversa da a, una variabile XOLD è diversa da xold. 

È importante osservare, inoltre, che nello scrivere M-files le variabili utilizzate non vanno dichiarate, 

come invece va fatto in FORTRAN. 

13.4.1 Strutture 

Per capire le differenze di programmazione tra FORTRAN e MATLAB® , partiamo dagli operatori logici. 

Vediamo nel seguito come si scrivono i vari cicli in FORTRAN e in MATLAB® : 

206

13.4. MATLAB® per scrivere ed eseguire programmi 

Operatore MATLAB® Operatore FORTRAN Significato 

< .LT minore 

> .GT. maggiore 

= .GE. maggiore o uguale 

== .EQ. uguale 

∼= .NE. non uguale 

&& .AND. congiunzione 

|| .OR. disgiunzione 

∼ .NOT. negazione 

Tabella 13.1: Operatori relazionali e logici 

in FORTRAN 

i f ( espr . logica ) then 



{ . . . . } 

else 



{ . . . . } 

end i f 

in MATLAB® 

i f ( espr . logica ) 



{ . . . . } 

else 



{ . . . . } 

end 

in FORTRAN 

i f ( espr . logica1 ) then 



{ . . . . } 

else i f ( espr . logica2 ) then 



{ . . . . } 

. . . . 

else 



{ . . . . } 

end i f 

in MATLAB® 

i f ( espr . logica1 ) 



{ . . . . } 

e l s e i f ( espr . logica2 ) 



{ . . . . } 

. . . . 

else 



{ . . . . } 

end 

Osserviamo che in MATLAB® non ci sono i then e che elseif va scritto tutto attaccato. 

207


in FORTRAN 

do while ( espressione logica ) 



{ . . . } 


end do 

in MATLAB 

while ( espressione logica ) 



{ . . . } 


end 

Nel ciclo while si elimina il do. 

in FORTRAN 

do ind= v a l i n i z , v a l f i n , incr 


end do 

in MATLAB 

for ind= v a l i n i z : incr : v a l f i n 


end 

Il ciclo do in FORTRAN diventa ciclo for in MATLAB® . L’ordine delle variabili relative al valore iniziale 

del ciclo, valore finale e incremento non è più come in FORTRAN e ci sono i due punti al posto della virgola: 

osservare bene le differenze. 

C’è un’altra struttura che si trova in MATLAB® e non in FORTRAN 77: è la costruzione switch-case. 

switch ( espressione ) % ( s c a l a r e o stringa ) 

case { valore1 } % eseguita se l ’ espressione e ’ valutata al valore1 ) 


{ . . . } 

case { valore2 } % ( eseguita se l ’ espressione e ’ valutata al valore2 ) 


{ . . . } 

otherwise 


{ . . . } 

end 

Il ciclo con switch confronta i valori dati nell’espressione di input (subito dopo switch) con ciascun 

valore assegnato a case ed esegue le istruzioni relative al case in cui valore ed espressione coincidono. 

Nell’esempio che riportiamo, a seconda del valore assegnato alla variabile scelta cambiano i valori da 

assegnare alle variabili a e b: 

s c e l t a =’test1’ ; 

switch s c e l t a 

case {’test1’} 

x0= 0 . 1 ; 

x1= 0 . 2 ; 

case {’test2’} 

x0= 0 . 0 ; 

x1= 1 . 0 ; 

otherwise 

disp (’nessun␣caso␣test␣scelto’) 

end 

Osserviamo che scelta è una variabile di stringa di caratteri, il nome del caso test scritto tra apici; per 

visualizzare un messaggio sulla Command Window, abbiamo usato la function di MATLAB® chiamata disp. 

208

13.5. Dati di input 

13.5 Dati di input 

Quando si lavora nella finestra dei comandi, per assegnare il valore alle variabili basta scrivere il nome 

della variabile seguito dal simbolo di uguale e dal valore (o dai valori) da assegnare (a seconda che si tratti di 

una variabile scalare, matrice, vettore...): 

>> a=10.5; 

>> A=[1 2 3; 4 5 6; 7 8 9]; 

Nell’eseguire uno script, alla stessa maniera, si può assegnare il valore alle variabili direttamente all’interno 

dello script. Tuttavia, se si vuole dare maggiore generalità al programma e si vogliono dare in input i valori 

delle variabili, conviene usare la function input. Vediamo con un esempio: 

a=input(’␣scrivi␣il␣valore␣della␣variabile␣a␣’) 

Il messaggio contenuto tra apici viene visualizzato sulla finestra dei comandi e il prompt aspetterà che l’utente 

scriva il valore da assegnare ad a. La function input si può dunque paragonare alle istruzioni di write 

e read in FORTRAN per assegnare il valore alle variabili. 

Questa procedura può essere utilizzata sia per assegnare il valore a variabili scalari, sia per matrici e vettori. 

Tuttavia, se i dati di input sono molto “pesanti” (ad esempio matrici di dimensioni molto elevate), conviene 

usare in maniera opportuna la funzione di input unitamente al comando load - scrivendo una volta per tutte 

la matrice di input in un file da caricare ogni volta che si vuole eseguire il programma con quella matrice. 

Per esempio, abbiamo scritto nel file A.dat i valori della matrice e vogliamo dare in input questa matrice al 

nostro programma. Invece di scrivere 

A= input(’␣matrice␣A␣’); 

nello script scriveremo 

A= input(’␣file␣di␣input␣con␣la␣matrice␣A␣’, ’s’); 

A= load(A); 

Osserviamo che abbiamo usato input inserendo, oltre alla stringa tra apici ’file di input con la 

matrice A’, anche ’s’: questa opzione serve perchè noi scriveremo il nome del file su cui si trova memorizzata 

la matrice e questo file viene letto come una stringa di caratteri per cui inizialmente alla variabile A 

viene associato il file con la matrice (in questo caso A.dat). Con il comando successivo, viene caricato il file 

e memorizzato di nuovo sulla variabile A, che quindi diventa la nostra matrice. 

Si osservi la differenza che c’è nel lasciare o meno spazi bianchi prima dell’apice che chiude la frase che 

viene visualizzata sulla Command Window tramite input. 

È utile sapere anche che, se un’istruzione è troppo lunga e si vuole andare a capo, si utilizzano tre puntini 

... sulla riga che si vuole interrompere e si prosegue a scrivere sulla riga successiva. 

13.5.1 Programma sul metodo delle bisezioni 

Consideriamo l’algoritmo del metodo delle bisezioni come descritto a pag. 38 per calcolare gli zeri di 

un’opportuna funzione f . 

Ad esempio vogliamo risolvere il problema f (x) = 0 con f (x) = ( x 2 )2 − sin(x) 

nell’intervallo [1,3]. 

Dobbiamo scrivere il programma principale, in un file che chiamiamo bisez.m, e la function legata alla 

funzione f (x), in un file che chiamiamo fun.m. 

Scriviamo il programma principale: 

% programma per i l calcolo d e g l i z e r i di una funzione mediante 

% i l metodo di bisezione 

a=input (’primo␣estremo␣dell’’intervallo␣a␣’ ) ; 

b=input (’secondo␣estremo␣dell’’intervallo␣b␣’ ) ; 

aux=fun ( a ) * fun (b ) ; 

i f aux>=0 

disp (’estremi␣dello␣stesso␣segno’) 

break 

end 

itmax =100; 

209


t o l l =1.e−10; 

i t e r =0; 

c =(a+b ) * 0 . 5 ; 

scarto=abs (b−a ) * 0 . 5 ; 

while i t e r t o l l 

i t e r = i t e r +1; 

aux=fun ( a ) * fun ( c ) ; 

i f aux>0 

a=c ; 

else 

b=c ; 

end 

c =(a+b ) * 0 . 5 ; 

scarto=abs (b−a ) * 0 . 5 ; 

end 

i f fun ( c)==0 | | scarto < t o l l 

s p r i n t f (’%s␣%15.8e’ , ’soluzione␣approssimata␣c=␣’ , c ) 

else 

s p r i n t f (’%s’ , ’raggiunto␣numero␣max␣di␣iterazioni␣’) 

end 

Per poter essere eseguito, dobbiamo scrivere in un file chiamato fun.m la function fun. Si ha: 

function y=fun ( x ) 

% funzione per lo schema d e l l e b i s e z i o n i 

% input x 

% output y =(x /2)^2 −sin ( x ) 

y=( x/2).^2 − sin ( x ) ; 

Nel programma principale abbiamo semplicemente tradotto l’algoritmo del metodo delle bisezioni. Abbiamo 

considerato dei comandi che non abbiamo ancora visto in MATLAB® , per la stampa dei risultati (mediante 

sprintf) e abbiamo usato il comando break per interrompere l’esecuzione del programma se una 

condizione non è verificata. 

Le righe di commento scritte dopo l’istruzione function y=fun(x) vengono visualizzate sulla 

Command Window se, una volta salvata la function, digitiamo l’istruzione help fun 

13.6 Dati di output 

L’ambiente MATLAB® permette di visualizzare tutte le variabili presenti al termine dell’esecuzione di un 

programma o di una funzione. Tuttavia, alcune volte vogliamo visualizzare subito dei risultati sulla Command 

Window o su un file separato rispetto all’ambiente di lavoro. Abbiamo già visto, nell’esempio precedente 

il comando sprintf: esso serve per stampare un messaggio sulla Command Window utilizzando un 

certo tipo di formato. 

Nell’esempio avevamo usato 

sprintf(’%s␣%15.8e’, ’soluzione␣approssimata␣c=␣’, c) 

All’interno delle parentesi tonde si possono riconoscere due parti: nella prima parte si scrive, tra apici e uno di 

seguito all’altro, il formato da utilizzare per la stampa delle variabili che sono scritte subito dopo. Nel nostro 

caso, le variabili da stampare sono la stringa di caratteri soluzione approssimata c= e il valore della 

variabile c. Per la stringa di caratteri si usa il formato delle stringhe che è dato da %s mentre per la variabile c, 

volendo scriverla mediante un formato esponenziale con 8 cifre nella mantissa, usiamo il formato %15.8e. 

Rispetto al FORTRAN, il formato per una variabile è preceduto dal simbolo % ma per il resto non ci sono 

grosse differenze. Per la variabili intere o reali possiamo decidere quante cifre utilizzare per rappresentare la 

variabile (%15.8e nell’esempio). Riassumiamo nella tabella seguente i principali tipi di formato e i simboli 

che servono per andare a capo o creare nuove linee: Se si vogliono scrivere i risultati su un file, occorre aprire 

il file e associarlo ad una variabile mediante la function fopen. Ad esempio 

fid= fopen(’risultati.txt’,’w’) 

210

13.7. Grafici 

formato 

Significato 

%s stringhe di caratteri 

%d formato intero 

%f formato fisso 

%e formato esponenziale (del tipo 3.5e + 00) 

%E formato esponenziale (del tipo 3.5E + 00) 

\ n nuova linea 

\ r per andare a capo 

Tabella 13.2: Il formato 

Figura 13.3: Finestra con il grafico 

Con questa istruzione aprimamo il file di risultati dal nome risultati.txt (’w’ indica che il file è di 

scrittura) associandolo alla variabile fid. Per scrivere sul file, al posto della function sprintf si userà la 

function fprintf che differisce dalla prima per il fatto che bisogna indicare la variabile associata al file di 

scrittura dati. Il comando sprintf di prima diventa ora: 

fprintf(fid , ’%s␣%15.8e’, ’soluzione␣approssimata␣c=␣’, c) 

Per chiudere il file si usa l’istruzione fclose(fid). Quindi fopen e fclose sono equivalenti alle 

istruzioni open e close che abbiamo visto in FORTRAN. 

13.7 Grafici 

Supponiamo di voler fare il grafico di una serie di dati (x i , y i ), i = 1,...,n. Sulla Command Window (o 

all’interno di uno script) basta digitare il comando 

plot(x,y) 

Si aprirà una nuova finestra con il grafico (vedi Figura 13.3). 

Potremo poi modificare il colore, il tipo di linea, inserire titolo, legenda,...operando direttamente sul menu 

della finestra del grafico, o inserendo i comandi opportuni tramite la Command Window 1 . 

Si possono sovrascrivere grafici l’uno sull’altro utilizzando il comando hold on. Oppure si possono 

affiancare grafici mediante il comando subplot. Lasciamo gli approfondimenti all’help on line. 

1 Ci sarebbe tanto da dire a riguardo ma lasciamo che il lettore curioso approfondisca l’argomento utilizzando l’help on line di 

MATLAB® . In Octave, invece, le modifiche ai grafici non possono essere fatte usando la finestra del grafico. 

211


Per fare il grafico di una funzione, si possono seguire diverse strade. 

Se si ha a disposizione la function (propria di MATLAB® o scritta su un file .m), si può costruire il vettore 

con il valore della funzione in un numero determinato di punti equidistanti sull’intervallo in cui si desidera 

visualizzarla. A tal proposito è utile la function linspace che permette di discretizzare un intervallo chiuso 

[a,b] in un prefissato numero di punti. Useremo allora le seguenti istruzioni: 

x=linspace ( 0 , 2 ) ;% discretizziamo l ’ i n t e r v a l l o [ 0 , 2 ] in 100 parti 

% uguali 

% x=linspace (50 , 0 , 2 ) d i s c r e t i z z a l ’ i n t e r v a l l o in 

%50 parti uguali 

y=myfun( x ) ; % valuto la function myfun nel v e t t o r e x 

plot ( x , y ) 

Questo approccio è comodo quando la funzione da visualizzare ha una espressione complicata o quando 

stiamo lavorando all’interno di uno script. La function myfun deve essere scritta in modo che sia possibile 

valutarla direttamente su un vettore (che è quello che facciamo tramite l’istruzione y=myfun(x)). Le 

operazioni di moltiplicazione, divisione ed elevamento a potenza devono essere vettorizzate, facendo precendere 

il simbolo di moltiplicazione, divisione e elevamento a potenza dal simbolo del punto – .*, ./, 

.ˆ – permettendo, in tal modo, che le operazioni vengano fatte componente per componente del vettore. Le 

operazioni di somma e differenza sono vettorizzate per definizione. 

Ad esempio: la function myfun definita tramite le istruzioni 

function [ y ]= f ( x ) 

y=log ( x ) * x 

non è vettorizzata. Se invece scriviamo 

function [ y ]= f ( x ) 

y=log ( x ) . * x 

allora la function è vettorizzata. 

Un’altra via è di scrivere la function come una funzione inline nella Command Window e di utilizzare la 

function ezplot per farne il grafico. 

Supponiamo di voler fare il grafico della funzione f (x) = e x −10sin(x)−1. Per avere questa funzione nella 

Command Window durante la sessione di lavoro (quindi non come una function scritta su file), scriviamo il 

comando 

fun = inline(’exp(x)-10*sin(x)-1’) 

Sulla Command Window compaiono le seguenti righe: 

>> fun=inline(’exp(x)-10*sin(x)-1’) 

fun = 

Inline function: 

fun(x) = exp(x)-10*sin(x)-1 

Se vogliamo farne il grafico nell’intervallo [0,2] scriveremo 

ezplot(fun, 0, 2) 

e viene direttamente creato il grafico della funzione fun. La function ezplot può essere utilizzata anche 

con funzioni intrinseche di MATLAB® o definite dall’utente in forma vettorizzata (per esempio 

ezplot(’sin’,0,2) 

crea il grafico della funzione sin(x) nell’intervallo [0,2]). 

13.8 Sulle potenzialità di MATLAB® 

MATLAB® ha un grande numero di functions predefinite che permettono di eseguire applicazioni in diversi 

settori propriamente matematici, per approssimare zeri di funzioni, per lavorare su matrici sparse, ri- 

212

13.9. Applicazioni di MATLAB® nel Calcolo Numerico 

solvere equazioni differenziali, lavorare su dati statistici, fare grafici in due e tre dimensioni... Basta vedere il 

Demo di MATLAB® per trovare la function di cui si ha bisogno. 

È possibile inoltre installare pacchetti specifichi per specifiche aree di applicazioni, quali sistemi di 

controllo, biologia computazionale, finanza computazionale, meccatronica... 

In questa breve presentazione di MATLAB® , tuttavia, cercheremo di vedere come utilizzarlo per capire 

meglio alcuni dei problemi trattati in Calcolo Numerico, rielaborando o ripresentando alcuni esempi già visti. 

13.9 Applicazioni di MATLAB® nel Calcolo Numerico 

13.9.1 Sull’instabilità numerica 

Riprendiamo l’esempio 3.7.1 visto nel Capitolo 3 per cui vogliamo approssimare il valore degli integrali 

espressi mediante la formula 

∫ 1 

x n 

y n = 

0 x + 10 dx 

per valori di n = 1,2,...,30. 

Avevamo visto due formule ricorsive che ci permettevano di approssimare y n , una era instabile e l’altra 

era stabile. 

Proviamo a rivedere gli algoritmi (nell’esempio 3.7.1) e scriviamo un programma MATLAB® da eseguire 

per verificare quanto avevamo detto. 

% E s e r c i z i o sull ’ i n s t a b i l i t a ’ numerica 

% calcolo dell ’ i n t e g r a l e y_n= int_0^1 x^n / ( x+10) dx 

% 

% y i n s t : v e t t o r e con i v a l o r i dell ’ algoritmo i n s t a b i l e 

% y s t : v e t t o r e con i v a l o r i dell ’ algoritmo s t a b i l e 

% 

% algoritmo i n s t a b i l e 

% 

y inst (1)= log (11) −log ( 1 0 ) ; %corrisponde al valore i n i z i a l e 

for i =1:30 

y inst ( i +1)= 1/ i −10* y inst ( i ) ; 

end 

% 

% algoritmo s t a b i l e 

% s i r i c hiede che i l valore dell ’ i n t e g r a l e y_n1 s i a approssimato 

% con una accuratezza data dal valore di input t o l 

n1= input (’␣indice␣n1’ ) ; 

t o l =input (’␣tolleranza␣tol’ ) ; 

k= −log10 ( t o l ) + n1 ; 

k= f i x ( k + 1 ) ; % f i x e ’ una function che e f f e t t u a l ’ arrotondamento 

% del numero in modo da avere un valore intero 

yst ( k ) = 0 ; 

for j =k−1:−1:1 

yst ( j ) =1/10*(1/ j − yst ( j + 1 ) ) ; 

end 

Uno volta eseuito lo script, nella Command Window si hanno i due vettori che possono essere confrontati tra 

loro. Osserviamo che l’equivalente programma FORTRAN sarebbe meglio scriverlo non utilizzando i vettori 

e facendosi stampare i risultati intermedi su un file. In questo caso, potendo avere i risultati sulla Command 

Window, ci conviene usare dei vettori. Il valore iniziale y 0 si avrà nella prima componente dei vettori che 

vengono creati. Perciò si faccia attenzione agli indici utilizzati (per yst si usa j e j+1: perchè?). 

Volendo, si può modificare lo script facendo uso della function di MATLAB® single che converte il 

risultato in singola precisione in modo da confrontare i due algoritmi con i calcoli in singola precisione. 

213


Figura 13.4: Algoritmo instabile: schermata del confronto tra l’uso o meno della function single 

% y i n s t s i n g : v e t t o r e dell ’ algoritmo i n s t a b i l e lavorando 

% in singola precisione 

% y s t s i n g : v e t t o r e dell ’ algoritmo s t a b i l e lavorando 

% in singola precisione 

yinstsing (1)= single ( log ( 1 1 ) ) −single ( log ( 1 0 ) ) ; 

for i =1:30 

yinstsing ( i +1)= single (1/ i ) −single (10* yinstsing ( i ) ) ; 

end 

n1= input (’␣indice␣n1’ ) ; 

t o l =input (’␣tolleranza␣tol’ ) ; 

k= −log10 ( t o l ) + n1 ; 

k= f i x ( k + 1 ) ; 

ystsing ( k ) = 0 ; 

for j =k−1:−1:1 

ystsing ( j ) = single (1/10)* single (1/ j − ystsing ( j + 1 ) ) ; 

end 

Come si può osservare dalle Figure 13.4 e 13.5, i risultati ottenuti dall’algoritmo instabile cambiano a seconda 

che si usi o meno la function single mentre abbiamo gli stessi risultati (consideriamo le cifre corrette in 

singola precisione, usando il formato format short e) per l’algoritmo stabile. 

13.9.2 Sull’interpolazione e approssimazione di dati 

In MATLAB® esistono già delle function che permettono di interpolare e approssimare delle serie di dati. 

C’è la function polyfit che, dati i vettori contenenti le ascisse e le ordinate da interpolare o approssimare, 

di dimensione n, e il grado m del polinomio che si vuole creare, fornisce in output il vettore contenente i 

214


Figura 13.5: Algoritmo stabile: schermata del confronto tra l’uso o meno della function single 

coefficienti del polinomio interpolante (o approssimante) in ordine decrescente [a m a m−1 ... a 0 ] da cui il polinomio 

è p(x) = a m x m + a m−1 x m−1 +... a 0 : per m = n −1 si ha il polinomio di interpolazione, per m < n −1 si 

ha il polinomio di approssimazione. L’algoritmo si basa sul processo di minimizzazione nel senso dei minimi 

quadrati. 

Esempio: 

>> x=[7 8 9 10]; 

>> y=[3 1 1 9]; 

>> p=polyfit(x,y,3) 

p = 

1.0000 -23.0000 174.0000 -431.0000 

Significa che il polinomio di interpolazione è: 

p(x) = x 3 − 23x 2 + 174x − 431 

Una volta ricavati i coefficienti, si può fare un grafico del polinomio utilizzando la function polyval. 

>> xx=linspace(x(1), x(4)); 

>> yy=polyval(p,xx); 

>> plot(x,y,’o’, xx,yy) 

215


Con polyval si valuta il polinomio, i cui coefficienti sono dati dal vettore p, nei punti di xx. Abbiamo usato 

la function plot per rappresentare sullo stesso grafico due curve, quella dei dati x,y (grafico che facciamo 

per punti utilizzando dei “cerchietti”) e quella del polinomio. 

Scriviamo ora delle function che ci permettano di ottenere il polinomio di interpolazione sia usando 

l’approccio delle funzioni base monomiali che porta alla costruzione della matrice di Vandermonde, 

sia costruendo i polinomi di Lagrange o utilizzando le differenze divise di Newton (si riveda il Capitolo 5 

sull’interpolazione). 

Usando le funzioni base monomiali, scriviamo la seguente function, interpmonom: 

function p=interpmonom( x , y ) 

% function p=interpmonom ( x , y ) 

% interpolazione monomiale 

% dati i v a l o r i x e y da interpolare s i c o s t r u i s c e i l v e t t o r e p 

% dei c o e f f i c i e n t i del polinomio di interpolazione 

% applicando i l metodo dei c o e f f i c i e n t i indeterminati 

% 

% se x e y non sono gia ’ v e t t o r i colonna l i rendiamo t a l i 

% mediante l e due i s t r u z i o n i s u c c e s s i v e 

x=x ( : ) ; 

y=y ( : ) ; 

i f length ( x)~= length ( y ) 

% length e ’ una function che misura la lunghezza del v e t t o r e 

% ( s i confronti la d i f f e r e n z a tra length e s i z e ) 

error (’MATLAB:interpmonom’ , . . . 

’i␣vettori␣x␣e␣y␣non␣hanno␣la␣stessa␣lunghezza’) 

else 

n=length ( x ) −1; 

% V matrice di Vandermonde c o s t r u i t a in maniera r i c o r s i v a 

V( : , 1 ) = ones (n+1 , 1 ) ; 

for i =2:n+1 

V ( : , i )= x . * V ( : , i −1); 

end 

p=V\y ; 

% i l v e t t o r e p contiene i c o e f f i c i e n t i del polinomio i n t e r p o l a t o r e 

% in ordine c r e s c e n t e − p0 p1 p2 . . . 

% se vogliamo usare la function del MATLAB polyval per valutare 

% t a l e polinomio in piu ’ punti , dobbiamo s c r i v e r l i in ordine decrescente 

for i =1:n+1 

aux ( i )=p(n+2− i ) ; 

end 

p=aux ; 

end 

Osserviamo che abbiamo usato l’istruzione error per mostrare un messaggio di errore e far interrompere 

l’esecuzione della function, nel caso in cui i dati di input x e y non abbiano la stessa lunghezza. La stringa 

’MATLAB:interpmonom’ è una stringa di identificazione dell’errore (puù essere anche omessa), mentre la 

stringa ’i vettori x e y non hanno la stessa lunghezza’ è quella che viene visualizzata durante l’esecuzione del 

codice. 

La matrice V è stata costruita in maniera ricorsiva. Una volta calcolato il vettore p possiamo valutare il 

polinomio di interpolazione mediante la polyval. 

Riprendendo l’esempio di prima, con x,y,xx,yy già dati: 

>> p=interpmonom(x,y); 


Per quanto riguarda l’interpolazione di Lagrange, si considerino le due functions che chiamamo 

lagrange e interplagrange rispettivamente. La prima valuta l’i -simo polinomio di Lagrange e l’altra 

valuta il polinomio di interpolazione di Lagrange in un assegnato punto (o nelle componenti di un vettore). 

216


function yval=lagrange ( xval , x , i ) 

% function yval=lagrange ( xval , x , i ) 

% function che calcola i l polinomio i−simo di Lagrange 

% valutandolo in xval 

% xval puo ’ e s s e r e uno s c a l a r e o un v e t t o r e 

% x − v e t t o r e d e l l e a s c i s s e da interpolare 

xval=xval ( : ) ; 

n=length ( x ) ; 

yval =ones ( length ( xval ) , 1 ) ; % s i crea un v e t t o r e di t u t t i 1 

for j =1:n 

i f j ~= i 

yval=yval . * ( xval−x ( j ) ) / ( x ( i ) −x ( j ) ) ; 

end 

end 

function yval=interplagrange ( xval , x , y ) 

% function yval=interplagrange ( xval , x , y ) 

% dati i v e t t o r i x e y da interpolare 

% la function implementa l ’ interpolazione di Lagrange valutandola 

% in xval 

% xval puo ’ e s s e r e uno s c a l are o un v e t t o r e 

% questa function chiama la function lagrange ( xval , x , i ) 

i f length ( x)~= length ( y ) 

error (’MATLAB:interplagrange’ , . . . 

’i␣vettori␣x␣e␣y␣non␣hanno␣la␣stessa␣lunghezza’) 

else 


yval=zeros ( length ( xval ) , 1 ) ; % s i crea un v e t t o r e di t u t t i zero 

n=length ( x ) −1; % n grado del polinomio 

for i =1:n+1 

yval = yval + lagrange ( xval , x , i ) * y ( i ) ; 

end 

end 

Eseguiamo l’esempio di prima per vedere cosa si ottiene: 

>> yy=interplagrange(xx,x,y); 


Ora la function interplagrange sostituisce l’uso delle due function polyfit, polyval o 

interpmonom, polyval. 

Calcoliamo ora il polinomio di interpolazione mediate le differenze divise di Newton. Scriviamo due 

functions, la prima che scrive la tabella delle differenze divise, la seconda che valuta il polinomio di interpolazione 

implementando l’algoritmo di Horner 2 in modo da minimizzare il numero delle operazioni da 

eseguire. 

function table= d i v d i f ( x , y ) 

% function table=divdif ( x , y ) 

% x − a s c i s s e dei dati da interpolare 

% y − ordinate dei dati da interpolare 

% table − t a b e l l a d e l l e d i f f e r e n z e d i v i s e 

x=x ( : ) ; 

y=y ( : ) ; 

n=length ( x ) ; 

m=length ( x ) ; 

2 William Horner (1786-1837) fu un matematico inglese, ricordato essenzialmente per il suo metodo sulle equazioni algebriche. 

Spieghiamo l’algoritmo solo per rendere comprensibile la function che scriviamo. 

217


i f n~=m 

error (’MATLAB:differenze_divise’ ,’errore␣sui␣dati’) 

else 

table=zeros (n , n ) ; % iniziamo la t a b e l l a come una matrice di z e r i 

table ( : , 1 ) = y ; 

for j =2:n 

for k =2: j 

table ( j , k)= ( table ( j , k−1) − table ( j −1,k−1) ) / . . . 

( x ( j ) − x ( j−k+1) ) ; 

end 

end 

end 

La diagonale principale della matrice table ha i coefficienti a 0 , a 1 , ... a n del polinomio di interpolazione. 

Il polinomio è dunque: 

p(x) = a 0 + a 1 (x − x 0 ) + a 2 (x − x 0 )(x − x 1 ) + ... + a n (x − x 0 )(x − x 1 )···(x − x n−1 ) 

Per valutarlo in un punto x eseguiamo i seguenti passaggi, applicando, in tal modo, l’algoritmo di Horner: 

p = a n 

p = p(x − x n−1 ) + a n−1 

= a n (x − x n−1 ) + a n−1 

p = p(x − x n−2 ) + a n−2 

. 

= a n (x − x n−1 )(x − x n−2 ) + a n−1 (x − x n−2 ) + a n−2 

p = p(x − x 0 ) + a 0 

= a n (x − x n−1 )(x − x n−2 )...(x − x 1 )(x − x 0 ) + ... + a 1 (x − x 1 )(x − x 0 ) + a 0 

= a 0 + a 1 (x − x 0 )(x − x 1 ) + ... + a n (x − x 0 )(x − x 1 )...(x − x n−2 )(x − x n−1 ) 

La function da scrivere è dunque: 

function yval= i n t e r p d i v d i f ( xval , x , table ) 

% function yval= i n t e r p d i v d i f ( xval , x , table ) 

% x − a s c i s s e dei dati da interpolare 

% table − t a b e l l a d e l l e d i f f e r e n z e divise , 

% ottenuta dalla function d i v d i f ; 

% servono i v a l o r i della diagonale principale 

% xval − s c a l a r e o v e t t o r e in cui c a l c o l a r e i l polinomio 

% i n t e r p o l a t o r e 

% yval − valore ( o v a l o r i ) del polinomio i n t e r p o l a t o r e 

% valutato in xval 

% nel calcolo del polinomio i n t e r p o l a t o r e s i applica 

% l ’ algoritmo di Horner 


x=x ( : ) ; 

n=length ( x ) −1; 

yval=table (n+1 ,n+1)* ones ( length ( xval ) , 1 ) ; 

for j =n: −1:1 

yval=yval . * ( xval−x ( j ) ) + table ( j , j ) ; 

end 

Le functions appena descritte possono essere usate in maniera del tutto equivalenti per risolvere il problema 

dell’interpolazione. Ci sono però dei casi in cui i risultati ottenuti dalla polyfit e dalla interpmonom 

non sono corretti in quanto la matrice di Vandermonde ad esse legate è malcondizionata. 

218


Abbiamo già descritto gli effetti del malcondizionamento nella Sezione 5.4.1 del Capitolo 5. Quando applichiamo 

la function polyfit ai dati di quel problema, si ha il seguente messaggio di avvertimento (un 

warning): 

>> poli=polyfit(x,y,5) 

Warning: Polynomial is badly conditioned. Add points with distinct X 

values, reduce the degree of the polynomial, or try 

centering 

and scaling as described in HELP POLYFIT. 

Questo ci dice che i risultati che avremo non saranno buoni e, effettivamente, se facciamo il grafico dei dati 

del problema e del polinomio di interpolazione ottenuto con la polyfit, si nota subito che il polinomio è 

completamente errato (vedi Figura 13.8) Anche nell’applicare la function interpmonom si ha il messaggio di 

Figura 13.6: Uso della function polyfit per l’esempio malcondizionato. 

avvertimento 

>> pmon=interpmonom(x,y) 

Warning: Matrix is close to singular or badly scaled. 

Results may be inaccurate. RCOND = 5.537667e-31. 

Se aggiungiamo al grafico precendente la curva corrispondente al polinomio ottenuto con la interpmonom 

osserviamo come le due curve siano tra loro distinte e non interpolano i dati. 

Figura 13.7: Uso della function interpmonom per l’esempio malcondizionato. 

Proviamo invece ad applicare l’algoritmo di Lagrange o delle differenze divise di Newton e aggiungiamo 

le nuove curve sul precedente grafico: 

219


>> ylagr=interplagrange(xx,x,y); 

>> table=divdif(x,y); 

>> ynewt=interpdivdif(xx,x,table); 

>> plot(xx,ylagr,xx,ynewt) 

Figura 13.8: Uso delle functions corrispondenti agli algoritmi di Lagrange e delle differenze divise di Newton 

nell’esempio malcondizionato. Osserviamo che la Figura 5.6 relativa allo stesso problema è stata ottenuta 

eseguendo le stesse functions (per semplicità abbiamo omesso i risultati ottenuti dalla interpmonom) in 

ambiente Octave. 

Si nota subito che le due curve sono tra loro coincidenti e interpolatorie! 

13.9.3 Confronto tra schemi per equazioni differenziali ordinarie 

Nel Capitolo 10 abbiamo introdotto alcuni metodi per la risoluzione di equazioni differenziali ordinarie, 

in particolare i metodi di Eulero esplicito, di Eulero implicito e di Crank-Nicolson. 

Li abbiamo anche confrontati per capire meglio il concetto di stabilità, considerando l’equazione test 

y ′ = −y con y(0) = 1 (si veda a proposito la Figura 10.2). 

Scriviamo ora un programma MATLAB® che, per questa equazione test, 

G ci permetta di poter confrontare i tre metodi tra loro e con la soluzione esatta 

G crei dei grafici simili a quelli di Figura 10.2 

G salvi i valori numerici dei diversi metodi e della soluzione esatta in un file 

clear 

% h = passo di d i s c r e t i z z a z i o n e temporale 

% Tfin = tempo f i n a l e di osservazione 

% n = numero di v o l t e in cui verra ’ applicato ciascuno dei metodi 

% proposti 

% f i d = v a r i a b i l e associata al f i l e di r i s u l t a t i 

% t = v e t t o r e dei tempi 

% ye = v e t t o r e dei v a l o r i a s s o c i a t i al metodo di Eulero e s p l i c i t o 

% ( di lunghezza n+1 perche ’ la prima componente corrisponde 

% al valore della soluzione al tempo zero ) 

% y i = v e t t o r e dei v a l o r i a s s o c i a t i al metodo di Eulero implicito 

% ycn = v e t t o r e dei v a l o r i a s s o c i a t i al metodo di Crank−Nicolson 

% yex = v e t t o r e dei v a l o r i a s s o c i a t i alla soluzione e s a t t a 

h=input (’passo␣h␣’ ) ; 

Tfin=input (’tempo␣finale␣di␣osservazione␣’ ) ; 

n=Tfin /h ; 

f i d =fopen (’ode_a_confronto.txt’ ,’w’ ) ; 

t ( 1 ) = 0 ; 

220


y ( 1 ) = 1 ; 

ye (1)= y ( 1 ) ; 

y i (1)= y ( 1 ) ; 

ycn (1)= y ( 1 ) ; 

yex (1)= y ( 1 ) ; 

for i =1:n 

ye ( i +1)= ye ( i ) − h* ye ( i ) ; 

y i ( i +1)= y i ( i )/(1+h) ; 

ycn ( i +1)= (2−h)/(2+h) * ycn ( i ) ; 

t ( i +1)= t ( i )+h ; 

yex ( i +1)=exp(− t ( i + 1 ) ) ; 

end 

plot ( t , yex , ’k’ , ’linewidth’ ,2 ) 

hold on %comando per s o v r a s c r i v e r e i g r a f i c i l ’ uno s u l l ’ a l t r o 

plot ( t , ye ,’b’ , ’linewidth’ , 2 ) 

plot ( t , yi ,’r’ ,’linewidth’ , 2 ) 

plot ( t , ycn , ’g’ ,’linewidth’ , 2 ) 

legend (’soluzione␣esatta’ , ’Eulero␣esplicito’ , ’Eulero␣implicito’ , ’Crank-Nicolson’ , ) 

% la legenda , lo spessore d e l l e linee , o i l colore possono e s s e r e 

% messi s i a direttamente dalla f i n e s t r a della figura 

% s i a dal programma stessocome in questo caso ( solo in Octave s i 

% deve operare direttamente dal programma per poter cambiare 

% l e proprieta ’ della figura ) . 

hold o f f 

for i =1:n+1 

f p r i n t f ( fid , ’\n%5.2f␣%12.6e␣%12.6e␣%12.6e␣%12.6e’ , t ( i ) , yex ( i ) , . . . 

ye ( i ) , y i ( i ) , ycn ( i ) ) ; 

end 

f c l o s e ( f i d ) ; 

221


14 

TABELLE E GRAFICI CON IL FOGLIO ELETTRONICO 

Io dico di aver capito un’equazione 

quando sono in grado di predire le 

proprietà delle sue soluzioni senza 

effettivamente risolverla. 

Paul Adrien Maurice Dirac 

14.1 Il foglio elettronico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 

14.2 Inserire funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 

14.3 Formule ricorsive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 

14.4 Fare grafici nel foglio elettronico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 

14.4.1 Grafici multicolonna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 

14.5 Inserire dati da files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 

14.1 Il foglio elettronico 

Il foglio elettronico può essere usato nell’ambito del Calcolo Numerico per implementare ed eseguire 

semplici algoritmi ricorsivi. Inoltre può essere utilizzato per importare dati e per fare grafici. Nel seguito, 

daremo alcune indicazioni su come usare il foglio elettronico, in particolare la versione in lingua inglese di 

OpenOffice 2.4 (in questa versione i numeri decimali vanno scritti facendo uso del punto . – ad esempio 

2.1023 – a differenza della versione in lingua italiana dove i numeri decimali, di default, vanno scritti facendo 

uso della virgola – ad esempio 2,1023. 1 Tenendo conto di questa differenza saremo in grado di usare 

correttamente il foglio elettronico. 

14.2 Inserire funzioni 

Un foglio elettronico si presenta come una tabella di cellette, ognuna delle quale viene individuata dal 

numero che contraddistingue la corrispondente riga e dalla lettera che indica la corrispondente colonna. Ad 

esempio, la cella C7 si trova sulla colonna C e sulla riga 7. 

1 Lasciando la versione italiana di OpenOffice, si può scegliere di scrivere i numeri decimali usando il punto . anzichè la virgola , 

andando, mediante il Menu, su Strumenti −− > Opzioni −− > Impostazioni della Lingua −− > Lingue e scegliere come Lingua Locale 

(nella seconda riga a partire dall’alto) quella Italiana (Svizzera) o un’altra lingua che permette di ottenere come separatore delle cifre 

decimali il punto. 

223

14. TABELLE E GRAFICI CON IL FOGLIO ELETTRONICO 

Figura 14.1: Si vuole lavorare sulla cella C7. La lettera C e il numero 7 che individuano la colonna C e la 

riga 7 sono evidenziate rispetto alle altre colonne e righe. La cella C7 ha il bordo più scuro rispetto alle altre 

celle. Sono state cerchiate in rosso le due righe chiamate Name Box (Casella del Nome) e Input Line (Riga di 

digitazione). 

Quando, con il mouse, ci spostiamo su una cella e clicchiamo il tasto sinistro del mouse, allora il contorno 

della cella diventa di colore nero grassetto: vuol dire che possiamo ”lavorare” su quella cella (si veda la Figura14.1). 

Inoltre, sopra la tabella delle celle, sulla sinistra, viene visualizzato nella Name Box (nella Casella del 

Nome) il nome della cella su cui vogliamo lavorare. 

Se in una cella scriviamo un numero o applichiamo una formula numerica che avrà come risultato un 

numero, la cella può essere considerata come una variabile e sarà chiamata con la coppia lettera-numero che 

la individua (per esempio la cella C7). 

Per scrivere un numero o applicare una formula numerica, una strada da seguire è la seguente: 

G Una volta che siamo sulla cella (per esempio la cella C7 evidenziata rispetto alle altre) scriviamo = 

e poi il numero che vogliamo scrivere, ad esempio 0.1 (oppure 0,1 se la versione di Office è quella 

italiana). Vediamo che quello che scriviamo sulla cella compare anche nella riga di Input Line (o riga 

per immettere i comandi, Riga di digitazione) che si trova sopra la tabella delle celle. Nel momento in 

cui scriviamo =, accanto a quella riga compare un simbolo a forma di x dal colore rosso (al posto del 

simbolo di sommatoria che c’era prima) e il simbolo di accettazione in verde (vedasi le immagini in 

Figura 14.2 e 14.3 e le si confronti con la Figura14.1). 

G Se invece di un numero vogliamo applicare una formula numerica, possiamo o scrivere direttamente il 

valore della funzione (per esempio cos(0.1) + 0.3 ) oppure possiamo avvalerci dell’aiuto delle funzioni 

predefinite che possiamo utilizzare nel foglio elettronico. Dal menu del foglio elettronico, cliccando 

su Insert (Inserisci) troviamo le due voci Function. . . (Funzione) e Function list (Lista di funzioni). Di 

qui possiamo vedere quali sono le funzioni che possiamo utilizzare. Ricordiamo che nella versione 

italiana, la funzione valore assoluto si chiama ASS (ABS in quella inglese), la funzione seno si chiama 

SEN (SIN in quella inglese). Nel momento in cui iniziamo a digitare il nome di una funzione, molto 

probabilmente ci verrà già data indicazione sulla funzione che inizia in quel modo, se l’abbiamo già 

utilizzata precedentemente. Inoltre, nel Name Box, dove prima era individuata la cella su cui stavamo 

lavorando, vengono visualizzate le funzioni più recenti che abbiamo utilizzato (si vedano le Figure 14.4 

e 14.5). 

224

14.2. Inserire funzioni 

Figura 14.2: Scriviamo = nella cella C7 per inserire un numero o per valutare una funzione in un numero. 

Figura 14.3: Inseriamo il valore 0.1 nella cella C7. 

225


Figura 14.4: 

(Funzione). 

Inseriamo il valore cos(0.1) nella cella C7 partendo dal menu Insert (Inserisci) e Function 

226

14.2. Inserire funzioni 

Figura 14.5: Inseriamo il valore cos(0.1) nella cella C7. Nella figura in alto si vede l’ultimo passaggio di cosa 

accade dopo aver inserito la funzione da menu. Nella figura in basso si vede cosa succede quando si scrive 

direttamente la formula. 

227


Figura 14.6: Inseriamo in C2 il valore cos(B2). 

14.3 Formule ricorsive 

Supponiamo ora di voler implementare l’algoritmo dello schema di punto fisso, applicato alla funzione 

g (x) = cos(x). 

Nella colonna A scriveremo le iterazioni k che facciamo nell’implementare lo schema. Per implementare 

la formula x k = g (x k−1 ) useremo le colonne B e C: in B metteremo i valori delle approssimazioni x k , in C 

scriveremo il valore g (x k ). 

Nella riga 1 delle colonne A, B e C, per ricordare ciò che stiamo facendo, scriviamo semplicemente k, xk e 

g(xk), rispettivamente. 

Al primo passo, nella cella A2 diamo il valore 0 per indicare l’iterazione k = 0, a B2 assegniamo il valore iniziale 

per x 0 , per esempio 0.0 e in C2 assegniamo il valore g (x 0 ), cioè cos(B2), che ci servirà al passo successivo. 

Osserviamo che abbiamo usato la cella B2 come una variabile avendo dato a C2 il valore cos(B2). Possiamo 

scrivere a mano cos(B2) oppure, inserendo la funzione cos() e cliccando con il mouse sulla variabile-cella 

in cui valutare la funzione (i cui contorni diventeranno di colore rosso), automaticamente viene inserito il 

nome della cella all’interno delle parentesi (in questo caso la cella B2). Dopo aver schiacciato il tasto di invio 

comparirà il valore numerico della funzione calcolata (si veda la Figura 14.6). 

Al passo successivo, il passo k deve essere uguale a 1: applichiamo alla cella A3 la formula A2+1 in modo 

da ottenere 1 (vedremo perchè conviene applicare questa semplice formula). La cella B3 ha come significato 

x 1 = g (x 0 )= cos(B2)=C2, il valore che si trova nella cella C2. Nella cella C3 andremo a valutare cos(B3), in 

modo da utilizzarlo nella cella B4 al passo successivo. 

Siamo ora in grado di scrivere queste formule in maniera ricorsiva effettuando una sola operazione di 

copia-incolla o di trascinamento. . . 

Difatti, ora sulla riga 4 noi dobbiamo: 

G in A4, incrementare il valore dell’iterazione che viene effettuata (la cella A4 deve essere uguale ad A3 

+1); 

G in B4, aggiornare la variabile x k mettendo nella cella B4 il valore che si trova nella cella C3; 

G in C4, aggiornare la variabile g (x k ) calcolando cos(B4). 

228

14.3. Formule ricorsive 

Figura 14.7: Operazione di copia-incolla per applicare le formule ricorsive dalla riga 3 alla riga 4. Nella figura 

in alto, abbiamo ”annerito” le tre cellette della riga 3. Nella figura in basso, dopo aver fatto Copy delle tre 

cellette della riga 3, ”anneriamo” le tre cellette della riga 4 su cui incolleremo le formule ricorsive. 

229


Figura 14.8: Risultato dell’operazione di copia e incolla dalle cellette della riga 3 alle cellette della riga 4. 

Questa operazione andrà ripetuta fino a quando non ci accorgiamo di essere arrivati a convergenza - vedremo 

poi come. 

Per aggiornare la riga 4 basta semplicemente ”annerire” con il mouse le cellette A3-B3-C3 (dove ci sono 

delle formule che si riferiscono alla riga precedente), spostandoci con il mouse e cliccando contemporaneamente 

con il tasto sinistro del mouse stesso. Clicchiamo quindi con il tasto destro del mouse e si aprirà una 

finestra di comandi: in particolare, clicchiamo alla voce Copy (Copia) e poi con il mouse ”anneriamo” (con la 

stessa tecnica descritta prima) le tre cellette successive. 

Clicchiamo di nuovo il tasto destro del mouse e facciamo Paste (Incolla). Vedremo che le cellette ora sono 

aggiornate e con le stesse formule che avremmo scritto a mano celletta per celletta (in A4 troviamo la formula 

A3+1, in B4 troviamo C3, in C4 troviamo cos(B4) ). Si vedano le Figure 14.7 e 14.8. Se anzichè ”annerire” solo 

le cellette della riga successiva, ”annerrissimo” le cellette di molte più righe, l’algoritmo verrà applicato in 

successione (talmente rapida che ci sembra istantanea) per molti più passi (tanti quante sono le righe su cui 

abbiamo applicato la formula ricorsiva mediante l’operazione di copia e incolla). Si veda la Figura 14.9. 

L’operazione di copia e incolla si può fare anche in un’altra maniera mediante l’operazione di trascinamento 

del mouse. Una volta che abbiamo ”annerito” le cellette in cui si trovano le formule ricorsive da applicare 

sulle righe successive, osserviamo che l’angolo in basso a destra della cornice nera che si è venuta a 

creare ha un bordino più spesso. Ci avviciniamo con il tasto sinistro del mouse su quel bordino e poi trasciniamo 

il mouse verso il basso. Vediamo che, via via che andiamo verso il basso, i bordi delle cellette su 

cui vogliamo applicare le formule ricorsive diventano di colore rosso. Una volta che lasciamo il tasto sinistro 

del mouse, le formule vengono applicate e troviamo i valori numerici nelle cellette. Notiamo che nella 

versione 2.3 di OpenOffice, una volta che lasciamo il tasto sinistro del mouse, per completare l’operazione di 

trascinamento dobbiamo cliccare su Formule nella finestra che automaticamente viene aperta. Dopo aver 

completato questa operazione, si conclude correttamente l’operazione di trascinamento. Osserviamo che ci 

sono al più due cifre decimali nella rappresentazione dei numeri. Per visualizzare meglio i numeri, conviene 

cambiare formato: ”anneriamo” le cellette delle colonne B e C, clicchiamo il tasto destro del mouse e, sulla 

finestra che si apre, andiamo su Format Cells (Formatta Celle). Si apre una nuova finestra da cui clicchiamo 

su Numbers (Numeri) e scegliamo la categoria del formato scientifico. Qui possiamo definire manualmente 

230

14.4. Fare grafici nel foglio elettronico 

Figura 14.9: Risultato dell’operazione di trascinamento (o di copia e incolla) su più righe. 

il numero di zeri che vogliamo nella mantissa (vedasi Figura 14.10). 2 Se vogliamo ora aggiungere delle iterazioni 

all’algoritmo, mediante un’operazione di copia e incolla o di trascinamento, oltre alle formule anche il 

formato viene incollato/trascinato nelle celle successive. Per capire quando arrestare l’algoritmo, utilizziamo 

il test di arresto sugli scarti. Sulla colonna D andremo a scrivere il valore assoluto della differenza tra due 

approssimazioni successive e applicheremo tale formula in maniera ricorsiva. Faremo quindi ABS(B3-B2) 

e trascineremo questa formula nelle celle successive con il formato che ci sembrerà più opportuno (si veda 

la Figura 14.11). In base alla tolleranza prefissata, quando lo scarto diverrà minore della tolleranza, allora 

arresteremo l’algoritmo (e quindi ci fermeremo nell’operazione di copia e incolla o di trascinamento delle 

formule da una cella alla successiva). 

14.4 Fare grafici nel foglio elettronico 

Una volta terminata l’implementazione del metodo di punto fisso, possiamo pensare di fare un grafico 

semilogaritmico degli scarti in funzione delle iterazioni. 

Dobbiamo quindi vedere come fare nel foglio elettronico un grafico in cui sull’asse delle ascisse mettiamo 

i valori delle iterazioni e sull’asse delle ordinate inseriamo i valori assoluti degli scarti. Inoltre, dobbiamo 

rendere il grafico semilogaritmico per studiare il profilo di convergenza del metodo. 

Incominciamo ”annerendo” solo la colonna che contiene le iterazioni dal valore 1 fino alla fine delle 

iterazioni che abbiamo effettuato: questa operazione viene fatta tenendo premuto il tasto sinistro del mouse. 

2 Osserviamo che il formato scelto può andare “stretto” nella cella/celle selezionate: in tal caso, al posto del numero saranno visualizzati 

i simboli ###. Per avere una corretta visualizzazione dei numeri, si dovrà allargare la colonna corrispondente in cui si trovano le 

celle per le quali non si vede il formato corretto. Cliccando con il tasto sinistro del mouse sulla cella che porta la lettera della colonna che 

desideriamo allargare, vedremo che tutte le celle della colonna selezionata si ”anneriscono”. Ci si sposta poi, con il mouse, verso il bordo 

destro della cella (per esempio ci troviamo sulla cella della colonna C al contorno con la cella della colonna D) e vedremo comparire una 

doppia freccia, grazie alla quale si potrà allargare tutta l’ampiezza della colonna verso destra. Allargheremo la colonna fino a quando 

tutte le celle saranno visualizzate correttamente nel loro formato. 

231


Figura 14.10: Finestra per modificare il formato numerico dei risultati. Viene scelto un formato scientifico 

definito dall’utente. 

Figura 14.11: Schema del punto fisso, in cui è stata aggiunta, nella colonna D, il valore assoluto dello scarto 

tra due approssimazioni successive. Si noti che abbiamo scelto un formato numerico diverso per gli scarti 

rispetto a quello usato per xk e cos(xk). 

232


Figura 14.12: Selezione delle colonne per fare il grafico. 

Dobbiamo poi passare alla colonna degli scarti, dal valore ottenuto all’iterazione 1 fino al valore ottenuto 

all’ultima iterazione. Per non perdere ”traccia” della colonna delle iterazioni, prima di iniziare a premere con 

il tasto sinistro del mouse sulla colonna degli scarti, dobbiamo schiacciare anche il tasto Ctrl della tastiera del 

computer. Solo dopo andiamo ad annerire la colonna degli scarti. In questo modo lasciamo ”nera” anche la 

colonna delle iterazioni (si veda la Figura 14.12). 

A questo punto, andiamo sul Menu principale del foglio elettronico alla voce Insert (Inserisci) e di qui su 

Chart (Diagramma). 

Si apre una finestra che ci permette la scelta del grafico. Noi sceglieremo il grafico XY (Scatter) (nella 

versione italiana XY (Dispersione) ) con solo linee - Lines Only (vedasi Figura 14.13). Procedendo (con Next 

- Avanti), si vede che l’intervallo dei punti su cui fare il grafico è stato già scelto e compare nella riga relativa 

al Data Range (Area dati). Per la serie dei dati, Data Series, si vede quali sono i valori delle ascisse (X-values) 

e quali le ordinate (Y-values). Si vede anche la scritta Column D che indica il fatto che abbiamo preso per le 

ordinate i valori presi dalla colonna D (vedremo che poi uscirà il nome Column D nella legenda della figura e 

vedremo come dare un nome più significativo) (si veda la Figura 14.14). Andando ancora avanti, nella Chart 

Elements (Elementi del diagramma), si può decidere cosa scrivere come titolo, sottotitolo, etichette sugli assi 

x e y. Nella Figura 14.15 abbiamo dato titolo, sottotitolo. . . A questo punto si clicca su Finish (Fine) e sul foglio 

elettronico compare il nostro grafico (che non è ancora semilogaritmico), mostrato nella Figura 14.16. 

Per fare modifiche al grafico, bisogna cliccare una volta con il tasto sinistro del mouse posizionato sul 

grafico, in modo da vedere in alto a sinistra un’icona con il simbolo dell’àncora. Ci si posiziona con il mouse 

all’interno del grafico e si clicca una volta con il tasto destro. Compare una finestra e qui si clicca la voce Edit 

(Edita). Ora è possibile cambiare il tipo di assi o le linee del grafico, i colori, la legenda. . . . 

Ad esempio, andando con il mouse sull’asse delle Y e cliccando due volte con il tasto sinistro del mouse, 

si apre una finestra da cui poter cambiare le linee, i colori, i caratteri, ma soprattutto la scala del grafico. 

Da Scale (Scala) è infatti possibile scegliere la scala logaritmica come si vede nella Figura 14.17. Una 

volta cliccato su OK, si torna al grafico che non è più quello di prima ma è in scala semilogaritmica (si veda 

233


Figura 14.13: Finestra per la scelta del grafico 

Figura 14.14: Finestra del Data Series 

Figura 14.15: Titolo, sottotitolo, etichette. 

234


Figura 14.16: Grafico 

Figura 14.17: Scelta della scala 

la Figura 14.18). Possiamo fare altre modifiche (per esempio cliccando sulla curva del grafico (Data Series 

Column D), possiamo cambiare lo spessore della curva). Inoltre, possiamo cambiare i caratteri usati per il 

titolo, i colori dello sfondo. E così via. 

Quello che ci interessa ora è come cambiare la legenda. 

Clicchiamo due volte con il tasto sinistro del mouse sul grafico. Poi clicchiamo con il tasto destro: si apre 

una finestra con varie opzioni di scelta tra cui Data Ranges. Clicchiamo su Data Ranges e si aprirà una finestra, 

quella che vediamo nella Figura 14.19. Per cambiare la scritta Column D, dobbiamo inserire nella casella 

Range for Name (Area per Nome) il nome di una cella del foglio elettronico in cui abbiamo scritto un nome di 

legenda che riteniamo più appropriato (per esempio, nella cella E1 abbiamo scritto punto fisso). Cliccando 

sull’icona che si trova a destra della finestra del Range for Name, possiamo poi direttamente cliccare sulla 

cella E1 in modo da inserire automaticamente il nome della cella sulla casella Range for Name (il risultato di 

questa operazione è mostrata nella Figura 14.20. Vediamo che non compare più il nome Column D ma punto 

fisso sia su questa finestra sia, dopo aver dato l’OK, sul grafico (vedasi la Figura 14.21). 

235


Figura 14.18: Grafico semilogaritmico 

Figura 14.19: Finestra del Data Ranges 

14.4.1 Grafici multicolonna 

Osserviamo che la procedura eseguita per fare il grafico semilogaritmico appena descritto può essere ripetuta 

in maniera analoga per fare grafici multicolonna (per esempio, sull’asse delle x riportiamo le iterate, 

mentre sull’asse delle ordinate riportiamo i valori assoluti degli scarti relativi ai metodi di Newton-Raphson, 

Regula Falsi, tangente fissa, secante fissa. . . ): una volta che abbiamo inserito i dati relativi alle ascisse e alle 

ordinate della prima serie di dati (per esempio quelli del metodo di Newton-Raphson), e mentre stiamo ancora 

lavorando sulla finestra che ci permette di costruire il grafico, dopo la scelta del tipo di grafico (Chart Type) 

e Data Range, al passo del Data Series possiamo aggiungere (Add) altre serie di dati (per esempio iterazioni e 

scarti del metodo della Regula Falsi) per fare un grafico multicolonna. Si vedano le Figure 14.22 e 14.23. 

236


Figura 14.20: Finestra del Data Ranges dopo aver operato la modifica 

Figura 14.21: Grafico finale semilogaritmico 

237


Figura 14.22: Dopo aver schiacciato sul tasto Add (Aggiungi), per aggiungere altri dati nel grafico, bisogna 

selezionare i nuovi dati. 

Figura 14.23: Dopo aver selezionato le cellette opportune dei valori delle ascisse da aggiungere al grafico, i 

valori vengono visualizzati sulla finestra. Analogamente si procede per l’asse y. 

14.5 Inserire dati da files 

Spesso il foglio elettronico viene utilizzato per fare grafici importando dati numerici da files esterni – 

per esempio files di tipo testo generati dall’esecuzione di programmi scritti in FORTRAN o altri linguaggi di 

programmazione. 

Per inserire correttamente i dati su più colonne, si può seguire questo percorso: dal Menu principale del 

foglio elettronico si va su Insert (Inserisci) −− > Sheet from file (Foglio da file). A questo punto si apre una 

finestra da cui è possibile selezionare il percorso in cui si trova il file da aprire. Una volta che importiamo 

il file, si apre un’altra finestra (la finestra di Text import (importa testo)) in cui dobbiamo selezionare alcuni 

parametri che ci permetteranno di importare i dati inserendoli su più colonne (se i dati sono scritti su più 

colonne, che è la cosa che ci importa per poter fare i successivi grafici). 

Le opzioni che dobbiamo selezionare sono, oltre a Tab, che già troviamo indicato, anche Merge delimiters 

e Space (si veda la Figura 14.24). Una volta dato l’OK, si apre un’altra finestra (Insert Test) in cui digitiamo di 

nuovo OK. Troviamo i dati del file messi in colonna come erano nel file di partenza. Il formato numerico non è 

molto carino (solo due cifre decimali, anche se andando a vedere celletta per celletta possiamo osservare che 

i valori sono memorizzati così come erano nel file originario), ma selezionando le celle possiamo cambiare 

238

14.5. Inserire dati da files 

Figura 14.24: Importare dati da un file esterno. 

il formato in modo da visualizzarlo correttamente. A questo punto, abbiamo i nostri dati in tabella sul foglio 

elettronico e possiamo fare i grafici o altre operazioni tramite il foglio elettronico. 

239

BIBLIOGRAFIA 

[1] ASCHER, U. M. e GREIF, C. (2007), A First Course on Numerical Methods. 

[2] BJÖRK, A. e DAHLQUIST, G. (2008), Numerical Methods in Scientific Computing, Volume II, Siam. 

[3] BURDEN, R. L. e FAIRES, J. D. (2004), Numerical Analysis, Brooks-Cole Publishing. 

[4] DAHLQUIST, G. e BJÖRK, A. (2006), Numerical Methods in Scientific Computing, Volume I, Siam. 

[5] GAMBOLATI, G. (1994), Lezioni di Metodi Numerici, Cortina, Padova. 

[6] GAUTSCHI, W. (1997), Numerical Analysis: An Introduction, Birkäuser, Boston. 

[7] GIANGRANDI, P. (2010), Dispense del corso di Storia dell’Informatica, Università degli Studi di Udine, 

Italia. 

[8] GIANGRANDI, P. (ultima visita: febbraio 2011), Museo on line - Breve storia degli Strumenti di Calcolo, 

Tecnoteca, http://www.tecnoteca.it/museo/. 

[9] KEISLER, H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Commons Attribution 

Non-Commercial-ShareAlike License, http://www.math.wisc.edu/~Keisler/calc.html. 

[10] MOORE, H. (2008), MATLAB® per l’ingegneria, Pearson Prentice Hall, Italy. 

[11] O’CONNOR, J. e ROBERTSON, E. F. (ultima visita: febbraio 2011), The MacTutor History of Mathematics 

archive, University of St Andrews Scotland, http://www-gap-system.org/~history/. 

[12] SARTORETTO, F. e PUTTI, M. (2008), Introduzione alla Programmazione per Elaborazioni Numeriche., 

Edizioni Libreria Progetto, Padova. 

[13] STRANG, G. (1991), Calculus, Wellesley-Cambridge Press. 

[14] SWADE, D. (ultima visita: febbraio 2011), The Babbage Engine, Computer History Museum, Mountain 

View, CA, http://www.computerhistory.org/babbage. 

241

Appunti di Calcolo Numerico - Esercizi e Dispense - UniversitÃ degli ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?