03.06.2013 Views

Dispense di Fonologia (Glottologia prof.Savoia) agg. 30/04/09

Dispense di Fonologia (Glottologia prof.Savoia) agg. 30/04/09

Dispense di Fonologia (Glottologia prof.Savoia) agg. 30/04/09

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

DISPENSE DI FONOLOGIA<br />

Leonardo M. <strong>Savoia</strong><br />

Università <strong>di</strong> Firenze e <strong>di</strong> Foggia<br />

a.a.2008-20<strong>09</strong>


1.1. Elementi <strong>di</strong> fonetica.<br />

Nelle lingue naturali gli enunciati combinano suoni e significati. Nello stu<strong>di</strong>o dei suoni linguistici, detti<br />

anche foni, si <strong>di</strong>stinguono almeno due aspetti fondamentali:<br />

(a) l’apparato fonatorio e i meccanismi articolatori che producono i suoni (fonetica articolatoria);<br />

(b) le proprietà fisiche relative all’aspetto acustico dei suoni, cioè ai tipi <strong>di</strong> onda sonora che possono essere<br />

prodotti dall’apparato fonatorio (fonetica acustica e strumentale).<br />

Un ulteriore punto <strong>di</strong> vista, detto fonetica u<strong>di</strong>tiva, è la considerazione del suono come il risultato della<br />

percezione r<strong>agg</strong>iunta dall’ascoltatore per mezzo del suo apparato u<strong>di</strong>tivo e della sua facoltà <strong>di</strong> lingu<strong>agg</strong>io. In<br />

effetti, la capacità <strong>di</strong> in<strong>di</strong>viduare nella catena fonica, cioè nel flusso <strong>di</strong> suoni associato a enunciati i singoli<br />

suoni (segmenti fonetici) come del resto le sillabe (cf. Ladefoged 1982) è il risultato <strong>di</strong> una segmentazione<br />

imposta dalla nostra percezione piuttosto che una reale sud<strong>di</strong>visione in parti separate del continuum fonetico.<br />

1.1. L’apparato fonatorio<br />

I suoni linguistici, ad esempio la vocale a o la consonante f <strong>di</strong> fame, sono prodotti mo<strong>di</strong>ficando per mezzo<br />

degli organi articolatori il flusso d’aria emesso dai polmoni. L’insieme degli organi utilizzati per la<br />

produzione dei suoni linguistici è chiamato apparato fonatorio (figura 1) e comprende i polmoni, i muscoli<br />

del <strong>di</strong>aframma e del torace, la trachea, la laringe, contenente la glottide, e il tratto vocale, cioè la cavità<br />

compresa fra le corde vocali e le labbra, che include la faringe, la cavità orale, la lingua, il velo palatino, il<br />

palato, gli alveoli, e la cavità nasale. Questi organi sono in generale associati ad altre funzioni vitali, come il<br />

respiro per i polmoni, la deglutizione per la lingua e la faringe; le corde vocali sono funzionalmente adattate<br />

alla fonazione, cioè alla produzione del particolare tipo <strong>di</strong> flusso d’aria che è alla base delle vocali e <strong>di</strong> altre<br />

caratteristiche fondamentali della catena fonica.<br />

Figura 1<br />

Il flusso d’aria emesso dai polmoni, detto egressivo, passa attraverso la trachea e fuoriesce attraversando il<br />

tratto vocale. Le corde vocali sono due pliche <strong>di</strong> tessuto muscolare inserite nella glottide, a sua volta<br />

all’interno della laringe, che possono assumere posizioni e forme <strong>di</strong>verse. Possono essere <strong>di</strong>stanziate, come<br />

nel caso della respirazione <strong>prof</strong>onda, oppure possono avvicinarsi. In particolare possono trovarsi ravvicinate<br />

in maniera tale per cui la pressione dell’aria proveniente dai polmoni è sufficiente a forzarle. Questo<br />

meccanismo determina la vibrazione delle corde vocali. I suoni che comprendono la vibrazione delle corde<br />

vocali sono detti sonori, mentre quelli prodotti con le corde vocali allontanate, che quin<strong>di</strong> non vibrano, sono<br />

detti sor<strong>di</strong> o non sonori. Inoltre quando il velo palatino è abbassato una parte del flusso d’aria fuoriesce dalle<br />

cavità nasali. I suoni prodotti in questo modo sono detti nasali. Sono possibili anche suoni, detti avulsivi,<br />

prodotti con un flusso d’aria ingressivo, in cui gli articolatori sono <strong>di</strong>sposti in modo da risucchiare l’aria<br />

esterna nella cavità orale e creare rumore. Li presentano alcune lingue dell’Africa meri<strong>di</strong>onale, come lo zuluxhosa.


Dal punto <strong>di</strong> vista fisico i suoni linguistici corrispondono all’onda sonora prodotta dai movimenti<br />

vibratori trasmessi alle molecole dell’aria dalla sorgente, costituita da una particolare configurazione assunta<br />

dagli organi articolatori o dalla vibrazione delle corde vocali. Le spinte provocate dalla sorgente tendono ad<br />

indebolirsi fino ad annullarsi. La velocità con cui l’onda sonora si propaga nello spazio <strong>di</strong>pende dal mezzo e<br />

dalle sue carattersitiche fisiche (densità, temperatura, pressione, etc.). Nell’aria, alla temperatura <strong>di</strong> 20°C e<br />

alla pressione atmosferica <strong>di</strong> 760mm. <strong>di</strong> mercurio, un suono si propaga alla velocità <strong>di</strong> circa 343 m al<br />

secondo (1235 km all’ora, circa). Nel caso <strong>di</strong> un’onda sonora nella quale la curva tende a ripetersi<br />

perio<strong>di</strong>camente in maniera uguale, si parla <strong>di</strong> oscillazione perio<strong>di</strong>ca. Un ciclo oscillatorio ha 4 fasi, e il<br />

tempo complessivo del ciclo è detto periodo dell’onda (figura 2).<br />

Figura 2<br />

A) Onda prodotta dalle corde vocali<br />

B) Il suo spettro secondo i parametri Hz/dB<br />

Per descrivere l’onda si ricorre alla frequenza, cioè il numero <strong>di</strong> volte in cui il ciclo si ripete nell’unità <strong>di</strong><br />

tempo. Così, se il periodo è <strong>di</strong> 1/10 sec., la frequenza F è <strong>di</strong> 10 cicli al secondo. Il ciclo <strong>di</strong> apertura/chiusura<br />

della glottide è detto meccanismo laringeo o vibrazione delle pliche vocali (in me<strong>di</strong>a 200 volte al secondo<br />

nelle donne, 100 volte negli uomini). L’onda sonora dei suoni del lingu<strong>agg</strong>io è complessa, costituita cioè<br />

dalla somma <strong>di</strong> più onde, dette armoniche, ciascuna caratterizzata da una frequenza il cui valore è un<br />

multiplo intero della frequenza a cui vibrano le corde vocali, detta frequenza fondamentale (F0). L’insieme<br />

delle <strong>di</strong>verse armoniche è detto spettro dell’onda complessa (figura 3).<br />

Figura 3 - Onde semplici (armoniche) che compongono un’onda complessa


1.2. Le proprietà acustiche delle vocali e delle consonanti<br />

La vibrazione delle corde vocali può accompagnarsi o meno all’articolazione all’interno del tratto vocale; se<br />

le corde vocali vibrano contemporaneamente all’articolazione nel tratto vocale, avremo consonanti sonore.<br />

La m<strong>agg</strong>ior parte delle <strong>di</strong>fferenze fra i suoni <strong>di</strong>pende quin<strong>di</strong> dalla posizione assunta dagli organi articolatori<br />

all’interno del tratto vocale o sopralaringeo. Le consonanti sono prodotte creando un ostacolo al pass<strong>agg</strong>io<br />

dell’aria tale da produrre rumore, tramite l’avvicinamento <strong>di</strong> due articolatori all’interno del tratto vocale o<br />

tramite un blocco al pass<strong>agg</strong>io dell’aria; le vocali invece sono prodotte semplicemente creando<br />

configurazioni del tratto vocale che mo<strong>di</strong>ficano le proprietà acustiche dell’onda sonora prodotta dalla<br />

vibrazione delle corde vocali, funzionando quin<strong>di</strong> come cassa <strong>di</strong> risonanza (sorgente perio<strong>di</strong>ca). Ne risulta lo<br />

schema in (1):<br />

(1) Sorgente glottica Sorgente sopralaringea<br />

vibrazione delle corde vocali ostacolo nel tratto vocale<br />

vocali + -<br />

consonanti sonore + +<br />

consonanti sorde - +<br />

Dal punto <strong>di</strong> vista acustico le configurazioni dello spazio sopralaringeo funzionano quin<strong>di</strong> come un<br />

filtro o risuonatore, nel senso che determinano il rafforzamento o l’indebolimento <strong>di</strong> alcune delle frequenze<br />

dell’onda sonora emessa. L’analisi delle proprietà acustiche dei suoni linguistici ha utilizzato (fonetica<br />

strumentale/ sperimentale) strumenti come lo spettrografo o attualmente programmi <strong>di</strong> analisi della voce.<br />

Nella visualizzazione delle caratteristiche fisiche dell’onda sonora sono evidenziate le formanti, cioè le zone<br />

dello spettro in cui si concentra l’energia acustica, come illustrato nella figura 4 che riporta gli spettrogrammi<br />

delle sette vocali italiane.<br />

Figura 4<br />

Le figure 5 e 6 (da Magno Caldognetto 1973) riportano invece i <strong>di</strong>agrammi <strong>di</strong> esistenza delle vocali<br />

dell’italiano (voci maschili e voci femminili) costruito in base ai valori delle due formanti, FI e FII. Come si<br />

vede più una vocale è alta, più è bassa la sua FI, più è anteriore più è alta la sua FII.


Figura 5 Figura 6<br />

1.3. Classificazione articolatoria delle vocali e delle consonanti<br />

Vocali (V) e consonanti (C) costituiscono le due classi fondamentali <strong>di</strong> suoni. Le vocali possono essere<br />

classificate tenendo conto delle possibili configurazioni determinate dalla posizione della lingua rispetto al<br />

palato. Nel rappresentare le <strong>di</strong>verse articolazioni (<strong>di</strong>versi suoni) ricorreremo a simboli che solo in parte<br />

coincidono con quelli della nostra scrittura usuale. Si tratta <strong>di</strong> simboli grafici appartenenti a una scrittura<br />

convenzionale chiamata alfabeto fonetico, il cui principio fondamentale è che ad ogni segno corrisponde un<br />

unico suono e viceversa. L’esigenza <strong>di</strong> un sistema <strong>di</strong> trascrizione convenzionale per il mondo scientifico<br />

<strong>di</strong>venne importante quando nell’800 si cominciò a <strong>di</strong>sporre dei dati <strong>di</strong> numerose lingue, con tra<strong>di</strong>zione<br />

scrittori o prive <strong>di</strong> essa, i cui enunciati dovevano essere resi leggibili e interpretabili a stu<strong>di</strong>osi <strong>di</strong> <strong>di</strong>versa<br />

provenineza.<br />

In effetti anche le scritture normali dell’italiano o <strong>di</strong> altre lingue, che impariamo a scuola, sono<br />

convenzionali, nel senso che le corrispondenze che collegano i segni ai suoni sono dovute alla consuetu<strong>di</strong>ne,<br />

e appunto devono essere imparate. Però queste scritture hanno alcuni inconvenienti, che nel nostro uso<br />

pratico non sono rilevanti, ma che <strong>di</strong>ventano <strong>di</strong>fetti nel momento in cui gli stu<strong>di</strong>osi devono rappresentare<br />

senza ambiguità un tipo <strong>di</strong> articolazione con un segno riconoscibile in<strong>di</strong>pendentemente dalla lingua parlata<br />

dal singolo stu<strong>di</strong>oso e dalle sue abitu<strong>di</strong>ni grafiche. Ad esempio, in italiano l’occlusiva velare [k] è scritta da c<br />

in cane e da ch in china; quin<strong>di</strong> uno stesso suono è scritto con due segni <strong>di</strong>versi. Al contrario due suoni<br />

<strong>di</strong>versi, ad esempio la ‘e’ aperta [D] <strong>di</strong> bello e la ‘e’ chiusa [e] <strong>di</strong> nero sono scritte dallo stesso segno e.<br />

Analogamente in inglese il <strong>di</strong>gramma ea in molti casi corrisponde a [i:], come in each [i:tR] ‘ciascuno’, eagle<br />

[i:gl] ‘aquila’, etc., ma in altri casi corrisponde a pronunce <strong>di</strong>verse, come [e:] in head [he:d] ‘testa’, leather<br />

[!leC?r] ‘pelle’, etc.Il confronto fra scritture <strong>di</strong> lingue <strong>di</strong>verse aumenta la confusione. Ad esempio ch in<br />

inglese corrisponde alla palatoalveolare [tR], come in child ‘bambino’, pronunciato [tRaild], mentre nella<br />

scrittura del francese vale [R], come in chapeau ‘cappello’ pronunciato [Ra!po]. È questo tipo <strong>di</strong> incongruenze<br />

negli usi grafici che spinse i linguisti a stabilire sistemi convenzionali <strong>di</strong> scrittura fonetica basati su<br />

un’accurata conoscenza dei meccanismi articolatori. È comunque importante tenere <strong>di</strong>stinta in ogni caso la<br />

nozione <strong>di</strong> ‘lettera’, che designa i segni grafici della scrittura. Da quella <strong>di</strong> suono o segmento fonetico, che<br />

designa il corrispondente fenomeno fisico a cui la lettera rinvia.


La prima proposta <strong>di</strong> alfabeto fonetico fatta nel quadro della linguistica scientifica è quella del<br />

linguista tedesco Karl Richard Lepsius, stu<strong>di</strong>oso <strong>di</strong> lingue indoeuropee, orientali e africane, che presentò il<br />

suo sistema nella pubblicazione Das allgemeine linguistische Alphabet, uscito a Berlino nel 1854 e<br />

conemporaneamente in inglese a Londra. L’alfabeto Lepsius è stato ampiamente utilizzato dai <strong>di</strong>alettologi e<br />

dai filologi. L’alfabeto fonetico che utilizzeremo nelle pagine seguenti è invece quello messo a punto dalla<br />

Associazione fonetica internazionale (International Phonetic Association), chiamato IPA, proposto per la<br />

prima volta nei Principles of the International Phonetic Association nel 1949, e <strong>di</strong> cui riportiamo una<br />

versione recente nella figura 6.<br />

Figura 6<br />

Il proce<strong>di</strong>mento che trascrive gli enunciati <strong>di</strong> una lingua per mezzo dell’alfabeto fonetico, abbinando suoni e<br />

simboli grafici, è la ‘trascrizione fonetica’. Le trascrizioni fonetiche sono messe fra parentesi quadre, come


negli esempi appena riportati; l’accento è segnalato da un apice prima della sillaba accentata. Oggi la<br />

trascrizione fonetica è comunemente riportata sui <strong>di</strong>zionari accanto alle voci lessicali.<br />

Lo schema in (2) classifica i tipi vocalici principali; le vocali posteriori sono anche arrotondate,<br />

comportando cioè l’arrotondamento delle labbra.<br />

(2) anteriori centrali posteriori<br />

alte/ chiuse i u<br />

me<strong>di</strong>o-alte e ? o<br />

me<strong>di</strong>o-basse D N<br />

basse/ aperte z a @<br />

Usualmente le <strong>di</strong>verse posizioni <strong>di</strong> articolazione delle vocali vengono rappresentate per mezzo <strong>di</strong> uno<br />

schema della cavità orale, detto trapezio vocalico (figura 7).<br />

Figura 7 - Quadrilatero vocalico IPA<br />

Si ricor<strong>di</strong> che oltre alle vocali orali, qui rappresentate, per ogni tipo vocalico possiamo avere il<br />

corrispondente nasalizzato. Le vocali <strong>di</strong> m<strong>agg</strong>iore durata sono trascritte <strong>agg</strong>iungendo due punti al simbolo<br />

vocalico o semplicemente ripetendolo, come [i:] o [ii]. Inoltre molte lingue presentano articolazioni<br />

vocaliche complesse, dette <strong>di</strong>ttonghi, come ad esempio i <strong>di</strong>ttonghi <strong>di</strong> tipo ascendente dell’inglese, cf. [faind]<br />

find ‘trovare’, [mauS] mouth ‘bocca’ o del tedesco, cf. [zain] sein ‘essere’, [!RØaib?n] schreiben ‘scrivere’.<br />

Le consonanti sono classificate tenendo conto del modo <strong>di</strong> articolazione, cioè del tipo <strong>di</strong> sorgente<br />

creata (occlusive, fricative, affricate, etc.) e del luogo <strong>di</strong> articolazione, cioè del punto dell’apparato fonatorio<br />

in cui viene creato l’ostacolo al pass<strong>agg</strong>io dell’aria (labiali, dentali, palatoalveolari, palatali, velari, faringali,<br />

laringali). Alcuni suoni, comunemente trattati come consonanti, hanno proprietà vocaliche e consonantiche;<br />

si tratta delle sonoranti, cioè le nasali e le liquide (laterali e vibranti). Possiamo trattare almeno in termini<br />

descrittivi le nasali e le liquide come ‘mo<strong>di</strong> <strong>di</strong> articolazione’, inserendoli quin<strong>di</strong> fra le consonanti, come nella<br />

tabella (3), relativa ad alcune serie, dove per ogni articolazione rilevante a sinistra è riportata la sorda, a<br />

destra la sonora; le nasali e le liquide sono sonore. Le occlusive, le affricate e le fricative formano la classe<br />

delle ostruenti.<br />

(3) bilabiali labiodentali dentali palatoalveolari retroflesse palatali velari uvulari faringali laringali<br />

occlusive p b t d ± á c ã j f p ç ><br />

fricative f v s z R Y ∞ π B õ w F W Q í ª g ê<br />

S C<br />

affricate ts dz tR dY<br />

nasali m n ® M N<br />

laterali l † K<br />

vibranti r Ø


Le lingue naturali possono <strong>di</strong>fferenziarsi per l’inventario <strong>di</strong> suoni che hanno. Così mentre l’italiano standard<br />

include le sette vocali [i e D a N o u] ed è privo <strong>di</strong> vocali anteriori arrotondate, queste ultime, cioè [y 1 8]<br />

sono presenti in francese e in tedesco. Il francese, a <strong>di</strong>fferenza delle altre lingue europee, ha vocali<br />

nasalizzate, come in [vDÈ] vin ‘vino’. L’inglese ha vocali posteriori non arrotondate, come [U] <strong>di</strong> cup ‘tazza’<br />

assente sia dall’italiano che dal francese, ha tipi <strong>di</strong> <strong>di</strong>ttonghi, ugualmente assenti in italiano e in francese, etc.<br />

Lo stesso vale per le consonanti: l’italiano ha le affricate [ts dz] assenti in inglese e in francese, ma presenti<br />

per esempio in tedesco, cf. [tsait] zeit ‘tempo’<br />

1.4. Esempi <strong>di</strong> trascrizione.<br />

Gli esempi <strong>di</strong> trascrizione che seguono sono posti fra parentesi quadre e, come <strong>di</strong> norma, nel caso <strong>di</strong><br />

plurisillabi, collocano l’accento prima della sillaba accentata. Gli esempi in (A) riguardano le vocali; la<br />

vocale su cui <strong>di</strong> volta in volta si concentra l’esempio è quella tonica. Gli esempi in (B), relativi alle<br />

consonanti, vengono riportati tenendo conto dei luoghi <strong>di</strong> articolazione consonantica, partendo quin<strong>di</strong> dalle<br />

bilabiali; <strong>di</strong> ogni serie sono esemplificati, quando sono <strong>di</strong>sponibili dati relativi alle lingue europee più note, i<br />

<strong>di</strong>versi mo<strong>di</strong> <strong>di</strong> articolazione e la <strong>di</strong>stinzione sordo-sonoro. Infine, il suono esemplificato è generalmente<br />

quello iniziale:<br />

(A)<br />

vocali alte (anteriore piatta e arrotondata, posteriore piatta e arrotondata)<br />

it. [»pila] pila, fr. [li{] lire ‘leggere’, ingl. [i:tR] each ‘ogni’, ted. [bi:g?n] biegen ‘piegare’<br />

fr. [kry] cru ‘crudo’, ted. [»by:ç?{] bücher ‘libri’<br />

it. [»muro] muro, fr. [Zu{] jour ‘giorno’, ted. [tØuk] trug ‘portavo/ portai’, ingl [fu:d] food ‘cibo’<br />

rumeno [»mµn?] mînă ‘mano’<br />

in inglese, in sillaba chiusa, troviamo gli esiti [I U] leggermente più aperti e centralizzati rispetto a [i u]: [tIp]<br />

tip ‘punta’, [pUt] put ‘mettere’.<br />

vocali me<strong>di</strong>o- alte (anteriore piatta e arrotondata, posteriore piatta e arrotondata)<br />

it. [»mese] mese, sp. [»etRo] hecho ‘fatto’, fr. [fe] fait ‘fatto’<br />

fr. [fO] feu ‘fuoco’, ted. [b1g?] böge ‘(io) piegassi’<br />

it. [»notRe] noce, fr. [bo] beau ‘bello’<br />

vocali me<strong>di</strong>o- basse (anteriore piatta e arrotondata, posteriore piatta e arrotondata)<br />

it. [»lDtto] letto, ingl. [bDd] bed ‘letto’, fr. [bDl] belle ‘bella’<br />

fr. [kø{] cœur ‘cuore’<br />

it [»kNllo] collo, ingl. [fNnd] fond ‘tenero’<br />

ingl. [k√p] cup ‘tazza’<br />

vocali basse (anteriore, centrale, posteriore piatta e arrotondata)<br />

ingl. [hQt] hat ‘cappello’<br />

it. [»kane] cane<br />

ingl. [h@:d] hard ‘duro’<br />

fr. [tÅ‚] temps ‘tempo’<br />

(B)<br />

occlusive bilabiali<br />

it. [»palo] palo, ingl. [»?up?n] open ‘aperto’, sp. [pan] pane ‘pane’<br />

it. [»bDne] bene, ingl. [boi] boy ‘ragazzo’, fr. [bo] beau ‘bello’<br />

fricative bilabiali<br />

sp. [weBo] huevo ‘uovo’<br />

nasale bilabiale<br />

it. [»mare] mare, ted. [man] Mann ‘uomo’, ingl. [m√tR] much ‘molto’<br />

fricative labiodentali<br />

it. [»fDrro] ferro, sp. [fin] fin ‘fine’, fr. [fD{] faire ‘fare’, ingl. [fain] fine ‘bello’.<br />

affricate labiodentali<br />

ted. [pfD{t] pferd ‘cavallo’


occlusive dentali/ alveolari<br />

it. [»tela] tela, fr. [tÅ‚] temps ‘tempo’, ingl. [taim] time ‘tempo’, ted. [hUt] Hut ‘cappello’<br />

it. [»dDnte] dente, ingl. [dei] day ‘giorno’, sp. [»djente] <strong>di</strong>ente ‘dente’, fr. [dÅ‚] dent ‘dente’<br />

fricative dentali (sibilanti)<br />

it. [»sera] sera, fr. [swa{] soire ‘sera’, ingl. [si:] see ‘vedere’, sp. [seis] seis ‘sei’, ted. [fus] Fuss ‘piede’<br />

it. [»rçza] rosa, fr. [Roz] chose ‘cosa’, ted. [zDks] sechs ‘sei’<br />

fricative interdentali<br />

ingl. [TIn] thin ‘fine’, sp. [»TiNko] cinco ‘cinque’<br />

ingl. [DQt] that ‘quello’, sp. [»laCo] lado ‘lato’<br />

affricate dentali/ alveolari<br />

it. [»tsitto] zitto, td. [tsait] Zeit ‘tempo’<br />

it. [»dzDro] zero<br />

nasale dentale/ alveolare<br />

it. [»nave] nave, ingl. [n?u] know ‘conoscere’, sp. [»naCa] nada ‘niente’, fr. [nu] nous ‘noi’<br />

laterale dentale/ alveolare<br />

it. [»lana] lana, fr. [lyn] lune ‘luna’, ingl. [lait] light ‘luce’, sp. [»letRe] leche ‘latte’<br />

vibrante dentale<br />

it. [»rete] rete, it. [»korro] corro, sp. [»rweCa] rueda ‘ruota’<br />

fricative palatoalveolari<br />

it. [»peRRe] pesce, fr. [R?»val] cheval ‘cavallo’, ingl. [fIR] fish ‘pesce’<br />

fr. [{uZ] rouge ‘rosso’, nella pronuncia toscana [ra»Zone] ‘ragione’<br />

affricate palatoalveolari<br />

it. [»tRera] cera, ted. [dçytR] Deutsch ‘tedesco’, ingl. [tR?:tR] church ‘chiesa’<br />

it. [»dZNko] gioco, ingl. [»dZ√dZ] judge ‘giu<strong>di</strong>ce’<br />

occlusive retroflesse<br />

cal.sett. [ku?ÍÍu] ‘collo’, sardo (Settimo S.Pietro) [mat!teááu] ‘martello’<br />

occlusive palatali<br />

foggiano [»cˆ:n?] pieno, [¯ca»n?] ‘salire’<br />

<strong>di</strong>aletti meri<strong>di</strong>onali [»paÔÔa] ‘paglia’<br />

fricative palatali<br />

ted. [»mIlç] Milch ‘latte’<br />

nasale palatale<br />

it. [»ra¯¯o] ragno, fr. [ga»¯e] gagner ‘guadagnare’, sp. [a¯o] año ‘anno’<br />

laterale palatale<br />

it. [»pa¥¥a] paglia, sp. [»¥ano] llano ‘pianura’<br />

occlusive velari<br />

it. [»kapo] capo, fr, [ku] cou ‘collo’, ingl. [ki:p] keep ‘tenere’, sp. [»keso] queso ‘form<strong>agg</strong>io’<br />

it. [»gatto] gatto, fr. [ga{] gare ‘satzione’, ingl. [geim] game ‘gioco’, sp. [»gato] gato ‘gatto’<br />

fricative velari<br />

sp. [»ixo] hijo ‘figlio’, ted. [bux] Buch ‘libro’<br />

sp. [»aƒo] hago ‘faccio’<br />

nasale velare<br />

it. [tDNgo] tengo, ted. [zaNk] sank ‘cadevo/ cad<strong>di</strong>’, ingl. [TIN] thing ‘cosa’<br />

fricative/vibranti uvulari<br />

fr. [{oz] rose ‘rosa’, ted. [“at] Rat ‘consiglio’<br />

fricative glottidali/ laringali<br />

ingl. [hQnd] hand ‘mano’, ted. [hUt] Hut ‘cappello’, alb. [hund] hund ‘naso’<br />

2. I processi fonetici.<br />

Gli enunciati delle lingue naturali comprendono sequenze <strong>di</strong> articolazioni che producono un continuum<br />

sonoro. Le sequenze <strong>di</strong> suoni sono soggette a fenomeni <strong>di</strong> coarticolazione, cioè a meccanismi che adattano la


produzione <strong>di</strong> un’articolazione a quelle della stessa stringa, in particolare quelle a<strong>di</strong>acenti. In generale,<br />

sappiamo che le sillabe atone sono pronunciate con minore energia e hanno durata minore e minore<br />

precisione articolatoria. Inoltre le caratteristiche articolatorie dei segmenti possono essere anticipate o<br />

mantenute in quelli circostanti. Così in un sequenza come curo l’occlusiva velare iniziale anticipa<br />

l’arrotondamento delle labbra della vocale [u] seguente, mentre in caro la stessa occlusiva velare iniziale<br />

presenta labbra appiattite come per la vocale [a] seguente. Questi meccanismi fonetici si manifestano in<br />

particolari sistemazioni delle sequenze <strong>di</strong> suoni, che le lingue registrano come caratteristiche della fonetica<br />

dei propri elementi lessicali, denominate processi fonetici. Si <strong>di</strong>stinguono alcuni tipi principali <strong>di</strong> processi<br />

fonetici: assimilazione (4), <strong>di</strong>ssimilazione (5), processi sillabici (6), come esemplificato qui <strong>di</strong> seguito.<br />

(4) Processi <strong>di</strong> assimilazione (un segmento <strong>di</strong>venta più simile o uguale a un segmento vicino)<br />

• assimilazione parziale: la sibilante si assimila in sonorità con la consonante seguente, per cui<br />

davanti a consonante sonora la sibilante è sonora, come in [zb]atto, mentre davanti a sorda è<br />

sorda, come in [sp]ento.<br />

• assimilazione completa: le sequenze latine [kt], [pt] si sono assimilate in [tt] in molte varietà<br />

romanze, per cui ad esempio l’italiano ha [!fatto] ‘fatto’, [!rotto] ‘rotto’.<br />

• assimilazione progressiva, come il pass<strong>agg</strong>io da rn a rr, ad es. in [!forru] ‘forno’ in alcune<br />

varietà sarde (Orroli). In molte varietà italiane, centro meri<strong>di</strong>onali, sarde e la<strong>di</strong>ne, la nasale<br />

assimila la consonante seguente, per cui abbiamo ad esempio [!kwanno] ‘quando’ Mascioni,<br />

[!tonno] ‘tondo’, [!amma] ‘gamba’, [!lu?MMo] ‘lungo’ Sutera, ['limma] *limba ‘lingua’, [!tunnu]<br />

‘tondo’ Tonara, [gran]/ [!grana] ‘grande m./f.’, [!dYama] ‘gamba’ Corte. Nelle varietà<br />

meri<strong>di</strong>onali la nasale assimila parzialmente l’ostruente sorda seguente, sonorizzandola, come in<br />

[!rombo] ‘rompo’ Mascioni, [!tReMgo] ‘cinque’ Sutera<br />

• assimilazione regressiva, come in co[mp]aro, co[Mk]orro, dove la consonante impone il<br />

proprio luogo <strong>di</strong> articolazione, bilabiale nel primo caso, velare nel secondo, alla nasale<br />

precedente.<br />

• sonorizzazione prevocalica: in molte lingue la consonante sorda in posizione intervocalica si<br />

sonorizza, come nelle varietà sarde, per cui abbiamo [nD!ANCD] ‘nipote’, e [!sNrrD] vs. [sa !zNrrD]<br />

‘sorella/ la sorella’ (Seneghe)<br />

• desonorizzazione in posizione finale: caratterizza molte lingue che ammettono consonanti<br />

finali. In tedesco troviamo un ben noto sistema <strong>di</strong> alternanze fra ostruente sorda finale <strong>di</strong> parola e<br />

ostruente sonora in posizione interna, come esmplificato qui <strong>di</strong> seguito:<br />

• [hunt]/[!hund?] hund/ hunde ‘cane/i’<br />

• [kunt] kund ‘conosciuto’/ [!kundbaØ] kundbar ‘noto’<br />

• [!bi:g?n] biegen ‘piegare’/ [iç bNk] ich bog ‘piegavo’<br />

• [!find?n] finden ‘trovare’ / [iç fant] ich fand ‘trovavo’<br />

• processi relativi al luogo <strong>di</strong> articolazione, come nel caso della palatalizzazione, per cui una<br />

consonante si palatalizza quando precede una vocale palatale, come nel caso dell’italiano<br />

ami[k]o vs. ami[tR]i, <strong>di</strong>[k]o vs. <strong>di</strong>[tR]i, etc. Nel caso delle vocali, il carattere labiale della nasale<br />

seguente ha determinato l’arrotondamento della vocale protonica in domani, per cui l’originario<br />

*de mane ‘<strong>di</strong> mattina’ è passato a [do!mani] ‘domani’.<br />

• processi relativi al modo <strong>di</strong> articolazione: un caso tipico è la nasalizzazione che si <strong>di</strong>ffonde<br />

sulle vocali vicine ad una nasale. Ad esempio in alcune varietà sarde campidanesi le vocali<br />

a<strong>di</strong>acenti ad una nasale intervocalica si nasalizzano mentre la nasale stessa è cancellata, come in<br />

[bDIdYu] ‘vengo’ vs. [!bDÈiÈzi] ‘vieni’ < * bDnizi (Oristano).<br />

• processi <strong>di</strong> assimilazione vocalica: metafonie e armonie (cf. in seguito). Un caso noto è la<br />

metafonia dell’antico inglese, che ha prodotto la palatalizzazione della vocale tonica seguita da<br />

un segmento vocalico o semivocalico palatale, come in:<br />

• satjan ‘porre’ > anglosassone settan > inglese set<br />

• fulljan ‘riempire’ > ags fyllan > inglese fill<br />

• * musir ‘topi’ > mys > inglese mice cf. mouce/mice<br />

• * fotiz ‘pie<strong>di</strong>’ > fet > inglese feet cf. foot/feet


(5) Processi <strong>di</strong> <strong>di</strong>ssimilazione.<br />

• Vi sono sistemazioni in cui un segmento si arricchisce <strong>di</strong> proprietà che lo <strong>di</strong>fferenziano<br />

m<strong>agg</strong>iormente da quello seguente, come nel caso della velarizzazionen e della rotacizzazione <strong>di</strong><br />

*l preconsonantica originaria in molte varietà romanze. Ad esempio, nel <strong>di</strong>aletto salentino <strong>di</strong><br />

Copertino *l si velarizza passando a u davanti a consonante dentale e palatale, come in [!autu]<br />

‘alto’, [!kauRD], mentre passa a r davanti a labiale e velare, come in [!NrpD] ‘volpe’, [!surku]<br />

‘solco’.<br />

• Nel caso delle vocali un tipico esempio <strong>di</strong> <strong>di</strong>ssimilazione emerge nella formazione dei<br />

<strong>di</strong>ttonghi, per cui la prima parte del <strong>di</strong>ttongo tende a <strong>di</strong>fferenziarsi in maniera vistosa dalla<br />

seconda parte del <strong>di</strong>ttongo, assumendo le caratteristiche <strong>di</strong> una vocale aperta, come nei <strong>di</strong>ttonghi<br />

tedeschi o inglesi del tipo <strong>di</strong> [zait] Zeit ‘tempo’, [bait] bite ‘morso’, etc. o nei <strong>di</strong>ttonghi <strong>di</strong> tante<br />

varietà meri<strong>di</strong>onali, come in [!mais?] ‘mese’, [!saul?] ‘sole’ (Ruvo <strong>di</strong> Puglia).<br />

(6) Fenomeni <strong>di</strong> riorganizzazione sillabica.<br />

• Un esempio <strong>di</strong> riorganizzazione della struttura sillabica è fornito dai fenomeni <strong>di</strong> metatesi o<br />

spostamento <strong>di</strong> elementi della sillaba. I <strong>di</strong>aletti della parte meri<strong>di</strong>onale della Sardegna<br />

(Campidano) sono caratterizzati da una riorganizzazione generalizzata della sillaba per cui<br />

l’elemento r / l originario che chiudeva la sillaba si è spostato nella parte iniziale, come<br />

illustrano gli esempi <strong>di</strong> Orroli: [!kruttsu] ‘corto’, [tRro!Aeááu] ‘cervello’, [!kroAu] ‘corvo’,<br />

[!vrattRi] ‘falce’, [!mroYu] ‘muoio’ (vs. [!morizi] ‘(tu) muori’), [!proku] ‘porco’, [!drNmmu]<br />

‘dormo’<br />

3. L’intonazione, l’accento e il ritmo.<br />

Altre proprietà fisiche sono la durata, cioè il protrarsi <strong>di</strong> un suono nel tempo, l’intensità, cioè la quantità <strong>di</strong><br />

energia con cui i suoni sono articolati e l’altezza melo<strong>di</strong>ca, cioè la frequenza a cui vibrano le corde vocali<br />

(frequenza fondamentale). Queste proprietà, oltre che caratterizzare il singolo suono, caratterizzano anche la<br />

catena fonica nel suo insieme. In questo caso sono dette soprasegmentali o proso<strong>di</strong>che. In particolare<br />

l’andamento melo<strong>di</strong>co della frase è ciò che chiamiamo intonazione. Ad esempio nelle frasi interrogative<br />

l’andamento melo<strong>di</strong>co tende ad innalzarsi alla fine della frase (andamento ascendente) mentre nelle frasi<br />

<strong>di</strong>chiarative l’intonazione finale è normalmente <strong>di</strong>scendente.<br />

Figura 8<br />

Nella figura 8 è riportato lo spettrogramma a banda stretta dell’enunciato interrogativo piove?. Come si può<br />

vedere, nel caso della domanda le formanti della vocale tonica hanno una variazione m<strong>agg</strong>iore, <strong>di</strong> tipo<br />

<strong>di</strong>scendente-ascendente corrispondente all’intonazione interrogativa.<br />

Oltre l’intonazione, vi sono altri fenomeni che caratterizzano la catena fonetica nel suo insieme,<br />

come l’accento e il ritmo. Con ‘accento’ ci riferiamo alla m<strong>agg</strong>iore forza articolatoria che caratterizza certe


sillabe (dette toniche), in confronto alle altre sillabe che le precedono o le seguono, dette atone o deboli. In<br />

una sequenza <strong>di</strong> due sillabe, una sillaba sarà quin<strong>di</strong> più forte dell’altra; ad esempio in parti, in trascrizione<br />

fonetica [!parti], la sillaba accentata è par-, mentre in partì, [par!ti], è -ti. In effetti parlare <strong>di</strong> ‘m<strong>agg</strong>iore forza’<br />

articolatoria è un po’ generico. Una sillaba che percepiamo come accentata ha una m<strong>agg</strong>iore energia<br />

articolatoria; i correlati fisici dell’accento sono la durata (quantità), l’altezza melo<strong>di</strong>ca, l’ampiezza della<br />

vibrazione (intensità) e la natura della vocale interessata (qualità). Le lingue utilizzano in maniera <strong>di</strong>versa<br />

questi correlati per realizzare l’accento e la stessa lingua può presentare correlati <strong>di</strong>versi in contesti sillabici<br />

<strong>di</strong>versi.<br />

Per quanto riguarda l’italiano, in uno stu<strong>di</strong>o sperimentale del 1976, Fava e Magno Caldognetto<br />

hanno mostrato che le proprietà fisiche coinvolte nella percezione dell’accento in italiano variano anche solo<br />

nelle parole <strong>di</strong> due sillabe, a seconda che la vocale accentata sia seguita da una consonante, come in [!kane] o<br />

da due consonanti o da una geminata come in [!kanne], e che la sillaba tonica sia quella iniziale come in<br />

[!papa] o quella finale come in [pa!pa]. Nei bisillabi con accento iniziale del tipo <strong>di</strong> [!kane] la vocale tonica<br />

ha m<strong>agg</strong>iore durata e intensità della vocale atona seguente; negli altri casi la durata non sembra <strong>di</strong>fferenziare<br />

la tonica dalla atona, mentre la tonica resta comunque più intensa della vocale atona. In molte lingue la<br />

posizione della sillaba accentata è fissa, come in francese, dove la sillaba tonica è quella più a destra della<br />

parola, o in ceco dove è la prima, mentre in altre, come l’italiano, la posizione della sillaba tonica è meno<br />

ristretta, potendo essere l’ultima, par[!ti] partì, la penultima [!par]ti parti, la terzultima, [!par]tono partono, la<br />

quartultima, [!pDt]tinano pettinano.<br />

In una sequenza vi sono segmenti o meglio sillabe che hanno un m<strong>agg</strong>iore risalto. Ad esempio in<br />

qualsiasi serie <strong>di</strong> sillabe σ ve ne sono alcune più salienti, in<strong>di</strong>cate dalla sottolineatura nelle sequenze in (7),<br />

cui corrispondono possibili sequenze italiane:<br />

(7) σσσσσσ ... ecco una casa/ <strong>di</strong>ce poche cose, etc.<br />

σσσσσ ... <strong>di</strong>cono questo/ tornano dopo, etc.<br />

Il succedersi <strong>di</strong> sillabe accentate (forti) e sillabe non accentate (deboli) dà luogo al ritmo della frase. Dal<br />

confronto fra le lingue emergono due tipi tendenziali <strong>di</strong> ritmo. In lingue come l’italiano e lo spagnolo, dette a<br />

isocronia sillabica, le sillabe toniche e atone tendono a susseguirsi a intervalli regolari, mentre in altre lingue,<br />

come l’inglese, dette a isocronia accentuale, le sillabe atone hanno una realizzazione fonetica ridotta, col<br />

risultato che le sillabe accentate tendono a ricorrere a intervalli regolari.<br />

4. L’analisi fonologica<br />

A <strong>di</strong>fferenza della fonetica, che stu<strong>di</strong>a le proprietà articolatorie e acustiche dei suoni linguistici e delle loro<br />

sequenze, la fonologia stu<strong>di</strong>a il sistema dei suoni come parte della conoscenza linguistica del parlante. Gli<br />

elementi lessicali conterranno istruzioni rilevanti per la sintassi e la semantica, e istruzioni rilevanti per la<br />

loro interpretazione fonetica. Tali istruzioni possono essere concepite come quelle proprietà fonetiche che il<br />

parlante/ ascoltatore deve riconoscere in un enunciato per identificare un dato elemento lessicale. Le<br />

informazioni fonetiche immagazzinate nel lessico costituiscono quin<strong>di</strong> una parte della nostra grammatica<br />

mentale. Queste proprietà fonetiche saranno apprese dal bambino, nel senso che ogni singolo elemento<br />

lessicale sarà caratterizzato da una combinazione <strong>di</strong> suoni che lo <strong>di</strong>fferenzia dagli altri elementi all’interno <strong>di</strong><br />

una lingua, per cui ad esempio la particolare sequenza associata a can(-e) sarà <strong>di</strong>versa da ogni altra sequenza<br />

della stessa lingua. Questa caratteristica delle proprietà fonetiche associate agli elementi lessicali viene<br />

definita ‘<strong>di</strong>stintiva’, ed è stata considerata una proprietà linguistica fondamentale dagli approcci strutturalisti.<br />

Le sequenze <strong>di</strong> consonanti e vocali che formano le parole e le frasi <strong>di</strong> una lingua sono governate da<br />

regolarità e restrizioni in parte universali, fissate cioè dalla Grammatica Universale, e in parte specifiche <strong>di</strong><br />

singole lingue naturali, fissate cioè come proprietà lessicali. Parleremo quin<strong>di</strong> <strong>di</strong> componente fonologico per<br />

riferirci a questo complesso <strong>di</strong> istruzioni relative alla struttura fonetica delle parole e delle frasi <strong>di</strong> una lingua.<br />

In particolare i parlanti hanno intuizioni sul fatto che sequenze fonetiche parzialmente <strong>di</strong>verse possono<br />

corrispondere a una stessa parola o comunque a una stessa voce lessicale; in altre parole possono identificare<br />

uno stesso elemento lessicale al <strong>di</strong> sotto <strong>di</strong> realizzazioni fonetiche parzialmente <strong>di</strong>verse. Quin<strong>di</strong> potremo<br />

<strong>di</strong>stinguere fra le proprietà fonetiche lessicali, che non <strong>di</strong>pendono dal contesto e che coincidono<br />

generalmente con le proprietà necessarie per identificare la singola voce lessicale, e le proprietà che<br />

<strong>di</strong>pendono dal contesto, collegate a restrizioni e regole generali.<br />

4.1. Fonemi e suoni: due livelli <strong>di</strong> analisi.


I modelli fonologici che si sono affermati nella linguistica moderna hanno avuto presente il fatto che<br />

un’analisi adeguata deve prevedere un livello <strong>di</strong> rappresentazioni astratte collegate in maniera sistematica<br />

con le proprietà fonetiche. La questione nei suoi elementi essenziali è già chiaramente formulata in Versuch<br />

einer Theorie phonetischer Alternationen. Ein Kapitel aus der Psychophonetic (1895) da Baudouin de<br />

Courtenay, che assume che i fenomeni fonetici, pur corrispondendo a proprietà fisiche, ‘antropofoniche’,<br />

rimandano ad immagini mentali, il livello ‘psicofonetico’. In particolare Baudouin de Courtenay nota che la<br />

nozione <strong>di</strong> ‘cambiamento <strong>di</strong> suono’ è priva <strong>di</strong> valore empirico visto che in sé il dato fisico è un evento<br />

particolare e transitorio che implica necessariamente rappresentazioni mentali: ‘Una parola, o una frase, una<br />

volta emessa, scompare al momento della sua enunciazione. Non c’è nessuna connessione fisica fra<br />

enunciati. Ciò che collega i separati atti <strong>di</strong> parola – siano essi suoni, parole fonetiche, o enunciati (u<strong>di</strong>ti e<br />

percepiti dall’orecchio) – sono rappresentazioni, o immagini della memoria, che durante l’emissione stessa<br />

servono come uno stimolo alla serie <strong>di</strong> organi della parola per l’appropriato movimento’ (B. de Courtenay<br />

1895 [1972]:158). A questo autore si richiama il linguista russo Nikolaj Sergeevic Trubeckoj (cf. le pagine<br />

seguenti), che nei Grundzüge der Phonologie (uscito postumo nel 1939) separa ‘il flusso fonico della parola<br />

concreta’ dal ‘sistema ben or<strong>di</strong>nato’ delle ‘unità della lingua’; la concettualizzazione messa a punto nei<br />

Grundzüge der Phonologie mira ad catturare le generalizzazioni e le relazioni soggiacenti ai sistemi fonetici;<br />

questa prospettiva sarà alla base della teoria dei tratti <strong>di</strong> Jakobson.<br />

La separazione <strong>di</strong> un livello più astratto e <strong>di</strong> un livello <strong>di</strong> tipo fonetico fu messa a punto dal linguista<br />

americano <strong>di</strong> origine tedesca Edward Sapir (1884 – 1939). Nacque a Lauenberg (Germania) nel 1884;<br />

quando aveva 4 anni la sua famiglia emigrò negli Stati Uniti. Stu<strong>di</strong>oso dai molteplici interessi, ha dato<br />

contributi fondamentali in vari campi della linguistica, dalla fonologia all’etnolinguistica, alla tipologia.<br />

L’interesse etnolinguistico, in particolare per le lingue amerin<strong>di</strong>e (le lingue originarie degli In<strong>di</strong>ani<br />

d’America), è principalmente nato in Sapir in seguito alla sua conoscenza del linguista ed etnologo Franz<br />

Boas (1858-1942). Ha quin<strong>di</strong> stu<strong>di</strong>ato e descritto varie lingue amerin<strong>di</strong>e parlate negli Stati Uniti e in Canada.<br />

Questi interessi e questi stu<strong>di</strong> sono alla base dei suoi successivi lavori nel campo della tipologia, <strong>di</strong>sciplina<br />

che si occupa della classificazione delle lingue non sulla base della parentela reciproca, bensì in base alle<br />

loro caratteristiche morfosintattiche. La grande <strong>di</strong>versità riscontrata fra le varie lingue amerin<strong>di</strong>e rendeva<br />

infatti impossibile r<strong>agg</strong>ruppare queste ultime in una o più famiglie geneticamente imparentate, seguendo il<br />

modello prevalente della linguistica indoeuropea; si rendeva dunque necessario un <strong>di</strong>verso modello <strong>di</strong><br />

classificazione. Secondo una classificazione del 1892, le lingue amerin<strong>di</strong>e erano state infatti sud<strong>di</strong>vise in ben<br />

55 famiglie in<strong>di</strong>pendenti, che Sapir ridurrà soltanto a 6 macro-gruppi.<br />

In Language del 1921, Sapir elabora una concezione originale e penetrante dei tipi linguistici basata<br />

sulla maniera in cui le lingue esprimono, tramite gli elementi lessicali e grammaticali (flessioni, preposizioni,<br />

congiunzioni, ecc.), i concetti, che lui <strong>di</strong>stingue fra fondamentali e relazionali. Sapir arriva quin<strong>di</strong> ad una<br />

sorta <strong>di</strong> classificazioni <strong>di</strong> universali concettuali Nei termini <strong>di</strong> questa analisi, inoltre Sapir rivede criticamente<br />

le tipologie tra<strong>di</strong>zionali, basate sulle proprietà superficiali delle lingue, e propone un <strong>di</strong>verso modello<br />

tipologico che classifica le lingue in rapporto alle loro proprietà concettuali. Sapir propone un’analisi dei<br />

concetti che una lingua può esprimere, cioè una sorta <strong>di</strong> classificazione <strong>di</strong> universali concettuali: (i) concetti<br />

fondamentali (concreti), espressi da parole in<strong>di</strong>pendenti o da ra<strong>di</strong>ci (nomi, verbi); (ii) concetti derivativi<br />

(meno concreti) espressi generalmente da elementi <strong>agg</strong>iunti alla ra<strong>di</strong>ce; (iii) concetti concreti relazionali (più<br />

astratti), espressi normalmente da elementi non ra<strong>di</strong>cali (flessione); (iv) concetti relazionali puri (puramente<br />

astratti) espressi in mo<strong>di</strong> <strong>di</strong>versi (parole singole come congiunzioni o preposizioni, or<strong>di</strong>ne delle parole, affissi<br />

alle ra<strong>di</strong>ci, ecc.). Quin<strong>di</strong> il contenuto che potremmo chiamare lessicale corrisponde a (i) e (ii), mentre quello<br />

relativo alle relazioni sintattiche corrisponde a (iii) e (iv). Sulla base <strong>di</strong> questa analisi è possibile <strong>di</strong>stinguere<br />

le lingue pure relazionali che esprimono con elementi lessicali e morfosintattici solo i concetti (i) e (iv),<br />

dalle lingue pure relazionali derivanti che esprimono (i), (ii) e (iv), da quelle miste relazionali non derivanti<br />

che esprimono i concetti (i) e (iii), e infine le lingue miste relazionali derivanti che esprimono (i), (ii) (iii), a<br />

cui appartengono le lingue flessive più familiari, come il latino.<br />

Un altro importante contributo è stato apportato da Sapir alla fonologia (Sapir 1921, 1933), ed in<br />

particolare al concetto <strong>di</strong> fonema, a cui egli giunse in<strong>di</strong>pendentemente dai paralleli stu<strong>di</strong> europei. Si<br />

concentrò prevalentemente sulla realtà psicologica dei fonemi, cioè sul fatto che i parlanti hanno intuizioni<br />

sulle entità fonologiche della lingua, cioè quelle proprietà fonetiche che non <strong>di</strong>pendono dal contesto e che<br />

corrispondono alla maniera in cui i suoni <strong>di</strong> una parola sono immagazzinati nel lessico mentale. La<br />

separazione <strong>di</strong> un livello più astratto e <strong>di</strong> un livello <strong>di</strong> tipo fonetico fu messa a punto da Sapir, in particolare<br />

in La réalité psychologique des phonèmes, dove <strong>di</strong>mostrò che i parlanti hanno intuizioni sulle entità<br />

fonologiche della lingua, cioè quelle proprietà fonetiche che non <strong>di</strong>pendono dal contesto; anzi i parlanti


ingenui erano in grado <strong>di</strong> identificare questi elementi astratti al <strong>di</strong> sotto delle effettive realizzazioni fonetiche.<br />

Ad esempio il suo interprete, parlante nativo del paiute meri<strong>di</strong>onale, una lingua amerin<strong>di</strong>ana dell’Arizona,<br />

trascriveva la sequenza fonetica del paiute [pa Aa] ‘acqua alla’, cioè all’acqua, come /pa pa/ trascurando ai<br />

fini dell’identificazione delle parole le proprietà dovute al contesto intervocalico, cioè il fatto che invece <strong>di</strong><br />

/p/ la pronuncia era quella <strong>di</strong> una fricativa sonora [A].<br />

4.2. La fonematica americana (fonemica autonoma)<br />

Anche la linguistica strutturalista americana sviluppa idee analoghe. E’ lo stesso Bloomfield 1933 che<br />

contrappone le <strong>di</strong>fficoltà <strong>di</strong> una descrizione fedele delle particolarità fonetiche dei suoni all’aspetto che<br />

risulta rilevante per il suono linguistico, cioè ‘Il fatto che esso serve a collegare lo stimolo del parlante con la<br />

risposta dell’ascoltatore’ (Bloomfield 1933 [1961]: 147). In realtà la ‘fonemica tassonomica’ dello<br />

strutturalismo americano elabora una procedura <strong>di</strong> analisi riducibile ad alcuni criteri rappresentazionali<br />

(linearità, invarianza, biunivocità, determinabilità locale). Chomsky 1966 [1975] mette in luce le<br />

inadeguatezze intrinseche della fonemica tassonomica e ne critica i presupposti epistemologici, il fatto cioè<br />

che la fonemica sia vista come un ‘mezzo per organizzare i dati originari’ (secondo la definizione <strong>di</strong> Harris<br />

riportata in Chomsky 1966 [1975]:101), rifiutando qualsiasi ipotesi mentalistica. La conclusione <strong>di</strong> Chomsky<br />

1966 [1975]:100 ripropone la questione del rapporto fra dato fisico e conoscenza del parlante, nel senso che<br />

‘… non c’è ragione che il linguista si debba limitare necessariamente allo stu<strong>di</strong>o ‘dei fenomeni e delle loro<br />

correlazioni’, evitando qualsiasi tentativo <strong>di</strong> capire a fondo questi dati me<strong>di</strong>ante una teoria esplicativa della<br />

lingua, una teoria che, ovviamente, è ‘mentalistica’ in quanto si occupa della natura dei processi mentali<br />

invece che del loro fondamento fisico’. Bloomfield fu uno stu<strong>di</strong>oso dai molteplici interessi, fu fortemente<br />

influenzato dal rigoroso positivismo degli psicologi americani del suo tempo, sostenitori del<br />

comportamentismo. A <strong>di</strong>fferenza del contemporaneo Sapir, anche il suo approccio allo stu<strong>di</strong>o della lingua è<br />

improntato a una metodologia <strong>di</strong> analisi formale, e caratterizzato dal rifiuto del mentalismo. In particolare<br />

Bloomfield mira a definire un proce<strong>di</strong>mento <strong>di</strong> analisi delle unità della lingua il più possibile in<strong>di</strong>pendente<br />

dal ricorso al significato, considerato <strong>di</strong> competenza delle scienze naturali. Pur considerando i significati al <strong>di</strong><br />

fuori del campo <strong>di</strong> stu<strong>di</strong>o della linguistica, Bloomfield caratterizza in maniera generale il significato <strong>di</strong> una<br />

forma linguistica come la situazione in cui il parlante la enuncia e la risposta che essa provoca<br />

nell’ascoltatore. In questo modo anche il bambino imparerebbe a parlare, acquisendo cioè i significati delle<br />

forme che sente in base alle varie situazioni che provocano l’enunciazione <strong>di</strong> una data forma linguistica. I<br />

significati non sarebbero quin<strong>di</strong> subor<strong>di</strong>nati alla completa conoscenza scientifica del mondo, bensì<br />

potrebbero essere in<strong>di</strong>viduati in base a tratti semanticamente <strong>di</strong>stintivi, cioè comuni alle situazioni alle quali<br />

appunto è possibile associare una data espressione linguistica.<br />

Bloomfield in A set of postulates 1926 delinea alcuni dei punti essenziali <strong>di</strong> un approccio linguistico<br />

formale, basato sull’idea che ‘il metodo della postulazione… ci forza a stabilire esplicitamente qualsiasi cosa<br />

noi assumiamo, a definire i nostri termini…’ come appunto nel caso della matematica. Bloomfield definisce<br />

quin<strong>di</strong> le unità fondamentali dell’analisi linguistica, cioè la nozione <strong>di</strong> enunciato e <strong>di</strong> lingua <strong>di</strong> una comunità,<br />

intesa come ‘la totalità degli enunciati che possono essere fatti in una comunità linguistica’. La definizione è<br />

quin<strong>di</strong> quella <strong>di</strong> tipo esternalista; Bloomfiel nota (con rammarico!) che i linguisti sono obbligati a ‘pre<strong>di</strong>re’<br />

(…possono essere…): esiste allora qualche cos’altro oltre l’insieme degli enunciati?. Definisce poi la<br />

nozione <strong>di</strong> forma, intesa come la parte simile <strong>di</strong> enunciati, <strong>di</strong> forma minima (morfema), <strong>di</strong> forma libera (che<br />

può essere prodotta in isolamento), <strong>di</strong> sintagma (forma libera non minima) <strong>di</strong> parola (forma libera minima). I<br />

fonemi (suoni <strong>di</strong>stintivi) sono le parti simili minime <strong>di</strong> morfemi: gli or<strong>di</strong>ni possibili dei fonemi sono detti<br />

sound-patterns della lingua. Le parti del <strong>di</strong>scorso sono definite in termini <strong>di</strong> classi <strong>di</strong> forme, cioè <strong>di</strong> quelle<br />

forme che possono ricorrere nelle stesse posizioni (dette funzioni). Lo stu<strong>di</strong>o delle alternanze è basato<br />

sull’idea che: In una costruzione un fonema può alternare con un altro fonema a seconda dei fonemi<br />

circostanti’ (esiste quin<strong>di</strong> un livello in cui una stessa parola può avere due rappresentazioni fonemiche<br />

<strong>di</strong>verse: tat pacati vs. tad bharati sanscrito). Introduce inoltre la nozione <strong>di</strong> elemento zero, per cui ad<br />

esempio, book ha un affisso zero <strong>di</strong> singolare in confronto a f-oo-t, dove –oo- è l’elemento <strong>di</strong> singolare<br />

effettivamente realizzato.<br />

In Language del 1933 (trad. italiana 1996) l’attenzione è dunque concentrata sull’analisi formale,<br />

compiuta me<strong>di</strong>ante proce<strong>di</strong>menti e operazioni obiettivamente descrivibili: le unità fondamentali della<br />

descrizione linguistica sono per Bloomfield il fonema e in generale le forme linguistiche, cioè i <strong>di</strong>versi tipi <strong>di</strong><br />

costituente che combinano suoni e significati, corrispondenti al morfema, alla parola, e ai <strong>di</strong>versi tipi <strong>di</strong><br />

combinazioni <strong>di</strong> costituenti. Le unità linguistiche sono quin<strong>di</strong> il risultato <strong>di</strong> un proce<strong>di</strong>mento <strong>di</strong><br />

commutazione che confrontando in maniera sistematica gli enunciati <strong>di</strong> una comunità <strong>di</strong> parlanti dovrebbe


permettere <strong>di</strong> in<strong>di</strong>viduare le parti che vi ricorrono, senza mettere in gioco ipotesi sul carattere mentale <strong>di</strong> tali<br />

unità. I costituenti sono solo il prodotto della procedura <strong>di</strong> analisi in componenti dotate <strong>di</strong> significato<br />

applicata alla frase. Il fonema è ciò che collega l’enunciato prodotto dal parlante con la risposta<br />

dell’ascoltatore: per ottenere questo risultato quello che conta è che ‘ciascun fonema sia inequivocabilmente<br />

<strong>di</strong>verso da tutti gli altri’ (Bloomfield 1933, trad. italiana 1996: 147).<br />

4.3. La nozione strutturalista <strong>di</strong> fonema<br />

Nei Grundzüge der Phonologie 1939, Trubeckoj osserva che nelle lingue naturali alcune <strong>di</strong>fferenze <strong>di</strong> suono<br />

corrispondono a <strong>di</strong>fferenze <strong>di</strong> significato, cioè danno luogo a parole e espressioni <strong>di</strong>stinte, mentre altre<br />

<strong>di</strong>fferenze <strong>di</strong> suono, pur riconoscibili, non hanno questa funzione. Le <strong>di</strong>fferenze del primo tipo sono<br />

‘pertinenti’ al funzionamento del sistema fonologico e sono definite ‘opposizioni <strong>di</strong>stintive’. Ad esempio, in<br />

italiano la <strong>di</strong>fferenza fra s e r <strong>di</strong>stingue sistematicamente significati <strong>di</strong>versi come in kasa ‘casa’ e kara ‘cara’,<br />

peso ‘peso’ e pero ‘pero’, etc., mentre la <strong>di</strong>fferenza fra s e z generalmente non dà luogo a parole <strong>di</strong>fferenti<br />

ma <strong>di</strong>pende dal tipo <strong>di</strong> pronuncia adottato dal parlante. Nel caso <strong>di</strong> kasa e kaza, peso e pezo, la pronuncia s è<br />

dei parlanti centro-meri<strong>di</strong>onali, mentre la pronuncia z dei parlanti settentrionali. Quin<strong>di</strong> la <strong>di</strong>fferenza fra s e z<br />

in kasa e kaza non <strong>di</strong>stingue significati <strong>di</strong>fferenti e non è <strong>di</strong>stintiva; Trubeckoj parla in questo caso <strong>di</strong> varianti<br />

stilistiche.<br />

Gli elementi che prendono parte a un’opposizione sono i fonemi, concepiti come l’insieme delle<br />

proprietà che hanno valore <strong>di</strong>stintivo; usualmente si parla <strong>di</strong> allofoni per in<strong>di</strong>care le <strong>di</strong>verse realizzazioni <strong>di</strong><br />

un fonema nei <strong>di</strong>versi contesti fonetici. Trubeckoj 1939 <strong>di</strong>stingue vari tipi <strong>di</strong> opposizioni sulla base delle<br />

proprietà comuni degli elementi sono coinvolti. Un’opposizione come t-d è bilaterale, dato che non vi sono<br />

altre occlusive dentali, mentre d-b è multilaterale dato che vi sono altre occlusive dentali e labiali; le<br />

opposizioni proporzionali caratterizzano più coppie oppositive, come nel caso <strong>di</strong> t-d, p-b, etc. dove in ogni<br />

coppia via è la stessa <strong>di</strong>fferenza fra i due elementi, l’uno sordo l’altro sonoro, mentre altre sono isolate,<br />

interessando solo una coppia, come quella tR-m, ad esempio. Infine un’opposizione è logicamente privativa<br />

se un termine ha una caratteristica (marca) assente nell’altro termine come nel caso <strong>di</strong> n-d, è graduale se la<br />

<strong>di</strong>fferenza non è riportabile alla presenza/assenza <strong>di</strong> una determinata proprietà, come. nel caso delle<br />

<strong>di</strong>fferenze <strong>di</strong> grado <strong>di</strong> apertura fra vocali, e equipollente, quando i due termini non sono né gra<strong>di</strong> <strong>di</strong>versi <strong>di</strong><br />

una proprietà né in rapporto privativo, come ad es. p-t, f-k. Un’opposizione bilaterale, proporzionale e<br />

privativa è una correlazione; la proprietà coinvolta è la marca <strong>di</strong> correlazione. (Trubeckoj 1949 trad. fr. <strong>di</strong><br />

Grundzuege der Phonologie 1939). Una correlazione è l’insieme delle coppie correlative, cioè delle coppie<br />

<strong>di</strong> fonemi che hanno una relazione <strong>di</strong> opposizione, per cui la serie p-b = f–v = t-d = s-z = tR-dY = k-g è una<br />

correlazione e la sua marca è la presenza/assenza <strong>di</strong> sonorità. In tali serie, Trubeckoj nota che è pertinente<br />

una sola proprietà, la ‘marca’; ad esempio in italiano la <strong>di</strong>fferenza fra p e b è la stessa <strong>di</strong> quella fra f e v, t e d,<br />

k e g, etc. ed è dovuta ad un’unica proprietà, cioè la sonorità, assente nel primo membro e presente nel<br />

secondo, mentre le altre proprietà fonetiche dei due membri sono costanti: p e b sono entrambe occlusive<br />

bilabiali, f e v fricative labiodentali, etc. Un’altra proprietà delle opposizioni sottolinenata da Trubeckoj è la<br />

possibilità che un’opposizione sia neutralizzata in certi contesti. Ad esempio, in tedesco l’opposizione fra<br />

ostruente sorda e ostruente sonora è neutralizzata in finale <strong>di</strong> parola, dove vengono realizzati solo gli allofoni<br />

sor<strong>di</strong>. Ad esempio l’opposizione fra /k/ e /g/ che separa /siMken/ “cadere” da /siMgen/ “cantare” è<br />

neutralizzata in posizione finale <strong>di</strong> parola, per cui le due forme vengono a coincidere, come in ich [zaMk]<br />

‘cadevo/ cantavo’<br />

La fonologia successiva ha sviluppato l’analisi e le idee <strong>di</strong> Trubeckoj in <strong>di</strong>rezione <strong>di</strong> una teoria dei<br />

componenti fonologici elementari. In particolare è Roman Jakobson che elabora l’idea, solo ancora<br />

embrionale in Trubeckoj, che i segmenti possono essere scomposti in proprietà elementari concepite come<br />

veri e propri universali del lingu<strong>agg</strong>io. In Preliminaries to speech analysis del 1952 Jakobson, Fant e Halle<br />

riconducono le proprietà fonetiche inerenti dei singoli segmenti a un insieme ristretto <strong>di</strong> 12 tratti <strong>di</strong>stintivi,<br />

ciascuno dei quali è una scelta fra la presenza o l’assenza <strong>di</strong> una proprietà acustica/ articolatoria. In (8) è<br />

riportato questo inventario <strong>di</strong> tratti nella sistemazione fornita in Jakobson 1966[1963].<br />

(8) Tratti intrinseci<br />

Tratti fondamentali <strong>di</strong> sorgente<br />

vocalico/non-vocalico<br />

consonantico/non consonantico<br />

Tratti <strong>di</strong> sonorità<br />

compatto/<strong>di</strong>ffuso


interrotto/continuo<br />

stridente/non-stridente<br />

glotalizzato/non gl.<br />

sonoro/non-sonoro<br />

teso/rilassato<br />

nasale/orale<br />

Tratti <strong>di</strong> tonalità<br />

grave/acuto<br />

bemollizzato/non-b.<br />

<strong>di</strong>esizzato/non-d.<br />

Una teoria dei tratti riporta quin<strong>di</strong> la <strong>di</strong>versità dei sistemi <strong>di</strong> suoni osservati nelle lingue naturali a un<br />

insieme limitato e universale <strong>di</strong> proprietà. Come si vede, i tratti tengono conto dei due tipi fondamentali <strong>di</strong><br />

sorgente, vocalica e consonantica, e <strong>di</strong>fferenziano all’interno del secondo tipo le <strong>di</strong>verse modalità<br />

articolatorie, in particolare il contrasto fra consonanti occlusive, cioè con una chiusura nel tratto vocale<br />

(interrotto) e le consonanti create tramite un semplice restringimento, fricative/ approssimanti (continuo). Il<br />

contrasto compatto/ <strong>di</strong>ffuso caratterizza la configurazione assunta dal risuonatore orale. In particolare sono<br />

compatti i suoni con elevata concentrazione <strong>di</strong> energia acustica in una zona centrale dello spettro sonoro, in<br />

particolare le vocali aperte e le consonanti velari e palatali, con la cavità orale aperta verso l’esterno (a rima<br />

<strong>di</strong>stesa anteriormente); al contrario i suoni <strong>di</strong>ffusi, nei quali la cavità del risuonatore si espande <strong>di</strong>etro il<br />

punto <strong>di</strong> articolazione, verso l’interno, hanno una ridotta concentrazione <strong>di</strong> energia acustica (vocali anteriori<br />

e consonanti labiali e dentali). Il contrasto grave/ acuto <strong>di</strong>fferenzia i segmenti con concentrazione <strong>di</strong> energia<br />

nelle alte frequenze (acuto) da quelli con concentrazione <strong>di</strong> energia nelle basse frequenze (grave). I segmenti<br />

gravi sono periferici (velari, labiali) con un risuonatore più ampio e meno sud<strong>di</strong>viso <strong>di</strong> quello dei segmenti<br />

palatali e dentali (acuto).<br />

Jakobson 1966 [1963] in<strong>di</strong>vidua alcuni contrasti fondamentali, <strong>di</strong> carattere universale, e determinanti<br />

nel processo <strong>di</strong> acquisizione fonologica del bambino. Il primo separa la vocale aperta [a] compatta e con<br />

forte concentrazione <strong>di</strong> energia dalle consonanti, a bassa energia, <strong>di</strong>ffuse, come nel in (9)<br />

(9) a [compatto]<br />

|<br />

|<br />

p ---------------- t [<strong>di</strong>ffuso]<br />

[grave] [acuto]<br />

Il contrasto compatto/<strong>di</strong>ffuso può <strong>di</strong>fferenziare anche le vocali, opponendo a [a] due vocali a minore energia,<br />

<strong>di</strong>fferenziate per le proprietà <strong>di</strong> tonalità (colore), l’una velare (grave), l’altra palatale (acuta), come in (10),<br />

specificando le tre configurazioni vocaliche fondamentali, sia dal punto <strong>di</strong> vista percettivo che dal punto <strong>di</strong><br />

vista della <strong>di</strong>stribuzione <strong>di</strong> questi tipi vocalici nelle lingue del mondo.<br />

(10) a [compatto]<br />

|<br />

|<br />

u ----------------- i [<strong>di</strong>ffuso]<br />

[grave] [acuto]<br />

5. La fonologia generativa.<br />

Chomsky 1966 [1975] delinea alcuni dei punti teorici ripresi poi in The sound pattern of English (Chomsky e<br />

Halle 1968). In particolare contrappone alla fonemica tassonomica la ‘fonemica sistematica’, cioè il livello <strong>di</strong><br />

rappresentazione associato al componente fonologico della grammatica <strong>di</strong> una lingua. Chomsky collega<br />

esplicitamente questo tipo <strong>di</strong> rappresentazione con l’‘ortografia fonologica <strong>di</strong> Sapir’ (Sapir 1933) o più<br />

esplicitamente col ‘sistema sonoro ideale’, con lo ‘schema fonetico interno’, che Sapir 1921 separa dal<br />

sistema sonoro oggettivo (cioè quello fonetico superficiale), e che al pari della ‘struttura grammaticale’<br />

caratterizza ogni lingua. In effetti, il modello <strong>di</strong> Sound pattern of English sostituisce gli approcci procedurali<br />

dello strutturalismo tassonomico con una teoria della conoscenza linguistica, in cui l’informazione<br />

fonologica è organizzata in rappresentazioni che obbe<strong>di</strong>scono ai principi generali del modello mentalista


piuttosto che ai requisiti <strong>di</strong> una procedura classificatoria. Specificamente, per quanto riguarda la natura delle<br />

rappresentazioni fonologiche e il rapporto fra rappresentazioni soggiacenti, relative cioè all’informazione<br />

fonologica lessicale, e rappresentazioni superficiali, è interessante notare che Chomsky 1995, sulla linea <strong>di</strong><br />

The sound pattern of English, assume che le rappresentazioni fonologiche non debbano necessariamente<br />

rispettare la con<strong>di</strong>zione <strong>di</strong> inclusività, altrimenti valida in sintassi. In altre parole, la fonologia può<br />

manipolare e trasformare il contenuto fonologico degli elementi lessicali.<br />

La natura delle rappresentazioni fonologiche costituisce una questione centrale nel quadro<br />

della teoria linguistica. Le rappresentazioni fonologiche definite nel testo <strong>di</strong> riferimento della fonologia<br />

generativa, Sound Pattern of English (Chomsky e Halle 1968), attribuiscono ai segmenti due tipi <strong>di</strong> proprietà<br />

<strong>di</strong> natura fondamentalmente <strong>di</strong>versa: le proprietà fonetiche intrinseche, interpretate dai tratti <strong>di</strong> risonanza e <strong>di</strong><br />

sorgente, e le proprietà <strong>di</strong> tipo metrico, sillabico e temporale, interpretate dai tratti <strong>di</strong> classe (Consonante vs.<br />

Vocale), e <strong>di</strong> durata. Il <strong>di</strong>battito degli anni successivi ha portato a rivedere alcuni punti essenziali del modello<br />

<strong>di</strong> Sound Pattern of English, ridefinendo in particolare il formato delle rappresentazioni fonologiche. Il<br />

modello iniziale della fonologia generativa era infatti basato su rappresentazioni povere, <strong>di</strong> tipo lineare, e un<br />

sistema sostanzialmente non-ristretto <strong>di</strong> regole. Le teorie fonologiche successive hanno puntato a limitare il<br />

carattere arbitrario e non-ristretto delle derivazioni. Un pass<strong>agg</strong>io essenziale ha riguardato il formato delle<br />

rappresentazioni, che il modello autosegmentale ha crucialmente arricchito. Infatti nelle correnti fonologie<br />

non-lineari le rappresentazioni co<strong>di</strong>ficano l'informazione <strong>di</strong> tipo fonetico e le proprietà <strong>di</strong> tipo sillabico,<br />

ritmico e temporale (durata) collocandole su livelli separati. Come vedremo, il carattere non-lineare delle<br />

rappresentazioni ha avuto effetti anche sulla tipologia dei processi fonologici, restringendone significativamente<br />

la forma.<br />

Vi è un conflitto, più volte notato, fra il carattere pre<strong>di</strong>ttivo del modello teorico e l’apparente<br />

incoerenza del dato fonetico. Una critica ricorrente ha preso <strong>di</strong> mira il carattere astratto dell’interpretazione<br />

fonologica, cui sfuggirebbero proprietà fisiche altrimenti evidenziate nelle descrizioni (impressionistiche o<br />

su base strumentale). In effetti, l’origine e l’affermarsi <strong>di</strong> un livello d’analisi fonologico ha dato una risposta<br />

agli interrogativi riguardanti il particolare dominio della conoscenza linguistica relativo ai suoni della sua<br />

lingua. In questo senso, l’analisi fonologica corrisponde ad un requisito <strong>di</strong> adeguatezza che la teoria<br />

linguistica deve comunque sod<strong>di</strong>sfare. La questione quin<strong>di</strong> va al <strong>di</strong> là del rapporto fra fonologia e dati<br />

fonetici ma investe più in generale lo statuto della teoria linguistica chomskyana che identifica la lingua con<br />

un sistema <strong>di</strong> conoscenza.<br />

Seguendo Chomsky 2000:7, è ragionevole aspettarci una ‘seria tensione’ fra le due con<strong>di</strong>zioni che<br />

una teoria del lingu<strong>agg</strong>io umano deve sod<strong>di</strong>sfare, cioè l’adeguatezza descrittiva e l’adeguatezza esplicativa.<br />

Infatti, quanto più è accurato il resoconto delle proprietà <strong>di</strong> una lingua, più una grammatica sarà adeguata nel<br />

primo senso. Ma l’adeguatezza esplicativa richiede che ‘una teoria del lingu<strong>agg</strong>io deve mostrare come ogni<br />

particolare lingua possa essere derivata da uno stato iniziale uniforme sotto le con<strong>di</strong>zioni limitanti poste<br />

dall’esperienza’ (Chomsky 2000: 7). Tutto sommato, il punto in questione è la relazione fra l’informazione<br />

immagazzinata al livello d’interfaccia <strong>di</strong> Forma Fonetica ed il sistema <strong>di</strong> esecuzione, senso-motorio, che<br />

interagisce con esso e che legge tale informazione (Chomsky 1995). È ipotizzabile che il livello d’interfaccia<br />

debba contenere un’informazione fonetica particolarmente ricca per essere letta ed esternalizzata dal sistema<br />

<strong>di</strong> esecuzione. In effetti questa soluzione tiene conto del fatto che i sistemi <strong>di</strong> esecuzione, pur essendo parte<br />

della facoltà <strong>di</strong> lingu<strong>agg</strong>io, non sembrano soggetti al tipo <strong>di</strong> variazione specifica delle singole lingue cui è<br />

soggetto il sistema cognitivo del lingu<strong>agg</strong>io (Chomsky 1995:2).<br />

5.1. Rappresentazione lessicale e rappresentazione <strong>di</strong> superficie.<br />

Le proprietà lessicali, rappresentate fra barre oblique, caratterizzano quella che si chiama forma soggiacente<br />

o <strong>di</strong> base, mentre le proprietà contestuali concorrono a specificare la forma <strong>di</strong> superficie; le realizzazioni<br />

superficiali <strong>di</strong> una forma <strong>di</strong> base sono dette alternanti, o, in riferimento ai singoli morfemi, allomorfi. Ad<br />

esempio le forme vedo, vi<strong>di</strong>, visto possono essere considerate alternanti della stessa forma <strong>di</strong> base /ved-/. Le<br />

proprietà fonetiche delle parole e degli enunciati mettono in gioco quin<strong>di</strong> almeno due livelli <strong>di</strong> informazioni<br />

fonetiche, che chiamiamo rappresentazioni; la rappresentazione delle proprietà lessicali (più astratte) sarà<br />

quin<strong>di</strong> separata da quella più superficiale, ottenuta dall’applicazione delle regole e delle restrizioni<br />

fonologiche che governano la combinazione delle voci lessicali in sequenze morfosintattiche.<br />

Discutiamo un esempio. In molte varietà sarde vi sono delle parole (elementi lessicali) che in alcuni<br />

contesti cominciano per vocale mentre in altri contesti hanno b iniziale; non tutte le parole che cominciano<br />

per vocale hanno però questo comportamento. Nella varietà <strong>di</strong> Padria, la parola per ‘voce’, si presenta ora<br />

come NFD, in contesti come sa NFD ‘la voce’ in cui è preceduta da una parola che finisce in vocale e ora come


NFD, sia quando è detta da sola sia quando è preceduta da una parola che finisce in consonante, come in kum<br />

bNFD ‘con voce’. Lo stesso vale per il plurale, per cui abbiamo dDFD NFDzD ‘<strong>di</strong>eci voci’ ma sal bNFDzD ‘le<br />

voci’. Cambiamenti dello stesso tipo riguardano molte altre parole, nomi e verbi. Ad esempio mentre si <strong>di</strong>ce<br />

lu i<strong>di</strong>mNzN ‘lo ve<strong>di</strong>amo’, si <strong>di</strong>ce lNl bi<strong>di</strong>mNzN ‘li ve<strong>di</strong>amo’, bi<strong>di</strong>mNzN a fradD Cou ‘ve<strong>di</strong>amo tuo fratello’, etc.<br />

La rappresentazione lessicale, cioè la sequenza <strong>di</strong> segmenti che identificano l’elemento lessicale nel lessico<br />

mentale del parlante, dovrà corrispondere a qualche cosa del tipo <strong>di</strong> /bNF-/ per ‘voce’ o /bid-/ per ‘vedere’,<br />

anche se alcune realizzazioni <strong>di</strong> questa parola sono prive <strong>di</strong> b iniziale.<br />

Quest’ultima informazione non è infatti altrimenti deducibile visto che vi sono voci lessicali come<br />

/odY-/ ‘occhio’ che non la presentano in nessun contesto, cf. s(u) odYu vs. soz NdYos(o). In altre parole dalla<br />

semplice esistenza <strong>di</strong> vocali iniziali <strong>di</strong> parola in contesto intervocalico all’interno <strong>di</strong> frase, sarebbe<br />

impossibile decidere quali alternano con una forma con [b] iniziale. La rappresentazione lessicale <strong>di</strong> voci<br />

lessicali come /odY-/ escluderà quin<strong>di</strong> b. Possiamo ricondurre l’alternanza fra forma con b iniziale e forma<br />

priva <strong>di</strong> b ad un meccanismo (regola) che si applica regolarmente nella grammatica <strong>di</strong> Padria, in base al<br />

quale l’alternante NFD <strong>di</strong> sa NFD risulterà da una regola che cancella b fra vocali. Il pass<strong>agg</strong>io da una forma <strong>di</strong><br />

base, come /bNF-/ all’effettiva realizzazione in un particolare contesto, come NFD in sa NFD per mezzo<br />

dell’applicazione <strong>di</strong> una o più regole, si chiama derivazione. Come schematizzato in (11), la forma <strong>di</strong> base si<br />

combina con i morfemi flessivi, le desinenze, per formare parole, che sono inserite nelle frasi; a questo punto<br />

le regole fonologiche, come la cancellazione <strong>di</strong> /b/, derivano le effettive realizzazioni.<br />

(11) regole <strong>di</strong> formazione <strong>di</strong> parola bNF-D bNF-Ds<br />

inserimento nella frase … sa bNF-D … … sas bNF-Ds …<br />

regole fonologiche:<br />

cancellazione <strong>di</strong> /b/ … sa [∅]NF-D … … sas bNF-Ds …<br />

sonorantizzazione <strong>di</strong> /s/ … sa NF-D … … sal bNF-Ds …<br />

5.2. La teoria fonologica nel quadro <strong>di</strong> un modello mentalista del lingu<strong>agg</strong>io.<br />

Il modello proposto da Chomsky e Halle inserisce la fonologia all’interno della teoria della facoltà <strong>di</strong><br />

lingu<strong>agg</strong>io e la concepisce come un componente della conoscenza linguistica del parlante, fissata dalla<br />

Grammatica Universale. L’approccio mentalista definito da Chomsky, che seguiremo come quadro <strong>di</strong><br />

riferimento, colloca lo stu<strong>di</strong>o del lingu<strong>agg</strong>io nel quadro delle scienze cognitive. In particolare, identifica le<br />

lingue naturali con sistemi <strong>di</strong> conoscenza, cioè con un componente della mente/ cervello del parlante che<br />

permette a quest’ultimo <strong>di</strong> produrre e comprendere le frasi della propria lingua e che il bambino può<br />

sviluppare sulla base <strong>di</strong> una facoltà della sua mente/ cervello biologicamente determinata. La lingua così<br />

intesa è chiamata da Chomsky (1995, 2000a) lingua-I, cioè lingua interna o intensionale:<br />

The concept of language is internal, in that it deals with an inner state of Jones’s mind/ brain, independent of other<br />

elements in the world. It is in<strong>di</strong>vidual in that it deals with Jones, and with language communities only derivatively, as<br />

groups of people with similar I-languages. It is intensional in the technical sense that the I-language is a function<br />

specified in intension, not extension: its extension is the set of S(tructural)D(escriptions)s [cioè le espressioni generate<br />

dalla particolare lingua-I (n.d.a.)] (Chomsky 1995: 15)<br />

È noto che in generale i modelli comportamentistici si scontrano con le restrizioni derivanti dalla povertà<br />

dello stimolo (Chomsky 1986): la questione cioè dei dati empirici sufficienti per lo sviluppo <strong>di</strong> un sistema<br />

così ricco e specifico come appunto la conoscenza del lingu<strong>agg</strong>io. La teoria della Grammatica Universale<br />

(GU) risponde a questi interrogativi, assumendo che la conoscenza <strong>di</strong> una lingua coincide con “un sistema <strong>di</strong><br />

regole e <strong>di</strong> principi che assegna rappresentazioni <strong>di</strong> forma e significato alle espressioni<br />

linguistiche” (Chomsky 1986:32) come risultato <strong>di</strong> un processo <strong>di</strong> acquisizione che porta il bambino<br />

dall’esperienza dei dati primari (gli enunciati che lo circondano) alla creazione <strong>di</strong> un proprio sistema <strong>di</strong><br />

conoscenza, la lingua-interna, come schematizzato in (12):<br />

(12) dati [facoltà <strong>di</strong> lingu<strong>agg</strong>io] lingua(-Interna) espressioni strutturate (adattato da Chomsky 1988: 35).<br />

Lo schema in (12) assegna alla nozione <strong>di</strong> lingua naturale un preciso significato, in quanto una delle possibili<br />

lingue che il bambino può sviluppare a partire dalla facoltà <strong>di</strong> lingu<strong>agg</strong>io.<br />

L’esistenza <strong>di</strong> gruppi <strong>di</strong> parlanti (comunità linguistiche) che si capiscono fra <strong>di</strong> loro è una situazione<br />

derivata dal fatto che la lingua-I (o le lingue-I) <strong>di</strong> ciascuno <strong>di</strong> essi è ampiamente o parzialmente simile a


quella <strong>di</strong> ciascun altro. La reciproca comprensione fra parlanti, che, come si <strong>di</strong>ce usualmente, parlano la<br />

stessa lingua, può essere riportata a quella che Chomsky (2000b) definisce ‘uniformità della dotazione<br />

iniziale’ dalla quale scaturiscono lingue-I simili in aspetti significativi. Del resto, la facoltà <strong>di</strong> lingu<strong>agg</strong>io<br />

con<strong>di</strong>visa dagli esseri umani impone a sua volta limiti all’ambito <strong>di</strong> variazione delle lingue-I possibili,<br />

incluse le proprietà lessicali, semantiche e fonetiche. Possiamo pensare una lingua L come un sistema<br />

cognitivo:<br />

The language L includes a cognitive system that stores information: roughly, information about sound, meaning, and<br />

structural organization. Performance systems access this information and put it to use […] L provides information to the<br />

performance systems in the form of “levels of representation”, in the technical sense. The performance systems access<br />

these “interface levels”. (Chomsky 2000b: 90).<br />

In una prospettiva mentalista (Chomsky 1981, 1986, 1995, 2000a) l’oggetto <strong>di</strong> stu<strong>di</strong>o della linguistica è il<br />

particolare sistema mentale (Lingua-Interna) che ciascun in<strong>di</strong>viduo sviluppa nel processo <strong>di</strong> acquisizione in<br />

corrispondenza <strong>di</strong> un <strong>di</strong>spositivo cognitivo specializzato per il lingu<strong>agg</strong>io fissato dal patrimonio genetico<br />

della specie umana, e non la collezione <strong>di</strong> dati esterni che rappresentano il prodotto <strong>di</strong> questo sistema. Il<br />

lingu<strong>agg</strong>io non è quin<strong>di</strong> <strong>di</strong>rettamente funzionale alla comunicazione <strong>di</strong> percezioni o referenti ma piuttosto<br />

corrisponde a una facoltà <strong>di</strong> tipo computazionale che, nei termini <strong>di</strong> Chomsky (2000a), Hauser, Chomsky,<br />

Fitch (2002), rappresenta la soluzione ottimale per connettere il nostro sistema <strong>di</strong> pensiero con i sistemi <strong>di</strong><br />

produzione e percezione dei suoni. Una lingua naturale sarà quin<strong>di</strong> un sistema del tipo schematizzato in<br />

(13i.ii) (Chomsky 2000b; cf. Rizzi 2006). La computazione sintattica dà luogo alla combinazione <strong>di</strong> elementi<br />

lessicali in oggetti sintattici più gran<strong>di</strong>, parole flesse, sintagmi e frase. La sintassi ha un ruolo decisivo in<br />

quanto è la sintassi che forma espressioni linguistiche leggibili ai due sistemi <strong>di</strong> interfaccia nella produzione<br />

come nella comprensione <strong>di</strong> enunciati, come schematizzato in (13iii); in altre parole, nelle lingue naturali la<br />

connessione tra significati e suoni è attuata dalla sintassi.<br />

(13) i. la lingua L comprende:<br />

lessico (gli elementi lessicali sono formati a partire da un insieme <strong>di</strong> tratti fissati dalla facoltà <strong>di</strong><br />

lingu<strong>agg</strong>io)<br />

sintassi = operazioni che si applicano in successione per formare oggetti sintattici <strong>di</strong> più grande<br />

complessità (Computational system for human language - CHL)<br />

livelli <strong>di</strong> interfaccia: forma fonetica - fonologia (Phonetic Form – PF)/ forma logica – significato<br />

(Logical form – LF) = forniscono informazioni ai sistemi <strong>di</strong> esecuzione: sistema senso-motorio e<br />

sistema concettuale-intenzionale.<br />

ii. la lingua L è un <strong>di</strong>spositivo che genera espressioni EXP, per EXP = <br />

dove PHON fornisce istruzioni al sistema senso-motorio e SEM fornisce istruzioni al sistema <strong>di</strong><br />

pensiero.<br />

iii. lessico CHL<br />

w p<br />

PF LF<br />

↓ ↓<br />

sistema sistema<br />

senso-motorio concettuale-intenzionale<br />

Quin<strong>di</strong>, l’analisi fonologica implica principi che caratterizzano in generale i sistemi fonologici delle lingue,<br />

assegnabili alla Grammatica Universale, accanto a restrizioni e regole specifiche delle singole lingue. Ad<br />

esempio, il r<strong>agg</strong>ruppamento in sillabe e la composizione in tratti dei segmenti fonologici rappresentano<br />

proprietà generali delle lingue. I tipi <strong>di</strong> sillabe e eventuali restrizioni sui tratti possono variare da lingua a<br />

lingua, anche se in ultima analisi la variazione mette in gioco a sua volta principi <strong>di</strong> carattere più <strong>prof</strong>ondo e<br />

generale. Finora le forme <strong>di</strong> base e le eventuali alternanti contestuali sono state rappresentate come sequenze<br />

<strong>di</strong> simboli dell’alfabeto fonetico o <strong>di</strong> quello normale. Al contrario, assumeremo che nelle rappresentazioni<br />

fonologiche i segmenti siano composti da componenti elementari, cioè i tratti fonologici.<br />

5.3. I tratti <strong>di</strong> Chomsky e Halle 1968<br />

La teoria dei tratti è ripresa nel modello <strong>di</strong> fonologia messo a punto da Chomsky e Halle 1968, come<br />

componente della facoltà <strong>di</strong> lingu<strong>agg</strong>io. I tratti rappresentano una caratterizzazione <strong>di</strong> proprietà universali dei<br />

sistemi fonologici delle lingue naturali e sono concepiti come istruzioni elementari per il riconoscimento e la


produzione delle sequenze fonetiche associate agli elementi lessicali e alla frase. Dovremo perciò tener<br />

<strong>di</strong>stinta la descrizione fonetica dall’analisi in tratti che tratta le proprietà fisiche (articolatorie e acustiche)<br />

fondamentali come parte della conoscenza linguistica del parlante. Chomsky e Halle 1968 propongono un<br />

inventario <strong>di</strong> tratti basati su criteri articolatori, che è quello oggi normalmente impiegato.<br />

I tratti possono essere sud<strong>di</strong>visi come segue:<br />

tratti delle classi m<strong>agg</strong>iori<br />

[± vocalico] = i segmenti [+vocalico] sono prodotti con una cavità orale in cui il massimo restringimento possibile è<br />

quello corrispondente a [i] e [u]; gli altri sono [-vocalico].<br />

[± consonantico] = presenza/ assenza <strong>di</strong> una ostruzione m<strong>agg</strong>iore nel tratto vocale<br />

[± sonorante] = presenza/ assenza della configurazione che permette la vibrazione spontanea delle corde vocali in<br />

assenza <strong>di</strong> un’ostruzione m<strong>agg</strong>iore nel tratto vocale.<br />

tratti <strong>di</strong> cavità<br />

[±coronale] = la punta della lingua è sollevata o meno dalla sua posizione neutra<br />

[±anteriore] = l’ostruzione è collocata prima o meno della regione palatoalveolare della bocca<br />

[±alto] = il corpo della lingua è sollevato o meno rispetto alla sua posizione neutra<br />

[±basso] = il corpo della lingua è spinto o meno al <strong>di</strong> sotto della sua posizione neutra<br />

[±posteriore] = il corpo della lingua è ritratto o meno verso la parte posteriore della cavità<br />

[±arrotondato] = presenza/ assenza <strong>di</strong> arrotondamento delle labbra<br />

[±nasale] = presenza/ assenza <strong>di</strong> flusso d’aria attraverso le cavità nasali<br />

[±laterale] = presenza/ assenza <strong>di</strong> pass<strong>agg</strong>io dell’aria ai lati della lingua<br />

tratti <strong>di</strong> modo <strong>di</strong> articolazione<br />

[±continuo] = presenza/ assenza <strong>di</strong> un’ostruzione tale da bloccare il flusso d’aria<br />

[±soluzione ritardata] = l’occlusione è sbloccata in maniera progressiva o repentina<br />

[±teso] = presenza/ assenza <strong>di</strong> una m<strong>agg</strong>iore energia articolatoria e acustica<br />

tratti <strong>di</strong> sorgente<br />

[±sonoro] = presenza/ assenza <strong>di</strong> vibrazione delle corde vocali<br />

[±stridente] = presenza/ assenza <strong>di</strong> m<strong>agg</strong>iore rumorosità<br />

Come si vede ciascun tratto [T] corrisponde ad una certa configurazione articolatoria che può essere presente<br />

oppure assente in un segmento, che nel primo caso sarà specificato come [+T] mentre nel secondo caso come<br />

[-T]. Ogni segmento corrisponderà quin<strong>di</strong> a un insieme <strong>di</strong> tratti che ne definiscono le proprietà fonetiche e<br />

sarà <strong>di</strong>stinto da ogni altro segmento della lingua almeno per un tratto. La matrice in (14) caratterizza le classi<br />

m<strong>agg</strong>iori <strong>di</strong> segmenti, cioè le consonanti (C), le vocali (V), le sonoranti (Son), le semiconsonanti (SC).<br />

(14) V C Son SC<br />

vocalico + - - -<br />

consonantico - + + -<br />

sonorante + - + -<br />

Le vocali e le sonoranti, cioè le nasali e le liquide, con<strong>di</strong>vidono il tratto [+sonorante], mentre le consonanti e<br />

le sonoranti con<strong>di</strong>vidono il tratto [+consonantico]. In altre parole l’analisi in tratti mette in luce (cattura) la<br />

somiglianza esistente fra le vocali e le sonoranti, da una parte e fra le consonanti e le sonoranti dall’altra.<br />

Quin<strong>di</strong> ad esempio il tratto [+consonantico] in<strong>di</strong>vidua la classe delle consonanti e delle sonoranti; stabilire<br />

classi <strong>di</strong> segmenti, dette classi naturali, è importante poiché nelle lingue i fenomeni fonologici e la<br />

<strong>di</strong>stribuzione nella catena fonica dei segmenti tiene conto appunto <strong>di</strong> classi <strong>di</strong> suoni parzialmente simili. Ad<br />

esempio potremo catturare il fatto che l’attacco sillabico è occupato o da consonanti o da sonoranti <strong>di</strong>cendo<br />

che sono i segmenti [+consonantico] che si inseriscono in questa posizione. I tratti sono quin<strong>di</strong> categorie,<br />

cioè proprietà, che in<strong>di</strong>viduano particolari classi <strong>di</strong> unità fonologiche. Più precisamente, i fenomeni<br />

fonologici interessano determinate proprietà fonetiche, ad esempio mo<strong>di</strong>ficano una certa configurazione<br />

articolatoria in particolari contesti, e così via; <strong>di</strong> conseguenza tutti i segmenti che con<strong>di</strong>vidono quella<br />

configurazione (espressa da un tratto o da più tratti) sono influenzati da quel particolare fenomeno. In<br />

conclusione, i tratti specificano il contenuto fonologico dei segmenti, esprimono le <strong>di</strong>fferenze e le<br />

somiglianze tra segmenti, permettono <strong>di</strong> catturare le classi naturali, cioè gli insiemi <strong>di</strong> segmenti che<br />

con<strong>di</strong>vidono uno o più tratti coinvolti in un processo fonologico.


5.4. Le vocali e le consonanti<br />

Possiamo caratterizzare le vocali dell’italiano, che corrispondono abbastanza fedelmente all’insieme delle<br />

vocali fondamentali, come in<strong>di</strong>cato in (15):<br />

(15)<br />

i e D a N o u<br />

vocalico + + + + + + +<br />

consonantico - - - - - - -<br />

sonorante + + + + + + +<br />

alto + - - - - - +<br />

basso - - + + + - -<br />

posteriore<br />

arrotondato<br />

-<br />

-<br />

-<br />

-<br />

-<br />

-<br />

+<br />

-<br />

+<br />

+<br />

+<br />

+<br />

+<br />

+<br />

Anche in questo caso è possibile in<strong>di</strong>viduare classi naturali, come quella delle vocali [+alto], cioè [i u],<br />

quella delle vocali [-basso] cioè [i e o u], quella delle vocali [+posteriore] cioè [a N o u], etc. Infine, <strong>di</strong>amo in<br />

(16) la matrice relativa ad un insieme rilevante <strong>di</strong> consonanti:<br />

(16)<br />

p b m f v t d n l r s z S C ts dz R Y tR dY c ã I K k g x F M h<br />

vocalico - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -<br />

consonant<br />

ico<br />

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + +<br />

sonorante - - + - - - - - + + - - - - - - - - - - - - + + - - - - + -<br />

sonoro - + + - + - + + + + - + - + - + - + - + + + - + - + + -<br />

anteriore + + + + + + + + + + + + + + + + - - - - - - - - - - - - - -<br />

coronale - - - - - + + + + + + + + + + + + + + + - - - - - - - - - -<br />

alto - - - - - - - - - - - - - - - - + + + + + + + + + + + + + -<br />

posteriore - - - - - - - - - - - - - - - - - - - - - - - - + + + + + -<br />

continuo - - - + + - - - + - + + + + - - + + - - - - - - - - + + - +<br />

stridente - - - + + - - - - - + + - - + + + + + + - - - - - - - - - -<br />

soluzione<br />

ritardata<br />

- - - - - - - - - - - - - - + + - - + + - - - - - - - - - -<br />

nasale - - + - - - - + - - - - - - - - - - - - - - + - - - - - + -<br />

laterale - - - - - - - - + - - - - - - - - - - - - - - + - - - - - -<br />

Almeno tre punti concettuali caratterizzano la teoria dei tratti: il numero dei <strong>di</strong>versi segmenti osservati nelle<br />

lingue naturali è molto alto, mentre i primitivi fonologici sono un insieme ristretto e universale; la natura<br />

binaria dei tratti è collegata al fatto che essi devono esprimere in primo luogo <strong>di</strong>fferenze fra segmenti<br />

(funzione <strong>di</strong>stintiva) piuttosto che il loro contenuto fonetico, per cui due segmenti potranno <strong>di</strong>fferenziarsi<br />

anche solo in termini negativi, per esempio [–vocalico, -consonantico] vs. [+vocalico, -consonantico], etc.; i<br />

tratti permettono <strong>di</strong> esprimere generalizzazioni, nel senso che più segmenti possono con<strong>di</strong>videre uno o più<br />

tratti (per esempio tutte le vocali saranno [+vocalico]). Quest’ultima proprietà è fondamentale poiché i<br />

fenomeni fonologici come anche i fenomeni sintattici interessano generalmente non tanto il singolo fonema o<br />

il singolo verbo, nome etc. ma classi <strong>di</strong> fonemi, nomi, verbi identificate dal fatto <strong>di</strong> con<strong>di</strong>videre una o più<br />

proprietà, cioè <strong>di</strong> appartenere ad una categoria. Quin<strong>di</strong> una teoria fonologica adeguata deve contenere una<br />

teoria dei tratti.<br />

Chomsky e Halle 1968 identificano il grado <strong>di</strong> complessità delle rappresentazioni col contenuto<br />

intrinseco dei tratti, nel senso che meno marcata è la configurazione associata a un segmento, minore sarà la<br />

sua complessità, stabilendo quin<strong>di</strong> un nesso fra complessità e naturalezza. formulata per mezzo <strong>di</strong><br />

‘convenzioni <strong>di</strong> marcatezza’. In base ad essa alle tre vocali fondamentali corrisponde la configurazione in<br />

tratti più naturale e preve<strong>di</strong>bile, data la natura dell’apparato articolatorio e del sistema percettivo, come<br />

specificato nella matrice in (17), dove ‘n=non marcato’, ‘m=marcato’.<br />

(17) a i u D N e o<br />

alto n n n n n m m<br />

basso n n n m m n n<br />

posteriore n - + m n - +<br />

arrotondato n n n n m n n<br />

peso 0 1 1 2 2 2 2


In (17) quin<strong>di</strong> [a] viene trattata come la vocale fondamentale, corrispondente ad una configurazione<br />

articolatoria interamente non marcata e preve<strong>di</strong>bile in mancanza <strong>di</strong> ulteriori determinazioni articolatorie. [i u]<br />

mettono in gioco la scelta tra [+posteriore] e [-posteriore], che le rende leggermente più complesse. Le vocali<br />

me<strong>di</strong>e richiedono ulteriori restrizioni fonetiche, che ne determinano il m<strong>agg</strong>ior grado <strong>di</strong> marcatezza/<br />

complessità. Possiamo contrapporre [i a u] con le altre vocali in quanto meno marcate, o non complesse.<br />

5.5. Le restrizioni combinatorie e la sillaba.<br />

Il contrasto fonetico fra C(onsonanti) e V(ocali) è riflesso dalla <strong>di</strong>versa <strong>di</strong>stribuzione delle C e delle V nelle<br />

sequenze <strong>di</strong> suoni corrispondenti alla parola e all’enunciato. Il susseguirsi <strong>di</strong> proprietà consonantiche e<br />

vocaliche lungo la stringa è governato sia da con<strong>di</strong>zioni <strong>di</strong> carattere universale sia da con<strong>di</strong>zioni relative a<br />

lingue specifiche. Le lingue naturali presentano restrizioni sulla <strong>di</strong>stribuzione delle proprietà fonologiche che<br />

<strong>di</strong>pendono da informazioni <strong>di</strong> carattere proso<strong>di</strong>co, che solo un modello teorico che integri i costituenti<br />

sillabici e la struttura metrica permette <strong>di</strong> esprimere in maniera adeguata. Tra<strong>di</strong>zionalmente, le restrizioni<br />

<strong>di</strong>stribuzionali dei segmenti e la sillabazione sono state espresse ricorrendo ad un or<strong>di</strong>namento gerarchico dei<br />

suoni in scale <strong>di</strong> sonorità. In esse i suoni vengono classificati sulla base del grado <strong>di</strong> sonorità, che<br />

corrisponde alla proprietà sillabica fondamentale. Un esempio <strong>di</strong> questo tipo <strong>di</strong> generalizzazione è la<br />

gerarchia in (18), inizialmente proposta da Jespersen e ripresa in Malmberg 1977 [1974]:214:<br />

(18) 1 Consonanti sorde<br />

occlusive<br />

fricative<br />

2 Occlusive sonore<br />

3 Fricative sonore<br />

4 Nasali e laterali<br />

5 Vibranti<br />

6 Vocali chiuse<br />

7 Vocali me<strong>di</strong>e<br />

8 Vocali aperte<br />

‘In questa teoria’ afferma Malmberg 1977 [1974] ‘la sillaba sarebbe definita come la <strong>di</strong>stanza fra due minimi<br />

<strong>di</strong> sonorità’. Gerarchie analoghe sono proposte da altri autori, ad es. in Bloomfield 1933 [1974]:138-139:<br />

In ogni successione <strong>di</strong> suoni alcuni colpiscono l'orecchio più energicamente <strong>di</strong> altri:..una V bassa, come [a], è più<br />

sonora <strong>di</strong> una alta, come [i]; qualunque vocale è più sonora <strong>di</strong> una consonante; una nasale, una vibrante o una laterale<br />

più <strong>di</strong> una occlusiva o <strong>di</strong> una spirante; una sibilante [s, z],...più <strong>di</strong> un'altra spirante; una spirante più <strong>di</strong> un'occlusiva; un<br />

suono sonoro più <strong>di</strong> uno sordo. In ogni successione <strong>di</strong> fonemi vi sarà perciò un'oscillazione <strong>di</strong> sonorità... Chiaramente<br />

alcuni fonemi sono più sonori dei fonemi (o del silenzio) che li seguono o precedono imme<strong>di</strong>atamente. Un fonema che<br />

sia più sonoro del fonema che lo precede ed anche contemporaneamente del fonema che lo segue è una cresta <strong>di</strong><br />

sonorità o un sillabico; gli altri fonemi sono non sillabici... Un enunciato ha tante sillabe quanti sono i sillabici...In ogni<br />

lingua solo alcuni fonemi possono comparire come sillabici<br />

In questo quadro la sillaba è concepita in maniera puramente lineare, come la <strong>di</strong>stanza fra due minimi <strong>di</strong><br />

sonorità. Il punto cruciale è che le concatenazioni <strong>di</strong> consonanti e vocali non sono un susseguirsi arbitrario <strong>di</strong><br />

suoni ma <strong>di</strong>pendono da restrizioni, in parte universali e in parte specifiche <strong>di</strong> singole lingue naturali. Quin<strong>di</strong><br />

non tutte le combinazioni sono ammesse o ugualmente <strong>di</strong>ffuse fra le lingue naturali.<br />

Jakobson, Fant e Halle 1952:13 mettono in opposizione la proprietà sillabica, <strong>di</strong> tipo proso<strong>di</strong>co, con<br />

le proprietà intrinseche ai fonemi in quanto definibile: ‘only with reference to a time series. A syllabic<br />

phoneme is opposed to the non-syllabic phonemes of the same syllable by a relative prominence. For the<br />

most part syllabicity is an exclusive function of the vowels...’. Inoltre, gli aspetti proso<strong>di</strong>ci della stringa<br />

comprendono anche l'accento, il tono e la lunghezza. Il contrasto fra entità che si succedono lungo l’asse<br />

temporale appare il pricipio fondamentale della struttura sillabica, come in<strong>di</strong>cato in (19):<br />

(19) i. la parte dominante della sillaba è il nucleo, usualmente consistente in una vocale;<br />

ii. i margini della sillaba contengono segmenti <strong>di</strong> qualità<br />

opposta a quella del nucleo, cioè consonanti;<br />

iii. alla vocale corrisponde la massima concentrazione <strong>di</strong><br />

energia, alla consonante la minima


Secondo Jakobson 1966 [1963]:110-111 ‘Questa polarità fra il minimo e il massimo <strong>di</strong> energia si presenta<br />

innanzitutto come un contrasto fra due unità successive: la consonante ottimale e la vocale ottimale. Si<br />

stabilisce così lo schema fonematico elementare, la sillaba. Poiché molte lingue ignorano le sillabe senza<br />

consonante prevocalica e/o con consonante postvocalica, l'unico modello sillabico universale è CV’.<br />

In Chomsky e Halle 1968, alla sillaba non è riconosciuto un preciso statuto. Le restrizioni sulle<br />

combinazioni possibili nella sequenza sono espresse dalle restrizioni <strong>di</strong> struttura <strong>di</strong> morfema. Ogni lingua ha<br />

restrizioni <strong>di</strong> questo tipo, ad es. il giapponese ammette che una sequenza inizi o finisca con una C al<br />

massimo, che non più <strong>di</strong> due consonanti possano occorrere insieme e in tal caso che le due C siano occlusive<br />

sorde identiche (geminate) o N+C. Al contrario l'inglese ammette fino a tre consonanti all'inizio, anche se tali<br />

nessi sono fortemente limitati: #tr è ammesso, non *#rt, #str è ammesso ma non *#rts. Le lingue restringono<br />

le possibilità combinatorie in nessi consonantici a una piccola parte delle possibili combinazioni dato<br />

l'inventario consonantico.<br />

In realtà le restrizioni <strong>di</strong> morfema falliscono, sostanzialmente per la ragione che il morfema è<br />

un’unità sintattica e quin<strong>di</strong> inadeguata ad esprimere generalizzazioni <strong>di</strong> tipo fonologico. Ad esempio, spesso<br />

i morfemi presentano sequenze inaccettabili in sequenze reali, cf. it. [+ndo] in [parl+a+ndo]. Analogamente<br />

il nesso finale <strong>di</strong> [parl+] non è un nesso ammesso in italiano. Ancora più cruciale è l'inadeguatezza mostrata<br />

dalle convenzioni <strong>di</strong> marcatezza sulle sequenze attese o preferite nelle lingue naturali in Chomsky e Halle<br />

1968:4<strong>04</strong>. Le convenzioni relative alle sequenze Consonante+Vocale riportate in (20) sono basate su<br />

considerazioni relative all'or<strong>di</strong>ne dei segmenti; in (20) ‘u’ significa ‘unmarked’, cioè ‘meno costoso, più<br />

naturale’, ‘+’ designa il confine <strong>di</strong> morfema, le parentesi graffe in<strong>di</strong>cano la <strong>di</strong>sgiunzione ‘o’. Così (20a) deve<br />

essere interpretata come ‘il segmento più naturale che ci possiamo aspettare alla destra <strong>di</strong> un confine <strong>di</strong><br />

morfema o <strong>di</strong> una vocale è una consonante’, mentre (20b) come ‘il segmento più naturale che ci possiamo<br />

aspettare alla desctra <strong>di</strong> una consonante è una vocale’.<br />

(20) a. [u cons] [+cons]/ { + } ____<br />

[+voc,-cons]<br />

b. [u voc] [+voc] / C__<br />

L'effetto <strong>di</strong> (20) è <strong>di</strong> oscurare le con<strong>di</strong>zioni che dovrebbero essere rappresentate. In base a (20a) infatti dopo<br />

un confine <strong>di</strong> morfema e dopo una vocale il valore non marcato <strong>di</strong> [consonantico] è quello <strong>di</strong> una vera<br />

consonante, [+consonantico]: quin<strong>di</strong> in una sequenza +CVCV le C sono i segmenti non marcati. In realtà la<br />

vera generalizzazione implicita in (20a) è che una C iniziale <strong>di</strong> sillaba è non marcata e non che vi siano due<br />

posizioni non marcate per C, nel senso che a stare a (20a) anche sequenze come CVC e CVC+CV, sono<br />

ugualmente non marcate, anche se il grado <strong>di</strong> marcatezza/ naturalezza è <strong>di</strong>verso a seconda che una C sia<br />

finale <strong>di</strong> sillaba o iniziale <strong>di</strong> sillaba. Possiamo supporre che il modo più adeguato <strong>di</strong> esprimere generalizzazioni<br />

fonotattiche sia ricorrere all'unità fonologica in cui si r<strong>agg</strong>ruppano i segmenti, cioè la sillaba. Ad<br />

esempio, Hooper 1976 mostra che, nel caso delle restrizioni sulle sequenze consonantiche iniziali dell'inglese<br />

la sillaba riesce ad esprimere le restrizioni rilevanti in maniera semplice ed elegante:<br />

(21) a. In inglese *tn non è ammesso all'inizio <strong>di</strong> parola, però alcune sequenze interne <strong>di</strong> tn<br />

sono accettabili: beatnik, sputnik<br />

b. In termini <strong>di</strong> struttura sillabica la restrizione è che #tn non è un nesso iniziale <strong>di</strong><br />

sillaba possibile, mentre è accettabile all'interno <strong>di</strong> parola perché t e n occorrono in<br />

sillabe separate beat$nik.<br />

Come notano molti autori (Goldsmith 1990, Harris 1994), le restrizioni combinatorie inducono ad attribuire<br />

struttura interna alla sillaba. È possibile esprimere infatti tali restrizioni nei termini <strong>di</strong> due costituenti,<br />

l'attacco e la rima. Ad es., nel caso dell'italiano standard, le possibilità combinatorie delle <strong>di</strong>fferenti unità<br />

segmentali possono essere schematizzate tenendo conto della loro posizione nell'attacco o nella rima, come<br />

in<strong>di</strong>cato in (22):<br />

(22) a. A b. R A<br />

!u !u !<br />

C ([+sonante]) V [C, α luogo <strong>di</strong> articolazione] [C, α luogo <strong>di</strong> art.]<br />

[+sonante, α luogo <strong>di</strong> art.] [C, α luogo <strong>di</strong> art.]<br />

[+continuo, +coronale, ß sonoro] [C, ß sonoro]


Sulla base <strong>di</strong> considerazioni <strong>di</strong> questo tipo uno schema <strong>di</strong> sillaba generalmente assunto <strong>di</strong>stingue due no<strong>di</strong>,<br />

l'attacco consonantico e la rima, che contiene la vocale, centro della sillaba. Data la restrizione<br />

comunemente accettata, che impone un carattere massimamente binario a attacco e rima, nel caso della rima<br />

le possibilità non marcate sono le due in (23):<br />

(23) a. σ b. σ<br />

3 3<br />

A R A R<br />

| | \ | | \<br />

C V V C V C<br />

Vi sono prove esterne a favore derll’esistenza della sillaba come unità della nostra conoscenza linguistica.<br />

Una delle prove empiriche a favore della struttura sillabica è fornita dagli errori <strong>di</strong> pronuncia, i lapsus. Infatti<br />

i suoni spostati rispettano la struttura sillabica; ad esempio in un caso <strong>di</strong> anticipazione del tipo carfiticio<br />

invece <strong>di</strong> cartificio (Miranda 1989:114), f si inserisce nella posizione sillabica originariamente riempita da t,<br />

e analogamente t riconosce la posizione <strong>di</strong> f. Questo conferma l’idea che la sillaba sia un costrutto<br />

appartenente alla nostra conoscenza linguistica innata, come del resto risulta evidente dal fatto che<br />

l’appren<strong>di</strong>mento iniziale della lettura e della scrittura ricorre proprio alla capacità del bambino <strong>di</strong> riconoscere<br />

le sillabe su base intuitiva. Altre prove <strong>di</strong> questo tipo vengono dai giochi linguistici . Un caso interessante è<br />

quello esaminato in Bertinetto 1987, che ha sottoposto ad alcuni parlanti un gioco basato sull’<strong>agg</strong>iunta a<br />

ciascuna delle sillabe <strong>di</strong> una parola, <strong>di</strong> due sillabe aperte con vocale identica a quella della sillaba iniziale.<br />

L’applicazione <strong>di</strong> questo gioco a parole con sillabe chiuse, del tipo <strong>di</strong> campo può fornire in<strong>di</strong>cazioni<br />

sull’intuizione del parlante in merito alla sillabazione, se cioè risulta intuitiva la sillabazione cam-po, che<br />

darebbe quin<strong>di</strong> camgasà-pogosò oppure la sillabazione ca-mpo. I risultati confermano la natura<br />

fondamentale della sillabazione cam-po, ma anche l’emergere <strong>di</strong> altre sillabazioni a conferma che la sillaba è<br />

innanzi tutto una struttura imposta, per così <strong>di</strong>re, dalla percezione del parlante sulla stringa fonetica<br />

(Ladefoged 1982).<br />

5.6. La sillaba come struttura.<br />

Nella catena fonica è possibile riconoscere sequenze <strong>di</strong> vocali e consonanti che si r<strong>agg</strong>ruppano in unità,<br />

chiamate sillabe. Le sillabe corrispondono a schemi <strong>di</strong> combinazioni possibili <strong>di</strong> consonanti e vocali e<br />

possono essere concepite come un costrutto fonologico interme<strong>di</strong>o fra il singolo segmento e l’enunciato, in<br />

maniera confrontabile ai costituenti sintattici . In questo senso la sillaba rappresenta il modo più adeguato <strong>di</strong><br />

esprimere generalizzazioni sull’or<strong>di</strong>ne reciproco dei suoni e sulle loro sequenze. Possiamo assegnare alla<br />

sillaba (σ) una struttura interna, che comprende due costituenti, la rima (R), inclusiva del nucleo vocalico (N)<br />

e <strong>di</strong> un’eventuale posizione consonantica, detta coda (Cd), e l’attacco (A), cioè la posizione consonantica che<br />

può precedere la rima. Alla base della sillaba vi è quin<strong>di</strong> l’assegnazione <strong>di</strong> consonanti e vocali a classi, in<br />

particolare alla classe degli elementi che possono essere inseriti nel nucleo (le vocali) e alla classe degli<br />

elementi che ricorrono nelle posizioni marginali rispetto al nucleo (consonanti). Se applichiamo questa<br />

analisi, le due forme fronte e gatto avranno le strutture in (24a) e (24b) rispettivamente.<br />

(24)<br />

a. σ σ b. σ σ<br />

3 3 3 3<br />

A R A R A R A R<br />

| \ | \ | | | | \ | |<br />

| \ N Cd | N | N Cd | N<br />

f r o n t e g a t t o<br />

Non tutti i tipi sillabici possibili sono ammessi nelle lingue naturali. In particolare mentre il tipo sillabico CV<br />

è il primo a comparire nel processo <strong>di</strong> acquisizione della lingua e si trova in tutte le lingue del mondo, le altre<br />

strutture sillabiche hanno una <strong>di</strong>ffusione più limitata. Le tipologie fondamentali possono essere in<strong>di</strong>cate<br />

come in (25) (Kaye e Lowenstamm 1981):<br />

(25) (i) Lingue che ammettono solo CV o V (maori, desano, etc.)<br />

σ σ


\ |<br />

C V V<br />

(ii) Lingue che ammettono, oltre al tipo (i) anche rime ramificanti ma non attacchi ramificanti (quechua,<br />

ungherese, wolof, etc.)<br />

σ<br />

3<br />

A R<br />

| | \<br />

C V C<br />

(iii) Lingue che ammettono oltre ai tipi (i) e (ii) anche attacchi ramificanti (inglese, polacco, fox, etc.)<br />

σ<br />

3<br />

A R<br />

| \ | \<br />

C C V C<br />

La variazione fra lingue riguarda anche i tipi <strong>di</strong> segmenti che possono ricorrere nei singoli costituenti. In<br />

particolare le sequenze coda+attacco presentano restrizioni. Molte lingue in questo contesto ammettono solo<br />

due consonanti identiche (geminate), come in gatto, o sequenze in cui la coda è una nasale che ha lo stesso<br />

luogo <strong>di</strong> articolazione della consonante attacco seguente, come in lampo, fronte, etc. Ad esempio, il<br />

giapponese limita a queste due combinazioni la sequenza coda+attacco. Altre lingue ammettono ulteriori<br />

combinazioni, come l’italiano, che presenta sequenze in cui in coda compare una liquida (l, r), come in<br />

parte, o s, come in pasta. Altre lingue ammettono anche sequenze <strong>di</strong> due ostruenti, come in latino factum<br />

‘fatto’, o in inglese capture ‘cattura’. D’altra parte, vi sono lingue che semplicemente escludono sillabe che<br />

finiscono in una consonante-coda. Un altro importante ambito <strong>di</strong> variazione riguarda la possibilità <strong>di</strong> avere<br />

una o più consonanti in posizione finale <strong>di</strong> parola; l’italiano, a parte alcune eccezioni, non ammette<br />

consonanti finali, mentre l’inglese come molte altre lingue ammette sia consonanti semplici, come in dog<br />

‘cane’, che sequenze, come in sand ‘sabbia’.<br />

Un interessante esempio <strong>di</strong> restrizione sulle sequenze coda+attacco è attestato dai <strong>di</strong>aletti sar<strong>di</strong><br />

campidanesi. Infatti in questi <strong>di</strong>aletti le parole che originariamente (ad esempio in latino) avevano la<br />

sequenza r/l+C, presentano oggi il segmento r all’interno dell’attacco, generalmente quello della sillaba<br />

tonica. Così troviamo [!bri<strong>di</strong>] ‘verde’, [!sudru] sordo, [!gruttsu] ‘corto’, [!drNmmu] ‘dormo’, [!proku] ‘porco’,<br />

[!drutRi] ‘dolce’, [!vratRi] ‘falce’, [!frummini] ‘fulmine’, etc. Avremo quin<strong>di</strong> strutture del tipo in (26)<br />

(26) σ σ<br />

3 3<br />

A R A R<br />

| \ | \ | |<br />

| \ N Cd | N<br />

d r N m m u<br />

Quin<strong>di</strong> queste varietà sarde hanno ridotto le possibili sequenze coda+attacco, alle serie nasale+C,<br />

consonante geminata, s+C, mentre non ammettono la sequenza liquida+C, presente invece in italiano come<br />

anche nei <strong>di</strong>aletti sar<strong>di</strong> settentrionali.<br />

5.7. I costituenti della sillaba: la rima<br />

In base all’analisi al paragrafo precedente, il nucleo e la coda sono r<strong>agg</strong>ruppati in un unico costituente, la<br />

Rima. Perciò una sequenza CVC sarà analizzata come C-VC. L’esistenza <strong>di</strong> un costituente Rima interno alla<br />

sillaba è motivata dal fatto che è la struttura interna della Rima, piuttosto che la sillaba nel suo complesso, a<br />

influenzare <strong>di</strong>versi fenomeni fonologici. In particolare, in molti sistemi fonologici l’assegnazione<br />

dell’accento tiene conto della <strong>di</strong>fferenza fra rima a una posizione (rima leggera) e rima a due posizioni (rima<br />

pesante). Per esempio in latino in una parola trisillaba, l'accento cade sulla terzultima vocale solo se la sillaba<br />

interme<strong>di</strong>a è breve (27a), mentre una penultima sillaba lunga, cioè con vocale lunga (27b) o coda<br />

consonantica (27c), attrae l'accento.<br />

(27) A R A R A R<br />

| | | /\ | /\


(a) c ò n fr i c o (b) c o n fl i i g o (c) c o n t i n g o<br />

‘strofino’ ‘combatto’ ‘tocco’<br />

Come mostra il confronto fra (27a) e (27 b), la presenza <strong>di</strong> un attacco complesso, cioè a due posizioni, non<br />

interagisce con l'assegnazione dell'accento, che tiene conto unicamente della struttura della rima. Ciò è vero<br />

anche nel caso in cui sia la sillaba finale ad avere un attacco complesso. La sillaba me<strong>di</strong>ana <strong>di</strong> (c), cioè –tin-,<br />

che include la rima a due posizioni –in- avrà l’accento; lo stesso vale per la sillaba me<strong>di</strong>ana -flii- in (b) che<br />

include una rima a due posizioni, entrambe vocaliche, -ii-. Il confronto fra (28a) e (28b) mette in luce il fatto<br />

che non è rilevante il numero <strong>di</strong> consonanti che intercorrono tra il nucleo me<strong>di</strong>ano e il nucleo della sillaba<br />

finale, ma il ruolo sillabico che rivestono. Infatti l'accento è bloccato sulla penultima non da una qualsiasi<br />

sequenza consonantica interme<strong>di</strong>a, bensì soltanto da una sequenza in cui una consonante è Coda <strong>di</strong> Rima:<br />

(28) A R A R<br />

| | | /\<br />

(a) c ò n s e c r o (b) c o n s e c t o r<br />

‘consacro’ ‘inseguo’<br />

Analogamente, la presenza delle due consonanti -fr- nell’attacco <strong>di</strong> (27a) non ha effetto nell’assegnazione<br />

dell’accento, che infatti si colloca sulla sillaba iniziale. Il punto cruciale quin<strong>di</strong> è lo status sillabico degli<br />

elementi coinvolti: in contingo il segmento –n <strong>di</strong> –tin- è la coda della rima –in, che essendo a due posizioni<br />

attira l’accento, mentre in consecro, in (25a) –cr- è l’attacco della sillaba finale mentre la rima della sillaba<br />

me<strong>di</strong>ana –se- è leggera, inclusiva cioè della sola posizione nucleo.<br />

Dati come quelli illustrati sono tipici dei sistemi sensibili alla quantità, che <strong>di</strong>stinguono cioè fra sillabe<br />

pesanti e sillabe leggere. Questi sistemi forniscono evidenza a favore dell’esistenza <strong>di</strong> due costituenti<br />

sillabici, Rima e Attacco, con statuto fonologico <strong>di</strong>verso. L’assegnazione dell’accento sulla base della<br />

struttura della rima della sillaba interme<strong>di</strong>a caratterizza molte lingue naturali. Ad esempio, la varietà araba<br />

del Cairo <strong>di</strong>stribuisce l’accento tenendo conto della restrizione per cui nei trisillabi una rima me<strong>di</strong>ana pesante<br />

prende l’accento, mentre una rima me<strong>di</strong>ana leggera lo lascia passare sulla terzultima. Gli esempi riportati in<br />

(29) illustrano questa <strong>di</strong>stribuzione, per cui una rima a due posizioni, V-V o V-C, trattiene l’accento, come<br />

in<strong>di</strong>cato in (29a, b).<br />

(29) Arabo del Cairo (da Kenstowicz 1994)<br />

a. garìida giornale<br />

fukàaha humor<br />

kinìisa chiesa<br />

b. Yakìtta giacchetta<br />

gawànti guanti<br />

fasùlya fagioli<br />

c. ªìnaba u grappolo<br />

ªàrabi arabo<br />

zàlata pietra<br />

La struttura della rima in molte lingue influenza anche la natura della vocale nucleo. Ad esempio in italiano i<br />

<strong>di</strong>ttonghi ie e uo, detti ascendenti, sono presenti unicamente se la rima non contiene una coda consonantica,<br />

come si vede dal confronto fra vengo in (<strong>30</strong>a) e viene in (<strong>30</strong>b):<br />

(<strong>30</strong>)<br />

a. σ σ b. σ σ<br />

3 3 3 3<br />

A R A R A R A R<br />

| | \ | | | N | |<br />

| N Cd | N | | \ | N<br />

v E N g o v i E n e<br />

(<strong>30</strong>a) caratterizza il contesto detto <strong>di</strong> sillaba chiusa, mentre (<strong>30</strong>b) caratterizza quello <strong>di</strong> sillaba aperta. Alcuni<br />

<strong>di</strong>aletti abruzzesi centrali presentano alternanza fra <strong>di</strong>ttongo <strong>di</strong>scendente in posizione aperta e vocale


semplice in posizione chiusa; così, a Tufillo troviamo esiti come [:paSS´] ‘pesce’ vs. [:sait´] ‘sete, come<br />

illustrato in (31a) e (31b):<br />

(31)<br />

a. σ σ b. σ σ<br />

3 3 3 3<br />

A R A R A R A R<br />

| | \ | | | N | |<br />

| N Cd | N | | \ | N<br />

p a S S ´ s a i t ´<br />

Le strutture in (31a,b) mettono in evidenza due restrizioni che affiorano in molte lingue naturali: (a) la Rima<br />

tonica deve essere a due posizioni, cioè pesante; (b) la Rima può contenere al massimo due posizioni. Così,<br />

nel <strong>di</strong>aletto <strong>di</strong> Tufillo nelle sillabe toniche prive <strong>di</strong> Coda consonantica, troviamo vocali lunghe o <strong>di</strong>ttonghi,<br />

come appunto in [:sait´] ‘sete’. D’altra parte, la restrizione (b) esclude un Nucleo complesso se è presente la<br />

Coda consonantica, come in (31a). La restrizione per cui <strong>di</strong>ttonghi o vocali lunghe sono ammesse solo in<br />

rime prive <strong>di</strong> coda consonantica non vale necessariamente; ad esempio in spagnolo, i <strong>di</strong>ttonghi ie e ue<br />

ricorrono anche in sillaba chiusa, cf [!hjDrro] hierro ‘ferro’, [!pwerta] puerta ‘porta’. Anche in inglese<br />

troviamo <strong>di</strong>ttonghi <strong>di</strong>scendenti in sillaba chiusa, cf. [!fain<strong>di</strong>M] fin<strong>di</strong>ng ‘scoperta’.<br />

6. Processi e regole fonologiche.<br />

Molti processi (cf. pf. 2) sono determinati dal contesto fonologico all’interno <strong>di</strong> sequenze (dette domini),<br />

corrispondenti alla parola o eventualmente a combinazioni <strong>di</strong> parole. Nel caso in cui due (o più) segmenti si<br />

influenzino, i segmenti rilevanti possono <strong>di</strong>ventare più simili (assimilazione) o possono <strong>di</strong>fferenziarsi<br />

(<strong>di</strong>ssimilazione). Il processo può coinvolgere segmenti a<strong>di</strong>acenti, come nel caso del pass<strong>agg</strong>io dal latino<br />

factu all’italiano fatto o al sardo fattu, in cui la seconda consonante assimila quella precedente, o dal latino<br />

cornu ‘corno’al sardo [!korru] in cui è la prima consonante ad assimilare quella seguente. L’assimilazione<br />

può anche interessare solo alcune delle proprietà <strong>di</strong> un segmento, come nel caso della sibilante<br />

preconsonantica, che in italiano è sonora o sorda a seconda della natura della consonante seguente, come in<br />

[!zbatto] ‘sbatto’ vs. [!spDMgo] ‘spengo’, o della nasale preconsonantica, in posizione coda, che si accorda col<br />

luogo <strong>di</strong> articolazione della consonante seguente, come in [!kampo] ‘campo’ vs. [!kanto] ‘canto’.<br />

I processi possono essere espressi per mezzo <strong>di</strong> regole fonologiche, cioè <strong>di</strong> formule che esprimono la<br />

<strong>di</strong>stribuzione delle proprietà fonologiche nei contesti rilevanti, cioè in rapporto alla struttura sillabica e in<br />

rapporto al contenuto fonologico <strong>di</strong> altri segmenti. Una regola fonologica comprende la Descrizione<br />

Strutturale, che in<strong>di</strong>vidua per mezzo dei tratti rilevanti la classe dei segmenti soggetti ad essa, il<br />

Cambiamento Strutturale, cioè il tratto o i tratti mo<strong>di</strong>ficati e il contesto, come in DS CS/ ___ X oppure<br />

X___. Ad esempio, l’assimilazione <strong>di</strong> sonorità delle sibilanti [s z] può essere espressa dalla regola (32):<br />

(32) [+coronale, +anteriore, -continuo] → [α sonoro]/ ___ [+consonantico, α sonoro]<br />

cioè, una fricativa coronale sarà [+sonoro] o [-sonoro] a seconda che la consonante seguente sia [+sonoro] o [-sonoro],<br />

dove α può essere ‘-’ o ‘+’.<br />

Una regola come (32), esprime una generalizzazione sulla <strong>di</strong>stribuzione delle proprietà fonologiche; essa<br />

riconosce nella sequenza i tratti della definiscono la classe naturale rilevante e il contesto e si applica<br />

introducendo le specificazioni che caratterizzano le stringhe fonetiche.<br />

Un tipo particolare <strong>di</strong> assimilazione al contesto è quella del tedesco (come <strong>di</strong> molte altre lingue), per<br />

cui in finale <strong>di</strong> parola una consonante altrimenti sonora <strong>di</strong>venta sorda, come nelle alternanze [hunt] hund<br />

‘cane’/[hund?] hunde ‘cani’, [!bi:g?n] biegen ‘piegare’/[bNk] (ich) bog ‘piegavo’. La regola rilevante<br />

esprimerà una restrizione <strong>di</strong> buona-formazione sulle sequenze per cui in finale <strong>di</strong> parola le vere consonanti<br />

non possono che essere [-sonoro], come in (33):<br />

(33) [+consonantico, -sonorante] → [-sonoro]/ ___ #<br />

dove # in<strong>di</strong>ca il confine <strong>di</strong> parola.


Un punto essenziale è che una teoria dei tratti fornisce uno strumento esplicativo <strong>di</strong> particolare importanza,<br />

capace <strong>di</strong> <strong>di</strong>stinguere processi naturali da processi non naturali in termini <strong>di</strong> semplicità e generalità della<br />

descrizione. In una fonologia priva <strong>di</strong> tratti è impossibile infatti catturare ed esprimere tramite l’apparato<br />

formale la <strong>di</strong>fferenza tra processi naturali, nei quali sono coinvolte classi naturali, e processi arbitrari. Il<br />

m<strong>agg</strong>iore grado <strong>di</strong> adeguatezza esplicativa <strong>di</strong> una fonologia che include la teoria dei tratti è <strong>di</strong>scusso in<br />

Chomsky, Halle (1968) sulla base <strong>di</strong> un confronto fra due modelli <strong>di</strong> fonologia. Ad esempio, assumiamo che<br />

una lingua abbia un processo che trasforma /k/ in /tR/ davanti a /i e/, come in (34a). In un modello privo <strong>di</strong><br />

tratti non vi sarebbe modo <strong>di</strong> <strong>di</strong>stinguere una regola naturale come (34a), che caratterizza un processo <strong>di</strong><br />

assimilazione, da una regola come (34b), innaturale. Dal punto <strong>di</strong> vista formale le due regole risultano infatti<br />

equivalenti; la naturalezza dell’assimilazione formalizzata in (34a) fa parte <strong>di</strong> ciò che sappiamo delle lingue<br />

ma non risulta catturata dal nostro modello teorico. Una fonologia che include la teoria dei tratti separa<br />

invece in maniera esplicita le due regole. Come in<strong>di</strong>cato in (34c), infatti [i e] formano la classe naturale delle<br />

vocali [-posteriore], caratterizzata appunto dal tratto con<strong>di</strong>viso; quest’ultimo tratto caratterizza inoltre l’esito<br />

della trasformazione, visto che [tR] è a sua volta [-posteriore]. Al contrario la regola arbitraria in (31b) non<br />

include una classe naturale, e per caratterizzare i due elementi che fanno scattare la regola bisogna elencare<br />

tutti i loro tratti, come in (34d)<br />

(34) a. k tR / __ {i e}<br />

b. ? k tR / __ {i p}<br />

c. k tR / __ [-posteriore]<br />

d. k tR /__ {[+vocalico, -consonantico, +sonorante, +alto, -basso, -posteriore], [-vocalico,<br />

+consonantico, -sonorante, +anteriore, -coronale, -alto, -posteriore, -continuo, -sonoro]}<br />

6.1. Processi a <strong>di</strong>stanza: la metafonia.<br />

La metafonia è un processo nel quale la vocale accentata anticipa alcune proprietà della vocale atona<br />

seguente (o finale <strong>di</strong> parola). Quin<strong>di</strong> si tratta <strong>di</strong> un processo che coinvolge due vocali generalmente<br />

<strong>di</strong>stanziate da consonanti. La metafonia influenza la <strong>di</strong>stribuzione delle vocali in molte lingue naturali.<br />

Consideriamo brevemente la metafonia delle varietà italiane, cioè il fenomeno <strong>di</strong> armonizzazione vocalica<br />

che anticipa sulla vocale tonica, testa del dominio <strong>di</strong> parola, le proprietà <strong>di</strong> grado <strong>di</strong> apetura <strong>di</strong> *-i e *-u<br />

originarie finali <strong>di</strong> parola (e, in alcuni <strong>di</strong>aletti, me<strong>di</strong>ane <strong>di</strong> proparossitono). Le con<strong>di</strong>zioni della metafonia<br />

mostrano una forte variazione: a parte i sistemi sar<strong>di</strong>, caratterizzati da un vocalismo a tre gra<strong>di</strong> <strong>di</strong> apetura,<br />

negli altri <strong>di</strong>aletti le vocali toniche interessate includono quasi sistematicamente le me<strong>di</strong>o-alte [e o], mentre<br />

le vocali me<strong>di</strong>o-basse [D N] e [a] metafonizzano in sottoinsiemi <strong>di</strong> varietà; in molte varietà l’antico contesto è<br />

andato perso visto che, a parte –a finale, le vocali atone finali nelle varietà del nord sono generalmente<br />

cadute e in molte varietà meri<strong>di</strong>onali si sono indebolite in una vocale centrale [?]; infine gli esiti fonetici<br />

della metafonia variano e interagiscono con le altre restrizioni fonologiche dei <strong>di</strong>versi sistemi. La metafonia<br />

è presente nei <strong>di</strong>aletti centro-meri<strong>di</strong>onali, sar<strong>di</strong> e settentrionali. Al contrario è assente nelle varietà toscane e<br />

corse. I sistemi metafonetici sono riconoscibili nonostante che in molte varietà siano parzialmente<br />

lessicalizzati e presentino trattamenti <strong>di</strong>fferenziati in rapporto alle <strong>di</strong>verse vocali toniche. In realtà nelle aree<br />

padane (varietà <strong>di</strong> tipo piemontese, emiliano e veneto) oggi appaiono generalmente soltanto sistemi residuali<br />

o in<strong>di</strong>zi <strong>di</strong> vocalismo metafonetico. Attualmente un’applicazione più sistematica della metafonia caratterizza<br />

i <strong>di</strong>aletti lombardo-alpini e i <strong>di</strong>aletti romagnoli; in questi ultimi la metafonia si applica alle vocali me<strong>di</strong>e<br />

originarie e a /a/ e riguarda tipicamente il maschile plurale del nome/<strong>agg</strong>ettivo e le forme verbali (2ps/p). Nel<br />

complesso, la <strong>di</strong>stribuzione del fenomeno appare desultoria e, anche se per ipotesi correlabile a tendenze<br />

fonologiche antiche, governata da fattori interni, interpretabili alla luce <strong>di</strong> restrizioni fonologiche <strong>di</strong><br />

grammatica universale.<br />

I dati in (35) illustrano i sistemi metafonetici nella varietà <strong>di</strong> Coimo (Val Vigezzo) in (35a), nella<br />

varietà <strong>di</strong> Stienta (Rovigo) in (35b) e nella varietà romagnola <strong>di</strong> Alfonsine in (35c).<br />

(35) a. Coimo<br />

[me:s]/[mi:s] “mese/i”, [»deu]/['<strong>di</strong>u] “<strong>di</strong>to/i”<br />

[pD]/[»pøi] “piede/i”, [vø:c]//[»vDca]/[vD:c] “vecchio/i//a/e”,<br />

[na»vu:t]/[na»vi:t] “nipote/i”, [nu:R]/[ni:R] “noce/i”<br />

[mørt]//[»mçrta]/[mçrt] “morto/i//a/e”, [pørk] “porco/i”,<br />

[ga:t]/[gD:t] “gatto/i”, [gra:s]/[grD:s]/[»grasa]/[gra:s] “grasso/i/a/e”


. Stienta<br />

[me:s]/[»mi:zi] “mese/i”, [nu»o:d]/[nu»u:<strong>di</strong>] “nipote/i”<br />

[»tevat]/[»tiv<strong>di</strong>] “tiepido/i”, [no:f]/[nu:i] “nuovo/i”<br />

[vo:t]/[»vu:<strong>di</strong>] “vuoto/i”<br />

c. Alfonsine<br />

[a bi:v]/[t bi:v]/[e be:v] “bevo/i/e”, [me:˛]/[mi:˛] “mese/i”,<br />

[a mi:d]/[t mi:d]/[e me:d] “mieto/i/e”,<br />

[nu»vo:d]/[nu»vu:d] “nipote/i”, [grN˛]/[gro˛]/[»grN˛æ] “grosso/i/a”,<br />

[gat]/[gDt] “gatto/i”<br />

Consideriamo infine due varietà centro-meri<strong>di</strong>onali. In varietà come quella abruzzese <strong>di</strong> Mascioni, la<br />

metafonia conserva il suo contesto fonetico in quanto le vocali atone finali sono pienamente realizzate,<br />

dando luogo ad alternanti nelle quali la vocale tonica è [e] o [o] se la vocale finale è –a, -e, -o, mentre è [i] o<br />

[u] rispettivamente se in posizione finale ci sono [i u]; nel caso delle vocali me<strong>di</strong>o-basse troviamo [D] o [N]<br />

toniche se la vocale finale è –a, -e, -o, [e] o [o] rispettivamente se in posizione finale ci sono [i u], come<br />

illustrato in (36a). I dati in (36b) illustrano le con<strong>di</strong>zioni della metafonia nella varietà <strong>di</strong> Cerignola, nella<br />

quale le alternanti metafonetiche ricorrono in contesti neutralizzati a seguito dell’indebolimento delle vocali<br />

atone finali originarie, per cui oggi in posizione finale ricorre unicamente [?]. La metafonia interagisce con<br />

un vocalismo tonico caratterizzato da una riorganizzazione timbrica sensibile alla struttura sillabica, nel<br />

quale a *e *a *o in sillaba aperta corrisponde l’esito [N]. Troviamo quin<strong>di</strong> una situazione opaca nella quale<br />

non vi è una connessione trasparente o regolare fra le proprietà delle due alternanti, nel senso che ad<br />

esempio, a [N] della base può corrispondere [?] da *e originario in (i), [i] da *D originario in (ii), [o]/ [u] da<br />

*o originario in (iii), [u] da *N originario in (iv). Le alternanti metafonetiche si <strong>di</strong>fferenziano in parte tra<br />

para<strong>di</strong>gma nominale e para<strong>di</strong>gma verbale; in particolare, la basi verbali con /a/ tonica presentano un esito<br />

metafonetico [i] alla 2ps, mentre le basi nominali con /a/ tonica non metafonizzano, come mostrato nel<br />

confronto fra forme verbali e nominali in (36b’).<br />

(36) a. Mascioni<br />

[»veta] / [»vitu] “<strong>di</strong>ta/ <strong>di</strong>to”, [»vejo] / [»viji] “(io) vedo/ (tu) ve<strong>di</strong>”<br />

[»vDcca] / [»vDcce] “vecchia / vecchie”, [»veccu] / [»vicci] “vecchio / vecchi”<br />

[»roRRa] / [»ruRRu] “rossa / rosso”, [»roRRe] / [»ruRRi] “rosse / “rossi”<br />

[»nou] / [»nNa] “nuovo / nuova”, [»noi] / [»nNe]“nuovi / nuove”<br />

b. Cerignola<br />

i. [»dDR?t?] / [»<strong>di</strong>R?t?] “<strong>di</strong>to/ <strong>di</strong>ti”, [krN:d?] / [kr?:d?] “(io) credo / (tu) cre<strong>di</strong>”<br />

[»mNs?] / [»m?:s?] “mese/ mesi”,<br />

ii. [»pN:t?] / [»pi:t?] “piede/ pie<strong>di</strong>”, [»dDnd?] / [»<strong>di</strong>nd?] “dente / denti”<br />

iii. [»nç:tR?] / [»n?:tR?] “noce/ noci”, [»kçrr?] / [»kurr?] “(io) corro/ (tu) corri”<br />

[»sord?] // [»sçrd?] “sordo/i // sorda/e”,<br />

iv. [»nu:v?] // [»nN:v?] “nuovo/i // nuova/e”, [»dNrm?] / [»durm?] “(io) dormo/ (tu) dormi”,<br />

b’. [»lN:v?] / [»li:v?] “(io) lavo/ (tu) lavi”, [kur»rN:v?] / [kur»ri:v?] ‘correvo/ correvi”<br />

cf. [kç:n?] ‘cane/i”<br />

6.2. La metafonia della varietà abruzzese <strong>di</strong> Mascioni: regole e derivazione.<br />

Ve<strong>di</strong>amo ora come analizzare le alternanze metafonetiche, limitandoci a sistemi nei quali il contesto fonetico<br />

è conservato, come appunto nel caso <strong>di</strong> Mascioni in (36a). Come abbiamo osservato, nella varietà <strong>di</strong><br />

Mascioni la vocale tonica anticipa le proprietà <strong>di</strong> grado <strong>di</strong> apertura della vocale seguente (metafonia).<br />

Troviamo infatti due tipi <strong>di</strong> alternanze, quella relativa alle vocali me<strong>di</strong>o-alte, che alternano con [i, u], e quelle<br />

relative alle vocali me<strong>di</strong>o-basse, che alternano con [e, o]. Il risultato è che [i, u] finali possono essere<br />

precedute da [i, u] o [e, o] toniche ma non da [D, N].<br />

Consideriamo le alternanze. Uno stesso elemento lessicale presenta [e] o [o] toniche se la vocale<br />

finale è –a, -e, -o, mentre presenta [i] o [u] rispettivamente se in posizione finale ci sono [i u], come in<strong>di</strong>cato<br />

negli esempi in (37):


(37) Mascioni<br />

v[e]ta “<strong>di</strong>ta” v[i]tu “<strong>di</strong>to”<br />

jok[e]a “(io) giocavo” jok[i] i “(tu) giocavi”<br />

v[e]jo “(io) vedo” v[i]ji “(tu) ve<strong>di</strong>”<br />

r[o]RRa “rossa” r[u]RRu “rosso”<br />

r[o]RRe “rosse” r[u]RRi “rossi”<br />

mond[o]ne “montone” mond[u]ni “montoni”<br />

r[o]ppo “(io) rompo” r[u]ppi “(tu) rompi”<br />

Uno stesso elemento lessicale presenta [D] o [N] toniche se la vocale finale è –a, -e, -o, mentre presenta [e] o<br />

[o] rispettivamente se in posizione finale ci sono [i u], come in<strong>di</strong>cato negli esempi in (38).<br />

(38) Mascioni<br />

s[D]rpa “serpe” s[e]rpi “serpi”<br />

d[D]nde “dente” d[e]n<strong>di</strong> “denti”<br />

v[D]Mgo “vengo” v[e]ngu “vengono”<br />

n[N]a “nuova” n[o]u “nuovo”<br />

n[N]e “nuove” n[o]i “nuovi”<br />

kr[N]po “(io) copro” kr[o]pi “(tu) copri”<br />

Per rendere conto <strong>di</strong> questa <strong>di</strong>stribuzione assumiamo che le rappresentazioni lessicali delle basi che<br />

alternano, in (37)-(38), hanno vocali toniche me<strong>di</strong>o-alte o me<strong>di</strong>o-basse, e che vi sono due regole <strong>di</strong> metafonia<br />

(RM 1) e (RM 2) che le convertono nelle alternanti metafonetiche corrispondenti, come in<strong>di</strong>cato in (39).<br />

(RM 1) converte [e o] in [i u] rispettivamente, mentre (RM 2) prende [D N] <strong>di</strong> base e le converte in [e o]<br />

rispettivamente:<br />

(39) Mascioni<br />

(RM 1) [+vocalico, -basso] --> [+alto] / __ X [+vocalico, +alto]<br />

(RM 2) [+vocalico, +basso] --> [-basso] / __ X [+vocalico, +alto]<br />

dove X è una variabile che sta per qualsiasi sequenza possibile, anche nulla, <strong>di</strong> consonanti.<br />

Si noti che (RM 2) crea contesti del tipo [:den<strong>di</strong>], [:noi], etc. a cui potrebbe essere applicata la regola (RM 1)<br />

dando esiti come *[:<strong>di</strong>n<strong>di</strong>], *[:nui], etc., che però sono non grammaticali. Dobbiamo pensare quin<strong>di</strong> che (RM<br />

1) e (RM 2) si applicano in un determinato or<strong>di</strong>ne (or<strong>di</strong>ne estrinseco) in modo tale che (RM 1) non possa<br />

applicarsi alle rappresentazioni generate da (RM 2). In altre parole (RM 1) sarà or<strong>di</strong>nata prima <strong>di</strong> (RM 2),<br />

come in<strong>di</strong>cato in (40). (40) schematizza la derivazione da una rappresentazione lessicale, corrispondente al<br />

livello soggiacente, a una rappresentazione <strong>di</strong> superficie, che fornisce le istruzioni all’apparato fonatorio per<br />

l’effettiva pronuncia della stringa. Mettiamo fra sbarrette oblique le rappresentazioni lessicali e fra parentesi<br />

quadre le rappresentazioni superficiali: assumiamo che le alternanti abbiano come punto <strong>di</strong> partenza un’unica<br />

base lessicale, /vet-/ e /krNp-/ in (40), e che le alternanti siano il risultato dell’applicazione delle due regole<br />

fonologiche <strong>di</strong> metafonia. Come si vede, nel caso <strong>di</strong> [:veta] ‘<strong>di</strong>ta’ e <strong>di</strong> [:krNpo] nessua delle due regole si<br />

applica, per cui la forma <strong>di</strong> superficie mantiene le proprietà fonologiche della forma <strong>di</strong> base.<br />

(40) /v e t / + / a / /v e t / + / a / /k r N p / + / o / /k r N p / + / i /<br />

[-alto] [+basso]<br />

RM 1 …………. i …………….. ……………...<br />

[+alto]<br />

RM 2 ………….. ………………… ……………... o<br />

[-basso]<br />

[:veta] [:vitu] [:krNpo] [:kropi]


Si noti che la scelta del contenuto fonologico delle basi lessicali tiene conto della complessiva <strong>di</strong>stribuzione<br />

delle vocali toniche del sistema. In particolare ve<strong>di</strong>amo che [i u] toniche ricorrono non solo davanti a [i u]<br />

finali ma anche in tutti gli altri contesti, per cui precedono anche [e a o], come ad esempio in (41)<br />

(41) Mascioni<br />

[kruDu] “crudo”<br />

[kruDa] “cruda”<br />

[kruDi] “cru<strong>di</strong>”<br />

[kruDe] “crude”<br />

[rijo] “rido”<br />

[riji] “ri<strong>di</strong>”<br />

Di conseguenza non possiamo pre<strong>di</strong>re a quali [i u] corrisponde un’alternante [e o] nei contesti con [e a o]<br />

finali, salvo elencare le forme con alternanza in una lista a parte. Al contrario, se assumiamo che le forme<br />

con alternanza hanno [e o] lessicali, possiamo derivare in maniera naturale ed elegante le alternanti con [i u].<br />

Analogamente, [e o] ricorrono in tutti i contesti, cioè sia davanti a [e a o] (cf. (37)), sia davanti a [i u] (cf.<br />

(38)). È quin<strong>di</strong> impossibile pre<strong>di</strong>re a quale alternanza corrispondono, se non elencando le forme. Anche in<br />

questo caso, attribuire alle forme <strong>di</strong> base il contenuto fonogico [+basso] permette una soluzione più semplice<br />

e naturale. In conclusione, come abbiamo già osservato nella <strong>di</strong>scussione precedente, sono criteri <strong>di</strong><br />

semplicità, eleganza e generalità che motivano una soluzione invece che un’altra.<br />

La metafonia <strong>di</strong> Mascioni mostra una caratteristica importante. Nelle parole con accento sulla<br />

terzultima sillaba (proparossìtoni), la vocale interme<strong>di</strong>a è trasparente, nel senso che la vocale tonica tiene<br />

conto unicamente della vocale finale, per cui se quest’ultima è [+alto], metaforizza, come nelle alternanze in<br />

(42):<br />

(42) Mascioni<br />

[:soretRe] “sorcio” [:suretRi] “sorci”<br />

[:olepe] “volpe” [:ulepi] “volpi”<br />

[:pDtteno] “pettino” [:petteni] “pettini”<br />

[:sNtRera] “suocera” [:sotReru] “suocera”<br />

Se la metafonia tenesse conto semplicemente della vocale imme<strong>di</strong>atamente seguente quella tonica, avremmo<br />

forme come [:olepi], [:pDtteni], etc. che invece sono agrammaticali. L’esistenza <strong>di</strong> vocali che non sono viste<br />

dai processi <strong>di</strong> armonizzazione vocalica, come appunto la metafonia, è attestata da numerosi sistemi<br />

fonologici. Questo suggerisce che i processi <strong>di</strong> armonizzazione tengono conto <strong>di</strong> proprietà proso<strong>di</strong>che della<br />

parola, in particolare del <strong>di</strong>verso status proso<strong>di</strong>co che hanno le vocali atone. Torneremo brevemente su<br />

questo punto. Per ora mo<strong>di</strong>fichiamo il contesto <strong>di</strong> (RM 1) e (RM 2) in (43) <strong>agg</strong>iungendo il contesto <strong>di</strong><br />

confine <strong>di</strong> parola in modo da restringere il contesto rilevante per la metafonia alla vocale finale della parola:<br />

(43) Mascioni<br />

(RM 1) [+vocalico, -basso] --> [+alto] / __ X [+vocalico, +alto]#<br />

(RM 2) [+vocalico, +basso] --> [-basso] / __ X [+vocalico, +alto]#<br />

6.3. La metafonia <strong>di</strong> una varietà sarda.<br />

Consideriamo il <strong>di</strong>aletto <strong>di</strong> Paulilàtino, nella Sardegna centrale. In questa varietà troviamo la <strong>di</strong>stribuzione<br />

delle vocali me<strong>di</strong>e toniche <strong>di</strong>pende dal grado <strong>di</strong> apertura della vocale finale: troviamo le me<strong>di</strong>o-basse [D N] se<br />

la vocale finale è [-alto] –a, -e, -o, le me<strong>di</strong>o-alte [e o] se la vocale finale è [+alto] –i, -u. Questa <strong>di</strong>stribuzione<br />

dà luogo ad un’alternanza per la quale uno stesso elemento lessicale presenta la tonica me<strong>di</strong>o-alta [e o]<br />

davanti a [i u] ma la tonica me<strong>di</strong>o-bassa [N D] negli altri contesti, come negli esempi in (44).


(44) Paulilàtino<br />

app[D]rdzo “(io) apro” app[e]ris “(tu) apri”<br />

b[D]ttsa “vecchia” b[e]ttsu “vecchio”<br />

b[D]ttsos “vecchie”<br />

b[D]ttsas “vecchie”<br />

f[N]rros “forni” f[o]rru “forno”<br />

k[N]rros “corni” k[o]rru “corno”<br />

z[N]lle “sole”<br />

Possiamo rendere conto della <strong>di</strong>stribuzione delle vocali toniche me<strong>di</strong>e [e D N o] asumendo che le<br />

rappresentazioni lessicali corrispondenti contengano la vocale me<strong>di</strong>o-bassa e che l’esito me<strong>di</strong>o-alto sia<br />

generato dalla regola (semplificata) (45). In (45) α è una variabile che può essere interpretata come ‘+’ o ‘-’;<br />

quin<strong>di</strong> per ‘+’ avremo [+posteriore, +arrotondato], cioè [o N], mentre per ‘-’ avremo [-posteriore, -<br />

arrotondato], cioè [D e], ma non [a], che ha valori opposti, cioè [+posteriore, -arrotondato].<br />

(45) [-alto, α posteriore, α arrotondato] → [-basso] / ___ X [+alto, -basso]<br />

dove [-alto, α posteriore, α arrotondato] in<strong>di</strong>vidua la classe delle vocali non alte ad esclusione <strong>di</strong> /a/, che<br />

infatti ha valori opposti per [posteriore] e [arrotondato], come si vede in (15); [-basso] caratterizza le vocali<br />

me<strong>di</strong>e come [e o] nel contesto <strong>di</strong> vocali [+alto, -basso], cioè [i u]. Un’altra soluzione consiste nell’assumere<br />

che le forme soggiacenti con vocali toniche [-alto, α posteriore, α arrotondato] non siano specificate per il<br />

tratto [basso], che aspetta <strong>di</strong> essere specificato a seconda della vocale che segue, come in (46), dove β = ±:<br />

(46) [-alto, α posteriore, α arrotondato] → [-β basso] / ___ X [β alto]<br />

Tenendo presente la tabella in (15), ve<strong>di</strong>amo che il valore ‘+’ <strong>di</strong> β, corrisponde a [+alto] e [-basso], mentre il<br />

valore ‘-’ <strong>di</strong> β corrisponde a [-alto] e [+ basso]; ne scaturisce quin<strong>di</strong> la <strong>di</strong>stribuzione delle vocali me<strong>di</strong>e<br />

toniche, che sono sempre [+basso] eccetto che quando precedono [i u], cioè le vocali [+alto]. La derivazione<br />

in (47) rende conto <strong>di</strong> questa <strong>di</strong>stribuzione: in (47) le vocali in maiuscolo sono prive della specificazione<br />

relative a [basso]:<br />

(47) Paulilàtino<br />

/ f O r r / + / o s / / f O r r / + / u /<br />

[basso] [-alto] [basso] [+alto]<br />

Reg (43) N o<br />

[:fNrros] [:forru]<br />

Si noti che in queste varietà alla destra <strong>di</strong> una consonante finale <strong>di</strong> parola in posizione finale <strong>di</strong> frase o <strong>di</strong><br />

sintagma viene inserita una vocale <strong>di</strong> appoggio, per cui in contesto finale <strong>di</strong> frase troviamo [:fNrrozo] ‘forni’.<br />

6.4. L’armonia vocalica.<br />

Altri processi <strong>di</strong> assimilazione vocalica hanno <strong>di</strong>rezione opposta alla metafonia, nel senso che è la vocale<br />

della base lessicale che influenza le proprietà vocaliche dei suffissi; si parla in questo caso <strong>di</strong> armonie. Un<br />

caso ampiamente analizzato e <strong>di</strong>scusso in letteratura è quello del turco, dove la vocale del suffisso si accorda<br />

con la vocale tonica della base lessicale. Ad esempio il morfema <strong>di</strong> plurale alterna fra due forme, cioè –lar se<br />

è preceduto da [u o a u] e –ler se è preceduto da [i y e o], come in [kol-lar] ‘braccia’, [kum-lar] ‘spi<strong>agg</strong>e’,<br />

[kap-lar] ‘recipienti’ rispetto a [el-ler] ‘mani’, [fil-ler] ‘elefanti’, etc. Inoltre le vocali alte si arrotondano se<br />

seguono una vocale arrotondata; quin<strong>di</strong> un suffisso con vocale alta è sensibile a entrambe le armonie, quella<br />

<strong>di</strong> timbro e quella <strong>di</strong> arrotondamento. Gli esempi in (48), relativi al plurale e alla flessione <strong>di</strong> accusativo,<br />

lessicalizzata da un elemento vocalico [+alto], illustrano questa <strong>di</strong>stribuzione delle proprietà vocaliche e le<br />

alternanze che ne sono determinate.


(48) turco<br />

singolare plurale accusativo singolare<br />

kol “braccio” kol-lar kol-u<br />

kuz “sorella” kuz-lar kuz-u<br />

kul “schiavo” kul-lar kul-u<br />

yel “vento” yel-ler yel-i<br />

g1l “mare” g1l-ler g1l-y<br />

<strong>di</strong>sh “dente” <strong>di</strong>sh-ler <strong>di</strong>sh-i<br />

gyl “rosa” gyl-ler gyl-y<br />

Possiamo spiegare questa <strong>di</strong>stribuzione nei termini <strong>di</strong> una generalizzazione sulle sequenze ben-formate, per<br />

cui sono ammesse solo vocali che si accordano con la vocale precedente (armonizzano) per il tratto<br />

[posteriore], e, nel caso delle vocali [+alto], anche per il tratto [arrotondato]. In (49) ricorriamo a due regole,<br />

delle quali (a) esprime l’armonia [± posteriore], mentre (b) esprime l’armonia [± arrotondato]. In entrambi i<br />

casi viene utilizzata l’abbreviazione per mezzo della variabile α, che introduce la scelta tra i due valori ‘+’ o<br />

‘-’; quin<strong>di</strong> ad esempio in (a) se la vocale che precede è [+posteriore] anche quella che segue sarà<br />

[+posteriore], mentre se quella che precede è [-posteriore] anche quella che segue sarà [-posteriore]. La<br />

regola (b) introduce la restrizione [+alto], per cui solo le vocali [+alto] saranno contesti possibili per<br />

l’armonia <strong>di</strong> arrotondamento.<br />

(49) a. [+vocalico] [α posteriore] / [+vocalico, αposteriore] X ___<br />

b. [+vocalico] [α arrotondato] / [+vocalico, α arrotondato] X ___<br />

[+alto]<br />

Consideriamo infine alcuni fenomeni nei quali le proprietà timbriche <strong>di</strong> una vocale si <strong>di</strong>ffondono, o, in altre<br />

parole, sono realizzate su una vocale seguente all’interno <strong>di</strong> un dominio che può includere combinazioni <strong>di</strong><br />

parole, come nel caso <strong>di</strong> contesti del tipo elemento clitico-nome/verbo.<br />

Il chamorro, lingua Austronesiana <strong>di</strong> Guam (Topping 1968) ha il sistema vocalico in (50):<br />

(50) chamorro<br />

[-posteriore] [+posteriore]<br />

[+alto] i u<br />

[-alto] e o<br />

[+basso ] æ a<br />

Quando una vocale della serie [-posteriore] precede una vocale della serie [+posteriore], quest’ultima cambia<br />

nella corrispondente [-posteriore] (cioè quella sulla sua stessa linea <strong>di</strong> sinistra), come negli esempi in (51).<br />

Come si vede i contesti sono creati dalla combinazione <strong>di</strong> formativi clitici, come l’articolo o il pronome<br />

personale, combinati con una categoria nominale o verbale.<br />

(51) chamorro<br />

gumë “casa” i gimë “la casa”<br />

tomu “coltello” i ‘temu “il coltello”<br />

lahi “maschio” i læhi “il maschio”<br />

tunu “conoscere” en tinu “tu conosci”<br />

La regola che esprime questo processo <strong>di</strong> assimilazione può essere formalizzata come in (52). In questo caso<br />

X può includere non solo una possibile sequenza consonantica ma anche un confine <strong>di</strong> parola.<br />

(52) chamorro<br />

[+vocalico] --> [-posteriore] / [+vocalico, -posteriore] X ___<br />

7. <strong>Fonologia</strong> proso<strong>di</strong>ca. Il Piede.<br />

Ci possiamo aspettare che il contenuto fonologico dei segmenti sia influenzato dalla struttura proso<strong>di</strong>ca della<br />

parola, cioè dalla sua organizzazione in gruppi <strong>di</strong> sillabe, detti Pie<strong>di</strong>, e dalla posizione dell’accento. In<br />

letteratura si assume che i Pie<strong>di</strong> includano normalmente due sillabe, con sillaba forte (accentata) a sinistra, e<br />

sono costruiti partendo dall’ultima sillaba <strong>di</strong> destra; l’accento <strong>di</strong> parola cade sulla sillaba forte del piede più a<br />

destra della parola. Se confrontiamo la struttura proso<strong>di</strong>ca delle parole perde in (53a) e perdete in (53b)


ve<strong>di</strong>amo che in questo secondo caso, la sillaba per è inclusa in un piede ridotto; risulta perciò debole mentre<br />

l’accento cade sulla sillaba <strong>di</strong> sinistra del piede.<br />

(53) a. Parola b. Parola<br />

| / |<br />

Piede Piede Piede<br />

| \ | | \<br />

σ σ σ σ σ<br />

pDr de per de te<br />

In italiano la struttura proso<strong>di</strong>ca della parola governa l’occorrenza delle vocali me<strong>di</strong>o-basse [D N], nel senso<br />

che [D N] sono ammesse solo in posizione accentata, mentre in posizione debole troviamo solo vocali<br />

me<strong>di</strong>oalte, [e o]. Così, [!pDrde] perde in (53a) alterna con [per!dete] perdete in (53b); il nucleo della base<br />

lessicale è [D] quando è in posizione tonica <strong>di</strong> parola, come in (53a), ma è [e] nell’alternante <strong>di</strong> 2pp in cui<br />

l’accento è sul piede a destra.<br />

7.1. La struttura proso<strong>di</strong>ca della frase.<br />

Possiamo estendere un’analisi simile anche alla successione <strong>di</strong> parole che formano una frase. E’ la sillaba<br />

accentata della parola più a destra della frase a mostrare le proprietà intonazionali più rilevanti della frase,<br />

cioè le mo<strong>di</strong>ficazioni più sensibili dell’andamento melo<strong>di</strong>co. L’organizzazione accentuale (o proso<strong>di</strong>ca) della<br />

frase può essere espressa nei termini <strong>di</strong> restrizioni simili a quelle viste per la parola, assumendo cioè che la<br />

sillaba forte della frase coincide con la sillaba forte più a destra, come in (54), dove ogni ‘x’ corrisponde ad<br />

un’unità <strong>di</strong> peso melo<strong>di</strong>co, sostanzialmente ad una sillaba, e ai livelli ‘piede’, ‘parola’, ‘frase’ vengono<br />

proiettate solo le sillabe forti. Il risultato è che in (54) la sillaba forte <strong>di</strong> ciascun livello ha una ‘x’ in più della<br />

sillaba forte del livello imme<strong>di</strong>atamente più basso. Si noti che elementi come gli articoli e i pronomi clitici,<br />

tipicamente atoni, sono integrati nel piede alla loro destra, come in<strong>di</strong>cato in (54).<br />

(54) x frase<br />

x x parola<br />

x x piede<br />

x x x x x sillaba<br />

lo ve de do po<br />

Vi sono lingue in cui certe caratteristiche qualitative della vocale tonica si manifestano solo in<br />

corrispondenza della sillaba forte <strong>di</strong> frase, dotata <strong>di</strong> m<strong>agg</strong>iore durata ed energia articolatoria. Ad esempio in<br />

certe varietà abruzzesi, come quella <strong>di</strong> Tufillo, in cui la vocale tonica <strong>di</strong> parola è <strong>di</strong>ttongata, il <strong>di</strong>ttongo è<br />

ristretto alla posizione forte <strong>di</strong> frase. Vi è quin<strong>di</strong> alternanza fra forma priva <strong>di</strong> <strong>di</strong>ttongo in posizione interna <strong>di</strong><br />

frase come in (55a) e forma con <strong>di</strong>ttongo come in (55b):<br />

(55) a. x b. x frase<br />

x x x parola<br />

x x x piede<br />

x x x x x x x sillaba<br />

l? kN tR? Fo l? kDu tR?<br />

‘lo cuocio io’ ‘lo cuocio’<br />

7.2. Processi fonosintattici e domini proso<strong>di</strong>ci<br />

I processi il cui contesto è creato dalla combinazione <strong>di</strong> due (o più) parole è detto fonosintattico. Un esempio<br />

<strong>di</strong> questo tipo è, in italiano, il Raddoppiamento Fonosintattico, cioè il rafforzamento della consonante iniziale<br />

<strong>di</strong> parola se preceduta o da una parola con accento sull’ultima sillaba (ossitona) o da una classe <strong>di</strong> forme<br />

specializzate, comprendenti alcuni monosillabi come è, ha, se, etc. e infine dove, come. Così emergono<br />

alternanze del tipo vengo [s]ubito rispetto a verrò [ss]ubito, quando [v]anno? rispetto a dove [vv]anno?, ecc.<br />

Le varietà sarde presentano numerosi processi fonosintattici. Uno <strong>di</strong> questi è la lenizione, cioè la<br />

sonorizzazione delle ostruenti intervocaliche, con indebolimento nel caso delle occlusive. Ad esempio ad<br />

Orroli alle forme [!pDrdu] ‘perdo’, [áus !pDrdu] ‘li perdo’ con [p] iniziale, corrisponde [áu !ADrdu] ‘lo perdo’<br />

con fricativa bilabiale [A] quando /p/ è preceduta da una vocale. Assumeremo che la forma <strong>di</strong> base è /pDrd-/ e<br />

che l’esito sonoro e fricativo [A] sia dovuto ad una regola <strong>di</strong> lenizione. In effetti, le ostruenti all’interno <strong>di</strong>


parola sono ugualmente lenite, cf. [o!Aerizi] ‘(tu) apri’. Questo processo può essere quin<strong>di</strong> interpretato da una<br />

regola come (56), che esprime il fatto che qualsiasi ostruente in contesto intervocalico, sia <strong>di</strong> parola che<br />

fonosintattico, è [+sonoro] e [+continuo].<br />

(56) [-sonorante] [+sonoro, +continuo] / V(#) __ V<br />

dove (#) in<strong>di</strong>ca il confine <strong>di</strong> parola presente nei soli contesti fonosintattici.<br />

La sensibilità all’organizzazione proso<strong>di</strong>ca della frase può influire sui processi fonosintattici, limitandoli<br />

all’interno <strong>di</strong> certi domini proso<strong>di</strong>ci, come i cosiddetti sintagmi fonologici, cioè gruppi <strong>di</strong> parole<br />

generalmente corrispondenti ad un sintagma, ma bloccandoli quando il contesto è formato dalla<br />

combinazione <strong>di</strong> due sintagmi fonologici. Questa possibilità affiora per esempio nel caso <strong>di</strong> processi <strong>di</strong><br />

assimilazione attestati in alcuni <strong>di</strong>aletti sar<strong>di</strong>, in cui l’assimilazione avviene solo all’interno <strong>di</strong> sintagma<br />

fonologico, mentre è esclusa o comunque è meno naturale nei contesti creati dalla combinazione <strong>di</strong> due<br />

sintagmi. Ad Orroli /s/ finale e /f/ iniziale si assimilano dando luogo alla realizzazione /RR/, e creando<br />

alternanze del tipo [!femminaza] ‘donne’ vs. [i R!Reminaza] ‘le donne’, [!fainti] ‘fanno’ vs. [áu R!Rainti] ‘li<br />

fanno’. Il meccanismo fonologico può essere espresso per mezzo <strong>di</strong> due regole, (57a) che converte /s/ in /S/ e<br />

(57b) che converte /f/ in /S/ nei contesti in cui è preceduta da /S/.<br />

(57)<br />

a. [+anteriore,+coronale+continuo] [-coronale, -anteriore,+alto]/__ # [+anteriore, -coronale, -sonoro]<br />

b. [+anteriore,-coronale,-sonoro] [-coronale, -anteriore]/ [-anteriore,-coronale, +continuo, -sonoro] # __<br />

Però l’assimilazione è generalmente esclusa in sequenze come [!issuzu !vainti ait!tRi] ‘loro fanno così’.<br />

Questa <strong>di</strong>fferenza, per cui –s finale <strong>di</strong> /iss-u-s/ non fa scattare l’assimilazione, mentre –s finale <strong>di</strong> /is/ ‘i/le’,<br />

/á-u-s/ ‘li’ la fa scattare, può essere spiegata sulla base della <strong>di</strong>versa struttura proso<strong>di</strong>ca dei due contesti.<br />

Mentre la combinazione articolo+nome o clitico+verbo formano un unico dominio proso<strong>di</strong>co, come in<br />

(58a), la combinazione SN+SV dà luogo a due <strong>di</strong>stinti domini proso<strong>di</strong>ci in<strong>di</strong>cati in (58b) dalle parentesi<br />

quadre, a cavallo dei quali l’assimilazione non si realizza:<br />

(58) a. x b. x frase<br />

x x x parola<br />

x x x piede<br />

x x x x x x x x x sillaba<br />

[is fe mi nas] [kus sus] [fa in ti]<br />

‘le donne’ ‘loro fanno...<br />

8. Tratti, regole e processi: il modello autosegmentale.<br />

Gli esempi <strong>di</strong>scussi nei paragrafi precedenti, mettono in luce alcuni importanti punti teorici in merito allo<br />

status e alla natura dei tratti fonologici:<br />

I <strong>di</strong>versi processi e quin<strong>di</strong> le regole che en rendono conto interessano generalmente un sottoinsieme<br />

dei tratti. Ad esempio, la metafonia in 6.1 e 6.2 riguarda le proprietà <strong>di</strong> grado <strong>di</strong> apertura e coinvolge<br />

quin<strong>di</strong> i soli tratti [alto, basso], <strong>di</strong>sinteressandosi degli altri tratti vocalici. L’armoni del turco rigarda<br />

le sole proprietà <strong>di</strong> localizzazione e <strong>di</strong> arrotondamento, mentre non influenza le proprietà <strong>di</strong> grado <strong>di</strong><br />

apertura. L’in<strong>di</strong>viduazione dei tratti sono trova quin<strong>di</strong> conferma in quanto sono visti da processi<br />

fonologici.<br />

Inoltre, i processi coinvolgono tratti fra <strong>di</strong> loro imparentati, cioè quegli insiemi <strong>di</strong> tratti che<br />

corrispondono a specifici meccanismi articolatori. Quin<strong>di</strong>, ad esempio, nel caso delle vocali,<br />

l’insieme [alto, basso] è il target <strong>di</strong> fenomeni che interagiscono con il grado <strong>di</strong> apertura; [posteriore]<br />

e eventualmente [arrotondato] sono coinvolti dai fenomeni che influenzano il luogo <strong>di</strong> articolazione.<br />

Analogamente, nel caso delle consonanti, troviamo fenomeni che interessano unicamente le<br />

proprietà glottidali [sonoro] (cf. (32), (33)), o il modo <strong>di</strong> articolazione, [continuo], o infine il luogo <strong>di</strong><br />

articolazione (cf. (22)).<br />

Queste considerazioni suggeriscono che una teoria che mette insieme i <strong>di</strong>versi tipi <strong>di</strong> tratti in<br />

rappresentazioni comuni non esprime adeguatamente il fatto che i tratti corrispondono a proprietà<br />

con status <strong>di</strong>verso e a processi autonomi. Un modello più adeguato <strong>di</strong> fonologia dovrebbe catturare


l’autonomia dei singoli tratti o degli insiemi <strong>di</strong> tratti associati ad una stessa proprietà fonologica,<br />

assegnando loro rappresentazioni separate.<br />

Una risposta a questi problemi è fornita dal modello autosegmentale, la cui proprietà fondamentale consiste<br />

nel separare il contenuto fonologico dei segmenti dalle posizioni della sequenza fonetica alle quali il<br />

contenuto stesso è associato, e nel separare su piani (tier) <strong>di</strong>versi i <strong>di</strong>versi tipi <strong>di</strong> proprietà fonologiche. Il<br />

formato autosegmentale delle rappresentazioni fonologiche estende ai <strong>di</strong>versi contenuti fonologici l’analisi<br />

originariamente applicata ai fenomeni <strong>di</strong> tipo tonale. Vi sono lingue parlate in <strong>di</strong>verse regioni della terra,<br />

nelle quali le singole parole o sillabe sono caratterizzate da particolari proprietà <strong>di</strong> altezza melo<strong>di</strong>ca, dette<br />

toni. Ad esempio il cinese è una lingua a toni. I toni sono stati trattati come caratteristiche si sovrappongono<br />

al contenuto fonologico dei segmenti, collocandosi su un proprio livello <strong>di</strong> rappresentazione autonomo. Kaye<br />

(1989), esemplifica questo punto riprendendo alcuni interessanti fenomeni <strong>di</strong>scussi in letteratura:<br />

• In Igbo, una lingua parlata in Nigeria, la sillaba finale dei nomi può avere un tono alto H, in<strong>di</strong>cato<br />

dall’accento acuto sulla vocale, o un tono basso L, in<strong>di</strong>cato dall’accento grave sulla vocale. Se<br />

precedono una parola che comincia con un tono L, il tono H <strong>di</strong>venta <strong>di</strong>scendente HL, in<strong>di</strong>cato<br />

dall’accento circonflesso sulla vocale, come in (59).<br />

(59) àdhâ cì àkhwá ‘Adha porta uova’; pronunciato in isolamento, il nome àdhá finisce con un tono alto.<br />

Kaye (1989) osserva che una regola del tipo in (60a), che rende conto dell’assimilazione, non è<br />

<strong>di</strong>stinguibile dalla regola arbitraria in (60b). Nuovamente si pone il problema <strong>di</strong> esprimere tramite i<br />

<strong>di</strong>spositivi formali forniti dal modello teorico i processi naturali separandoli da quelli non naturali.<br />

(60) a. … H # L … … HL # L<br />

b. … L # L … … HL # L<br />

La soluzione è fornita da una rappresentazione più ricca, che assegna alle proprietà tonali un livello<br />

<strong>di</strong> rappresentazione specializzato, autonomo rispetto al contenuto fonologico dei segmenti, come in<br />

(61).<br />

(61) H H L L H<br />

| | / | | |<br />

adha ci akhwa<br />

In (61) i toni sono collocati su una linea che si sovrappone a quella dei segmenti; la restrizione<br />

fondamentale richiede che ogni tono sia associato almeno ad un segmento. La formazione <strong>di</strong> un tono<br />

<strong>di</strong>scendente HL risulta perciò dal fatto che il tono L iniziale si associa alla vocale precedente, per cui<br />

se questa è associata nella sua rappresentazione lessicale con un tono H, ne deriva il tono HL, come<br />

appunto in<strong>di</strong>cato in (61). Se la vocale è associata a un tono L, la propagazione <strong>di</strong> L alla sua sinistra<br />

non porta a nessun cambiamento percepibile.<br />

• I dati <strong>di</strong> un’altra lingua africana a toni, il Lomongo, appartenenente alla famiglia bantu,<br />

esemplificano un altro tipo <strong>di</strong> fenomeno, cioè la persistenza <strong>di</strong> un tono anche nei contesti in cui la<br />

vocale a cui era associato viene cancellata. In particolare, se due vocali vengono a trovarsi a<strong>di</strong>acenti,<br />

la più a sinistra è cancellata e il suo tono è ere<strong>di</strong>tato dalla vocale a destra. (62a) presenta una<br />

sequenza <strong>di</strong> due vocali …o a… a seguito della cancellazione <strong>di</strong> b iniziale; in questo contesto la<br />

vocale finale della prima parola, o, viene cancellata e il tono corrispondente si associa alla vocale<br />

seguente, che così <strong>di</strong>venta a doppio contorno, come in (62b).<br />

(62) a. L H H L H H H<br />

| | | | / | |<br />

balongo a k a e ‘il suo libro’<br />

b. L H H L H H H<br />

| | \ | / | |<br />

balong a k a e


• Kaye (1989) mostra, infine, che questi comportamenti caratterizzano anche le proprietà fonologiche<br />

(i tratti) che formano il contenuto timbrico dei segmenti. L’esempio <strong>di</strong>scusso da Kaye è quello della<br />

lingua africana della famiglia Kru, il Vata, parlato in Africa occidentale. Il Vata presenta due serie <strong>di</strong><br />

vocali: [+ATR] e [-ATR], dove ATR (Advanced Tongue Root) in<strong>di</strong>ca la presenza/ assenza <strong>di</strong> una<br />

configurazione articolatoria nella quale la ra<strong>di</strong>ca della lingua si spinge in avanti, dando luogo a un<br />

contrasto simile a quello tra vocali più o meno alte e tese. Avremo perciò la serie [-ATR], [i e a o u],<br />

e la serie [+ATR], [I E A O U] (stando alla trascrizione <strong>di</strong> Kaye (1989)). All’interno del dominio <strong>di</strong><br />

parola tutte le vocali sono armonizzano per il tratto [ATR], come in lete ‘ferro’, golu ‘canoa’, mEnA<br />

‘naso’, kOsU ‘fuoco’, etc. La <strong>di</strong>stribuzione <strong>di</strong> questo tratto può essere spiegata assumendo che la<br />

specificazione [-ATR] sia assegnata come specificazione <strong>di</strong> ‘default’ a tutte le vocali non specificate<br />

a livello lessicale per questo tratto; altrimenti le vocali saranno associate al tratto [+ATR] a livello<br />

lessicale. Possiamo trattare [+ATR] come un autosegmento, che si colloca su una linea autonoma<br />

rispetto a quella degli altri contenuti fonologici, e che si associa a tutte le vocali <strong>di</strong> una parola, come<br />

suggerito in (63):<br />

(63) [+ATR]<br />

| \<br />

k o s u<br />

I suffissi, in quanto non lessicalmente specificati per il tratto [ATR], prenderanno la specificazione<br />

[ATR] dell’elemento lessicale: se quest’ultimo non è specificato per tale tratto, tutta la sequenza<br />

apparirà come [-ATR]; se la base lessicale è [+ATR], questo tratto si assocerà anche al suffisso,<br />

come in (64), dove –lo è il suffisso <strong>di</strong> passivo.<br />

(64) [+ATR]<br />

| \<br />

l i l o ‘essere mangiato’<br />

L’autosegmento [+ATR] si può inoltre espandere anche alla sillaba finale <strong>di</strong> una parola alla sua<br />

sinistra, comenel caso dei pronomi soggetto, che appariranno come [+/-ATR] a seconda delle<br />

proprietà del verbo seguente, come in (65). In (65a) troviamo la forma [+ATR], con <strong>di</strong>ffusione del<br />

tratto; in (65b), dove il verbo non è specificato per [ATR], viene inserita la specificazione [-ATR] su<br />

entrambi gli elementi.<br />

(65) a. [+ATR]<br />

| \<br />

O l E ‘egli mangia’<br />

b. o l a ‘egli chiama’<br />

In Vata una vocale non alta si assimila a quella seguente che <strong>di</strong>venta lunga. Nei contesti nei quali un<br />

pronome oggetto segue un verbo, la vocale non alta del verbo si assimila a quella del pronome, come<br />

negli esempi in (66). Se il verbo è [+ATR] questo tratto risulta perso, nel senso che la vocale lunga<br />

realizzata ne è priva, come in<strong>di</strong>cato in (66b):<br />

(66) a. zo+i zii ‘mettili’ b. nO+i nii ‘ascoltali’<br />

zo+z zaa ‘mettilo’ nO+a naa ‘ascoltalo’, etc.<br />

È interessante notare, che il tratto [+ATR] si comporta come i toni, nel senso che anche se la vocale a<br />

cui era associato lessicalmente è stata cancellata, rimane <strong>di</strong>sponibile e può assicarsi ad una vocale<br />

che si trovi nel suo dominio. Così, i pronomi soggetto che precedono queste forme verbali varieranno<br />

tra [-ATR] e [+ATR] a seconda che la vocale lessicale del verbo fosse [-ATR] o [+ATR]. In<br />

particolare, le sequenze soggetto-verbo [-ATR] in (67a) e soggetto-verbo [-ATR]-pronome oggetto in<br />

(67b) esemplificano un contesto [-ATR]. Le sequenze corrispondenti in (67c) e (67d) esemplificano<br />

un contesto in cui il verbo è [+ATR].


(67) a. o zaa ‘egli lo mette’ b. o zo ‘egli mette’<br />

c. [+ATR] d. [+ATR]<br />

/ | /<br />

O nO ‘egli ascolta’ O n aa ‘egli lo ascolta’<br />

In (67d) l’elemento [+ATR], a seguito del processo <strong>di</strong> assimilazione in (66), è rimasto staccato dalla<br />

vocale del verbo alla quale era lessicalmente associato; tuttavia, esattamente come i toni, è in grado<br />

<strong>di</strong> associarsi ad un ospite <strong>di</strong>sponibile, in questo caso la vocale del pronome soggetto alla sinistra del<br />

verbo.<br />

La conclusione <strong>di</strong> Kaye è che anche il contenuto segmentale degli elementi fonologici possa essere<br />

trattato negli stessi termini delle proprietà tonali. In altre parole, la rappresentazione autosegmentale<br />

può essere estesa a tutte le proprietà fonologiche, uniformando così la maniera <strong>di</strong> rappresentare le<br />

proprietà fonologiche delle sequenze fonetiche. Inoltre, un teoria fonologica che include la<br />

rappresentazione autosegmentale permette una spiegazione più adeguata in particolare dei fenomeni<br />

<strong>di</strong> <strong>di</strong>ffusione e <strong>di</strong> armonizzazione all’interno <strong>di</strong> domini come la parola o il gruppo clitico.<br />

8.1. Le rappresentazioni fonologiche in un formato autosegmentale.<br />

Nelle rappresentazioni fonologiche autosegmentali le proprietà <strong>di</strong> tipo quantitativo, cioè la durata <strong>di</strong> un<br />

segmento, sono espresse separatamente dalle proprietà <strong>di</strong> tipo qualitativo, cioè il contenuto melo<strong>di</strong>co del<br />

segmento (i tratti che lo definiscono). Questi due <strong>di</strong>versi tipi <strong>di</strong> proprietà sono rappresentati su livelli (tier)<br />

<strong>di</strong>stinti, come in<strong>di</strong>cato in (68):<br />

(68) x x x x livello delle unità temporali/ossatura<br />

| | | |<br />

l a n a livello melo<strong>di</strong>co<br />

In (69) ogni unità melo<strong>di</strong>ca è associata ad una posizione sull'asse temporale. Questa separazione permette <strong>di</strong><br />

trattare in maniera in<strong>di</strong>pendente i fenomeni <strong>di</strong> durata e i fenomeni relativi al contenuto segmentale. In<br />

particolare la lunghezza vocalica o consonantica risulta interpretata come l'associazione <strong>di</strong> un unico<br />

contenuto segmentale a due posizioni temporali. (69a) rappresenta una vocale breve, (69b) una vocale lunga:<br />

(69) a. x b. x x<br />

| \ /<br />

a a<br />

Ci possiamo attendere inoltre che vi sia la possibilità <strong>di</strong> un'unità temporale associata a due unità melo<strong>di</strong>che.<br />

Le strutture <strong>di</strong> questo tipo, dette 'a contorno', caratterizzano ad es. le affricate e i <strong>di</strong>ttonghi ascendenti, come<br />

in (70):<br />

(70) x<br />

/ \<br />

w a<br />

L'associazione delle unità melo<strong>di</strong>che con le posizioni temporali esprime la coincidenza temporale fra le due<br />

unità. Poiché l'or<strong>di</strong>ne lineare delle posizioni dell'ossatura rappresenta un or<strong>di</strong>ne <strong>di</strong> precedenza nel tempo, sarà<br />

impossibile l'associazione fra un'unità melo<strong>di</strong>ca e un'unità temporale se si interpone un'altra associazione fra<br />

un'unità <strong>di</strong> tempo e un'unità melo<strong>di</strong>ca. Risulta esclusa quin<strong>di</strong> in via <strong>di</strong> principio una rappresentazione nella<br />

quale due linee <strong>di</strong> associazione si intersecano, come in (71):<br />

(71) * x x x<br />

| | /<br />

| / |<br />

x x


La rappresentazione autosegmentale pre<strong>di</strong>ce quin<strong>di</strong> l'esistenza <strong>di</strong> due tipi <strong>di</strong> processi: (i) il <strong>di</strong>stacco<br />

('delinking') <strong>di</strong> un'unità melo<strong>di</strong>ca dalla posizione cui è associata, (72a); (ii) la <strong>di</strong>ffusione o propagazione<br />

('sprea<strong>di</strong>ng') del contenuto segmentale a una posizione temporale contigua, (72b):<br />

(72) a. x x x x x b. x x x x x<br />

| | + | | | | \ | |<br />

l a c t e l a t e<br />

8.2. Il trattamento autosegmentale dei fenomeni <strong>di</strong> armonizzazione e propagazione.<br />

Esaminiamo brevemente altri fenomeni <strong>di</strong> armonia vocalica. Le lingue bantu (parlate nell’Africa a sud del<br />

Sahara) presentano un tipo <strong>di</strong> armonia vocalica che separa le vocali me<strong>di</strong>e dalle altre, come si vede dagli<br />

esempi in (73) relativi al chichewa. Questa armonia emerge sia in sequenze vocaliche interne alla base<br />

lessicale in (73a), sia in particolare nelle forme che combinano una base lessicale (ad esempio un verbo) con<br />

suffissi <strong>di</strong> tipo aspettuale, <strong>di</strong> voce, etc. in<strong>di</strong>cati in (73b) come causativo e applicativo. Questi ultimi alternano<br />

fra una vocale me<strong>di</strong>a e una vocale alta a seconda della vocale della base verbale. Nel caso in cui la base<br />

verbale ha la vocale tonica [a], come in (73c), il suffisso selezionato ha vocalismo [+alto], come quin<strong>di</strong> nei<br />

contesti nei quali la base verbale ha una vocale tonica [i u]. Questo suggerisce che [a] è opaca, cioè non è<br />

rilevante per l’armonia, e che in presenza <strong>di</strong> [a] viene inserito il valore meno marcato per [alto], cioè [+alto]<br />

(cf. (17)).<br />

(73) chichewa<br />

a. futuk-a ‘cedere’ fotokoz-a ‘spiegare’<br />

uzir-a ‘rinfrescare’ kolez-a ‘soffiare sul fuoco’<br />

b. base verbale V- causativo- V- applicativo-<br />

pind-a ‘curvare’ bind-its-a bind-il-a (applicativo)<br />

put-a ‘provocare’ put-its-a put-il-a<br />

lemb-a ‘scrivere’ lemb-ets-a lemb-el-a<br />

konz-a ‘correggere’ konz-ets-a konz-el-a<br />

c. bal-a ‘dare origine’ bal-its-a bal-il-a<br />

La <strong>di</strong>stribuzione in (73) può essere espressa per mezzo <strong>di</strong> una regola del tipo in (74), che esclude le vocali<br />

[+basso] dal processo <strong>di</strong> armonia. La regola ha <strong>di</strong>versi punti deboli: non in<strong>di</strong>vidua quale proprietà si<br />

<strong>di</strong>ffonde, e è costretta a in<strong>di</strong>viduare la classe delle vocali armoniche tramite il ricorso ad una specificazione<br />

negativa [-basso].<br />

(74) [-basso] [α alto] / [α alto, -basso] X ___<br />

Una soluzione più adeguata consiste nel ricorrere alla sottospecificazione, cioè a rappresentazioni che<br />

mancano della specificazione dei tratti altrimenti derivabile per mezzo delle restrizioni <strong>di</strong> ridondanza in (75)<br />

che attribuiscono i valori non marcati a [alto] a rappresentazioni lessicali sottospecificate per questo tratto.<br />

(75a) assegna il valore [-alto] a una vocale specificata a livello lessicale [+basso] e (75b) assegna il valore<br />

[+alto] negli altri casi.<br />

(75) a. [+basso] [-alto]<br />

b. [ ] [+alto]<br />

Le vocali me<strong>di</strong>e sono specificate come [-alto] a livello lessicale, per cui il sistema vocalico delle<br />

rappresentazioni lessicali sarà caratterizzato come in (76), dove, salvo le vocali [-alto], nelle altre il valore <strong>di</strong><br />

[alto] è specificato da (75a,b):<br />

(76) i e a o u<br />

alto - -<br />

basso - - + - -<br />

posteriore - - + + +


Assumiamo inoltre che il tratto armonico, che si <strong>di</strong>ffonde alle vocali sottospecificate alla sua destra, è [-alto],<br />

come in (77a). In questo contesto infatti il suffisso è sottospecificato per [alto] e vi si associa il valore [-alto]<br />

della vocale me<strong>di</strong>a della base lessicale, dando le vocali armonizzate e…e/ o…o. Le specificazioni [+alto] che<br />

emergono in (77b) e (77c) sono invece determinate dalle regole <strong>di</strong> ridondanza in (75): nel caso <strong>di</strong> (77b) viene<br />

inserita la specificazione [+alto] in base a (75b); nel caso <strong>di</strong> (77c) /a/ assume [-alto] in virtù <strong>di</strong> (75a) mentre<br />

la vocale del suffisso prende [+alto] in virtù <strong>di</strong> (75b).<br />

(77) chichewa (da Harris 1994).<br />

[-alto] [+alto] [+alto]<br />

| p | |<br />

a. l e m b e l a b. p u n d i l a<br />

| | | |<br />

[-basso] [-basso] [-basso] [-basso]<br />

[-post] [-post] [+post] [-post]<br />

[-alto] [+alto]<br />

| |<br />

c. b a l i l a<br />

| |<br />

[+basso] [-basso]<br />

[+post] [-post]<br />

Come si vede, le regole in (77) hanno un formato <strong>di</strong>verso rispetto alle precedenti, chiamato autosegmentale.<br />

Esso prevede infatti che ogni tratto sia rappresentato su un livello autonomo, dal quale può associarsi a una o<br />

più posizioni segmentali, in<strong>di</strong>cate qui dai simboli dei segmenti.<br />

Fenomeni <strong>di</strong> propagazione da sinistra a destra sono documentati anche da molte varietà lucane e<br />

calabresi settentrionali. Ad esempio a Saracena (CS) /a/ tonica in sillaba aperta riproduce il tratto<br />

[+posteriore] della [u] che ricorre nella sillaba precedente. Emergono alternanze interne <strong>di</strong> parola, come in<br />

(78a), dove i dati <strong>di</strong> confronto mostrano la realizzazione [E:] della vocale tonica dei formativi <strong>di</strong> 1pp e <strong>di</strong><br />

imperfetto in<strong>di</strong>cativo; inoltre, alla [E:] tonica <strong>di</strong> una base lessicale corrisponde [ç:] nei domini formati dalla<br />

combinazione <strong>di</strong> articolo-nome e <strong>di</strong> pronome clitico-verbo, dove l’articolo o il clitico includono [u], come in<br />

(78b). Come si vede dai dati <strong>di</strong> confronto in (78b), ad *a originaria in sillaba chiusa corrisponde [a], mentre<br />

in sillaba aperta corrisponde un esito anteriorizzato e lungo, [E:]; è in questi ultimi contesti che invece <strong>di</strong> [E:]<br />

ricorre [ç:] se il nucleo della sillaba precedente è [u]. Lo stesso effetto <strong>di</strong> un contesto <strong>di</strong> sillaba chiusa lo ha<br />

anche il contesto in cui la vocale tonica è in una sequenza proparossitona, come in<strong>di</strong>cato nuovamente negli<br />

esempi <strong>di</strong> confronto in (78b)<br />

(78) Saracena<br />

a. [stu:tç:m´] ‘(noi) spengiamo’<br />

[stu:tç:v´] ‘(io) spengevo’<br />

cf. [ca:mE:m´] ‘(noi) chiamiamo’<br />

[ca:mE:v´] ‘(io) chiamavo’<br />

b. [:pD:n?] ‘pane’ [u :pN:n?] ‘il pane’<br />

[:nD:s?] ‘naso’ [u :nN:s?] ‘il naso’<br />

[:fD:j?] ‘(tu) fai’ [u :fN:j?] ‘lo fai’<br />

[a :FrE:p´] ‘la apro’ [u :Frç:p´] ‘lo apro’<br />

cf. [u/ a :fatts´] ‘lo/ la faccio’<br />

[u/ a :laA´s´] ‘lo/ la lavi’<br />

Posiamo rendere conto <strong>di</strong> questo fenomeno ricorrendo ad una rappresentazione <strong>di</strong> tipo autosegmentale, come<br />

quella adottata in (76). Rappresentiamo la vocale interessata come [x]. Possiamo pensare infatti che /a/ sia<br />

specificata a livello <strong>di</strong> rappresentazione lessicale bome [+basso], mentre i valori [+posteriore, -arrotondato]<br />

sono introdotti da una restrizione <strong>di</strong> ridondanza come proprietà non marcate (cf. (17)), salvo che non siano<br />

mo<strong>di</strong>ficati da regole fonologiche. In particolare in posizione aperta, troviamo un esito anteriorizzato [E:] e,


nei contesti della propagazione, come in (79a), il suo contenuto fonologico riproduce quello della vocale [u]<br />

della sillaba precedente (propagazione). La struttura sillabica suggerita in (77a) in<strong>di</strong>ca che le proprietà del<br />

Nucleo si <strong>di</strong>ffondono in<strong>di</strong>pendentemente dal fatto che sia breve o lungo (due posizioni). Al contrario sel il<br />

Nucleo è nel dominio <strong>di</strong> una Rima a due posizioni, con Coda consonantica, come in (79b), la propagazione è<br />

bloccata e /a/ si realizza come [a], con le specificazioni non marcate. La propagazione è quin<strong>di</strong> sensibile alla<br />

struttura sillabica e, in particolare, il dominio formato da una Rima chiusa da una Coda rappresenta una<br />

barriera per la propagazione; funziona cioè come un’isola non penetrabile da parte del processo.<br />

(79) Saracena<br />

a. N N<br />

[+arrot] ↔ [+arrot]<br />

[+post] [+post]<br />

| | \<br />

x f x x j ´<br />

| | /<br />

[+alto] [+basso]<br />

b. N<br />

[+arrot] R<br />

[+post] N \<br />

| | \<br />

x f x t ts ´<br />

| |<br />

[+alto] [+basso]<br />

Il modello autosegmentale, proprio in quanto separa le <strong>di</strong>verse componenti fonologiche degli elementi dalle<br />

posizione lungo l’ossatura temporale della sequenza, permette <strong>di</strong> trattare in maniera più semplice e adeguata<br />

i fenomeni che interagiscono con la struttura proso<strong>di</strong>ca della parola. Ad esempio in (42)-(43) abbiamo visto<br />

che a Mascioni la metafonia non vede la vocale me<strong>di</strong>a interme<strong>di</strong>a nei proparossitoni, per cui abbiamo<br />

alternanti come [:olepe] ‘volpe’ / [:ulepi] ‘volpi’. In (80) la vocale tonica iniziale, testa del dominio<br />

proso<strong>di</strong>co <strong>di</strong> parola, prende come posizione <strong>di</strong>pendente la vocale interme<strong>di</strong>a a livello <strong>di</strong> piede, e governa<br />

<strong>di</strong>rettamente la vocale finale del proparossitono, legittimando su quest’ultima il tratto [+alto].<br />

(80) Mascioni<br />

N⎯⎯⎯⎯⎯⎯⎯<br />

| |<br />

N ⎯⎯ N N<br />

| | |<br />

x x x<br />

| e<br />

[+alto] e<br />

9. Recenti proposte nel quadro della teoria fonologica.<br />

La fonologia della reggenza (Government Phonology) è stata proposto da Kaye 1986/87, Kaye,<br />

Lowenstamm e Vergnaud 1990. Questo modello include il formato autosegmentale delle rappresentazioni, la<br />

teoria dei costituenti proso<strong>di</strong>ci, il principio <strong>di</strong> conservazione della struttura. Questo modello assume un<br />

arrangiamento non-lineare, nel quale le rappresentazioni fonologiche registrano su livelli <strong>di</strong>stinti le proprietà<br />

<strong>di</strong> tempo (posizioni o slot) e il contenuto autosegmentale ad esse associato; inoltre prevede che le posizioni,<br />

in<strong>di</strong>cate con x in (61), siano integrate in costituenti sillabici, per ipotesi al massimo binari, cioè A(ttacco) e<br />

R(ima); quest’ultima è inclusiva del N(ucleo), come in (81).<br />

(81) A R R<br />

| \ | \ |<br />

x (x) N \ N<br />

| \ | \<br />

x x x x


Possiamo pensare ai costituenti come proiezioni delle proprietà melo<strong>di</strong>che associate alla posizione testa: al<br />

nucleo corrisponde il contenuto melo<strong>di</strong>co <strong>di</strong> tipo vocalico, cioè dotato <strong>di</strong> m<strong>agg</strong>ior grado <strong>di</strong> sonorità; al<br />

contrario, all'attacco corrisponde il contenuto <strong>di</strong> tipo consonantico della sua testa. La testa ottimizza queste<br />

proprietà. A questo punto, se il rapporto fra la testa e i costituenti nucleo e attacco appare chiaro, meno<br />

evidente risulta la relazione fra testa nucleare e costituente rima. Notiamo infatti che la posizione esterna al<br />

nucleo, che possiamo in<strong>di</strong>care come coda, non con<strong>di</strong>vide la natura vocalica del nucleo. Possiamo pensare<br />

quin<strong>di</strong> che il nodo rima rappresenti il secondo livello <strong>di</strong> proieErrore. Il segnalibro non è definito.zione<br />

della testa nucleare; rispetto ad esso la posizione coda costituirà quin<strong>di</strong> una posizione <strong>agg</strong>iunta. Ciò spiega<br />

l'autonomia della coda rispetto alle proprietà fonologiche del nucleo.<br />

Come suggeriscono Kaye, Lowenstamm e Vergnaud 1990, un costituente è il dominio <strong>di</strong> una relazione<br />

asimmetrica fra due posizioni, una testa e un elemento retto. Due con<strong>di</strong>zioni definiscono tale relazione: (i) la<br />

località stretta, cioè le posizioni devono essere a<strong>di</strong>acenti; (ii) la <strong>di</strong>rezionalità stretta, cioè la testa deve essere<br />

a sinistra. Il carattere massimamente binario dei costituenti sillabici risulta quin<strong>di</strong> derivato da questi due<br />

requisiti. Un costituente a tre posizioni infatti sarebbe in contrasto o col requisito <strong>di</strong> a<strong>di</strong>acenza o con quello <strong>di</strong><br />

<strong>di</strong>rezionalità. Infine, il carattere 'testa' <strong>di</strong> una posizione all'interno <strong>di</strong> un attacco o <strong>di</strong> un nucleo appare<br />

collegato, come vedremo meglio, alla sua autonomia fonologica, cioè alla capacità <strong>di</strong> ammettere il m<strong>agg</strong>ior<br />

numero <strong>di</strong> <strong>di</strong>stinzioni fonologiche. La capacità fonologica delle posizioni rette risulta invece ristretta e<br />

determinata dalla testa.<br />

I trattamenti <strong>di</strong> tipo metrico assumono che ogni posizione deve essere legittimata all’interno <strong>di</strong><br />

un’unità proso<strong>di</strong>ca <strong>di</strong> livello superiore che la include (con<strong>di</strong>zione <strong>di</strong> proso<strong>di</strong>c licensing ‘legittimazione<br />

proso<strong>di</strong>ca’; cf. Kaye 1986/87, Itô 1989, Goldsmith 1990). La gerarchia rilevante, prevede che il piede<br />

comprenda <strong>di</strong> norma due sillabe; la parola e i domini superor<strong>di</strong>nati includono uno o più pie<strong>di</strong>. Ciascuna<br />

proiezione definisce il dominio <strong>di</strong> una testa, dove la testa legittima le posizioni deboli (rette) nel dominio. In<br />

particolare, mentre all'interno <strong>di</strong> un costituente sillabico la testa è a sinistra, nel caso delle proiezioni <strong>di</strong><br />

or<strong>di</strong>ne più elevato la testa è a destra o a sinistra sulla base <strong>di</strong> una variazione <strong>di</strong> tipo parametrico. Nelle varietà<br />

romanze, la posizione forte (tonica) del piede è il nucleo <strong>di</strong> sinistra, mentre quella <strong>di</strong> parola coincide col<br />

nucleo forte del piede più a destra. La con<strong>di</strong>zione <strong>di</strong> ‘proso<strong>di</strong>c licensing’ ha l’effetto <strong>di</strong> escludere materiale<br />

non legittimato dalla struttura proso<strong>di</strong>ca (Kaye 1986/87, Itô 1989); <strong>di</strong> conseguenza il contenuto fonologico<br />

associato ad una posizione può essere realizzato solo se è incorporato nella struttura proso<strong>di</strong>ca (Itô 1989,<br />

Goldsmith 1990, Archangeli e Pulleyblank 1994). Kaye 1986/87, Kaye 1990, Kaye, Lowenstamm e<br />

Vergnaud 1990, assumono un principio <strong>di</strong> conservazione della struttura proso<strong>di</strong>ca più restrittivo (Projection<br />

principle) in forza del quale “Governing relations established at the level of lexical representation are<br />

maintained at all levels o representation” (Kaye 1986/87: 138). Di conseguenza le alternanze <strong>di</strong> forma<br />

fonetica che emergono nelle stringhe fonologiche non possono essere derivate tramite processi <strong>di</strong><br />

eliminazione o <strong>agg</strong>iunta <strong>di</strong> materiale fononologico alla rappresentazione lessicale, o tramite processi <strong>di</strong><br />

risillabazione. Se i processi fonologici ammessi dalle lingue naturali sono processi che conservano la<br />

struttura, i fenomeni <strong>di</strong> sincope/ epentesi e le restrizioni sulle consonanti finali che caratterizzano molte<br />

lingue naturali (inclusi i <strong>di</strong>aletti italiani settentrionali qui esaminati) non potranno essere riportati a<br />

sillabazioni <strong>di</strong> volta in volta <strong>di</strong>verse. In particolare, in accordo con Charette 1990, 1991, Kaye 1990, Harris<br />

1992, assumiamo che le consonanti che precedono un contesto <strong>di</strong> sincope o si trovano in posizione finale non<br />

appartengono alla rima precedente ma sono attacchi seguiti da un nucleo debole (nucleo vuoto) che avrà<br />

interpretazione fonetica a seconda delle caratteristiche proso<strong>di</strong>che del contesto.<br />

Assumere nuclei non realizzati ma computati dalla struttura sillabica ci permette <strong>di</strong> attribuire lo<br />

statuto <strong>di</strong> attacco alle consonanti nei contesti <strong>di</strong> sincope o finali <strong>di</strong> parola. Questo trattamento spiega perché<br />

in questi contesti è ammesso l’intero inventario consonantico della lingua, a <strong>di</strong>fferenza <strong>di</strong> quanto ci<br />

aspetteremmo se questi fossero contesti sillabici <strong>di</strong> ‘coda’, che, come è noto in letteratura, sono generalmente<br />

ristretti. Questo quadro interpretativo infine so<strong>di</strong>sfa il Projection Principle, in quanto la presenza <strong>di</strong> un<br />

nucleo soggiacente rende <strong>di</strong>sponibile una struttura sillabica invariata in<strong>di</strong>pendentemente dal fatto che le<br />

consonanti si realizzino nella sequenza fonetica in contesti <strong>di</strong> sincope e finali <strong>di</strong> parola.<br />

9.1. Il principio <strong>di</strong> legittimazione e la struttura proso<strong>di</strong>ca.<br />

La relazione fra le posizioni comprese in un costituente sillabico rappresenta un'applicazione particolare <strong>di</strong><br />

un requisito generale <strong>di</strong> buona formazione sulle rappresentazioni fonologiche che richiede che ciascun<br />

segmento <strong>di</strong> una stringa sia legittimato ('licenziato') in quella posizione. In base a tale requisito, formulato ad<br />

es. come licenziamento proso<strong>di</strong>co in Goldsmith 1990, ogni segmento è parte <strong>di</strong> un'unità strutturale che lo


include. Più generalmente, tutte le unità fonologiche sono incluse esaustivamente in una struttura proso<strong>di</strong>ca<br />

<strong>di</strong> livello più alto. A tale proposito sarà utile in<strong>di</strong>care che una gerarchia dei costituenti proso<strong>di</strong>ci prevede<br />

almeno i domini in (82) (cf. Itô 1989, Goldsmith 1990, Harris 1992, 1994)<br />

(82) sintagma fonologico/gruppo clitico<br />

parola fonologica<br />

piede<br />

costituente sillabico<br />

posizione temporale<br />

Possiamo assumere che una relazione analoga a quella che intercorre fra testa e posizione retta all'interno <strong>di</strong><br />

un costituente valga anche fra posizioni incluse in proiezioni <strong>di</strong> livello più alto. In questa prospettiva<br />

ciascuna proiezione definisce il dominio <strong>di</strong> una testa, dove la testa legittima la posizione recessiva nel<br />

dominio. Esten<strong>di</strong>amo inoltre alla relazione <strong>di</strong> legittimazione i due requisiti <strong>di</strong> località e <strong>di</strong> <strong>di</strong>rezionalità: la<br />

legittimazione vale fra posizioni a<strong>di</strong>acenti e presenta una <strong>di</strong>rezione definita. Possiamo quin<strong>di</strong> riformulare il<br />

principio <strong>di</strong> licenziamento proso<strong>di</strong>co nel modo in<strong>di</strong>cato in (83):<br />

(83) In un dominio tutte le unità fonologiche devono essere legittimate salvo una, la testa del dominio.<br />

Le relazioni <strong>di</strong> legittimazione sono locali e <strong>di</strong>rezionali.<br />

In particolare, mentre la relazione fra testa e posizione retta all'interno <strong>di</strong> un costituente è fissa con testa a<br />

sinistra, nel caso delle proiezioni <strong>di</strong> or<strong>di</strong>ne più elevato la relazione <strong>di</strong> legittimazione ha testa a destra o a<br />

sinistra sulla base <strong>di</strong> una variazione <strong>di</strong> tipo parametrico. Un'intuizione implicita nella teoria dei costituenti<br />

sviluppata in Harris 1992, 1994 è che il contenuto segmentale <strong>di</strong> una posizione sia un riflesso delle sue<br />

proprietà proso<strong>di</strong>che. In altre parole l'interpretabilità fonetica <strong>di</strong> una posizione <strong>di</strong>pende dalla possibilità <strong>di</strong><br />

essere legittimata all'interno della struttura proso<strong>di</strong>ca. Possiamo pensare che anche il contenuto segmentale<br />

associato ad una posizione sia legittimato esattamente come qualsiasi altra unità integrata nella<br />

rappresentazione. Chiameremo questo tipo <strong>di</strong> relazione legittimazione autosegmentale; mentre con<br />

legittimazione proso<strong>di</strong>ca in<strong>di</strong>cheremo il meccanismo per cui ogni unità deve appartenere ad un'unità <strong>di</strong><br />

livello più alto.<br />

Infine, osserviamo che nel quadro della fonologia della 'reggenza' i nuclei sono associati a uno specifico<br />

livello <strong>di</strong> proiezione che costituisce il punto <strong>di</strong> partenza per i costrutti metrici <strong>di</strong> piede e <strong>di</strong> parola fonologica.<br />

L'esistenza <strong>di</strong> un livello <strong>di</strong> proiezione nucleare risulta in<strong>di</strong>pendentemente motivato sulla base <strong>di</strong> fenomeni<br />

<strong>di</strong>versi, peraltro fra <strong>di</strong> loro collegati: (i) le relazioni <strong>di</strong> prominenza accentuale coinvolgono unicamente le<br />

proprietà del nucleo; (ii) i nuclei sono interessati da processi <strong>di</strong> armonizzazione all'interno <strong>di</strong> un dominio<br />

proso<strong>di</strong>co. In entrambi i casi le posizioni consonantiche non sono viste dai processi rilevanti. (84) illustra la<br />

struttura della gerarchia proso<strong>di</strong>ca. La testa della rappresentazione è la posizione non legittimata ad ogni<br />

livello: nel caso del dominio <strong>di</strong> livello più alto, cioè la parola fonologica, la testa sarà quin<strong>di</strong> il nucleo tonico.<br />

I <strong>di</strong>versi livelli <strong>di</strong> proiezione delle posizioni si integrano via via nella costruzione dei livelli gerarchicamente<br />

superiori.<br />

(84)<br />

proiezione:<br />

parola +-----------+ N--->-+<br />

| | | |<br />

nucleare N N N N<br />

A R A R A R A R<br />

| N \ | N | N | N<br />

x x 1 x x x 2 x x 3 x x 4<br />

| | \ | | | | | |<br />

k ç d i j a v a<br />

[kçd<strong>di</strong>'java] "scaldavo" Arena CZ<br />

In (84) le relazioni metriche <strong>di</strong> livello più alto sono espresse come 'rappresentazioni ad albero': le due<br />

strutture <strong>di</strong> piede sono costruite sulla proiezione nucleare; la parola fonologica è proiettata sui nuclei testa


delle due unità <strong>di</strong> or<strong>di</strong>ne inferiore. La <strong>di</strong>rezione della relazione fra testa e posizione legittimata obbe<strong>di</strong>sce a<br />

uno schema metrico vigente in maniera generale per le varietà italiane, in<strong>di</strong>cato in (85):<br />

(85) La testa del piede è a sinistra<br />

La testa della parola fonologica è a destra.<br />

Il requisito <strong>di</strong> località impone infine che i singoli costrutti (piede, parola e eventuali livelli interme<strong>di</strong>) siano<br />

massimamente binari. Si noti che la località è sod<strong>di</strong>sfatta al livello <strong>di</strong> proiezione pertinente: così in (84) [x1] e<br />

[x2] sono a<strong>di</strong>acenti rispettivamente a [x3] e [x4] al livello <strong>di</strong> proiezione nucleare, mentre [x5], cioè la testa<br />

tonica della parola, è a<strong>di</strong>acente a [x1] al livello <strong>di</strong> proiezione <strong>di</strong> parola. [x1], testa del primo piede, è sede<br />

dell'accento secondario.<br />

9.2. La legittimazione fra costituenti.<br />

Come abbiamo notato, l'iterazione dei costituenti lungo la stringa obbe<strong>di</strong>sce a restrizioni <strong>di</strong> tipo<br />

combinatorio. In particolare l'esistenza <strong>di</strong> alcune asimmetrie suggerisce che anche fra posizioni a<strong>di</strong>acenti<br />

appartenenti a costituenti <strong>di</strong>versi vi sono relazioni <strong>di</strong> legittimazione. Ciò vale nelle sequenze attacco-nucleo e<br />

Coda <strong>di</strong> rima-attacco. Per quanto fra attacco e nucleo sembra esservi un elevato grado <strong>di</strong> autonomia<br />

fonotattica, tuttavia l'occorrenza <strong>di</strong> un attacco richiede quella <strong>di</strong> un nucleo. Ancora più evidente è<br />

l'asimmetria fra Coda e attacco. Sono note in letteratura le restrizioni combinatorie che limitano l'autonomia<br />

fonologica della coda (cf. Goldsmith 1990, Kaye 1990, Harris 1992). Le restrizioni sulla Coda <strong>di</strong> rima<br />

possono essere espresse nei termini <strong>di</strong> una gerarchia <strong>di</strong> marcatezza, riportata (866). Tale gerarchia è or<strong>di</strong>nata<br />

dall'alto in basso, dal contesto meno marcato a quello più marcato. In essa ciascun contesto implica quello<br />

sovraor<strong>di</strong>nato:<br />

(86)<br />

CV[X prima parte della geminata]<br />

CV[X Nasale con lo stesso luogo <strong>di</strong> articolazione della C-attacco seguente]<br />

CV[X sonorante] legamenti e liquide<br />

CVX ogni C è ammessa<br />

L'attacco quin<strong>di</strong> controlla e restringe le capacità segmentali della Coda, mentre da parte sua mostra la<br />

massima autonomia. Ad es., è ampiamente attestata fra le lingue la restrizione per cui in posizione Coda sono<br />

ammesse solo nasali omorganiche, cioè caratterizzate dallo stesso luogo <strong>di</strong> articolazione della consonante<br />

attacco seguente, come in [:kampo], [:kanto], [:baNka], etc. o la prima parte <strong>di</strong> una consonante geminata, cioè<br />

<strong>di</strong> una consonante il cui contenuto melo<strong>di</strong>co è interamente specificato dall'attacco, come in [:gatto], etc..<br />

Concludendo, vi sono elementi per pensare che le sequenze attacco-nucleo e Coda-attacco implichino<br />

relazioni <strong>di</strong> legittimazione analoghe a quelle che valgono all'interno dei costituenti. In entrambi i contesti una<br />

posizione, in questo caso quella <strong>di</strong> destra, è in grado <strong>di</strong> influenzare il contenuto fonologico associabile alla<br />

posizione a<strong>di</strong>acente alla sua sinistra. Quin<strong>di</strong>, a <strong>di</strong>fferenza dei domini interni ai costituenti, la <strong>di</strong>rezione della<br />

legittimazione è destra-sinistra. Seguendo Harris 1994, possiamo assumere due restrizioni <strong>di</strong> buonaformazione<br />

che specificano la tipologia delle sequenze ammissibili:<br />

(87)a. Un attacco deve essere legittimato da una posizione<br />

nucleare.<br />

b. Una posizione <strong>agg</strong>iunta alla rima deve essere legittimata da una posizione attacco.<br />

(87a) richiede che un attacco sia seguito da un nucleo, eliminando la possibilità <strong>di</strong> nessi <strong>di</strong> due attacchi; (83b)<br />

impone la sillabazione V$CV piuttosto che *VC$V, provocando la massima realizzazione degli attacchi in<br />

sequenze consonante-vocale.<br />

9.3. La legittimazione <strong>di</strong> nuclei vuoti.<br />

Un importante effetto <strong>di</strong> (87b) riguarda lo statuto proso<strong>di</strong>co delle consonanti finali <strong>di</strong> parola. (87b) infatti,<br />

richiedendo che una Coda sia legittimata da un attacco seguente implica che una consonante in posizione<br />

finale <strong>di</strong> parola non possa essere una Coda, ma debba essere sillabata come attacco <strong>di</strong> un nucleo non<br />

realizzato. Questa soluzione è confermata da <strong>di</strong>versi in<strong>di</strong>zi: (i) le consonanti in posizione finale <strong>di</strong>fferiscono<br />

dalle vere consonanti in posizione Coda in quanto non obbe<strong>di</strong>scono alle restrizioni sul contenuto segmentale


della Coda; (ii) nelle lingue sensibili al peso sillabico le consonanti finali generalmente non contribuiscono al<br />

peso della rima e non influenzano la lunghezza della vocale precedente; (ii) i nessi finali spesso<br />

contrad<strong>di</strong>cono le restrizioni <strong>di</strong> sonorità, mentre presentano sistematiche corrispondenze con le sequenze<br />

Coda-attacco.<br />

Gli argomenti precedenti inducono ad assegnare lo statuto <strong>di</strong> attacco alle consonanti finali <strong>di</strong> parola,<br />

assumendo quin<strong>di</strong> l'esistenza <strong>di</strong> posizioni vuote non realizzate. Con questa soluzione, formulata da Kaye<br />

1990, la <strong>di</strong>fferenza fra sistemi linguistici non riguarderà più la possibilità <strong>di</strong> avere consonanti finali, quanto la<br />

possibilità o meno <strong>di</strong> avere un nucleo vuoto in posizione finale. Le lingue varieranno quin<strong>di</strong> rispetto alla<br />

scelta in (88):<br />

(88) Parametro del nucleo vuoto finale<br />

Un nucleo vuoto finale è legittimato sì/no<br />

Questa soluzione pre<strong>di</strong>ce che la possibilità <strong>di</strong> avere consonanti finali sia in<strong>di</strong>pendente dalla possibilità <strong>di</strong><br />

avere rime ramificanti. Ad es., Kaye 1990:324 sottolinea come alcune lingue Gur del Burkina Faso e del<br />

Camerun ammettono consonanti finali ma non hanno rime ramificanti.<br />

Considerazioni analoghe inducono a postulare un nucleo vuoto non realizzato anche nel caso dei nessi<br />

C 1 C 2 interni <strong>di</strong> sequenza dove C 1 viene meno alle restrizioni valide per le Code in quella determinata lingua.<br />

Cioè, nei casi in cui sequenze C 1 C 2 non manifestano <strong>di</strong>pendenza fonotattica, tenuto conto delle restrizioni<br />

<strong>di</strong>stribuzionali generalmente assunte sulla sequenza Coda+attacco o sulla sequenza delle posizioni interne<br />

all'attacco. Una situazione ampiamente documentata nelle lingue naturali prevede che questi contesti siano<br />

collegati a fenomeni <strong>di</strong> sincope/epentesi. In molti casi l'alternanza sincope/epentesi in posizione interna<br />

interagisce con la possibilità <strong>di</strong> avere consonanti finali. Ad esempio nell’arabo del Marocco troviamo<br />

alternanze del tipo kd?b ‘mento’ vs. k?dbu: ‘mentiamo’. In (89) il fenomeno è analizzato assumendo che le<br />

due alternanti del verbo ‘mentire’ hanno sillabazioni <strong>di</strong>verse a seconda che ? sia presente (epentesi) o assente<br />

(sincope), per cui d, che nella forma <strong>di</strong> 1ps è un attacco, nella forma sincopata è la coda della rima<br />

precedente. La risillabazione naturalmente interessa anche gli altri segmenti, come b, coda in kd?b, ma<br />

attacco in k?dbu:, etc. In effetti ci potremmo aspettare che le proprietà fonologiche della forma <strong>di</strong> base<br />

restino costanti nelle <strong>di</strong>verse alternanti, tanto più che i contesti <strong>di</strong> sincope vanno contro le più generali<br />

restrizioni sui costituenti sillabici, in quanto danno luogo a rime con una ostruente come coda, e a sequenze<br />

<strong>di</strong> due ostruenti, come kd e db. Assumeremo quin<strong>di</strong> che i contesti in cui ? ma anche il nucleo finale u:<br />

alternano con ∅, includano un nucleo, presente comunque a livello astratto, che non si realizza se c’è una<br />

vocale piena alla sua destra, come in (90). Questo ci permette <strong>di</strong> rendere conto in maniera semplice ed<br />

elegante delle alternaze sincope/ epentesi mantenendo inalterati i principi generali che regolano la sillaba.<br />

(89) AR R A (90) A N A N A N A N A N A N<br />

| | \ | \ | | | | | | | | | | | | |<br />

k d ? b k ? d b u: k ∅ d ? b ∅ k ? d ∅ b u:<br />

In turco troviamo alternanze <strong>di</strong> questo tipo, come nel caso <strong>di</strong> burun ‘naso’ e della forma con morfema<br />

possessivo <strong>agg</strong>iunto, burnum ‘il nio naso’ in cui il nucleo u della seconda sillaba è cancellato in presenza <strong>di</strong><br />

una sillaba alla sua destra. In (91) il fenomeno è analizzato assumendo che la cancellazione <strong>di</strong> u me<strong>di</strong>ano dà<br />

luogo alla risillabazione, per cui r, che nella forma senza possessivo è un attacco, nella forma sincopata è la<br />

coda della rima precedente, e così n da coda <strong>di</strong>venta attacco. Come abbiamo visto, appare una soluzione più<br />

adeguata trattare questi fenomeni assumendo che le proprietà sillabiche della forma <strong>di</strong> base restino costanti<br />

nelle due alternanti; nella seconda semplicemente il nucleo, presente a livello astratto, non si realizza, come<br />

in (92).<br />

(91) A R R A (92) N N N N<br />

| |\ | \ | | | | |<br />

b u r u n b u r n - u m b u r u n = b u r ∅ n - u m<br />

‘naso’ ‘naso mio’<br />

Anche i <strong>di</strong>aletti italo-albanesi illustrano questo fenomeno, come mostrano gli esempi in (93)


(93) S.Paolo Albanese<br />

a. ['z´m´r] "cuore" b. ['z´mra] "il cuore"<br />

['picim] "arrostivamo" ['pic¯a] "arrostivo"<br />

Possiamo spiegare sequenze <strong>di</strong> questo tipo alla possibilità che in particolari contesti interni <strong>di</strong> parola un<br />

nucleo vuoto possa rimanere non realizzato. I dati riportati in (93) suggeriscono nuovamente che la mancata<br />

realizzazione è collegata alla presenza <strong>di</strong> un nucleo realizzato a<strong>di</strong>acente, dando origine all'alternanza<br />

illustrata in (94), dove @ rappresenta i nuclei deboli non realizzati (vuoti):<br />

(94) a. b.<br />

A N A N A N A N A N A N<br />

| | | | | | | | | | | |<br />

x x x x x x x x x x x x<br />

| | | + | | | | | | | +<br />

z ´ m @ r a z ´ m @ r @<br />

L'occorrenza <strong>di</strong> un nucleo vuoto non realizzato in posizione interna <strong>di</strong>pende dalla presenza <strong>di</strong> un nucleo<br />

foneticamente realizzato alla sua destra, che lo autorizza.<br />

La capacità <strong>di</strong> un attacco <strong>di</strong> legittimare proso<strong>di</strong>camente una Coda deriva dal suo legittimatore, cioè il<br />

nucleo. Vi sono lingue che in tali contesti richiedono la realizzazione <strong>di</strong> un nucleo vuoto. In altre parole solo<br />

un nucleo realizzato può legittimare una testa <strong>di</strong> attacco a reggere una posizione recessiva o una Coda.<br />

Questa possibilità sembra trattata parametricamente dalle lingue, che si <strong>di</strong>fferenziano nell'ammettere o meno<br />

che un nucleo vuoto legittimi un attacco come posizione reggente. Ad es., Charette (1991/92) mostra che il<br />

francese e il polacco ammettono entrambi un nesso consonantico in posizione finale (95a), mentre si<br />

<strong>di</strong>fferenziano per quanto riguarda i contesti interni. Infatti il polacco ammette la sincope anche in posizione<br />

contigua a nessi (95b), mentre il francese la esclude (95c) intrudendo un elemento <strong>di</strong> tipo [´]:<br />

(95) a. polacco francese<br />

dobr "buono" livr "libro"<br />

ciern "spina" port "porta"<br />

b. polacco<br />

/ubr@dac@/ ubrdac "immagine"<br />

/@skarb@nik@/ skarbnik "tesoriere"<br />

c. francese<br />

/vendr@<strong>di</strong>/ vendr[´]<strong>di</strong> vs. *vendr<strong>di</strong> "venerdì"<br />

/fort@ment@/ fort[´]ment vs. *fortment "fortemente"<br />

Charette 1991/92 attribuisce questa <strong>di</strong>fferenza ad un conflitto fra legittimazione alla reggenza e reggenza<br />

propria: il polacco applica comunque questa seconda, mentre il francese impone restrizioni sul nucleo che<br />

legittima la reggenza da parte dell'attacco.<br />

Riferimenti e altre letture<br />

Archangeli D. e D. Pulleyblank 1994, Grounded phonology, MIT Press, Cambridge, Mass.<br />

Bafile L. 2003, Syncope, epenthesys and syllable structure: the case of some italian <strong>di</strong>alects, in Rivista <strong>di</strong> grammatica<br />

generativa, 28: 19-29.<br />

Bafile L. 2005, Struttura sillabica e consonanti finali in varietà italiane, in Quaderni del Dipartimento <strong>di</strong> Linguistica<br />

dell’Università <strong>di</strong> Firenze, 15: 1-25.<br />

Baudouin de Courtenay J. 1895 [1972], Versuch einer Theorie phonetischer Alternationen. Ein Kapitel ausder<br />

Psychophonetic, trad. inglese in E.Stankiewicz (a cura <strong>di</strong>), A Baudouin de Courtenay Anthology, In<strong>di</strong>ana University<br />

Press 1972, pp.144-212.<br />

Bertinetto P. M. 1988, Reflections on the <strong>di</strong>chotomy ‘stress’ vs. ‘syllable timing’, Quaderni del laboratorio <strong>di</strong><br />

Linguistica, Scuola Normale Superiore, Pisa: 59-84<br />

Bloomfield L. 1933 [1974], Il lingu<strong>agg</strong>io, Il S<strong>agg</strong>iatore, Milano.<br />

Charette M. 1990, “License to govern”, Phonology 7:233-253.<br />

Charette M. 1991, Con<strong>di</strong>tions on phonological government,Cambridge University Press, Cambridge.


Charette M. 1991/92, Mongolian and Polish meet Government Licensing, SOAS Working Papers in Linguistics and<br />

Phonetics, 2:275-291<br />

Chomsky N. 1966 [1975], Problemi <strong>di</strong> teoria linguistica, Boringhieri, Torino.<br />

Chomsky N. (1981), Lectures on government and bin<strong>di</strong>ng, Foris, Dodrecht.<br />

Chomsky N. (1986), Knowledge of Language. Its Nature, Origin, and Use, Praeger, New York.<br />

Chomsky N. (1988), Language and problems of knowledge, The MIT Press, Cambridge, Mass.<br />

Chomsky N. (1995), A minimalist program, MIT Press, Cambridge, Mass.<br />

Chomsky N. (2000), New Horizons in the Study of Language and Mind, Cambridge University Press, Cambridge.<br />

Chomsky N. e M. Halle (1968), The sound pattern of English, Harper & Row, New York<br />

Fava E. e E. Magno Caldognetto 1976, “Stu<strong>di</strong>o sperimentale delle caratteristiche elettroacustiche delle vocali toniche ed<br />

atone in bisillabi italiani”, in R. Simone, U. Vignuzzi, G. Ruggiero (a cura <strong>di</strong>), Stu<strong>di</strong> <strong>di</strong> fonetica e fonologia,<br />

Bulzoni, Roma: 35-79<br />

Goldsmith J.A. 1990, Autosegmental and metrical phonology, Blackwell, Oxford.<br />

Harris J. 1990, Segmental complexity and phonological government, in Phonology 7:255-<strong>30</strong>0.<br />

Harris J. 1992, Licensing Inheritance, in UCL Working Papers in Linguistics 4:359-406.<br />

Harris J. 1994, Monovalency and opacity: Chicheŵa height harmony, in UCL Working Papers in Linguistics 6: 5<strong>09</strong>-<br />

547.<br />

Harris J. 1994, English Sound Structure, Oxford, Blackwell.<br />

Harris J., G. Lindsey 1995, The elements of phonological representation, in J. Durand & F. Katamba (a cura <strong>di</strong>),<br />

Frontiers of phonology, Longman, London: 34-79.<br />

Hauser M.D., B. Chomsky, W.T. Fitch (2002), The faculty of language: what is it, who has it, and how <strong>di</strong>d it evolve?, in<br />

Science 298: 1569-1579.<br />

Hyman L. M. 1975, Phonology. Theory and analysis, Holt, Rinehart and Winston, New York (traduzione italiana 1981,<br />

<strong>Fonologia</strong>. Teoria e analisi, Il Mulino, Bologna).<br />

Itô J.1989, A proso<strong>di</strong>c theory of Epenthesis, Natural Language and Linguistic Theory 7, 2: 217-259.<br />

Kaye J. 1986/87, Government in phonology. The case of Moroccan Arabic, The Linguistic Review 6: 131-159.<br />

Kaye J. 1989, Phonology. A cognitive view, Erlbaum, Hillsdale<br />

Kaye J. 1990, ‘Coda’ licensing, in Phonology 7: <strong>30</strong>1-3<strong>30</strong>.<br />

Kaye J. e J. Lowenstamm 1981, Syllable structure and markedness theory, in A. Belletti, L. Bran<strong>di</strong> e L. Rizzi, Theory of<br />

markedness in generative grammar, Scuola Normale Superiore, Pisa: 287-315<br />

Kaye J., J. Lowenstamm, J.-R. Vergnaud 1990, Constituent structure and government in phonology, Phonology 7:293-<br />

231.<br />

Kenstowicz M. 1994, Phonology in generative grammar, Blakwell, Oxford<br />

Ladefoged P. 1982, A Course in Phonetics, Harcourt Brace Jovanovich, San Diego<br />

Lehiste I. 1970, Suprasegmentals, M.I.T. Press, Cambridge, Massachusetts.<br />

Magno Caldognetto E. (1973), Introduzione all’interpretazione articolatoria dei dati spettrografici, Pàtron, Bologna.<br />

Malmberg B. 1977 [1974], Manuale <strong>di</strong> fonetica generale, Il Mulino, Bologna.<br />

Nespor M. 1993, <strong>Fonologia</strong>, Il Mulino, Bologna<br />

Repetti L. 1995, Variazione nella sillabificazione: il caso dei <strong>di</strong>aletti emiliani e romagnoli, in Rivista italiana <strong>di</strong><br />

<strong>di</strong>alettologia, 19: 41-56.<br />

Rohlfs G. 1949, Historische Grammatik der Italienischen Sprache und ihrer Mundarten. I - Lautlehre, Francke, Bern.<br />

Romito L.e J. Trumper 1994, Problemi teorici e sperimentali posti dall’isocronia, in Quaderni del Dipartimento <strong>di</strong><br />

Linguistica dell’Università della Calabria, serie Linguistica 4: 89-118.<br />

Sapir. E. 1933, La réalité psychologique des phonèmes, in Journal de Psychologie normal et pathologique <strong>30</strong>: 247-265,<br />

traduzione italiana ‘La realtà psicologica dei fonemi’, in AA.VV. Il lingu<strong>agg</strong>io, Dedalo libri, Bari, 1976: 285-<strong>30</strong>6.<br />

Trubeckoj N.J. 1939 [1971], Fondamenti <strong>di</strong> fonologia (a cura <strong>di</strong> G. Mazzuoli Porru), Einau<strong>di</strong>, Torino.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!