28.05.2013 Views

Scarica la descrizione del corpus e le istruzioni per la ricerca

Scarica la descrizione del corpus e le istruzioni per la ricerca

Scarica la descrizione del corpus e le istruzioni per la ricerca

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

L’ADIL2 come strumento <strong>per</strong> <strong>la</strong> <strong>ricerca</strong><br />

Massimo Pa<strong>le</strong>rmo<br />

1. Il <strong>corpus</strong><br />

L’ADIL2 è stato progettato e realizzato nell’ambito <strong>del</strong><strong>la</strong> <strong>ricerca</strong> da me diretta Le interlingue<br />

di apprendimento a base non italiana <strong>del</strong>l’Osservatorio Linguistico Permanente <strong>del</strong>l'Italiano<br />

diffuso fra stranieri e <strong>del</strong><strong>le</strong> lingue immigrate in Italia istituito dal MIUR presso l’Università <strong>per</strong><br />

stranieri di Siena 1 . Con <strong>la</strong> pubblicazione <strong>del</strong> DVD contenente <strong>la</strong> banca dati e il motore di <strong>ricerca</strong> si<br />

intende ora mettere a disposizione <strong>del</strong><strong>la</strong> comunità degli studiosi uno strumento <strong>per</strong> ricerche<br />

linguistiche e glottodidattiche sull’apprendimento guidato <strong>del</strong>l’italiano L2: i saggi contenuti nel<br />

volume, realizzati da col<strong>le</strong>ghi <strong>del</strong>l’Università <strong>per</strong> Stranieri di Siena, indicano alcune possibili<br />

applicazioni in tal senso re<strong>la</strong>tive al<strong>la</strong> morfosintassi, al <strong>le</strong>ssico, al<strong>le</strong> modalità di gestione <strong>del</strong><strong>la</strong><br />

comunicazione ora<strong>le</strong> e scritta da parte di non nativi 2 .<br />

Negli ultimi venti anni lo sviluppo <strong>del</strong>l’informatica ha reso possibi<strong>le</strong> <strong>la</strong> creazione di corpora<br />

di italiano scritto e par<strong>la</strong>to sempre più estesi quantitativamente e, in alcuni casi, più sofisticati nel<strong>le</strong><br />

potenzialità di interrogazione dei testi 3 . Più recentemente, ad essi si sono affiancati corpora di<br />

apprendimento (<strong>le</strong>arner corpora) aventi l’italiano come lingua target; senza pretesa di esaustività<br />

ricordiamo <strong>la</strong> Banca dati di italiano L2 <strong>del</strong> Progetto di Pavia, contenente trascrizioni di interviste ad<br />

immigrati raccolte fra il 1985 e il 2000 (disponibi<strong>le</strong> su CD-ROM dal 2001), il LIPS (Lessico<br />

<strong>del</strong>l’italiano par<strong>la</strong>to da stranieri), basato sull’archivio <strong>del</strong><strong>le</strong> prove di produzione ora<strong>le</strong> <strong>del</strong><strong>la</strong><br />

certificazione CILS <strong>del</strong>l’Università <strong>per</strong> stranieri di Siena dal 1993 ad oggi 4 , il Co.Cer.IT (Corpus<br />

<strong>del</strong><strong>la</strong> Certificazione IT) iniziato nel 2005 e basato sul<strong>le</strong> prove di certificazione IT <strong>del</strong>l’Università di<br />

Roma Tre 5 ; il VALICO (Varietà di Apprendimento <strong>del</strong><strong>la</strong> Lingua Italiana Corpus Online), realizzato<br />

presso l’Università di Torino 6 ; il Corpus Par<strong>la</strong>to di Italiano L2, che raccoglie trascrizioni di<br />

interviste a par<strong>la</strong>nti di italiano L2, realizzato dall’Osservatorio sull’italiano di stranieri e<br />

sull’italiano all’estero <strong>del</strong>l’Università <strong>per</strong> straneri di Perugia 7 . A questa lista si può ora aggiungere<br />

1<br />

Il Centro, fondato nel 2001 e diretto fino al 2005 da Massimo Vedovelli, è attualmente sotto <strong>la</strong> direzione di Riccardo<br />

Campa. Per maggiori dettagli sul<strong>le</strong> finalità <strong>del</strong> progetto si rimanda a Pa<strong>le</strong>rmo 2005, da cui sono tratti alcuni dei dati<br />

riproposti nel<strong>le</strong> pagine che seguono.<br />

2<br />

Per altri esempi di studi basati sul <strong>corpus</strong> ADIL2 mi <strong>per</strong>metto di rinviare a Pa<strong>le</strong>rmo 2006 e Pa<strong>le</strong>rmo - Troncarelli –<br />

Petrocelli (in stampa).<br />

3<br />

Per maggiori dettagli sullo sviluppo <strong>del</strong><strong>la</strong> linguistica dei corpora in Italia e all’estero cfr. Rossini Favretti 2000. Per<br />

quanto riguarda <strong>la</strong> sitografia, basti rimandare a “Par<strong>la</strong>ritaliano” , un osservatorio dedicato allo<br />

studio <strong>del</strong> par<strong>la</strong>to italiano costituito nel 2004 da gruppi di <strong>ricerca</strong> di varie università italiane e al sito <strong>del</strong>l’Università di<br />

Graz, all’indirizzo .<br />

4<br />

Cfr. Vedovelli 2006; Barni - Gallina 2008 e 2009<br />

5<br />

Il <strong>corpus</strong> contiene attualmente 11 ore e 35 minuti di registrazione di par<strong>la</strong>nti di italiano L2. fr. Cfr. Ambroso -<br />

Bonvino 2009.<br />

6<br />

Cfr. Barbera – Marello, 2004.<br />

7<br />

Consultabi<strong>le</strong> in rete all’indirizzo .<br />

1


ADIL2, i cui ri<strong>le</strong>vamenti sono stati realizzati tra il 1997 e il 2004 8 . A questa prima fase di grande<br />

fervore nel<strong>la</strong> produzione e pubblicazione di nuovi corpora sarebbe auspicabi<strong>le</strong> che seguisse ora una<br />

comune rif<strong>le</strong>ssione mirata al<strong>la</strong> progressiva omogeneizzazione dei corpora esistenti. Sarà essenzia<strong>le</strong><br />

a mio avviso soprattutto favorire l’importabilità / esportabilità deii dati, <strong>per</strong> poterli utilizzare su<br />

diverse piattaforme e sfruttare quindi al meglio <strong>le</strong> potenzialità dei singoli motori di <strong>ricerca</strong> 9 .<br />

Veniamo ora a una <strong>descrizione</strong> di ADIL2. Il <strong>corpus</strong> è formato da 1168 unità testuali,<br />

prodotte da 1126 informanti. In termini di estensione l’intero <strong>corpus</strong> contiene 432.606 forme<br />

(tokens). Al suo interno distinguiamo tre sezioni: testi scritti trasversali, risultato di prove<br />

somministrate una so<strong>la</strong> volta a gruppi di informanti (sez. A, 1051 unità testuali, 185.455 forme);<br />

testi orali trasversali (sez. B, 65 unità testuali, 84.846 forme); testi orali longitudinali (sez. C, 53<br />

unità testuali, 185.455 forme), risultato di interviste allo stesso informante realizzate in un arco di<br />

tempo variabi<strong>le</strong>. I testi orali sono in tutto 117 e corrispondono a oltre 37 ore di registrazione 10 . Se si<br />

considera il numero di forme di ciascuna sezione si ha <strong>la</strong> proporzione rappresentata nel grafico<br />

seguente:<br />

Grafico 1. Composizione di ADIL2 (<strong>per</strong>centua<strong>le</strong> re<strong>la</strong>tiva al n. di forme)<br />

8 L’e<strong>la</strong>borazione <strong>del</strong> progetto e <strong>la</strong> gran parte dei ri<strong>le</strong>vamenti risalgono al <strong>per</strong>iodo 2002-2004. Gli informanti sono gli<br />

studenti che in quel <strong>per</strong>iodo frequentavano i corsi ordinari di italiano L2 presso il Centro Linguistico d’Ateneo. La<br />

somministrazione <strong>del</strong><strong>le</strong> prove, <strong>le</strong> interviste e <strong>le</strong> altre videoregistrazioni, <strong>le</strong> trascrizioni e <strong>la</strong> marcatura dei testi sono state<br />

effettuate da Marco Cassandro. Alcune trascrizioni e marcature si devono a Vincenzo Faraoni. L’al<strong>le</strong>stimento<br />

informatico <strong>del</strong> sistema è a cura di Luca Belgiovane. Sono confluiti nel <strong>corpus</strong>, trascritti e marcati secondo <strong>le</strong> norme<br />

ADIL2, alcuni testi scritti e orali raccolti precedentemente. La prova scritta su Cappuccetto Rosso è stata somministrata<br />

nel 1997 da un gruppo di <strong>ricerca</strong> <strong>del</strong> Centro linguistico d’Ateneo, coordinato da M. G. Lo Duca (<strong>per</strong> maggiori dettagli<br />

cfr. Lo Duca 1998). Le interviste longitudinali a CAM, HOL e JOD sono state effettuate da Marco Cassandro in<br />

occasione <strong>del</strong><strong>la</strong> propria tesi di dottorato nel 1998 (Cassandro, tesi di dottorato). Colgo l’occasione <strong>per</strong> ringraziare, oltre<br />

al<strong>le</strong> <strong>per</strong>sone sopra citate, i docenti e i col<strong>la</strong>boratori es<strong>per</strong>ti linguistici <strong>del</strong> Centro Linguistico <strong>del</strong>l’Università <strong>per</strong> stranieri<br />

che in questo lungo <strong>la</strong>sso di tempo hanno col<strong>la</strong>borato a vario titolo ai ri<strong>le</strong>vamenti. Per maggiori notizie sul<strong>la</strong> genesi di<br />

ADIL2 cfr. Pa<strong>le</strong>rmo 2005.<br />

9 Sui <strong>le</strong>arner corpora cfr. Granger 2004 e, <strong>per</strong> lo specifico <strong>del</strong>l’italiano L2 Andorno – Rastelli 2009.<br />

10 Di questi 74 sono stati videoregistrati (19 ore e 6 minuti), 43 registrati in solo formato audio (18 ore e 11 minuti).<br />

Nel<strong>la</strong> versione di ADIL2 che si pubblica con questo volume, <strong>per</strong> ragioni di privacy, i fi<strong>le</strong> video sono stati convertiti in<br />

fi<strong>le</strong> audio. Su richiesta di singoli <strong>ricerca</strong>tori, da inviare al curatore <strong>del</strong> volume, sarà possibi<strong>le</strong> visionare <strong>le</strong><br />

videoregistrazioni.<br />

2


Per <strong>le</strong> sezioni A e B il criterio primario <strong>per</strong> <strong>la</strong> costituzione <strong>del</strong> <strong>corpus</strong> è stato testua<strong>le</strong>: con<br />

riferimento al<strong>la</strong> c<strong>la</strong>ssificazione funziona<strong>le</strong> dei testi, si è cercato di coprire in modo bi<strong>la</strong>nciato i<br />

cinque tipi fondamentali. I testi orali <strong>del</strong><strong>la</strong> sezione B si differenziano, oltre che sul<strong>la</strong> base <strong>del</strong> tipo<br />

testua<strong>le</strong>, in funzione <strong>del</strong><strong>le</strong> modalità di interazione (monologo, dialogo, conversazione di gruppo). La<br />

sezione ora<strong>le</strong> longitudina<strong>le</strong> (C) comprende soltanto interviste semi-strutturate.<br />

Vediamo qualche dato ulteriore sugli informanti. Per quel che riguarda <strong>la</strong> lingua madre il<br />

quadro emergente è quello rappresentato dal<strong>la</strong> Tabel<strong>la</strong> 1:<br />

Tabel<strong>la</strong> 1. Composizione <strong>del</strong>l’ADIL2 (<strong>per</strong> lingua madre degli apprendenti)<br />

MADRELINGUA NUMERO MADRELINGUA NUMERO<br />

Ing<strong>le</strong>se 286 Gal<strong>le</strong>se 1<br />

Giapponese 151 Lettone 5<br />

Cinese 102 Norvegese 5<br />

Coreano 82 Bulgaro 4<br />

Tedesco 73 Kazako 4<br />

Spagnolo 54 Lituano 4<br />

Arabo 41 Ma<strong>le</strong>se 4<br />

Francese 33 Ungherese 4<br />

Russo 32 Azero 3<br />

Svedese 29 Bantu 11 3<br />

Albanese 28 Fin<strong>la</strong>ndese 3<br />

Greco 24 Is<strong>la</strong>ndese 3<br />

Portoghese 19 Birmano 2<br />

Tai<strong>la</strong>ndese 19 Ceco 2<br />

Po<strong>la</strong>cco 14 Ebraico 2<br />

Serbo-croato 14 Rumeno 2<br />

Ucraino 10 Uzbeko 2<br />

Indonesiano 8 Armeno 2<br />

Slovacco 8 Georgiano 1<br />

O<strong>la</strong>ndese 7 Igbo (Nigeria) 1<br />

Vietnamita 7 Malgascio 1<br />

Estone 6 Moldavo 1<br />

Persiano 6 Kiniarwanda 1<br />

11 Si tratta di due informanti di nazionalità camerunense e mozambicana. Ho usato <strong>per</strong> semplicità il nome <strong>del</strong><strong>la</strong> famiglia<br />

linguistica d’appartenenza.<br />

A: SCRITTO<br />

42%<br />

B: ORALE TRASVERSALE<br />

20%<br />

C: ORALE LONGITUDINALE<br />

38%<br />

3


Turco 6<br />

(Ruanda)<br />

Cata<strong>la</strong>no 1<br />

Danese 5 Minangkabau<br />

(Sumatra)<br />

1<br />

I casi più significativi di lingue madri “ombrello”, cioè corrispondenti a par<strong>la</strong>nti di nazionalità<br />

diverse riguardano l’ arabo (21 magrebini, 2 arabi, 2 siriani, 6 pa<strong>le</strong>stinesi, 6 giordani), l’ing<strong>le</strong>se (213<br />

statunitensi, 19 australiani, 8 britannici, 7 canadesi, 4 sudafricani, 2 ir<strong>la</strong>ndesi, 1 neoze<strong>la</strong>ndese, i<br />

rimanenti con doppia cittadinanza), lo spagnolo (12 spagnoli, 12 argentini, 7 ci<strong>le</strong>ni, 4 colombiani, 3<br />

messicani, i rimanenti centro o sudamericani), il francese (21 francesi, 5 belgi, 2 franco-canadesi, 1<br />

gabonese, senega<strong>le</strong>se, mauriziano, ivoriano), il tedesco (61 tedeschi, 4 svizzeri, 4 austriaci), il<br />

portoghese (7 portoghesi e 12 brasiliani), il serbo-croato (11 bosniaci, 2 serbi, 1 croato). Per evitare<br />

l’eccessiva frammentazione dei dati abbiamo compiuto alcune forzature non tenendo conto <strong>del</strong><strong>le</strong><br />

differenze linguistiche interne agli informanti di nazionalità cinese e taiwanese e dei pochi<br />

appartenenti a lingue <strong>del</strong> gruppo bantu (2 mozambicani, 1 camerunense). Interessanti infine i casi<br />

degli informanti provenienti da paesi ex coloniali, in partico<strong>la</strong>re africani, che non dichiarano come<br />

lingua madre <strong>la</strong> lingua ufficia<strong>le</strong> europea in uso nel<strong>la</strong> loro nazione. Per quanto riguarda gli europei,<br />

da segna<strong>la</strong>re l’autodichiarazione di due apprendenti (rispettivamente spagnolo e britannico) che<br />

hanno fatto riferimento al cata<strong>la</strong>no e al gal<strong>le</strong>se.<br />

Una <strong>del</strong><strong>le</strong> possibi<strong>le</strong> direttrici di studio <strong>del</strong> <strong>corpus</strong> riguarda i rapporti tra tipo linguistico e<br />

caratteristiche <strong>del</strong>l’interlingua. A ta<strong>le</strong> scopo può essere uti<strong>le</strong> un’analisi <strong>del</strong><strong>la</strong> suddivisione degli<br />

apprendenti <strong>per</strong> famiglia linguistica. Il primo dato ri<strong>le</strong>vante è l’appartenenza <strong>del</strong> 58% degli<br />

informanti a lingue indoeuropee. Nel grafico 2 riportiamo nel dettaglio <strong>le</strong> cifre re<strong>la</strong>tive al<strong>le</strong> famiglie<br />

linguistiche che presentino più di 5 informanti 12 :<br />

Grafico 2. Distribuzione degli informanti <strong>per</strong> famiglia linguistica<br />

450<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

indo-iranico<br />

distribuzione degli informanti <strong>per</strong> famiglia linguistica<br />

6 9 13 14 15 19 23 28 43<br />

baltico<br />

ugro-finnico<br />

austronesiano<br />

altaico<br />

tai<br />

greco<br />

albanese<br />

semitico<br />

coreano<br />

82 84 98 104<br />

s<strong>la</strong>vo<br />

romanzo<br />

sino-tibetano<br />

giapponese<br />

151<br />

germanico<br />

12 Rientrano nel<strong>la</strong> colonna “altro”, oltre ad alcune autodichiarazioni incerte, <strong>le</strong> famiglie linguistiche con meno di 6<br />

informanti: alcune lingue africane (igbo, bantu, ruandese), il vietnamita, il georgiano, il gal<strong>le</strong>se.<br />

408<br />

altro<br />

28<br />

4


Partico<strong>la</strong>re cura è stata posta nell’ottenere una distribuzione equilibrata degli informanti <strong>per</strong><br />

livello di competenza, come si evince dal grafico seguente 13 :<br />

Grafico 3. Distribuzione degli informanti <strong>per</strong> livelli di competenza<br />

I due terzi degli informanti sono compresi nel<strong>la</strong> fascia d’età tra i 18 e i 25 anni. Per quel che<br />

riguarda il livello d’istruzione (hanno compi<strong>la</strong>to questa sezione 830 informanti) notiamo un 5,55%<br />

di <strong>la</strong>ureati, un 43,01% di studenti universitari, un 51,44% di <strong>per</strong>sone in possesso <strong>del</strong> diploma di<br />

scuo<strong>la</strong> su<strong>per</strong>iore.<br />

intermedio<br />

227<br />

I 912 informanti che hanno compi<strong>la</strong>to <strong>la</strong> sezione “altre lingue conosciute” sono così distribuiti:<br />

Grafico 4. Altre lingue conosciute<br />

altre<br />

tipologie 46<br />

avanzato<br />

217<br />

tre<br />

179<br />

quattro<br />

18<br />

due<br />

481<br />

principiante<br />

290<br />

e<strong>le</strong>mentare<br />

352<br />

13 Ricordiamo che al momento dei ri<strong>le</strong>vamenti i corsi ordinari di lingua <strong>del</strong> Centro linguistico <strong>del</strong>l’Università <strong>per</strong><br />

stranieri erano artico<strong>la</strong>ti su quattro livelli, mentre dal 1° gennaio 2005 si è passati ad un’artico<strong>la</strong>zione su sei livelli,<br />

secondo l’impostazione <strong>del</strong> Quadro comune europeo.<br />

una<br />

234<br />

5


La prima lingua straniera conosciuta è l’ing<strong>le</strong>se (574 casi), seguita dal francese (110 casi), dallo<br />

spagnolo (90), dal tedesco (26), dal russo (18), dal cinese (15 casi, <strong>per</strong> lo più taiwanesi, giapponesi,<br />

coreani), dal giapponese (7 casi, <strong>per</strong> lo più coreani).<br />

2. Le ri<strong>le</strong>vazioni<br />

Vediamo ora come sono state predisposte <strong>le</strong> prove. Per <strong>la</strong> sezione A esse sono suddivise<br />

secondo i cinque tipi testuali fondamentali. Eccone il quadro riassuntivo:<br />

Tabel<strong>la</strong> 2. Tipologia <strong>del</strong><strong>le</strong> prove scritte<br />

Tipo Genere Titolo Descrizione Livelli di<br />

Rego<strong>la</strong>tivo Ricetta Come<br />

competenza<br />

si Dare <strong>istruzioni</strong> <strong>per</strong> preparare I-IV<br />

prepara un un caffé all’italiana.<br />

buon caffé!<br />

Narrativo 1 Racconto Par<strong>la</strong>ci di te Racconto di es<strong>per</strong>ienze I-IV<br />

<strong>per</strong>sona<strong>le</strong><br />

<strong>per</strong>sonali.<br />

Narrativo 2 Favo<strong>la</strong> Cappuccetto Narrazione <strong>del</strong><strong>la</strong> favo<strong>la</strong>.<br />

Rosso<br />

I-IV<br />

Espositivo Saggio Lo sviluppo Esposizione <strong>del</strong><strong>la</strong> situazione I-IV<br />

breve <strong>del</strong><strong>la</strong> demografica italiana.<br />

popo<strong>la</strong>zione Esposizione e interpretazione<br />

italiana di tabel<strong>le</strong> con dati reali.<br />

Descrittivo Gioco Confronta <strong>le</strong> Descrivere due immagini che I-IV<br />

enigmistico due si differenziano <strong>per</strong> alcuni<br />

immagini e dettagli<br />

scrivi<br />

differenze<br />

che trovi.<br />

<strong>le</strong><br />

Argomentativo Lettera Lettera a un Scrivere una <strong>le</strong>ttera a un I-IV<br />

informa<strong>le</strong> amico. amico <strong>per</strong> convincerlo a<br />

visitare il proprio paese<br />

Nel<strong>la</strong> somministrazione di alcune prove ci siamo avvalsi <strong>del</strong>l’ausilio di immagini o di altri materiali<br />

di supporto (v. infra, par. 4): <strong>per</strong> <strong>la</strong> prova rego<strong>la</strong>tiva si è dapprima mostrato un breve video di una<br />

<strong>per</strong>sona che prepara il caffé, poi si è fornito agli studenti un foglio con alcune immagini <strong>del</strong><strong>le</strong> fasi<br />

principali <strong>del</strong><strong>la</strong> preparazione e un <strong>le</strong>ssico tecnico fondamenta<strong>le</strong>; <strong>per</strong> <strong>la</strong> narrazione <strong>del</strong><strong>la</strong> favo<strong>la</strong><br />

l’input era costituito da un’illustrazione che riproduceva i protagonisti <strong>del</strong><strong>la</strong> storia, <strong>per</strong> <strong>la</strong> prova<br />

descrittiva si sono utilizzate due immagini quasi identiche di cui gli studenti dovevano individuare e<br />

descrivere <strong>le</strong> differenze; <strong>per</strong> <strong>la</strong> prova espositiva si sono forniti due grafici che illustrano l'andamento<br />

<strong>del</strong><strong>la</strong> popo<strong>la</strong>zione italiana dal 1999 al 2001 e un grafico con ipotesi sul futuro sviluppo demografico<br />

<strong>del</strong> nostro Paese 14 . Lo spazio maggiore dedicato al<strong>la</strong> tipologia narrativa si spiega tenendo conto <strong>del</strong><br />

14 Nel<strong>la</strong> cartel<strong>la</strong> “materiali di supporto” presente nel DVD al<strong>le</strong>gato al volume sono contenuti i fi<strong>le</strong> con <strong>le</strong> consegne <strong>del</strong><strong>le</strong><br />

prove.<br />

6


fatto che <strong>la</strong> prova su Cappuccetto Rosso, certamente di notevo<strong>le</strong> interesse <strong>per</strong> molti altri aspetti 15 -<br />

poteva comportare un certo condizionamento degli scriventi <strong>per</strong> quel che riguarda <strong>le</strong> rego<strong>le</strong><br />

retoriche e stilistiche con cui <strong>la</strong> narrazione favolistica si è storicamente sedimentata nel<strong>le</strong> varie<br />

culture, con conseguenze sul<strong>la</strong> se<strong>le</strong>zione di strutture linguistiche caratteristiche <strong>del</strong> narrare (mi<br />

riferisco in partico<strong>la</strong>re al<strong>la</strong> se<strong>le</strong>zione dei tempi <strong>del</strong> passato e a partico<strong>la</strong>ri vincoli nel<strong>la</strong> costruzione<br />

<strong>del</strong><strong>le</strong> catene anaforiche), mentre <strong>la</strong> narrazione pragmatica richiesta con il racconto <strong>per</strong>sona<strong>le</strong><br />

dovrebbe risentire in misura minore di condizionamenti di tal genere.<br />

Un’analoga suddivisione è stata compiuta <strong>per</strong> i testi <strong>del</strong><strong>le</strong> sezioni B e C. Tuttavia nei testi orali<br />

occorre considerare come variabili <strong>per</strong>tinenti anche <strong>le</strong> modalità <strong>del</strong><strong>la</strong> conversazione. Dal punto di<br />

vista <strong>del</strong><strong>le</strong> modalità di interazione tra gli interlocutori sono presenti sia monologhi sia conversazioni<br />

faccia a faccia con variazione nel<strong>la</strong> libertà di presa <strong>del</strong> turno, sia conversazioni di gruppo più o<br />

meno guidate. In linea di massima, tuttavia, <strong>le</strong> ri<strong>le</strong>vazioni orali, benché sempre guidate dal<br />

<strong>ricerca</strong>tore, hanno avuto carattere libero e, quando se ne è presentata l’opportunità, si è cercato di<br />

incoraggiare <strong>le</strong> produzioni autonome degli apprendenti. Il sotto<strong>corpus</strong> raccoglie varie tipologie di<br />

prove - in genere svoltesi nell’ambito <strong>del</strong>l’interazione di c<strong>la</strong>sse - che includono unità testuali<br />

narrative (ordinare una storia a disegni e narrar<strong>la</strong>, riassumere il contenuto di un breve video),<br />

descrittive (descrivere un’immagine proposta), espositive (presentare una breve <strong>ricerca</strong>), rego<strong>la</strong>tive<br />

(spiegare come si fa il caffé all’italiana), argomentative (convincere a trascorrere un fine settimana<br />

in una località turistica).<br />

La sezione C è costituita da 52 interviste semilstrutturate realizzate nel tempo a un gruppo di<br />

dieci informanti. La tabel<strong>la</strong> seguente descrive <strong>la</strong> lingua madre dei par<strong>la</strong>nti, il loro livello di<br />

competenza inizia<strong>le</strong> e fina<strong>le</strong>, il numero di interviste.<br />

Sig<strong>la</strong><br />

Informante<br />

Tabel<strong>la</strong> 3. Informanti <strong>del</strong> <strong>corpus</strong> longitudina<strong>le</strong><br />

Lingua<br />

madre<br />

Livelli di<br />

competenza<br />

n.<br />

interviste<br />

Sig<strong>la</strong><br />

Informante<br />

ANA Spagnolo 1–3 (non 2) 3 WAN<br />

MON Arabo<br />

(libico)<br />

GHA Arabo<br />

(pa<strong>le</strong>stinese)<br />

AMI Arabo<br />

(pa<strong>le</strong>stinese)<br />

Lingua<br />

madre<br />

1–2 6 CAM Ing<strong>le</strong>se<br />

(USA)<br />

1 2 HLY Ing<strong>le</strong>se<br />

(USA)<br />

1 2 JOD Ing<strong>le</strong>se<br />

(USA)<br />

WEN Cinese 1-3 5 HUI Cinese<br />

(Taiwan)<br />

Livelli di<br />

competenza<br />

Cinese 3-4 2<br />

1-2 9<br />

1-3 11<br />

1-3 8<br />

2-3 3<br />

n.<br />

interviste<br />

15 Sul<strong>le</strong> ragioni che hanno determinato l’uso di ta<strong>le</strong> favo<strong>la</strong> <strong>per</strong> uno studio comparato sull’apprendimento <strong>del</strong><strong>la</strong> scrittura<br />

nei bambini si veda Ferreiro / Pontecorvo (1996).<br />

7


3. Modalità di accesso ai dati e funzioni di <strong>ricerca</strong><br />

L’ADIL2 è un sistema composto da una banca dati di testi multimediali (trascrizioni e<br />

registrazioni audio/video) e un programma che consente di accedere al<strong>la</strong> <strong>le</strong>ttura e al<strong>le</strong> ricerche<br />

testuali. Sia <strong>la</strong> <strong>le</strong>ttura che <strong>la</strong> <strong>ricerca</strong> sfruttano <strong>le</strong> potenzialità <strong>del</strong> supporto digita<strong>le</strong>, in quanto è<br />

possibi<strong>le</strong> se<strong>le</strong>zionare dinamicamente <strong>la</strong> porzione di <strong>corpus</strong> su cui <strong>la</strong>vorare. L’utente può predisporre<br />

sottoinsiemi di testi definiti sul<strong>la</strong> base <strong>del</strong><strong>le</strong> proprie esigenze di <strong>ricerca</strong>, <strong>le</strong>ggerli in maniera<br />

sequenzia<strong>le</strong> e non, o<strong>per</strong>are su di essi ricerche testuali.<br />

3.1 Instal<strong>la</strong>re e <strong>la</strong>nciare il programma, se<strong>le</strong>zionare i testi<br />

ADIL2 funziona con i sistemi o<strong>per</strong>ativi di Windows. Per instal<strong>la</strong>rlo, avviare “setup.exe” e<br />

seguire <strong>la</strong> procedura. Per ascoltare i testi orali è necessario che sul proprio PC sia presente il<br />

programma Windows Media P<strong>la</strong>yer, versione 10 o su<strong>per</strong>iore. In caso contrario, aprire <strong>la</strong> cartel<strong>la</strong><br />

“P<strong>la</strong>yer” contenuta nel DVD e <strong>la</strong>nciare Winxp.exe <strong>per</strong> sistemi o<strong>per</strong>ativi XP, NON_WinXP.exe <strong>per</strong><br />

sistemi o<strong>per</strong>ativi diversi da XP. Una volta eseguita l’instal<strong>la</strong>zione non sarà più necessario inserire il<br />

DVD nel <strong>le</strong>ttore <strong>per</strong> usare il programma.<br />

Lanciato il programma con doppio clic sull’icona ADIL2, <strong>la</strong> prima o<strong>per</strong>azione consiste nel<br />

se<strong>le</strong>zionare il sottoinsieme di testi su cui <strong>la</strong>vorare: <strong>corpus</strong> scritto o ora<strong>le</strong>. Effettuata questa scelta, è<br />

possibi<strong>le</strong> <strong>la</strong>vorare sull’intero insieme di testi (opzione di default) o se<strong>le</strong>zionarlo ulteriormente in<br />

base a:<br />

! tipo di testo;<br />

! caratteristiche <strong>del</strong>l’apprendente: età, lingua madre, livello di competenza;<br />

! modalità di ri<strong>le</strong>vamento (longitudina<strong>le</strong> o trasversa<strong>le</strong>);<br />

! modalità di scambio (monodireziona<strong>le</strong> o bidireziona<strong>le</strong>).<br />

Nel<strong>le</strong> figg. 1 e 2 sono riprodotte <strong>le</strong> maschere di se<strong>le</strong>zione re<strong>la</strong>tive al <strong>corpus</strong> scritto e ora<strong>le</strong>:<br />

8


Figura 1. Maschera di se<strong>le</strong>zione <strong>del</strong> <strong>corpus</strong> scritto<br />

Figura 2. Maschera di se<strong>le</strong>zione <strong>del</strong> <strong>corpus</strong> ora<strong>le</strong><br />

Ciascun testo corrisponde a un n. di fi<strong>le</strong>. La numerazione parte da 1 sia <strong>per</strong> il <strong>corpus</strong> scritto sia <strong>per</strong><br />

quello ora<strong>le</strong>. Nel<strong>le</strong> citazioni di brani tratti da ADIL2 in questo volume, salvo diversa indicazione<br />

<strong>del</strong>l’autore, sarà specificato il <strong>corpus</strong> e il n. fi<strong>le</strong>, <strong>per</strong> es. [SC 234]; [OR 56].<br />

3.2 Lettura, <strong>ricerca</strong> semplice, <strong>ricerca</strong> avanzata<br />

Una volta se<strong>le</strong>zionati i testi è possibi<strong>le</strong> scegliere tre modalità di accesso ai dati: <strong>le</strong>ttura,<br />

<strong>ricerca</strong> semplice e <strong>ricerca</strong> avanzata. La modalità <strong>le</strong>ttura consente, nel caso <strong>del</strong><strong>le</strong> produzioni<br />

scritte, di visualizzare il testo e varie informazioni sul<strong>la</strong> mise en page (cancel<strong>la</strong>ture, sostituzioni,<br />

aggiunte interlineari, paro<strong>le</strong> di dubbia <strong>le</strong>ttura o non comprensibili) e sul<strong>le</strong> incertezze ortografiche<br />

9


(concrezioni, discrezioni). Nel caso dei testi orali <strong>le</strong> trascrizioni sono associate ai corrispondenti fi<strong>le</strong><br />

audio/video: nel<strong>la</strong> cornice di sinistra compare <strong>la</strong> trascrizione, in quel<strong>la</strong> di destra è possibi<strong>le</strong> attivare<br />

l’ascolto o <strong>la</strong> visione <strong>del</strong> fi<strong>le</strong>. La possibilità di accesso diretto ai fi<strong>le</strong> multimediali ha consentito di<br />

semplificare <strong>le</strong> convenzioni di trascrizione e di ricorrere all’ortografia standard affiancata da pochi<br />

simboli, che si riportano nel<strong>le</strong> tabel<strong>le</strong> 4, 5 e 6:<br />

Tabel<strong>la</strong> 4. Convenzioni di trascrizione e visualizzazione comuni ai testi orali e scritti<br />

Fenomeno Simbolo / Visualizzazione Esempio<br />

Inserti in L1 <strong>del</strong>l’informante colore blu Un po' più tardi ein Jaeger passa<br />

Inserti in L2 <strong>del</strong>l’informante colore rosso ehm quindi , ehm quando sono vicini ,<br />

character [#] altre , va bene<br />

Cambio di tema 16 ÷ sì , <strong>per</strong>ché ehm [#] ho abito nel<strong>la</strong><br />

famiglia belgi . ho: ÷ no , sono andato<br />

a un scuo<strong>la</strong> belgi .<br />

Falsa partenza 17 @ ehm io drit¦ @ io ha dritto .<br />

Riferimento metalinguistico 18 corsivo sì , ehm primo ci sono quattre ragazze<br />

. e loro fanno una gherra con neve .<br />

ehm loro <strong>la</strong>nsano <strong>la</strong>nciano ?<br />

paro<strong>la</strong> il<strong>le</strong>ggibi<strong>le</strong> o<br />

incomprensibi<strong>le</strong> /<br />

cancel<strong>la</strong>tura irrecu<strong>per</strong>abi<strong>le</strong><br />

{xxx}<br />

numero di x corrispondente<br />

grosso modo al numero di<br />

grafemi / fonemi non<br />

recu<strong>per</strong>abili<br />

lo portò a casa sua, e gli dare (pass.<br />

remoto) tante cose da mangiare <strong>per</strong><br />

guarire<br />

Per me,{xxxxx} penso che è un'iptesi<br />

alta<br />

Trascrizione alternativa in<br />

caso di dubbi<br />

testo tra parentesi graffe ma:: [#] qua {va} a Siena ?<br />

Ricostruzione congettura<strong>le</strong> testo tra parentesi graffe Le <strong>per</strong>soni {f}anno a pa<strong>la</strong>volo<br />

Tabel<strong>la</strong> 5. Convenzioni di trascrizione e visualizzazione usate solo nei testi orali<br />

Fenomeno Simbolo / Visualizzazione Esempio<br />

Tonia esc<strong>la</strong>mativa !<br />

Tonia interrogativa ?<br />

Tonia conclusiva .<br />

Tonia sospensiva … A:- ieri sono andato a Roma…<br />

B:- mhm mhm<br />

A:- [+] e ho fatto shopping<br />

Giuntura sintattica , Senti , che pensi di questa cosa?<br />

Domande a coda ¿ xxx ? vedi che lui ha un libro in mano ¿ no ?<br />

16<br />

Il par<strong>la</strong>nte cambia spontaneamente il topic e passa a un nuovo tema che può essere anche vagamente corre<strong>la</strong>to<br />

all’argomento precedente.<br />

17<br />

Riformu<strong>la</strong>zione <strong>del</strong>lo stesso concetto con altre paro<strong>le</strong> nello stesso enunciato, diverso dal cambio di progetto che è<br />

anche un cambio di topic e dall’autointerruzione che è una vera e propria interruzione<br />

18<br />

Casi in cui il par<strong>la</strong>nte o lo scrivente, con un’intonazione partico<strong>la</strong>re o altri segnali grafici o paralinguistici cerca di<br />

attirare l’attenzione <strong>del</strong>l’interlocutore sul<strong>la</strong> forma linguistica. Il primo esempio è tratto da un testo ora<strong>le</strong>, il secondo da<br />

un testo scritto.<br />

10


Pausa (breve, media lunga) [#][##][###] in base al<strong>la</strong><br />

durata<br />

sì , ma: [##] non sono in contatto .<br />

Tenuta vocalica : :: ::: in base al<strong>la</strong> durata tu hai fatto qualcosa di: ehm piacevo<strong>le</strong><br />

Sovrapposizione [//] RIC: che [//] che [//] che cosa hai<br />

fatto a Venezia ?<br />

MON: [//] sì [//] . Venezia [#] va bene<br />

. molto bel<strong>la</strong> .<br />

Autointerruzione [///] A:- Ieri sono andato a Roma [///]<br />

A:- ma che è ‘sto rumore?<br />

Eterointerruzione [/]<br />

A:- Ieri sono andato a Roma [/]<br />

B:- ieri?<br />

A:- sì<br />

Autocomp<strong>le</strong>tamento [+]<br />

MER: in strada .<br />

ma in au<strong>la</strong> che è più tranquillo .<br />

più faci<strong>le</strong> di di ...<br />

KRY: ah , va bene .<br />

MER: [+] registrare .<br />

Eterocomp<strong>le</strong>tamento [++]<br />

MON: Italia par<strong>la</strong>no qui in Italia [/]<br />

RIC: [++] e basta !<br />

MON: lo so , lo so.<br />

Annotazioni, glosse e altre<br />

colore vio<strong>la</strong><br />

e poi [simu<strong>la</strong> reazione di spavento] .<br />

informazioni<br />

para/extralinguistiche,<br />

ha paura .<br />

minutaggio 19<br />

Interruzione di paro<strong>la</strong> | MON: [//] no [//] saluti .<br />

spettià | spettano ?<br />

Caratteri fonetici 20 corpo maggiore grassetto se c'è anche ehm altra film @ cassetta<br />

<strong>per</strong> città . si chiama derEZ<br />

Click avulsivo |\ ah {e i:} [##] |\ , rega<strong>le</strong> @ regali @<br />

i regali .<br />

Tabel<strong>la</strong> 6. Convenzioni di trascrizione e visualizzazione usate solo nei TESTI SCRITTI<br />

Fenomeno Simbolo / Visualizzazione Esempio<br />

concrezioni colore verde Hao arrivato in corea adesso. ti sentireo il <strong>la</strong><br />

mancanza, <strong>per</strong>ché ti bene di tutto cioché ha fatto<br />

<strong>per</strong> me<br />

discrezioni colore verde Perche durante <strong>le</strong> state il mio paese è bellissimo<br />

cancel<strong>la</strong>ture testo barrato <strong>per</strong> <strong>la</strong> prima volta lo avevo garud visto in Italia<br />

aggiunte<br />

interlineari<br />

testo in apice tra barre<br />

trasversali<br />

sovrascrittura testo originario in pedice,<br />

testo sovrascritto in apice<br />

tra parentesi<br />

punto o serie di<br />

···<br />

punti con<br />

il primo \ ipotesa / mostra che <strong>la</strong> popo<strong>la</strong>zione<br />

<strong>del</strong>l'Italia aumenterà molto<br />

Questa estate. sono andata<br />

azzurra. azzura<br />

(ho viaggiato)<br />

al<strong>la</strong> costa<br />

Questo, è un motivo <strong>per</strong> <strong>la</strong> gente di venire<br />

a <strong>la</strong>vorare al<strong>la</strong> Italia; <strong>le</strong> <strong>per</strong>sone <strong>del</strong><strong>le</strong> paese poberi<br />

19 I tag re<strong>la</strong>tivi al minutaggio sono inseriti nel<strong>la</strong> trascrizione ad intervalli di tre minuti e indicano i secondi trascorsi<br />

dall’inizio <strong>del</strong> fi<strong>le</strong> audio video: servono a facilitare l’abbinamento trascrizione / ascolto. Naturalmente glosse,<br />

spiegazioni di fenomeni paralinguistici, minutaggi e tutto quanto visualizzato in vio<strong>la</strong> è escluso dal<strong>le</strong> ricerche.<br />

20 Essendo possibi<strong>le</strong> ascoltare l’audio i caratteri fonetici sono stati usati solo in caso di effettiva necessità. I simboli usati<br />

sono quelli <strong>del</strong>l’alfabeto SAMPA (Speech Assessment Methods Phonetic Alphabet). Maggiori informazioni al riguardo<br />

si possono trovare in rete agli indirizzi e <br />

11


funzione non<br />

demarcativa di<br />

<strong>per</strong>iodo<br />

· ·· ma <strong>per</strong> altro posto, <strong>la</strong> Italia non è molto<br />

economica <strong>per</strong> vivere ··· ma comunque<br />

anche posto di <strong>la</strong>voro è attrativo<br />

fine pagina [||] "Perciò voglio ti sentire meglio" risponde il lupo.[||]<br />

Finalmente <strong>la</strong> ragazza chiede<br />

Ecco un esempio di trascrizione <strong>del</strong> <strong>corpus</strong> scritto [testo espositivo di un informante ing<strong>le</strong>se<br />

diciannovenne, principiante]:<br />

A) Penso che <strong>le</strong> popo<strong>la</strong>zioni nel in tutto il mondo diventa più<br />

ma il cambio grande fra 2000 e 2001 è <strong>per</strong>ché<br />

<strong>la</strong> gente ha voluto avere bambini ÷ si sono nati nel anno<br />

2000. Era un anno molto specia<strong>le</strong>. L'inizio <strong>del</strong><strong>la</strong> nuovea<br />

mil<strong>le</strong>nia.<br />

C'è anche il prob<strong>le</strong>ma con <strong>le</strong> gravidanze nei giovani è<br />

i Catolici non gli piaciono \ loro / gli aborti.<br />

La popolzione cresce <strong>per</strong>ché gli stranieri vengono dei paesi<br />

più poveri e fanno tanti bambini.<br />

Non è <strong>la</strong> colpa degli italiani <strong>per</strong>ché in graffico 2 si puo<br />

vedere che se non ci sono gli stranieri, <strong>la</strong> popo<strong>la</strong>zione<br />

sarà meno di solito.<br />

È molto interessante che gli italiani L'italia ha il <strong>per</strong>cento<br />

di c gli italiani fanno più bambini <strong>del</strong> mondo.<br />

B) Scelgo l'ipotesi media. La popo<strong>la</strong>zione crescerà, è sono sicuro.<br />

Gli stranieri \ ci / continueranno {x} venire {x} con <strong>le</strong> loro famiglie<br />

e continueranno fare bambini ma fra pochi anni qualche<br />

anno, sarà detrimorta<strong>le</strong> <strong>per</strong> L'Italia <strong>per</strong>ché il paese non<br />

avrà il forte <strong>per</strong> vivere in salute. Eventualmente il governo<br />

dovrà fermare gli immigrati che \ lo / abusano e <strong>la</strong>vorano nero.<br />

Dovrà anche fermare dare i soldi troppo liberalmente agli stranieri. [23]<br />

e uno di trascrizione <strong>del</strong>l’ora<strong>le</strong> [intervista a GON, portoghese, 23 anni, principiante]:<br />

RIC:<br />

a te ti piace il cinema ?<br />

GON:<br />

sì !<br />

muito .<br />

RIC:<br />

molto .<br />

GON:<br />

muito .<br />

RIC:<br />

ehm lo sai che oggi vedremo un film ?<br />

GON:<br />

ehm: [//] sì [//] , sì .<br />

RIC:<br />

[//] in c<strong>la</strong>sse [//] .<br />

ah .<br />

GON:<br />

ma: non lo so che: che film ...<br />

RIC:<br />

ehm forse un film di Benigni .<br />

GON:<br />

La Vita è Bel<strong>la</strong> ?<br />

RIC:<br />

no .<br />

GON:<br />

Un Mostro ?<br />

RIC:<br />

Il Mostro .<br />

GON:<br />

Il Mostro .<br />

RIC:<br />

12


l'hai visto ?<br />

GON:<br />

sì , è muy bello .<br />

RIC:<br />

ehm o forse un altro film se riesco a trovarlo .<br />

<strong>per</strong>ò ancora non l'ho trovato .<br />

quindi <strong>per</strong> adesso ho preso Il Mostro .<br />

poi: [//] [#] [//] vediamo .<br />

GON:<br />

[//] okay [//] .<br />

RIC:<br />

senti , ehm sei stato al cinema qui te: ?<br />

GON:<br />

no , [//] no [//] .<br />

RIC:<br />

[//] mai [//] ?<br />

GON:<br />

ehm: nunca @ mai .<br />

ehm <strong>per</strong>ché: non mi piace: ehm:: guardare <strong>la</strong>:: lo:: cine [//] [#] [//] ehm:: ehm italiano . [105]<br />

Ricerca semplice<br />

La modalità <strong>ricerca</strong> semplice, <strong>le</strong> cui maschere sono riprodotte nel<strong>le</strong> fig. 3 (<strong>corpus</strong> scritto) e 4<br />

(<strong>corpus</strong> ora<strong>le</strong>), consente di eseguire <strong>le</strong> seguenti o<strong>per</strong>azioni:<br />

! cercare paro<strong>le</strong>, gruppi di paro<strong>le</strong> adiacenti, frasi. Digitando “casa” si ottengono tutti i contesti in cui <strong>la</strong><br />

paro<strong>la</strong> compare; digitando “<strong>la</strong> casa di Cappuccetto Rosso” si ottengono tutte i contesti in cui compare<br />

l’espressione;<br />

! cercare parti di paro<strong>le</strong>. Come caratteri jolly sono disponibili “$” (qualsiasi carattere) e “*” (qualsiasi<br />

sequenza di caratteri); quindi cercando “cas$” si ottengono tutti i contesti di casa /case / caso ecc. cercando<br />

“cas*” si ottengono tutti i contesti di casa /case / casetta / castello / castoro ecc. È possibi<strong>le</strong> escludere dai<br />

risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> alcune paro<strong>le</strong>. In questo caso occorre separare con un punto e virgo<strong>la</strong> (senza spazio) <strong>le</strong><br />

paro<strong>le</strong> da escludere. Per es., <strong>per</strong> <strong>ricerca</strong>re <strong>le</strong> forme verbali al gerundio posso impostare come <strong>ricerca</strong> <strong>la</strong> stringa<br />

“*ndo” ed escludere dai risultati paro<strong>le</strong> di disturbo come quando;mando;fondo;mondo ecc.<br />

! generare concordanze e liste di frequenza. Digitando come stringa di <strong>ricerca</strong> il solo carattere “*” si<br />

ottengono <strong>le</strong> concordanze o <strong>le</strong> liste di frequenza <strong>del</strong>l’intero <strong>corpus</strong> se<strong>le</strong>zionato (v. infra <strong>per</strong> maggiore<br />

dettagli).<br />

! cercare combinazioni di due paro<strong>le</strong> non adiacenti (cerca paro<strong>la</strong>1 e paro<strong>la</strong>2 separate da N paro<strong>le</strong>).<br />

L’indicatore di prossimità (n. di paro<strong>le</strong> che separano “paro<strong>la</strong>1” e “paro<strong>la</strong>2”) è modificabi<strong>le</strong> dall’utente.<br />

! cercare varianti di paro<strong>le</strong> (cerca paro<strong>la</strong>1 oppure paro<strong>la</strong>2). Questa funzione è partico<strong>la</strong>rmente uti<strong>le</strong> in un<br />

<strong>corpus</strong> acquisiziona<strong>le</strong> <strong>per</strong> cercare varianti grafiche di una paro<strong>la</strong>, <strong>per</strong> es. casa, caza, chasa;<br />

! escludere alcuni contesti. In una <strong>ricerca</strong> su casa posso escludere tutti i contesti in cui <strong>la</strong> paro<strong>la</strong> è preceduta<br />

dall’articolo <strong>la</strong> (cerca paro<strong>la</strong>2 non preceduta da paro<strong>la</strong>1), oppure tutti i contesti in cui <strong>la</strong> paro<strong>la</strong> è seguita dal<strong>la</strong><br />

preposizione di (cerca paro<strong>la</strong>1 non seguita da paro<strong>la</strong>2);<br />

! generare il contesto sinistro (cerca paro<strong>la</strong>2 preceduta da qualunque paro<strong>la</strong>) o destro (cerca paro<strong>la</strong>1 seguita da<br />

qualunque paro<strong>la</strong>). Per es. posso ottenere <strong>la</strong> lista in ordine alfabetico tutte <strong>le</strong> paro<strong>le</strong> che seguono il verbo voglio<br />

(<strong>per</strong> es. <strong>per</strong> vedere con quali verbi è usato il moda<strong>le</strong>) oppure tute <strong>le</strong> paro<strong>le</strong> che precedono il participio andato<br />

(<strong>per</strong> es. <strong>per</strong> una <strong>ricerca</strong> sull’ausiliare);<br />

Nel <strong>corpus</strong> ora<strong>le</strong> è possibi<strong>le</strong>, se<strong>le</strong>zionando <strong>la</strong> casel<strong>la</strong> di controllo, escludere dal<strong>le</strong> ricerche i turni di<br />

paro<strong>la</strong> <strong>del</strong>l’intervistatore.<br />

13


Figura 3. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> semplice (<strong>corpus</strong> scritto)<br />

Figura 4. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> semplice (<strong>corpus</strong> ora<strong>le</strong>)<br />

Risultati <strong>del</strong><strong>le</strong> ricerche<br />

Le figg. 5 e 6 mostrano i risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> <strong>del</strong><strong>la</strong> paro<strong>la</strong> casa in un testo scritto e in uno<br />

ora<strong>le</strong>. Come si vede, nel<strong>la</strong> cornice in basso compaiono tutti i risultati. Il contesto, cioè <strong>la</strong> forma o <strong>le</strong><br />

forme corrispondenti al<strong>la</strong> stringa di <strong>ricerca</strong> digitata, è presente nell’ultima colonna a destra,<br />

preceduto da informazioni sul testo e sull’informante (n. fi<strong>le</strong>, sotto<strong>corpus</strong>, tipo testua<strong>le</strong>, modalità di<br />

scambio, lingua madre, età, livello di competenza). Di default i risultati appaiono ordinati secondo il<br />

n. di fi<strong>le</strong>, ma possono essere ordinati <strong>per</strong> uno qualsiasi degli altri campi cliccando sul capo colonna<br />

corrispondente. Se<strong>le</strong>zionando uno dei risultati, nel<strong>la</strong> cornice in alto appare il contesto ampio, con <strong>la</strong><br />

forma <strong>ricerca</strong>ta evidenziata in giallo (scorrendo in alto e in basso si può <strong>le</strong>ggere l’intero testo). Nel<br />

14


caso dei testi orali (fig. 6) <strong>la</strong> cornice di sinistra contiene <strong>la</strong> trascrizione, quel<strong>la</strong> di destra consente di<br />

aprire il fi<strong>le</strong> multimedia<strong>le</strong> con <strong>la</strong> registrazione audio/video 21 . In basso a sinistra sono visualizzate <strong>le</strong><br />

occorrenze totali risultanti dal<strong>la</strong> <strong>ricerca</strong> (nei nostri ess. casa compare 971 volte nel <strong>corpus</strong> scritto,<br />

324 nel <strong>corpus</strong> ora<strong>le</strong>).<br />

Figura 5. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “casa” nel <strong>corpus</strong> scritto<br />

Figura 6. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “casa”nel <strong>corpus</strong> ora<strong>le</strong><br />

Salvataggio dei risultati <strong>del</strong><strong>le</strong> ricerche<br />

Agendo sull’icona <strong>del</strong> floppy disk in basso a destra (fig. 7) i risultati di una <strong>ricerca</strong> possono<br />

essere salvati in un fi<strong>le</strong> di formato .txt. Nel<strong>la</strong> finestra di salvataggio, se<strong>le</strong>zionando <strong>le</strong> varie<br />

possibilità e<strong>le</strong>ncate in “salva come” è possibi<strong>le</strong> specificare quali informazioni trasferire su fi<strong>le</strong>: tutte<br />

<strong>le</strong> colonne, il n. fi<strong>le</strong> e il contesto, il solo contesto o <strong>la</strong> lista di frequenza.<br />

21 Nel<strong>le</strong> trascrizioni sono stati inseriti ogni 180 secondi dei tag che indicano i secondi trascorsi dall’inizio <strong>del</strong> fi<strong>le</strong>, <strong>per</strong><br />

facilitare il ritrovamento <strong>del</strong><strong>la</strong> stringa di testo evidenziata sul fi<strong>le</strong> audio-video.<br />

15


Per salvare su fi<strong>le</strong> <strong>le</strong> concordanze, dopo aver digitato come stringa di <strong>ricerca</strong> il carattere *, cliccare<br />

sull’icona <strong>del</strong> floppy disk e se<strong>le</strong>zionare nel menù a scorrimento “salva come” l’opzione “numero<br />

fi<strong>le</strong> e contesto”, oppure “tutte <strong>le</strong> colonne” (esempi dei fi<strong>le</strong> risultanti nel<strong>le</strong> figg. 8 e 9).<br />

Per salvare su fi<strong>le</strong> una lista di frequenza procedere come <strong>per</strong> <strong>le</strong> concordanze, ma se<strong>le</strong>zionare nel<br />

menù a scorrimento “salva come” l’opzione “lista di frequenza” (esempi dei fi<strong>le</strong> risultanti nel<strong>la</strong> fig.<br />

10).<br />

Fig. 7. Modalità di salvataggio su fi<strong>le</strong><br />

Figura 8. Salvataggio di concordanze con l’opzione “tutte <strong>le</strong> colonne”<br />

fi<strong>le</strong> tipo testua<strong>le</strong> madrelingua età livello forma<br />

0889 narrativo2 ing<strong>le</strong>se 20 2-e<strong>le</strong>mentare abbraccio<br />

0163 argomentativo cinese 26 2-e<strong>le</strong>mentare abbraccione<br />

0248 argomentativo ing<strong>le</strong>se 26 2-e<strong>le</strong>mentare abbraccione<br />

0979 narrativo2 albanese 19 4-avanzato abbracciono<br />

0742 prescrittivo albanese 32 altro Abbraci<br />

0793 narrativo2 coreano 29 1-principiante abbracia<br />

0793 narrativo2 coreano 29 1-principiante abbracia<br />

0909 narrativo2 bulgaro 18 2-e<strong>le</strong>mentare abbraciare<br />

1010 narrativo2 francese 25 4-avanzato abbraciare<br />

1015 narrativo2 ing<strong>le</strong>se 22 4-avanzato abbraciatti<br />

0170 argomentativo po<strong>la</strong>cco 21 3-intermedio abbracio<br />

0222 argomentativo russo 32 4-avanzato abbracio<br />

0947 narrativo2 greco 20 3-intermedio abbraciò<br />

Figura 9. Salvataggio di concordanze con l’opzione “numero fi<strong>le</strong> e contesto”<br />

0889 abbraccio<br />

0163 abbraccione<br />

0248 abbraccione<br />

16


0979 abbracciono<br />

0742 Abbraci<br />

0793 abbracia<br />

0793 abbracia<br />

0909 abbraciare<br />

1010 abbraciare<br />

1015 abbraciatti<br />

0170 abbracio<br />

0222 abbracio<br />

0947 abbraciò<br />

Figura 10. Salvataggio di una lista di frequenza<br />

prime 20 forme <strong>per</strong> frequenza nel <strong>corpus</strong> scritto prime 20 forme <strong>per</strong> frequenza nel <strong>corpus</strong> ora<strong>le</strong><br />

5938 e<br />

5888 <strong>la</strong><br />

4502 il<br />

4054 di<br />

3192 che<br />

3184 è<br />

2785 a<br />

2726 un<br />

2421 <strong>per</strong><br />

2229 in<br />

1966 sono<br />

1951 nonna<br />

1941 ha<br />

1919 non<br />

1871 una<br />

1463 si<br />

1425 era<br />

1359 lupo<br />

1357 ma<br />

1302 Con<br />

8303 sì<br />

4437 ehm<br />

4398 è<br />

3889 non<br />

3662 e<br />

2492 no<br />

2278 ma<br />

2265 <strong>la</strong><br />

2166 un<br />

1968 che<br />

1942 <strong>per</strong><br />

1773 a<br />

1749 di<br />

1697 <strong>per</strong>ché<br />

1625 il<br />

1608 in<br />

1451 mhm<br />

1445 io<br />

1235 ho<br />

1222 sono<br />

In modalità <strong>ricerca</strong> semplice è possibi<strong>le</strong> individuare alcuni fenomeni segna<strong>la</strong>ti da caratteri o<br />

sequenze di caratteri speciali, già illustrati nel<strong>le</strong> convenzioni di trascrizione (v. tabel<strong>le</strong> 4, 5 e 6).<br />

Poiché alcuni di questi caratteri non sono presenti sul<strong>la</strong> tastiera <strong>del</strong> PC, si sono riprodotti nel<strong>la</strong><br />

maschera di <strong>ricerca</strong>. Per inserirli nel<strong>la</strong> finestra di <strong>ricerca</strong> è sufficiente fare su di essi doppio clic. A<br />

parte il carattere ÷, che segna<strong>la</strong> il cambio di tema ed è comune ai testi scritti e orali, <strong>per</strong> il resto si<br />

tratta di convenzioni di trascrizione utilizzate solo <strong>per</strong> i testi orali. Riportiamo di seguito i fenomeni<br />

<strong>ricerca</strong>bili grazie ai caratteri speciali 22 :<br />

Tabel<strong>la</strong> 4. Caratteri speciali <strong>per</strong> <strong>la</strong> <strong>ricerca</strong><br />

Fenomeno carattere (o stringa di caratteri) di <strong>ricerca</strong><br />

Falsa partenza @<br />

Tonia esc<strong>la</strong>mativa !<br />

Tonia interrogativa ?<br />

Tonia conclusiva .<br />

Tonia sospensiva …<br />

Giuntura sintattica ,<br />

Domande a coda ¿*?<br />

Pausa [#] breve, [##] media, [###] lunga<br />

Tenuta vocalica : breve, :: media, ::: lunga<br />

22 Nei testi scritti alcuni di questi caratteri sono usati come segni di interpunzione o come simboli paragrafematici.<br />

17


Ricerca avanzata<br />

Sovrapposizione [//]<br />

Autointerruzione [///]<br />

Eterointerruzione [/]<br />

Autocomp<strong>le</strong>tamento [+]<br />

Eterocomp<strong>le</strong>tamento [++]<br />

Interruzione di paro<strong>la</strong> |<br />

Altri fenomeni di interesse linguistico sono stati marcati in modo non visibi<strong>le</strong> <strong>per</strong> l’utente, e sono<br />

recu<strong>per</strong>abili in modalità <strong>ricerca</strong> avanzata. Qui di seguito sono riprodotte <strong>le</strong> maschere di <strong>ricerca</strong><br />

avanzata re<strong>la</strong>tive al <strong>corpus</strong> scritto (fig. 11) e ora<strong>le</strong> (fig. 12) dal<strong>le</strong> quali si può ricavare il set di<br />

fenomeni <strong>ricerca</strong>bili:<br />

Figura 11. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> avanzata nel <strong>corpus</strong> scritto<br />

18


Figura 12. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> avanzata nel <strong>corpus</strong> ora<strong>le</strong><br />

Se<strong>le</strong>zionando un e<strong>le</strong>mento <strong>del</strong><strong>la</strong> lista si ottengono tutti i contesti in cui compare il fenomeno, <strong>per</strong> es.<br />

tutte <strong>le</strong> cancel<strong>la</strong>ture; in alternativa è possibi<strong>le</strong> restringere <strong>la</strong> <strong>ricerca</strong> digitando anche una stringa di<br />

caratteri: <strong>per</strong> es. nel<strong>la</strong> fig. 13 vediamo i risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> dei soli contesti di cancel<strong>la</strong>ture<br />

contenenti il testo “ho”.<br />

Statistiche<br />

Figura 13. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “cancel<strong>la</strong>ture” contenenti il testo “ho”<br />

Se<strong>le</strong>zionando <strong>la</strong> voce “statistiche”, è possibi<strong>le</strong> ottenere <strong>le</strong> seguenti misurazioni sul <strong>corpus</strong><br />

se<strong>le</strong>zionato:<br />

Corpus scritto Corpus ora<strong>le</strong><br />

Numero di testi Numero di testi<br />

Numero di <strong>per</strong>iodi Numero di enunciati<br />

19


Numero di paro<strong>le</strong> (tokens) Numero di turni di paro<strong>la</strong><br />

Media <strong>per</strong>iodi <strong>per</strong> testo Numero di paro<strong>le</strong> (tokens)<br />

Media paro<strong>le</strong> <strong>per</strong> <strong>per</strong>iodo Media enunciati <strong>per</strong> testo<br />

Lunghezza media <strong>del</strong><strong>le</strong> paro<strong>le</strong> Media enunciati <strong>per</strong> turno di paro<strong>la</strong><br />

Media paro<strong>le</strong> <strong>per</strong> enunciato<br />

Lunghezza media <strong>del</strong><strong>le</strong> paro<strong>le</strong><br />

Nel <strong>corpus</strong> scritto i confini di <strong>per</strong>iodo sono individuati automaticamente dal programma come<br />

sequenze di paro<strong>le</strong> comprese tra un punto, un punto esc<strong>la</strong>mativo o interrogativo e un altro punto,<br />

punto esc<strong>la</strong>mativo o interrogativo. Poiché <strong>per</strong> ragioni di attendibilità filologica <strong>del</strong><strong>le</strong> trascrizioni non<br />

si è intervenuti sull’uso di maiusco<strong>le</strong>, segni di interpunzione ecc. i risultati di questa misurazione<br />

possono in alcuni casi dipendere dall’usus scribendi <strong>del</strong>l’apprendente. L’unico intervento effettuato<br />

<strong>per</strong> rendere più attendibi<strong>le</strong> <strong>la</strong> misura è stato quello di utilizzare un carattere <strong>le</strong>ggermente diverso (un<br />

punto sovrascritto) <strong>per</strong> gli usi non demarcativi <strong>del</strong> punto, <strong>per</strong> es. <strong>per</strong> serie di punti sospensivi non<br />

corrispondenti a un confine di frase, serie di punti introdotti dallo scrivente <strong>per</strong> altri scopi, come ad<br />

es. segna<strong>la</strong>re abbreviazioni, unire dati o creare un e<strong>le</strong>nco puntato. Nel <strong>corpus</strong> ora<strong>le</strong> i confini di<br />

enunciato sono stati individuati e marcati manualmente sul<strong>la</strong> base di criteri fondamentalmente<br />

prosodici (profilo intonativo, pause), integrati dove necessario da considerazioni semantiche<br />

(comp<strong>le</strong>tezza <strong>del</strong><strong>la</strong> struttura predicativa, compiutezza semantica) 23 .<br />

4. Materiali di supporto<br />

Nel DVD è presente una cartel<strong>la</strong> con questo nome contenente i seguenti fi<strong>le</strong>:<br />

! guida all’uso di ADIL2 (tratta dal<strong>la</strong> presente introduzione);<br />

! consegne <strong>del</strong><strong>le</strong> prove scritte;<br />

! immagini <strong>del</strong><strong>le</strong> vignette, foto o altre illustrazioni utilizzate <strong>per</strong> elicitare <strong>la</strong> narrazione di<br />

una storia;<br />

! <strong>descrizione</strong> <strong>del</strong><strong>le</strong> scene di film utilizzate <strong>per</strong> elicitare <strong>la</strong> narrazione di una storia;<br />

! database degli informanti, da cui si possono ricavare ulteriori notizie sull’informante<br />

oltre a quel<strong>le</strong> utili <strong>per</strong> se<strong>le</strong>zionare il <strong>corpus</strong> (età, sesso, lingua madre, livello di<br />

competenza). Per es. si possono ricavare notizie sul<strong>la</strong> professione, il titolo di studio, il<br />

numero di altre lingue straniere conosciute, eventuali origini italiane, <strong>le</strong> motivazioni che<br />

lo hanno indotto a studiare <strong>la</strong> nostra lingua, il tipo di contatto preva<strong>le</strong>nte con lingua<br />

italiana in patria ecc.<br />

! e<strong>le</strong>nco <strong>del</strong><strong>le</strong> convenzioni di trascrizione e visualizzazione;<br />

! e<strong>le</strong>nco dei fonosimboli;<br />

23 Sul<strong>la</strong> comp<strong>le</strong>ssità connessa al<strong>la</strong> definizione di enunciato e, conseguentemente, all’individuazione dei confini di<br />

enunciato nel par<strong>la</strong>to cfr. Cresti 2000: vol. I, 39-63.<br />

20


! e<strong>le</strong>nco <strong>del</strong><strong>le</strong> lingue madri degli informanti e re<strong>la</strong>tivi codici ISO.<br />

Riferimenti bibliografici<br />

Ambroso S. - Bonvino E. 2009, Configurazioni di discorso. Un’unità di analisi <strong>del</strong> par<strong>la</strong>to L2, in<br />

Andorno - Rastelli 2009: 153-177.<br />

Andorno C. - Rastelli S. (a c. di) 2009, Atti <strong>del</strong> convegno Corpora di italiano L2: tecnologie,<br />

metodi, spunti tecnici. Pavia 22-23 novembre 2007, Perugia, Guerra.<br />

Barbera M. – Marello C., 2004, VALICO (Varietà di Apprendimento <strong>del</strong><strong>la</strong> Lingua Italiana Corpus<br />

Online): una presentazione, «ITALS» 4, Guerra, Perugia.<br />

Barni M. - Gallina F. 2008, Le paro<strong>le</strong> degli stranieri: il LIPS, il primo <strong>le</strong>ssico di frequenza<br />

<strong>del</strong>l’italiano par<strong>la</strong>to dagli stranieri, in: M. Barni - D. Troncarelli - C. Bagna (a c. di),<br />

Lessico e apprendimenti. Il ruolo <strong>del</strong> <strong>le</strong>ssico nel<strong>la</strong> linguistica educativa, Mi<strong>la</strong>no, Franco<br />

Angeli: 143-156.<br />

Barni M., Gallina F. 2009, Il <strong>corpus</strong> LIPS (Lessico <strong>del</strong>l’italiano par<strong>la</strong>to da stranieri): prob<strong>le</strong>mi di<br />

trattamento <strong>del</strong><strong>le</strong> forme e di <strong>le</strong>mmatizzazione, in C. Andorno e S. Rastelli (a c. di) 2009: 139-<br />

151.<br />

Cassandro M, Apprendimento in contesto guidato: l’im<strong>per</strong>fetto in italiano L2, Tesi di dottorato in<br />

Linguistica e didattica <strong>del</strong><strong>la</strong> lingua italiana a stranieri (XII ciclo), Tutor M. Benedetti,<br />

discussa nell’a.a. 200-2001.<br />

Cresti E. 2000, Corpus di italiano par<strong>la</strong>to. Volume I. Introduzione. Volume II. Campionamenti,<br />

Firenze, Accademia <strong>del</strong><strong>la</strong> Crusca.<br />

Ferreiro E. / Pontecorvo C. et alii, 1996, Cappuccetto Rosso impara a scrivere, Firenze, La Nuova<br />

Italia.<br />

Granger S. 2004, Computer <strong>le</strong>arner <strong>corpus</strong> research: current status and future prospectives, in: U.<br />

Connor - T. Utpon (a c. di) Applied Corpus Linguistics: A Multidimensional Perspective,<br />

Amsterdam – At<strong>la</strong>nta, Rodopi: 123-145.<br />

Lo Duca M. G., 1998, Testi narrativi in apprendenti l’italiano come L2: resoconto di una <strong>ricerca</strong> in<br />

corso, «Études romanes» 42: 281-94.<br />

Pa<strong>le</strong>rmo M. - Troncarelli D. – Petrocelli E. (in stampa), Le ricadute <strong>del</strong>l’input sull’output: aspetti<br />

<strong>del</strong><strong>la</strong> coesione nei libri di testo e nel<strong>le</strong> produzioni di apprendenti di Italiano L2 e L1, in: Atti<br />

<strong>del</strong> convegno-seminario Interazione didattica e apprendimento linguistico, Università degli<br />

studi di Bergamo 17-18 giugno 2008 (in stampa).<br />

Pa<strong>le</strong>rmo M., 2005, L’ADIL2 (Archivio Digita<strong>le</strong> di Italiano L2), «Studi Italiani di Linguistica<br />

Teorica e applicata» XXXIV 2005: 357-73.<br />

Pa<strong>le</strong>rmo M., 2006, Sul<strong>la</strong> costruzione <strong>del</strong> <strong>per</strong>iodo ipotetico in italiano L2, «Studi Italiani di<br />

Linguistica Teorica e applicata» XXXV 2006: 389-404.<br />

Rossini Favretti R. (a c. di) 2000 = Linguistica e informatica. Corpora, multimedialità e <strong>per</strong>corsi di<br />

apprendimento, Roma, Bulzoni.<br />

Vedovelli M. 2006, Il LIPS - Lessico di frequenza <strong>del</strong>l’Italiano Par<strong>la</strong>to dagli Stranieri, in C.<br />

Bar<strong>del</strong>, J. Nystedt (a c. di), Progetto Dizionario Italiano-Svedese. Atti <strong>del</strong> primo colloquio,<br />

Stoccolma, 10-12 febbraio 2005, Acta Universitatis Stockholmiensis 22, Stockolm,<br />

Romanica Stockholmiensia: 55-78.<br />

21

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!