Scarica la descrizione del corpus e le istruzioni per la ricerca
Scarica la descrizione del corpus e le istruzioni per la ricerca
Scarica la descrizione del corpus e le istruzioni per la ricerca
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
L’ADIL2 come strumento <strong>per</strong> <strong>la</strong> <strong>ricerca</strong><br />
Massimo Pa<strong>le</strong>rmo<br />
1. Il <strong>corpus</strong><br />
L’ADIL2 è stato progettato e realizzato nell’ambito <strong>del</strong><strong>la</strong> <strong>ricerca</strong> da me diretta Le interlingue<br />
di apprendimento a base non italiana <strong>del</strong>l’Osservatorio Linguistico Permanente <strong>del</strong>l'Italiano<br />
diffuso fra stranieri e <strong>del</strong><strong>le</strong> lingue immigrate in Italia istituito dal MIUR presso l’Università <strong>per</strong><br />
stranieri di Siena 1 . Con <strong>la</strong> pubblicazione <strong>del</strong> DVD contenente <strong>la</strong> banca dati e il motore di <strong>ricerca</strong> si<br />
intende ora mettere a disposizione <strong>del</strong><strong>la</strong> comunità degli studiosi uno strumento <strong>per</strong> ricerche<br />
linguistiche e glottodidattiche sull’apprendimento guidato <strong>del</strong>l’italiano L2: i saggi contenuti nel<br />
volume, realizzati da col<strong>le</strong>ghi <strong>del</strong>l’Università <strong>per</strong> Stranieri di Siena, indicano alcune possibili<br />
applicazioni in tal senso re<strong>la</strong>tive al<strong>la</strong> morfosintassi, al <strong>le</strong>ssico, al<strong>le</strong> modalità di gestione <strong>del</strong><strong>la</strong><br />
comunicazione ora<strong>le</strong> e scritta da parte di non nativi 2 .<br />
Negli ultimi venti anni lo sviluppo <strong>del</strong>l’informatica ha reso possibi<strong>le</strong> <strong>la</strong> creazione di corpora<br />
di italiano scritto e par<strong>la</strong>to sempre più estesi quantitativamente e, in alcuni casi, più sofisticati nel<strong>le</strong><br />
potenzialità di interrogazione dei testi 3 . Più recentemente, ad essi si sono affiancati corpora di<br />
apprendimento (<strong>le</strong>arner corpora) aventi l’italiano come lingua target; senza pretesa di esaustività<br />
ricordiamo <strong>la</strong> Banca dati di italiano L2 <strong>del</strong> Progetto di Pavia, contenente trascrizioni di interviste ad<br />
immigrati raccolte fra il 1985 e il 2000 (disponibi<strong>le</strong> su CD-ROM dal 2001), il LIPS (Lessico<br />
<strong>del</strong>l’italiano par<strong>la</strong>to da stranieri), basato sull’archivio <strong>del</strong><strong>le</strong> prove di produzione ora<strong>le</strong> <strong>del</strong><strong>la</strong><br />
certificazione CILS <strong>del</strong>l’Università <strong>per</strong> stranieri di Siena dal 1993 ad oggi 4 , il Co.Cer.IT (Corpus<br />
<strong>del</strong><strong>la</strong> Certificazione IT) iniziato nel 2005 e basato sul<strong>le</strong> prove di certificazione IT <strong>del</strong>l’Università di<br />
Roma Tre 5 ; il VALICO (Varietà di Apprendimento <strong>del</strong><strong>la</strong> Lingua Italiana Corpus Online), realizzato<br />
presso l’Università di Torino 6 ; il Corpus Par<strong>la</strong>to di Italiano L2, che raccoglie trascrizioni di<br />
interviste a par<strong>la</strong>nti di italiano L2, realizzato dall’Osservatorio sull’italiano di stranieri e<br />
sull’italiano all’estero <strong>del</strong>l’Università <strong>per</strong> straneri di Perugia 7 . A questa lista si può ora aggiungere<br />
1<br />
Il Centro, fondato nel 2001 e diretto fino al 2005 da Massimo Vedovelli, è attualmente sotto <strong>la</strong> direzione di Riccardo<br />
Campa. Per maggiori dettagli sul<strong>le</strong> finalità <strong>del</strong> progetto si rimanda a Pa<strong>le</strong>rmo 2005, da cui sono tratti alcuni dei dati<br />
riproposti nel<strong>le</strong> pagine che seguono.<br />
2<br />
Per altri esempi di studi basati sul <strong>corpus</strong> ADIL2 mi <strong>per</strong>metto di rinviare a Pa<strong>le</strong>rmo 2006 e Pa<strong>le</strong>rmo - Troncarelli –<br />
Petrocelli (in stampa).<br />
3<br />
Per maggiori dettagli sullo sviluppo <strong>del</strong><strong>la</strong> linguistica dei corpora in Italia e all’estero cfr. Rossini Favretti 2000. Per<br />
quanto riguarda <strong>la</strong> sitografia, basti rimandare a “Par<strong>la</strong>ritaliano” , un osservatorio dedicato allo<br />
studio <strong>del</strong> par<strong>la</strong>to italiano costituito nel 2004 da gruppi di <strong>ricerca</strong> di varie università italiane e al sito <strong>del</strong>l’Università di<br />
Graz, all’indirizzo .<br />
4<br />
Cfr. Vedovelli 2006; Barni - Gallina 2008 e 2009<br />
5<br />
Il <strong>corpus</strong> contiene attualmente 11 ore e 35 minuti di registrazione di par<strong>la</strong>nti di italiano L2. fr. Cfr. Ambroso -<br />
Bonvino 2009.<br />
6<br />
Cfr. Barbera – Marello, 2004.<br />
7<br />
Consultabi<strong>le</strong> in rete all’indirizzo .<br />
1
ADIL2, i cui ri<strong>le</strong>vamenti sono stati realizzati tra il 1997 e il 2004 8 . A questa prima fase di grande<br />
fervore nel<strong>la</strong> produzione e pubblicazione di nuovi corpora sarebbe auspicabi<strong>le</strong> che seguisse ora una<br />
comune rif<strong>le</strong>ssione mirata al<strong>la</strong> progressiva omogeneizzazione dei corpora esistenti. Sarà essenzia<strong>le</strong><br />
a mio avviso soprattutto favorire l’importabilità / esportabilità deii dati, <strong>per</strong> poterli utilizzare su<br />
diverse piattaforme e sfruttare quindi al meglio <strong>le</strong> potenzialità dei singoli motori di <strong>ricerca</strong> 9 .<br />
Veniamo ora a una <strong>descrizione</strong> di ADIL2. Il <strong>corpus</strong> è formato da 1168 unità testuali,<br />
prodotte da 1126 informanti. In termini di estensione l’intero <strong>corpus</strong> contiene 432.606 forme<br />
(tokens). Al suo interno distinguiamo tre sezioni: testi scritti trasversali, risultato di prove<br />
somministrate una so<strong>la</strong> volta a gruppi di informanti (sez. A, 1051 unità testuali, 185.455 forme);<br />
testi orali trasversali (sez. B, 65 unità testuali, 84.846 forme); testi orali longitudinali (sez. C, 53<br />
unità testuali, 185.455 forme), risultato di interviste allo stesso informante realizzate in un arco di<br />
tempo variabi<strong>le</strong>. I testi orali sono in tutto 117 e corrispondono a oltre 37 ore di registrazione 10 . Se si<br />
considera il numero di forme di ciascuna sezione si ha <strong>la</strong> proporzione rappresentata nel grafico<br />
seguente:<br />
Grafico 1. Composizione di ADIL2 (<strong>per</strong>centua<strong>le</strong> re<strong>la</strong>tiva al n. di forme)<br />
8 L’e<strong>la</strong>borazione <strong>del</strong> progetto e <strong>la</strong> gran parte dei ri<strong>le</strong>vamenti risalgono al <strong>per</strong>iodo 2002-2004. Gli informanti sono gli<br />
studenti che in quel <strong>per</strong>iodo frequentavano i corsi ordinari di italiano L2 presso il Centro Linguistico d’Ateneo. La<br />
somministrazione <strong>del</strong><strong>le</strong> prove, <strong>le</strong> interviste e <strong>le</strong> altre videoregistrazioni, <strong>le</strong> trascrizioni e <strong>la</strong> marcatura dei testi sono state<br />
effettuate da Marco Cassandro. Alcune trascrizioni e marcature si devono a Vincenzo Faraoni. L’al<strong>le</strong>stimento<br />
informatico <strong>del</strong> sistema è a cura di Luca Belgiovane. Sono confluiti nel <strong>corpus</strong>, trascritti e marcati secondo <strong>le</strong> norme<br />
ADIL2, alcuni testi scritti e orali raccolti precedentemente. La prova scritta su Cappuccetto Rosso è stata somministrata<br />
nel 1997 da un gruppo di <strong>ricerca</strong> <strong>del</strong> Centro linguistico d’Ateneo, coordinato da M. G. Lo Duca (<strong>per</strong> maggiori dettagli<br />
cfr. Lo Duca 1998). Le interviste longitudinali a CAM, HOL e JOD sono state effettuate da Marco Cassandro in<br />
occasione <strong>del</strong><strong>la</strong> propria tesi di dottorato nel 1998 (Cassandro, tesi di dottorato). Colgo l’occasione <strong>per</strong> ringraziare, oltre<br />
al<strong>le</strong> <strong>per</strong>sone sopra citate, i docenti e i col<strong>la</strong>boratori es<strong>per</strong>ti linguistici <strong>del</strong> Centro Linguistico <strong>del</strong>l’Università <strong>per</strong> stranieri<br />
che in questo lungo <strong>la</strong>sso di tempo hanno col<strong>la</strong>borato a vario titolo ai ri<strong>le</strong>vamenti. Per maggiori notizie sul<strong>la</strong> genesi di<br />
ADIL2 cfr. Pa<strong>le</strong>rmo 2005.<br />
9 Sui <strong>le</strong>arner corpora cfr. Granger 2004 e, <strong>per</strong> lo specifico <strong>del</strong>l’italiano L2 Andorno – Rastelli 2009.<br />
10 Di questi 74 sono stati videoregistrati (19 ore e 6 minuti), 43 registrati in solo formato audio (18 ore e 11 minuti).<br />
Nel<strong>la</strong> versione di ADIL2 che si pubblica con questo volume, <strong>per</strong> ragioni di privacy, i fi<strong>le</strong> video sono stati convertiti in<br />
fi<strong>le</strong> audio. Su richiesta di singoli <strong>ricerca</strong>tori, da inviare al curatore <strong>del</strong> volume, sarà possibi<strong>le</strong> visionare <strong>le</strong><br />
videoregistrazioni.<br />
2
Per <strong>le</strong> sezioni A e B il criterio primario <strong>per</strong> <strong>la</strong> costituzione <strong>del</strong> <strong>corpus</strong> è stato testua<strong>le</strong>: con<br />
riferimento al<strong>la</strong> c<strong>la</strong>ssificazione funziona<strong>le</strong> dei testi, si è cercato di coprire in modo bi<strong>la</strong>nciato i<br />
cinque tipi fondamentali. I testi orali <strong>del</strong><strong>la</strong> sezione B si differenziano, oltre che sul<strong>la</strong> base <strong>del</strong> tipo<br />
testua<strong>le</strong>, in funzione <strong>del</strong><strong>le</strong> modalità di interazione (monologo, dialogo, conversazione di gruppo). La<br />
sezione ora<strong>le</strong> longitudina<strong>le</strong> (C) comprende soltanto interviste semi-strutturate.<br />
Vediamo qualche dato ulteriore sugli informanti. Per quel che riguarda <strong>la</strong> lingua madre il<br />
quadro emergente è quello rappresentato dal<strong>la</strong> Tabel<strong>la</strong> 1:<br />
Tabel<strong>la</strong> 1. Composizione <strong>del</strong>l’ADIL2 (<strong>per</strong> lingua madre degli apprendenti)<br />
MADRELINGUA NUMERO MADRELINGUA NUMERO<br />
Ing<strong>le</strong>se 286 Gal<strong>le</strong>se 1<br />
Giapponese 151 Lettone 5<br />
Cinese 102 Norvegese 5<br />
Coreano 82 Bulgaro 4<br />
Tedesco 73 Kazako 4<br />
Spagnolo 54 Lituano 4<br />
Arabo 41 Ma<strong>le</strong>se 4<br />
Francese 33 Ungherese 4<br />
Russo 32 Azero 3<br />
Svedese 29 Bantu 11 3<br />
Albanese 28 Fin<strong>la</strong>ndese 3<br />
Greco 24 Is<strong>la</strong>ndese 3<br />
Portoghese 19 Birmano 2<br />
Tai<strong>la</strong>ndese 19 Ceco 2<br />
Po<strong>la</strong>cco 14 Ebraico 2<br />
Serbo-croato 14 Rumeno 2<br />
Ucraino 10 Uzbeko 2<br />
Indonesiano 8 Armeno 2<br />
Slovacco 8 Georgiano 1<br />
O<strong>la</strong>ndese 7 Igbo (Nigeria) 1<br />
Vietnamita 7 Malgascio 1<br />
Estone 6 Moldavo 1<br />
Persiano 6 Kiniarwanda 1<br />
11 Si tratta di due informanti di nazionalità camerunense e mozambicana. Ho usato <strong>per</strong> semplicità il nome <strong>del</strong><strong>la</strong> famiglia<br />
linguistica d’appartenenza.<br />
A: SCRITTO<br />
42%<br />
B: ORALE TRASVERSALE<br />
20%<br />
C: ORALE LONGITUDINALE<br />
38%<br />
3
Turco 6<br />
(Ruanda)<br />
Cata<strong>la</strong>no 1<br />
Danese 5 Minangkabau<br />
(Sumatra)<br />
1<br />
I casi più significativi di lingue madri “ombrello”, cioè corrispondenti a par<strong>la</strong>nti di nazionalità<br />
diverse riguardano l’ arabo (21 magrebini, 2 arabi, 2 siriani, 6 pa<strong>le</strong>stinesi, 6 giordani), l’ing<strong>le</strong>se (213<br />
statunitensi, 19 australiani, 8 britannici, 7 canadesi, 4 sudafricani, 2 ir<strong>la</strong>ndesi, 1 neoze<strong>la</strong>ndese, i<br />
rimanenti con doppia cittadinanza), lo spagnolo (12 spagnoli, 12 argentini, 7 ci<strong>le</strong>ni, 4 colombiani, 3<br />
messicani, i rimanenti centro o sudamericani), il francese (21 francesi, 5 belgi, 2 franco-canadesi, 1<br />
gabonese, senega<strong>le</strong>se, mauriziano, ivoriano), il tedesco (61 tedeschi, 4 svizzeri, 4 austriaci), il<br />
portoghese (7 portoghesi e 12 brasiliani), il serbo-croato (11 bosniaci, 2 serbi, 1 croato). Per evitare<br />
l’eccessiva frammentazione dei dati abbiamo compiuto alcune forzature non tenendo conto <strong>del</strong><strong>le</strong><br />
differenze linguistiche interne agli informanti di nazionalità cinese e taiwanese e dei pochi<br />
appartenenti a lingue <strong>del</strong> gruppo bantu (2 mozambicani, 1 camerunense). Interessanti infine i casi<br />
degli informanti provenienti da paesi ex coloniali, in partico<strong>la</strong>re africani, che non dichiarano come<br />
lingua madre <strong>la</strong> lingua ufficia<strong>le</strong> europea in uso nel<strong>la</strong> loro nazione. Per quanto riguarda gli europei,<br />
da segna<strong>la</strong>re l’autodichiarazione di due apprendenti (rispettivamente spagnolo e britannico) che<br />
hanno fatto riferimento al cata<strong>la</strong>no e al gal<strong>le</strong>se.<br />
Una <strong>del</strong><strong>le</strong> possibi<strong>le</strong> direttrici di studio <strong>del</strong> <strong>corpus</strong> riguarda i rapporti tra tipo linguistico e<br />
caratteristiche <strong>del</strong>l’interlingua. A ta<strong>le</strong> scopo può essere uti<strong>le</strong> un’analisi <strong>del</strong><strong>la</strong> suddivisione degli<br />
apprendenti <strong>per</strong> famiglia linguistica. Il primo dato ri<strong>le</strong>vante è l’appartenenza <strong>del</strong> 58% degli<br />
informanti a lingue indoeuropee. Nel grafico 2 riportiamo nel dettaglio <strong>le</strong> cifre re<strong>la</strong>tive al<strong>le</strong> famiglie<br />
linguistiche che presentino più di 5 informanti 12 :<br />
Grafico 2. Distribuzione degli informanti <strong>per</strong> famiglia linguistica<br />
450<br />
400<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0<br />
indo-iranico<br />
distribuzione degli informanti <strong>per</strong> famiglia linguistica<br />
6 9 13 14 15 19 23 28 43<br />
baltico<br />
ugro-finnico<br />
austronesiano<br />
altaico<br />
tai<br />
greco<br />
albanese<br />
semitico<br />
coreano<br />
82 84 98 104<br />
s<strong>la</strong>vo<br />
romanzo<br />
sino-tibetano<br />
giapponese<br />
151<br />
germanico<br />
12 Rientrano nel<strong>la</strong> colonna “altro”, oltre ad alcune autodichiarazioni incerte, <strong>le</strong> famiglie linguistiche con meno di 6<br />
informanti: alcune lingue africane (igbo, bantu, ruandese), il vietnamita, il georgiano, il gal<strong>le</strong>se.<br />
408<br />
altro<br />
28<br />
4
Partico<strong>la</strong>re cura è stata posta nell’ottenere una distribuzione equilibrata degli informanti <strong>per</strong><br />
livello di competenza, come si evince dal grafico seguente 13 :<br />
Grafico 3. Distribuzione degli informanti <strong>per</strong> livelli di competenza<br />
I due terzi degli informanti sono compresi nel<strong>la</strong> fascia d’età tra i 18 e i 25 anni. Per quel che<br />
riguarda il livello d’istruzione (hanno compi<strong>la</strong>to questa sezione 830 informanti) notiamo un 5,55%<br />
di <strong>la</strong>ureati, un 43,01% di studenti universitari, un 51,44% di <strong>per</strong>sone in possesso <strong>del</strong> diploma di<br />
scuo<strong>la</strong> su<strong>per</strong>iore.<br />
intermedio<br />
227<br />
I 912 informanti che hanno compi<strong>la</strong>to <strong>la</strong> sezione “altre lingue conosciute” sono così distribuiti:<br />
Grafico 4. Altre lingue conosciute<br />
altre<br />
tipologie 46<br />
avanzato<br />
217<br />
tre<br />
179<br />
quattro<br />
18<br />
due<br />
481<br />
principiante<br />
290<br />
e<strong>le</strong>mentare<br />
352<br />
13 Ricordiamo che al momento dei ri<strong>le</strong>vamenti i corsi ordinari di lingua <strong>del</strong> Centro linguistico <strong>del</strong>l’Università <strong>per</strong><br />
stranieri erano artico<strong>la</strong>ti su quattro livelli, mentre dal 1° gennaio 2005 si è passati ad un’artico<strong>la</strong>zione su sei livelli,<br />
secondo l’impostazione <strong>del</strong> Quadro comune europeo.<br />
una<br />
234<br />
5
La prima lingua straniera conosciuta è l’ing<strong>le</strong>se (574 casi), seguita dal francese (110 casi), dallo<br />
spagnolo (90), dal tedesco (26), dal russo (18), dal cinese (15 casi, <strong>per</strong> lo più taiwanesi, giapponesi,<br />
coreani), dal giapponese (7 casi, <strong>per</strong> lo più coreani).<br />
2. Le ri<strong>le</strong>vazioni<br />
Vediamo ora come sono state predisposte <strong>le</strong> prove. Per <strong>la</strong> sezione A esse sono suddivise<br />
secondo i cinque tipi testuali fondamentali. Eccone il quadro riassuntivo:<br />
Tabel<strong>la</strong> 2. Tipologia <strong>del</strong><strong>le</strong> prove scritte<br />
Tipo Genere Titolo Descrizione Livelli di<br />
Rego<strong>la</strong>tivo Ricetta Come<br />
competenza<br />
si Dare <strong>istruzioni</strong> <strong>per</strong> preparare I-IV<br />
prepara un un caffé all’italiana.<br />
buon caffé!<br />
Narrativo 1 Racconto Par<strong>la</strong>ci di te Racconto di es<strong>per</strong>ienze I-IV<br />
<strong>per</strong>sona<strong>le</strong><br />
<strong>per</strong>sonali.<br />
Narrativo 2 Favo<strong>la</strong> Cappuccetto Narrazione <strong>del</strong><strong>la</strong> favo<strong>la</strong>.<br />
Rosso<br />
I-IV<br />
Espositivo Saggio Lo sviluppo Esposizione <strong>del</strong><strong>la</strong> situazione I-IV<br />
breve <strong>del</strong><strong>la</strong> demografica italiana.<br />
popo<strong>la</strong>zione Esposizione e interpretazione<br />
italiana di tabel<strong>le</strong> con dati reali.<br />
Descrittivo Gioco Confronta <strong>le</strong> Descrivere due immagini che I-IV<br />
enigmistico due si differenziano <strong>per</strong> alcuni<br />
immagini e dettagli<br />
scrivi<br />
differenze<br />
che trovi.<br />
<strong>le</strong><br />
Argomentativo Lettera Lettera a un Scrivere una <strong>le</strong>ttera a un I-IV<br />
informa<strong>le</strong> amico. amico <strong>per</strong> convincerlo a<br />
visitare il proprio paese<br />
Nel<strong>la</strong> somministrazione di alcune prove ci siamo avvalsi <strong>del</strong>l’ausilio di immagini o di altri materiali<br />
di supporto (v. infra, par. 4): <strong>per</strong> <strong>la</strong> prova rego<strong>la</strong>tiva si è dapprima mostrato un breve video di una<br />
<strong>per</strong>sona che prepara il caffé, poi si è fornito agli studenti un foglio con alcune immagini <strong>del</strong><strong>le</strong> fasi<br />
principali <strong>del</strong><strong>la</strong> preparazione e un <strong>le</strong>ssico tecnico fondamenta<strong>le</strong>; <strong>per</strong> <strong>la</strong> narrazione <strong>del</strong><strong>la</strong> favo<strong>la</strong><br />
l’input era costituito da un’illustrazione che riproduceva i protagonisti <strong>del</strong><strong>la</strong> storia, <strong>per</strong> <strong>la</strong> prova<br />
descrittiva si sono utilizzate due immagini quasi identiche di cui gli studenti dovevano individuare e<br />
descrivere <strong>le</strong> differenze; <strong>per</strong> <strong>la</strong> prova espositiva si sono forniti due grafici che illustrano l'andamento<br />
<strong>del</strong><strong>la</strong> popo<strong>la</strong>zione italiana dal 1999 al 2001 e un grafico con ipotesi sul futuro sviluppo demografico<br />
<strong>del</strong> nostro Paese 14 . Lo spazio maggiore dedicato al<strong>la</strong> tipologia narrativa si spiega tenendo conto <strong>del</strong><br />
14 Nel<strong>la</strong> cartel<strong>la</strong> “materiali di supporto” presente nel DVD al<strong>le</strong>gato al volume sono contenuti i fi<strong>le</strong> con <strong>le</strong> consegne <strong>del</strong><strong>le</strong><br />
prove.<br />
6
fatto che <strong>la</strong> prova su Cappuccetto Rosso, certamente di notevo<strong>le</strong> interesse <strong>per</strong> molti altri aspetti 15 -<br />
poteva comportare un certo condizionamento degli scriventi <strong>per</strong> quel che riguarda <strong>le</strong> rego<strong>le</strong><br />
retoriche e stilistiche con cui <strong>la</strong> narrazione favolistica si è storicamente sedimentata nel<strong>le</strong> varie<br />
culture, con conseguenze sul<strong>la</strong> se<strong>le</strong>zione di strutture linguistiche caratteristiche <strong>del</strong> narrare (mi<br />
riferisco in partico<strong>la</strong>re al<strong>la</strong> se<strong>le</strong>zione dei tempi <strong>del</strong> passato e a partico<strong>la</strong>ri vincoli nel<strong>la</strong> costruzione<br />
<strong>del</strong><strong>le</strong> catene anaforiche), mentre <strong>la</strong> narrazione pragmatica richiesta con il racconto <strong>per</strong>sona<strong>le</strong><br />
dovrebbe risentire in misura minore di condizionamenti di tal genere.<br />
Un’analoga suddivisione è stata compiuta <strong>per</strong> i testi <strong>del</strong><strong>le</strong> sezioni B e C. Tuttavia nei testi orali<br />
occorre considerare come variabili <strong>per</strong>tinenti anche <strong>le</strong> modalità <strong>del</strong><strong>la</strong> conversazione. Dal punto di<br />
vista <strong>del</strong><strong>le</strong> modalità di interazione tra gli interlocutori sono presenti sia monologhi sia conversazioni<br />
faccia a faccia con variazione nel<strong>la</strong> libertà di presa <strong>del</strong> turno, sia conversazioni di gruppo più o<br />
meno guidate. In linea di massima, tuttavia, <strong>le</strong> ri<strong>le</strong>vazioni orali, benché sempre guidate dal<br />
<strong>ricerca</strong>tore, hanno avuto carattere libero e, quando se ne è presentata l’opportunità, si è cercato di<br />
incoraggiare <strong>le</strong> produzioni autonome degli apprendenti. Il sotto<strong>corpus</strong> raccoglie varie tipologie di<br />
prove - in genere svoltesi nell’ambito <strong>del</strong>l’interazione di c<strong>la</strong>sse - che includono unità testuali<br />
narrative (ordinare una storia a disegni e narrar<strong>la</strong>, riassumere il contenuto di un breve video),<br />
descrittive (descrivere un’immagine proposta), espositive (presentare una breve <strong>ricerca</strong>), rego<strong>la</strong>tive<br />
(spiegare come si fa il caffé all’italiana), argomentative (convincere a trascorrere un fine settimana<br />
in una località turistica).<br />
La sezione C è costituita da 52 interviste semilstrutturate realizzate nel tempo a un gruppo di<br />
dieci informanti. La tabel<strong>la</strong> seguente descrive <strong>la</strong> lingua madre dei par<strong>la</strong>nti, il loro livello di<br />
competenza inizia<strong>le</strong> e fina<strong>le</strong>, il numero di interviste.<br />
Sig<strong>la</strong><br />
Informante<br />
Tabel<strong>la</strong> 3. Informanti <strong>del</strong> <strong>corpus</strong> longitudina<strong>le</strong><br />
Lingua<br />
madre<br />
Livelli di<br />
competenza<br />
n.<br />
interviste<br />
Sig<strong>la</strong><br />
Informante<br />
ANA Spagnolo 1–3 (non 2) 3 WAN<br />
MON Arabo<br />
(libico)<br />
GHA Arabo<br />
(pa<strong>le</strong>stinese)<br />
AMI Arabo<br />
(pa<strong>le</strong>stinese)<br />
Lingua<br />
madre<br />
1–2 6 CAM Ing<strong>le</strong>se<br />
(USA)<br />
1 2 HLY Ing<strong>le</strong>se<br />
(USA)<br />
1 2 JOD Ing<strong>le</strong>se<br />
(USA)<br />
WEN Cinese 1-3 5 HUI Cinese<br />
(Taiwan)<br />
Livelli di<br />
competenza<br />
Cinese 3-4 2<br />
1-2 9<br />
1-3 11<br />
1-3 8<br />
2-3 3<br />
n.<br />
interviste<br />
15 Sul<strong>le</strong> ragioni che hanno determinato l’uso di ta<strong>le</strong> favo<strong>la</strong> <strong>per</strong> uno studio comparato sull’apprendimento <strong>del</strong><strong>la</strong> scrittura<br />
nei bambini si veda Ferreiro / Pontecorvo (1996).<br />
7
3. Modalità di accesso ai dati e funzioni di <strong>ricerca</strong><br />
L’ADIL2 è un sistema composto da una banca dati di testi multimediali (trascrizioni e<br />
registrazioni audio/video) e un programma che consente di accedere al<strong>la</strong> <strong>le</strong>ttura e al<strong>le</strong> ricerche<br />
testuali. Sia <strong>la</strong> <strong>le</strong>ttura che <strong>la</strong> <strong>ricerca</strong> sfruttano <strong>le</strong> potenzialità <strong>del</strong> supporto digita<strong>le</strong>, in quanto è<br />
possibi<strong>le</strong> se<strong>le</strong>zionare dinamicamente <strong>la</strong> porzione di <strong>corpus</strong> su cui <strong>la</strong>vorare. L’utente può predisporre<br />
sottoinsiemi di testi definiti sul<strong>la</strong> base <strong>del</strong><strong>le</strong> proprie esigenze di <strong>ricerca</strong>, <strong>le</strong>ggerli in maniera<br />
sequenzia<strong>le</strong> e non, o<strong>per</strong>are su di essi ricerche testuali.<br />
3.1 Instal<strong>la</strong>re e <strong>la</strong>nciare il programma, se<strong>le</strong>zionare i testi<br />
ADIL2 funziona con i sistemi o<strong>per</strong>ativi di Windows. Per instal<strong>la</strong>rlo, avviare “setup.exe” e<br />
seguire <strong>la</strong> procedura. Per ascoltare i testi orali è necessario che sul proprio PC sia presente il<br />
programma Windows Media P<strong>la</strong>yer, versione 10 o su<strong>per</strong>iore. In caso contrario, aprire <strong>la</strong> cartel<strong>la</strong><br />
“P<strong>la</strong>yer” contenuta nel DVD e <strong>la</strong>nciare Winxp.exe <strong>per</strong> sistemi o<strong>per</strong>ativi XP, NON_WinXP.exe <strong>per</strong><br />
sistemi o<strong>per</strong>ativi diversi da XP. Una volta eseguita l’instal<strong>la</strong>zione non sarà più necessario inserire il<br />
DVD nel <strong>le</strong>ttore <strong>per</strong> usare il programma.<br />
Lanciato il programma con doppio clic sull’icona ADIL2, <strong>la</strong> prima o<strong>per</strong>azione consiste nel<br />
se<strong>le</strong>zionare il sottoinsieme di testi su cui <strong>la</strong>vorare: <strong>corpus</strong> scritto o ora<strong>le</strong>. Effettuata questa scelta, è<br />
possibi<strong>le</strong> <strong>la</strong>vorare sull’intero insieme di testi (opzione di default) o se<strong>le</strong>zionarlo ulteriormente in<br />
base a:<br />
! tipo di testo;<br />
! caratteristiche <strong>del</strong>l’apprendente: età, lingua madre, livello di competenza;<br />
! modalità di ri<strong>le</strong>vamento (longitudina<strong>le</strong> o trasversa<strong>le</strong>);<br />
! modalità di scambio (monodireziona<strong>le</strong> o bidireziona<strong>le</strong>).<br />
Nel<strong>le</strong> figg. 1 e 2 sono riprodotte <strong>le</strong> maschere di se<strong>le</strong>zione re<strong>la</strong>tive al <strong>corpus</strong> scritto e ora<strong>le</strong>:<br />
8
Figura 1. Maschera di se<strong>le</strong>zione <strong>del</strong> <strong>corpus</strong> scritto<br />
Figura 2. Maschera di se<strong>le</strong>zione <strong>del</strong> <strong>corpus</strong> ora<strong>le</strong><br />
Ciascun testo corrisponde a un n. di fi<strong>le</strong>. La numerazione parte da 1 sia <strong>per</strong> il <strong>corpus</strong> scritto sia <strong>per</strong><br />
quello ora<strong>le</strong>. Nel<strong>le</strong> citazioni di brani tratti da ADIL2 in questo volume, salvo diversa indicazione<br />
<strong>del</strong>l’autore, sarà specificato il <strong>corpus</strong> e il n. fi<strong>le</strong>, <strong>per</strong> es. [SC 234]; [OR 56].<br />
3.2 Lettura, <strong>ricerca</strong> semplice, <strong>ricerca</strong> avanzata<br />
Una volta se<strong>le</strong>zionati i testi è possibi<strong>le</strong> scegliere tre modalità di accesso ai dati: <strong>le</strong>ttura,<br />
<strong>ricerca</strong> semplice e <strong>ricerca</strong> avanzata. La modalità <strong>le</strong>ttura consente, nel caso <strong>del</strong><strong>le</strong> produzioni<br />
scritte, di visualizzare il testo e varie informazioni sul<strong>la</strong> mise en page (cancel<strong>la</strong>ture, sostituzioni,<br />
aggiunte interlineari, paro<strong>le</strong> di dubbia <strong>le</strong>ttura o non comprensibili) e sul<strong>le</strong> incertezze ortografiche<br />
9
(concrezioni, discrezioni). Nel caso dei testi orali <strong>le</strong> trascrizioni sono associate ai corrispondenti fi<strong>le</strong><br />
audio/video: nel<strong>la</strong> cornice di sinistra compare <strong>la</strong> trascrizione, in quel<strong>la</strong> di destra è possibi<strong>le</strong> attivare<br />
l’ascolto o <strong>la</strong> visione <strong>del</strong> fi<strong>le</strong>. La possibilità di accesso diretto ai fi<strong>le</strong> multimediali ha consentito di<br />
semplificare <strong>le</strong> convenzioni di trascrizione e di ricorrere all’ortografia standard affiancata da pochi<br />
simboli, che si riportano nel<strong>le</strong> tabel<strong>le</strong> 4, 5 e 6:<br />
Tabel<strong>la</strong> 4. Convenzioni di trascrizione e visualizzazione comuni ai testi orali e scritti<br />
Fenomeno Simbolo / Visualizzazione Esempio<br />
Inserti in L1 <strong>del</strong>l’informante colore blu Un po' più tardi ein Jaeger passa<br />
Inserti in L2 <strong>del</strong>l’informante colore rosso ehm quindi , ehm quando sono vicini ,<br />
character [#] altre , va bene<br />
Cambio di tema 16 ÷ sì , <strong>per</strong>ché ehm [#] ho abito nel<strong>la</strong><br />
famiglia belgi . ho: ÷ no , sono andato<br />
a un scuo<strong>la</strong> belgi .<br />
Falsa partenza 17 @ ehm io drit¦ @ io ha dritto .<br />
Riferimento metalinguistico 18 corsivo sì , ehm primo ci sono quattre ragazze<br />
. e loro fanno una gherra con neve .<br />
ehm loro <strong>la</strong>nsano <strong>la</strong>nciano ?<br />
paro<strong>la</strong> il<strong>le</strong>ggibi<strong>le</strong> o<br />
incomprensibi<strong>le</strong> /<br />
cancel<strong>la</strong>tura irrecu<strong>per</strong>abi<strong>le</strong><br />
{xxx}<br />
numero di x corrispondente<br />
grosso modo al numero di<br />
grafemi / fonemi non<br />
recu<strong>per</strong>abili<br />
lo portò a casa sua, e gli dare (pass.<br />
remoto) tante cose da mangiare <strong>per</strong><br />
guarire<br />
Per me,{xxxxx} penso che è un'iptesi<br />
alta<br />
Trascrizione alternativa in<br />
caso di dubbi<br />
testo tra parentesi graffe ma:: [#] qua {va} a Siena ?<br />
Ricostruzione congettura<strong>le</strong> testo tra parentesi graffe Le <strong>per</strong>soni {f}anno a pa<strong>la</strong>volo<br />
Tabel<strong>la</strong> 5. Convenzioni di trascrizione e visualizzazione usate solo nei testi orali<br />
Fenomeno Simbolo / Visualizzazione Esempio<br />
Tonia esc<strong>la</strong>mativa !<br />
Tonia interrogativa ?<br />
Tonia conclusiva .<br />
Tonia sospensiva … A:- ieri sono andato a Roma…<br />
B:- mhm mhm<br />
A:- [+] e ho fatto shopping<br />
Giuntura sintattica , Senti , che pensi di questa cosa?<br />
Domande a coda ¿ xxx ? vedi che lui ha un libro in mano ¿ no ?<br />
16<br />
Il par<strong>la</strong>nte cambia spontaneamente il topic e passa a un nuovo tema che può essere anche vagamente corre<strong>la</strong>to<br />
all’argomento precedente.<br />
17<br />
Riformu<strong>la</strong>zione <strong>del</strong>lo stesso concetto con altre paro<strong>le</strong> nello stesso enunciato, diverso dal cambio di progetto che è<br />
anche un cambio di topic e dall’autointerruzione che è una vera e propria interruzione<br />
18<br />
Casi in cui il par<strong>la</strong>nte o lo scrivente, con un’intonazione partico<strong>la</strong>re o altri segnali grafici o paralinguistici cerca di<br />
attirare l’attenzione <strong>del</strong>l’interlocutore sul<strong>la</strong> forma linguistica. Il primo esempio è tratto da un testo ora<strong>le</strong>, il secondo da<br />
un testo scritto.<br />
10
Pausa (breve, media lunga) [#][##][###] in base al<strong>la</strong><br />
durata<br />
sì , ma: [##] non sono in contatto .<br />
Tenuta vocalica : :: ::: in base al<strong>la</strong> durata tu hai fatto qualcosa di: ehm piacevo<strong>le</strong><br />
Sovrapposizione [//] RIC: che [//] che [//] che cosa hai<br />
fatto a Venezia ?<br />
MON: [//] sì [//] . Venezia [#] va bene<br />
. molto bel<strong>la</strong> .<br />
Autointerruzione [///] A:- Ieri sono andato a Roma [///]<br />
A:- ma che è ‘sto rumore?<br />
Eterointerruzione [/]<br />
A:- Ieri sono andato a Roma [/]<br />
B:- ieri?<br />
A:- sì<br />
Autocomp<strong>le</strong>tamento [+]<br />
MER: in strada .<br />
ma in au<strong>la</strong> che è più tranquillo .<br />
più faci<strong>le</strong> di di ...<br />
KRY: ah , va bene .<br />
MER: [+] registrare .<br />
Eterocomp<strong>le</strong>tamento [++]<br />
MON: Italia par<strong>la</strong>no qui in Italia [/]<br />
RIC: [++] e basta !<br />
MON: lo so , lo so.<br />
Annotazioni, glosse e altre<br />
colore vio<strong>la</strong><br />
e poi [simu<strong>la</strong> reazione di spavento] .<br />
informazioni<br />
para/extralinguistiche,<br />
ha paura .<br />
minutaggio 19<br />
Interruzione di paro<strong>la</strong> | MON: [//] no [//] saluti .<br />
spettià | spettano ?<br />
Caratteri fonetici 20 corpo maggiore grassetto se c'è anche ehm altra film @ cassetta<br />
<strong>per</strong> città . si chiama derEZ<br />
Click avulsivo |\ ah {e i:} [##] |\ , rega<strong>le</strong> @ regali @<br />
i regali .<br />
Tabel<strong>la</strong> 6. Convenzioni di trascrizione e visualizzazione usate solo nei TESTI SCRITTI<br />
Fenomeno Simbolo / Visualizzazione Esempio<br />
concrezioni colore verde Hao arrivato in corea adesso. ti sentireo il <strong>la</strong><br />
mancanza, <strong>per</strong>ché ti bene di tutto cioché ha fatto<br />
<strong>per</strong> me<br />
discrezioni colore verde Perche durante <strong>le</strong> state il mio paese è bellissimo<br />
cancel<strong>la</strong>ture testo barrato <strong>per</strong> <strong>la</strong> prima volta lo avevo garud visto in Italia<br />
aggiunte<br />
interlineari<br />
testo in apice tra barre<br />
trasversali<br />
sovrascrittura testo originario in pedice,<br />
testo sovrascritto in apice<br />
tra parentesi<br />
punto o serie di<br />
···<br />
punti con<br />
il primo \ ipotesa / mostra che <strong>la</strong> popo<strong>la</strong>zione<br />
<strong>del</strong>l'Italia aumenterà molto<br />
Questa estate. sono andata<br />
azzurra. azzura<br />
(ho viaggiato)<br />
al<strong>la</strong> costa<br />
Questo, è un motivo <strong>per</strong> <strong>la</strong> gente di venire<br />
a <strong>la</strong>vorare al<strong>la</strong> Italia; <strong>le</strong> <strong>per</strong>sone <strong>del</strong><strong>le</strong> paese poberi<br />
19 I tag re<strong>la</strong>tivi al minutaggio sono inseriti nel<strong>la</strong> trascrizione ad intervalli di tre minuti e indicano i secondi trascorsi<br />
dall’inizio <strong>del</strong> fi<strong>le</strong> audio video: servono a facilitare l’abbinamento trascrizione / ascolto. Naturalmente glosse,<br />
spiegazioni di fenomeni paralinguistici, minutaggi e tutto quanto visualizzato in vio<strong>la</strong> è escluso dal<strong>le</strong> ricerche.<br />
20 Essendo possibi<strong>le</strong> ascoltare l’audio i caratteri fonetici sono stati usati solo in caso di effettiva necessità. I simboli usati<br />
sono quelli <strong>del</strong>l’alfabeto SAMPA (Speech Assessment Methods Phonetic Alphabet). Maggiori informazioni al riguardo<br />
si possono trovare in rete agli indirizzi e <br />
11
funzione non<br />
demarcativa di<br />
<strong>per</strong>iodo<br />
· ·· ma <strong>per</strong> altro posto, <strong>la</strong> Italia non è molto<br />
economica <strong>per</strong> vivere ··· ma comunque<br />
anche posto di <strong>la</strong>voro è attrativo<br />
fine pagina [||] "Perciò voglio ti sentire meglio" risponde il lupo.[||]<br />
Finalmente <strong>la</strong> ragazza chiede<br />
Ecco un esempio di trascrizione <strong>del</strong> <strong>corpus</strong> scritto [testo espositivo di un informante ing<strong>le</strong>se<br />
diciannovenne, principiante]:<br />
A) Penso che <strong>le</strong> popo<strong>la</strong>zioni nel in tutto il mondo diventa più<br />
ma il cambio grande fra 2000 e 2001 è <strong>per</strong>ché<br />
<strong>la</strong> gente ha voluto avere bambini ÷ si sono nati nel anno<br />
2000. Era un anno molto specia<strong>le</strong>. L'inizio <strong>del</strong><strong>la</strong> nuovea<br />
mil<strong>le</strong>nia.<br />
C'è anche il prob<strong>le</strong>ma con <strong>le</strong> gravidanze nei giovani è<br />
i Catolici non gli piaciono \ loro / gli aborti.<br />
La popolzione cresce <strong>per</strong>ché gli stranieri vengono dei paesi<br />
più poveri e fanno tanti bambini.<br />
Non è <strong>la</strong> colpa degli italiani <strong>per</strong>ché in graffico 2 si puo<br />
vedere che se non ci sono gli stranieri, <strong>la</strong> popo<strong>la</strong>zione<br />
sarà meno di solito.<br />
È molto interessante che gli italiani L'italia ha il <strong>per</strong>cento<br />
di c gli italiani fanno più bambini <strong>del</strong> mondo.<br />
B) Scelgo l'ipotesi media. La popo<strong>la</strong>zione crescerà, è sono sicuro.<br />
Gli stranieri \ ci / continueranno {x} venire {x} con <strong>le</strong> loro famiglie<br />
e continueranno fare bambini ma fra pochi anni qualche<br />
anno, sarà detrimorta<strong>le</strong> <strong>per</strong> L'Italia <strong>per</strong>ché il paese non<br />
avrà il forte <strong>per</strong> vivere in salute. Eventualmente il governo<br />
dovrà fermare gli immigrati che \ lo / abusano e <strong>la</strong>vorano nero.<br />
Dovrà anche fermare dare i soldi troppo liberalmente agli stranieri. [23]<br />
e uno di trascrizione <strong>del</strong>l’ora<strong>le</strong> [intervista a GON, portoghese, 23 anni, principiante]:<br />
RIC:<br />
a te ti piace il cinema ?<br />
GON:<br />
sì !<br />
muito .<br />
RIC:<br />
molto .<br />
GON:<br />
muito .<br />
RIC:<br />
ehm lo sai che oggi vedremo un film ?<br />
GON:<br />
ehm: [//] sì [//] , sì .<br />
RIC:<br />
[//] in c<strong>la</strong>sse [//] .<br />
ah .<br />
GON:<br />
ma: non lo so che: che film ...<br />
RIC:<br />
ehm forse un film di Benigni .<br />
GON:<br />
La Vita è Bel<strong>la</strong> ?<br />
RIC:<br />
no .<br />
GON:<br />
Un Mostro ?<br />
RIC:<br />
Il Mostro .<br />
GON:<br />
Il Mostro .<br />
RIC:<br />
12
l'hai visto ?<br />
GON:<br />
sì , è muy bello .<br />
RIC:<br />
ehm o forse un altro film se riesco a trovarlo .<br />
<strong>per</strong>ò ancora non l'ho trovato .<br />
quindi <strong>per</strong> adesso ho preso Il Mostro .<br />
poi: [//] [#] [//] vediamo .<br />
GON:<br />
[//] okay [//] .<br />
RIC:<br />
senti , ehm sei stato al cinema qui te: ?<br />
GON:<br />
no , [//] no [//] .<br />
RIC:<br />
[//] mai [//] ?<br />
GON:<br />
ehm: nunca @ mai .<br />
ehm <strong>per</strong>ché: non mi piace: ehm:: guardare <strong>la</strong>:: lo:: cine [//] [#] [//] ehm:: ehm italiano . [105]<br />
Ricerca semplice<br />
La modalità <strong>ricerca</strong> semplice, <strong>le</strong> cui maschere sono riprodotte nel<strong>le</strong> fig. 3 (<strong>corpus</strong> scritto) e 4<br />
(<strong>corpus</strong> ora<strong>le</strong>), consente di eseguire <strong>le</strong> seguenti o<strong>per</strong>azioni:<br />
! cercare paro<strong>le</strong>, gruppi di paro<strong>le</strong> adiacenti, frasi. Digitando “casa” si ottengono tutti i contesti in cui <strong>la</strong><br />
paro<strong>la</strong> compare; digitando “<strong>la</strong> casa di Cappuccetto Rosso” si ottengono tutte i contesti in cui compare<br />
l’espressione;<br />
! cercare parti di paro<strong>le</strong>. Come caratteri jolly sono disponibili “$” (qualsiasi carattere) e “*” (qualsiasi<br />
sequenza di caratteri); quindi cercando “cas$” si ottengono tutti i contesti di casa /case / caso ecc. cercando<br />
“cas*” si ottengono tutti i contesti di casa /case / casetta / castello / castoro ecc. È possibi<strong>le</strong> escludere dai<br />
risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> alcune paro<strong>le</strong>. In questo caso occorre separare con un punto e virgo<strong>la</strong> (senza spazio) <strong>le</strong><br />
paro<strong>le</strong> da escludere. Per es., <strong>per</strong> <strong>ricerca</strong>re <strong>le</strong> forme verbali al gerundio posso impostare come <strong>ricerca</strong> <strong>la</strong> stringa<br />
“*ndo” ed escludere dai risultati paro<strong>le</strong> di disturbo come quando;mando;fondo;mondo ecc.<br />
! generare concordanze e liste di frequenza. Digitando come stringa di <strong>ricerca</strong> il solo carattere “*” si<br />
ottengono <strong>le</strong> concordanze o <strong>le</strong> liste di frequenza <strong>del</strong>l’intero <strong>corpus</strong> se<strong>le</strong>zionato (v. infra <strong>per</strong> maggiore<br />
dettagli).<br />
! cercare combinazioni di due paro<strong>le</strong> non adiacenti (cerca paro<strong>la</strong>1 e paro<strong>la</strong>2 separate da N paro<strong>le</strong>).<br />
L’indicatore di prossimità (n. di paro<strong>le</strong> che separano “paro<strong>la</strong>1” e “paro<strong>la</strong>2”) è modificabi<strong>le</strong> dall’utente.<br />
! cercare varianti di paro<strong>le</strong> (cerca paro<strong>la</strong>1 oppure paro<strong>la</strong>2). Questa funzione è partico<strong>la</strong>rmente uti<strong>le</strong> in un<br />
<strong>corpus</strong> acquisiziona<strong>le</strong> <strong>per</strong> cercare varianti grafiche di una paro<strong>la</strong>, <strong>per</strong> es. casa, caza, chasa;<br />
! escludere alcuni contesti. In una <strong>ricerca</strong> su casa posso escludere tutti i contesti in cui <strong>la</strong> paro<strong>la</strong> è preceduta<br />
dall’articolo <strong>la</strong> (cerca paro<strong>la</strong>2 non preceduta da paro<strong>la</strong>1), oppure tutti i contesti in cui <strong>la</strong> paro<strong>la</strong> è seguita dal<strong>la</strong><br />
preposizione di (cerca paro<strong>la</strong>1 non seguita da paro<strong>la</strong>2);<br />
! generare il contesto sinistro (cerca paro<strong>la</strong>2 preceduta da qualunque paro<strong>la</strong>) o destro (cerca paro<strong>la</strong>1 seguita da<br />
qualunque paro<strong>la</strong>). Per es. posso ottenere <strong>la</strong> lista in ordine alfabetico tutte <strong>le</strong> paro<strong>le</strong> che seguono il verbo voglio<br />
(<strong>per</strong> es. <strong>per</strong> vedere con quali verbi è usato il moda<strong>le</strong>) oppure tute <strong>le</strong> paro<strong>le</strong> che precedono il participio andato<br />
(<strong>per</strong> es. <strong>per</strong> una <strong>ricerca</strong> sull’ausiliare);<br />
Nel <strong>corpus</strong> ora<strong>le</strong> è possibi<strong>le</strong>, se<strong>le</strong>zionando <strong>la</strong> casel<strong>la</strong> di controllo, escludere dal<strong>le</strong> ricerche i turni di<br />
paro<strong>la</strong> <strong>del</strong>l’intervistatore.<br />
13
Figura 3. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> semplice (<strong>corpus</strong> scritto)<br />
Figura 4. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> semplice (<strong>corpus</strong> ora<strong>le</strong>)<br />
Risultati <strong>del</strong><strong>le</strong> ricerche<br />
Le figg. 5 e 6 mostrano i risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> <strong>del</strong><strong>la</strong> paro<strong>la</strong> casa in un testo scritto e in uno<br />
ora<strong>le</strong>. Come si vede, nel<strong>la</strong> cornice in basso compaiono tutti i risultati. Il contesto, cioè <strong>la</strong> forma o <strong>le</strong><br />
forme corrispondenti al<strong>la</strong> stringa di <strong>ricerca</strong> digitata, è presente nell’ultima colonna a destra,<br />
preceduto da informazioni sul testo e sull’informante (n. fi<strong>le</strong>, sotto<strong>corpus</strong>, tipo testua<strong>le</strong>, modalità di<br />
scambio, lingua madre, età, livello di competenza). Di default i risultati appaiono ordinati secondo il<br />
n. di fi<strong>le</strong>, ma possono essere ordinati <strong>per</strong> uno qualsiasi degli altri campi cliccando sul capo colonna<br />
corrispondente. Se<strong>le</strong>zionando uno dei risultati, nel<strong>la</strong> cornice in alto appare il contesto ampio, con <strong>la</strong><br />
forma <strong>ricerca</strong>ta evidenziata in giallo (scorrendo in alto e in basso si può <strong>le</strong>ggere l’intero testo). Nel<br />
14
caso dei testi orali (fig. 6) <strong>la</strong> cornice di sinistra contiene <strong>la</strong> trascrizione, quel<strong>la</strong> di destra consente di<br />
aprire il fi<strong>le</strong> multimedia<strong>le</strong> con <strong>la</strong> registrazione audio/video 21 . In basso a sinistra sono visualizzate <strong>le</strong><br />
occorrenze totali risultanti dal<strong>la</strong> <strong>ricerca</strong> (nei nostri ess. casa compare 971 volte nel <strong>corpus</strong> scritto,<br />
324 nel <strong>corpus</strong> ora<strong>le</strong>).<br />
Figura 5. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “casa” nel <strong>corpus</strong> scritto<br />
Figura 6. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “casa”nel <strong>corpus</strong> ora<strong>le</strong><br />
Salvataggio dei risultati <strong>del</strong><strong>le</strong> ricerche<br />
Agendo sull’icona <strong>del</strong> floppy disk in basso a destra (fig. 7) i risultati di una <strong>ricerca</strong> possono<br />
essere salvati in un fi<strong>le</strong> di formato .txt. Nel<strong>la</strong> finestra di salvataggio, se<strong>le</strong>zionando <strong>le</strong> varie<br />
possibilità e<strong>le</strong>ncate in “salva come” è possibi<strong>le</strong> specificare quali informazioni trasferire su fi<strong>le</strong>: tutte<br />
<strong>le</strong> colonne, il n. fi<strong>le</strong> e il contesto, il solo contesto o <strong>la</strong> lista di frequenza.<br />
21 Nel<strong>le</strong> trascrizioni sono stati inseriti ogni 180 secondi dei tag che indicano i secondi trascorsi dall’inizio <strong>del</strong> fi<strong>le</strong>, <strong>per</strong><br />
facilitare il ritrovamento <strong>del</strong><strong>la</strong> stringa di testo evidenziata sul fi<strong>le</strong> audio-video.<br />
15
Per salvare su fi<strong>le</strong> <strong>le</strong> concordanze, dopo aver digitato come stringa di <strong>ricerca</strong> il carattere *, cliccare<br />
sull’icona <strong>del</strong> floppy disk e se<strong>le</strong>zionare nel menù a scorrimento “salva come” l’opzione “numero<br />
fi<strong>le</strong> e contesto”, oppure “tutte <strong>le</strong> colonne” (esempi dei fi<strong>le</strong> risultanti nel<strong>le</strong> figg. 8 e 9).<br />
Per salvare su fi<strong>le</strong> una lista di frequenza procedere come <strong>per</strong> <strong>le</strong> concordanze, ma se<strong>le</strong>zionare nel<br />
menù a scorrimento “salva come” l’opzione “lista di frequenza” (esempi dei fi<strong>le</strong> risultanti nel<strong>la</strong> fig.<br />
10).<br />
Fig. 7. Modalità di salvataggio su fi<strong>le</strong><br />
Figura 8. Salvataggio di concordanze con l’opzione “tutte <strong>le</strong> colonne”<br />
fi<strong>le</strong> tipo testua<strong>le</strong> madrelingua età livello forma<br />
0889 narrativo2 ing<strong>le</strong>se 20 2-e<strong>le</strong>mentare abbraccio<br />
0163 argomentativo cinese 26 2-e<strong>le</strong>mentare abbraccione<br />
0248 argomentativo ing<strong>le</strong>se 26 2-e<strong>le</strong>mentare abbraccione<br />
0979 narrativo2 albanese 19 4-avanzato abbracciono<br />
0742 prescrittivo albanese 32 altro Abbraci<br />
0793 narrativo2 coreano 29 1-principiante abbracia<br />
0793 narrativo2 coreano 29 1-principiante abbracia<br />
0909 narrativo2 bulgaro 18 2-e<strong>le</strong>mentare abbraciare<br />
1010 narrativo2 francese 25 4-avanzato abbraciare<br />
1015 narrativo2 ing<strong>le</strong>se 22 4-avanzato abbraciatti<br />
0170 argomentativo po<strong>la</strong>cco 21 3-intermedio abbracio<br />
0222 argomentativo russo 32 4-avanzato abbracio<br />
0947 narrativo2 greco 20 3-intermedio abbraciò<br />
Figura 9. Salvataggio di concordanze con l’opzione “numero fi<strong>le</strong> e contesto”<br />
0889 abbraccio<br />
0163 abbraccione<br />
0248 abbraccione<br />
16
0979 abbracciono<br />
0742 Abbraci<br />
0793 abbracia<br />
0793 abbracia<br />
0909 abbraciare<br />
1010 abbraciare<br />
1015 abbraciatti<br />
0170 abbracio<br />
0222 abbracio<br />
0947 abbraciò<br />
Figura 10. Salvataggio di una lista di frequenza<br />
prime 20 forme <strong>per</strong> frequenza nel <strong>corpus</strong> scritto prime 20 forme <strong>per</strong> frequenza nel <strong>corpus</strong> ora<strong>le</strong><br />
5938 e<br />
5888 <strong>la</strong><br />
4502 il<br />
4054 di<br />
3192 che<br />
3184 è<br />
2785 a<br />
2726 un<br />
2421 <strong>per</strong><br />
2229 in<br />
1966 sono<br />
1951 nonna<br />
1941 ha<br />
1919 non<br />
1871 una<br />
1463 si<br />
1425 era<br />
1359 lupo<br />
1357 ma<br />
1302 Con<br />
8303 sì<br />
4437 ehm<br />
4398 è<br />
3889 non<br />
3662 e<br />
2492 no<br />
2278 ma<br />
2265 <strong>la</strong><br />
2166 un<br />
1968 che<br />
1942 <strong>per</strong><br />
1773 a<br />
1749 di<br />
1697 <strong>per</strong>ché<br />
1625 il<br />
1608 in<br />
1451 mhm<br />
1445 io<br />
1235 ho<br />
1222 sono<br />
In modalità <strong>ricerca</strong> semplice è possibi<strong>le</strong> individuare alcuni fenomeni segna<strong>la</strong>ti da caratteri o<br />
sequenze di caratteri speciali, già illustrati nel<strong>le</strong> convenzioni di trascrizione (v. tabel<strong>le</strong> 4, 5 e 6).<br />
Poiché alcuni di questi caratteri non sono presenti sul<strong>la</strong> tastiera <strong>del</strong> PC, si sono riprodotti nel<strong>la</strong><br />
maschera di <strong>ricerca</strong>. Per inserirli nel<strong>la</strong> finestra di <strong>ricerca</strong> è sufficiente fare su di essi doppio clic. A<br />
parte il carattere ÷, che segna<strong>la</strong> il cambio di tema ed è comune ai testi scritti e orali, <strong>per</strong> il resto si<br />
tratta di convenzioni di trascrizione utilizzate solo <strong>per</strong> i testi orali. Riportiamo di seguito i fenomeni<br />
<strong>ricerca</strong>bili grazie ai caratteri speciali 22 :<br />
Tabel<strong>la</strong> 4. Caratteri speciali <strong>per</strong> <strong>la</strong> <strong>ricerca</strong><br />
Fenomeno carattere (o stringa di caratteri) di <strong>ricerca</strong><br />
Falsa partenza @<br />
Tonia esc<strong>la</strong>mativa !<br />
Tonia interrogativa ?<br />
Tonia conclusiva .<br />
Tonia sospensiva …<br />
Giuntura sintattica ,<br />
Domande a coda ¿*?<br />
Pausa [#] breve, [##] media, [###] lunga<br />
Tenuta vocalica : breve, :: media, ::: lunga<br />
22 Nei testi scritti alcuni di questi caratteri sono usati come segni di interpunzione o come simboli paragrafematici.<br />
17
Ricerca avanzata<br />
Sovrapposizione [//]<br />
Autointerruzione [///]<br />
Eterointerruzione [/]<br />
Autocomp<strong>le</strong>tamento [+]<br />
Eterocomp<strong>le</strong>tamento [++]<br />
Interruzione di paro<strong>la</strong> |<br />
Altri fenomeni di interesse linguistico sono stati marcati in modo non visibi<strong>le</strong> <strong>per</strong> l’utente, e sono<br />
recu<strong>per</strong>abili in modalità <strong>ricerca</strong> avanzata. Qui di seguito sono riprodotte <strong>le</strong> maschere di <strong>ricerca</strong><br />
avanzata re<strong>la</strong>tive al <strong>corpus</strong> scritto (fig. 11) e ora<strong>le</strong> (fig. 12) dal<strong>le</strong> quali si può ricavare il set di<br />
fenomeni <strong>ricerca</strong>bili:<br />
Figura 11. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> avanzata nel <strong>corpus</strong> scritto<br />
18
Figura 12. Maschera <strong>per</strong> <strong>la</strong> <strong>ricerca</strong> avanzata nel <strong>corpus</strong> ora<strong>le</strong><br />
Se<strong>le</strong>zionando un e<strong>le</strong>mento <strong>del</strong><strong>la</strong> lista si ottengono tutti i contesti in cui compare il fenomeno, <strong>per</strong> es.<br />
tutte <strong>le</strong> cancel<strong>la</strong>ture; in alternativa è possibi<strong>le</strong> restringere <strong>la</strong> <strong>ricerca</strong> digitando anche una stringa di<br />
caratteri: <strong>per</strong> es. nel<strong>la</strong> fig. 13 vediamo i risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> dei soli contesti di cancel<strong>la</strong>ture<br />
contenenti il testo “ho”.<br />
Statistiche<br />
Figura 13. Risultati <strong>del</strong><strong>la</strong> <strong>ricerca</strong> di “cancel<strong>la</strong>ture” contenenti il testo “ho”<br />
Se<strong>le</strong>zionando <strong>la</strong> voce “statistiche”, è possibi<strong>le</strong> ottenere <strong>le</strong> seguenti misurazioni sul <strong>corpus</strong><br />
se<strong>le</strong>zionato:<br />
Corpus scritto Corpus ora<strong>le</strong><br />
Numero di testi Numero di testi<br />
Numero di <strong>per</strong>iodi Numero di enunciati<br />
19
Numero di paro<strong>le</strong> (tokens) Numero di turni di paro<strong>la</strong><br />
Media <strong>per</strong>iodi <strong>per</strong> testo Numero di paro<strong>le</strong> (tokens)<br />
Media paro<strong>le</strong> <strong>per</strong> <strong>per</strong>iodo Media enunciati <strong>per</strong> testo<br />
Lunghezza media <strong>del</strong><strong>le</strong> paro<strong>le</strong> Media enunciati <strong>per</strong> turno di paro<strong>la</strong><br />
Media paro<strong>le</strong> <strong>per</strong> enunciato<br />
Lunghezza media <strong>del</strong><strong>le</strong> paro<strong>le</strong><br />
Nel <strong>corpus</strong> scritto i confini di <strong>per</strong>iodo sono individuati automaticamente dal programma come<br />
sequenze di paro<strong>le</strong> comprese tra un punto, un punto esc<strong>la</strong>mativo o interrogativo e un altro punto,<br />
punto esc<strong>la</strong>mativo o interrogativo. Poiché <strong>per</strong> ragioni di attendibilità filologica <strong>del</strong><strong>le</strong> trascrizioni non<br />
si è intervenuti sull’uso di maiusco<strong>le</strong>, segni di interpunzione ecc. i risultati di questa misurazione<br />
possono in alcuni casi dipendere dall’usus scribendi <strong>del</strong>l’apprendente. L’unico intervento effettuato<br />
<strong>per</strong> rendere più attendibi<strong>le</strong> <strong>la</strong> misura è stato quello di utilizzare un carattere <strong>le</strong>ggermente diverso (un<br />
punto sovrascritto) <strong>per</strong> gli usi non demarcativi <strong>del</strong> punto, <strong>per</strong> es. <strong>per</strong> serie di punti sospensivi non<br />
corrispondenti a un confine di frase, serie di punti introdotti dallo scrivente <strong>per</strong> altri scopi, come ad<br />
es. segna<strong>la</strong>re abbreviazioni, unire dati o creare un e<strong>le</strong>nco puntato. Nel <strong>corpus</strong> ora<strong>le</strong> i confini di<br />
enunciato sono stati individuati e marcati manualmente sul<strong>la</strong> base di criteri fondamentalmente<br />
prosodici (profilo intonativo, pause), integrati dove necessario da considerazioni semantiche<br />
(comp<strong>le</strong>tezza <strong>del</strong><strong>la</strong> struttura predicativa, compiutezza semantica) 23 .<br />
4. Materiali di supporto<br />
Nel DVD è presente una cartel<strong>la</strong> con questo nome contenente i seguenti fi<strong>le</strong>:<br />
! guida all’uso di ADIL2 (tratta dal<strong>la</strong> presente introduzione);<br />
! consegne <strong>del</strong><strong>le</strong> prove scritte;<br />
! immagini <strong>del</strong><strong>le</strong> vignette, foto o altre illustrazioni utilizzate <strong>per</strong> elicitare <strong>la</strong> narrazione di<br />
una storia;<br />
! <strong>descrizione</strong> <strong>del</strong><strong>le</strong> scene di film utilizzate <strong>per</strong> elicitare <strong>la</strong> narrazione di una storia;<br />
! database degli informanti, da cui si possono ricavare ulteriori notizie sull’informante<br />
oltre a quel<strong>le</strong> utili <strong>per</strong> se<strong>le</strong>zionare il <strong>corpus</strong> (età, sesso, lingua madre, livello di<br />
competenza). Per es. si possono ricavare notizie sul<strong>la</strong> professione, il titolo di studio, il<br />
numero di altre lingue straniere conosciute, eventuali origini italiane, <strong>le</strong> motivazioni che<br />
lo hanno indotto a studiare <strong>la</strong> nostra lingua, il tipo di contatto preva<strong>le</strong>nte con lingua<br />
italiana in patria ecc.<br />
! e<strong>le</strong>nco <strong>del</strong><strong>le</strong> convenzioni di trascrizione e visualizzazione;<br />
! e<strong>le</strong>nco dei fonosimboli;<br />
23 Sul<strong>la</strong> comp<strong>le</strong>ssità connessa al<strong>la</strong> definizione di enunciato e, conseguentemente, all’individuazione dei confini di<br />
enunciato nel par<strong>la</strong>to cfr. Cresti 2000: vol. I, 39-63.<br />
20
! e<strong>le</strong>nco <strong>del</strong><strong>le</strong> lingue madri degli informanti e re<strong>la</strong>tivi codici ISO.<br />
Riferimenti bibliografici<br />
Ambroso S. - Bonvino E. 2009, Configurazioni di discorso. Un’unità di analisi <strong>del</strong> par<strong>la</strong>to L2, in<br />
Andorno - Rastelli 2009: 153-177.<br />
Andorno C. - Rastelli S. (a c. di) 2009, Atti <strong>del</strong> convegno Corpora di italiano L2: tecnologie,<br />
metodi, spunti tecnici. Pavia 22-23 novembre 2007, Perugia, Guerra.<br />
Barbera M. – Marello C., 2004, VALICO (Varietà di Apprendimento <strong>del</strong><strong>la</strong> Lingua Italiana Corpus<br />
Online): una presentazione, «ITALS» 4, Guerra, Perugia.<br />
Barni M. - Gallina F. 2008, Le paro<strong>le</strong> degli stranieri: il LIPS, il primo <strong>le</strong>ssico di frequenza<br />
<strong>del</strong>l’italiano par<strong>la</strong>to dagli stranieri, in: M. Barni - D. Troncarelli - C. Bagna (a c. di),<br />
Lessico e apprendimenti. Il ruolo <strong>del</strong> <strong>le</strong>ssico nel<strong>la</strong> linguistica educativa, Mi<strong>la</strong>no, Franco<br />
Angeli: 143-156.<br />
Barni M., Gallina F. 2009, Il <strong>corpus</strong> LIPS (Lessico <strong>del</strong>l’italiano par<strong>la</strong>to da stranieri): prob<strong>le</strong>mi di<br />
trattamento <strong>del</strong><strong>le</strong> forme e di <strong>le</strong>mmatizzazione, in C. Andorno e S. Rastelli (a c. di) 2009: 139-<br />
151.<br />
Cassandro M, Apprendimento in contesto guidato: l’im<strong>per</strong>fetto in italiano L2, Tesi di dottorato in<br />
Linguistica e didattica <strong>del</strong><strong>la</strong> lingua italiana a stranieri (XII ciclo), Tutor M. Benedetti,<br />
discussa nell’a.a. 200-2001.<br />
Cresti E. 2000, Corpus di italiano par<strong>la</strong>to. Volume I. Introduzione. Volume II. Campionamenti,<br />
Firenze, Accademia <strong>del</strong><strong>la</strong> Crusca.<br />
Ferreiro E. / Pontecorvo C. et alii, 1996, Cappuccetto Rosso impara a scrivere, Firenze, La Nuova<br />
Italia.<br />
Granger S. 2004, Computer <strong>le</strong>arner <strong>corpus</strong> research: current status and future prospectives, in: U.<br />
Connor - T. Utpon (a c. di) Applied Corpus Linguistics: A Multidimensional Perspective,<br />
Amsterdam – At<strong>la</strong>nta, Rodopi: 123-145.<br />
Lo Duca M. G., 1998, Testi narrativi in apprendenti l’italiano come L2: resoconto di una <strong>ricerca</strong> in<br />
corso, «Études romanes» 42: 281-94.<br />
Pa<strong>le</strong>rmo M. - Troncarelli D. – Petrocelli E. (in stampa), Le ricadute <strong>del</strong>l’input sull’output: aspetti<br />
<strong>del</strong><strong>la</strong> coesione nei libri di testo e nel<strong>le</strong> produzioni di apprendenti di Italiano L2 e L1, in: Atti<br />
<strong>del</strong> convegno-seminario Interazione didattica e apprendimento linguistico, Università degli<br />
studi di Bergamo 17-18 giugno 2008 (in stampa).<br />
Pa<strong>le</strong>rmo M., 2005, L’ADIL2 (Archivio Digita<strong>le</strong> di Italiano L2), «Studi Italiani di Linguistica<br />
Teorica e applicata» XXXIV 2005: 357-73.<br />
Pa<strong>le</strong>rmo M., 2006, Sul<strong>la</strong> costruzione <strong>del</strong> <strong>per</strong>iodo ipotetico in italiano L2, «Studi Italiani di<br />
Linguistica Teorica e applicata» XXXV 2006: 389-404.<br />
Rossini Favretti R. (a c. di) 2000 = Linguistica e informatica. Corpora, multimedialità e <strong>per</strong>corsi di<br />
apprendimento, Roma, Bulzoni.<br />
Vedovelli M. 2006, Il LIPS - Lessico di frequenza <strong>del</strong>l’Italiano Par<strong>la</strong>to dagli Stranieri, in C.<br />
Bar<strong>del</strong>, J. Nystedt (a c. di), Progetto Dizionario Italiano-Svedese. Atti <strong>del</strong> primo colloquio,<br />
Stoccolma, 10-12 febbraio 2005, Acta Universitatis Stockholmiensis 22, Stockolm,<br />
Romanica Stockholmiensia: 55-78.<br />
21