Laurea: | DIGITAL HUMANITIES PER L'ITALIANO |
Insegnamento: | LINGUISTICA DEI CORPORA E LABORATORIO DI CODIFICA DEI TESTI |
Anno di corso: | III |
Semestre: | II |
Docenti: | Irene Fioravanti Stefania Spina |
SSD: | L-LIN/01 |
CFU: | 9 |
Carico di lavoro globale: | 225 ore |
Ripartizione del carico di lavoro: | 60 ore di lezione e 165 ore di studio individuale |
Pagina LOL con materiale didattico digitale dell'insegnamento. |
Prerequisiti
Sono necessarie una buona conoscenza della lingua e della grammatica italiana, e conoscenze di base nel campo della Linguistica generale. In particolare:
- livelli di analisi delle lingue: fonologia, morfologia, sintassi, lessico;
- principali unità di analisi linguistica: fonema, morfema, lessema, sintagma, frase, testo.
È utile, in tal senso, aver già sostenuto l’esame di Linguistica generale. Eventuali lacune potranno essere recuperate facendo riferimento ai seguenti testi:
- Berruto, B., Cerruti, M. (2017). La linguistica. Un corso introduttivo, Seconda Edizione, UTET Università.
Gli studenti possono comunque utilizzare la piattaforma LOL per interagire con il docente e chiarire eventuali dubbi sulle proprie conoscenze disciplinari di base.
Si richiede la comprensione della lingua italiana orale e scritta al livello B2 del QCER. Se necessario, e in particolare se segnalato nei colloqui in ingresso, gli studenti devono avvalersi del servizio di tutorato linguistico alla pari offerto dall’Ateneo.
Obiettivi formativi - Risultati di apprendimento attesi
Conoscenza e comprensione:
- conoscere le principali tappe di sviluppo, i metodi e gli strumenti di analisi della Linguistica dei corpora;
- comprendere le opportunità legate all’uso di corpora linguistici nel campo della ricerca linguistica;
- conoscere il modo in cui i dati linguistici estratti da corpora, le risorse e le metodologie usate dalla linguistica dei corpora sono usati per analizzare l’uso linguistico, anche come supporto alla didattica delle lingue;
- conoscere gli standard, le metodologie e gli strumenti necessari all’elaborazione e alla codifica di dati linguistici, prodotti da parlanti nativi e da apprendenti.
Applicazione della conoscenza e della comprensione:
- essere in grado di analizzare e valutare dati estratti da corpora, attraverso le metodologie e le risorse della Linguistica dei corpora;
- saper utilizzare le metodologie e le risorse necessarie ad annotare dati linguistici secondo gli standard internazionali di codifica.
Contenuto del corso
l corso è articolato in quattro sezioni.
Nella prima sezione viene delineata la posizione della Linguistica dei corpora all’interno delle Scienze del linguaggio, e ne vengono descritte le caratteristiche salienti. Si introduce e si problematizza, inoltre, la nozione di corpus in linguistica (6 ore circa).
La seconda sezione affronta due aspetti centrali della disciplina: il trattamento di dati linguistici (codifica testuale e annotazione linguistica), e la loro successiva analisi. A partire dall’interrogazione di corpora, vengono descritte alcune metodologie di analisi di dati linguistici strutturati, basate su misure di tipo quantitativo (frequenza, dispersione, misure di associazione e di ricchezza e densità lessicale, analisi per keywords) e qualitativo (analisi di concordanze). Alcuni casi di studio proposti riguardano un fenomeno lessico-grammaticale rilevante in molti ambiti applicativi, tra cui quello della didattica delle lingue: le combinazioni lessicali (28 ore circa).
La terza sezione affronta sinteticamente il tema dell’uso di corpora nella didattica dell’italiano (6 ore circa).
La sezione finale (Laboratorio di codifica dei testi) è infine finalizzata a coinvolgere gli studenti in attività pratiche di codifica di dati linguistici (20 ore)
Metodi didattici
Per studenti frequentanti
Lezioni frontali e attività applicative, da integrare con lo studio progressivo dei testi di riferimento e dei materiali proposti sulla piattaforma LOL.
Per studenti non frequentanti
Studio individuale dei testi di riferimento, col supporto delle dispense e dei materiali scaricabili dalla piattaforma LOL.
Verranno utilizzate le piattaforme digitali LOL e Teams, che potranno venire adoperate anche per modalità di didattica a distanza secondo le indicazioni elaborate dai CdS.
Agli studenti che abbiano depositato in Segreteria certificazioni di disabilità o DSA si consiglia di contattare all’inizio del corso il/la docente, anche attraverso la Commissione per le differenze e l’inclusione (differenze-inclusione@unistrapg.it) per concordare misure compensative e/o dispensative di adattamento della didattica.
Metodi di accertamento
L’esame si svolgerà in modalità orale. Gli studenti dovranno dimostrare di conoscere e di aver compreso i contenuti del corso, anche attraverso la loro applicazione concreta. Un’attenzione particolare sarà rivolta all’uso adeguato della terminologia specifica che caratterizza la disciplina, nonché alla capacità di sintesi e di rielaborazione critica dei contenuti del corso.
Per gli studenti con certificazioni di disabilità o DSA le modalità d’esame saranno concordate in relazione alle specifiche esigenze, sentito il parere della Commissione per le differenze e l’inclusione.
Testi di esame
Per studenti frequentanti:
- Freddi M. (2014). Linguistica dei corpora. Carocci.
- Sinclair J. (1991). Corpus, concordance, collocation. Oxford University Press.
- Johns T. (1991). Should you be persuaded: Two samples of data-driven learning materials. English Language Research Journal, 4, 1–16.
- Hadley G. (2002). An introduction to data-driven learning. RELC Journal 33(2), pp. 99-124.
Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.
Per studenti non frequentanti:
- Freddi M. (2014). Linguistica dei corpora. Carocci.
- Sinclair J. (1991). Corpus, concordance, collocation. Oxford University Press.
- Johns T. (1991). Should you be persuaded: Two samples of data-driven learning materials. English Language Research Journal, 4, 1–16.
- Hadley G. (2002). An introduction to data-driven learning. RELC Journal 33(2), pp. 99-124.
Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.
Testi di consultazione e approfondimento
- Tony McEnery & Andrew Hardie (2012), Corpus Linguistics. Method, Theory and Practice. Cambridge, Cambridge University Press.
- Stefanowitsch, A. 2020. Corpus linguistics: A guide to the methodology. Berlin: Language Science Press.
- Pierazzo E. (2005). La codifica dei testi: un'introduzione. Carocci.
Altre informazioni
È richiesta l’iscrizione on-line al corso sulla piattaforma LOL. L'orario di ricevimento sarà pubblicato sul sito web di ateneo.
È raccomandata una regolare frequenza.
E-mail del docente: stefania.spina@unistrapg.it.
L’orario di ricevimento sarà pubblicato sul sito web di Ateneo.