Scheda insegnamento

Laurea: DIGITAL HUMANITIES PER L'ITALIANO
Insegnamento: LINGUISTICA DEI CORPORA E LABORATORIO DI CODIFICA DEI TESTI
Anno di corso: III
Semestre: II
Docenti: Irene Fioravanti
Stefania Spina
SSD: L-LIN/01
CFU: 9
Carico di lavoro globale: 225 ore
Ripartizione del carico di lavoro: 60 ore di lezione e 165 ore di studio individuale
 Pagina LOL con materiale didattico digitale dell'insegnamento.

Prerequisiti

Sono necessarie una buona conoscenza della lingua e della grammatica italiana, e conoscenze di base nel campo della Linguistica generale. In particolare:

  • livelli di analisi delle lingue: fonologia, morfologia, sintassi, lessico;
  • principali unità di analisi linguistica: fonema, morfema, lessema, sintagma, frase, testo.

È utile, in tal senso, aver già sostenuto l’esame di Linguistica generale. Eventuali lacune potranno essere recuperate facendo riferimento ai seguenti testi:

  • Berruto, B., Cerruti, M. (2017). La linguistica. Un corso introduttivo, Seconda Edizione, UTET Università.

Gli studenti possono comunque utilizzare la piattaforma LOL per interagire con il docente e chiarire eventuali dubbi sulle proprie conoscenze disciplinari di base.

Si richiede la comprensione della lingua italiana orale e scritta al livello B2 del QCER. Se necessario, e in particolare se segnalato nei colloqui in ingresso, gli studenti devono avvalersi del servizio di tutorato linguistico alla pari offerto dall’Ateneo.

Obiettivi formativi - Risultati di apprendimento attesi

Conoscenza e comprensione:

  • conoscere le principali tappe di sviluppo, i metodi e gli strumenti di analisi della Linguistica dei corpora;
  • comprendere le opportunità legate all’uso di corpora linguistici nel campo della ricerca linguistica;
  • conoscere il modo in cui i dati linguistici estratti da corpora, le risorse e le metodologie usate dalla linguistica dei corpora sono usati per analizzare l’uso linguistico, anche come supporto alla didattica delle lingue;
  • conoscere gli standard, le metodologie e gli strumenti necessari all’elaborazione e alla codifica di dati linguistici, prodotti da parlanti nativi e da apprendenti.

Applicazione della conoscenza e della comprensione:

  • essere in grado di analizzare e valutare dati estratti da corpora, attraverso le metodologie e le risorse della Linguistica dei corpora;
  • saper utilizzare le metodologie e le risorse necessarie ad annotare dati linguistici secondo gli standard internazionali di codifica.

Contenuto del corso

l corso è articolato in quattro sezioni.

Nella prima sezione viene delineata la posizione della Linguistica dei corpora all’interno delle Scienze del linguaggio, e ne vengono descritte le caratteristiche salienti. Si introduce e si problematizza, inoltre, la nozione di corpus in linguistica (6 ore circa).

La seconda sezione affronta due aspetti centrali della disciplina: il trattamento di dati linguistici (codifica testuale e annotazione linguistica), e la loro successiva analisi. A partire dall’interrogazione di corpora, vengono descritte alcune metodologie di analisi di dati linguistici strutturati, basate su misure di tipo quantitativo (frequenza, dispersione, misure di associazione e di ricchezza e densità lessicale, analisi per keywords) e qualitativo (analisi di concordanze). Alcuni casi di studio proposti riguardano un fenomeno lessico-grammaticale rilevante in molti ambiti applicativi, tra cui quello della didattica delle lingue: le combinazioni lessicali (28 ore circa).

La terza sezione affronta sinteticamente il tema dell’uso di corpora nella didattica dell’italiano (6 ore circa).

La sezione finale (Laboratorio di codifica dei testi) è infine finalizzata a coinvolgere gli studenti in attività pratiche di codifica di dati linguistici (20 ore)

Metodi didattici

Per studenti frequentanti

Lezioni frontali e attività applicative, da integrare con lo studio progressivo dei testi di riferimento e dei materiali proposti sulla piattaforma LOL.

Per studenti non frequentanti

Studio individuale dei testi di riferimento, col supporto delle dispense e dei materiali scaricabili dalla piattaforma LOL.

Verranno utilizzate le piattaforme digitali LOL e Teams, che potranno venire adoperate anche per modalità di didattica a distanza secondo le indicazioni elaborate dai CdS.

Agli studenti che abbiano depositato in Segreteria certificazioni di disabilità o DSA si consiglia di contattare all’inizio del corso il/la docente, anche attraverso la Commissione per le differenze e l’inclusione (differenze-inclusione@unistrapg.it) per concordare misure compensative e/o dispensative di adattamento della didattica.

Metodi di accertamento

L’esame si svolgerà in modalità orale. Gli studenti dovranno dimostrare di conoscere e di aver compreso i contenuti del corso, anche attraverso la loro applicazione concreta. Un’attenzione particolare sarà rivolta all’uso adeguato della terminologia specifica che caratterizza la disciplina, nonché alla capacità di sintesi e di rielaborazione critica dei contenuti del corso.

Per gli studenti con certificazioni di disabilità o DSA le modalità d’esame saranno concordate in relazione alle specifiche esigenze, sentito il parere della Commissione per le differenze e l’inclusione.

Testi di esame

Per studenti frequentanti:

  • Freddi M. (2014). Linguistica dei corpora. Carocci.
  • Sinclair J. (1991). Corpus, concordance, collocation. Oxford University Press.
  • Johns T. (1991). Should you be persuaded: Two samples of data-driven learning materials. English Language Research Journal, 4, 1–16.
  • Hadley G. (2002). An introduction to data-driven learning. RELC Journal 33(2), pp. 99-124.

Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.

Per studenti non frequentanti:

  • Freddi M. (2014). Linguistica dei corpora. Carocci.
  • Sinclair J. (1991). Corpus, concordance, collocation. Oxford University Press.
  • Johns T. (1991). Should you be persuaded: Two samples of data-driven learning materials. English Language Research Journal, 4, 1–16.
  • Hadley G. (2002). An introduction to data-driven learning. RELC Journal 33(2), pp. 99-124.

Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.

Testi di consultazione e approfondimento

  • Tony McEnery & Andrew Hardie (2012), Corpus Linguistics. Method, Theory and Practice. Cambridge, Cambridge University Press.
  • Stefanowitsch, A. 2020. Corpus linguistics: A guide to the methodology. Berlin: Language Science Press.
  • Pierazzo E. (2005). La codifica dei testi: un'introduzione. Carocci.

Altre informazioni

È richiesta l’iscrizione on-line al corso sulla piattaforma LOL. L'orario di ricevimento sarà pubblicato sul sito web di ateneo.

È raccomandata una regolare frequenza.

E-mail del docente: stefania.spina@unistrapg.it.

L’orario di ricevimento sarà pubblicato sul sito web di Ateneo.