STATISTICS IN CORPUS LINGUISTICS

Anno accademico 2023/2024 - Docente: MARCO VENUTI

Risultati di apprendimento attesi

Secondo i descrittori di Dublino gli studenti dovranno, alla fine del corso, acquisire:

1) Conoscenza e comprensione: Comprendere le basi della Corpus Linguistics; Comprendere le basi della statistica in relazione all’analisi quantitativa della lingua; Conoscere l’utilizzo del software LancsBox; Conoscere l’utilizzo degli Stats tools online.

2) Capacità di applicare conoscenza e comprensione: Saper identificare ed utilizzare gli strumenti e le misure statistiche appropriate ai diversi tipi di analisi quantitative a partire dagli specifici obiettivi identificati.

3) Autonomia di giudizio: Dimostrare di saper raccogliere, analizzare ed interpretare dati testuali da un contesto complesso e di saper adottare la soluzione progettuale più efficiente, motivando in modo appropriato tutte le scelte necessarie per lo svolgimento del progetto.

4) Abilità comunicative: Saper spiegare ed argomentare in modo chiaro le diverse fasi dell’analisi svolta, facendo riferimento alla terminologia appropriata.

5) Capacità di apprendimento: Tramite i concetti, le nozioni e le capacità acquisite durante il corso, saper intraprendere gli studi successivi con un alto grado di autonomia.

Modalità di svolgimento dell'insegnamento

Lezioni frontali e attività seminariali pratiche in lingua inglese.

Prerequisiti richiesti

Conoscenza della lingua inglese di un livello B2, nozioni di base linguistica generale, o di filosofia del linguaggio o di semiotica.

Frequenza lezioni

Obbligatoria.

Contenuti del corso

Dopo un’introduzione ai corpora e alle nozioni di base riferite alla creazione di corpora, il corso introdurrà, con regolari sessioni pratiche, l’uso di software per l’analisi statistica della lingua inglese in merito a: a) l’analisi del lessico, attraverso i concetti di collocation, keywords e lexical density; b) un approccio lessico-grammaticale alla descrizione linguistica; c) l’analisi della variazione in termini di registro linguistico; d) studi sociolinguistici e stilistici; e) confronti diacronici.

Testi di riferimento

Brezina, Vaclav 2018 Statistics in Corpus Linguistics. A Practical Guide, Cambridge University Press, pp. 296.

Baker, Paul, 2010, “Will Ms ever be as frequent as Mr? A corpus-based comparison of gendered terms across four diachronic corpora of British English”. In: Gender and Language. 4/1, pp.125-149.

I materiali per le esercitazioni pratiche con software di interrogazione di corpora verranno resi disponibili tramite STUDIUM

Si ricorda che, ai sensi dell’art. 171 della legge 22 aprile 1941, n. 633 e successive disposizioni, fotocopiare libri in commercio, in misura superiore al 15% del volume o del fascicolo di rivista, è reato penale.

Per ulteriori informazioni sui vincoli e sulle sanzioni all’uso illecito di fotocopie, è possibile consultare le Linee guida sulla gestione dei diritti d’autore nelle università (a cura della Associazione Italiana per i Diritti di Riproduzione delle opere dell’ingegno - AIDRO).

I testi di riferimento possono essere consultati in Biblioteca.

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

1) Prova pratica: prima della fine del corso, studenti e studentesse costruiranno un corpus da interrogare con gli strumenti appresi durante le lezioni. In tre prove in itinere, ciascuna alla fine di un ciclo di 6 lezioni, verranno valutati: a) i criteri di selezione dei testi, b) la raccolta dei dati testuali e l’accuratezza l’eventuale dettaglio dell’annotazione, c) l’identificazione di una valida ipotesi di ricerca

2) Prova scritta: alla fine del corso, studenti e studentesse presentano una relazione (3000/4000 parole) in cui verranno presentati e discussi i risultati dell’analisi svolta sul corpus costruito. Verrà valutato il livello di dettaglio dell’analisi ed i suoi risultati anche in base alle scelte fatte in fase di costruzione del corpus

3) Prova orale: discussione sulla relazione presentata; verranno valutati elementi non emersi o non sufficientemente chiari presenti nella relazione

Per la valutazione dell’esame si terrà conto della padronanza dei contenuti e delle competenze acquisite, dell’accuratezza linguistica e proprietà lessicale, nonché della capacità argomentativa dimostrata dal/la candidato/a.

Esempi di domande e/o esercizi frequenti

Criteri di Costruzione del Corpus; Scelta del tool più appropriato; Scelta dell’approccio statistico più appropriato; Ipotesi di ricerca.
ENGLISH VERSION