Tirocini presso il CInUm

Sono in fase di attivazione dei tirocini da 3 o 6 CFU, preferibilmente per studenti e studentesse delle Lauree Magistrali, in collaborazione col progetto "EmoITA: Realizzazione del primo dataset italiano per il riconoscimento automatico delle emozioni" e che si svolgeranno a partire da fine ottobre.

Chi fosse interessato/a deve inviare una mail al prof. Venuti (marco.venuti@unict.it), e verrà poi conttato/a per un colluquio.

Di seguito le indicazioni generali per le attività dei due tirocini

  • Traduzione del dataset

Cerchiamo collaboratori per la traduzione in lingua italiana del corpus inglese EmoBank. EmoBank è il più grande dataset esistente per la emotion analysis dimensionale: 10.000 frasi di lunghezza variabile (da una a centotrenta parole) sono state annotate in base ai valori di Valence (grado di piacere), Arousal (grado di eccitazione) e Dominance (grado di controllo della situazione) che suscitano nel lettore. Le frasi sono estratte da testi appartenenti a vari domini (opere di finzione, blog, lettere, titoli di giornali, guide di viaggio, saggi). I partecipanti riceveranno una quota delle frasi da tradurre e, se possibile, i testi da cui sono state tratte.

Il corpus così prodotto potrà aprire la strada al riconoscimento automatico delle emozioni in lingua italiana, un ambito dell’Intelligenza Artificiale le cui applicazioni spaziano dalle interazioni con assistenti virtuali alla gestione di eventi catastrofici, dal marketing allo studio di dinamiche sociali di massa.

  • Annotazione del dataset

Cerchiamo collaboratori per l’annotazione del corpus inglese EmoBank dal punto di vista degli stati emotivi. EmoBank è il più grande dataset esistente per la emotion analysis dimensionale: 10.000 frasi di lunghezza variabile (da una a centotrenta parole) sono state annotate in base ai valori di Valence (grado di piacere), Arousal (grado di eccitazione) e Dominance (grado di controllo della situazione) che suscitano nel lettore. Le frasi sono estratte da testi appartenenti a vari domini (opere di finzione, blog, lettere, titoli di giornali, guide di viaggio, saggi). I partecipanti riceveranno una quota delle frasi, alle quali dovranno assegnare i punteggi di Valence, Arousal e Dominance per loro più adeguati.

Il corpus così prodotto potrà aprire la strada al riconoscimento automatico delle emozioni in lingua italiana, un ambito dell’Intelligenza Artificiale le cui applicazioni spaziano dalle interazioni con assistenti virtuali alla gestione di eventi catastrofici, dal marketing allo studio di dinamiche sociali di massa.


Data di pubblicazione: 17/10/2022

Vai alla scheda del prof. Marco VENUTI