Data Science e Ricerca Psicosociale
Corso integrato (IC)
Obiettivi
Al termine del corso gli studenti otterranno:
- la conoscenza dei principi alla base dell’applicazione della data science a contesti di ricerca in ambito psicologico e psicosociale;
- la conoscenza delle principali linee di ricerca attive in questo ambito e delle prospettive di sviluppo future, includendo approcci di text mining e l’impiego di modelli linguistici di grandi dimensioni (LLM) come strumenti per l’analisi e la produzione di contenuti;
- conoscenze pratiche utili a svolgere in autonomia analisi di contenuto su dati testuali digitali mediante strumenti open-source o free-to-use, con attenzione alla documentazione delle procedure e ai limiti metodologici.
Programma
Il termine data science si riferisce a un campo emergente di ricerca e pratica che si concentra sull’ottenere, elaborare, visualizzare, analizzare, conservare e riutilizzare grandi moli di informazioni. Un termine correlato, “big data”, è stato usato per riferirsi a una delle principali sfide affrontate in molti contesti applicativi: la necessità di analizzare grandi fonti di dati eterogenei, spesso prodotti in ambienti digitali.
Il corso è composto da due parti.
- Nella prima verranno presentati i temi principali legati all’applicazione della data science ai contesti di ricerca psicologici e psicosociali, illustrando esempi di studi basati su dati digitali. Saranno introdotti i concetti di base dell’analisi dei testi come dati (text mining e approcci text-as-data), le opportunità offerte dall’analisi computazionale dei contenuti e le principali criticità metodologiche, tra cui validità, affidabilità, replicabilità e bias. In questa cornice verrà inoltre discusso il ruolo dei modelli generativi e dei Large Language Models (LLM) come strumenti per supportare alcune fasi della ricerca, quali sintesi, classificazione e annotazione assistita, evidenziandone potenzialità e limiti.
- La seconda parte ha carattere applicativo. Gli studenti saranno guidati nell’organizzazione di dataset testuali digitali e nell’applicazione di tecniche di analisi di contenuto mediante strumenti open-source o free-to-use. L’attività laboratoriale culminerà nella realizzazione di un progetto di gruppo finalizzato alla costruzione e documentazione di un semplice protocollo di ricerca, con discussione critica dei risultati e dei limiti metodologici.
Esame
Il raggiungimento degli obiettivi del corso sarà verificato tramite un elaborato finale, nel quale lo studente potrà dimostrare la propria capacità di rielaborare criticamente i contenuti appresi e/o di applicare le competenze pratiche acquisite durante il corso.
La votazione finale potrà essere integrata da un esame orale facoltativo.
Bibliografia
- Woo, S. E. E., Tay, L. E., & Proctor, R. W. (2020). Big data in psychological research. American Psychological Association (alcuni capitoli indicati a lezione).
- Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), 267–297.
- Chancellor, S., & De Choudhury, M. (2020). Methods in predictive techniques for mental health status on social media: A critical review. npj Digital Medicine, 3, 43.
- Volkmer, S., Meyer-Lindenberg, A., & Schwarz, E. (2024). Large language models in psychiatry: Opportunities and challenges. Psychiatry Research, 339, 116026.
- Settanni, M., Quilghini, F., Toscano, A., & Marengo, D. (2025). Assessing the accuracy and consistency of large language models in triaging social media posts for psychological distress. Psychiatry Research, 351, 116583.
- Slide e materiali forniti dal docente.