Inizio contenuto principale del sito

STATISTICAL LEARNING & LARGE DATA 2

Informations

  • Responsabile didattico: Francesca Chiaromonte
  • Semestre: 2° semestre
  • Data inizio: 4 marzo 2024
  • CFU: 2
  • Durata (ore): 20
  • Corso: Economia

Details

Contenuti

Questo corso introdurrà gli studenti a vari argomenti di Statistical Learning contemporaneo e a metodi utilizzati per l'analisi di dataset complessi di grandi dimensione che sono sempre più comuni in molti campi scientifici.
 Il contenuto sarà organizzato in due moduli che gli allievi possono seguire in anni diversi. Rispetto ai corsi tradizionali, il focus riguarderà l'analisi di dataset concreti di interesse per gli studenti attraverso progetti di gruppo e sessioni di 'practicum' associati a ciascuna lezione.
 
 Modulo 2
 - Feature selection and regularization techniques for high-dimensional Linear and Generalized Linear Models
 - Feature screening algorithms for ultra-high dimensional supervised problems
 - Supervised dimension reduction; Sufficient Dimension Reduction and related techniques
 - Subsampling/partitioning approaches for ultra-high sample sizes
 - Under- and oversampling approaches for data rebalancing
 Prerequisiti: una conoscenza pratica dei metodi compresi nel Modulo 1.
 Valutazione: Progetto di gruppo con presentazione finale e relazione scritta.
 Materiali: An Introduction to Statistical Learning - with Applications in R (James, Witten, Hastie, Tibshirani; Springer). Computer Age Statistical Inference (B. Efron, T. Hastie). Se necessario, verranno forniti collegamenti a ulteriore materiale.

Docenti

  • FRANCESCA CHIAROMONTE
    20 ore