Groupe de Travail de l'équipe “Probabilités & Statistiques de l'Institut Élie Cartan (Nancy)
19 juin 2014 : Aurélie Muller-Gueudin
Introduction au Lasso

Nous nous plaçons dans le cadre d'une régression où le nombre de variables explicatives dépasse le nombre d'observations. Il est alors nécessaire de trouver un modèle de régression parcimonieux, qui choisisse un nombre restreint de variables explicatives. La méthode classique des moindres carrés ne fonctionne plus dans ce cas.

Une technique alternative a été proposée en 1996 par Tibshirani : le Lasso, qui cherche une solution à la régression en contraignant le modèle à être parcimonieux au sens de la norme l1. Nous présenterons les propriétés basiques de la solution Lasso, puis montrerons l'intérêt de cette technique en terme de qualité de la régression et de choix parcimonieux des variables explicatives.