Samuel Stocksieker

Thematic seminars
big data and econometrics seminar

Samuel Stocksieker

Université Claude Bernard Lyon 1
Imbalanced Data : Comment faire face au déséquilibre de données pour améliorer les performances des modèles prédictifs ?
Venue

IBD Salle 21

Îlot Bernard du Bois - Salle 21

AMU - AMSE
5-9 boulevard Maurice Bourdet
13001 Marseille

Date(s)
Tuesday, February 25 2025| 2:00pm to 3:30pm
Contact(s)

Sullivan Hué: sullivan.hue[at]univ-amu.fr
Michel Lubrano: michel.lubrano[at]univ-amu.fr

Abstract

Les données jouent un rôle essentiel dans l’apprentissage automatique, la modélisation statistique et, plus généralement, l’intelligence artificielle. Elles fournissent en effet la matière première nécessaire à la construction des modèles, qu’il s’agisse de méthodes d’apprentissage supervisé ou non supervisé, ou de techniques statistiques plus traditionnelles ou même de réseaux neuronaux profonds. Plus les données sont riches, variées et représentatives de la réalité, plus les modèles peuvent être précis, généralisables et utiles dans divers contextes. Par conséquent, la qualité des résultats est intimement liée la qualité des données utilisées.
L’apprentissage à partir de valeurs rares, extrêmes ou non, et plus généralement à partir de données déséquilibrées reste encore un défi majeur et assez inexploré pour les tâches de régression. De plus, les valeurs rares représentent souvent un événement important que les praticiens cherchent à comprendre ou prédire.
Comment identifier ce phénomène ? Quels impacts cela peut-il avoir sur la modélisation ? Quelles solutions permettent d’appréhender cette problématique ? Voici les questions auxquelles essaiera de répondre cette présentation sur le sujet.