Clustering en ligne:
Application à la segmentation de clients de sites marchands
Collaboration avec iAdvize, Nantes
Le projet
La segmentation de l’assistance aux clients sur les sites marchands consiste à proposer en temps quasi réel un type d’assistance parmi plusieurs (téléphone, mail, visio, etc.). Cela représente un certain nombre de gageures théoriques et techniques : temps de réaction extrêmement réduit, volume important de données, et sanction immédiate si l’assistance n’est pas adaptée. C’est le coeur de métier de l’entreprise iAdvize, basée à Nantes.
Ce projet, démarré en novembre 2014, est celui de la thèse CIFRE de Le Li, entre Inria, le laboratoire Paul Painlevé, l’Université d’Angers et iAdvize. Le Li a pour mission de proposer une approche de clustering en ligne pour effectuer de la segmentation à la volée, reposant sur la théorie PAC-bayésienne et l’implémentation d’estimateurs quasi-bayésiens par MCMC. La combinaison de ces ingrédients s’est révélée fructueuse dans plusieurs contextes statistiques (régression, factorisation de grandes matrices, ranking) et voit ici son champs d’application étendu.
Le consortium se compose de l’équipe R&D d’iAdvize (Nantes), de Le Li (doctorant CIFRE), de Sébastien Loustau (co-directeur de thèse, MCF HDR, Université d’Angers) et de Benjamin Guedj (co-directeur de thèse, CR Inria & Laboratoire Paul Painlevé).
Pré-publication
[1] L. Li, B. Guedj and S. Loustau. PAC-Bayesian Online Clustering, arXiv preprint. Available online: http://arxiv.org/abs/1602.00522