Segmenter et créer des clusters sur Tableau Desktop
Cette vidéo présente la technique du clustering sur Tableau Dekstop et décrit en détail comment peut on faire une analyse via la technique de machine learning (clustering) sur Tableau Desktop.
C’est quoi le clustering ?
Le clustering est une des techniques de Machine Learning(ML) non supervisés, que doit connaitre tout data scientiste dont la finalité est de regrouper les observations ayant des caractéristiques similaires. Les techniques de clustering n’utilisent pas les informations de sortie(output) pour l’entraînement, mais laissent plutôt l’algorithme définir elle même la sortie. Ceci dit, Dans les méthodes de clustering, on ne peut inspecter la qualité de la solution à travers une visualisation des résultats.
Quelle méthode de clustering utilise Tableau Desktop?
La méthode de clustering la plus populaire est K-Means, nommée aussi K-moyenne, où «K» représente le nombre de clusters que l’utilisateur choisit de créer. (Notez qu’il existe différentes techniques pour choisir la valeur de K, comme la méthode du coude.). Chaque cluster a un centre (centroïde) qui correspond à la valeur moyenne de tous les points de ce cluster. Le clustering sous Tableau Desktop vous permet de choisir le nombre de cluster à créer et vous propose aussi le K optimal en se basant sur l’algorithme de Lloyds avec les distances euclidiennes au carré pour calculer le clustering de k-moyenne pour chaque k
Cette vidéo propose une démarche pratique d’identification des outliers en utilisant Tableau Desktop.
A noter que le clustering est disponible dans Tableau Desktop uniquement. Sur Tableau Server ou Tableau Online cette fonctionnalité n’est pas disponible..