ENJEUX
Avignon Ceramic est un fabricant de noyaux céramiques servant à créer des évidements au cœur des pièces de fonderie.
Avignon Ceramic a observé, sur une famille spécifique de noyaux, une forte variabilité du taux de rebuts (cloques, criques) au sein de leur production, et souhaite comprendre les causes de ce phénomène. Une première étude statistique est donc réalisée afin de déterminer les paramètres influençant le taux de rebuts à partir d’une base de données contenant des paramètres de fabrication, d’injection, de cuisson et des conditions en atelier pour différents produits.
Par ailleurs, Avignon Ceramic a constaté que le temps de traversée sur différentes étapes de production est plus long que la durée théorique prévue initialement. Une deuxième étude statistique est réalisée afin de déterminer les étapes responsables des écarts entre durées théorique et effective.
Pour cela, on a à disposition une base de données avec les dates de début et de fin de chaque étape du processus de production des différents produits.
MÉTHODOLOGIE ET PRINCIPALES RÉALISATIONS
- Mise en forme et nettoyage des bases de données fournies par le client : suppression de lignes avec des valeurs aberrantes, imputation de données manquantes, … ;
- Feature engineering : transformation des données brutes en caractéristiques susceptibles de mieux représenter la problématique métier (par exemple : à partir des dates de mélange et injection, créer une variable âge de la pâte) ;
- Analyse descriptive : histogrammes des différentes variables, études des corrélations entre les variables, analyse univariée et bivariée, parallel coordinates plot permettant d’établir des liens entre les valeurs prises par les différentes variables, … ;
- Construction d’un modèle de Machine Learning permettant de prédire le taux de rebut et extractions de l’importance prise par les variables dans la prédiction du modèle ;
- Mise à disposition de notebooks interactifs synthétisant les résultats de l’étude et permettant au client d’explorer ses données par lui-même.
Figure 2 : Parallel coordinates plot permettant d’établir des liens entre les valeurs prises par différentes variables
Figure 3 : Graphique de l’importance prise par les différentes variables dans le modèle de prédiction du taux de rebuts