Je viens d’être assigné à un projet crucial au sein de l’entreprise “Place de marché”, qui souhaite lancer une marketplace e-commerce. Actuellement, les vendeurs de cette plateforme anglophone attribuent manuellement les catégories aux articles qu’ils mettent en ligne, mais cette méthode s’avère peu fiable et inadaptée à une montée en charge du volume d’articles.
Ma mission consiste à étudier la faisabilité d’un moteur de classification automatique des articles en différentes catégories, en utilisant à la fois les images des produits et leurs descriptions textuelles en anglais. Linda, Lead Data Scientist, m’a fourni les données nécessaires ainsi qu’un exemple de Notebook pour m’aider dans cette tâche.
Je vais d’abord analyser les descriptions textuelles et les images des produits à travers plusieurs étapes : un prétraitement des données, l’extraction de features, et une réduction en 2 dimensions pour projeter les produits sur un graphique 2D. Cette visualisation me permettra d’évaluer la faisabilité de regrouper automatiquement des produits de même catégorie.
Pour l’extraction des features image, j’utiliserai des algorithmes de type SIFT, ORB, ou SURF, ainsi que des modèles de type CNN avec Transfer Learning. Pour l’analyse des textes, je mettrai en œuvre plusieurs approches, notamment le bag-of-words, le Tf-idf, ainsi que des embeddings de type Word2Vec, BERT, et Universal Sentence Encoder (USE).
Mon objectif est de démontrer la faisabilité d’une classification automatique qui facilitera la mise en ligne de nouveaux articles pour les vendeurs et améliorera l’expérience utilisateur pour les acheteurs. Je vais également calculer la similarité entre les catégories réelles et celles issues de la segmentation en clusters pour valider mon analyse visuelle.
Je suis impatient de relever ce défi et de contribuer à la mise en place de cette fonctionnalité essentielle pour le succès de la marketplace de “Place de marché”.
![1](https://stephanieroulland.fr/wp-content/uploads/1-10.png)
![2](https://stephanieroulland.fr/wp-content/uploads/2-10.png)
![3](https://stephanieroulland.fr/wp-content/uploads/3-11.png)
![4](https://stephanieroulland.fr/wp-content/uploads/4-11.png)
![5](https://stephanieroulland.fr/wp-content/uploads/5-11.png)
![6](https://stephanieroulland.fr/wp-content/uploads/6-10.png)
![7](https://stephanieroulland.fr/wp-content/uploads/7-10.png)
![8](https://stephanieroulland.fr/wp-content/uploads/8-10.png)
![9](https://stephanieroulland.fr/wp-content/uploads/9-10.png)
![10](https://stephanieroulland.fr/wp-content/uploads/10-10.png)
![11](https://stephanieroulland.fr/wp-content/uploads/11-10.png)
![12](https://stephanieroulland.fr/wp-content/uploads/12-9.png)
![13](https://stephanieroulland.fr/wp-content/uploads/13-9.png)
![14](https://stephanieroulland.fr/wp-content/uploads/14-9.png)
![15](https://stephanieroulland.fr/wp-content/uploads/15-9.png)
![16](https://stephanieroulland.fr/wp-content/uploads/16-9.png)
![17](https://stephanieroulland.fr/wp-content/uploads/17-9.png)
![18](https://stephanieroulland.fr/wp-content/uploads/18-8.png)
![19](https://stephanieroulland.fr/wp-content/uploads/19-8.png)
![20](https://stephanieroulland.fr/wp-content/uploads/20-7.png)
![21](https://stephanieroulland.fr/wp-content/uploads/21-7.png)
![22](https://stephanieroulland.fr/wp-content/uploads/22-5.png)
![23](https://stephanieroulland.fr/wp-content/uploads/23-5.png)
![24](https://stephanieroulland.fr/wp-content/uploads/24-5.png)