Rakuten — classification multimodale
Vision + NLP → Late Fusion → 84k classes
Lead Data Scientist (Mines Paris-PSL) : classer 84 000+ produits à partir du texte ET de l'image. Hybrid Vision (Transformers/CNN) + NLP fusionnés en Late Fusion, réglés pour tenir sur GPU.



















































































































