Le transfer learning est une technique du deep learning qui cherche à réutiliser un réseau de neurones entraîné à une tâche pour une autre.
L'une des applications du transfer learning est le fine tuning, qui consiste à prendre un modèle existant performant sur une tâche générale et l'entraîner sur un nouveau dataset plus spécifique.
L'application la plus évidente est le fine tuning pour la reconnaissance d'objets. À partir d'un modèle capable d'identifier un grand nombre de classes, l'affiner pour qu'il reconnaisse une classe spécifique.
Le modèle d'origine est performant car il a été entraîné :
On économise donc ces trois besoins, et le fine tuning se fera sur un plus petit dataset avec un moins grand besoin de puissance et de temps.
L'espoir est d'obtenir un plus haut taux de précision que le modèle général sur la nouvelle tâche qui est plus spécifique.
Le modèle général doit être capable de résoudre une tâche similaire à la votre.
Bien souvent, cela consiste à changer la forme de la dernière couche du modèle, pour qu'il ait le bon nombre d'output. Cette couche modifiée est initialisée avec des poids aléatoires. Le reste des couches du réseau sont gelées pour que leurs poids ne soient pas modifiés durant l'entraînement.
Entraîner le modèle sur le dataset spécifique. Souvent avec un petit learning rate, qui offre un apprentissage plus fin que pendant l'entraînement du modèle d'origine.
En suivant ce tutoriel de PyTorch, j'ai utilisé le fine tuning pour reconnaître des piétons et des véhicules dans un hangar.
J'ai généré le dataset dans Blender, ce processus est détaillé dans cet article : Dataset synthétique grâce au rendu 3D dans Blender - AI Squad by Reboot Conseil (rebootia.com)
J'ai choisis le modèle pré entraîné MaskRCNN avec ResNet50 de PyTorch, un modèle à 50 couches performant sur un grand nombre de classes.
Ici, il faut identifier 3 classes : les piétons, les transpalettes et le background. La dernière couche du modèle est donc remplacée par une couche à 3 sorties.
L'objectif a été atteint. À partir d'un modèle général, j'ai maintenant un modèle qui répond à mes besoins spécifiques. Le tout avec un faible temps d'entraînement et un petit dataset.
Get our best articles every month.
Automatisation du tri de 10 000+ CV/mois avec scoring IA. Réduction de 70% du temps de pré-sélection.
ProjectGénération automatique de rapports hebdomadaires. De 4h de travail manuel à 15 minutes.
TrainingFondamentaux ML, scikit-learn, premiers modèles supervisés et non supervisés.
ServiceDe l'audit au déploiement. Diagnostic, formation, POC, audit 360°, projet complet.
ServiceFormateurs opérationnels. IA, data science, développement web. Certifié Qualiopi.
ArticlePère Castor, raconte-moi N8N N8N (prononcez « n-huit-n » ou « nodemation » si vous voulez faire classe). C'est un outil qui permet de connecter vos...