C'est assez étonnant mais comprendre les différents types de coût permet aussi d'avoir une vision stratégique pour déployer intelligemment et progressivement l'IA au sein de l'entreprise.
A titre personnel, je considère que pour que la stratégie soit efficiente, il faut fonctionner par propagation de cercles concentriques comme quand vous jetez un caillou dans l'eau et que cela crée des vagues qui se propagent.
Identifier le domaine le plus impactant pour ensuite créer le mouvement qui touchera progressivement chaque pan de l'entreprise est une bonne façon d'arriver avec succès à mettre en place une organisation pérenne qui exploite la puissance de ces nouveaux outils.
Pour autant, cela a un coût et ces coûts associés à la GenAI font partie intégrante de la mise en place stratégique et tactique de l'IA.
On entend souvent la fausse idée qui consiste à dire aux directions des entreprises de ne pas se préoccuper des coûts à mettre en oeuvre car l'IA est forcément rentable mais chez Reboot, nous sommes contre cette idée.
Nous avons eu des entreprises avoir des initiatives sporadiques et sans démarche qui font un ou deux projets mais qui resteront localisés dans un coin de l'entreprise sans impacter l'organisation dans son ensemble.
Le jeu en vaut la chandelle mais c'est un investissement et pas uniquement financier. Comme tout, cela demande de bien comprendre les tenants et les aboutissants.
C'est pourquoi, en identifiant les différents coûts, nous comprenons également la mécanique qu'il y a derrière l'IA et donc : ses possibilités mais aussi ses contraintes. Voilà ce que je vous propose d'aborder coût par coût et coup par coup.
Le coût d'inférence est le coût qui résulte de l'utilisation d'un modèle de type LLM pour générer une réponse.
Forcément, selon le grand modèle utilisé, les coûts varient.
Grosso modo, pour générer la réalisation d'un texte à partir d'un LLM, il y a ce que vous entrez et ce que le LLM va vous répondre. Ces entrées et sorties sont gérées par des tokens (jetons) et forcément, à chaque transaction, les tokens coûtent.
Alors sur des petites transactions, on parle de centimes mais quand on pense en volume, forcément, le coût est bien plus important.
Plus la puissance de calcul est sollicitée, plus le coût est important.
Générer une image implique plus de puissance de calcul que de générer un texte.
L'autre option pour maitriser les coûts serait d'héberger un LLM open source que vous pouvez vous-même entrainer afin d'optimiser le processus d'inférence.
L'avantage notable, c'est que vous avez une maîtrise totale des coûts, l'inconvénient, c'est le coût de la mise en place et, éventuellement, la mise à jour du modèle et/ou l'entrainement du LLM pour améliorer sa performance.
Bien entendu, ici, nous n'abordons que les aspects financiers mais il existe d'autres points dont il faut tenir compte comme les aspects de protection ou de cybersécurité.
Le réglage fin (fine-tuning) est le processus d'adaptation d'un modèle d'IA générative pré-entrainé à une tâche ou à un domaine particulier.
Il faut donc fournir les données, entrainer le modèle, prendre en compte la complexité du modèle LLM choisi et itérer l'entrainement.
Ces itérations d'entrainement, on appelle cela « epochs ».
Selon OpenAI, le coût de réglage fin spécifique équivaut à :
Coût de base pour 1000 tokens x Nombre de tokens dans le fichier d'entrée x Nombre d'epochs entrainées
Une fois votre modèle entrainé, il faut pouvoir le solliciter en le conditionnant selon vos besoins. Ce qui permet de le faire, c'est le processus de structuration d'un texte pouvant être interprété et compris par un modèle d'IA générative qu'on appelle l'ingénierie prompt.
C'est tout un art et même un métier que de conditionner l'IA pour lui permettre d'être de qualité et performante.
Le problème, c'est de trouver l'équilibre entre le réglage fin et l'ingénierie prompt.
Si la tâche exige un degré élevé d'exactitude et de précision, le réglage fin sera plus important, plus coûteux et plus long que l'ingénierie prompt.
Rien de nouveau, les données doivent être hébergées, les IA aussi et cela engendre nécessairement des frais.
Lorsque la stratégie IA se déploie, probablement qu'il faudra également faire cohabiter les anciens systèmes avec les nouveaux tout en permettant d'avoir accès à toutes les données.
Généralement, les entreprises penchent pour une solution cloud "lift and shift" où les anciens systèmes sont conservés aussi longtemps que nécessaire tout en exploitant les nouveaux où il y a de l'IA.
Ce n'est pas une solution durable mais bien de transition.
Aucune surprise, pour pouvoir articuler toute cette mécanique, il est indispensable d'avoir des talents compétents comme nous avons chez Reboot et évidemment, les compétences de ce type sont encore assez rares.
Au-delà des compétences opérationnelles, il y a aussi une nécessité de former constamment et pas uniquement sur les enjeux techniques : les profils sont souvent pluridisciplinaires afin d'adresser les sujets sous un angle essentiellement non-technique.
L'impact de l'IA est fort, la culture d'entreprise doit donc l'être, il ne faut pas sous-estimer ce point car clairement, une entreprise qui utilise l'IA va nécessairement évoluer et repenser son activité pour le mieux.
Eh oui, il faut maintenir et continuer à enrichir les IA via le MLOps (opération d'apprentissage) tout en s'intégrant au système existant afin d'assurer le déploiement et la maintenance des modèles de manière fiable et efficace.
Cela passe par des automatisations et des processus qui entrent dans le flux de travail : récupération des données, caractéristiques d'ingénierie, entraînement, tests, stockage et déploiement des modèles
Il faut une infrastructure digne de ce nom et donc la doter progressivement des moyens nécessaires pour faire face aux sujets en cours et à l'évolution du SI impactée par l'IA.
Il faut sécuriser à mort les données et éviter les fuites de données et de propriété intellectuelle, de contrer les risques associés à la diffusion de contenus malveillants et aux attaques ciblées.
Il faut continuellement se former et sensibiliser aux risques liées à la technologie et aux risques dus au shadow IT (les logiciels non validés par le service IT).
Il faut aussi avoir la capacité de gérer les effets de bord comme les biais :
Notre recommandation est d'instaurer un contrôle des coûts afin d'avoir un avis éclairé sur les prises de décision en tenant compte des différents aspects que nous venons d'aborder mais aussi et surtout de votre culture d'entreprise.
Savoir si vous préférez utiliser des solutions du marché ou si vous préférez avoir la main sur vos IA en les concevant vous-même n'a absolument pas le même impact. C'est pourquoi, un arbitre sur les finances peut être pertinent dans certaines situations.
Faire une IA Factory ou laisser la main ? Faire une équipe IA transverse qui juge au cas par cas ou gouvernance absolue et centralisation des IA ? Toutes ces questions sont pertinentes dès lors qu'on entre dans ce monde.
Krieg unseri beschte Artikel jede Monet.
Père Castor, raconte-moi N8N N8N (prononcez « n-huit-n » ou « nodemation » si vous voulez faire classe). C'est un outil qui permet de connecter vos...
ArtikelL'intelligence artificielle s'est invitée dans le quotidien des marketeurs à une vitesse record. En quelques mois, des outils comme ChatGPT,...
ArtikelLe risque ? Créer une \"illusion de compétence\" tout en laissant les véritables lacunes stratégiques se creuser. La solution est pourtant simple et...
ArtikelÀ lire avec la voix de Stallone : « plus de puces, plus de data, plus de milliards, le maître du monde ». Je viens de regarder le dernier numéro du...
ArtikelSoyons clairs : si vous dirigez une organisation de taille significative aujourd'hui, la complexité des données—leur volume, leur vitesse de...
ArtikelOn parle ici d'une transformation fondamentale, un changement de paradigme comparable à l'arrivée d'Internet ou de l'électricité dans l'industrie....