Alors que l'IA prédictive extrait des insights à partir de données existantes, l'IA générative va plus loin et crée quelque chose de nouveau. Il peut écrire du texte, générer des images, produire du code ou même concevoir des interfaces utilisateur complètes. Voici quelques exemples courants de cas d'utilisation de l'IA générative :
- Création de contenu : les assistants de rédaction IA peuvent créer des brouillons et peaufiner du texte existant.
- Rédaction de résumés : des outils comme Aperçus IA de Google permettent de condenser de longs documents, réunions ou pages Web en résumés concis et exploitables.
- Génération de code : les outils pour les développeurs utilisent l'IA générative pour écrire et refactoriser du code, ce qui augmente la productivité des développeurs.
- Création d'images et de composants : à l'aide de modèles de vision, les utilisateurs peuvent produire des composants visuels, tels que des bannières et des miniatures.
La boucle de l'IA générative
La plupart des modèles d'IA générative sont entraînés à l'aide de réseaux de neurones et d'architectures Transformer. Les modèles apprennent à suggérer l'élément suivant d'une séquence (mot, pixel ou note, par exemple) en fonction de ceux qui le précèdent.
Mathématiquement, ce n'est pas très éloigné de l'IA prédictive. Les deux apprennent des schémas à partir des données. La différence réside dans l'échelle.
Dans l'IA prédictive, les options de sortie sont limitées à quelques libellés, comme "désabonnement" ou "pas de désabonnement". Dans l'IA générative, l'espace de sortie peut inclure des centaines de milliers d'options. Entraîné sur des milliards d'exemples, le mécanisme de prédiction évolue pour devenir un moteur puissant capable de générer de nouveaux résultats inédits.
Le développement d'un système d'IA générative suit une approche itérative.
Nous allons vous montrer comment cela fonctionne avec notre exemple d'application, BlogBuddy, un assistant de système de gestion de contenu qui aide les utilisateurs à générer des descriptions accrocheuses et des titres d'articles adaptés au SEO.
Définir votre cas d'utilisation
Votre énoncé de problème doit inclure :
- Modalité d'entrée et de sortie : Il peut s'agir de texte (prose ou code), d'images ou d'audio.
- Méthode d'importation : Le contenu provient-il d'un champ d'importation, d'un texte libre ou d'autres entrées structurées ?
- Audience Qui effectue cette tâche ? Ont-ils des connaissances générales ou ont-ils besoin de connaissances spécialisées ?
Les fonctionnalités de BlogBuddy sont axées sur la génération de texte. L'entrée est semi-structurée : les utilisateurs fournissent un thème ou un bref brouillon, et le modèle renvoie des variantes. L'audience est marketing, avec des connaissances spécialisées en rédaction.
Il est important de définir une norme de qualité pour vos résultats. Dans notre cas, nous voulons générer un texte court, facile à lire et riche en mots clés, qui correspond au ton de la publication.
Des métriques de réussite claires vous aident à orienter le reste du processus. Pour en savoir plus sur la collecte de métriques de réussite, consultez Evaluation-Driven Development.
Sélectionner le modèle de base
Il existe une large gamme de modèles pré-entraînés sur de grands ensembles de données universels. Leur comportement peut être adapté à des besoins spécifiques. Les modèles d'IA générative sont généralement beaucoup plus grands et complexes que les modèles prédictifs. Il est donc préférable de s'appuyer sur un modèle existant plutôt que de créer et d'entraîner le vôtre.
Votre choix détermine les fonctionnalités, le coût, la personnalisation et les limites de confidentialité de votre produit. Le choix du modèle est fortement interdépendant de la plate-forme sur laquelle vous déployez votre système d'IA.
Plus loin dans ce cours, vous apprendrez à choisir votre plate-forme.
Ingénierie des requêtes et du contexte
Une fois que vous avez choisi votre modèle, vous devez lui fournir les bonnes instructions à l'aide d'une requête. Pour BlogBuddy, nous pouvons demander au modèle :
Generate three short, engaging title suggestions for this article
Vous pouvez ajouter plusieurs types d'informations à une requête. Exemple :
- Invite système qui définit le comportement général.
- Contexte spécifique à l'entrée pour la tâche en cours.
- Instructions utilisateur dans les applications conversationnelles, telles que les chatbots ou les agents.
Inférence et post-traitement
Une fois votre requête assemblée, elle est envoyée au modèle pour l'inférence. Vous pouvez modifier les paramètres du modèle, y compris la température (pour la créativité) et le nombre maximal de jetons (pour la longueur et la richesse du vocabulaire), afin d'ajuster la façon dont le modèle répond. Après la génération, le résultat est souvent traité avec des règles et des mesures de protection supplémentaires.
Par exemple, vous pouvez reformuler un texte genré, modérer le ton ou filtrer les termes interdits.
Pour favoriser la transparence et la calibration de la confiance, vous pouvez ajouter un modèle secondaire plus petit pour classer ou résumer le résultat. Par exemple : "Introduction générée à partir de 12 articles associés. Niveau de confiance : élevé."
Évaluation et boucle de rétroaction
L'espace de sortie de l'IA générative étant pratiquement infini, la plupart des requêtes n'ont pas une seule bonne réponse. Les benchmarks standardisés, tels que MMLU ou SQuAD, peuvent mesurer la capacité générale d'un modèle, mais ils capturent rarement les besoins spécifiques des utilisateurs humains. Dans un contexte produit, vous devez définir votre propre combinaison de métriques qualitatives et quantitatives :
- Précision : la réponse est-elle factuellement correcte ?
- Utilité : la réponse répond-elle aux attentes définies par la requête ou l'intention de l'utilisateur ?
- Lisibilité et ton : la sortie est-elle claire et conforme aux normes de la marque ?
- Effort humain : quelle quantité de curation ou de retouche manuelle est requise ?
- Compréhension du domaine : la réponse reflète-t-elle des connaissances spécifiques au domaine ?
Pour évaluer ces métriques, vous pouvez combiner l'examen humain et la notation automatique. Par exemple, vous pouvez demander aux utilisateurs d'évaluer les résultats concrets, utiliser un deuxième modèle pour l'évaluation automatique (également appelée LLM-as-a-judge) et effectuer des examens internes périodiques pour détecter les biais ou les hallucinations.
Les données d'utilisation réelle sont l'un de vos plus grands atouts lorsque vous créez des applications avec l'IA générative. Si possible, enregistrez ces interactions pour ajuster les requêtes et les contextes, tester différents modèles ou modifier les paramètres au fil du temps. Chaque interaction, correction ou évaluation d'un utilisateur devient un commentaire qui peut vous aider à déterminer les prochaines étapes d'optimisation :
- Les saisies utilisateur inattendues peuvent vous aider à déterminer si vous résolvez le bon problème.
- Les demandes récurrentes spécifiques à un domaine peuvent vous aider à choisir le modèle. Vous pouvez passer d'un grand LLM général à un petit modèle affiné.
- Des hallucinations fréquentes peuvent indiquer un manque de contexte spécifique dans vos requêtes.
- Des modifications importantes peuvent indiquer un manque de contexte partagé. Le modèle n'a pas connaissance des informations que l'utilisateur considère comme acquises.
Au fil du temps, ces boucles de rétroaction transforment votre fonctionnalité d'IA générative, qui passe d'un appel de modèle statique à un système dynamique qui s'adapte en permanence aux besoins et aux préférences de vos utilisateurs.
Écueils courants et stratégies d'atténuation
Étant donné que l'IA générative fonctionne dans un espace ouvert d'entrées et de sorties, sa surface de risque est beaucoup plus large que celle des systèmes prédictifs. En plus de produire des résultats incorrects, elle peut générer du contenu toxique, biaisé ou trompeur, voire manipuler les utilisateurs involontairement. Ces échecs peuvent entamer la confiance des utilisateurs et exposer votre entreprise à des conséquences financières ou juridiques.
C'est pourquoi l'IA générative nécessite une approche proactive et continue de la gestion des risques. Voici quelques-uns des risques les plus courants :
- Hallucination : le modèle invente des faits ou déforme des détails. Pour atténuer ce problème, utilisez le RAG pour l'ancrage factuel.
- Confiance excessive : les utilisateurs supposent que les résultats sont toujours corrects. Pour atténuer ce risque, encouragez un flux de vérification et de modification plutôt qu'une publication automatique. Dans Gouvernance de l'IA : développer de manière responsable, vous apprendrez à aider les utilisateurs à calibrer leur confiance.
- Incohérence : les résultats varient considérablement d'une exécution à l'autre. Pour atténuer ce problème, utilisez des modèles d'invite, le contrôle de la température ou des exemples few-shot pour stabiliser le ton et la structure.
- Contenu toxique ou nuisible : le modèle produit du texte biaisé, choquant ou manipulateur. Pour atténuer ce problème, appliquez des filtres de modération et des classificateurs de toxicité avant l'affichage. Testez en continu les résultats avec de vraies requêtes et maintenez une boucle de rétroaction pour signaler les cas extrêmes et réentraîner le modèle.
- Latence et coût : les grands modèles peuvent être lents et coûteux. Surtout si vous visez une adoption à grande échelle, il peut être difficile d'estimer à l'avance le coût et l'utilisation des ressources des modèles. Pour y remédier, utilisez la mise en cache, le traitement par lot et des modèles plus petits pour les tâches courtes.
Vos points à retenir
En bref, l'IA générative transforme des idées brutes en contenus concrets tels que des textes, des images, du code ou des conversations. Il excelle là où la créativité et l'adaptabilité comptent plus que la précision.
En tant que développeur Web, votre réussite dépend de la conception des bonnes requêtes, de l'ancrage de votre modèle dans les bonnes données et de l'alignement continu du système sur les préférences des utilisateurs.
Ressources
En savoir plus sur le choix de modèles plus petits et durables Pour un apprentissage plus avancé :
- Suivez le cours intensif sur le machine learning et l'IA générative.
- Consultez la boîte à outils d'IA générative responsable.
- Pour en savoir plus sur les différents types de modèles de base dans l'IA générative, consultez le chapitre 5 de The Art of AI Product Development.
Vérifier que vous avez bien compris
Quelle est la principale différence entre les résultats de l'IA générative et ceux de l'IA prédictive ?
Quel est le rôle de la température du modèle ?
Pourquoi les benchmarks standardisés sont-ils souvent insuffisants pour évaluer l'IA générative ?
Parmi les propositions suivantes, laquelle est une mesure d'atténuation courante pour les hallucinations ?
Que devez-vous faire des commentaires des utilisateurs, selon la boucle d'IA générative ?