Untitled document

Écrit par Stanislas

Dernière mise à jour Il y a 6 jours

Aperçu

Chaque interaction avec un agent IA dans Swiftask consomme des crédits. Le montant que vous dépensez dépend non seulement du modèle LLM que vous choisissez, mais aussi de la façon dont vous concevez vos agents, rédigez vos prompts, structurez vos conversations et gérez vos bases de connaissances. En suivant ces bonnes pratiques, vous pouvez obtenir de meilleurs résultats tout en dépensant moins de crédits.

Ce guide couvre les stratégies pratiques pour vous aider à optimiser l'utilisation des crédits dans tous les aspects de Swiftask—de la configuration de l'agent à la gestion des conversations jusqu'au contrôle des coûts.

Prérequis

Pour appliquer ces bonnes pratiques, vous devez :

Avoir un espace de travail Swiftask et une connaissance de base de la création d'agents
Comprendre que différentes tâches nécessitent différentes approches pour optimiser les crédits
Être disposé à tester et affiner la configuration de votre agent en fonction des résultats

Tip 1 : Stratégie de conception des agents

La base de l'optimisation des crédits est la création du bon agent pour le bon travail.

Commencez par un objectif clair.

Un agent à usage général qui essaie de tout faire prendra des décisions inefficaces, posera des questions de suivi inutiles et consommera plus de crédits qu'un agent spécialisé. Par exemple, l'agent d'accueil Swiftask par défaut est conçu pour accueillir les utilisateurs et les diriger vers les bonnes ressources—non pour effectuer des tâches spécialisées comme l'analyse détaillée de documents ou le support technique.

Créez des agents personnalisés pour des cas d'usage spécifiques.

Au lieu de vous fier à un seul agent général, créez des agents ciblés pour chaque tâche majeure : un pour le support client, un pour le traitement des documents, un pour la recherche, et ainsi de suite. Un agent spécialisé sait exactement ce qu'il doit faire, fait moins de détours et coûte moins cher à exploiter.

Évitez le surpoids des agents.

Juste parce que vous pouvez ajouter une compétence ne signifie pas que vous devez le faire. Chaque compétence que vous ajoutez augmente la surcharge de prise de décision de l'agent et la probabilité qu'il utilise le mauvais outil pour une question donnée. Incluez uniquement les compétences dont votre agent a réellement besoin.

Tip 2 : Sélection et correspondance des modèles LLM

Toutes les tâches ne nécessitent pas le modèle LLM le plus puissant (et le plus coûteux). Swiftask vous donne accès à des modèles à différents niveaux de coût et avec des forces différentes.

Comprenez la différence de coût.

Chaque modèle LLM a un coût de crédit différent par mot. Dans la Bibliothèque IA, vous pouvez voir le coût estimé pour chaque modèle. Une tâche simple—comme répondre à une question factuelle ou reformater du texte—peut être traitée tout aussi bien par un modèle optimisé pour les coûts que par un modèle premium.

Faites correspondre le modèle à la tâche.

Posez-vous la question : S'agit-il d'une question simple ou nécessite-t-elle un raisonnement sur plusieurs sources ? Nécessite-t-elle une recherche sur le web, une compréhension de documents ou une génération de texte créatif ? Les différents modèles excellent dans des domaines différents :

Utilisez des modèles optimisés pour les coûts pour les tâches simples et factuelles
Utilisez des modèles à usage général pour le raisonnement multi-étapes
Utilisez des modèles spécialisés lorsque vous savez que la tâche nécessite leur force spécifique (par exemple, recherche web, génération de code, analyse de documents)

Rappelez-vous que simple pour les humains n'est pas simple pour l'IA.

Une question qui semble simple pour vous pourrait nécessiter que l'agent recherche des informations, fasse des références croisées de documents ou effectue plusieurs appels API. La charge de travail réelle de l'agent est souvent plus complexe qu'elle ne le paraît. En cas de doute, testez d'abord avec un modèle optimisé pour les coûts et mettez à niveau uniquement si nécessaire.

Tip 3 : Ingénierie des prompts pour l'efficacité

Votre prompt est l'ensemble d'instructions pour votre agent. Un prompt bien écrit économise des crédits en réduisant la confusion, en prévenant les hallucinations et en évitant les questions de suivi inutiles.

Soyez concis.

Chaque mot de votre prompt est traité par le LLM. Les prompts plus longs coûtent plus cher et fonctionnent souvent moins bien. Supprimez le remplissage, la répétition et le contexte inutile. Gardez vos instructions claires et directes.

Incluez les informations statiques directement dans le prompt.

S'il y a des informations qui ne changeront pas—les politiques de l'entreprise, les noms de produits, les procédures standard, les données de référence—mettez-les dans le prompt au lieu de demander à l'agent de les rechercher. Cela évite les boucles coûteuses où l'agent recherche des informations dont il a déjà besoin.

Fournissez des conseils d'utilisation pour les compétences.

Si votre agent possède des compétences (comme la recherche web ou la récupération de documents), incluez de brefs exemples ou conseils dans le prompt montrant quand et comment utiliser chacune. Cela empêche l'agent de deviner, ce qui conduit souvent à des appels d'outils inutiles et à du gaspillage de crédits.

Évitez les hallucinations.

Les prompts vagues ou trop complexes encouragent le LLM à inventer des informations. Soyez spécifique sur ce que vous voulez, quelles sources il doit utiliser et ce qu'il doit faire s'il ne connaît pas la réponse. Un prompt précis est moins cher et plus fiable.

Tip 4 : Gestion des conversations

Plus une conversation dure longtemps, plus chaque nouveau message devient cher. C'est parce que le LLM doit traiter l'historique complet de la conversation à chaque fois.

Commencez une nouvelle conversation lorsque les conversations deviennent lourdes.

Swiftask vous alertera lorsqu'une conversation aura atteint une taille importante (environ 200 000 crédits de contexte). À ce moment-là, commencez une nouvelle conversation. Les économies de coûts peuvent être substantielles parce que la nouvelle conversation a un historique propre.

Commencez une nouvelle conversation quand le sujet n’a aucun rapport

Si vos nouvelles questions ou votre nouveau sujet n’ont rien à voir avec la conversation précédente, commencez une nouvelle conversation. Cela garantit que vous ne payez pas pour un traitement de contexte non pertinent.

Comprenez pourquoi les conversations lourdes coûtent plus cher.

Lorsque vous posez une question dans une conversation qui contient déjà de nombreux messages précédents et de gros documents, le LLM doit traiter tout cet historique pour comprendre le contexte. Une question simple dans une conversation légère pourrait coûter beaucoup moins que la même question dans une conversation lourde.

Gérez les pièces jointes avec soin.

Si vous joignez un document à une seule question, ce document est traité uniquement pour cet échange. Si vous ajoutez un document à la base de connaissances de votre agent, il sera traité avec chaque question pertinente à l'avenir. Utilisez les pièces jointes pour les demandes ponctuelles et les bases de connaissances pour les tâches récurrentes.

Tip 5 : Configuration des compétences

Les compétences sont puissantes, mais chacune ajoute de la complexité à la prise de décision de votre agent.

Incluez uniquement les compétences pertinentes.

Examinez l'objectif de votre agent. A-t-il vraiment besoin de la recherche web ? A-t-il besoin de l'exécution de code ? A-t-il besoin de la récupération de documents ? Incluez uniquement les compétences qui soutiennent directement sa mission.

Minimisez le nombre de compétences.

Plus un agent a de compétences, plus il passe de temps à décider laquelle utiliser, et plus il est probable qu'il fasse le mauvais choix. Cela augmente à la fois la latence et la consommation de crédits. Un agent ciblé avec trois compétences bien choisies surpassera un agent gonflé avec dix.

Fournissez des conseils clairs sur les compétences.

Dans votre prompt, expliquez quelle compétence utiliser pour quel type de demande. Par exemple : « Utilisez la recherche web uniquement pour les événements actuels ou les informations en temps réel. Utilisez la récupération de documents pour les politiques de l'entreprise. Utilisez l'exécution de code uniquement lorsque l'utilisateur demande explicitement une sortie de code. » Cela réduit les suppositions et les appels d'outils gaspillés.

Tip 6 : Stratégie de base de connaissances

La façon dont vous organisez votre base de connaissances affecte à la fois les performances et le coût.

Utilisez les pièces jointes pour les demandes ponctuelles.

Si un utilisateur pose une question sur un document spécifique qu'il vient de télécharger, utilisez une pièce jointe. Le document est traité uniquement pour cette question.

Utilisez les bases de connaissances pour les tâches récurrentes.

Si vous avez de la documentation que votre agent consultera à plusieurs reprises, ajoutez-la à la base de connaissances. Le coût est amorti sur de nombreuses questions.

Évitez la redondance.

N'ajoutez pas le même document à la base de connaissances plusieurs fois. N'ajoutez pas de documents qui seront rarement utilisés. Gardez votre base de connaissances ciblée et épurée.

Choisissez le bon format.

Les documents structurés (comme les fichiers CSV ou les PDF bien organisés) sont plus faciles à traiter pour le LLM que le texte non structuré. Cela peut réduire le nombre de jetons consommés par question.

Tip 7 : Meilleure pratique pour l'interpréteur de code Python

Si votre agent utilise un interpréteur de code Python, la planification est essentielle.

Planifiez avant d'exécuter.

Incluez une instruction dans votre prompt demandant à l'agent d'expliquer son plan avant d'exécuter un code. Par exemple : « Avant d'exécuter un code, décrivez les étapes que vous allez suivre et expliquez votre approche. Ensuite, exécutez le code. » Cela empêche les boucles où l'agent génère du code, il échoue, l'agent réessaie, et ainsi de suite.

Évitez le tâtonnement.

Chaque exécution de code consomme des crédits. Encouragez l'agent à réfléchir à la logique, à vérifier les cas limites et à bien faire la première fois plutôt que d'itérer aveuglément.

Limitez la complexité du code.

Si une tâche nécessite une génération de code très complexe, envisagez de la diviser en sous-tâches plus petites que chaque agent peut gérer indépendamment.

Tip 8 : Traitement des fichiers et sous-agents

Les fichiers volumineux et les tâches complexes à plusieurs étapes bénéficient d'une approche diviser pour régner.

Divisez les fichiers volumineux.

Si vous avez un CSV avec 10 000 lignes ou un PDF avec des centaines de pages, ne le traitez pas en une seule fois. La plupart des LLM ont des limites de jetons et peuvent échouer ou produire des résultats incomplets. Au lieu de cela, divisez le fichier en petits chunks et traitez chacun séparément.

Utilisez des sous-agents pour les tâches complexes.

Si une tâche implique plusieurs étapes—comme extraire des données d'un fichier, les transformer, puis générer un rapport—envisagez de créer des sous-agents pour chaque étape. L'agent principal orchestre les sous-agents, et chaque sous-agent reste concentré sur sa partie du travail. Cela peut réduire les erreurs et le gaspillage de crédits.

Regroupez les demandes similaires.

Si vous avez de nombreuses demandes similaires (comme traiter 100 demandes de clients), regroupez-les ensemble et traitez-les par groupes. C'est plus efficace que de les traiter une par une.

Tip 9 : Bibliothèque de prompts

Swiftask inclut une Bibliothèque de prompts où vous pouvez enregistrer et réutiliser des prompts bien rédigés.

Créez une bibliothèque de prompts éprouvés.

Lorsque vous rédigez un prompt qui fonctionne bien pour une tâche, enregistrez-le. Au fil du temps, vous constituerez une bibliothèque de prompts testés et optimisés que vous et votre équipe pourrez réutiliser.

Réutilisez au lieu de recréer.

Lorsque vous avez besoin d'un prompt similaire pour un nouvel agent, commencez par un prompt existant de la bibliothèque plutôt que d'en écrire un à partir de zéro. Cela garantit la cohérence et économise du temps.

Versionnez et affinez.

Au fur et à mesure que vous apprenez ce qui fonctionne, mettez à jour vos prompts dans la bibliothèque. Supprimez les versions obsolètes ou inefficaces.

Tip 10 : Contrôle des coûts et surveillance (pour les agents partagés publiquement)

Le contrôle des coûts est disponible uniquement pour les agents partagés publiquement. Utilisez la fonction Contrôle des coûts pour définir des limites de messages et des budgets quotidiens pour vos agents publics.

Accédez au Contrôle des coûts.

Pour les agents partagés publiquement, dans la configuration de votre agent, recherchez le bouton Contrôle des coûts dans le panneau gauche. C'est là que vous gérez tous les paramètres de limite d'utilisation et de budget.

Emplacement du bouton Contrôle des coûts

Définissez des limites de messages par utilisateur.

Vous pouvez limiter le nombre de messages qu'un utilisateur peut envoyer dans une période donnée. Par exemple, vous pourriez autoriser 5 messages tous les 240 secondes. Cela protège contre les abus et l'utilisation incontrôlée.

Définissez des limites de budget quotidien.

Configurez une limite de budget quotidienne pour votre agent. Une fois la limite atteinte, l'agent arrête de répondre jusqu'au jour suivant. Cela est utile pour contrôler les coûts dans les environnements de production.

Personnalisez les messages de limite.

Lorsqu'un utilisateur atteint la limite de messages, vous pouvez afficher un message personnalisé (ou utiliser le message par défaut). Cela tient les utilisateurs informés sans confusion.

Interface Contrôle des coûts avec les limites de messages et les paramètres de budget quotidien

Surveillez l'utilisation dans le tableau de bord.

Votre tableau de bord d'espace de travail affiche l'utilisation des crédits par jour et par agent. Consultez-le régulièrement pour identifier les agents ou les cas d'usage qui consomment plus que prévu. Utilisez ces données pour affiner la configuration de votre agent.

Configurez des alertes par courrier électronique.

Swiftask peut vous envoyer une notification par courrier électronique lorsque vous atteignez certains seuils de crédits (comme 1 million de crédits consommés). Utilisez ces alertes pour rester conscient de votre consommation.

Cas d'usage pratiques

Cas d'usage 1 : Chatbot de support client

Un agent de support client traite les questions courantes sur les produits et les politiques. Pour optimiser les crédits :

Créez un agent unique et ciblé pour le support (pas un agent général)
Incluez les politiques de l'entreprise, les FAQ sur les produits et les étapes de dépannage directement dans le prompt
Incluez uniquement les compétences dont il a besoin : récupération de documents (pour la base de connaissances) et éventuellement création de tickets (s'il est intégré)
Utilisez un modèle LLM optimisé pour les coûts, car la plupart des questions sont factuelles et répétitives
Définissez des limites de messages pour prévenir les abus : par exemple, 10 messages par utilisateur par jour
Surveillez le tableau de bord pour voir quels types de questions consomment le plus de crédits ; affinez le prompt pour gérer ces cas plus efficacement

Résultat : Un agent ciblé et efficace qui coûte 30–50 % moins cher qu'un agent à usage général, tout en offrant des réponses plus rapides.

Cas d'usage 2 : Agent d'analyse de documents

Un agent qui analyse les contrats, les rapports ou d'autres documents. Pour optimiser les crédits :

Créez un agent spécialisé pour l'analyse de documents
Incluez les instructions dans le prompt sur ce qu'il faut extraire, résumer et ignorer
Utilisez un modèle optimisé pour la compréhension de documents (comme Mistral) plutôt qu'un modèle général
Pour les fichiers volumineux (>50 pages), divisez-les en sections et traitez chaque section séparément
Utilisez des sous-agents si la tâche implique plusieurs étapes (par exemple, extraire des données, puis générer un résumé, puis identifier les risques)
Joignez les documents en tant que pièces jointes ponctuelles plutôt que de les ajouter à la base de connaissances (sauf s'ils sont référencés à plusieurs reprises)

Résultat : Analyse plus rapide, moins d'hallucinations et des coûts de crédit plus bas que le traitement de documents entiers à la fois.

Étapes suivantes

Maintenant que vous comprenez les principes de l'optimisation des crédits, voici comment les appliquer :

Auditez vos agents actuels. Examinez les agents que vous avez déjà créés. Lesquels ont trop de compétences ? Lesquels utilisent des modèles LLM coûteux pour des tâches simples ? Notez les domaines à améliorer.
Commencez par un agent. Choisissez un agent qui consomme le plus de crédits ou qui gère la tâche la plus importante. Appliquez les stratégies de ce guide : affinez le prompt, réduisez les compétences, testez un modèle LLM moins cher et définissez des contrôles de coûts.
Mesurez l'impact. Avant et après apporter des modifications, notez la consommation de crédits dans le tableau de bord. Suivez combien vous économisez et les compromis (le cas échéant) que vous remarquez en matière de performances.
Construisez votre bibliothèque de prompts. Commencez à enregistrer les prompts qui fonctionnent bien. Partagez-les avec votre équipe pour que tout le monde bénéficie de prompts optimisés.
Examinez trimestriellement. Définissez un rappel pour examiner les performances de votre agent et les coûts des crédits tous les trois mois. Ajustez-vous en fonction des modèles d'utilisation réels.
Partagez les bonnes pratiques avec votre équipe. Si vous travaillez en équipe, partagez ce que vous avez appris. La cohérence entre les agents conduit à une meilleure efficacité globale des crédits.