Standards d'exécution IA
Politique des attentes organisationnelles
Le principe opératoire derrière ces standards est la règle de traduction universelle : remplacer « l'humain produit l'artefact » par « l'humain définit la spécification → le système produit l'artefact. »
1. Principe fondamental
L'IA est traitée comme un travailleur autonome, pas comme un agent conversationnel.
Tout travail assigné à l'IA doit être exécutable sans supervision en temps réel.
2. Couches de travail obligatoires
Chaque workflow IA doit définir les quatre couches.
Couche 1 – Rédaction de prompts (compétence de base)
Les employés doivent :
- écrire des instructions claires
- spécifier le format
- inclure des exemples quand c'est utile
- résoudre l'ambiguïté en amont
Barre minimale : le résultat IA ne devrait nécessiter ≤20% de correction.
Couche 2 – Ingénierie de contexte
Chaque équipe doit maintenir un fichier de contexte structuré contenant :
- les objectifs
- les contraintes
- la terminologie
- les standards de qualité
- les documents pertinents
- les règles d'accès aux outils
Exigence : les tâches IA doivent charger ce contexte avant l'exécution.
Couche 3 – Ingénierie d'intention
Chaque workflow doit définir :
- la hiérarchie des objectifs
- les règles d'arbitrage
- les conditions d'escalade
- ce que l'IA peut décider vs ce qu'elle doit escalader
Aucun agent ne peut s'exécuter sans intention définie.
Couche 4 – Ingénierie de spécification (standard le plus élevé)
Toutes les tâches non triviales doivent avoir une spécification écrite.
Composantes requises de la spécification :
- énoncé du problème
- portée
- entrées
- contraintes
- critères d'acceptation
- conditions d'échec
- tests de réussite
- définition de complétion
Règle : si le succès ne peut pas être vérifié objectivement, la tâche n'est pas prête pour la spécification.
2b. Primitives de spécification (compétences à développer)
L'ingénierie de spécification repose sur cinq primitives. Chacune est une compétence distincte à pratiquer.
Primitive 1 – Énoncés de problème autonomes
Formulez le problème avec suffisamment de contexte pour que la tâche soit résoluble sans que l'agent ait besoin de chercher plus d'information. Exposez les hypothèses cachées. Articulez les contraintes que vous laissez normalement implicites.
Exercice d'entraînement : prenez une demande que vous feriez normalement de manière conversationnelle et réécrivez-la comme si le destinataire n'avait jamais vu votre projet, ne connaissait pas votre terminologie, et n'avait accès à rien au-delà de ce que vous incluez.
Primitive 2 – Critères d'acceptation
Définissez à quoi ressemble « terminé » de sorte qu'un observateur indépendant puisse vérifier le résultat sans poser de questions. Si vous ne pouvez pas écrire trois phrases qui vérifient la complétion, vous ne comprenez pas la tâche assez bien pour la déléguer.
Primitive 3 – Architecture des contraintes
Définissez quatre catégories pour chaque tâche :
- Doit – exigences non négociables
- Ne doit pas – actions ou résultats interdits
- Préfère – orientation quand plusieurs approches valides existent
- Escalade – conditions où l'agent doit s'arrêter et demander
Primitive 4 – Décomposition
Découpez les tâches en composantes qui peuvent être exécutées indépendamment, testées indépendamment, et intégrées de manière prévisible. Granularité cible : sous-tâches de ≤2 heures avec des frontières entrée/sortie claires, chacune vérifiable de manière autonome.
Primitive 5 – Conception d'évaluation
Pour chaque tâche IA récurrente, construisez 3 à 5 cas de test avec des résultats connus et validés. Exécutez-les après les mises à jour de modèles pour détecter les régressions. Les résultats sont jugés par les métriques, pas par l'apparence.
3. Règles de qualité des spécifications
Une spécification valide doit être :
Autonome – Aucune connaissance externe requise.
Testable – Un évaluateur indépendant peut vérifier la qualité du résultat.
Contrainte – Les règles Doit / Ne doit pas / Préfère / Escalade sont définies.
Décomposable – La tâche peut être découpée en sous-tâches vérifiables indépendamment.
4. Liste de vérification de préparation à la délégation
Avant d'assigner du travail à l'IA, les employés doivent confirmer :
- Je comprends la tâche complètement
- Je peux définir le succès objectivement
- Je peux lister les cas d'échec
- Je peux décrire les contraintes
- Je peux vérifier les résultats sans interprétation
Si une réponse = non → ne pas déléguer encore.
5. Standard d'évaluation
Chaque workflow IA récurrent doit inclure des tests d'évaluation.
Minimum :
- 3 cas de test avec des résultats connus
- des critères de notation mesurables
- des vérifications de régression après les mises à jour de modèles
Les résultats sont jugés par les métriques, pas par l'apparence.
6. Modèle de responsabilité en cas d'échec
L'échec est attribué par couche :
| Type d'échec | Cause racine |
|---|---|
| Mauvais résultat | Problème de prompt |
| Résultat non pertinent | Problème de contexte |
| Mauvaise direction | Problème d'intention |
| Résultat incomplet | Problème de spécification |
Les équipes doivent corriger la couche responsable, pas relancer les prompts.
7. Rôles organisationnels
Chaque système IA en production doit avoir :
- un Propriétaire de la spécification
- un Propriétaire du contexte
- un Propriétaire de l'évaluation
Une même personne peut occuper plusieurs rôles au départ.
8. Standard de documentation
Tous les documents internes doivent être rédigés comme si un agent allait les exécuter.
Les documents doivent :
- énoncer les hypothèses
- définir les termes
- spécifier les résultats attendus
- inclure les contraintes
- éviter le savoir implicite
9. Pratiques interdites
Les employés ne peuvent pas :
- déléguer des tâches vagues à l'IA
- compter sur des boucles de correction itératives
- assumer un contexte partagé
- accepter des résultats sans critères de vérification
- exécuter des agents sans spécifications
10. Attentes de performance
Les employés utilisant l'IA sont évalués sur :
- la clarté des instructions
- la complétude des spécifications
- la fiabilité des résultats
- la réduction du travail à refaire
- la qualité de la conception d'évaluation
Pas sur l'ingéniosité des prompts.
Règle de synthèse
La pensée claire précède l'exécution IA.
Si vous ne pouvez pas le spécifier, vous ne pouvez pas l'automatiser.
← Retour à l'accueil · Le cadre de référence · Le Lab IA · Glossaire