10 modules internes de l’IA OpenAI / ChatGPT
par Aurélien Bardon
Voici la présentation selon ChatGPT de 10 modules internes d’OpenAI utilisés pour traiter les saisies des utilisateurs.
Modules internes intéressants à étudier
Nom du module | Fonction principale |
---|---|
Sonic | Filtrage rapide de contenu |
Fortis | Surveillance réglementaire et thématique |
Labrador | Suivi de cohérence contextuelle |
Moderation | Classifieur général à haut niveau |
Sentinel | Défense contre attaques prompt injection |
Critic | Analyse logique et éthique des réponses |
Observer | Journalisation des décisions internes |
Compass | Alignement éthique et culturel |
Router | Dispatch vers sous-modules / agents |
Retriever | Récupération de documents / connaissances |
Chronologie d’utilisation
Présentation de chaque module par nom de code
Sonic
- Classifieur de sécurité rapide chargé de détecter les contenus sensibles
- Intervient en entrée ou en sortie pour autoriser ou bloquer les requêtes
- Utilisé en temps réel pour assurer la conformité immédiate des échanges
Présentation détaillée du classifieur Sonic
Fortis
- Module de gouvernance qui applique des règles réglementaires et métier
- Surveille les réponses dans des domaines critiques comme la santé ou le droit
- Peut reformuler, bloquer ou encadrer une réponse à risque
Présentation détaillée du module Fortis
Labrador
- Module de suivi de cohérence contextuelle dans les conversations longues
- Détecte les contradictions ou les oublis dans les échanges successifs
- Aide le modèle à rester fidèle à l’historique et à la mémoire active
Présentation détaillée du module Labrador
Moderation (anciennement « Watchtower »)
- Rôle : Classifieur généraliste très rigoureux qui évalue les contenus selon les politiques d’OpenAI
- Spécialité : Capable de catégoriser finement les types de danger (violence, harcèlement, etc.)
- Différence avec Sonic : Sonic est rapide et léger ; Moderation est plus complet et granulaire
Présentation détaillée du classifieur Modération (ex Watchtower)
Sentinel
- Rôle : Défense active contre les attaques de type prompt injection
- Spécialité : Détecte les patterns suspects dans les prompts
- Action : Peut bloquer l’entrée ou injecter des garde-fous dans la génération
Présentation détaillée du module Sentinel
Critic
- Rôle : Relecteur automatique des réponses générées par le modèle
- Spécialité : Vérifie le fond et signale ou corrige les erreurs logiques
- Utilisation : Présent dans les systèmes multi-passes comme Reflexion ou ReAct
Présentation détaillée du module Critic
Observer
- Rôle : Journalisation et analyse comportementale
- Spécialité : Suit les décisions internes pour créer une trace exploitable
- Utilité : Sert à l’auditabilité et à l’explicabilité du système
Présentation détaillée du module Observer
Compass
- Rôle : Alignement moral et normatif selon les juridictions ou cas d’usage
- Spécialité : Modifie les réponses selon les contextes culturels, éthiques ou réglementaires
- Exemple : Réponses sur des sujets comme l’euthanasie adaptées selon les pays
Présentation détaillée du module Compass
Router / Orchestrator
- Rôle : Diriger les requêtes vers les sous-modèles ou outils appropriés
- Spécialité : Utilisé dans des architectures hybrides ou multi-agents
- Exemple : Déléguer une tâche mathématique à un solver spécialisé
Présentation détaillé du composant Router ex Orchestrator
Retriever
- Rôle : Récupération d’informations externes (documents, bases, web)
- Spécialité : Enrichit le contexte avec des données factuelles
- Cas typique : Modules de « browsing » ou lecture de fichiers personnalisés
Présentation détaillée du module Retriever
Memory Core
- Rôle : Gérer la mémoire utilisateur à long terme (si activée)
- Spécialité : Stocke les préférences, le nom, les projets passés
- Interaction : Labrador peut y accéder pour garantir la cohérence des échanges
Tableau récapitulatif
Nom du module | Fonction principale | Catégorie |
---|---|---|
Sonic | Filtrage rapide de contenu | Sécurité (input/output) |
Fortis | Surveillance réglementaire et thématique | Gouvernance |
Labrador | Suivi de cohérence contextuelle | Mémoire / Contexte |
Moderation | Classifieur général à haut niveau | Sécurité avancée |
Sentinel | Défense contre attaques prompt injection | Sécurité technique |
Critic | Analyse logique et éthique des réponses | Post-traitement |
Observer | Journalisation des décisions internes | Audit interne |
Compass | Alignement éthique et culturel | Régulation |
Router | Dispatch vers sous-modules / agents | Orchestration |
Retriever | Récupération de documents / connaissances | RAG / Connaissance |
Memory Core | Gestion de la mémoire utilisateur | Persistance |
L’intégralité de ces informations provient de ChatGPT himself
suite à la publication de Olivier de Segonzac contenant plusieurs noms de code ^^
Le graphique a aussi été généré par Chatgpt, je ne sais absolument pas s’il est valide ou non : – ) Il s’agirait de « composants typiques d’une architecture IA encadrée et sécurisée ».
A noter que sur Github vous pouvez souvent retrouver des projets ayant ces noms ce qui montre peut-être que ces informations ne sont pas vraiment confidentielles ou alors qu’il s’agit d’info valables pour n’importe quel LLM avec interface utilisateur : )
Aurélien Bardon
Dites STOP aux régressions SEO avec Oseox
Je vous recommande de lire également