10 modules internes de l’IA OpenAI / ChatGPT

par Aurélien Bardon

Voici la présentation selon ChatGPT de 10 modules internes d’OpenAI utilisés pour traiter les saisies des utilisateurs.

Modules internes intéressants à étudier

Nom du module Fonction principale
Sonic Filtrage rapide de contenu
Fortis Surveillance réglementaire et thématique
Labrador Suivi de cohérence contextuelle
Moderation Classifieur général à haut niveau
Sentinel Défense contre attaques prompt injection
Critic Analyse logique et éthique des réponses
Observer Journalisation des décisions internes
Compass Alignement éthique et culturel
Router Dispatch vers sous-modules / agents
Retriever Récupération de documents / connaissances

Chronologie d’utilisation

fonctionnement de chatgpt

Présentation de chaque module par nom de code

Sonic

sonic chatgpt openai

  • Classifieur de sécurité rapide chargé de détecter les contenus sensibles
  • Intervient en entrée ou en sortie pour autoriser ou bloquer les requêtes
  • Utilisé en temps réel pour assurer la conformité immédiate des échanges

Présentation détaillée du classifieur Sonic

Fortis

fortis de openai et chatgpt

  • Module de gouvernance qui applique des règles réglementaires et métier
  • Surveille les réponses dans des domaines critiques comme la santé ou le droit
  • Peut reformuler, bloquer ou encadrer une réponse à risque

Présentation détaillée du module Fortis

Labrador

labrador de openai et chatgpt

  • Module de suivi de cohérence contextuelle dans les conversations longues
  • Détecte les contradictions ou les oublis dans les échanges successifs
  • Aide le modèle à rester fidèle à l’historique et à la mémoire active

Présentation détaillée du module Labrador

Moderation (anciennement « Watchtower »)

moderation de openai et chatgpt

  • Rôle : Classifieur généraliste très rigoureux qui évalue les contenus selon les politiques d’OpenAI
  • Spécialité : Capable de catégoriser finement les types de danger (violence, harcèlement, etc.)
  • Différence avec Sonic : Sonic est rapide et léger ; Moderation est plus complet et granulaire

Présentation détaillée du classifieur Modération (ex Watchtower)

Sentinel

sentinel de chatgpt / openai

  • Rôle : Défense active contre les attaques de type prompt injection
  • Spécialité : Détecte les patterns suspects dans les prompts
  • Action : Peut bloquer l’entrée ou injecter des garde-fous dans la génération

Présentation détaillée du module Sentinel

Critic

critic de openai et chatgpt

  • Rôle : Relecteur automatique des réponses générées par le modèle
  • Spécialité : Vérifie le fond et signale ou corrige les erreurs logiques
  • Utilisation : Présent dans les systèmes multi-passes comme Reflexion ou ReAct

Présentation détaillée du module Critic

Observer

observer de chatgpt / openai

  • Rôle : Journalisation et analyse comportementale
  • Spécialité : Suit les décisions internes pour créer une trace exploitable
  • Utilité : Sert à l’auditabilité et à l’explicabilité du système

Présentation détaillée du module Observer

Compass

compass de openai et chatgpt

  • Rôle : Alignement moral et normatif selon les juridictions ou cas d’usage
  • Spécialité : Modifie les réponses selon les contextes culturels, éthiques ou réglementaires
  • Exemple : Réponses sur des sujets comme l’euthanasie adaptées selon les pays

Présentation détaillée du module Compass

Router / Orchestrator

router de chatgpt et openai

  • Rôle : Diriger les requêtes vers les sous-modèles ou outils appropriés
  • Spécialité : Utilisé dans des architectures hybrides ou multi-agents
  • Exemple : Déléguer une tâche mathématique à un solver spécialisé

Présentation détaillé du composant Router ex Orchestrator

Retriever

  • Rôle : Récupération d’informations externes (documents, bases, web)
  • Spécialité : Enrichit le contexte avec des données factuelles
  • Cas typique : Modules de « browsing » ou lecture de fichiers personnalisés

Présentation détaillée du module Retriever

Memory Core

  • Rôle : Gérer la mémoire utilisateur à long terme (si activée)
  • Spécialité : Stocke les préférences, le nom, les projets passés
  • Interaction : Labrador peut y accéder pour garantir la cohérence des échanges

Tableau récapitulatif

Récapitulatif des modules
Nom du module Fonction principale Catégorie
Sonic Filtrage rapide de contenu Sécurité (input/output)
Fortis Surveillance réglementaire et thématique Gouvernance
Labrador Suivi de cohérence contextuelle Mémoire / Contexte
Moderation Classifieur général à haut niveau Sécurité avancée
Sentinel Défense contre attaques prompt injection Sécurité technique
Critic Analyse logique et éthique des réponses Post-traitement
Observer Journalisation des décisions internes Audit interne
Compass Alignement éthique et culturel Régulation
Router Dispatch vers sous-modules / agents Orchestration
Retriever Récupération de documents / connaissances RAG / Connaissance
Memory Core Gestion de la mémoire utilisateur Persistance

 

L’intégralité de ces informations provient de ChatGPT himself
suite à la publication de Olivier de Segonzac contenant plusieurs noms de code  ^^

Le graphique a aussi été généré par Chatgpt, je ne sais absolument pas s’il est valide ou non : – ) Il s’agirait de « composants typiques d’une architecture IA encadrée et sécurisée ».

A noter que sur Github vous pouvez souvent retrouver des projets ayant ces noms ce qui montre peut-être que ces informations ne sont pas vraiment confidentielles ou alors qu’il s’agit d’info valables pour n’importe quel LLM avec interface utilisateur : )

Aurélien Bardon
Dites STOP aux régressions SEO avec Oseox

Je vous recommande de lire également

  • Module Retriever de chez chatGPT, OpenAI / IA
  • Composant Router / Orchestrator chez OpenAI, Chatgpt et IA
  • Module Compass de OpenAI, ChatGPT / IA
  • Module Observer chez ChatGPT, OpenAI / IA