10 modules internes de l’IA OpenAI / ChatGPT

Voici la présentation selon ChatGPT de 10 modules internes d’OpenAI utilisés pour traiter les saisies des utilisateurs.

Modules internes intéressants à étudier

Nom du module	Fonction principale
Sonic	Filtrage rapide de contenu
Fortis	Surveillance réglementaire et thématique
Labrador	Suivi de cohérence contextuelle
Moderation	Classifieur général à haut niveau
Sentinel	Défense contre attaques prompt injection
Critic	Analyse logique et éthique des réponses
Observer	Journalisation des décisions internes
Compass	Alignement éthique et culturel
Router	Dispatch vers sous-modules / agents
Retriever	Récupération de documents / connaissances

Chronologie d’utilisation

Présentation de chaque module par nom de code

Sonic

sonic chatgpt openai

Classifieur de sécurité rapide chargé de détecter les contenus sensibles
Intervient en entrée ou en sortie pour autoriser ou bloquer les requêtes
Utilisé en temps réel pour assurer la conformité immédiate des échanges

Présentation détaillée du classifieur Sonic

Fortis

fortis de openai et chatgpt

Module de gouvernance qui applique des règles réglementaires et métier
Surveille les réponses dans des domaines critiques comme la santé ou le droit
Peut reformuler, bloquer ou encadrer une réponse à risque

Présentation détaillée du module Fortis

Labrador

labrador de openai et chatgpt

Module de suivi de cohérence contextuelle dans les conversations longues
Détecte les contradictions ou les oublis dans les échanges successifs
Aide le modèle à rester fidèle à l’historique et à la mémoire active

Présentation détaillée du module Labrador

Moderation (anciennement « Watchtower »)

moderation de openai et chatgpt

Rôle : Classifieur généraliste très rigoureux qui évalue les contenus selon les politiques d’OpenAI
Spécialité : Capable de catégoriser finement les types de danger (violence, harcèlement, etc.)
Différence avec Sonic : Sonic est rapide et léger ; Moderation est plus complet et granulaire

Présentation détaillée du classifieur Modération (ex Watchtower)

Sentinel

sentinel de chatgpt / openai

Rôle : Défense active contre les attaques de type prompt injection
Spécialité : Détecte les patterns suspects dans les prompts
Action : Peut bloquer l’entrée ou injecter des garde-fous dans la génération

Présentation détaillée du module Sentinel

Critic

critic de openai et chatgpt

Rôle : Relecteur automatique des réponses générées par le modèle
Spécialité : Vérifie le fond et signale ou corrige les erreurs logiques
Utilisation : Présent dans les systèmes multi-passes comme Reflexion ou ReAct

Présentation détaillée du module Critic

Observer

observer de chatgpt / openai

Rôle : Journalisation et analyse comportementale
Spécialité : Suit les décisions internes pour créer une trace exploitable
Utilité : Sert à l’auditabilité et à l’explicabilité du système

Présentation détaillée du module Observer

Compass

Rôle : Alignement moral et normatif selon les juridictions ou cas d’usage
Spécialité : Modifie les réponses selon les contextes culturels, éthiques ou réglementaires
Exemple : Réponses sur des sujets comme l’euthanasie adaptées selon les pays

Présentation détaillée du module Compass

Router / Orchestrator

router de chatgpt et openai

Rôle : Diriger les requêtes vers les sous-modèles ou outils appropriés
Spécialité : Utilisé dans des architectures hybrides ou multi-agents
Exemple : Déléguer une tâche mathématique à un solver spécialisé

Présentation détaillé du composant Router ex Orchestrator

Retriever

Rôle : Récupération d’informations externes (documents, bases, web)
Spécialité : Enrichit le contexte avec des données factuelles
Cas typique : Modules de « browsing » ou lecture de fichiers personnalisés

Présentation détaillée du module Retriever

Memory Core

Rôle : Gérer la mémoire utilisateur à long terme (si activée)
Spécialité : Stocke les préférences, le nom, les projets passés
Interaction : Labrador peut y accéder pour garantir la cohérence des échanges

Tableau récapitulatif

Récapitulatif des modules
Nom du module	Fonction principale	Catégorie
Sonic	Filtrage rapide de contenu	Sécurité (input/output)
Fortis	Surveillance réglementaire et thématique	Gouvernance
Labrador	Suivi de cohérence contextuelle	Mémoire / Contexte
Moderation	Classifieur général à haut niveau	Sécurité avancée
Sentinel	Défense contre attaques prompt injection	Sécurité technique
Critic	Analyse logique et éthique des réponses	Post-traitement
Observer	Journalisation des décisions internes	Audit interne
Compass	Alignement éthique et culturel	Régulation
Router	Dispatch vers sous-modules / agents	Orchestration
Retriever	Récupération de documents / connaissances	RAG / Connaissance
Memory Core	Gestion de la mémoire utilisateur	Persistance

L’intégralité de ces informations provient de ChatGPT himself
suite à la publication de Olivier de Segonzac contenant plusieurs noms de code ^^

Le graphique a aussi été généré par Chatgpt, je ne sais absolument pas s’il est valide ou non : – ) Il s’agirait de « composants typiques d’une architecture IA encadrée et sécurisée ».

A noter que sur Github vous pouvez souvent retrouver des projets ayant ces noms ce qui montre peut-être que ces informations ne sont pas vraiment confidentielles ou alors qu’il s’agit d’info valables pour n’importe quel LLM avec interface utilisateur : )

Aurélien Bardon
Dites STOP aux régressions SEO avec Oseox

Je vous recommande de lire également

Outil Webperf d’Oseox : Notre tableau de KPI lié à la vitesse d’un site

LLM : Qu’est ce que le Fan out ?

Auditer la difficulté du top 3 Google sur n’importe quel mot clé avec Oseox

Comparaison temps de travail et age de départ à la retraite

Aurélien Bardon