Composant Fortis dans l’architecture de OpenAI, Chatgpt / IA

par Aurélien Bardon

Qu’est-ce que Fortis ?

Fortis est un composant interne utilisé pour renforcer la sûreté et la fiabilité des modèles d’IA comme ChatGPT.

Il ne génère pas de texte, mais il intervient dans la gestion des réponses sensibles ou complexes, en agissant comme une couche d’intervention contextuelle spécialisée.

fortis de openai et chatgpt

Rôle principal de Fortis chez openAI / Chatgpt

  1. Superviser les générations dans des domaines jugés critiques (juridique, médical, sécurité, etc.).
  2. Fournir une escalade ou une reformulation lorsque la génération nécessite un traitement prudent ou sécurisé.
  3. Renforcer la conformité aux règles internes ou aux obligations réglementaires locales.

Quand Fortis est-il activé ?

Fortis peut être déclenché automatiquement en fonction du type de requête détectée par d’autres classifieurs (comme Sonic).

  1. Quand une question touche un sujet juridiquement sensible (ex : conseils légaux).
  2. Quand une réponse risque de déclencher un comportement dangereux ou médicalement inapproprié.
  3. Quand une réponse pourrait violer une politique interne de l’éditeur du modèle.

Fonctionnement interne de Fortis

  1. Fortis reçoit un signal contextuel basé sur une détection préalable (souvent par classifieur).
  2. Il applique une logique d’aiguillage :
  • Soit il autorise la génération avec des balises d’encadrement (ex : “consultez un professionnel…”).
  • Soit il bloque ou redirige vers une réponse neutre/sûre.
  • Soit il déclenche une logique plus sophistiquée (redirection vers une base de connaissance validée).
  1. Il journalise l’intervention pour traçabilité dans le pipeline de décision.

Relation entre Fortis et les autres composants

  1. Avec Sonic : Sonic détecte, Fortis agit. Sonic alerte d’un contenu sensible, Fortis peut structurer ou censurer la réponse.
  2. Avec le LLM : Fortis n’est pas un modèle génératif mais un contrôleur autour du LLM. Il injecte des règles ou des réponses types.
  3. Avec les logs internes : Fortis participe à la journalisation des réponses sensibles pour assurer l’auditabilité.

Objectif final de Fortis

  1. Garantir la sécurité des utilisateurs et la responsabilité de l’IA.
  2. Éviter des réponses risquées dans des contextes réglementés.
  3. Permettre un traitement différencié selon les juridictions ou les profils utilisateurs (en entreprise par exemple).

Récapitulatif des modules OpenAI

Nom du module Fonction principale
Sonic Filtrage rapide de contenu
Fortis Surveillance réglementaire et thématique
Labrador Suivi de cohérence contextuelle
Moderation Classifieur général à haut niveau
Sentinel Défense contre attaques prompt injection
Critic Analyse logique et éthique des réponses
Observer Journalisation des décisions internes
Compass Alignement éthique et culturel
Router Dispatch vers sous-modules / agents
Retriever Récupération de documents / connaissances RAG / Connaissance

 

Aurélien Bardon
Dites STOP aux régressions SEO avec Oseox

Je vous recommande de lire également

  • Pearl Harbor Russe : L’attaque des drones en vidéo
  • 10 modules internes de l’IA OpenAI / ChatGPT
  • Module Retriever de chez chatGPT, OpenAI / IA
  • Composant Router / Orchestrator chez OpenAI, Chatgpt et IA
  • Module Compass de OpenAI, ChatGPT / IA