Assistant IA RAG — un ChatGPT interne sur vos données
Un assistant IA formé sur VOS documents métier (procédures, contrats, FAQ, comptes-rendus). Sources citées, zéro hallucination, hébergement EU. À partir de 5 900 € HT.
Vos équipes utilisent ChatGPT en cachette — et ça vous fait peur
Parce que ChatGPT public ne sait rien de votre entreprise. Et vos données y partent en clair.
Vos collaborateurs ont découvert ChatGPT comme outil de productivité. Ils l'utilisent pour rédiger des emails, résumer des documents, chercher de l'information — sauf que ChatGPT public ne sait rien de votre métier. Pas votre catalogue produits, pas vos procédures internes, pas votre jurisprudence, pas vos clients. Résultat : ils inventent des réponses (hallucinations) ou copient-collent des documents internes dans le prompt — ce qui pose un vrai problème RGPD et de confidentialité.
Pendant ce temps, vos équipes passent 5 à 10 heures par semaine à chercher des informations dans la base documentaire (Drive, Notion, GED interne) ou à ré-expliquer les mêmes procédures à chaque nouveau collaborateur. Un assistant IA RAG formé sur VOS documents répondrait en 5 secondes avec sources citées. Mais vous n'avez pas le bandwidth technique pour le construire vous-même.
Symptômes qu'un assistant IA RAG résout
- Vos équipes utilisent ChatGPT public en cachette avec vos données internes (problème RGPD)
- Trouver une info dans la base documentaire prend 30 minutes (au lieu de 5 secondes)
- Les nouveaux collaborateurs mettent 3 mois à maîtriser les procédures internes
- Les mêmes questions internes reviennent en boucle sur Slack/Teams
- Votre expert métier est l'unique détenteur de la connaissance critique (bus factor 1)
- Vous avez testé un « ChatGPT pour entreprise » SaaS et vos données sont stockées chez OpenAI (pas RGPD)
Un RAG construit chez vous, pas chez OpenAI
Vos documents indexés sur votre infra, sources citées, zéro hallucination, RGPD natif.
Architecture RAG : vos données restent à vous
On démarre par indexer vos documents métier dans une base vectorielle (PostgreSQL pgvector) sur votre infra (ou hébergeur EU à votre nom). Format accepté : PDF, Word, Excel, Markdown, exports Notion/Confluence/GitBook, bases SQL. Ensuite, votre assistant IA est branché sur Slack/Teams/intranet/site web. Quand un collaborateur pose une question, l'IA cherche dans VOS documents, trouve les passages pertinents, et génère une réponse en citant les sources.
- Indexation pgvector chez vous — vos documents ne quittent jamais votre infra
- Sources citées — chaque réponse pointe vers le ou les documents originaux (pas d'hallucination possible)
- Multi-canaux — Slack, Teams, intranet, site web interne, ou API pour vos apps métier
- Sync automatique — ajout/modification d'un document → index à jour (horaire ou immédiat)
- Permissions par document — si Bob ne doit pas voir les contrats RH, l'IA respecte la règle
- Modèles open-source self-hosted disponibles pour les données ultra-sensibles (santé, juridique)
Notre référence : on a livré I-Notaire, un RAG sécurisé pour cabinet juridique — données ultra-confidentielles, hébergement EU, contrats DPA, architecture isolée. Si on tient le cabinet juridique, on tient n'importe quel secteur régulé (santé, finance, pharmacie). Même stack RAG, même niveau de sécurité.
La méthode 3S
Simple. Sur-mesure. Souverain. Notre façon de livrer un RAG qui ne fuite pas vos données.
Simple — audit gratuit + cartographie documentaire
Audit gratuit 30 min pour cadrer vos sources documentaires (Drive, Notion, GED, SharePoint, etc.) et le cas d'usage prioritaire. Si on continue, on passe 1 jour à explorer vos contenus pour estimer le volume réel, les permissions, les contraintes RGPD. On vous chiffre clairement, sans engagement.
Sur-mesure — assistant en production en 2 à 3 semaines
Sprint 1 : indexation de vos documents en pgvector (chez vous ou EU à votre nom). Sprint 2 : interface chat + intégration sur le canal prioritaire (Slack, Teams, intranet ou site interne). Sprint 3 (optionnel) : ajout d'un 2e canal ou de permissions fines. Vos équipes utilisent l'assistant dès la fin du sprint 2.
Souverain — vos données ne sortent jamais de votre infra
Hébergement EU exclusif (OVH, Scaleway, Hetzner ou votre infra), conversations chiffrées, audit trail complet. Pour les données ultra-sensibles, modèles open-source (Mistral, Llama) self-hosted : rien ne sort. Pour les requêtes standards, OpenAI/Anthropic en mode sans rétention. Architecture isolée dispo pour les secteurs régulés.
I-Notaire — RAG sécurisé pour cabinet juridique
Le cas extrême en sécurité. Si ça passe là, ça passe partout.
I-Notaire est un assistant IA RAG déployé pour un cabinet juridique français. L'enjeu : permettre aux notaires et collaborateurs d'interroger en langage naturel la jurisprudence, les contrats clients, les actes archivés — sans aucune fuite vers des serveurs américains. Confidentialité absolue, pas de marge d'erreur acceptable.
On a livré un RAG en architecture isolée : indexation pgvector sur infra française à leur nom, modèle open-source self-hosted pour les requêtes contenant des informations clients, OpenAI/Anthropic en mode sans rétention pour les requêtes purement méthodologiques. Permissions par document (un notaire ne voit que ses dossiers), audit trail complet, chiffrement de bout en bout. Zéro fuite, zéro hallucination.
fuite de données
vers serveurs tiers
réponse moyenne
(vs 30 min de recherche)
hébergement France
RGPD natif
Aujourd'hui le cabinet utilise I-Notaire au quotidien. Les notaires gagnent 30 minutes à 1 heure par dossier sur la recherche jurisprudentielle. Les nouveaux collaborateurs sont opérationnels en 2 semaines au lieu de 3 mois. Le bus factor sur l'expert juridique senior est résolu (la connaissance est dans la base, plus dans une seule tête).
Questions fréquentes sur l'assistant IA RAG
Les 6 questions qu'on nous pose en premier à chaque audit RAG.
Qu'est-ce qu'un RAG et en quoi c'est différent de ChatGPT ?
Le RAG (Retrieval Augmented Generation) est l'architecture qui permet à un modèle IA de répondre sur vos données métier sans les avoir apprises pendant l'entraînement. Concrètement : votre assistant IA cherche dans VOS documents (contrats, fiches produits, procédures internes, jurisprudence, comptes-rendus), trouve les passages pertinents, et génère une réponse en citant les sources. ChatGPT public répond depuis ce qu'il a appris en 2024 — ne sait rien de votre entreprise. Un RAG sait tout, et ne dit que ce qui est dans VOTRE base.
Mes données métier restent-elles confidentielles ?
Oui, c'est même la raison principale du RAG vs ChatGPT public. Vos documents ne sortent jamais de votre infra : indexation et stockage en base PostgreSQL pgvector chez vous (ou hébergeur EU à votre nom). Au moment de la requête, seul le contexte minimal nécessaire transite vers OpenAI/Anthropic (mode sans rétention), ou vers un modèle open-source self-hosted pour les données ultra-sensibles. Conversations chiffrées, audit trail complet, contrats DPA signés. Pour les secteurs régulés (juridique, santé, finance) on travaille en architecture isolée.
Combien de temps pour déployer un assistant IA RAG ?
Le pack démarrage se livre en 2 à 3 semaines : sprint 1 ingestion de vos documents (catalogue, procédures, fiches techniques), sprint 2 mise en production avec interface chat + intégration sur 1 canal (Slack OU Teams OU site interne), sprint 3 (optionnel) ajout d'un 2e canal. Pour une base documentaire massive (100 000+ documents) ou des contraintes RGPD lourdes (santé, juridique), comptez 6 à 8 semaines.
Combien coûte un assistant IA RAG pour PME ?
Le pack démarrage est à partir de 5 900 € HT pour un assistant IA RAG déployé sur 1 base documentaire (jusqu'à ~5 000 documents) + 1 canal (Slack, Teams ou site interne), livré en 2 à 3 semaines. Le pack boost à 12 900 € HT couvre 2 bases ou 2 canaux + intégrations métier. Pour les déploiements secteurs régulés (architecture isolée, hébergement français labélisé HDS, etc.), devis sur mesure à partir de 25 000 €.
Comment former l'IA sur mes documents internes ?
On ne forme pas le modèle (ce serait long et cher). On indexe vos documents dans une base vectorielle (pgvector), et au moment de chaque question l'IA va chercher les passages pertinents pour construire sa réponse. Format accepté : PDF, Word, Excel, Markdown, HTML, exports SaaS (Notion, Confluence, GitBook), bases SQL. La mise à jour est continue : ajoutez/modifiez un document dans votre source, l'index se met à jour automatiquement (sync horaire ou immédiate selon volume).
Peut-on l'intégrer à Slack, Teams ou notre intranet ?
Oui, ce sont les 3 canaux les plus demandés. Slack et Teams via apps officielles (l'assistant IA devient un bot que vos équipes mentionnent dans les channels) ; intranet via widget chat embarqué ou page dédiée full-écran. On peut aussi exposer une API pour vos applications métier internes. Pour les cabinets juridiques et la santé, on déploie souvent en architecture isolée avec interface web dédiée plutôt que Slack/Teams (séparation des données).
Combien ça coûte ?
Le pack démarrage est à partir de 5 900 € HT pour un assistant IA RAG déployé sur 1 base documentaire (jusqu'à ~5 000 documents) + 1 canal (Slack, Teams ou intranet), livré en 2 à 3 semaines. Le pack boost à 12 900 € HT couvre 2 bases ou 2 canaux + intégrations métier.
Pour les secteurs régulés (juridique, santé, finance) avec architecture isolée et hébergement labellisé HDS, comptez à partir de 25 000 € HT, livré en 6 à 8 semaines. Maintenance forfaitaire mensuelle (mises à jour indéterminées de la base, ajustements prompts, nouvelles permissions).
Voir le détail des tarifsL'assistant RAG selon vos enjeux
Selon votre secteur et le type de données, le bon montage varie.
Prêt à donner à vos équipes un ChatGPT qui connaît vraiment votre métier ?
30 minutes d'audit gratuit. On cartographie ensemble vos sources documentaires, le cas d'usage prioritaire, et les contraintes RGPD. Sans engagement.
Réserver mon audit gratuitOu contactez-nous directement : +33 6 51 30 89 49 • WhatsApp • greg@audelalia.fr