Accueil/Expertises/IA et automatisations/Assistants IA connectés à vos données
01 — Expertise · IA générative

Intégrer l'IA générativesans dépendance.

Du cadrage au déploiement : RAG, choix du modèle, sécurité, coûts, qualité des réponses et réversibilité.

Assistants IA connectés à vos données
Vos données
Documents internes
Base de données
Emails & tickets
Procédures métier
Assistant
IA
Comprend
Cherche
Répond
Vos équipes
« Quel est le délai de préavis dans le contrat Acme ? »
30 jours calendaires à compter de la date de notification.
Contrat Acme · Art. 8.2 · p. 12
Pourquoi nous

Notre façon de travailler.

01

Indépendance

Multi-LLM par défaut. Llama et Mistral en open source, GPT, Claude et Gemini en propriétaire selon la tâche.

02

Pragmatisme

On ne lance pas un POC si la donnée n'est pas prête. On ne pousse pas en production si l'évaluation ne valide pas. Pas de fuite en avant.

03

Continuité

L'IA doit s'intégrer à vos outils, vos règles de sécurité et vos pratiques d'exploitation. Pas vivre à côté.

Stack IA

Les briques que nous intégrons.

Aucun de ces choix n'est imposé d'office. La stack est arbitrée en cadrage, sur votre contexte réel.

Modèles

Llama
Mistral
GPT
Claude
Gemini

Frameworks

LangChain
LangGraph
LlamaIndex

Vector stores

pgvector / Supabase
Qdrant

Orchestration

Langflow
n8n
MCP
vLLM
Ollama
+ benchmark systématique sur votre corpus métier via Ragas, LLM-as-judge, et des jeux de tests construits avec vos experts métier.
Cas client

Sistr —Assistant IA.

Recherche documentaire sur dossiers patients anonymisés. Hébergement souverain Scaleway, Llama 3.1 70B, RAG avec citations sources.

Lire le cas complet
Santé · Public2025 · 8 mois

CHU Nantes

Recherche sémantique sur 12 ans de comptes-rendus anonymisés, déployée pour 1 500 praticiens et chercheurs.

−70%temps de recherche documentaire moyen par praticien
1 500utilisateurs internes actifs · mensuel
100%hébergement souverain, modèle open source self-hosted
Llama 3.1 70BpgvectorScaleway GPUvLLMHDS
Méthode IA

Cinq étapes, pas plus.

Une déclinaison spécifique de notre méthode pour les projets IA générative. L'évaluation est traitée comme une étape à part entière, pas en option.

01Cadrage

Cas d’usage & corpus.

Faisabilité métier, qualité de la donnée, contraintes de souveraineté. Sortie : décision de POC ou non.

02Choix du modèle

Benchmark argumenté.

2-3 modèles testés sur votre corpus réel. Open source vs propriétaire arbitré sur des chiffres, pas des préférences.

03POC

Le cas d’usage core.

2 à 6 semaines. Un seul cas d’usage, fait correctement. On valide les sources, les droits, les limites de l’assistant.

04Évaluation

Métriques de qualité.

Taux de bonnes réponses, sources citées, hallucinations, coût par requête, retours utilisateurs.

05Industrialisation

Mise en production.

Si les critères sont atteints : déploiement, supervision, documentation et transfert aux équipes.

Souveraineté

Sécurité, conformité, réversibilité.

Ces sujets ne sont pas traités à la fin. Ils cadrent les choix dès le départ : données, accès, hébergement, logs, supervision et clauses de sortie.

Hébergement souverain

Scaleway, OVH, on-premise. Donnée et inférence dans l'UE quand requis.

Modèles open source

Llama, Mistral, Phi. Self-hosted via vLLM ou Ollama. Pas de fuite vers un cloud tiers.

RGPD & conformité

Privacy by design. HDS-compatible santé. DPIA accompagnée si besoin.

Réversibilité

Code livré, documenté, testé. Pas de plateforme propriétaire. Tout reprenable.

FAQ

Questions de DSI.

Les questions que les DSI et les directions Innovation nous posent le plus. Si la vôtre n'y est pas, écrivez-nous.

Cela dépend de trois critères : la sensibilité de la donnée, la qualité attendue sur votre tâche réelle, et votre tolérance à la dépendance fournisseur. Nous comparons systématiquement Llama / Mistral face à GPT, Claude, Gemini sur votre corpus avant de trancher. Aucun modèle n'est universellement supérieur, la décision se prend sur vos métriques.
Oui. Trois options : hébergement souverain européen (OVH, Scaleway), déploiement self-hosted sur vos GPU, ou inférence locale via vLLM. Dans tous les cas, le data flow est documenté et auditable. Pour les projets sensibles (santé, défense, finance), nous travaillons exclusivement en open source self-hosted.
Trois leviers : (1) une évaluation continue sur jeu de tests représentatifs, (2) du grounding systématique (RAG ou tool calls), pas de génération libre sur des faits, (3) des garde-fous (validation de format, refus en cas de doute, escalade humaine). Pas de mise en production sans métriques de qualité mesurées et acceptées.
Trois choses suffisent au démarrage : un cas d'usage métier exprimé en français clair, un sponsor exécutif, et un accès aux données pertinentes. Le reste : choix du modèle, architecture, hébergement relève de notre cadrage.
Oui, c'est l'une de nos lignes d'activité. Audit indépendant en 1 à 2 semaines, plan de redressement, reprise du code. Nous documentons précisément ce qui ne marche pas (architecture, qualité, coûts) avant de proposer une suite.
Systématiquement. Vos équipes co-construisent dès le cadrage et reprennent le code à terme. Nous documentons, formons, et organisons un transfert progressif. Notre intérêt n’est pas de devenir indispensable à votre run.
Oui, formations techniques (architecture LLM, prompt engineering, évaluation) et formations métier (animer un cas d’usage, écrire un prompt produit). Formats demi-journée, journée, ou parcours multi-sessions. Catalogue disponible sur demande.
Démarrer

Un projet IA, une refonte applicative, une modernisation à cadrer ?

Coordonnées
contact@agence-scroll.com
+33 6 48 03 90 27
20 Rue des Taillandiers
75011 Paris
Réponse sous 24h ouvrées.