Accueil/Expertises/IA et automatisations/Assistants IA connectés à vos données

01 — Expertise · IA générative

Intégrer l'IA générativesans dépendance.

Du cadrage au déploiement : RAG, choix du modèle, sécurité, coûts, qualité des réponses et réversibilité.

Échanger avec un expert Voir nos réalisations

Assistants IA connectés à vos données

Vos données

Documents internes

Base de données

Emails & tickets

Procédures métier

Assistant
IA

Comprend
Cherche
Répond

Vos équipes

« Quel est le délai de préavis dans le contrat Acme ? »

30 jours calendaires à compter de la date de notification.

Contrat Acme · Art. 8.2 · p. 12

Pourquoi nous

Notre façon de travailler.

Indépendance

Multi-LLM par défaut. Llama et Mistral en open source, GPT, Claude et Gemini en propriétaire selon la tâche.

Pragmatisme

On ne lance pas un POC si la donnée n'est pas prête. On ne pousse pas en production si l'évaluation ne valide pas. Pas de fuite en avant.

Continuité

L'IA doit s'intégrer à vos outils, vos règles de sécurité et vos pratiques d'exploitation. Pas vivre à côté.

Nos terrains

Les sujets IA que nous cadrons et livrons.

Six terrains précis sur lesquels nous avons des livrables, des métriques, et des retours de production.
Chaque cas d'usage impose ses choix : modèle, données, hébergement, garde-fous, coût.

Assistants métier internes

Un assistant limité à un périmètre clair, avec réponses sourcées, règles de refus et validation humaine quand nécessaire.

GPTClaudeMistral

RAG documentaire

Brancher un assistant sur vos documents internes pour retrouver, résumer et citer l’information utile.

pgvectorSupabaseLlamaIndex

Agents back-office

Classer, préremplir, contrôler ou résumer des dossiers, avec logs, règles métier et validation humaine.

LangGraphn8nMCP

Fine-tuning open source

Quand le prompt ou le RAG ne suffisent pas, on spécialise un modèle sur des exemples validés.

Llama 3MistralLoRA

MCP servers sur-mesure

Permettre à un assistant d’interroger vos API et outils internes, avec droits, logs et limites claires.

MCPTypeScriptAuth

Évaluation & benchmark

Comparer plusieurs modèles sur vos propres cas : qualité des réponses, coût, latence, hallucinations, maintenabilité.

RagasLLM-as-judge

Stack IA

Les briques que nous intégrons.

Aucun de ces choix n'est imposé d'office. La stack est arbitrée en cadrage, sur votre contexte réel.

Modèles

Llama

Mistral

GPT

Claude

Gemini

Frameworks

LangChain

LangGraph

LlamaIndex

Vector stores

pgvector / Supabase

Qdrant

Orchestration

Langflow

n8n

MCP

vLLM

Ollama

+ benchmark systématique sur votre corpus métier via Ragas, LLM-as-judge, et des jeux de tests construits avec vos experts métier.

Cas client

Sistr —Assistant IA.

Recherche documentaire sur dossiers patients anonymisés. Hébergement souverain Scaleway, Llama 3.1 70B, RAG avec citations sources.

Lire le cas complet

Santé · Public2025 · 8 mois

CHU Nantes

Recherche sémantique sur 12 ans de comptes-rendus anonymisés, déployée pour 1 500 praticiens et chercheurs.

−70%temps de recherche documentaire moyen par praticien

1 500utilisateurs internes actifs · mensuel

100%hébergement souverain, modèle open source self-hosted

Llama 3.1 70BpgvectorScaleway GPUvLLMHDS

Méthode IA

Cinq étapes, pas plus.

Une déclinaison spécifique de notre méthode pour les projets IA générative. L'évaluation est traitée comme une étape à part entière, pas en option.

01 — Cadrage

Cas d’usage & corpus.

Faisabilité métier, qualité de la donnée, contraintes de souveraineté. Sortie : décision de POC ou non.

02 — Choix du modèle

Benchmark argumenté.

2-3 modèles testés sur votre corpus réel. Open source vs propriétaire arbitré sur des chiffres, pas des préférences.

03 — POC

Le cas d’usage core.

2 à 6 semaines. Un seul cas d’usage, fait correctement. On valide les sources, les droits, les limites de l’assistant.

04 — Évaluation

Métriques de qualité.

Taux de bonnes réponses, sources citées, hallucinations, coût par requête, retours utilisateurs.

05 — Industrialisation

Mise en production.

Si les critères sont atteints : déploiement, supervision, documentation et transfert aux équipes.

Souveraineté

Sécurité, conformité, réversibilité.

Ces sujets ne sont pas traités à la fin. Ils cadrent les choix dès le départ : données, accès, hébergement, logs, supervision et clauses de sortie.

Hébergement souverain

Scaleway, OVH, on-premise. Donnée et inférence dans l'UE quand requis.

Modèles open source

Llama, Mistral, Phi. Self-hosted via vLLM ou Ollama. Pas de fuite vers un cloud tiers.

RGPD & conformité

Privacy by design. HDS-compatible santé. DPIA accompagnée si besoin.

Réversibilité

Code livré, documenté, testé. Pas de plateforme propriétaire. Tout reprenable.

FAQ

Questions de DSI.

Les questions que les DSI et les directions Innovation nous posent le plus. Si la vôtre n'y est pas, écrivez-nous.

Cela dépend de trois critères : la sensibilité de la donnée, la qualité attendue sur votre tâche réelle, et votre tolérance à la dépendance fournisseur. Nous comparons systématiquement Llama / Mistral face à GPT, Claude, Gemini sur votre corpus avant de trancher. Aucun modèle n'est universellement supérieur, la décision se prend sur vos métriques.

Oui. Trois options : hébergement souverain européen (OVH, Scaleway), déploiement self-hosted sur vos GPU, ou inférence locale via vLLM. Dans tous les cas, le data flow est documenté et auditable. Pour les projets sensibles (santé, défense, finance), nous travaillons exclusivement en open source self-hosted.

Trois leviers : (1) une évaluation continue sur jeu de tests représentatifs, (2) du grounding systématique (RAG ou tool calls), pas de génération libre sur des faits, (3) des garde-fous (validation de format, refus en cas de doute, escalade humaine). Pas de mise en production sans métriques de qualité mesurées et acceptées.

Trois choses suffisent au démarrage : un cas d'usage métier exprimé en français clair, un sponsor exécutif, et un accès aux données pertinentes. Le reste : choix du modèle, architecture, hébergement relève de notre cadrage.

Oui, c'est l'une de nos lignes d'activité. Audit indépendant en 1 à 2 semaines, plan de redressement, reprise du code. Nous documentons précisément ce qui ne marche pas (architecture, qualité, coûts) avant de proposer une suite.

Systématiquement. Vos équipes co-construisent dès le cadrage et reprennent le code à terme. Nous documentons, formons, et organisons un transfert progressif. Notre intérêt n’est pas de devenir indispensable à votre run.

Oui, formations techniques (architecture LLM, prompt engineering, évaluation) et formations métier (animer un cas d’usage, écrire un prompt produit). Formats demi-journée, journée, ou parcours multi-sessions. Catalogue disponible sur demande.

Démarrer

Un projet IA, une refonte applicative, une modernisation à cadrer ?

Demander un devis Prendre rendez-vous

Coordonnées

contact@agence-scroll.com

+33 6 48 03 90 27

20 Rue des Taillandiers
75011 Paris

Réponse sous 24h ouvrées.