Intégrer l'IA générativesans dépendance.
Du cadrage au déploiement : RAG, choix du modèle, sécurité, coûts, qualité des réponses et réversibilité.
Notre façon de travailler.
Indépendance
Multi-LLM par défaut. Llama et Mistral en open source, GPT, Claude et Gemini en propriétaire selon la tâche.
Pragmatisme
On ne lance pas un POC si la donnée n'est pas prête. On ne pousse pas en production si l'évaluation ne valide pas. Pas de fuite en avant.
Continuité
L'IA doit s'intégrer à vos outils, vos règles de sécurité et vos pratiques d'exploitation. Pas vivre à côté.
Les sujets IA que nous cadrons et livrons.
Six terrains précis sur lesquels nous avons des livrables, des métriques, et des retours de production.
Chaque cas d'usage impose ses choix : modèle, données, hébergement, garde-fous, coût.
Assistants métier internes
Un assistant limité à un périmètre clair, avec réponses sourcées, règles de refus et validation humaine quand nécessaire.
RAG documentaire
Brancher un assistant sur vos documents internes pour retrouver, résumer et citer l’information utile.
Agents back-office
Classer, préremplir, contrôler ou résumer des dossiers, avec logs, règles métier et validation humaine.
Fine-tuning open source
Quand le prompt ou le RAG ne suffisent pas, on spécialise un modèle sur des exemples validés.
MCP servers sur-mesure
Permettre à un assistant d’interroger vos API et outils internes, avec droits, logs et limites claires.
Évaluation & benchmark
Comparer plusieurs modèles sur vos propres cas : qualité des réponses, coût, latence, hallucinations, maintenabilité.
Les briques que nous intégrons.
Aucun de ces choix n'est imposé d'office. La stack est arbitrée en cadrage, sur votre contexte réel.
Modèles
Frameworks
Vector stores
Orchestration
Sistr —Assistant IA.
Recherche documentaire sur dossiers patients anonymisés. Hébergement souverain Scaleway, Llama 3.1 70B, RAG avec citations sources.
Lire le cas completCinq étapes, pas plus.
Une déclinaison spécifique de notre méthode pour les projets IA générative. L'évaluation est traitée comme une étape à part entière, pas en option.
Cas d’usage & corpus.
Faisabilité métier, qualité de la donnée, contraintes de souveraineté. Sortie : décision de POC ou non.
Benchmark argumenté.
2-3 modèles testés sur votre corpus réel. Open source vs propriétaire arbitré sur des chiffres, pas des préférences.
Le cas d’usage core.
2 à 6 semaines. Un seul cas d’usage, fait correctement. On valide les sources, les droits, les limites de l’assistant.
Métriques de qualité.
Taux de bonnes réponses, sources citées, hallucinations, coût par requête, retours utilisateurs.
Mise en production.
Si les critères sont atteints : déploiement, supervision, documentation et transfert aux équipes.
Sécurité, conformité, réversibilité.
Ces sujets ne sont pas traités à la fin. Ils cadrent les choix dès le départ : données, accès, hébergement, logs, supervision et clauses de sortie.
Hébergement souverain
Scaleway, OVH, on-premise. Donnée et inférence dans l'UE quand requis.
Modèles open source
Llama, Mistral, Phi. Self-hosted via vLLM ou Ollama. Pas de fuite vers un cloud tiers.
RGPD & conformité
Privacy by design. HDS-compatible santé. DPIA accompagnée si besoin.
Réversibilité
Code livré, documenté, testé. Pas de plateforme propriétaire. Tout reprenable.
Questions de DSI.
Les questions que les DSI et les directions Innovation nous posent le plus. Si la vôtre n'y est pas, écrivez-nous.
Un projet IA, une refonte applicative, une modernisation à cadrer ?
75011 Paris