04 · Sécuriser

04.01 · Sécuriser

Prévention des fuites de données

Le DLP classique a été pensé pour le périmètre réseau et l’email. La donnée moderne fuit par dix chemins qui n’existaient pas en 2015 — et les outils n’ont pas suivi.

Par L’équipe Kabeen·12 min de lecture·Mis à jour le 15 mai 2026

La fuite a changé de visage

Pendant vingt ans, la fuite de données type passait par un employé qui emportait un fichier sur clé USB ou un export envoyé sur une adresse personnelle. Les outils DLP — Data Loss Prevention — étaient conçus pour ces vecteurs : inspection email, contrôle USB, blocage des protocoles connus. Aujourd’hui, ces canaux représentent moins d’un tiers des fuites observées.

83 %
Incidents de fuite de données impliquant un service SaaS ou cloud en 2024.
IBM, Cost of a Data Breach 2024
€ 4,4 M
Coût moyen d’une violation de données en 2024.
IBM, Cost of a Data Breach 2024
194 jours
Temps moyen pour détecter une fuite de données dans un environnement SaaS.
IBM, Cost of a Data Breach 2024

Anatomie des vecteurs modernes

31 %24 %17 %15 %13 %
SaaS mal configuré
Partage interne
IA générative
Email / USB
Attaque externe
Fig. 13.1Répartition typique des canaux de fuite de données dans une ETI en 2024.

Le canal qui a le plus changé en deux ans est celui de l’IA générative — passé de zéro à dix-sept pourcents. Le canal qui reste sous-estimé est celui des SaaS mal configurés : permissions trop larges, partages publics, intégrations OAuth héritées que personne ne révoque. Ces deux canaux ont une caractéristique commune : ils échappent totalement aux DLP périmétriques classiques.

Quatre couches de défense, à construire dans l’ordre

01

Classification des données

Public / interne / confidentiel / sensible. Sans cette couche, aucune des suivantes ne peut décider intelligemment.

02

Cartographie des flux

Quelles données sortent de quelle application, vers où, dans quel format. Base de toute analyse de risque.

03

Contrôles préventifs

Permissions par défaut restrictives, expiration des partages, détection des prompts IA contenant des données sensibles.

04

Détection et réponse

Alerting sur partages publics, exfiltrations OAuth, anomalies d’usage. Doit alerter une personne, pas un dashboard.

Fig. 13.2Architecture DLP moderne, des fondations vers les couches sophistiquées.

L’ordre est strict. Sans classification, la cartographie des flux donne un volume mais pas une criticité. Sanscartographie, les contrôles sont appliqués à l’aveugle. Sans contrôles préventifs, la détection produit du bruit qu’on apprend à ignorer. La majorité des programmes DLP qui échouent commencent par l’étape 4 — l’achat d’un outil de détection — et n’atteignent jamais l’étape 1.

La spécificité IA

Le canal IA générative mérite un traitement à part parce qu’il ne se contrôle pas comme les autres. Une donnée envoyée dans un prompt n’est pas exfiltrée par un fichier — elle est ingérée par un modèle. Trois contrôles complémentaires fonctionnent.

Liste blanche d’outils. Cohérent avec la charte IA. Les outils approuvés disposent de garanties contractuelles sur la donnée (non-réutilisation pour l’entraînement, hébergement européen). Les outils non approuvés sont bloqués au niveau réseau ou navigateur.

Détection client. Extension navigateur ou agent endpoint qui détecte les patterns sensibles (numéros de carte, RIB, adresses, code source identifié) dans les prompts envoyés à des outils IA, et alerte ou bloque selon la politique.

Suivi des intégrations natives. De plus en plus d’outils SaaS embarquent désormais leur propre IA (Notion AI, Copilot, Slack AI). Suivre activement les fonctionnalités IA activées dans le parc — souvent par défaut — devient un sujet à part entière.

Ce qu’il faut retenir

  • Le DLP classique manque la majorité des vecteurs modernes. Près de la moitié des fuites passent par SaaS mal configuré ou prompt IA.
  • Quatre couches dans l’ordre : classifier, cartographier, prévenir, détecter. Sauter une étape mène à un dispositif bruyant et inefficace.
  • Le canal IA générative se contrôle par trois leviers : liste blanche, détection client, suivi des intégrations natives.