Prévention des fuites de données — IT Playbook

La fuite a changé de visage

Pendant vingt ans, la fuite de données type passait par un employé qui emportait un fichier sur clé USB ou un export envoyé sur une adresse personnelle. Les outils DLP — Data Loss Prevention — étaient conçus pour ces vecteurs : inspection email, contrôle USB, blocage des protocoles connus. Aujourd’hui, ces canaux représentent moins d’un tiers des fuites observées.

83 %

Incidents de fuite de données impliquant un service SaaS ou cloud en 2024.

IBM, Cost of a Data Breach 2024

€ 4,4 M

Coût moyen d’une violation de données en 2024.

IBM, Cost of a Data Breach 2024

194 jours

Temps moyen pour détecter une fuite de données dans un environnement SaaS.

IBM, Cost of a Data Breach 2024

Anatomie des vecteurs modernes

SaaS mal configuré

Partage interne

IA générative

Email / USB

Attaque externe

Fig. 13.1Répartition typique des canaux de fuite de données dans une ETI en 2024.Estimations Kabeen, croisement de rapports Verizon DBIR et IBM

Le canal qui a le plus changé en deux ans est celui de l’IA générative — passé de zéro à dix-sept pourcents. Le canal qui reste sous-estimé est celui des SaaS mal configurés : permissions trop larges, partages publics, intégrations OAuth héritées que personne ne révoque. Ces deux canaux ont une caractéristique commune : ils échappent totalement aux DLP périmétriques classiques.

Quatre couches de défense, à construire dans l’ordre

Classification des données

Public / interne / confidentiel / sensible. Sans cette couche, aucune des suivantes ne peut décider intelligemment.

Cartographie des flux

Quelles données sortent de quelle application, vers où, dans quel format. Base de toute analyse de risque.

Contrôles préventifs

Permissions par défaut restrictives, expiration des partages, détection des prompts IA contenant des données sensibles.

Détection et réponse

Alerting sur partages publics, exfiltrations OAuth, anomalies d’usage. Doit alerter une personne, pas un dashboard.

Fig. 13.2Architecture DLP moderne, des fondations vers les couches sophistiquées.

L’ordre est strict. Sans classification, la cartographie des flux donne un volume mais pas une criticité. Sanscartographie, les contrôles sont appliqués à l’aveugle. Sans contrôles préventifs, la détection produit du bruit qu’on apprend à ignorer. La majorité des programmes DLP qui échouent commencent par l’étape 4 — l’achat d’un outil de détection — et n’atteignent jamais l’étape 1.

La spécificité IA

Le canal IA générative mérite un traitement à part parce qu’il ne se contrôle pas comme les autres. Une donnée envoyée dans un prompt n’est pas exfiltrée par un fichier — elle est ingérée par un modèle. Trois contrôles complémentaires fonctionnent.

Liste blanche d’outils. Cohérent avec la charte IA. Les outils approuvés disposent de garanties contractuelles sur la donnée (non-réutilisation pour l’entraînement, hébergement européen). Les outils non approuvés sont bloqués au niveau réseau ou navigateur.

Détection client. Extension navigateur ou agent endpoint qui détecte les patterns sensibles (numéros de carte, RIB, adresses, code source identifié) dans les prompts envoyés à des outils IA, et alerte ou bloque selon la politique.

Suivi des intégrations natives. De plus en plus d’outils SaaS embarquent désormais leur propre IA (Notion AI, Copilot, Slack AI). Suivre activement les fonctionnalités IA activées dans le parc — souvent par défaut — devient un sujet à part entière.

Ce qu’il faut retenir

Le DLP classique manque la majorité des vecteurs modernes. Près de la moitié des fuites passent par SaaS mal configuré ou prompt IA.
Quatre couches dans l’ordre : classifier, cartographier, prévenir, détecter. Sauter une étape mène à un dispositif bruyant et inefficace.
Le canal IA générative se contrôle par trois leviers : liste blanche, détection client, suivi des intégrations natives.