11 Juil 2025

Doxallia et le Datalab expérimentent l’IA pour l’extraction de données documentaires

Dox'Alliance

Entretien avec Yasser Aidarous de l’équipe Extraction et Enrichissement, de la Squad Dématérialisation des Processus.

"NOUS AVONS AMÉLIORÉ LA RECONNAISSANCE ET L’EXTRACTION AUTOMATIQUE DES CONTENUS DOCUMENTAIRES GRÂCE À L’IA."

Peux-tu nous expliquer l’origine de ce projet ?

L’origine de ce projet remonte à la solution FACDEB, développée par Doxallia il y a plusieurs années pour faciliter le déblocage de crédits basés sur des factures de travaux immobiliers. Cette solution reposait sur un système de RAD/LAD (ADDOC) sans intelligence artificielle. Toutefois, ses performances, notamment en termes de reconnaissance initiale automatisée, n’étaient plus satisfaisantes.
Nous avons donc identifié un besoin critique d’amélioration pour renforcer la reconnaissance automatique et l’extraction du contenu des documents, en s’appuyant sur l’IA. Pour cela, l’équipe Extraction/Enrichissement s’est rapprochée du DataLab Groupe afin de développer une solution IA spécifique.

Quels étaient les principaux défis ou problèmes à résoudre avec ce POC ?

Le premier défi était de convaincre et d’obtenir l’autorisation de trois Caisses Régionales (CA Atlantique Vendée, CA Centre Est et CA Centre France) pour utiliser des documents issus de la production afin de constituer une base d’apprentissage représentative.
Ensuite, il était nécessaire de construire cette base documentaire, en incluant des dizaines de milliers de documents, afin d’assurer un apprentissage robuste. Les objectifs clés incluaient :
• Améliorer les performances de reconnaissance de +30 % grâce à l’IA.
• Augmenter la qualité des valeurs reconnues.
• Réduire les tâches de saisie manuelle pour permettre aux opérateurs de se concentrer sur le contrôle.

Quelle méthodologie avez-vous adoptée pour ce POC ?

Le projet a été organisé en deux étapes principales :

1. Une première phase de validation sur un échantillon restreint de 327 documents,
afin d’évaluer la pertinence du modèle cible.

2. Une mise à l’échelle sur une base beaucoup plus large de 13 000 documents pour tester la robustesse et l’adaptabilité du modèle.

Quelles technologies ont été déployées, et quel a été le rôle du DataLab Groupe ?

Nous avons utilisé le modèle d’extraction G3, qui repose sur une approche end-to-end sans OCR, permettant de réduire les coûts d’annotation et d’augmenter la robustesse face aux variations des templates. Ce modèle utilise uniquement des paires clés/valeurs pour l’apprentissage, ce qui simplifie considérablement les processus précédents.

Le DataLab a été un partenaire stratégique. Il a mobilisé des compétences en data science et en ingénierie ML pour développer et calibrer le modèle. Leur travail a permis d’obtenir des résultats préliminaires convaincants, avec un taux d’extraction correcte de 77,4 % sur l’échantillon initial.

Quels ont été les résultats obtenus ?

Le POC a dépassé nos attentes initiales. Nous avons observé une nette amélioration des performances grâce à l’intégration de l’IA. Le modèle G3 s’est montré capable de gérer efficacement les variations dans les templates de factures et a fourni des résultats stables dans un environnement limité.

Quels sont les principaux bénéfices de ce projet ?

Pour l’entreprise, ce projet a permis une réduction significative des coûts opérationnels en diminuant le besoin d’annotations complexes. Le traitement des factures est plus rapide et précis, ce qui augmente globalement l’efficacité des processus.

Pour les utilisateurs finaux, notamment les opérateurs, le projet a permis de réduire la charge de travail liée à la saisie manuelle, leur donnant plus de temps pour se concentrer sur des contrôles à plus forte valeur ajoutée.

"LE PROJET OFFRE DES OPPORTUNITÉS POUR DIGITALISER ET OPTIMISER LES PROCESSUS DOCUMENTAIRES, AVEC UN POTENTIEL RÉPLICABLE À DE NOMBREUX AUTRES TYPES DE DOCUMENTS."

Quelles leçons tirez-vous de cette expérience, et quelles sont les prochaines étapes ?

Ce projet a mis en évidence l’importance d’une collaboration fluide entre les équipes techniques et métiers. L’intégration de l’IA, lorsqu’elle est ciblée sur un besoin précis, peut transformer significativement des processus complexes.

Les prochaines étapes incluent des tests sur des données de production afin de valider la scalabilité du modèle. De plus, nous explorons la possibilité d’étendre cette solution à d’autres types de documents comme les bons de commande ou les tickets de caisse.

Ce projet ouvre des perspectives prometteuses pour la digitalisation et l’optimisation des processus documentaires. Cette expérience peut être répliquée sur d’autres usages du traitement documentaire.

Le projet IA 3G Facdeb a été rendu possible grâce à une collaboration étroite des équipes de Doxallia et du DataLab Groupe.

Nos réussites
RSE

Doxallia renouvelle l’obtention de son label Imprim’Vert

Renouvellement du label Imprim’Vert, symbole de notre engagement en faveur de l’environnement.

23 Juin 2025

Nos réussites
RSE

Doxallia obtient le label EcoVadis OR

Label EcoVadis OR, une reconnaissance de nos avancées concrètes en matière de politique RSE.

21 Mai 2025

Bandeau d'actualité communiqué de presse Invox'IA by Doxallia.

Communiqué de presse
Nos réussites

Doxallia dévoile Invox-IA, une solution intelligente et conforme pour réussir la facturation électronique

À l’occasion de la Journée de la facture électronique, Doxallia, filiale du Groupe Crédit Agricole, annonce le lancement officiel de Invox-IA by Doxallia.

13 Mai 2025

Nos réussites
RSE

Doxallia obtient le label Numérique Responsable Niveau 1

Ce label certifie que Doxallia est engagée dans une démarche numérique responsable exigeante.

29 Avr 2025

Nos réussites
RSE

Engagement pour une gestion forestière durable : notre certification PEFC renouvelée

Par le renouvellement de ce label, Doxallia garantit l’utilisation de matière première issue de forêts certifiées PEFC.

24 Fév 2025

Carrière durable
Parole d'expert
RSE

Pourquoi l’accessibilité numérique est-elle indispensable pour votre entreprise ?

Sujet également essentiel au cœur même de l'accessibilité, l'accessibilité numérique est un enjeu fondamental pour les entreprises...

14 Nov 2024

Communiqué de presse
Nos réussites
Parole d'expert

Facturation électronique : le Crédit Agricole annonce l’immatriculation de ses deux PDP Doxallia et Kolecto

Le Crédit Agricole annonce dans un communiqué l'immatriculation de ses deux PDP dans le cadre de la réforme de la facturation électronique.

4 Oct 2024

Doxallia obtient l'immatriculation PDP, Plateforme de Dématérialisation Partenaire, attribuée par la DGFIP.

Communiqué de presse
Nos réussites
Parole d'expert

PDP : Doxallia obtient l’immatriculation de sa Plateforme de Dématérialisation Partenaire (n° 0016)

Doxallia obtient l'immatriculation PDP, Plateforme de Dématérialisation Partenaire, attribuée par la DGFIP.

11 Sep 2024

Excellente nouvelle pour Doxallia qui voit son statut de partenaire des services de confiance renforcé.

Nos réussites
Parole d'expert

Protection des données : nos certifications ISO 27001 et HDS renouvelées

Excellente nouvelle pour Doxallia qui voit son statut de partenaire des services de confiance renforcé.

29 Juil 2024

DOXALLIA et Data One décrochent un marché public lancé par France Travail pour les 6 prochaines années.

Nos réussites

Doxallia et Data One : marché conclu avec France Travail !

DOXALLIA et Data One décrochent un marché public lancé par France Travail pour les 6 prochaines années.

12 Juin 2024