Avertissement : site en construction
Contact
Contact
Retour à toutes les études de cas

Solution basée sur l'OCR pour récupérer des données à partir des reçus

Efficacité des processus administratifs améliorée de 42 %.

OCR based solution for image processing
Détails clés

Efficacité des processus administratifs améliorée de 42 %.

  • Défi
    Extraction d'informations à partir des reçus grâce à l'apprentissage automatique
  • Solution
    Solution basée sur l'OCR pour traiter des données semi-structurées issues de reçus
  • Technologies et outils
    OpenCV, Python, C++, ABBYY Cloud OCR SDK

Client

Le Client est un fournisseur de solutions personnalisées dans le domaine bancaire et financier. Le Client recherchait des services d'extraction des données pour améliorer les applications métiers grâce à l'apprentissage automatique.

Défi : extraction d'informations à partir des reçus grâce à l'apprentissage automatique

Le Client a fourni à l'équipe de DataSqueeze une application mobile conçue pour stocker des reçus numériques. Le défi consistait à enrichir cette application pour appliquer l'apprentissage automatique.

Nos scientifiques des données ont décidé d'utiliser la reconnaissance optique de caractères (OCR) pour entraîner un algorithme à extraire des données clés à partir d'images brutes. Ils ont également utilisé des méthodes classiques de vision par ordinateur pour améliorer la qualité des images avant d'appliquer la reconnaissance optique de caractères aux reçus.

Solution : solution basée sur l'OCR pour traiter des données semi-structurées issues de reçus

La première étape a consisté à prétraiter les images numériques pour l'extraction des données. Notre équipe a utilisé la vision par ordinateur pour lire les reçus.

Le texte semi-structuré dans les reçus peut contenir non seulement du texte brut mais aussi des chiffres, des titres, des tableaux ou des éléments non textuels. De plus, les textes dans les reçus ont des attributs tels que des polices différentes, des symboles, des colonnes, etc. Ces particularités contribuent à une mauvaise reconnaissance des caractères. La solution consistait à se concentrer sur une sélection minutieuse des zones, une extraction précise des données de chaque zone, et à synthétiser les résultats.
Notre équipe a développé une solution qui permet de diviser un reçu en plusieurs zones ou boîtes pour extraire les données, colonne par colonne, les traiter et les transférer automatiquement vers les formulaires requis ou le CRM du client.

Un autre défi consistait à extraire les chiffres du numéro de compte et un numéro de routage. Les banques utilisent souvent des polices spécialisées, et un symbole se compose de plusieurs parties. De plus, les textes sur les reçus peuvent s'effacer ou pâlir, ce qui peut poser des difficultés de reconnaissance dans certains cas.

Notre équipe a trouvé une méthode qui permet de calculer automatiquement une boîte englobante pour chaque symbole. Cette approche a permis de traiter chaque symbole comme une image afin d'extraire le nombre entier avec un taux de précision élevé.

Résultat : Automatisation des tâches routinières et amélioration de la performance globale

L'équipe DataSqueeze a accompagné le Client dans l'automatisation des processus d'extraction des données. Le Client a reçu une solution basée sur la reconnaissance optique de caractères, capable d'éliminer les tâches longues et sujettes aux erreurs. Cela comprenait le traitement des données de transactions financières provenant des reçus.

Cette solution personnalisée peut être utilisée pour améliorer l'efficacité des processus administratifs. En remplaçant les employés humains impliqués dans les tâches routinières, le Client réaffecte davantage de talents pour résoudre des problèmes critiques nécessitant une supervision humaine.

Optimisez vos processus d'affaires avec nos Services d'extraction des données

Mots-clés :
  • Reconnaissance optique de caractères
  • OCR

Commencez dès aujourd'hui avec l'IA pour Entreprises

Parlons de votre projet.

En cliquant sur Envoyer le message, vous acceptez nos Conditions d'utilisation et Politique de confidentialité.