Efficacité des processus administratifs améliorée de 42 %.

Efficacité des processus administratifs améliorée de 42 %.
Le Client est un fournisseur de solutions personnalisées dans le domaine bancaire et financier. Le Client recherchait des services d'extraction des données pour améliorer les applications métiers grâce à l'apprentissage automatique.
Le Client a fourni à l'équipe de DataSqueeze une application mobile conçue pour stocker des reçus numériques. Le défi consistait à enrichir cette application pour appliquer l'apprentissage automatique.
Nos scientifiques des données ont décidé d'utiliser la reconnaissance optique de caractères (OCR) pour entraîner un algorithme à extraire des données clés à partir d'images brutes. Ils ont également utilisé des méthodes classiques de vision par ordinateur pour améliorer la qualité des images avant d'appliquer la reconnaissance optique de caractères aux reçus.
La première étape a consisté à prétraiter les images numériques pour l'extraction des données. Notre équipe a utilisé la vision par ordinateur pour lire les reçus.
Le texte semi-structuré dans les reçus peut contenir non seulement du texte brut mais aussi des chiffres, des titres, des tableaux ou des éléments non textuels. De plus, les textes dans les reçus ont des attributs tels que des polices différentes, des symboles, des colonnes, etc. Ces particularités contribuent à une mauvaise reconnaissance des caractères. La solution consistait à se concentrer sur une sélection minutieuse des zones, une extraction précise des données de chaque zone, et à synthétiser les résultats.
Notre équipe a développé une solution qui permet de diviser un reçu en plusieurs zones ou boîtes pour extraire les données, colonne par colonne, les traiter et les transférer automatiquement vers les formulaires requis ou le CRM du client.
Un autre défi consistait à extraire les chiffres du numéro de compte et un numéro de routage. Les banques utilisent souvent des polices spécialisées, et un symbole se compose de plusieurs parties. De plus, les textes sur les reçus peuvent s'effacer ou pâlir, ce qui peut poser des difficultés de reconnaissance dans certains cas.
Notre équipe a trouvé une méthode qui permet de calculer automatiquement une boîte englobante pour chaque symbole. Cette approche a permis de traiter chaque symbole comme une image afin d'extraire le nombre entier avec un taux de précision élevé.
L'équipe DataSqueeze a accompagné le Client dans l'automatisation des processus d'extraction des données. Le Client a reçu une solution basée sur la reconnaissance optique de caractères, capable d'éliminer les tâches longues et sujettes aux erreurs. Cela comprenait le traitement des données de transactions financières provenant des reçus.
Cette solution personnalisée peut être utilisée pour améliorer l'efficacité des processus administratifs. En remplaçant les employés humains impliqués dans les tâches routinières, le Client réaffecte davantage de talents pour résoudre des problèmes critiques nécessitant une supervision humaine.