Comment l'OCR peut aider les employés à accomplir les tâches les plus fastidieuses

De nos jours, les employés de bureau ont besoin d'un héros IA. Pouvez-vous imaginer le nombre d'heures perdues à gérer un flux de travail basé sur le papier ? N'est-il pas temps de sauver les employés des piles de papiers ?

Personne ne dit qu'il sera facile d'éliminer rapidement les documents papier. Par exemple, dans le domaine juridique où le coût d'une erreur est assez élevé, la vérification et la validation des documents nécessitent l'intervention humaine. Cependant, de nombreux autres secteurs d'activité ont un besoin urgent de automatisation intelligente des processus de flux documentaire pour numériser des tonnes de documents imprimés factures, tickets et reçus dès maintenant.

Les entreprises aux États-Unis et en Europe perdent trop de temps à gérer les flux de travail traditionnels de documents papier – environ 46 % – au lieu de se concentrer sur les processus clés. Et| 65 % d’entreprises chercher à exploiter la puissance des données et à numériser les documents papier en 2018. Est-ce suffisant pour se débarrasser complètement de tonnes de papier dans les années à venir ? Non, il semble que non.

Quant à un coup de main pour relever ce défi, c'est l'intelligence artificielle (IA) qui se développe à pas de géant d'année en année. À savoir, c'est le machine learning (ML) et la technologie de reconnaissance optique de caractères (OCR). Et l'OCR peut devenir le meilleur assistant de vos employés dans la lutte contre les tâches manuelles routinières.

Prenez une photo, améliorez-la, reconnaissez les caractères

Considérons par exemple une agence fiscale et tous les reçus qu’elle traite au quotidien. Des dizaines d’employés scannent des documents imprimés et recueillent des informations sur les types de services, les remises, les dates, le prestataire, etc. Leur travail peut et doit être optimisé pour améliorer la productivité, gagner du temps et des ressources, et réaffecter les employés à la résolution de problèmes nécessitant une intervention humaine.

Et voici une solution alimentée par l'IA. La première étape pour numériser des documents papier consiste à utiliser l'OCR. Parmi les outils puissants prêts à l'emploi destinés à l'extraction de texte, il y a Google API Cloud Vision avec ses fonctionnalités suivantes :

Démontre un processus de reconnaissance de haute qualité
détecte la position du texte sur une page
fournit le niveau de confiance pour les prédictions de caractères

Cela peut sembler excellent, sauf si on le compare à open source Tesseract et ABBYY FineReader Engine offrant un SDK OCR multifonction pour les développeurs. Ces deux solutions renvoient les mêmes résultats mais dans un format différent et peuvent surpasser la première.

Cependant, ces trois solutions dépendent d'une connexion Internet et ne prennent pas en charge le mode hors ligne. De plus, elles fonctionnent bien uniquement avec des images brutes parfaites, alors qu'en réalité les documents papier sont trop souvent froissés et présentent des caractères mal imprimés. Un mauvais éclairage ou une caméra de faible qualité peut également rendre la reconnaissance des caractères difficile.

Ainsi, les images brutes doivent passer par une phase de prétraitement. À ce sujet, OpenCV – une bibliothèque open-source d'algorithmes dédiée à la vision par ordinateur – peut être utilisée efficacement comme cadre pour le traitement des images. Elle fournit le niveau de confiance qui sert d'indicateur lors de la vérification de la qualité des images améliorées. Une autre façon est de prendre une approche human-in-the-loop du machine learning ou, pour le dire simplement, faire appel à un humain pour assister une machine dans le contrôle qualité.

Algorithme ML en coopération avec l'humain

Présentons un autre cas d'usage où l'OCR peut devenir le meilleur allié des employés. Lorsque lorsqu’un employé est en déplacement professionnel, l’entreprise est responsable de couvrir tous les frais pour les hôtels, billets, transferts, repas, communication, etc. Et encore une fois, ce type de voyage génère de nombreux documents papier, entraînant un traitement manuel fastidieux. Pour contourner ce problème, un employé peut renvoyer des photos ou des images de documents scannés pour la reconnaissance optique de caractères (OCR), contribuant ainsi à optimiser le temps et les ressources.

Cela dit, toute l'information collectée via OCR nécessite d'être répartie en plusieurs catégories. Ce n'est qu'après catégorisation et analyse qu'elle peut être utilisée efficacement pour éliminer le traitement manuel. Mais on ne peut pas se passer de l'intervention et du retour d'un humain. La coopération entre un humain et une machine est connue sous le nom de apprentissage supervisé. Pour entraîner un algorithme de ML à analyser et segmenter les données avec une plus grande précision, les données doivent être annotées par des humains. Ils doivent également définir des règles strictes pour indiquer automatiquement à la machine une catégorie ou une autre.

Un algorithme ML fonctionne sur des caractéristiques (dans ce cas, les dimensions de l'image). Pour ingénierie des caractéristiques, il est crucial d'utiliser autant que possible la connaissance du domaine, telle que la hauteur et la largeur, la couleur, le nombre de mots, les polices, l'espacement, les caractéristiques temporelles, etc. Des images étiquetées manuellement permettent de construire un modèle d'apprentissage pour un algorithme. Pour démarrer le développement du modèle, 1 000 à 2 000 éléments étiquetés suffisent. Mais pour obtenir d'excellents résultats, au moins 10 000 à 20 000 sont indispensables.

En route vers l'avenir des assistants activés par l'IA

Enfin, un autre cas d'usage se présente : exploiter l'OCR pour analyser les tickets et rembourser les frais de déplacement en cas de voyage annulé. Toutefois, il est prudent de maintenir une approche human-in-the-loop (humain dans la boucle), car tout ce qui concerne l'argent exige une vérification fiable. Il est nécessaire d'entraîner une machine à identifier sans faille la date, l'heure et le nom de la gare. Tout cela souligne l'intérêt d'une approche basée sur des règles pour l'apprentissage automatique et la nécessité de l'intervention humaine.

Mais imaginez qu'à partir de, disons, 60 employés qui recueillent et analysent des informations manuellement, il n'en restera que 10. Un tel niveau d'automatisation offrira aux entreprises des avantages considérables, à savoir une productivité accrue et des opportunités d'économie de ressources. Certains diraient qu'un inconvénient évident est l'élimination des emplois et la prise de pouvoir des machines sur les humains dans de nombreux domaines. Loin de là, en réalité. Selon un Rapport du World Economic Forum, l'IA pourrait supprimer 75 millions d'emplois, tout en créant 133 millions de nouvelles opportunités d'ici 2022.

Avec l’objectif d’assurer une intégration fluide de l’OCR dans les| la gestion de documents processus, il est impératif de préparer les employés à une approche innovante. Les mesures suivantes peuvent aider à démontrer une attitude responsable de la part de la direction et garantir un impact positif sur les processus business :

commencez par adopter un système activé par l’IA offrant un faible niveau d'automatisation
créer une interface conviviale
engager les employés et les persuader d'adopter les changements
introduire progressivement une automatisation supplémentaire

L'OCR est déjà prêt à être utilisé avec succès pour traitement automatique de documents. Il peut aider à économiser considérablement du temps et des ressources dédiées à la numérisation des documents papier, bien que l'étendue de l'automatisation dépende du type d'entreprise, de ses exigences spécifiques et de sa préparation aux changements induits par l'IA.

Jusqu'à présent, l'utilisation efficace de la technologie est incertaine, en raison du manque d'implication humaine. Plus le cas d'usage de la reconnaissance optique de caractères (OCR) est spécifique – par exemple, dans les domaines juridique ou économique – plus l'implication humaine est nécessaire. Les machines sont créées pour être un outil d'aide pour assister les humains, tant dans certaines tâches sophistiquées que dans les tâches quotidiennes.

Travaillez avec DataSqueeze sur votre Projet de Deep-learning.

Vous avez un projet en tête mais avez besoin d'aide pour le mettre en œuvre ? Contactez-nous à info@datasqueeze.fr, nous serions ravis de discuter de la manière dont nous pouvons collaborer avec vous.

Comment l'OCR peut aider les employés à accomplir les tâches les plus fastidieuses

Prenez une photo, améliorez-la, reconnaissez les caractères

Algorithme ML en coopération avec l'humain

En route vers l'avenir des assistants activés par l'IA

Travaillez avec DataSqueeze sur votre Projet de Deep-learning.

Abonnez-vous à notre newsletter !

Articles connexes