Close

Tout savoir sur la vérification d’identité

Qu’est-ce que la reconnaissance optique de caractère (OCR) ?

3 minutes

La technologie OCR pour vérifier les documents d'identité

Qu'est-ce que l'OCR ? Définition

La Reconnaissance Optique de Caractères (OCR), aussi appelée « océrisation », est un procédé informatique qui permet de convertir du texte imprimé (tels que ceux inscrits sur un document d’identité) ou écrit à la main en texte électronique. Cette conversion est réalisée grâce à l’utilisation de techniques avancées en traitement d’image et en Intelligence Artificielle.

Ainsi dans le cas de la vérification de la CNI, l’OCR va permettre de convertir les données visuelles du document capturé ou de sa photocopie telles que le nom, la date de naissance, la date de péremption ou la MRZ en données textuelles numériques et éditables. Ainsi, le nom Martin d’une CNI va pouvoir être correctement décomposé en plusieurs lettres lisibles : M-a-r-t-i-n.

OCR sur une carte d'identité nationale

Pour vous donner une image, l’OCR fonctionne exactement comme les yeux et le cerveau d’un humain :

  • Lorsque vous regardez une pièce d’identité, vos yeux vont transmettre une information visuelle brute au cerveau. Le cerveau va alors recevoir et analyser l’information visuelle pour la transformer en information compréhensible pour l’humain : du texte, des lettres, une image…
  • L’OCR fonctionne de la même manière, sauf que les yeux et le cerveau sont remplacés par 2 IA : la première IA va convertir une image brute (la zone de texte d’une CNI) en un signal compréhensible par une 2ème IA qui se chargera de lui donner du sens (texte, lettres éditables au format numérique).

Cette technologie a originellement été développée dans le but de faciliter la recherche et l’indexation des documents papier, permettant ainsi une recherche textuelle en son sein. Cependant, elle offre également des applications pratiques dans le domaine de la vérification et du contrôle d’identité.

En effet, grâce à l’OCR, il est possible d’automatiser le processus de vérification d’identité en numérisant des pièces d’identité telles que les CNI, les passeports, les permis de conduire ou les titres de séjour. Les informations contenues dans ces justificatifs, telles que le nom, la date de naissance ou encore le numéro d’identification sont alors extraites automatiquement par l’algorithme OCR.

Cette automatisation permet une vérification plus rapide et plus fiable des informations contenues dans le document d’identité. De plus, elle réduit les erreurs humaines liées à une saisie manuelle incorrecte.

Comment fonctionne l'OCR ? Cas de la vérification d'une CNI

L’extraction des données d’un document d’identité, tel qu’une carte nationale d’identité (CNI), par la technologie OCR (Optical Character Recognition) comprend plusieurs étapes techniques importantes, chacune utilisant des techniques avancées en Deep Learning. Voici une liste exhaustive des étapes clés impliquées dans ce processus :

  1. Localisation de la CNI dans l’image : l’objectif est de supprimer l’arrière-plan de la photo présentant la CNI pour ne garder qu’elle sur l’image.
  2. Annulation des déformations géométriques : la capture d’une pièce d’identité par la caméra d’un téléphone portable par exemple n’est jamais complètement droite. L’image de la CNI est alors souvent “déformée”, verticalement, horizontalement ou en profondeur. L’objectif est alors d’annuler et corriger les déformations géométriques pour mettre à plat la CNI.
  3. Localisation des zones de texte du document : l’objectif est de repérer les zones de données (MRZ, nom, date…) dans la photo de la CNI.
  4. Lecture du texte du document : l’OCR va alors pouvoir extraire et convertir les données pixelisées de la carte en données textuelles numériques.
Vous avez des questions ?

Contactez l’un de nos experts solutions pour découvrir comment Namirial Onboarding vous permet de vérifier l’identité de vos utilisateurs, en tout sécurité et sans perdre en conversion.

L'OCR pour lire la bande MRZ

C’est quoi la bande MRZ ?

La bande MRZ, également connue sous le nom de Zone de Reconnaissance de Caractères Machine (MRZ pour Machine-Readable Zone en anglais), est une zone présente sur les passeports, les cartes d’identité et autres pièces officielles. Elle est située généralement au bas de la page d’identification.

Il s’agit d’une section spéciale qui contient certaines informations clés en format machine lisible. Ces informations sont encodées sous forme de caractères alphanumériques qui peuvent être facilement traités par des systèmes automatisés tels que les scanners ou les logiciels de reconnaissance optique des caractères (OCR).

La bande MRZ est divisée en plusieurs lignes, chacune fournissant des détails spécifiques sur l’identité du titulaire du document. Typiquement, la première ligne comprend le pays émetteur du document, tandis que la deuxième contient le numéro de document et la date d’expiration. La troisième est quant à elle utilisée pour stocker le nom et le prénom.

Les données contenues dans la bande MRZ sont cruciales pour l’authentification et la vérification des identités. Elles permettent aux systèmes automatisés de lire rapidement et avec précision les informations essentielles nécessaires à la vérification d’une identité.

Pour en savoir plus
Contactez-nous !

Remplissez le formulaire pour être recontacter par l’un de nos experts solutions.

Cette prise de contact sera pour vous l’occasion de : 

  • Découvrir comment nous pouvons répondre à vos attentes, votre problématique et vos besoins spécifiques
  • Découvrir les avantages de nos solutions et les avantages que vous gagneriez selon votre cas d’usage
  • Obtenir des retours clients et des cas d’entreprises similaires qui ont intégré nos solutions
  • Organiser une démo personnalisée, vous permettant d’apprécier comment nos solutions allient fluidité, sécurité et conformité.

Sommaire