Hyperlex s’engage aux côtés de la Chambre des Notaires de Paris et de la Banque des Territoires dans un vaste projet d’Intelligence Artificielle au service de la profession notariale : le projet “VictorIA”.

Dans ce projet, l’innovation n’est pas seulement portée par la technologie développée par Hyperlex, mais aussi par l’implication de toute une profession qui devient actrice de sa transformation digitale : allier l’expertise métier des notaires au savoir-faire technologique d’Hyperlex pour entraîner des algorithmes de machine learning. L’objectif ? Utiliser la puissance de l’IA entraînée pour assister les offices dans la gestion de masses documentaires croissantes. Découvrez tous les détails du projet VictorIA dans cet article (voir le communiqué de presse).

Présentation du projet VictorIA

La Chambre des Notaires de Paris a créé en 2018 un fonds d’innovation doté de 6,2 Millions d’euros à ce jour, permettant à la profession de mieux appréhender les nouvelles technologies et de conserver la maîtrise de leur utilisation. Grâce à ce fonds et au soutien de la Banque des Territoires, le notariat parisien s’appuie notamment sur l’intelligence artificielle et la blockchain pour enrichir son offre de service, améliorer sa qualité et gagner en productivité.

Parmi les projets menés, VictorIA concerne les milliers de datarooms électroniques constituées par les notaires pour gérer les cessions d’actifs immobiliers. Ces datarooms sont consultables sur l’Espace Notarial, un service en ligne “plébiscité par les offices et leurs clients dans toute la France [qui] compte 220 000 utilisateurs, 15 000 notaires et collaborateurs, avec 33 000 datarooms en ligne et plus de 5,4 millions de documents” précise Stéphane Adler, Vice-Président de la Chambre des Notaires de Paris.

En recourant aux algorithmes d’Intelligence Artificielle d’Hyperlex, le projet VictorIA vise d’abord à faciliter l’identification et la classification des ces masses documentaires. L’un des défis relevés réside dans la complexité et la technicité des documents présents : permis de construire, devis de travaux, factures, notes techniques des architectes, couvertures d’assurance… côtoient les actes de ventes et les baux commerciaux.

Le premier chantier du projet consiste donc – avec l’aide des offices partenaires qui injectent leur expertise métier – à entraîner les algorithmes d’Hyperlex à reconnaître les différentes natures de documents, mais aussi à extraire les informations pertinentes pour effectuer des contrôles de cohérence entre documents. Une fois l’IA entraînée, elle pourra nommer et classer automatiquement les documents importés dans les datarooms.

Pour Jacques Binard, Directeur des Systèmes d’Information de la Chambre des Notaires de Paris, “l’IA doit pouvoir réaliser une grande partie des tâches répétitives nécessaires à la constitution des datarooms afin de permettre aux notaires et à leurs collaborateurs de se focaliser sur l’audit juridique.” Autrement dit, il s’agit de permettre aux notaires de gagner en efficacité pour se concentrer sur leur expertise : la sécurité juridique de leurs dossiers, au service de leurs clients.

L’association de l’homme et de la machine

Cet ambitieux projet s’appuie la mobilisation et la cohésion du notariat parisien :

  • la mise à disposition d’un fonds de données important, nécessaire à l’apprentissage de l’IA ;
  • l’implication des notaires partenaires du projet qui vont non seulement “labelliser” les données brutes au départ [voir plus bas notre présentation du fonctionnement de l’IA] mais aussi contrôler la pertinence du travail de l’algorithme durant la phase d’apprentissage.

Côté technologie, le rôle des ingénieurs d’Hyperlex sera d’affiner au fur et à mesure le paramétrage des algorithmes pour obtenir la précision de résultat attendue par le métier. C’est un processus d’amélioration continu.

Comment l’IA d’Hyperlex s’applique-t-elle au traitement des documents juridiques ?

Après l’étape de la reconnaissance de caractère (OCR) qui permet de « traduire » une image (par exemple un document scanné) en un fichier de texte modifiable, l’intelligence artificielle vient reconnaître des informations importantes en fonction du contexte : types de contrat, clauses, éléments clés (dates, montants, durées, contreparties, objet…). Ce résultat est obtenu grâce à un processus d’apprentissage préalable : le machine learning.

ZOOM SUR LE MACHINE LEARNING : Le machine learning est une technologie d’intelligence artificielle qui regroupe l’ensemble des techniques et algorithmes permettant à la machine d’identifier et d’extraire, à partir d’un jeu de donnés, un ensemble de similarités : des modèles, utilisés par la suite pour faire des groupements et de la prédiction sur de nouveaux jeux de donnés.

On distingue deux types de machine learning : l’apprentissage supervisé : les données en entrée et en sortie sont fournies par les experts métiers. Ces données sont étiquetées afin de pouvoir être classifiées et d’établir une base d’apprentissage pour le futur. l’apprentissage non-supervisé : il s’agit pour la machine de trouver seule des modèles sous-jacents à partir de données non étiquetées

De la donnée brute à la donnée d’apprentissage

Au départ, les experts métier (notaires, étudiants en droit…) associent des “étiquettes” aux documents bruts à disposition, pour constituer les données d’apprentissage qui serviront à entraîner les algorithmes. Par exemple :

Donnée brute : données utilisables afin de répondre à une problématique métier (ex : le texte d’un contrat permettant d’identifier le type de contrat).

Label ou étiquette : réponse possible à cette problématique métier (ex : on identifie un permis de construire).

Donnée d’apprentissage : donnée brute associée à son label (ex : ce contrat est un permis de construire).

La phase d’apprentissage

Une fois ces données d’apprentissage constituées, les ingénieurs d’Hyperlex vont les associer à des algorithmes d’apprentissage pour bâtir des modèles entrainés qu’ils vont perfectionner au fur et à mesure jusqu’à obtenir le meilleur paramétrage. C’est à partir de ces modèles que l’IA devient capable de reconnaître seule les types de documents et les éléments clés qu’ils contiennent au cours de l’inférence.

Algorithme d’apprentissage : séquences d’opérations mathématiques sur une donnée d’apprentissage permettant de constituer un modèle entraîné.

Modèle entraîné : ensemble des paramètres d’un algorithme d’apprentissage, entraînés sur des données d’apprentissage. Il constitue une sorte de synthèse de la connaissance métier déduite des données d’apprentissage. Ce modèle est ensuite exploitable sur de nouvelles données via un algorithme d’inférence.

L’inférence : l’IA en action

L’inférence est l’opération qui consiste à associer une étiquette (par exemple: “permis de construire”) à des données brutes (par exemple : de nouveaux documents qu’on importe dans la dataroom) grâce à un modèle entraîné. Elle permet de créer des liens entre les différentes informations afin d’émettre une hypothèse ou d’en tirer une conclusion. Ici l’IA fonctionne de manière autonome (non-supervisé). L’utilisateur n’aura plus qu’à valider ses suggestions.

Algorithme d’inférence : séquences d’opérations mathématiques sur une donnée brute permettant la prédiction de son label.

Hyperlex : une IA au service des professions juridiques

Le processus d’apprentissage d’Hyperlex en synthèse

Dans le cadre du projet VictorIA, les études notariales partenaires participeront aux étapes de validation des suggestions de l’IA et d’entraînement.

LE SAVIEZ-VOUS ? Avant VictorIA, la Chambre des Notaires de Paris et Hyperlex ont déjà collaboré avec succès autour du projet VIDOC qui permet la consultation d’une base de données immobilières référençant l’usage de tous les biens immobiliers à Paris. 🔎 Découvrir le projet

Le savoir-faire et la technologie Hyperlex

Hyperlex est un expert reconnu de l’intelligence artificielle spécialisée dans l’analyse des documents juridiques. Sa technologie propriétaire traite quotidiennement des milliers de contrats d’entreprise afin de détecter et d’alerter sur la présence d’éléments importants tels que les clauses, les dates, les montants, les parties, etc.

Plusieurs innovations mises en oeuvre

  • Notre IA respecte les meilleurs standards de confidentialité : la société a développé une technologie cloud indépendante qui assure la sécurité des documents fournis grâce à un système de chiffrement innovant et certifié. Toutes les données de nos clients sont chiffrées et stockées dans des bases de données qui leur sont propres et sont hébergées en Europe.
  • Notre IA apprend vite : notre technologie ne nécessite qu’un faible nombre de données d’apprentissage. Ainsi, elle repose sur une intelligence artificielle semi-supervisée permettant de distinguer, de manière autonome, les documents et informations similaires au sein d’une base de données.
  • Notre IA s’exprime via une interface intuitive : conçue pour les professionnels du droit, notre interface logicielle est optimisée pour faciliter la lecture et l’analyse de documents juridiques.

👉 Vous souhaitez en savoir plus sur l’Intelligence Artificielle dans le traitements des documents juridiques ? Téléchargez notre livre blanc !

Télécharger le livre blanc