Hyperlex est une solution SaaS de gestion de contrats. Depuis sa création, Hyperlex développe sa propre intelligence artificielle. C’est grâce à cette IA que nous pouvons proposer notre service. C’est elle qui analyse les contrats et extrait les données importantes qu’ils contiennent pour vous faciliter le quotidien au travail. 

Il s’agit d’une technologie complexe et une équipe entière est dédiée à son développement et son amélioration au quotidien. 

Nous sommes très fiers de ce travail et souhaitons le mettre en lumière dans une série d’articles dédiés à leur expertise. Vous les trouverez dans la rubrique Tech. 

Pour mieux comprendre les écrits qu’ils seront amenés à publier, nous vous proposons ce premier article dédié à l’organisation de l’équipe Machine Learning d’Hyperlex. Puisse-t-il vous aider à comprendre les spécificités de leur métier et de leurs recherches.

Dans les coulisses de l’équipe Machine Learning d’Hyperlex

C’est quoi l’intelligence artificielle ?

L’intelligence artificielle regroupe toutes les techniques qui permettent de s’inspirer de la pensée humaine afin de créer des machines capables de soulager l’homme à résoudre des tâches complexes

On distingue deux types d’IA : 

  • l’IA symbolique, soit celle qui n’agit qu’en fonction des règles que lui a dicté l’humain,
  • l’IA par apprentissage, soit celle qui tente de donner du sens aux données d’entrées, détecter les signaux présents dans ces données, et qui peut apprendre à les reconnaître. Il s’agit du Machine Learning.

C’est cette dernière discipline qui est principalement utilisée chez Hyperlex. 

Machine learning et données

Le Machine Learning, c’est l’ensemble des techniques qui permettent d’identifier des corrélations (ou « patterns ») dans des jeux de données afin d’en tirer des modèles prédictifs.

Ensuite, à partir de ces modèles, la machine va pouvoir analyser des documents inconnus. On appelle cela des prédictions.

Sans données, pas de modèles ! C’est pourquoi la donnée, ou data, est essentielle dans le travail de notre équipe Machine Learning.

Chez Hyperlex, la donnée que l’on traite, c’est le contenu des contrats. C’est pourquoi l’équipe a besoin de legal experts, de juristes. Ce sont eux qui leur indiquent les spécificités et contraintes liées à leur expertise.

 

Comment s’applique le machine learning chez Hyperlex ?

Pour reconnaître ce que contiennent les contrats, on commence par appliquer un système d’OCR (Optical Character Recognition). Celui-ci permet de convertir une image en texte modifiable.

💡 Le saviez-vous ? Aujourd’hui, vous pouvez aussi utiliser ce genre de technologie sur certains smartphones ! Elle vous permet de copier-coller un texte contenu dans une image.

 

Après cette étape, l’équipe utilise une forme de Machine Learning qui s’appelle Natural Language Processing (NLP) ou traitement automatique du langage naturel. Elle consiste à traiter et analyser du texte brut (de n’importe quel type de document) et d’en tirer des conclusions. En somme, elle peut comprendre le contenu de ce texte, repérer certains éléments d’intérêts ou encore identifier des séquences qui reviennent.

C’est grâce à lui que notre solution de contract management reconnaît les caractéristiques contenues dans vos contrats et vous accompagne à chaque étape du cycle de vie de ces derniers !

Ce schéma permet de comprendre comment elle fonctionne.

 

 

🔎 Pour aller plus loin : notre équipe ML n’utilise pas que le NLP, mais passe également par l’analyse d’image. Vous pouvez en découvrir plus dans cet article :
Comment fonctionne l’analyse d’image dans la gestion de contrats ?

 

A quoi ressemble l’équipe Machine Learning ?

L’équipe Machine Learning d’Hyperlex a une mission : améliorer et faire évoluer son intelligence artificielle pour proposer un service toujours plus performant !

Cela se traduit par le développement de nouvelles fonctionnalités comme par exemple la reconnaissance de plus en plus de langues. 

Pour ce faire, l’équipe suit un processus en cycle, en 4 étapes :

  • L’acquisition des données, ou Data Acquisition. L’équipe commence par travailler avec des Legal Experts pour annoter la donnée, mais également avec l’équipe liée au produit afin de définir les besoins des utilisateurs. Ces données sont ensuite analysées pour contrôler leur qualité grâce à un outil en interne. Puis, elles sont stockées dans ce que l’on appelle un Lac de Données (Data Lake en anglais).
  • L’entraînement du modèle, ou Training. Il consiste à récupérer les données issues de ce lac, afin d’entraîner plusieurs modèles. Ces derniers permettent de nourrir notre technologie et la rendre de plus en plus performante.
  • L’évaluation du modèle, qui consiste à tester la fiabilité du meilleur modèle retenu. Ce nouveau modèle est ensuite comparé avec le modèle existant de sorte à vérifier sa qualité. Il doit être meilleur sur les données historiques et récentes.
  • Le déploiement et suivi, qui consiste à surveiller toutes les prédictions de la machine afin d’identifier d’éventuelles régressions puis à prendre en compte les retours d’activité des utilisateurs. 

💡 Le saviez-vous ? Lorsque vous précisez le type de clause que vous examinez dans Hyperlex, vous participez à l’amélioration de notre machine. Notre équipe prend en compte ces retours !

 

Ce travail d’itération et de recherche complexe est mené par 4 groupes au sein même de l’équipe Machine Learning et sous la responsabilité de Romain Vial.

 

Le rôle du Core Model et du Business Model dans l’équipe Machine Learning 🧠

Alaa, Fuqi, Ahmed et Hicham sont Data Scientists. Leur métier consiste à :

  • concevoir des solutions métiers en combinant différents modèles ; 
  • imaginer de nouvelles architectures pour améliorer les modèles existants ;
  • développer des modèles réutilisables pour différents problèmes métiers.

Le rôle du ML Ops dans l’équipe Machine Learning 🧑‍💻

Akim, Subaandh et Amine sont Data Engineers. Ils sont responsables du processus de création de modèles, durant toutes les étapes d’apprentissage de la machine.

C’est l’équipe ML Ops qui fournit les outils nécessaires pour déployer toutes les fonctionnalités liées au Machine Learning. Ils sont ensuite garants de la stabilité de ces services.

Le rôle du pôle Data dans l’équipe Machine Learning 💻

Estelle est Data Analyst. Elle s’occupe d’analyser les données regroupées et de contrôler leur pertinence et leur qualité. 

De plus, elle identifie les “trous dans la raquette” en repérant les clauses ou les attributs que les modèles ne gèrent pas correctement. Cela lui permet de relancer l’annotation et d’améliorer les modèles. 

 

La rubrique Tech Lex

Comme vous pouvez le voir, développer une intelligence artificielle est une technologie complexe. Nous souhaitons familiariser nos lecteurs et/ou utilisateurs à cette dernière.

Chaque mois, un article sera dédié à la technologie de pointe développée par Hyperlex et écrit par nos collaborateurs. Experts dans leur domaine, ces derniers ont à cœur de partager ce qui fait leur quotidien.

Des contenus plus simples, comme celui-ci, seront également accessibles. 

Que vous soyez un simple curieux, que vous souhaitiez rejoindre les équipes d’Hyperlex ou comprendre notre fonctionnement en interne, les articles de notre nouvelle rubrique Tech Lex vous sont dédiés.

 

Vous voulez suivre Hyperlex de plus près ?
Inscrivez-vous à notre newsletter !

Je m’inscris à la newsletter !

 

A lire également :