Hyperlex ist eine SaaS-Lösung für die Verwaltung von Verträgen. Seit ihrer Gründung, Hyperlex entwickelt seine eigene künstliche Intelligenz. Diese KI ist der Grund, warum wir unseren Service anbieten können. Sie analysiert Verträge und extrahiert wichtige Daten aus ihnen, um Ihnen den Arbeitsalltag zu erleichtern.
Es handelt sich um eine komplexe Technologie, und ein ganzes Team widmet sich ihrer Entwicklung und täglichen Verbesserung.
Wir sind sehr stolz auf diese Arbeit und möchten sie in einer Reihe von Artikeln hervorheben, die ihrem Fachwissen gewidmet sind. Sie finden sie in der Rubrik Tech.
Um ein besseres Verständnis ihrer Arbeit zu erlangen, möchten wir Ihnen diesen ersten Artikel über die Organisation des Hyperlex Machine Learning Teams vorstellen. Er wird Ihnen helfen, die Besonderheiten ihres Berufs und ihrer Forschung zu verstehen.
Was ist künstliche Intelligenz?
Künstliche Intelligenz umfasst alle Techniken, mit denen man sich das menschliche Denken zum Vorbild nimmt, um Maschinen zu entwickeln, die dem Menschen die Lösung komplexer Aufgaben abnehmen können.
Es werden zwei Arten von KI unterschieden:
- die symbolische KI, also diejenige, die nur nach den Regeln handelt, die ihr der Mensch diktiert hat,
- Lernende KI, d. h. KI, die versucht, den Eingabedaten einen Sinn zu geben, Signale in diesen Daten zu erkennen und zu lernen, wie man sie erkennt. Hierbei handelt es sich um Machine Learning.
Die letztgenannte Disziplin wird bei Hyperlex hauptsächlich eingesetzt.
Machine Learning und Daten
Machine Learning umfasst alle Techniken, mit denen Korrelationen (oder "Muster") in Datensätzen identifiziert werden können, um daraus Vorhersagemodelle abzuleiten.
Anschließend wird die Maschine anhand dieser Modelle in der Lage sein, unbekannte Dokumente zu analysieren. Das nennt man Vorhersagen.
Ohne Daten keine Modelle! Deshalb sind Daten, oder Data, für die Arbeit unseres Machine-Learning-Teams von entscheidender Bedeutung.
Bei Hyperlex sind die Daten, die wir verarbeiten, der Inhalt von Verträgen. Deshalb braucht das Team Legal Experts, also Juristen. Sie sind es, die sie auf die Besonderheiten und Einschränkungen hinweisen, die mit ihrem Fachwissen verbunden sind.
Wie wird Machine Learning bei Hyperlex angewendet?
Um zu erkennen, was in den Verträgen steht, wird zunächst ein OCR-System (Optical Character Recognition) angewendet. Dieses Verfahren wandelt ein Bild in bearbeitbaren Text um.
💡 Wusstest du das? Heutzutage können Sie diese Art von Technologie auch auf einigen Smartphones nutzen! Sie ermöglicht es Ihnen, einen in einem Bild enthaltenen Text zu kopieren und einzufügen.
Nach diesem Schritt verwendet das Team eine Form des maschinellen Lernens, die als Natural Language Processing (NLP) oder automatische Verarbeitung natürlicher Sprache bezeichnet wird. Sie besteht darin, reinen Text (aus jeder Art von Dokument) zu verarbeiten und zu analysieren und daraus Schlussfolgerungen zu ziehen. Kurz gesagt, sie kann den Inhalt dieses Textes verstehen, bestimmte interessante Elemente ausfindig machen oder auch wiederkehrende Sequenzen identifizieren.
Er ist der Grund dafür, dass unsere Vertragsmanagementlösung die in Ihren Verträgen enthaltenen Merkmale erkennt und Sie in jeder Phase des Vertragslebenszyklus begleitet!
Dieses Schema hilft Ihnen zu verstehen, wie sie funktioniert.
🔎 Weiterführende Informationen: Unser ML-Team verwendet nicht nur NLP, sondern geht auch den Weg über die Bildanalyse. In diesem Artikel können Sie mehr darüber erfahren :
Wie funktioniert die Bildanalyse im Vertragsmanagement?
Wie sieht das Machine-Learning-Team aus?
Das Machine Learning Team von Hyperlex hat eine Mission: seine künstliche Intelligenz zu verbessern und weiterzuentwickeln, um einen immer besseren Service zu bieten!
Dies schlägt sich in der Entwicklung neuer Funktionen nieder, wie z. B. der Erkennung von immer mehr Sprachen.
Dazu folgt das Team einem zyklischen Prozess in vier Schritten:
- Die Datenerfassung oder Data Acquisition. Das Team arbeitet zunächst mit Legal Experts zusammen, um die Daten zu annotieren, aber auch mit dem Produktteam, um die Bedürfnisse der Nutzer zu definieren. Die Daten werden dann mithilfe eines internen Tools analysiert, um ihre Qualität zu überprüfen. Dann werden sie in einem sogenannten Data Lake gespeichert.
- Das Modelltraining, auch Training genannt. Hierbei werden Daten aus dem See gesammelt, um verschiedene Modelle zu trainieren. Diese Modelle dienen als Grundlage für unsere Technologie und machen sie immer leistungsfähiger.
- Die Modellbewertung, bei der die Zuverlässigkeit des besten ausgewählten Modells getestet wird. Dieses neue Modell wird dann mit dem bestehenden Modell verglichen, um seine Qualität zu überprüfen. Es muss sowohl bei historischen als auch bei aktuellen Daten besser sein.
- Einsatz und Überwachung, bei der alle Vorhersagen der Maschine überwacht werden, um mögliche Rückschritte zu erkennen, und dann das Feedback der Nutzer berücksichtigt wird.
💡 Wussten Sie schon? Wenn Sie angeben, welche Art von Klausel Sie in Hyperlex untersuchen, tragen Sie dazu bei, unsere Maschine zu verbessern. Unser Team berücksichtigt diese Rückmeldungen!
Diese komplexe Iterations- und Forschungsarbeit wird von vier Gruppen innerhalb des Machine-Learning-Teams und unter der Verantwortung von Romain Vial durchgeführt.
Die Rolle des Core Model und des Business Model im Machine Learning Team 🧠🧠.
Alaa, Fuqi, Ahmed und Hicham sind Data Scientists. Ihr Beruf besteht darin, :
- Geschäftslösungen entwerfen, indem sie verschiedene Modelle kombinieren ;
- sich neue Architekturen ausdenken, um bestehende Modelle zu verbessern ;
- wiederverwendbare Modelle für verschiedene Geschäftsprobleme entwickeln.
Die Rolle des ML Ops im Machine Learning Team 🧑💻.
Akim, Subaandh und Amine sind Data Engineers. Sie sind für den Prozess der Modellerstellung während aller Phasen des maschinellen Lernens verantwortlich.
Das ML Ops-Team stellt die Tools zur Verfügung, die für den Einsatz aller mit Machine Learning verbundenen Funktionen erforderlich sind. Anschließend sind sie für die Stabilität dieser Dienste verantwortlich.
Die Rolle des Data Pols im Machine Learning Team 💻.
Estelle ist Datenanalystin. Sie kümmert sich darum, die zusammengefassten Daten zu analysieren und ihre Relevanz und Qualität zu überprüfen.
Darüber hinaus identifiziert sie "Löcher im Schläger", indem sie Klauseln oder Attribute ausfindig macht, die die Vorlagen nicht richtig handhaben. Dies ermöglicht ihr, die Annotation erneut zu starten und die Vorlagen zu verbessern.
Die Rubrik Tech Lex
Wie Sie sehen können, ist die Entwicklung einer künstlichen Intelligenz eine komplexe Technologie. Wir möchten unsere Leser und/oder Nutzer mit dieser vertraut machen.
Jeden Monat wird ein Artikel der von Hyperlex entwickelten Spitzentechnologie gewidmet und von unseren Mitarbeitern verfasst. Als Experten auf ihrem Gebiet liegt es diesen am Herzen, das zu teilen, was ihren Alltag ausmacht.
Auch einfachere Inhalte wie dieser werden zugänglich sein.
Ob Sie einfach nur neugierig sind, sich den Teams von Hyperlex anschließen oder unsere internen Abläufe verstehen möchten, die Artikel in unserer neuen Rubrik Tech Lex sind Ihnen gewidmet.
Möchten Sie Hyperlex genauer kennenlernen?
Abonnieren Sie unseren Newsletter!
Ich melde mich für den Newsletter an!
Lesen Sie auch :