Sie werden "Data Scientists" genannt und sind Teil des Machine Learning. Ihre Aufgabe ist es, die KI aufzubauen, zu pflegen und weiterzuentwickeln, mit der die Verwaltung und Analyse von Verträgen automatisiert werden kann. Wer sind sie? In unserer Serie über den Blick hinter die Kulissen eines Legaltech-Unternehmens stellen uns Ahmed und Romain, Data Scientists bei Hyperlex, ihren Beruf und ihren Alltag vor, um uns zu helfen, die Funktionsweise und die Anwendungen von Machine Learning im Rechtsbereich zu verstehen. Treffen Sie das Expertenteam hinter der Software.

 

Können Sie Ihren Werdegang vorstellen und was Sie dazu motiviert hat, sich einem Legaltech wie Hyperlex anzuschließen?

Ahmed: Ich habe vor zwei Jahren nach meinem Abschluss an der Ingenieurschule mit Hyperlex begonnen. Das Thema hat mich sehr angesprochen, da ich bereits an der Analyse und Auswertung eines großen Textkorpus gearbeitet hatte. Es war die Gelegenheit, am Stand der Technik von NLP im juristischen Bereich zu arbeiten: Klauselerkennung, Dokumentenklassifizierung, Extraktion von Informationen aus Verträgen usw. Ich war sehr zufrieden mit meiner Arbeit.

 

🔎 WAS IST NLP? Natural Language Processing, oder auf Deutsch automatische Verarbeitung natürlicher Sprache, ist die Fähigkeit eines Computerprogramms, menschliche Sprache zu verstehen.

NLP gehört zu den Technologien der künstlichen Intelligenz und besteht darin, reinen Text zu verarbeiten und zu analysieren, um eine Reihe von Aufgaben zu erfüllen: zu verstehen, worum es in dem Text geht, Elemente in dem Text zu markieren, wiederkehrende Sequenzen zu identifizieren...

Im Gegensatz zu einem Formular ist ein reiner Text nicht immer präzise, er kann sogar mehrdeutig sein, was Komplexität mit sich bringt. Seine sprachliche Struktur umfasst mehrere Dimensionen, nämlich Syntax, Grammatik und Semantik, die das NLP entschlüsseln soll.

 

Romain: Ich hatte die Gelegenheit, künstliche Intelligenz und Machine Learning während eines Gap Years an einer Ingenieurschule zu entdecken, das mir ermöglichte, Forschungspraktika in diesem Bereich zu absolvieren und mich von Anfang an zu spezialisieren. Die Begegnung mit Hyperlex erfolgte zufällig im Internet ... sich diesem Projekt anzuschließen, war eine ganz natürliche Sache.

 

Warum rechtlich?

A: Es war nicht das Juristische im eigentlichen Sinne, das mich angezogen hat. Im Bereich der Textanalyse kommen Verträge in großer Zahl vor und sind darüber hinaus relativ formatierte Dokumente mit impliziten und expliziten Regeln: Sie sind also sehr gute Kandidaten für Machine Learning. Man hat das Gefühl, dass man mit KI in diesem Bereich interessante Dinge erreichen kann.

A: Das Rechtswesen ist ein anspruchsvolles und interessantes Gebiet, um Methoden des Textverständnisses anzuwenden. Rechtliche Informationen sind komplex und von entscheidender Bedeutung. Es steht viel auf dem Spiel. Nehmen Sie zum Beispiel Beträge und Fälligkeitsdaten. Hier kommt NLP ins Spiel: Es hilft, Schlüsselelemente im Vertrag zu finden.

 

Welche verschiedenen Berufe gibt es im Bereich Machine Learning? Können Sie uns ein wenig mehr über Ihr Team erzählen?

Unser Team besteht aus drei Profilen und teilt seine Zeit zwischen F&E und Kundenprojekten auf.

  • Research Scientists: Forscher, die sich mit eher theoretischen Themen beschäftigen. Ihre Aufgabe ist es, Modelle zu erstellen und neue Wege zu entwerfen, um Daten zu extrahieren.
  • Data Engineers: Sie implementieren und setzen Machine-Learning-Algorithmen(1) ein.
  • Data Scientists: Sie stellen die Verbindung zwischen der theoretischen Forschung und der angewandten Welt her. Sie integrieren die beruflichen Zwänge, setzen Algorithmen in die Praxis um, indem sie sehr theoretische Konzepte an ihre Branche anpassen, bereiten die Arbeit für die Dateningenieure vor... Sie müssen also die Forschung auf der einen Seite und die Bedürfnisse der Branche auf der anderen Seite gut verstehen.

 

Was ist Machine Learning und wie funktioniert es?

Hierbei handelt es sich um Techniken, die es ermöglichen, eine Reihe von verborgenen Ähnlichkeiten in einem Datensatz zu identifizieren und so Muster zu erkennen: Man spricht von "Patterns". Die Maschine lernt und entwickelt sich weiter. Sie nutzt diese Muster, um Ranglisten zu erstellen und Vorhersagen für neue Datensätze zu treffen.

→ Lesen Sie unseren Artikel über die Funktionsweise von KI im Vertragsmanagement.

Der Nerv des Krieges sind Daten. Denn um Korrelationen zwischen Daten zu finden, müssen erst einmal Daten vorhanden sein! Diese Daten werden zunächst von den Fachleuten, d. h. den Juristen, geliefert. Nur sie können den Data Scientists die Einschränkungen und Besonderheiten ihres Fachgebiets mitteilen: was den Unterschied zwischen zwei Verträgen, zwei Klauseln, zwei Rechtsbegriffen usw. ausmacht. Anschließend wird das maschinelle Lernen in der Lage sein, Ähnlichkeiten innerhalb eines Satzes von Verträgen zu identifizieren und die verschiedenen typischen Elemente automatisch zu erkennen. Das ist es, was dem Benutzer, der mit Massen von Verträgen umgeht, Zeit und Übersicht verschaffen wird.

 

🤔 "MACHINE LEARNING", "KÜNSTLICHE INTELLIGENZ"... WAS SONST? Künstliche Intelligenz umfasst viele Dinge wie Robotik, Machine Learning, Optimierungsansätze usw. Sie ist sozusagen die "Mainstream"-Bezeichnung für all diese Techniken. Machine Learning bezeichnet den algorithmischen und computergestützten Baustein der KI.

 

Ein Nutzer kann die Maschine selbst trainieren und sie dann weiterentwickeln...

Ja. In der Hyperlex-Schnittstelle werden dem Benutzer zum Zeitpunkt Null bereits trainierte Modelle zur Verfügung gestellt, aber er hat auch die Möglichkeit, Modelle an seinen eigenen Verträgen zu trainieren, indem er seine Dokumente mit Anmerkungen zu den Informationen versieht, die ihn besonders interessieren. Indem er seine Übersichtsblätter bestätigt, ermöglicht er der KI zu lernen und ihm später noch genauere und schnellere Ergebnisse zu liefern.

Parallel dazu wird sich unser Customer Success Team darum kümmern, die KI während derOnboarding-Phase auf die Besonderheiten der Verträge des Kunden zu trainieren, um ihm eine perfekt geübte Lösung für seine Vertragsbibliothek zu liefern.

 

Wie interagieren Sie mit dem Customer Success? Können Sie uns ein Beispielprojekt nennen?

Wir greifen auf der Ebene der Übernahme von Bestehendem ein. Zu Beginn identifiziert der Customer Success gemeinsam mit dem Kunden die Merkmale, die er in seinen Verträgen verfolgen möchte, um die Maschine darauf zu trainieren, diese Merkmale zu erkennen. Das Machine-Learning-Team richtet die kundenfallspezifischen Tools ein, damit der Customer Success diese Übernahme so schnell und effizient wie möglich durchführen kann.

Jeder Anwendungsfall kann uns helfen, neue Funktionen zu implementieren, die wir später in Hyperlex einsetzen werden. Dies trägt zur Skalierbarkeit der Lösung bei, die es uns ermöglicht, eine immer zuverlässigere und besser trainierte API zu liefern.

 

Wie viele Verträge sind nötig, um eine KI zu trainieren?

Um Muster erkennen zu können, braucht die KI natürlich mehr als einen Vertrag. Aber es gibt keine starre Zahl, einfach weil es vom Problem, von der Aufgabe abhängt, die es zu lösen gilt. Man muss die Variabilität, die Komplexität und die Qualität des Mediums berücksichtigen - beim letzten Punkt muss man die OCR-Komponente(2) berücksichtigen.

 

Was sind die Qualitäten eines guten Data Scientists?

Ehrlich und pragmatisch mit den Daten umgehen. Um keine Fehler zu machen, muss man sich bewusst sein, dass der Bereich des Machine Learning noch keine perfekten Ergebnisse ermöglicht, er ist entwicklungsfähig. Deshalb muss der Data Scientist kreativ und ehrgeizig sein können: Es gibt noch viel zu tun. Es gibt viele Möglichkeiten, ein Problem zu "knacken", die Kunst besteht darin, sich die Lösung vorzustellen.

Ein Data Scientist ist nicht dazu da, ein Theorem zu beweisen, aber er muss in der Lage sein, neue Entwicklungen in diesem Bereich zu verstehen, um zu sehen, ob sie in seinem Fall anwendbar sind. Dies erfordert neben dem mathematischen, theoretischen und technischen Hintergrund auch eine ständige Beobachtung.

 

Die großen Herausforderungen dieses Berufs in der Rechtsbranche?

A: Die Zuverlässigkeit ständig optimieren. Alle Algorithmen haben Stufen der "Genauigkeit", was bedeutet, dass sie sich irren können. Im rechtlichen Kontext kann man es sich jedoch nicht leisten, dem Nutzer eine falsche Information zu geben oder ihn eine wichtige Information verpassen zu lassen. Es ist eine echte Herausforderung für uns, Werkzeuge mit dem höchsten Grad an Zuverlässigkeit zu liefern.

A: Die Interaktion zwischen Mensch und Maschine. Wenn der Mensch einen Fehler macht, weiß er nicht, dass er einen Fehler macht. Wenn die Maschine einen Fehler macht, haben wir Hinweise, die uns das zeigen. Und wir können sie nutzen! Hier geht es um einen transparenten Ansatz: Ungenauigkeiten für den Nutzer sichtbar machen, z. B. über Vertrauens-Scores, um die Arbeit der Automatisierung noch zuverlässiger zu machen. Was man verstehen muss, ist, dass die Maschine die Analyse unterstützt: Indem sie dem Nutzer die Schlüsselinformationen vorschlägt, die sie in seinen Verträgen identifiziert, versetzt sie ihn in eine Kontrollposition.

💡 WUSSTEN SIE SCHON? Die Automatisierung spart nicht nur Zeit, indem sie die manuelle Eingabe von Schlüsselinformationen in Ihre Verträge überflüssig macht. Sie hilft auch, Fehler zu reduzieren, indem sie ungewöhnliche Klauseln und Daten in Ihren Dokumenten identifiziert. Unterstützt durch künstliche Intelligenz finden Sie leicht versteckte Risiken und Chancen in Ihren Verträgen.→.

Ein Sieg ist für Sie wann...?

Aus Projektsicht: Wenn ein Kunde am Ende eines Onboardings seine Begeisterung zum Ausdruck bringt, diesen kleinen "Wow"-Effekt, wenn er spürt, dass die Maschine seinen Bedarf gut erfüllt. Aus der Perspektive der Forschung: Wenn wir eine erstaunliche Entdeckung machen, neue Techniken testen und sehen, dass sie in unseren Anwendungsfällen gut funktionieren. Dann hat man das Gefühl, dass man einen Schritt weiter gekommen ist.

 

Eine Botschaft an Juristen, die die Installation einer KI-Lösung in ihrer Rechtsabteilung in Betracht ziehen?

A: Bevor man eine "KI" einrichtet, sollte man sich über ihre Grenzen informieren und sich fragen: "Kann sie mir wirklich Zeit sparen?". Eine KI zu installieren, ohne sie dahinter zu nutzen, ist schade. Eine KI einzusetzen, bedeutet an sich schon, aktiv an Innovationen im Rechtsbereich mitzuwirken. Darüber hinaus sollte man sich die Zeit nehmen, die internen Prozesse so zu überdenken, dass sie den technologischen Baustein in den Alltag des Juristen integrieren.

A: Bevor man loslegt, sollte man die Aufgaben identifizieren, die systematisch anfallen (z. B. das Ausfüllen einer Excel-Datei mit den Daten des Inkrafttretens): Bei dieser Art von Aufgaben wird die Automatisierung am nützlichsten sein. Die KI ist zwar nicht dazu bestimmt, einen Rechtsbegriff bis ins Detail zu verstehen, aber sie ist in der Lage, sofort die genauen Klauseln zu finden, in denen der Jurist seine Analyse durchführen muss.

 

Haben Sie Lust, mehr über KI in der Vertragsverwaltung und -analyse zu erfahren?
Hier geht's lang 👇.

Ich lade das Weißbuch herunter!

 

Sehen Sie sich das Interview mit unserer Head of Product gleich hier an: Interview mit Silvana de Santis, Head of Product 💖.