top of page
Writer's pictureLegal Business World

Artificial Intelligence heeft de toekomst. Ook in de juridische wereld


Artificial Intelligence (AI) is momenteel het buzzword in de juridische sector. Het was dan ook geen verrassing dat Legal Week 2018 – het jaarlijkse LegalTech event in New York - volledig in het teken van AI stond.

In de openingstoespraak gaven Nicholas Bruch en Steve Kolavan, beiden senior analisten bij ALM Legal Intelligence, direct de belangrijkste reden voor de enorme interesse in het gebruik van AI om het juridische proces te automatiseren: tussen 1995 en 2007 verdubbelde het uurtarief van advocaten. Hoeveel pijn dat kan doen, was te lezen in een recent artikel uit de Wall Street Journal met de pakkende titel: ‘Legal Fees Cross New Mark: $1,500 per hour’.

Het is dan ook niet verwonderlijk dat alternatieven zoals investeringen in de eigen interne juridische afdeling of externe dienstverleners sterk zijn toegenomen. Het gebruik van AI is een ander en zeer effectieve mogelijkheid om de juridische kosten te verlagen.

Vooral in het eDiscovery proces en bij andere grootschalige dataonderzoeken hebben AI-technieken zichzelf al uitvoerig bewezen. Bij dataonderzoek toont wetenschappelijk bewijs consequent aan dat AI niet alleen veel sneller is dan menselijke beoordeling, maar vooral ook kosten effectiever. Machines zijn daarnaast veel beter, dus het is logisch dat advocatenkantoren deze technologie inzetten om betere kwaliteit te bieden aan hun klanten voor een meer concurrerende prijs.

eDiscovery met minder mensen en meer machines

In het panel ‘A Day in the Life of a Futurist Jurist Empowered by Artificial Intelligence: An Ethical Dilemma’ met onder andere Ralph Losey, directeur bij advocatenkantoor Jackson Lewis en Martin Tully, procespartner bij advocatenkantoor Akerman, werd een beeld geschetst van eDiscovery in 2048 met minder mensen en meer machines. Vooral in eDiscovery laat de voortdurende groei van data (door een van onze klanten ‘Terrible Bytes’ genoemd) ons geen andere keus dan met machines te bestrijden wat machines produceren. Zeker nu de scheidslijn tussen bedrijfsgegevens en persoonlijke data gestaag verdwijnt en de datasets voor een eDiscovery of ander grootschalig gegevensonderzoek steeds meer verschillende vormen data bevatten die ook nog eens overal vandaan verzameld moeten worden.

Ik onderschrijf deze visies en ambities volledig. We moeten zoveel mogelijk van het eDiscoveryproces automatiseren, te beginnen met de mogelijkheid om direct te kunnen verzamelen uit die veelheid van bronnen, bijvoorbeeld uit Office 365. Daarna hebben we sterke, innovatieve technologieën nodig om deze gegevens grondig te verwerken, zodat we de hoeveelheid data zoveel mogelijk reduceren voordat we deze aan de interne of externe beoordelaars voorleggen. En ook het beoordelingsproces, het reviewen, kunnen we met geavanceerdere hulpmiddelen drastisch versnellen.

Begin met het gebruik van de modernste algoritmen

Tijdens Legal Week had ik ook ruim de gelegenheid om verschillende producten te bekijken. Ik ben wat verrast dat er nog steeds veel gebruik wordt gemaakt van inferieure en verouderde tekstclassificatie algoritmen voor Technology Assisted Review (TAR). Dit resulteert namelijk in meerdere problemen en inefficiënties, terwijl er veel betere algoritmen in de steeds groter wordende datasets gebruikt kunnen worden. Even technisch voor de liefhebbers:

  • We weten al jaren dat Non-Negative Matrix Factorization (NMF) een veel beter alternatief is voor algoritmen zoals k-NN, Latent Semantic Indexing (LSI), de probabilistische variant PLSA en zelfs LDA (die bepaalde wiskundige bewerkingen in clustering mogelijk maakt, die niet kunnen worden gebruikt wanneer het om tekst gaat) voor conceptonderzoek.

  • Het gebruik van lineaire regressie voor TAR verreist zeer gebalanceerde documentsets en is erg gevoelig voor verkeerde trainingsdata in vergelijking met bijvoorbeeld Support Vector Machines.

  • De Early Case Assessment (ECA) oplossingen die ik heb bekeken, zijn zeer beperkt en alleen te gebruiken om het volume en type data te bepalen. Niet om ook al een inhou-delijke inschatting van de zaak te kunnen maken. Tools die worden gebruikt in de inlichtingenindustrie, zoals modellering van onderwerpen, detectie van gebeurtenissen, community detectie en de ​​detectie van anomalieën, worden in de meeste eDiscovery-oplossingen nog helemaal niet gebruikt.

Wanneer we streven naar meer automatisering en intelligentie in eDiscovery, moeten we geavanceerde algoritmen gebruiken, simpelweg omdat hun kwaliteit zoveel beter is. Kwaliteit staat voorop als we door de gebruikers geaccepteerd willen worden. Zeker nu eDiscovery nog complexer wordt door nieuwe regelgeving zoals de GDPR.

AI voor de juridische markt

AI wordt in de juridische wereld al op grote schaal ingezet bij onderzoeken gerelateerd aan mededinging, M&A, omkoping, zorg-, milieu-, voedsel- of financiële fraude. Of bij internationale arbitrage over transacties, aansprakelijkheid, intellectueel eigendom, verzekeringskwesties, commerciële contracten, herstructureringen en massaschades.

Ook in de rechtspraak worden zelflerende computers al op grote schaal ingezet voor het razendsnel doorzoeken en analyseren van grote hoeveelheden tekstuele gegevens. Door zaakdossiers of jurisprudentie te “lezen”, analyseren en ordenen, kan de computer de kerngegevens extraheren en hiermee gaan redeneren. Op basis van deze redeneringen is een computer prima in staat om de uitspraak in bepaalde rechtszaken te voorspellen, de beste advocaat te selecteren en volgens professor Jaap van den Herik, binnenkort in staat om zelfs een rechter te vervangen.

Te veel data en cognitieve beperkingen

We kunnen er niet meer omheen dat erin diverse juridische toepassingen gewoon te veel data is opgenomen. Iedere zoekopdracht, hoe goed dan ook geeft te veel documenten om te bekijken. Je weet nooit exact wat je krijgt of wat je mist. Je weet niet precies waar je op moet zoeken en maakt spellingsfouten of gaat afwijken. Bovendien is het doorzoeken van data tijdrovend, saai en vervelend werk. Wij mensen hebben cognitieve beperkingen wanneer we grote hoeveelheden data moeten verwerken en daaruit inzichten moeten halen. We zijn gewoon niet geschikt om succesvol grote volumes data te synthetiseren.

Ondersteuning vanuit AI bij de organisatie, analyse en interpretatie van de feiten van dit soort grote dataverzamelingen moet ons in de toekomst helpen. Alleen dan kunnen we de werkdruk verminderen en de kwaliteit blijven leveren die van een bedrijfsjurist of advocaat wordt verwacht. Want succes begint met een begrijpelijke presentatie van de feiten. Ook als die feiten verstopt zitten in die enorme berg data.

In de juridische wereld ligt een mooie toekomst voor AI.

Een machine kun je leren om patronen en verbanden te ontdekken in grote datasets. Aan de hand van zogenaamde trainingsdata wordt een classificatiesysteem getraind. Nieuwe stukjes data worden vervolgens geclassificeerd aan de hand van (latente) patronen, die ontdekt zijn in de trainingsdata. Zo wordt het na genoeg training uiteindelijk mogelijk om het gedrag van nieuwe data te voorspellen. En zo kun je een computer trainen om documenten te organiseren en analyseren. Zoals eerder gezegd, uit de praktijk en doorlopend wetenschappelijk onderzoek blijkt dat de computer het vaak vele malen beter en consistenter doet dan mensen. Automatisering biedt de bedrijfsjurist en advocaat daarom juist kansen. Saai, arbeidsintensief werk of taken die eigenlijk overbodig zijn, worden veel sneller uitgevoerd door het te automatiseren. Zo kan de bedrijfsjurist en advocaat zich focussen op de meer strategische taken en ervoor zorgen dat hij of zij snel kan reageren op vragen van cliënten, vanuit de board of andere stakeholders omdat de informatie die daarvoor nodig is snel inzichtelijk is te krijgen.

bottom of page