1. Introducción
Son muchos los proyectos de Procesamiento del Lenguaje Natural (NLP) en los que hemos trabajado en Scalian.
Hoy en este artículo del Centro de Excelencia de IA (CoE AI) no explicaremos un proyecto concreto, sino que expondremos los posibles usos del NLP en el sector legal, o LegalTech.
Sólo en el ámbito procesal en España se producen al año 2M de casos. El uso de la digitalización y de IA puede facilitar el procesamiento de esas cantidades de información mediante el uso de diversas técnicas según el estadio del proceso.
Actualmente vivimos un proceso de transformación digital que abarca todos los sectores, incluido el sector legal.
Hace años empezó a acuñarse el término Legaltech, abreviatura de Legal Technology, que se define como la utilización de tecnología en el ámbito legal para agilizar, optimizar y automatizar los procesos de las compañías.
La Inteligencia Artificial, el Big Data o el cloud computing son algunas de las tecnologías que pueden producir un impacto más importante en el sector legal. En concreto, el Machine Learning, gracias a su capacidad de aprendizaje automático y predicción, puede servir de ayuda para la toma de decisiones más precisas permitiéndoles agilizar las gestiones, automatizar los procesos y reducir los errores.
El Procesamiento del Lenguaje Natural (NLP) es un subconjunto de AI que procesa el lenguaje humano natural. Algunos de los ejemplos más familiares incluyen las sugerencias de búsqueda predictiva, los correctores ortográficos y el reconocimiento de voz.
Por su parte, el Big Data ofrece la posibilidad de procesar grandes volúmenes de datos, lo que permite obtener información valiosa que puede ayudar en la toma de decisiones y mejorar la experiencia de los clientes.
Otras tecnologías como el blockchain, que aportan una mayor seguridad en las transacciones, los bots o la robótica están adquiriendo cada vez un mayor protagonismo en el sector.
En este artículo nos centraremos en los casos de uso en los que se están aplicando este tipo de técnicas.
2. Casos de Uso
Actualmente los abogados están utilizando el NLP de diversas formas, algunas de ellas las explicamos a continuación:
La digitalización puede llevarse a cabo a través de un OCR, reconocimiento óptico de caracteres. Esto nos permite digitalizar documentos escaneados, faxes o fotografías de documentos y transformarlos a archivos de texto.
Todos los equipos legales necesitan una herramienta de OCR para que los acuerdos escaneados o enviados por fax puedan incorporarse a las soluciones modernas de gestión y análisis de documentos.
Existen algunos ejemplos de OCR’s que han sido creados para trabajar en el sector legal como por ejemplo linkSquares.
Una de las aplicaciones más populares y útiles de la NLP en derecho es la investigación jurídica. Llevar a cabo una investigación exhaustiva es esencial para todos los procesos legales, pero también es parte de por qué tardan tanto. La resolución de una denuncia por lesiones personales puede demorar hasta tres años , lo que puede desanimar a los clientes.
El procesamiento del lenguaje natural puede ayudar a acortar estos plazos al agilizar el proceso de investigación. Los motores de búsqueda legal impulsados por NLP pueden traducir un lenguaje sencillo a «jerga legal», lo que facilita la selección de documentos y casos relevantes. Los programas de NLP más avanzados pueden buscar conceptos, no solo palabras clave específicas, lo que ayuda a los abogados a encontrar lo que necesitan más rápido.
En este contexto, el análisis semántico permite encontrar la respuesta a una pregunta formulada en un documento. Por ejemplo, si en un conjunto de acuerdos de confidencialidad uno busca las ubicaciones geográficas de los tribunales designados para resolver disputas, estas solicitudes aislarán los pasajes relevantes.
Los programas de NLP pueden analizar un estudio de caso o documento y sugerir otros casos similares para que los revisen los abogados. Estas recomendaciones pueden ayudar a los abogados a comprender los precedentes de un problema de manera más rápida y completa.
Es difícil exagerar la importancia de la elección de palabras y la sintaxis en la ley. Cualquier vaguedad en un contrato u otro documento legal puede dar lugar a interpretaciones no deseadas. El NLP puede ayudar a los abogados a evitar estos errores al redactar documentos, protegiendo a sus clientes y su reputación.
Algunos programas de revisión de contratos pueden procesar documentos en 20 idiomas , lo que ayuda a los abogados de todo el mundo a comprender o redactar contratos. Otros pueden crear automáticamente plantillas basadas en una ley, un acuerdo o una política de empresa determinados.
Estas tecnologías ahorran tiempo a los abogados y les ayudan a garantizar una elección de palabras y una sintaxis precisas.
El trabajo legal es notoriamente intensivo, por lo que cualquier cantidad de automatización puede ser un alivio considerable para los abogados. Si bien la NLP en sí misma no es una tecnología de automatización, puede habilitar la automatización en algunas áreas. El ejemplo más popular de esta aplicación son los chatbots.
Los chatbots pueden brindar soporte las 24 horas, ayudando a estos clientes a obtener las respuestas que necesitan sin que los abogados tengan que trabajar horas extras. Estos mismos servicios también podrían responder a las preguntas iniciales de las personas, ayudándolos a dirigirse a los servicios que necesitan más rápido.
Algunas herramientas de automatización basadas en NLP pueden redactar versiones básicas de contratos. Otros servicios pueden organizar y archivar documentos automáticamente según el idioma que contengan. La automatización de estos procesos ahorra tiempo a los abogados, reduce el estrés y los ayuda a atender a más clientes.
Una de las aplicaciones de NLP más novedosas, pero más prometedoras en la ley es el análisis predictivo de resultados de casos. Los programas avanzados de NLP pueden analizar estudios de casos anteriores para construir modelos predictivos para una jurisdicción determinada. Estos algoritmos pueden entonces predecir cómo puede fallar un tribunal, lo que ayuda a los abogados a diseñar un argumento más efectivo.
Un estudio de 2016 creó un modelo de NLP que podía predecir con un 79 % de precisión lo que decidiría un tribunal en un caso determinado. Con años de investigación adicional y avances tecnológicos, es probable que los servicios similares actuales resulten aún más precisos. El uso de estos modelos para influir en el argumento de un abogado podría mejorar drásticamente sus posibilidades de éxito.
Dado que estos programas de NLP se basan en el aprendizaje automático, cuanto más los usen los abogados, más útiles serán. Con más casos para analizar, estos modelos predictivos serán cada vez más precisos.
En el área de gestión de contratos y licitaciones, el retorno de la inversión de las tecnologías NLP también se ha vuelto significativo.
En las grandes empresas, el examen de documentos legales y contractuales moviliza varios miles de días-hombre cada año en perfiles de expertos. El análisis semántico facilita el trabajo de los abogados corporativos al ayudarlos a identificar rápidamente los puntos de atención en una licitación o contrato, lo que reduce el tiempo y el esfuerzo de procesamiento de documentos.
Comentarios: Thales automatiza la lectura de licitaciones con NLP
El grupo Thales recibe miles de licitaciones por año, cada una con un promedio de 500 páginas. Los abogados son los encargados de estudiarlos y sintetizarlos en forma de nota legal de 5 o 6 páginas que permite a los gestores decidir si responden o no al Call for Licitation. Se ha puesto en marcha un proyecto piloto, validando el valor del Análisis Semántico para automatizar parcialmente esta tarea.
Thales está probando un Digital Lawyer junior para responder a licitaciones. (Artículo en francés)
3. Ejemplo de extracción de entidades (NER)
Vamos a presentar un ejemplo sencillo de aplicación de técnicas de NLP a documentos legales. En este caso vamos a crear un NER (name entity recognition) para extraer una serie de entidades.
Los NER son herramientas de procesamiento del lenguaje natural que pueden ayudar entender el contenido de un documento.
El objetivo de los NER es identificar entidades como personas, organizaciones, localizaciones, fechas,… Estas entidades pueden considerarse básicas y extenderse según el caso de uso.
Para nuestro ejemplo podemos definir una serie de entidades como:
- TRIBUNAL: Nombre del tribunal que ha dictado la sentencia actual si se extrae del Preámbulo. Nombre de cualquier tribunal mencionado si se extrae de sentencias judiciales.
- PETICIONARIO: Nombre de los peticionarios/apelantes/revisionista del caso actual.
- DEMANDADO: Nombre de los demandados/defensores/oposición del caso actual.
- JUEZ: Nombre de los jueces del caso actual si se extrae del preámbulo. Nombre de los jueces de los casos actuales y anteriores si se extrae de las sentencias.
- ABOGADO: Nombre de los abogados de ambas partes.
- FECHA: Cualquier fecha mencionada en la sentencia.
- ORG: Nombre de las organizaciones mencionadas en el texto aparte del tribunal. Por ejemplo, bancos, PSU, empresas privadas, estaciones de policía, gobierno estatal, etc.
- GPE: Ubicaciones geopolíticas que incluyen nombres de países, estados, ciudades, distritos y pueblos.
- ESTATUTO: Nombre del acto o ley mencionado en la sentencia.
- DISPOSICIÓN: Secciones, subsecciones, artículos, órdenes, reglas bajo un estatuto.
- PRECEDENTE: Todas las causas judiciales pasadas a las que se refiere la sentencia como precedentes. El precedente consta de los nombres de las partes + citación (opcional) o número de caso (opcional).
- NÚMERO DE CASO: Todos los demás números de casos mencionados en la sentencia (aparte del precedente) donde no se proporcionan los nombres de las partes y la cita.
- TESTIGO: Nombre de los testigos en el juicio actual.
- OTRA PERSONA: Nombre de todas las personas que no están incluidas en peticionario, demandado, juez y testigo.
El resultado de la aplicación de este tipo de técnicas podemos verlo en la siguiente imagen:

4. Conclusiones
El procesamiento del lenguaje natural ayuda tanto a los abogados, los jueces e incluso a los clientes.
El trabajo legal rara vez es sencillo, en los últimos años hemos visto como la falta de profesionales cualificados está haciendo que el número de casos se acumule en los despachos y que no lleguen a resolver en un breve periodo de tiempo, lo que puede ser frustrante tanto para los abogados como para sus clientes. Las herramientas de IA, y en especial el NLP, pueden ayudar a agilizar y mejorar el trabajo legal, asegurando mejores resultados para todos.
La dependencia del sector legal de un lenguaje preciso lo convierte en el lugar ideal para utilizar el NLP. Si bien este concepto aún se encuentra en sus primeras etapas, ya muestra un enorme potencial para los abogados y sus clientes.
5. Referencias
- Bues, M. (2019, May 17). 4 steps to make a law firm Machine Learning ready. ELTA – European LegalTech Association. Retrieved November 15, 2022, from https://europe-legaltech.org/4-steps-to-make-a-law-firm-machine-learning-ready/
- Guerreiro Nieto, M. (2022, May 25). La Importancia de Tener Un ner – IIC. Instituto de Ingeniería del Conocimiento. Retrieved November 15, 2022, from https://www.iic.uam.es/inteligencia/la-importancia-tener-ner/#:~:text=Los%20Named%20Entity%20Recognition%2C%20(NER,de%20una%20serie%20de%20documentos.
- Legal-NLP-EkStep. (2022). Legal-NLP-ekstep/legal_ner: OpenNyAI is a mission aimed at developing open source software and datasets to catalyze the creation of AI-powered solutions to improve access to justice in India. legal ner is one the AI component developed under this mission. GitHub. Retrieved November 15, 2022, from https://github.com/Legal-NLP-EkStep/legal_NER
- LinkSquares Team. (2021, December 20). What is OCR and why do legal teams need it? LinkSquares Blog. Retrieved November 15, 2022, from https://blog.linksquares.com/how-does-ocr-differ-between-softwares#:~:text=Lawyers%20deal%20with%20lots%20of,can%20read%20text%20in%20images.
- Maia Polo, Felipe & Mendonça, Gabriel & Parreira, Kauê & Gianvechio, Lucka & Cordeiro, Peterson & Ferreira, Jonathan & Lima, Leticia & Maia, Antônio & Vicente, Renato. (2021). LegalNLP — Natural Language Processing methods for the Brazilian Legal Language.
- Orosz, Tamás & Vági, Renátó & Márk, Csányi & Nagy, Daniel & Vadasz, Pal & István, Üveges & Megyeri, Andrea. (2021). Evaluating Human versus Machine Learning Performance in a LegalTech Problem. Applied Sciences. 10.3390/app12010297.