"No puedo dejar de pensar en ellos cuando veo que ciertas oficinas de abogados se precian de no conocer límites,...
Harvard y su Caselaw Access Project
«Se requirió de 6 bibliotecarios a tiempo completo, por turnos, además de un escáner de alta velocidad, un cortador hidráulico y una máquina selladora al vacío…»
M. Fernanda Villegas / Matías Aránguiz - 29 noviembre, 2019
María Fernanda Villegas / Matías Aránguiz
Caselaw Access Project es uno de los proyectos del Library Innovation Lab, cuyo principal objetivo es hacer accesible a la población millones de decisiones judiciales de varias jurisdicciones de Estados Unidos, que abarcan un período de 400 años, contenidas en miles de tomos pertenecientes a la biblioteca de la Escuela de Derecho de la Harvard. En la misma línea, también se busca impulsar y ayudar a la modernización de los tribunales, si estos así lo desean.
El proyecto inició en 2013, se oficializó en 2015 y finalizó en 2018, con todos los documentos puestos a disposición del público, cumpliendo el objetivo principal de permitir el acceso a la jurisprudencia de manera gratuita. Esto último es de especial importancia, ya que el diagnóstico que se hizo fue que la falta de acceso a decisiones judiciales tiene una plétora de consecuencias negativas: alto costo para la preparación de juicios por medio de estudios de jurisprudencia, lo que generaba barreras de entrada a aquellos litigantes de menores recursos; y desigual conocimiento de la evolución jurisprudencial de las cortes y tribunales, lo que afectaba no solo el conocimiento formal de la norma en vías de aplicación, sino también los efectos en la incompleta educación que las escuelas de Derecho dan a sus alumnos.
Además, la falta de análisis de sentencias agregadas no permitía a las universidades y centros de estudio identificar sesgos, tendencias y anomalías cometidas al realizar el juzgamiento; y finalmente, ignorar la jurisprudencia suponía el incumplimiento del mandato de que las normas deben ser de público conocimiento y fácil acceso: si efectivamente la ley es conocida por todos, se puede obedecer; si no, difícilmente puede obligar al ciudadano, lo que termina afectando al Estado de Derecho.
¿Cómo se llevó a cabo el Caselaw Access Project? En 2013 se planteó la posibilidad de digitalizar todos los casos publicados oficialmente por las distintas cortes del país, contenidos en aproximadamente 43.000 libros pertenecientes a la Biblioteca de Derecho de Harvard. Se investigó cuál era toda la bibliografía disponible, para cerciorarse de que el proyecto efectivamente comprendiera la información propuesta.
A finales de octubre de 2015 se anunció un acuerdo con Ravel Law, un emprendimiento desarrollador de una plataforma de investigación legal y analítica, quienes se encargaron de financiar todo el proceso, lo que permitió su ejecución.
Para digitalizar la información, los libros eran enviados desde el depósito de la biblioteca. Luego, se sacaban de sus encuadernados, se pasaban por una guillotina hidráulica para separar las hojas y finalmente eran procesadas por un escáner de alta velocidad. Una vez acabado ese trabajo, los libros descosidos se volvían a poner en sus empastes, se sellaban individualmente al vacío, y eran enviados a Kentucky para almacenarlos en una antigua mina de piedra caliza.
Se requirió de 6 bibliotecarios —trabajadores a tiempo completo, de la misma biblioteca— que llevaban a cabo el proceso antes descrito, por turnos, además de la maquinaria utilizada: un escáner de alta velocidad, cortador hidráulico y máquina selladora al vacío. Asimismo, se externalizó el procesamiento de la información a un proveedor.
Se tuvieron que digitalizar 40 millones de hojas, escaneando entre 450 mil y 500 mil por semana, lo que tomó un poco menos de 2 años, terminando esta fase del proyecto en enero de 2017.
Primero, se creó metadata para cada uno de los libros, tales como código de barras único, nombre de la publicación, jurisdicción, entre otra información editorial. Luego, con el escáner de alta velocidad, se producían imágenes en alta calidad de cada página. Posteriormente, un proveedor aplicaba una herramienta de OCR para poder extraer la información de cada caso, creando documentos XML de ellos. Luego, la metadata clave de cada caso era corregida para mayor precisión, mientras que el texto restante se dejaba sin mayor tratamiento. En aquellos casos que no eran aún de dominio público, el mismo proveedor ocultaba la información sujeta a derechos de autor.
Así, con la información lista, se iba subiendo a la plataforma de Ravel Law parcialmente, bajo el criterio de jurisdicción, comenzando con los estados de California, Nueva York, Massachusetts, Illinois y Texas, finalizando con los demás estados y decisiones de la Corte Suprema.
Se puede acceder a los datos obtenidos con 5 herramientas, según aparece en la misma página del proyecto: API, bulk data, interfaz de búsqueda, por colección de libros y tendencias históricas. Con las dos primeras, se busca que distintos investigadores y desarrolladores de programas y soluciones generen aplicaciones con los datos obtenidos.
Ravel Law accedió a financiar toda la digitalización para Caselaw Access Project, a cambio de obtener ciertos derechos. Estos consisten en una licencia de exclusividad para explotar comercialmente los datos, la cual tiene una duración máxima de ocho años, expirando en 2024. Esta licencia puede terminar anticipadamente en dos situaciones: si Ravel Law incumple sus obligaciones, o en el caso de que una jurisdicción publique sus decisiones en línea en un formato adecuado, como ocurrió con Illinois y Arkansas.
Los datos obtenidos pertenecen a Harvard, y están a disposición del público gratuitamente, con algunas limitaciones. Quien tenga interés, debe registrar una cuenta en la página de Ravel Law, y sólo se pueden descargar hasta 500 casos por día. Se hacen excepciones para investigadores, quienes deben sujetarse a restricciones sobre el uso y redistribución de la información. Las herramientas de análisis de los datos son comercializados por Ravel. Además, el desarrollo de APIs para esta información puede ser comercializado a entidades comerciales.
No se conoce el monto específico de cuánto costó el proyecto, pues el acuerdo no se puso a disposición del público, aunque se estima en varios millones de dólares. En un comentario, a raíz de una noticia, se menciona que el financiamiento solicitado fue de 8 millones de dólares, pero no se cita fuente.
Para finalizar, Harvard tiene una participación del 4% en el capital (equity interest) de Ravel Law, que, de generar ganancias, se destinarán a un fondo de sostenibilidad para apoyar el proyecto.
En Chile, al igual que en muchas de las jurisdicciones de Latinoamérica, las sentencias de los tribunales no son públicas ni gratuitas. Ejemplos como Caselaw Access Project, liderado por Harvard, debiesen ser usados como estándar de transparencia normativos, no solo por el incuestionable acceso a la justicia, sino por el profundamente necesario conocimiento que todos debiéramos tener de nuestro sistema jurídico.
* María Fernanda Villegas es ayudante del Programa Derecho, Ciencia y Tecnología UC (Chile). Matías Aránguiz es coordinador Fintech de dicho Programa, candidato a doctor por la Universidad de Shanghai Jiao Tong University (China).
También te puede interesar:
— Desafíos en inteligencia artificial, justicia y ODR (video)
— Qué podemos aprender de la tecnología legal china
— Jueces e inteligencia artificial en China: ¿podríamos implementar un Xiaofa?