Le big data des
décisions de justice fait parler de lui. Visant à rendre accessibles au public
les décisions de justice, cette ouverture veille toutefois à préserver la vie
privée des parties, en rendant anonymes les données. Dans ce cadre, depuis
janvier 2019, la Cour de cassation a accueilli, pour dix mois, deux
spécialistes de l’intelligence artificielle, dont la mission première sera de
développer des outils visant à mettre en place cette anonymisation de façon
automatisée.
La mise à disposition des jugements voulue par le
gouvernement ne se fait pas sans peine. Promise par les articles 20 et 21 de la loi numéro 2016-1321 du 7 octobre 2016 pour une République
numérique, leur mise en ligne doit toutefois être encadrée. En effet, comme l’a
rappelé la ministre de la Justice, Nicole Belloubet, lors de la 2e
édition de la Vendôme Tech en novembre dernier, « l’article 19 du
projet de loi pose un principe important : les jugements sont mis à la
disposition du public à titre gratuit sous forme électronique ». Jugée comme « essentielle à la démocratie », cette
ouverture doit toutefois veiller à la protection de la vie privée des parties.
Aussi, « les noms et prénoms des personnes physiques mentionnées dans
le jugement, lorsqu’elles sont parties ou tiers, seront préalablement occultées
avant la mise à disposition au public. » a précisé la garde des
Sceaux. Veillant à garantir un équilibre « entre l’accès à la décision,
entièrement préservé, et le respect de la vie privée et de la sécurité des
personnes », celui-ci apparaît pour la ministre indispensable pour
« que l’accès aux décisions de justice améliore la confiance des citoyens
en la justice ».
Alors que la Cour de cassation procède elle-même à
l’anonymisation des décisions de justice diffusées sur Légifrance et
accessibles en open data depuis janvier 2018, celle-ci souhaite
développer une technique visant à automatiser cette étape. Car en effet, les
chiffres sont éloquents : 15 000 décisions judiciaires sont diffusées sur Légifrance chaque année, alors
que près de 3,9 millions
de décisions sont rendues, tous les ans. Aussi, pour répondre à l’anonymisation
de ses décisions, la Cour de cassation a souhaité faire appel « à des
techniques d’intelligence artificielle et en particulier d’apprentissage
automatique » précise-t-elle. Les deux data scientists
accueillis par la Cour de cassation devront alors mettre en œuvre le
développement d’un outil permettant d’occulter les éléments identifiants
directs (noms, adresses…) à l’aide d’un logiciel. Ils pourront, dans leur
tâche, s’appuyer sur les techniques déjà existantes, mais aussi compter sur une
équipe de dix annotateurs-correcteurs « qui pourront vérifier les
résultats du logiciel d’anonymisation à concevoir et permettre de les
améliorer », précise la plus haute juridiction de France. Les
objectifs étant de transformer en profondeur la diffusion de la jurisprudence
et de renforcer la cohérence des décisions rendues et la confiance des citoyens
en l’autorité judiciaire.
Constance Périn