ACTUALITÉ

Open data des décisions de justice : où en est-on en France ?

Open data des décisions de justice : où en est-on en France ?
Publié le 08/11/2018 à 15:17

La loi n° 2016-1321 du 7 octobre 2016 pour une République numérique a promis d’engager un vaste mouvement d’ouverture des données publiques. Au cœur de cette promesse, la mise en ligne des décisions de justice portée par les articles 20 et 21 et par un décret en Conseil d’État qui n’a toujours pas été publié. L’ouverture des données pourrait offrir aux acteurs historiques, comme aux legaltech, des perspectives de travail nouvelles. Fabien Waechter, président de l’éditeur juridique et legaltech Lexbase, et Fabien Girard de Barros, son directeur général, nous ont expliqué les enjeux de l’open data des données judiciaires ainsi que les freins actuels à leur ouverture.




« Globalement, la France n’est pas en avance dans ce qu’on appelle la libération des décisions de justice. Ce n’est pas une libération naturelle. C’est délégué et cher », a déclaré d’emblée Fabien Girard de Barros, directeur général de Lexbase, lors d’un entretien consacré à l’open data des décisions de justice en France.


Actuellement les professionnels n’ont accès, au mieux, qu’à 6,5 % des trois millions de décisions rendues chaque année.


Certes, il y a Légifrance (qui regroupe les arrêts de Cassation, du Conseil d’État, des décisions des cours administratives en appel et quelques décisions d’appel…), mais ce service public diffuse à peine 50 000 décisions par an (la plupart des éditeurs en publient entre 150 000 et
200 000). Revenant sur l’historique de l’open data, les deux intervenants ont précisé que c’est à la fin des années 90 que la décision judiciaire en général a été considérée comme une donnée publique.


Toutefois, pendant de très nombreuses années, la grosse masse de la jurisprudence, celle des cours d’appel et des premières instances, n’a pas été publiée. L’État est resté coi à ce sujet. Or, c’est dans ces juridictions « inférieures » que l’on trouve les éléments les plus intéressants, particulièrement en terme de datas, selon Fabien Girard de Barros.
Ce stand-by des instances publiques a permis à certains acteurs comme Lexbase de se positionner pour l’acquisition de ces données. 


En effet, à l’époque, même les décisions des cours d’appel n’étaient pas accessibles. C’est seulement en 2009/2010 que tous les éditeurs ont pu avoir accès au fonds quasi-complet des décisions d’appel. C’est donc à la fin des années 2000 que la Cour de cassation a mis en place cette diffusion des arrêts d’appel à travers la licence JURICA. On est alors passé de 50 000 à 200 000 décisions (cassation et cour d’appel) diffusées à destination des justiciables, ou plutôt à ceux qui voulaient bien acheter ce fonds et étaient en capacité de le rediffuser tout en respectant un certain nombre de cahiers des charges dont l’anonymisation. De fait, une fois qu’on acquiert une base de données, il faut ensuite la traiter pour la rediffuser, et seuls les grands éditeurs ont les moyens financiers pour acheter les données et effectuer ce retraitement ensuite.


Pour constituer sa base, dès 2000, Lexbase avait démarché chaque greffe pour passer des partenariats. Certes, a expliqué Fabien Waechter, président de Lexbase, les greffes sont censés donner les décisions de justice à tout le monde, mais à l’époque on passait des sortes de « deals » : « Donnez-moi vos données, et je vous donne accès à Lexbase. » Cela a été avec la cour d’appel de Bordeaux que l’éditeur numérique a signé son premier contrat de partenariat. Au demeurant, tous les éditeurs pouvaient en faire de même. Mais, alors que les autres grands éditeurs (notamment LexisNexis, Dalloz, Wolters kluwer...) choisissaient les décisions qu’ils voulaient diffuser, Lexbase ne faisait pas de sélections, a expliqué son président, c’est pourquoi son stock de décisions est aussi important.


 


LES ENJEUX DE LA LIBÉRALISATION DES DONNÉES


Dans la tradition romano-civiliste, la loi donne le « la », a affirmé Fabien Girard de Barros, ce qui explique, selon lui, pourquoi en France le Code de 1804 constitue toujours la référence. Le principe de ce dernier était de donner des grands principes, et de former des magistrats capables de les interpréter par rapport à des faits présentés devant eux. Cependant, a expliqué le directeur général, la société française s’est peu à peu complexifiée (modification de la sphère familiale, mondialisation, nouvelles technologies…), et ces grands principes ne suffisent plus aujourd’hui. La loi est devenue beaucoup plus alambiquée, ce qui implique « une interprétation plus complexe à l’aune de faits complexes ». Dans ce cadre-là, la jurisprudence est essentielle, puisque celle-ci a trait à l’interprétation du droit eu égard à des faits souvent singuliers et compliqués. Malheureusement, pour Fabien Girard de Barros, dans notre culture romano-civiliste, nous sommes réticents à accorder de l’importance à la jurisprudence, alors qu’il est primordial pour les justiciables, mais surtout pour les avocats, notaires, huissiers, etc., de pouvoir accéder à une manne de faits pour trouver le cas précis qui les intéresse et ainsi orienter leur stratégie de conseil ou de contentieux. D’un point de vue économique, le mouvement open data a été initié par Emmanuel Macron, alors ministre de l’Économie et des Finances en 2016. Objectif : donner de la matière à traiter à de nouveaux acteurs (legaltech) pour qu’ils apportent de nouveaux services (Predictice, Doctrine… se sont ainsi jetés dans la brèche).


Pour résumer, l’enjeu de la libération des données, c’est d’avoir une meilleure justice, transparente et accessible à tous. « Officiellement, la libération de la jurisprudence c’est une œuvre de justice, de transparence et d’accès au droit », ont déclaré les dirigeants de Lexbase. Il s’agit d’une mesure avant tout politique et sociétale, au même titre que l’aide juridictionnelle et les maisons du droit. Il serait en effet étonnant de promouvoir une politique d’accès à la justice alors qu’on ne peut avoir accès aux solutions juridiques.


Concernant Lexbase, l’éditeur possède une base de données qui se construit à la fois sur les décisions des Cours suprêmes, des cours d’appel, des CAA et sur certaines décisions de première instance, dont le TGI de Paris et les tribunaux de commerce. « Nous voulions libérer les données. Nous avons tissé des accords avec ces juridictions dans la transparence totale. On allait voir un tribunal, et on lui demandait de libérer ses données. On lui donnait ensuite accès à sa propre production en échange » ont expliqué les dirigeants de la société. Ainsi, en près de 20 ans, l’éditeur juridique a construit une base de 3,6 millions de décisions à travers des partenariats avec les juridictions et une collaboration directe avec les greffes. Ces partenariats n’étaient en rien exclusifs, tous les éditeurs pouvaient en faire de même.


 


LES DIFFÉRENTES LOIS DE LIBÉRALISATION DES DONNÉES 



Il y a d’abord eu une délibération de la CNIL en 2001 qui précisait qu’on pouvait tout publier, tout en veillant à préserver l’anonymat des personnes concernées. Or, cette obligation est très compliquée à mettre en œuvre en pratique.


Avec la loi Lemaire pour une République numérique du 7 octobre 2016, le gouvernement a cru résoudre le problème en donnant un cadre légal. Leitmotiv de cette loi : il faut tout libérer, sous réserve du respect de la vie privée toutefois. « On a donc avancé, mais sans prendre de risques, et sans régler le problème. C’est ce qu’Habermas appellerait une contradiction performative », a souligné Fabien Waechter, président et féru de philosophie. Cette situation dure depuis trois ans déjà. Certes aujourd’hui on peut libérer la donnée judiciaire, mais à condition de retirer le nom des parties, le nom de l’avocat, le nom du magistrat… En fait, le nom de tous les tiers, plus tous les faits, en principe, qui permettent une réidentification. Au final, très peu de données pourront être libérées, en l’état des données existantes.


Bref, pour les experts, la loi Lemaire ne peut porter ses fruits, car soit les juridictions sont en mesure de délivrer une data objective (or sur des millions d’informations, il est quasi impossible de respecter ce prérequis), soit elles décident de léser les individus. En outre, avec l’introduction de la notion de vie privée à la place d’anonymisation, on a rendu les choses encore plus complexes, car ce concept est difficile à cerner. Qu’est-ce qui relève en effet de la vie privée ? Cela suppose une appréciation au cas par cas.


Pour le président de Lexbase, il existerait bien une solution, cependant inenvisagée par les pouvoirs publics. Dans le domaine médical, par exemple, il n’existe pas de bases publiques. Chaque « malade » décide de livrer publiquement son cas ou non. Dans le domaine juridique, on pourrait faire de même. Les décisions seraient des données privées qui pourraient être concédées librement pour alimenter une base publique.
En effet, a expliqué Fabien Girard de Barros, si une donnée judiciaire est publique mais qu’elle n’est pas publiable, alors à quoi sert-elle ?
Il faut la rendre publiable, c’est-à-dire construire un texte dans lequel ne sont indiqués que des éléments neutres. L’idée serait ainsi de construire une donnée, un document qui soit représentatif de la position du juge sur une question de fait. Il s’agirait par conséquent d’une donnée judiciaire publique publiable (DJPP).


Cependant, tout le monde n’est pas en capacité technologique et financière pour faire ce travail-là. Il faut des années d’investissement. L’État pourrait prendre en charge cette problématique (la loi Lemaire affirme en effet que c’est aux producteurs de s’occuper de cela), cependant, les juridictions n’ont pas les moyens de le faire. Ces dernières ont certes demandé à la Direction de l’information légale et administrative (DILA) de traiter ces données, mais cette instance n’a pas voulu en prendre la responsabilité. La prochaine mouture de Legifrance montre bien que la DILA se concentre sur la donnée législative et règlementaire.


Selon les dirigeants de Lexbase, on est donc aujourd’hui en présence d’une loi qui dit qu’il faut libérer, sans toutefois donner aux juridictions la possibilité de le faire concrètement, le traitement de toutes ces données étant extrêmement lourd à gérer (celles-ci ont d’ailleurs des difficultés plus urgentes à résoudre).


« Par conséquent, depuis trois ans, on est coincé, et le décret ne sort pas », ont-ils déploré.


Le traitement de la data elle-même n’intéresse pas beaucoup de monde, car la libéralisation attendue n’existe pas, et le traitement est laborieux.


L’open data des décisions judiciaires se trouve aujourd’hui coupé dans son élan, et cela à cause de lois dont l’objectif était justement de libérer la donnée. Face à cette réalité, éditeurs et nouveaux acteurs du droit comme les legaltech tentent de tirer leur épingle du jeu. Leurs stratégies sont néanmoins très différentes. Qu’est-ce qui différencie les legaltechs des éditeurs classiques sur le marché de l’open data ?


 


le FONCTIONNEMENT DES LEGALTECH


« Le principe d’une legaltech, c’est de se présenter sur le marché avec un produit pas nécessairement terminé et de l’assumer » ont expliqué les dirigeants de Lexbase.
Les concepteurs finalisent le produit avec le client de manière coopérative, l’idée étant de s’améliorer petit à petit. Un concept totalement inconnu pour l’économie traditionnelle, mais qui fonctionne bien de nos jours. Pour prospérer, ces nouveaux acteurs du droit trouvent des investisseurs qui sont sur la même longueur d’onde qu’eux.


La force de ces legaltech réside dans le fait qu’elles parviennent à faire croire qu’elles introduisent sur le marché quelque chose de nouveau alors que ce n’est pas le cas.
En outre, « Ce qui est troublant, c’est qu’elles communiquent sur le volume, car elles pensent que c’est le plus important, or c’est surtout la qualité de la base qui l’est »,
a commenté Fabien Girard de Barros.


Pour acquérir une base de données exploitables, il faut mettre en place un système de collecte, et procéder de quatre manière :


en payant un fonds de concours (la Cour de cassation) ;


en intégrant sur son site un système d’upload (intégration) de décisions de justice ;


en chrolant le web (scrapping) : dès qu’une décision de justice est en accès libre, on la prend et on la traite ;


en faisant des commandes aux greffes.


Tout se joue ensuite sur la mise en place d’une stratégie pour se différencier de ses concurrents.


Comment les éditeurs « classiques » peuvent-ils réagir face à ces legaltech ? Il faut avant tout fidéliser sa clientèle, en communiquant beaucoup auprès d’elle, ont vivement conseillé Fabien Waechter et Fabien Girard de Barros. C’est la meilleure façon de s’en sortir sur un marché de l’open data devenu aujourd’hui très concurrentiel. Et ce notamment quand on a face à soi des adversaires qui usent de méthodes discutables comme Doctrine.fr. La start-up est en effet actuellement au centre d’une affaire loin d’être réglée.


 


L’AFFAIRE DOCTRINE.fr


Une start-up comme Doctrine.fr s’inscrit totalement dans le mouvement de disruption sus-évoqué. En juin dernier, malgré la polémique dont elle faisait l’objet (sur laquelle les dirigeants de Lexbase sont ensuite revenus), l’entreprise a annoncé qu’elle levait 10 millions d’euros, alors même que ses méthodes sont un peu floues.


En effet, en février 2018, Juriconnexion, association qui rassemble les utilisateurs professionnels des produits électroniques d’information juridique, a mené une enquête auprès des éditeurs juridiques pour connaître le volume, la nature et les modes d’approvisionnement de leurs données juridiques. Or, Doctrine.fr a refusé de s’y soumettre. Par conséquent, personne ne sait combien précisément la legaltech possède de décisions judiciaires. À l’époque, Juriconnexion avait regretté que Doctrine n’ait pas répondu à l’enquête et s’était également étonnée que la start-up mette en avant près de 7 millions de décisions : « Pour l’heure, ce chiffre ne peut être prouvé et l’éditeur manque là complètement de transparence. Nous savons qu’aucun fonds supplémentaire de jurisprudence n’est mis à la disposition des éditeurs, le différentiel de 3,4 millions de décisions est donc difficilement compréhensible » pouvait-on lire dans le rapport de l’association. Doctrine.fr a en fait monté un système qui rend impossible tout comptage (la recherche est limitée à 500 décisions par mot-clé). « Ils savaient donc dès le départ qu’ils n’allaient pas être transparents sur le nombre de décisions », ont avancé les dirigeants de Lexbase. Si l’on détaille leur site, on peut voir que 7 articles sur 10 ont trait à leur levée de fond, leur idéologie et non leurs services.


Comment Doctrine.fr a acquis sa base de données ? C’est bien là que se situe la polémique dont la start-up fait l’objet actuellement.


Afin de mieux comprendre cette « affaire », les intervenants ont d’abord retracé l’histoire de la legaltech.


Les dirigeants, Antoine Dusséaux, Nicolas Bustamante et Raphael Champeimont, avaient à l’origine pour ambition (comme tant d’autres) de libérer les données judiciaires. Ils ont commencé par obtenir les décisions d’appel de la part de la Cour de cassation en lui promettant en échange de les anonymiser le plus rapidement possible, aux termes d’une convention de recherche.


Une fois le travail de retraitement effectué, les jeunes entrepreneurs ont décidé d’acheter cette base à la Cour suprême, de monter un site puis de la revendre. Ils ont ainsi pu obtenir les données de la Cour de cassation avant de les acheter. 


Pour se différencier des autres éditeurs, ils ont ensuite voulu obtenir les décisions de premières instances (un marché sur lequel se trouve déjà Lexbase depuis de nombreuses années). Pour les recueillir, il faut passer des commandes, établir des partenariats… Et cela prend du temps. Trop pour les dirigeants de Doctrine.fr
impatients de proposer quelque chose d’intéressant à vendre, analysent Fabien Waechter et Fabien Girard de Barros . En outre, quand les startuppers ont débuté leur activité, la loi Lemaire est tombée, ils ne pouvaient donc plus passer de partenariats. Il ne restait alors plus que l’option des commandes.


Même si cette dernière solution est la plus efficace pour obtenir des décisions, le problème avec les commandes c’est que les réponses des juridictions et des greffes ne sont pas nombreuses, et sont longues à arriver. Une situation à laquelle sont confrontés tous les autres éditeurs sur le marché.


« à ce que l’on peut lire dans les journaux, ce qu’on reprocherait à Doctrine.fr, c’est d’avoir passé des commandes massives, mais pas sous leur propre nom », ont expliqué les dirigeants de Lexbase, en affichant cependant une grande prudence dans leurs propos. Ils expliquent en effet que l’arrivée de nouveaux acteurs est souhaitable, va dans le sens de la démarche de Lexbase, et qu’en aucun cas, ils ne voudraient participer à une vindicte publique : ils veulent rester objectifs. Surtout, ils réaffirment leurs compétences en matière de data ET d’édition : tous les circuits de numérisation, acquisition de jurisprudence existent depuis les années 2000 à Lexbase (qui était une sorte de pré-legal start-up) ; leur enrichissement éditorial est inédit, du fait de contenus juridiques, scientifiques exclusifs !


Doctrine est suspecté d’avoir fait ce qu’on appelle aujourd’hui du typosquatting : invention et usurpation d’adresses électroniques qui ressemblent très fortement aux mails de cabinets qui existent ou de cabinets inventés. Mais pourquoi ?


Pour accélérer le processus de récolte des décisions judiciaires, selon les dirigeants de Lexbase. En effet, quand un avocat demande une décision de justice, il l’obtient automatiquement et très rapidement.
Or, se faire passer pour un avocat est clairement un délit, a rappelé Monsieur Girard de Barros, « si les faits sont averés, l’usurpation du titre d’avocat relève du pénal ».


Cette « frauduleuse machination » a été révélée au grand jour dans le journal Le Monde (cf. article du 29 juin 2018 « piratage massif de données au Tribunal »).


Étonnés de recevoir autant de mails de commandes massives, les greffes sont allés voir les cabinets d’avocats pour s’assurer que c’était bien eux qui avaient passé les commandes.
Ces derniers ont nié. Ont alors été découvertes des dizaines d’adresses fictives reprenant soit des noms de cabinets d’avocats soit des adresses de magistrats ou d’universitaires.


Il s’est ensuite avéré que ces adresses avaient été déposées par la firme britannique Legal Nemesis Limited. Une société à quatre actionnaires dont trois sont les créateurs de la société française Forseti, gestionnaire de la publication Doctrine.fr…


Interrogés sur cette affaire, les fondateurs de Doctrine.fr ont nié les faits, avant de déclarer que c’était un ancien stagiaire qui leur avait demandé de le faire. Un deuxième scandale implique cette fois Infogreffe. Quelques jours auparavant, avait été dévoilé un partenariat passé entre Doctrine et Infogreffe.
Le GIE s’est engagé à livrer dans le cadre d’un contrat commercial toutes ses décisions (stocks et flux) à Doctrine, alors que tous les éditeurs demandaient un partenariat équivalent depuis des années, puisque cette dernière traitait déjà le contentieux de plusieurs tribunaux de commerce depuis des années, avec succès. Il s’agit par conséquent d’une forme de privatisation de la donnée publique, selon les dirigeants de Lexbase, puisque de fait, Doctrine bénéficiait d’une exclusivité.


Cette entente a d’ailleurs été établie dans le plus grand secret il y a plus d’un an… Au grand dam des éditeurs classiques et autres legaltech.


 


DE VIVES RÉACTIONS DES REPRÉSENTANTS DU DROIT


Suite à l’affaire Doctrine, les réactions ne se sont pas fait attendre. Dès juillet, le GIE a demandé à la start-up de ne plus diffuser ses décisions de justice. Début septembre, Infogreffe a mis un terme définitif à son partenariat avec la legaltech.


« Par principe de précaution et par solidarité avec les professions du droit qui ont été impactées par les pratiques de Doctrine.fr,
– c’est-à-dire les avocats et les greffiers des autres juridictions – nous avons d’abord suspendu puis résilié le partenariat avec Doctrine.fr. Nous réfléchissons désormais à une licence dont pourraient bénéficier tous les éditeurs »
, ont expliqué les greffiers des tribunaux de commerce.


Juste après les révélations du Monde, la présidente du Conseil national des barreaux, Christiane Féral-Schuhl, a indiqué par un tweet que si l’usurpation d’identité d’avocat était avérée, le CNB ne manquerait pas d’intervenir.


Le 28 septembre dernier, le barreau de Paris a officiellement déposé une plainte au pénal contre Doctrine.fr. « Ne rien faire, c’est encourager une forme de pillage. L’ordre des avocats de Paris souhaite promouvoir un numérique propre dans son secteur, mais s’oppose à Doctrine.fr
comme à toute forme de détournement de l’open data »
se sont ainsi exprimés dans un communiqué Marie-Aimée Peyron et Basile Ader, respectivement bâtonnier et vice-bâtonnier de l’Ordre.


La legaltech Predictice se réserve également le droit d’une action en justice puisqu’elle accuse Doctrine.fr d’avoir usurpé son identité.


Quant à la Chancellerie, elle a immédiatement envoyé un email à tous les tribunaux, tombé depuis dans un amendement au Sénat, énonçant que toute personne a le droit de faire une commande à un greffe sauf si elle est massive et récurrente.


« Nous sommes donc passés d’une loi Lemaire qui veut que tout soit libéré à ce décret. On se trouve donc dans une situation d’ultra blocage, d’autant que le décret d’application pour une libération n’a finalement pas vu le jour » a regretté Fabien Girard de Barros. Pour lui, nous sommes parvenus à l’opposé de ce qu’on voulait dans la loi Lemaire : « À cause de la suspicion de fraude de Doctrine, tout le monde est pénalisé. »
Il reste certes les partenariats et les fonds de concours, mais les commandes sont encore plus difficiles qu’avant à passer.


« Je souhaite que la numérisation complète de notre justice ait été entièrement déployée en juin 2020 », écrivait le président de la République, Emmanuel Macron, dans un tweet du 15 janvier dernier. Cela ne sera certainement pas le cas, étant donné la situation actuelle.


 


CONCLUSION


Quel est donc l’avenir de l’open data en France ? Pour les dirigeants de Lexbase,
il faudrait que la Cour de cassation s’empare du problème et qu’elle passe par des intermédiaires qualifiés. Elle pourrait ainsi centraliser les décisions (ou du moins un volume conséquent) puis s’attacher les services d’un opérateur fiable et éthique qui sait anonymiser, et qui sera chargé de redistribuer ces décisions, gratuitement ou en le vendant sous le contrôle de la Cour de cassation, à tous ceux qui le veulent, et cela de manière égalitaire. On aurait ainsi un responsable public, un opérateur privé compétent, une redistribution égalitaire, soit une chaine d’optimisation tout à fait contrôlée. 


En conclusion, on peut dire que l’affaire Doctrine, au-delà du « scandale », met en lumière les difficultés réelles des éditeurs pour obtenir en masse des décisions de justice.
En France, Il existe un vrai problème d’accès à la décision de justice notamment de première instance. Actuellement, les acteurs du droit se trouvent bloqués par la loi Lemaire, par la Cour de cassation qui n’a pas trouvé de solution, et par la DILA qui refuse de prendre sa part de responsabilité. Cette situation ne profite à personne, et chacun tente tant bien que mal de s’en sortir. Certains conservent leur éthique, d’autres moins…


 


Maria-Angélica Bailly


 


0 commentaire
Poster

Nos derniers articles