La loi n° 2016-1321
du 7 octobre 2016 pour une République numérique a promis d’engager un
vaste mouvement d’ouverture des données publiques. Au cœur de cette promesse,
la mise en ligne des décisions de justice portée par les articles 20 et 21
et par un décret en Conseil d’État qui n’a toujours pas été publié. L’ouverture
des données pourrait offrir aux acteurs historiques, comme aux legaltech, des
perspectives de travail nouvelles. Fabien Waechter, président de l’éditeur
juridique et legaltech Lexbase, et Fabien Girard de Barros, son directeur
général, nous ont expliqué les enjeux de l’open data des données judiciaires
ainsi que les freins actuels à leur ouverture.
« Globalement, la France n’est pas en avance dans ce qu’on
appelle la libération des décisions de justice. Ce n’est pas une libération
naturelle. C’est délégué et cher », a déclaré d’emblée Fabien Girard
de Barros, directeur général de Lexbase, lors d’un entretien consacré à l’open
data des décisions de justice en France.
Actuellement les professionnels n’ont accès, au mieux, qu’à 6,5 % des
trois millions de décisions rendues chaque année.
Certes, il y a Légifrance (qui regroupe les arrêts
de Cassation, du Conseil d’État, des décisions des cours administratives en
appel et quelques décisions d’appel…), mais ce service public diffuse à peine
50 000 décisions par an (la plupart des éditeurs en publient entre
150 000 et
200 000). Revenant sur l’historique de l’open data, les deux intervenants ont
précisé que c’est à la fin des années 90 que la décision judiciaire en
général a été considérée comme une donnée publique.
Toutefois, pendant de très nombreuses années, la
grosse masse de la jurisprudence, celle des cours d’appel et des premières
instances, n’a pas été publiée. L’État est resté coi à ce sujet. Or, c’est dans
ces juridictions « inférieures » que l’on trouve les éléments
les plus intéressants, particulièrement en terme de datas, selon Fabien Girard
de Barros.
Ce stand-by des instances publiques a permis à certains acteurs comme
Lexbase de se positionner pour l’acquisition de ces données.
En effet, à l’époque, même les décisions des cours
d’appel n’étaient pas accessibles. C’est seulement en 2009/2010 que tous les
éditeurs ont pu avoir accès au fonds quasi-complet des décisions d’appel. C’est
donc à la fin des années 2000 que la Cour de cassation a mis en place cette
diffusion des arrêts d’appel à travers la licence JURICA. On est alors passé de
50 000 à 200 000 décisions (cassation et cour d’appel) diffusées à
destination des justiciables, ou plutôt à ceux qui voulaient bien acheter ce
fonds et étaient en capacité de le rediffuser tout en respectant un certain
nombre de cahiers des charges dont l’anonymisation. De fait, une fois qu’on
acquiert une base de données, il faut ensuite la traiter pour la rediffuser, et
seuls les grands éditeurs ont les moyens financiers pour acheter les données et
effectuer ce retraitement ensuite.
Pour constituer sa base, dès 2000, Lexbase avait
démarché chaque greffe pour passer des partenariats. Certes, a expliqué Fabien
Waechter, président de Lexbase, les greffes sont censés donner les décisions de
justice à tout le monde, mais à l’époque on passait des sortes de « deals » :
« Donnez-moi vos données, et je vous donne accès à Lexbase. »
Cela a été avec la cour d’appel de Bordeaux que l’éditeur numérique a signé son
premier contrat de partenariat. Au demeurant, tous les éditeurs pouvaient en
faire de même. Mais, alors que les autres grands éditeurs (notamment
LexisNexis, Dalloz, Wolters kluwer...) choisissaient les décisions qu’ils
voulaient diffuser, Lexbase ne faisait pas de sélections, a expliqué son
président, c’est pourquoi son stock de décisions est aussi important.
LES ENJEUX DE LA LIBÉRALISATION
DES DONNÉES
Dans la tradition romano-civiliste, la loi donne le « la »,
a affirmé Fabien Girard de Barros, ce qui explique, selon lui, pourquoi en
France le Code de 1804 constitue toujours la référence. Le principe de ce
dernier était de donner des grands principes, et de former des magistrats
capables de les interpréter par rapport à des faits présentés devant eux.
Cependant, a expliqué le directeur général, la société française s’est peu à
peu complexifiée (modification de la sphère familiale, mondialisation,
nouvelles technologies…), et ces grands principes ne suffisent plus
aujourd’hui. La loi est devenue beaucoup plus alambiquée, ce qui implique
« une interprétation plus complexe à l’aune de faits complexes ».
Dans ce cadre-là, la jurisprudence est essentielle, puisque celle-ci a trait à
l’interprétation du droit eu égard à des faits souvent singuliers et
compliqués. Malheureusement, pour Fabien Girard de Barros, dans notre culture
romano-civiliste, nous sommes réticents à accorder de l’importance à la
jurisprudence, alors qu’il est primordial pour les justiciables, mais surtout
pour les avocats, notaires, huissiers, etc., de pouvoir accéder à une manne de
faits pour trouver le cas précis qui les intéresse et ainsi orienter leur
stratégie de conseil ou de contentieux. D’un point de vue économique, le
mouvement open data a été initié par Emmanuel Macron, alors ministre de
l’Économie et des Finances en 2016. Objectif : donner de la matière à
traiter à de nouveaux acteurs (legaltech) pour qu’ils apportent de nouveaux
services (Predictice, Doctrine… se sont ainsi jetés dans la brèche).
Pour résumer, l’enjeu de la libération des données, c’est d’avoir une
meilleure justice, transparente et accessible à tous. « Officiellement,
la libération de la jurisprudence c’est une œuvre de justice, de transparence
et d’accès au droit », ont déclaré les dirigeants de Lexbase. Il
s’agit d’une mesure avant tout politique et sociétale, au même titre que l’aide
juridictionnelle et les maisons du droit. Il serait en effet étonnant de
promouvoir une politique d’accès à la justice alors qu’on ne peut avoir accès
aux solutions juridiques.
Concernant Lexbase, l’éditeur possède une base de données qui se construit
à la fois sur les décisions des Cours suprêmes, des cours d’appel, des CAA et
sur certaines décisions de première instance, dont le TGI de Paris et les
tribunaux de commerce. « Nous voulions libérer les données. Nous avons
tissé des accords avec ces juridictions dans la transparence totale. On allait
voir un tribunal, et on lui demandait de libérer ses données. On lui donnait
ensuite accès à sa propre production en échange » ont expliqué les
dirigeants de la société. Ainsi, en près de 20 ans, l’éditeur juridique a
construit une base de 3,6 millions de décisions à travers des partenariats
avec les juridictions et une collaboration directe avec les greffes. Ces
partenariats n’étaient en rien exclusifs, tous les éditeurs pouvaient en faire
de même.
LES DIFFÉRENTES LOIS DE
LIBÉRALISATION DES DONNÉES
Il y a d’abord eu une délibération de la CNIL en 2001 qui précisait
qu’on pouvait tout publier, tout en veillant à préserver l’anonymat des
personnes concernées. Or, cette obligation est très compliquée à mettre en
œuvre en pratique.
Avec la loi Lemaire pour une République numérique du 7 octobre
2016, le gouvernement a cru résoudre le problème en donnant un cadre légal.
Leitmotiv de cette loi : il faut tout libérer, sous réserve du respect de
la vie privée toutefois. « On a donc avancé, mais sans prendre de
risques, et sans régler le problème. C’est ce qu’Habermas appellerait une
contradiction performative », a souligné Fabien Waechter, président et
féru de philosophie. Cette situation dure depuis trois ans déjà. Certes
aujourd’hui on peut libérer la donnée judiciaire, mais à condition de retirer
le nom des parties, le nom de l’avocat, le nom du magistrat… En fait, le nom de
tous les tiers, plus tous les faits, en principe, qui permettent une
réidentification. Au final, très peu de données pourront être libérées, en
l’état des données existantes.
Bref, pour les experts, la loi Lemaire ne peut porter ses fruits, car
soit les juridictions sont en mesure de délivrer une data objective (or sur des
millions d’informations, il est quasi impossible de respecter ce prérequis),
soit elles décident de léser les individus. En outre, avec l’introduction de la
notion de vie privée à la place d’anonymisation, on a rendu les choses encore
plus complexes, car ce concept est difficile à cerner. Qu’est-ce qui relève en
effet de la vie privée ? Cela suppose une appréciation au cas par cas.
Pour le
président de Lexbase, il existerait bien une solution, cependant inenvisagée
par les pouvoirs publics. Dans le domaine médical, par exemple, il n’existe pas
de bases publiques. Chaque « malade » décide de livrer
publiquement son cas ou non. Dans le domaine juridique, on pourrait faire de
même. Les décisions seraient des données privées qui pourraient être concédées
librement pour alimenter une base publique.
En effet, a expliqué Fabien Girard de Barros, si une donnée judiciaire est
publique mais qu’elle n’est pas publiable, alors à quoi sert-elle ?
Il faut la rendre publiable, c’est-à-dire construire un texte dans lequel ne
sont indiqués que des éléments neutres. L’idée serait ainsi de construire une
donnée, un document qui soit représentatif de la position du juge sur une
question de fait. Il s’agirait par conséquent d’une donnée judiciaire publique
publiable (DJPP).
Cependant, tout le monde n’est pas en capacité technologique et
financière pour faire ce travail-là. Il faut des années d’investissement.
L’État pourrait prendre en charge cette problématique (la loi Lemaire affirme
en effet que c’est aux producteurs de s’occuper de cela), cependant, les
juridictions n’ont pas les moyens de le faire. Ces dernières ont certes demandé
à la Direction de l’information légale et administrative (DILA) de traiter ces
données, mais cette instance n’a pas voulu en prendre la responsabilité. La
prochaine mouture de Legifrance montre bien que la DILA se concentre sur la
donnée législative et règlementaire.
Selon les dirigeants de Lexbase, on est donc aujourd’hui en présence
d’une loi qui dit qu’il faut libérer, sans toutefois donner aux juridictions la
possibilité de le faire concrètement, le traitement de toutes ces données étant
extrêmement lourd à gérer (celles-ci ont d’ailleurs des difficultés plus
urgentes à résoudre).
« Par conséquent, depuis trois ans, on est coincé, et le
décret ne sort pas », ont-ils déploré.
Le traitement de la data elle-même n’intéresse pas beaucoup de monde,
car la libéralisation attendue n’existe pas, et le traitement est laborieux.
L’open data des décisions judiciaires se trouve aujourd’hui coupé dans
son élan, et cela à cause de lois dont l’objectif était justement de libérer la
donnée. Face à cette réalité, éditeurs et nouveaux acteurs du droit comme les
legaltech tentent de tirer leur épingle du jeu. Leurs stratégies sont néanmoins
très différentes. Qu’est-ce qui différencie les legaltechs des éditeurs
classiques sur le marché de l’open data ?
le FONCTIONNEMENT DES LEGALTECH
« Le principe d’une legaltech, c’est de se présenter sur le
marché avec un produit pas nécessairement terminé et de l’assumer »
ont expliqué les dirigeants de Lexbase.
Les concepteurs finalisent le produit avec le client de manière coopérative,
l’idée étant de s’améliorer petit à petit. Un concept totalement inconnu pour
l’économie traditionnelle, mais qui fonctionne bien de nos jours. Pour
prospérer, ces nouveaux acteurs du droit trouvent des investisseurs qui sont
sur la même longueur d’onde qu’eux.
La force de
ces legaltech réside dans le fait qu’elles parviennent à faire croire qu’elles
introduisent sur le marché quelque chose de nouveau alors que ce n’est pas le
cas.
En outre, « Ce qui est troublant, c’est qu’elles communiquent sur le volume,
car elles pensent que c’est le plus important, or c’est surtout la qualité de
la base qui l’est »,
a commenté Fabien Girard de Barros.
Pour
acquérir une base de données exploitables, il faut mettre en place un système
de collecte, et procéder de quatre manière :
• en payant
un fonds de concours (la Cour de cassation) ;
• en
intégrant sur son site un système d’upload (intégration) de décisions de
justice ;
• en chrolant
le web (scrapping) : dès qu’une décision de justice est en accès libre,
on la prend et on la traite ;
• en faisant
des commandes aux greffes.
Tout se joue
ensuite sur la mise en place d’une stratégie pour se différencier de ses
concurrents.
Comment les
éditeurs « classiques » peuvent-ils réagir face à ces
legaltech ? Il faut avant tout fidéliser sa clientèle, en communiquant
beaucoup auprès d’elle, ont vivement conseillé Fabien Waechter et Fabien Girard
de Barros. C’est la meilleure façon de s’en sortir sur un marché de l’open data
devenu aujourd’hui très concurrentiel. Et ce notamment quand on a face à soi
des adversaires qui usent de méthodes discutables comme Doctrine.fr. La
start-up est en effet actuellement au centre d’une affaire loin d’être réglée.
L’AFFAIRE DOCTRINE.fr
Une start-up comme Doctrine.fr s’inscrit totalement dans le mouvement
de disruption sus-évoqué. En juin dernier, malgré la polémique dont elle
faisait l’objet (sur laquelle les dirigeants de Lexbase sont ensuite revenus),
l’entreprise a annoncé qu’elle levait 10 millions d’euros, alors même que ses
méthodes sont un peu floues.
En effet, en
février 2018, Juriconnexion, association qui rassemble les utilisateurs
professionnels des produits électroniques d’information juridique, a mené une
enquête auprès des éditeurs juridiques pour connaître le volume, la nature et
les modes d’approvisionnement de leurs données juridiques. Or, Doctrine.fr a
refusé de s’y soumettre. Par conséquent, personne ne sait combien précisément
la legaltech possède de décisions judiciaires. À l’époque, Juriconnexion avait
regretté que Doctrine n’ait pas répondu à l’enquête et s’était également
étonnée que la start-up mette en avant près de 7 millions de décisions : «
Pour l’heure, ce chiffre ne peut être prouvé et l’éditeur manque là
complètement de transparence. Nous savons qu’aucun fonds supplémentaire de
jurisprudence n’est mis à la disposition des éditeurs, le différentiel de 3,4
millions de décisions est donc difficilement compréhensible » pouvait-on
lire dans le rapport de l’association. Doctrine.fr a en fait monté un système
qui rend impossible tout comptage (la recherche est limitée à 500 décisions par
mot-clé). « Ils savaient donc dès le départ qu’ils n’allaient pas être
transparents sur le nombre de décisions », ont avancé les dirigeants de
Lexbase. Si l’on détaille leur site, on peut voir que 7 articles sur 10 ont
trait à leur levée de fond, leur idéologie et non leurs services.
Comment
Doctrine.fr a acquis sa base de données ? C’est bien là que se situe la
polémique dont la start-up fait l’objet actuellement.
Afin de
mieux comprendre cette « affaire », les intervenants ont
d’abord retracé l’histoire de la legaltech.
Les
dirigeants, Antoine Dusséaux, Nicolas Bustamante et Raphael Champeimont, avaient
à l’origine pour ambition (comme tant d’autres) de libérer les données
judiciaires. Ils ont commencé par obtenir les décisions d’appel de la part de
la Cour de cassation en lui promettant en échange de les anonymiser le
plus rapidement possible, aux termes d’une convention de recherche.
Une fois le
travail de retraitement effectué, les jeunes entrepreneurs ont décidé d’acheter
cette base à la Cour suprême, de monter un site puis de la revendre. Ils ont
ainsi pu obtenir les données de la Cour de cassation avant de les acheter.
Pour se
différencier des autres éditeurs, ils ont ensuite voulu obtenir les décisions
de premières instances (un marché sur lequel se trouve déjà Lexbase depuis de
nombreuses années). Pour les recueillir, il faut passer des commandes, établir
des partenariats… Et cela prend du temps. Trop pour les dirigeants de Doctrine.fr
impatients de proposer quelque chose d’intéressant à vendre, analysent Fabien
Waechter et Fabien Girard de Barros . En outre, quand les startuppers ont
débuté leur activité, la loi Lemaire est tombée, ils ne pouvaient donc plus
passer de partenariats. Il ne restait alors plus que l’option des commandes.
Même si
cette dernière solution est la plus efficace pour obtenir des décisions, le problème
avec les commandes c’est que les réponses des juridictions et des greffes ne
sont pas nombreuses, et sont longues à arriver. Une situation à laquelle sont
confrontés tous les autres éditeurs sur le marché.
« à ce que l’on peut lire dans les
journaux, ce qu’on reprocherait à Doctrine.fr, c’est d’avoir passé des
commandes massives, mais pas sous leur propre nom », ont expliqué les
dirigeants de Lexbase, en affichant cependant une grande prudence dans leurs
propos. Ils expliquent en effet que l’arrivée de nouveaux acteurs est
souhaitable, va dans le sens de la démarche de Lexbase, et qu’en aucun cas, ils
ne voudraient participer à une vindicte publique : ils veulent rester
objectifs. Surtout, ils réaffirment leurs compétences en matière de data ET d’édition :
tous les circuits de numérisation, acquisition de jurisprudence existent depuis
les années 2000 à Lexbase (qui était une sorte de pré-legal start-up) ;
leur enrichissement éditorial est inédit, du fait de contenus juridiques,
scientifiques exclusifs !
Doctrine est
suspecté d’avoir fait ce qu’on appelle aujourd’hui du typosquatting :
invention et usurpation d’adresses électroniques qui ressemblent très fortement
aux mails de cabinets qui existent ou de cabinets inventés. Mais
pourquoi ?
Pour accélérer le processus de récolte des décisions judiciaires, selon
les dirigeants de Lexbase. En effet, quand un avocat demande une décision de
justice, il l’obtient automatiquement et très rapidement.
Or, se faire passer pour un avocat est clairement un délit, a rappelé
Monsieur Girard de Barros, « si les faits sont averés,
l’usurpation du titre d’avocat relève du pénal ».
Cette « frauduleuse machination » a été révélée au
grand jour dans le journal Le Monde (cf. article du 29 juin 2018
« piratage massif de données au Tribunal »).
Étonnés de recevoir autant de mails de commandes massives, les greffes
sont allés voir les cabinets d’avocats pour s’assurer que c’était bien eux qui
avaient passé les commandes.
Ces derniers ont nié. Ont alors été découvertes des dizaines d’adresses
fictives reprenant soit des noms de cabinets d’avocats soit des adresses de
magistrats ou d’universitaires.
Il s’est ensuite avéré que ces adresses avaient été déposées par la
firme britannique Legal Nemesis Limited. Une société à quatre actionnaires dont
trois sont les créateurs de la société française Forseti, gestionnaire de la
publication Doctrine.fr…
Interrogés sur cette affaire, les fondateurs de Doctrine.fr ont
nié les faits, avant de déclarer que c’était un ancien stagiaire qui leur avait
demandé de le faire. Un deuxième scandale implique cette fois Infogreffe.
Quelques jours auparavant, avait été dévoilé un partenariat passé entre
Doctrine et Infogreffe.
Le GIE s’est engagé à livrer dans le cadre d’un contrat commercial toutes
ses décisions (stocks et flux) à Doctrine, alors que tous les éditeurs
demandaient un partenariat équivalent depuis des années, puisque cette dernière
traitait déjà le contentieux de plusieurs tribunaux de commerce depuis des
années, avec succès. Il s’agit par conséquent d’une forme de privatisation de
la donnée publique, selon les dirigeants de Lexbase, puisque de fait, Doctrine
bénéficiait d’une exclusivité.
Cette entente a d’ailleurs été établie dans le plus grand secret il y a
plus d’un an… Au grand dam des éditeurs classiques et autres legaltech.
DE VIVES
RÉACTIONS DES REPRÉSENTANTS DU DROIT
Suite à
l’affaire Doctrine, les réactions ne se sont pas fait attendre. Dès juillet, le
GIE a demandé à la start-up de ne plus diffuser ses décisions de justice. Début
septembre, Infogreffe a mis un terme définitif à son partenariat avec la
legaltech.
« Par principe de précaution et par solidarité avec les professions du
droit qui ont été impactées par les pratiques de Doctrine.fr,
– c’est-à-dire les avocats et les greffiers des autres juridictions – nous
avons d’abord suspendu puis résilié le partenariat avec Doctrine.fr. Nous
réfléchissons désormais à une licence dont pourraient bénéficier tous les
éditeurs », ont expliqué les greffiers des tribunaux de commerce.
Juste après les révélations du Monde, la présidente du Conseil
national des barreaux, Christiane Féral-Schuhl, a indiqué par un tweet
que si l’usurpation d’identité d’avocat était avérée, le CNB ne manquerait pas
d’intervenir.
Le 28 septembre dernier, le barreau de Paris a officiellement déposé
une plainte au pénal contre Doctrine.fr. « Ne rien faire, c’est
encourager une forme de pillage. L’ordre des avocats de Paris souhaite
promouvoir un numérique propre dans son secteur, mais s’oppose à
Doctrine.fr
comme à toute forme de détournement de l’open data » se sont ainsi
exprimés dans un communiqué Marie-Aimée Peyron et Basile Ader, respectivement
bâtonnier et vice-bâtonnier de l’Ordre.
La legaltech Predictice se réserve également le droit d’une action en
justice puisqu’elle accuse Doctrine.fr d’avoir usurpé son identité.
Quant à la Chancellerie, elle a immédiatement envoyé un email à tous
les tribunaux, tombé depuis dans un amendement au Sénat,
énonçant que toute personne a le droit de faire une commande à un
greffe sauf si elle est massive et récurrente.
« Nous sommes donc passés d’une loi Lemaire qui veut que tout
soit libéré à ce décret. On se trouve donc dans une situation d’ultra blocage,
d’autant que le décret d’application pour une libération n’a finalement pas vu
le jour » a regretté Fabien Girard de Barros. Pour lui, nous sommes
parvenus à l’opposé de ce qu’on voulait dans la loi Lemaire : « À
cause de la suspicion de fraude de Doctrine, tout le monde est pénalisé. »
Il reste certes les partenariats et les fonds de concours, mais les commandes
sont encore plus difficiles qu’avant à passer.
« Je souhaite que la numérisation complète de notre justice ait
été entièrement déployée en juin 2020 », écrivait le président de la
République, Emmanuel Macron, dans un tweet du 15 janvier dernier. Cela
ne sera certainement pas le cas, étant donné la situation actuelle.
CONCLUSION
Quel est donc l’avenir de l’open data en France ? Pour les
dirigeants de Lexbase,
il faudrait que la Cour de cassation s’empare du problème et qu’elle passe par
des intermédiaires qualifiés. Elle pourrait ainsi centraliser les décisions (ou
du moins un volume conséquent) puis s’attacher les services d’un opérateur
fiable et éthique qui sait anonymiser, et qui sera chargé de redistribuer ces
décisions, gratuitement ou en le vendant sous le contrôle de la Cour de
cassation, à tous ceux qui le veulent, et cela de manière égalitaire. On aurait
ainsi un responsable public, un opérateur privé compétent, une redistribution
égalitaire, soit une chaine d’optimisation tout à fait contrôlée.
En conclusion, on peut dire que l’affaire Doctrine, au-delà du « scandale »,
met en lumière les difficultés réelles des éditeurs pour obtenir en masse des
décisions de justice.
En France, Il existe un vrai problème d’accès à la décision de justice
notamment de première instance. Actuellement, les acteurs du droit se trouvent
bloqués par la loi Lemaire, par la Cour de cassation qui n’a pas trouvé de
solution, et par la DILA qui refuse de prendre sa part de responsabilité. Cette
situation ne profite à personne, et chacun tente tant bien que mal de s’en
sortir. Certains conservent leur éthique, d’autres moins…
Maria-Angélica Bailly