Les données personnelles représenteraient selon le Boston Consulting Group la valeur de 1 000 milliards d'euros. Or, cette redistribution des parts du gâteau de la donnée de santé s'accélère car les enjeux dans la recherche sont énormes. Ainsi, l'industrie pharma est prête à y mettre les moyens. Illustration en 2018, Roche acquiert l’éditeur de logiciels Flatiron pour 1,9 milliard de dollars (1,65 milliard d’euros). Cette acquisition du laboratoire a une finalité bien précise : mettre la main sur les historiques médicaux complets d’environ 200 000 patients cancéreux, soit quelque 10 000 dollars par dossier. Hors Europe, essentiellement aux Etats-Unis et en Chine, la question de la richesse et de la valorisation de la donnée ne se pose donc même pas.
En Europe soumise au cadre juridique du RGPD, c'est une autre affaire. La protection des données est mise en avant et en France on se pose encore la question du recueil des données puisqu'il n’y a pas de cadre juridique à la vente de données de santé par le patient. Dans cette logique, l'Etat tente de se positionner comme acteur principal du recueil et de la valorisation des données de santé. Si l'Etat ne fait rien, soit les acteurs restent dans l'expectative, soit ils expérimentent des projets chacun de leur côté. Cette prise de conscience des pouvoirs publics s'illustre dans le rapport publié par Cédric Villani sur l’intelligence artificielle et sur le big data. Pour le Pr Bernard Nordlinger, président du jury qui a sélectionné les dix projets intégrés au futur Health Data Hub, le grand entrepôt de données lancé par l'Etat, « la France a un retard à rattraper dans le numérique général mais est bien placée dans les applications du numérique en santé. Concernant les données de santé, leur accès est possible dans le cadre de protocoles de recherche de qualité approuvés par le conseil scientifique et à la condition que les porteurs de projets acceptent de partager leurs données. Mais l'accès n'est pas payant actuellement. »
Tout en jetant un voile pudique sur le coût des données, la plupart des acteurs expriment leur crainte sur l'accès à l'innovation qui a pris beaucoup de retard. Ce fossé avec les pays plus compétitifs risque de devenir impossible à combler. Ainsi, toujours selon le Pr Nordlinger, « il est essentiel de faire un écosystème avec les données de santé si on veut que la France soit au niveau international. Nous ne devons pas dépendre des applis des autres pays qui risquent d’obliger les Français à aller chercher les services à l’étranger, ce qui serait susceptible d’entraîner des inégalités. »
L'innovation tous azimuts
Cette crainte que l'innovation ne « s'envole » à l'étranger est également relayée par David Gruson (think tank Ethik IA), coauteur de La Révolution du pilotage par les données : « Si l'on bloque l'innovation en France et en Europe, elle nous reviendra par la fenêtre à la demande des professionnels de santé et des patients. La médecine algorithmique se développe très vite à partir du traitement massif des données. »
Gérard Raymond (France Assos Santé) est dans la même logique : « Il faut mettre en place rapidement un outil avec l'État pour que nous puissions puiser dans ce creuset car on peut aller beaucoup plus loin que le Sniiram. »
Contrairement à Bernard Nordlinger, le représentant des patients plaide pour un droit d'entrée sur les données du Health Data Hub qui sera reversé ultérieurement à la démocratie sanitaire et aux actions de santé publique. Dans le même temps, les associations de patients souhaitent instaurer un caractère contraignant au recueil des données de santé auprès de tous les praticiens de santé et de toutes les structures de santé dont les hôpitaux.
Non-patrimonialité des données
La patrimonialité des données de santé est une idée neuve en Europe : l'humain ne doit pas devenir une marchandise. Comme le don du sang ou d'organes qui est fortement encadré par les pouvoirs publics, les données sont une émanation de la personnalité depuis la loi Informatique et libertés (1978) et protégées par le principe d'indisponibilité du corps humain du code civil. Par exemple, si un organe n'est pas appropriable, son émanation (un relevé médical par exemple) ne l'est pas non plus.
C'est l'idée développée par la Pr Lina Williatte, vice-présidente de la Société française de télémédecine : « Nous avons posé le principe de la gratuité du don d'organes parce que les gens n'ont pas toujours conscience de la sacralité du corps. Et si nous autorisions cette vente, cela reviendrait à désacraliser cette conception et par là même altérer l'identité qu'on a de soi. Idem pour les données de santé que les gens communiquent aisément aux Gafam, sans avoir conscience réellement de ce qu'ils font. »
Cet argumentaire lié à la donnée de santé rentre-t-il vraiment dans le débat éthique et le principe de solidarité où une personne donne son sang ou un organe au bénéfice d'une autre personne ? La problématique de la donnée de santé n'a pas forcément de rapport direct avec le patient, qui souvent n'hésite pas à donner les éléments de son dossier médical à des fins de recherche, s'il est assuré qu'il pourrait à terme bénéficier des progrès de la recherche dans sa pathologie. Toujours est-il que cette comparaison interroge, puisque nos données sont infiniment duplicables et surtout pas forcément vitales et n'empêchent pas les Gafam de les exploiter.
Concernant la richesse créée par ces bases de données, Lina Williatte met en avant une réelle force de travail apportée. Mais cette valorisation doit être strictement encadrée au sein du Health Data Hub, réservoir dans lequel seront déversées les données qui appartiendront aux biens communs. Contrairement aux associations de patients, la vice-présidente de la SFT est beaucoup plus réservée sur le fait qu'il faille faire acheter les données une fois valorisées, même lorsqu'elles sont destinées à des sociétés privées.
L'État, opérateur ou organisateur des données ?
Si tous ces acteurs sont enthousiastes à l'idée du projet du Health Data Hub, les réserves sont beaucoup plus importantes quant à sa mise en œuvre. Jean-Yves Robin, ancien patron de l'Asip, s'interroge sur le rôle de l'État qui doit conserver son rôle d'organisateur en organisant le partage des données, au service du public. « S'il embauche des data scientists, participe au traitement et finalement administre le traitement des données en France, l'État va endosser un rôle d'opérateur public, alors que les grandes innovations doivent passer par les acteurs économiques. Une vraie réflexion doit être aussi engagée sur le périmètre de l'action publique qui doit se cantonner à la régulation de l'écosystème. »
Financer la mise à disposition des données
Quant à l’usage des données, chacun l'exige, chacun l'exige : le patient, le médecin, l'établissement de santé, la Cnam. Pour François Decourcelle (Enovacom) qui revendique un financement de la donnée par la puissance publique, « le patient est propriétaire de ses données, mais elles sont produites et exploitées par l'hôpital, le médecin ou le laboratoire dans le cadre de son parcours de soins à juste titre. Et elles sont au final financées par le payeur qui en est l'État ».
Quant à imaginer un scénario où l'Etat ne prendrait pas en charge les données, la régulation d'un tel type de marché forcément se ferait avec des effets pervers et l'émergence de data brokers qui ne rémunèrent que peu ou mal les patients, selon Jean-Yves Robin : « Les gens risquent d'être exposés à des ruptures de confidentialité et à des inégalités face à la sécurité de leurs données. Au final, les personnes pauvres vont donner au plus offrant alors que d'autres personnes s'abstiendront bien de les vendre. »
Mes data sont à moi ?
À l’opposé de la vision européenne et française de la donnée, Gaspard Koenig à la tête du think tank Génération libre, propose un changement de paradigme dans son rapport publié en janvier 2018 Mes data sont à moi. Pour une patrimonialité des données personnelles. La pensée de Koenig [qui n'a pas répondu aux sollicitations de la rédaction] est considérée comme libérale mais a tendance à s'adapter au cadre juridique européen plus protecteur. Il part du principe qu'il faut rendre à l'individu producteur de données la propriété de ces dernières, les Gafa étant considérées comme des voleurs de données : « Seule la création d'un marché des data pourra rééquilibrer les rapports de pouvoir entre les plateformes et leurs utilisateurs en dotant ces derniers d'un véritable capital. »
TVA pour renflouer les caisses
En guise d'arguments à leur thèse, les auteurs du rapport Mes data sont à moi proposent de soumettre les futures transactions de données à la TVA qui viendrait nourrir les budgets des États de l'Union européenne. Ainsi, cette taxe assurerait un partage de la chaîne de valeur en lien avec l'intérêt général. Le cadre juridique, plaident les auteurs, y est d'ailleurs favorable, celui du RGPD qui attribue aux entreprises un rôle de gardiennes des données, et non pas propriétaires, en en garantissant la portabilité des données personnelles. Si l'on va un peu plus loin, le droit de propriété serait une suite logique de ces avancées réglementaires.
Blockchain
Pour le mettre en œuvre, la technologie de la blockchain serait utilisée afin de gérer des contrats intelligents, ce qui permettrait à chacun d'entre nous de rassembler, gérer et commercialiser lui-même ses données. Une personne pourra recevoir un paiement après avoir consenti à ce que ses données soient agrégées au sein d'une cohorte. Le principe reste que l'acheteur n'a pas accès aux données personnelles individuelles. Les données inaliénables ne seront jamais communiquées tandis que les dissociables qui représentent un actif économique pourront l'être. Cette technique est utilisée dans le cadre du projet Embleema qui consiste à échanger des données en vie réelle de meilleure qualité hors de toute étude clinique. Après le lancement d'un produit, des données de toutes sources sont récoltées (dossiers médicaux de patients qui prennent le médicament, données d'objets connectés, données génomiques, photos, exposition à des risques professionnels ou environnementaux, etc.). La FDA est particulièrement friande de ces analyses de données de santé, qui lui permettent de mesurer l'efficacité d'un médicament. Selon Robert Chu, PDG d'Embleema, « les experts de l'Agence américaine réanalysent toute la donnée brute, contrairement aux analystes européens qui préfèrent reprendre des rapports scientifiques sans en reproduire l'analyse ». Les patients comme les experts de la FDA sont à même de vérifier (traçabilité) à tout moment ce qui est fait des données des patients. À ce stade, elles sont anonymisées (identifiées via un numéro), non réidentifiables, et accessibles à tous les acteurs. L'étape finale du processus entamé avec la FDA est de standardiser ces données en temps réel via un consortium composé de laboratoires pharmaceutiques, d'hôpitaux, d'associations de patients.
Échangerait données contre financement de la recherche
Un autre projet lancé en mars dernier pour 2020 par Embleema en France est basé sur un partenariat avec l'Institut Gustave-Roussy ; il s'agit d'établir un système d'échange de données oncologiques à des fins de recherche clinique, mais sur un modèle plus vertueux qu'aux États-Unis. Alors qu'outre Atlantique les tiers qui sont souvent des data brokers capturent 90 % de la valeur des données, ce projet français permettra de financer des programmes de patients pris en charge dans l'Institut. Les obstacles réglementaires dans l'Hexagone seront plus nombreux (comité scientifique, comité éthique, demande d'autorisation à la Cnil). En replaçant cette démarche dans le contexte de la patrimonialité des données, Robert Chu est aussi favorable à laisser le consentement au patient [dans le cadre du RGPD] et à l'informer systématiquement des usages secondaires de la donnée*. Selon le PGD d'Embleema, « que ce soit pour la recherche clinique, la surveillance, la sécurité des patients, il faut collecter la donnée, la nettoyer, la faire parler. Or tout cela mérite salaire ».
Au-delà de l'opposition de deux cultures de la donnée (européenne versus américaine), les coulisses de ce futur marché laissent entr'apercevoir une réalité plus fine et plus complexe.
La donnée de santé est indestructible
En Europe, le cadre juridique ne définit pas un propriétaire pour les données de santé. Car qui dit propriété d'un objet, dit possibilité de le vendre, mais aussi de le détruire, selon un data manager : « La donnée n'est pas destructible car elle fait partie d'un dossier médical qui n'appartient pas au patient qui en a seulement l'usufruit. La seule chose que peut imposer le patient est d'en interdire l’accès à certaines personnes ou certains usages comme par exemple son utilisation dans un entrepôt. » Si l'on va plus loin, certes la donnée comparable à du sang ne peut faire l'objet de commerce. Mais, tout comme pour la poche de sang pour son traitement, elle bénéficie d'une structure pour être traitée et valorisée, et dispose d'une valeur. Et pour être vendue dans un cadre réglementé, elle aura donc besoin d'être régulée. Toutefois, prévient ce spécialiste, même si cette donnée est vendue, rien ne pourra empêcher l'État de tenter d’en avoir une copie pour un usage « d’intérêt public », c’est le principe du Health Data Hub.
HDH, un support à l'industrie pour produire de l'IA
Quel est l'objectif final de ce dispositif ? Les acteurs impliqués ne le cachent pas, il est pensé comme une architecture de support à l'industrie pour produire de l'intelligence artificielle et du développement de médicament. Une fois que l'industriel aura calibré son appli à partir de la donnée publique après l'avoir acheté au Health Data Hub, le risque est qu'il ne l'utilise pas sur le territoire ou même que son appli soit vendue à l'étranger. Le dernier rapport d'analyse prospective 2019 de la Haute Autorité de santé "Numérique, quelle (R)évolution ?" (cf. encadré HAS) aborde ce risque de dissociation que va opérer l'IA à travers la privatisation du résultat de la data. Les patients [notamment ceux atteints de maladies rares] qui acceptent de rentrer dans les cohortes et dont les données seront versées dans le Health Data Hub auront le sentiment d'être trahis si le bénéfice médical de leurs données part vers d'autres territoires. En bref, le résultat obtenu serait l'exact inverse des intentions premières des créateurs du dispositif. Mais comment faire autrement ? Les pouvoirs publics auraient-ils intérêt à faire preuve de plus de transparence en la matière?
* * Le traitement secondaire est un traitement informatique pour un autre usage que celui qui a justifié le recueil de la donnée. Par exemple, utilisation à des fins de recherche clinique ou de veille sanitaire de données recueillies pour prodiguer des soins.
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature