Verso una completa condivisione dei dati

Un RCT ben condotto non solo produce le conoscenze per le quali è stato impostato e quelle derivate da analisi per sottogruppi, ma con la condivisione dei dati si permette la verifica degli obiettivi primari, si possono evitare replicazioni inutili e generare nuove ipotesi investigative. Questo è il circolo virtuoso attraverso il quale la scienza progredisce e salva vite umane.

 

Per incentivare la condivisione dei dati sono state avanzate alcune ipotesi tra le quali la possibilità di un riconoscimento sia accademico che finanziario per chi prepara, classifica e rielabora i dati, rendendoli così disponibili alla condivisione. Si dovrebbero definire due tipologie di autori, quelli che hanno raccolto i dati e quelli che contribuiranno a renderne attiva la condivisione (c’è chi ricoprirà entrambi i ruoli). Questo potrà comportare una necessaria e non facile riclassificazione della parola “autore” in maniera da rendere esplicito il contributo di ciascuno (curatore, analista dati, statistico).(1)

Il punto di vista dello sponsor filantropico.(2)

Il Wellcome Trust, il Medical Research Council e il Cancer Institute, nel Regno Unito, e la Fondazione Bill e Melinda Gates, negli USA, si sono accordati per massimizzare il valore delle ricerche da loro sponsorizzate, facilitando la condivisione dei dati raccolti. É l’esempio di quanto accaduto nel 2014 con la vicenda del virus Ebola, dove la condivisione dei dati ha permesso di arrivare a vincere l’epidemia.

Il NEJM, attraverso la condivisione dei dati dello studio SPRINT sul trattamento intensivo dell’ipertensione, ha permesso a 143 ricercatori selezionati su 16.000 richiedenti, di generare e pubblicare nuove applicazioni dei dati (https://challenge.nejm.org/pages/winners). Anche il Comitato degli editori (ICMJE) ha auspicato la condivisione dei dati, anche se questo non è un prerequisito obbligatorio per la pubblicazione di RCT. É comunque un passo avanti come lo è la omogeneizzazione delle regole per condividere i dati pubblicata di recente dall’OMS. É importante poi che si creino comitati indipendenti che si facciano garanti della privacy dei singoli pazienti.

É chiaro che la condivisione dei dati ha dei costi non indifferenti; i dati vanno uniformati, catalogati, riversati in un supporto di formato standard per un facile accesso da parte della comunità scientifica. Questi costi devono essere quantificati e far parte integrante del finanziamento di una ricerca. Vanno supportati i ricercatori nei paesi a basso reddito, che operano in condizioni di difficoltà logistiche ed economiche e che si troverebbero in una posizione di svantaggio rispetto a chi lavora in paesi ad economia avanzata.

Purtroppo qualcuno percepisce ancora la condivisione dei dati come un elemento di svantaggio, poiché comporta anche lavoro aggiuntivo e non retribuito. I finanziatori devono saper superare questi ostacoli, oltre a fornire supporti quali software e materiale vario (culture cellulari, anticorpi, reagenti). Nel finanziare un gruppo di ricerca si dovrebbero focalizzare sul significato delle pubblicazioni più che sull’importanza della rivista che le ha accettate. La ricerca medica salva vite umane, ma necessita di risorse spesso non reperibili. Per questo è necessario che i finanziamenti siano coordinati ed usati nel migliore dei modi; è inconcepibile che i dati raccolti con dispendio di tempo e danaro rimangano inaccessibili.

La fiducia è il nocciolo della questione.(3)

Anche il BMJ si è occupato di recente della condivisione dei dati, pubblicando uno studio che analizza l’effettiva condivisione dati di alcuni RCT apparsi sulle sue pagine ed in quelle di PlosMed, che analogamente sostiene una politica attiva in tal senso. Lo studio porta tra le altre la firma di John Joannidis, epidemiologo molto noto anche ai NoGrazie per la sua visione critica sulla reale veridicità degli RCT.

Sono stati presi in considerazione 37 RCT (21 BMJ, 16 PlosMed) pubblicati fra il 2013 e 2016; 17 su 37 (46%) sono risultati soddisfare i criteri di disponibilità dei dati, mentre 30 su 37 (82%) sono stati effettivamente riprodotti con conferma degli stessi outcome principali. Queste in estrema sintesi le conclusioni. Il 46% di dati condivisibili è un buon risultato, anche se ben al di sotto dell’asticella del’80% ritenuta dagli autori come accettabile per una buona politica di pubblicazione. Si tratta certamente di un dato più ottimistico di quanto osservato in genere nella letteratura medica, in cui la pratica di condivisione appare pressoché assente.

Indipendentemente dalla buona volontà, vi sono state numerose altre difficoltà alla condivisione, nel contattare gli autori, nel preparare i dati, oppure nella disomogenea modalità di raccolta degli stessi, cosa che rende difficoltoso il ricalcolo. Esiste poi la mancanza di una definizione chiara e condivisa di cosa si intenda per “raw data”, cioè dei parametri disponibili nelle cartelle cliniche dei singoli pazienti. Se si parte soltanto dai dati pubblicati, elaborati e ‘ripuliti’, ben difficilmente si arriverà a riprodurre i risultati. Un esempio per tutti è lo studio 329 sulla paroxetina nella depressione infantile-adolescenziale, in cui soltanto la rielaborazione dei dati originali (ottenuti tra l’altro per via legale e ricalcolati proprio da Joannidis) ha permesso di sconfessare i risultati su efficacia e sicurezza del farmaco. Si veda al proposito quanto scritto da E. Pisani nella nostra Lettera36.

L’invito alla condivisione dei dati non è pratica diffusa. Alcune testate di prima grandezza (NEJM, Lancet, JAMA) solo di recente hanno approvato la politica di condivisione dei dati. Annals of Internal Medicine l’aveva incoraggiata già dal 2007, ma non in maniera vincolante. Questo va detto per non fare l’errore di estendere i risultati ottimistici dello studio a tutto il panorama editoriale biomedico. Va aggiunto poi che i buoni risultati di PlosMed si devono anche alla politica di condivisione adottata da gruppi e fondazioni (come quella di Bill e Melinda Gates) coinvolti in molti degli RCT pubblicati.

In ogni caso, se tutte le testate biomediche condividessero le stesse modalità e protocolli, si faciliterebbe di molto la condivisione dei dati, anche se i costi non indifferenti escluderebbero comunque le riviste più piccole, con budget modesti. E in ogni caso, un autore che crede nella veridicità dei propri dati non dovrebbe avere alcun timore di cederli a qualcun altro che voglia provare a riprodurli. In uno studio osservazionale su RCT raccolti con metodica casuale tra le pagine del BMJ nel periodo 2009/15, solo il 5% degli autori risultava aver condiviso i dati, e questo, rispetto all’analisi di questo studio, denota un sicuro aumento di tendenza.

Poco è stato scritto sui tentativi di riprodurre i dati di RCT già pubblicati. Da un’analisi empirica apparsa su JAMA nel 2014, solo il 35% (13/37) di chi ci aveva provato confermava i risultati originali, mentre i dati di questo studio parlano di un 82% di riproducibilità. Questa macroscopica differenza può essere ascritta al fatto che uno studio riprodotto con gli stessi risultati spesso non viene pubblicato, mentre è più facile lo sia in caso contrario, oppure non è riproducibile se vengono usati sistemi analitici differenti.

Dal 2019, le raccomandazioni del ICJME richiederanno espressamente la possibilità di condivisione dei dati sin dal momento della registrazione di un RCT, ma anche questo potrebbe non essere sufficiente. Se un autore ha pure aderito formalmente alla richiesta, può essere poi riluttante a farlo a causa delle spese aggiuntive e del tempo necessario per condividere i dati. Vedremo cosa succederà dopo il 2019; sarà importante anche la disponibilità dello sponsor a sostenere spese aggiuntive, mentre una nuova sensibilità dei pazienti potrebbe giocare un ruolo non secondario. Anche le modalità di ri-analisi non dovrebbero essere più un problema in quanto le linee guida per il reporting degli RCT (Consort Statement 2010) invitano espressamente a descrivere i metodi analitici con chiarezza sufficiente per facilitarne la riprova.

Oggi la privacy dei pazienti e la mancanza di un loro specifico consenso viene paventato come uno dei maggiori ostacoli all’open access, ma nessuno degli autori contattati per questo studio ha menzionato il problema. In ogni caso, la riproduzione positiva di un RCT è solo un primo passo, quello successivo sarà il riuso dei dati per ottenere nuovi risultati, che possano modificare un regime terapeutico, invece dei falsi positivi oggi ottenuti con la ri-analisi per sottogruppi. Nello stesso numero del BMJ sono pubblicati anche i due commenti riportati di seguito.

La fiducia deve essere un fatto evidente per tutti (the elefant is in the room).(4)

In questo editoriale, Milton Packer dell’Università di Dallas (Texas), sottolinea come dopo anni di dibattito si osservi la crescita di consenso nel mondo accademico sul problema della condivisione dei dati, considerata oggi parte integrante del lavoro di ricerca. Condurre un RCT rende implicito da parte del ricercatore un vero e proprio contratto sociale con il quale egli si impegna a condividere tutti gli elementi della ricerca fino ai dati dei singoli pazienti (i cosiddetti ‘raw data’). Voler riprodurre un RCT non significa mancanza di fiducia nei risultati espressi, ma miglioramento del progresso scientifico.

Perché allora le molte resistenze? Forse c’è qualcosa da nascondere, si potrebbe sospettare, e in effetti molti ricercatori hanno percepito la campagna sulla condivisione dei dati come una sorta di caccia alle streghe, una mancanza di fiducia nella scienza. Altri hanno rifiutato la condivisione per ragioni di opportunità, essendo la metodica molto gravosa e percepita al solo scopo di far verificare da qualcun altro le proprie conclusioni.

La fiducia è il nocciolo del problema; se non diventa un sentire diffuso, la condivisione dei dati sarà un processo lungo e faticoso. Come migliorare il senso di fiducia tra ricercatori, che dovrebbe essere dato per scontato? Le aziende farmaceutiche che vogliono commercializzare un loro prodotto sono obbligate a portare tutti i dati disponibili alle agenzie del farmaco per una loro attenta verifica. I singoli ricercatori dovrebbero fare eccezione? La condivisione dei dati è un processo complesso, costoso, che richiede tempo per essere implementato, ma che non arriverà mai a conclusione senza un clima di fiducia reciproca.

Condivisione dei dati: far fede alle promesse.(5)

Elizabeth Loder interviene con un commento editoriale dove sostiene come nulla danneggi di più la scienza quanto il sospetto che i dati di uno studio siano stati manipolati. Un RCT costa soldi e tempo, entrambi potrebbero essere risparmiati con la condivisione dei dati e la replicazione dei risultati. Il BMJ chiede perciò agli autori che pubblicano un RCT di facilitare la condivisone e che siano motivate chiaramente le ragioni del diniego, in caso di risposta negativa, ai richiedenti che motivino formalmente le ragioni della loro richiesta. Naudet e Joannidis, prosegue la Loder, hanno evidenziato come meno della metà degli autori abbia acconsentito a condividere i dati completi, anche se c’è stata una riproducibilità molto elevata di quanto condiviso. In alcuni casi altri autori avevano rifiutato adducendo il fatto che non era stata prevista una simile evenienza nei consensi informati. Un epidemiologo/statistico del BMJ ha calcolato in una settimana il tempo stimabile per la preparazione dei dati da condividere. La politica adottata dal BMJ richiederà esplicitamente agli autori che pubblicheranno un RCT di predisporre i dati da condividere e preparerà un protocollo chiaro da seguire per chi li richiedesse. Inoltre, si farà carico di eventuali pressioni sugli autori riluttanti alla concessione. La condivisione dei dati dovrebbe diventare una norma che conferisce maggiore credibilità ai dati scientifici. Il BMJ farà la sua parte e si aspetta altrettanto dai ricercatori.

A cura di Giovanni Peronato

  1. Bierer B et al. Data Authorship as an Incentive to Data Sharing. N Engl J Med 2016;376:1684-7
  2. Kiley R et al. Data Sharing from Clinical Trials: A Research Funder’s Perspective. N Engl J Med 2007; 377: 1990-2
  3. Naudet F, Johannidis J et al. Data sharing and reanalysis of randomized controlled trials in leading biomedical journals with a full data sharing policy: survey of studies published in the BMJ and PLOS Medicine. BMJ 2018;360:k400
  4. Packer M. Data sharing in medical research. Trust is the elephant in the room. BMJ 2018;360:k510
  5. Loder E. Data sharing: making good on promises. BMJ 2018;360:k710