Il Fenomeno Open Data INDICAZIONI E NORME PER UN MONDO DI DATI APERTI A CURA DI SIMONE ALIPRANDI Ledizioni ● Milano Questo libro è frutto del mash-up di articoli e documenti già pubblicati e rilasciati con licenze di libera ridistribuzione. La scelta dei materiali e la loro rielaborazione sotto forma di unico libro è stata curata da Simone Aliprandi. Ogni parte utilizzata mantiene il suo status di copyright originario con la rispettiva licenza. Dettagli in tal senso sono indicati nell’apposita sezione “Copyright e credits”. ISBN cartaceo: 978-88-6705-168-7 ISBN versione ePub: 978-88-6705-167-0 Il volume è disponibile in Open Access ed acquistabile nelle versioni ePub e cartacee a cura di Ledizioni Sommario Copyright e credits vii Prefazione di Morena Ragone 1 1. Open data: un'introduzione 5 2. Il particolare regime di tutela delle banche dati 25 3. I principali risvolti giuridici della public sector information 41 4. Il licensing di dati in modalità open 69 Appendice - Open Data Licensing (presentazione a slides) 83 Per approfondire 95 v Copyright e credits Questo libro è frutto del mash-up di articoli e documenti già pubblicati e rilasciati con licenze di libera ridistribuzione. La scelta dei materiali e la loro rielaborazione sotto forma di unico libro è stata curata da Simone Aliprandi. Si riportano di seguito le fonti originarie delle varie parti, con i rispettivi link e dati sul copyright. Il Capitolo 1 è tratto dal documento “Open Data Handbook” redatto dalla Open Knowledge Foundation e disponibile in versione italiana al sito http://opendatahandbook.org/it/. L’opera originaria è rilasciata con licenza Creative Commons Attribution 3.0 (Unported). Il Capitolo 2 è tratto dall’articolo “Open licensing e banche dati” di Simone Aliprandi, pubblicato sulla rivista “Informatica e diritto” (n. 1-2/2011) e disponibile al sito http://aliprandi.blogspot.it/2013/02/open-licensing-e-banche- dati.html. L’opera originaria è rilasciata con licenza Creative Commons Attribuzione – Condividi allo stesso modo 3.0 Italia. Il Capitolo 3 è tratto principalmente dal documento “Analisi delle policies di condivisione dei dati spaziali. Un inquadramento giuridico del tema open (geo)data” redatto da Simone Aliprandi e Carlo Piana per il Progetto FreeGIS.net e disponibile al sito http://aliprandi.blogspot.it/2013/06/freegis-D51-inquadramento- vii viii Il Fenomeno Open Data giuridico.html. Il documento originario è rilasciato con licenza Creative Commons Attribuzione – Condividi allo stesso modo 3.0 Italia. Il paragrafo 7 del Capitolo 3 è in parte tratto dal vademecum “Open Data. Come rendere aperti i dati delle pubbliche amministrazioni” curato da Formez PA e rilasciato nell’ottobre 2011. La fonte originaria è disponibile al sito http://focus.formez.it/content/vademecum-open-data-come- rendere-aperti-dati-delle-pubbliche-amministrazioni ed è rilasciata con licenza Creative Commons Attribuzione – Condividi allo stesso modo 3.0 Italia. Il Capitolo 4 è tratto principalmente dal documento “FreeGIS.net Data License. Indicazioni per la scelta e l’applicazione della licenza più adatta al rilascio di dati spaziali (da parte di enti pubblici)” redatto da Simone Aliprandi e Carlo Piana per il Progetto FreeGIS.net e disponibile al sito http://aliprandi.blogspot.it/2013/07/freegis-D52-D54-license- it.html. Il documento originario è rilasciato con licenza Creative Commons Attribuzione – Condividi allo stesso modo 3.0 Italia. L’immagine di copertina è stata tratta dall’account Flickr di Michael Mandiberg ed è rilasciata con licenza Creative Commons Attribution – Share Alike (vedi url originario: www.flickr.com/ photos/theredproject/3332644561/). La pagina web ufficiale relativa a questo libro è www.aliprandi.org/fenomeno-opendata. Prefazione di Morena Ragone Sono stati anni importanti, questi ultimi, per il movimento open data italiano. A partire dalla data, simbolica, del 18 ottobre 2011, con l’inaugurazione del portale italiano dei dati aperti – dati.gov.it – passi avanti ne sono stati fatti tanti. Un iter di poco più di due anni che ha visto, tra le tappe miliari, la riforma degli articoli 52 e 68 del Codice dell’amministrazione Digitale – con l’introduzione, nel nostro ordinamento, del principio dell’”Open Data by default” sul patrimonio informativo pubblico e di una definizione di “formato di dati di tipo aperto”, perfettamente compiuta nei suoi tre elementi giuridico, tecnico ed economico – la riforma della Public Sector Information directive 2003/98/CE ad opera della direttiva 2013/37/UE – con la valorizzazione dell’enorme patrimonio culturale europeo – ma, soprattutto ed al di là dei cambiamenti normativi – che, da giurista, non posso fare a meno di notare ed apprezzare – la nascita di una forte ed articolata community attorno ai dati aperti. Radicata su una serie di realtà ormai ben presenti sulla scena nazionale e non solo – penso a Spaghetti Open Data (SOD), ma anche al gruppo organizatore dell’Open Data Day italiano, alla comunità di Open Street Map quanto alle nuove, piccole ed 1 2 Il Fenomeno Open Data entusiaste realtà locali – la community è diventata il vero valore aggiunto della scena open data italiana. Ce ne siamo accorti già all’inizio del 2013, a Bologna, quando, nell’ambito del primo raduno organizzato da SOD, l’hackathon giuridico sulla revisione della PSI scoreboard – un questionario tecnico giuridico che attribuisce un punteggio ai membri UE in ragione di una pluralità di parametri valutativi dell’impatto e della diffusione dei dati aperti all’interno del Paese – ci ha mostrato una realtà fatta di studio, norme, riforme, ma, soprattutto, di attivismo e di gruppi locali, di competenze in rete e di condivisione. In una parola: openness, un substrato fortemente impiantato sul territorio, quasi completamente misconosciuto, costituito da tanti soggetti che finiscono, singolarmente presi, per fare da insiders all’interno delle singole realtà in cui vivono e lavorano, e che sono direttamente coinvolti da questo processo di cambiamento. Un cambiamento che è tecnico, giuridico, culturale e che, come ogni cosa bella e plurisfaccettata richiede un processo lungo e complesso. Ovviamente, è un processo che, per definizione, può avere un punto di partenza convenzionale, ma è privo di punto di arrivo, un processo in fieri. E visto che “non c’è cammino troppo lungo per chi cammina lentamente, senza sforzarsi; non c’è meta troppo alta per chi vi si prepara con la pazienza” (la citazione è di Jean de La Bruyère, I caratteri, 1688), possiamo dire di essere sulla buona strada. Ma veniamo alle note dolenti, che, se conosco bene l’autore di questa pubblicazione, non mancheranno di essere evidenziate: non più la penuria di dati – grazie, anche, al decreto “trasparenza” del 14 marzo 2013, n. 33, per diversi aspetti fuorviante nell’associare trasparenza e dati aperti fino a renderli un binomio inscindibile, come in più occasioni e sedi ho rilevato, ma sicuramente avente Prefazione 3 l’indubbio pregio di obbligare le Pubbliche Amministrazioni a pubblicare molti dataset in formato di dati di tipo aperto ai sensi della nuova definizione del Codice – ma il loro scarso utilizzo per le finalità specifiche cui è finalizzato l’open data. Non (solo e non tanto) trasparenza, quindi, ma riutilizzo dei dati come vera chiave di volta, al tempo stesso, dello sviluppo economico e sociale del Paese. Crescita, quindi, in tutte le accezioni possibili: la vera sfida dei prossimi anni sarà sì quella di trasformare questa valanga di dati in servizi, ma, soprattutto, quella di far crescere in tutti gli attori coinvolti – pubblico, privati, profit, terzo settore – la consapevolezza del valore di questi dati e della necessità della loro condivisione finalizzata al riutilizzo. Anche, ovviamente, al di là dei singoli obblighi normativi. 1. Open data: un'introduzione 1. Introduzione Conosci esattamente quanta parte delle tue tasse è destinata all’illuminazione stradale o alla ricerca contro il cancro? Qual’è l’itinerario più breve, sicuro e panoramico per raggiungere in bici il tuo ufficio da casa? E cosa c’è nell’aria che respiri durante il tragitto? Dove troverai le migliori opportunità di lavoro nella tua regione, e dove il maggior numero di alberi da frutta pro-capite? Quand’è che puoi influenzare attivamente le decisioni sui temi che ti stanno più a cuore e con chi dovresti parlarne? Le nuove tecnologie permettono di creare servizi per rispondere automaticamente a queste domande. Molti dei dati necessari a rispondere a queste questioni sono in effetti prodotti da organismi pubblici. Tuttavia spesso tali dati non sono disponibili in formati che li rendano facili da manipolare. Questo manuale vuole proporre una via per estrarre il potenziale dei dati ufficiali e di altre informazioni e rendere così possibili nuovi servizi, 5 6 Il Fenomeno Open Data migliorare la vita dei cittadini e far funzionare più efficientemente governi e società. La nozione di dati aperti – open data, e più specificatamente dati aperti del settore pubblico – open government data, intesa come informazione, pubblica o no, accessibile e riutilizzabile da chiunque e per qualunque fine, è utilizzata da diversi anni. L’uso comune del concetto inizia nel 2009, quando diversi governi (come gli Stati Uniti d’America, il Regno Unito, il Canada e la Nuova Zelanda) hanno annunciato nuove iniziative per l’apertura della loro informazione pubblica. Il presente manuale intende spiegare i concetti di base degli ‘open data’, specialmente in relazione ai governi. Si propone di illustrare come i dati aperti possono creare valore e avere un impatto positivo in molte aree. Oltre alle informazioni di base, il manuale fornisce istruzioni pratiche su come produrre dati aperti. 2. Perché dati aperti (open data)? Gli Open data, e in particolare gli open government data, sono una immensa risorsa ancora in gran parte inutilizzata. Molte persone e molte organizzazioni raccolgono, per svolgere i loro compiti, una vasta gamma di dati diversi. Quello che fa il Governo è particolarmente importante in questo senso, non solo per la quantità e centralità dei dati raccolti, ma anche perché la maggior parte dei dati governativi sono pubblici per legge, e quindi dovrebbero essere resi aperti e disponibili all’uso per chiunque. Perché questo ci interessa? Ci sono molte circostanze in cui possiamo attenderci che i dati aperti abbiano un valore rilevante e molti esempi in cui questo già accade. Ci sono anche numerose categorie di soggetti e organizzazioni che possono trarre beneficio dalla disponibilità di dati aperti, inclusa la pubblica amministrazione. Allo stesso Open data: un'introduzione 7 tempo non è possibile predire come e dove sarà creato valore. La caratteristica dell’innovazione e delle novità è di arrivare da luoghi inaspettati. È già possibile indicare un vasto numero di aree dove i dati pubblici aperti stanno creando valore. Tra di esse: • Trasparenza e controllo democratico; • Partecipazione; • accrescimento della propria influenza nella discussione pubblica; • miglioramento o creazione di prodotti e servizi privati; • Innovazione; • Miglioramento dell’efficienza dei servizi pubblici; • Miglioramento dell’efficacia dei servizi pubblici; • Misurazione dell’impatto delle politiche pubbliche; • Estrazione di nuova conoscenza dalla combinazione di diverse fonti di dati e dall’identificazione di regolarità che emergono dall’analisi di grandi masse di dati Esistono già esempi per la maggior parte di queste aree. Nell’ambito della trasparenza, progetti come il Finlandese ‘tax tree’ (l’albero delle tasse) e il Britannico ‘where does my money go’ (dove vanno i miei soldi) permettono di identificare come i soldi delle tasse dei cittadini sono impiegati dal governo. In Canada i dati aperti hanno fatto risparmiare 3.2 miliardi di dollari in un caso di frode fiscale legato alla beneficenza. Molti siti, tra cui il Danese Folketsting.dk e l’italiano Openparlamento.it, tracciano le attività dei parlamenti e il processo di formazione delle leggi, in modo da mostrare cosa succede esattamente e quali parlamentari sono coinvolti nelle varie attività. 8 Il Fenomeno Open Data I dati aperti governativi possono inoltre aiutare a prendere decisioni migliori nella nostra vita privata, o renderci più attivi nell’ambito della società civile. In Danimarca, una sviluppatrice ha creato Findtoilet.dk che permette di accedere alla lista di tutti i bagni pubblici del paese, così anche chi soffre di problemi di incontinenza ora si sente più rassicurato dovendo uscire di casa. In Olanda il servizio Vervuilingsalarm.nl ti avvisa quando la qualità dell’aria del tuo quartiere raggiunge una soglia critica da te definita. A New York puoi facilmente capire dove puoi portare a spasso il tuo cane, così come trovare altre persone che usano il tuo stesso parco. Servizi come ‘Mapumental’ nel Regno Unito e ‘Mapnificent’ in Germania ci fanno capire dove possiamo andare ad abitare impostando i tempi massimi di percorrenza casa/ufficio, i prezzi delle case e la bellezza del quartiere. Tutti questi esempi utilizzano dati aperti rilasciati dai governi. Anche dal punto di vista economico i dati aperti hanno un’enorme importanza. Svariati studi hanno stimato il valore economico dei dati aperti in diverse decine di miliardi di euro ogni anno, nella sola Europa. Nuovi prodotti e nuove aziende stanno ri-usando dati aperti. Il sito danese Husetsweb.dk aiuta a trovare i modi migliori di risparmiare energia elettrica in casa, inclusa la pianificazione finanziaria e la possibilità di contattare gli artigiani che potranno eseguire il lavoro. Funziona grazie al riutilizzo di dati catastali, a informazioni sugli incentivi governativi e al registro delle imprese locali. Google Translate usa l’enorme volume di documenti dell’Unione Europea, disponibili in tutte le lingue d’Europa, per allenare gli algoritmi di traduzione automatica, aumentando la precisione del servizio offerto. Anche per il governo stesso i dati aperti hanno un grande valore. Per esempio, possono aumentare l’efficienza. Il Ministero olandese dell’Istruzione ha pubblicato on-line tutti i dati relativi al sistema educativo consentendone il ri-uso. Da allora il numero di Open data: un'introduzione 9 domande ricevute è sceso, riducendo il carico di lavoro e i costi, e anche per i dipendenti pubblici è ora più facile rispondere alle domande residue, perché ora è chiaro dove possono essere trovati i dati che servono per rispondere. I dati aperti rendono anche il governo più efficace, il che in ultima analisi riduce anche i costi. Il dipartimento olandese per il patrimonio culturale sta attivamente rilasciando i propri dati e sta collaborando con le società amatoriali di storici e con gruppi come la Wikimedia Foundation per eseguire i propri compiti in modo più efficace. Ciò si traduce non solo in un miglioramento della qualità dei dati, ma anche in una riduzione delle dimensioni del dipartimento. Mentre ci sono numerosi esempi in cui i dati aperti stanno già creando vantaggi economici e sociali, ancora non sappiamo quali nuovi utilizzi saranno possibili in futuro. Nuove combinazioni di dati possono creare nuova conoscenza e nuove intuizioni, che possono portare a campi di applicazione inimmaginabili. Abbiamo visto nel passato, ad esempio, quando il dottor Snow scoprì la correlazione tra l’inquinamento dell’acqua potabile e il colera nella Londra dell’800, combinando i dati sui morti per colera con quelli sull’ubicazione dei pozzi. Il fatto portò alla costruzione del sistema fognario a Londra, migliorando di molto le condizioni generali di salute della popolazione. Probabilmente vedremo di nuovo nascere intuizioni simili dalla combinazione di insiemi diversi di dati aperti. Questo potenziale non sfruttato può essere utilizzato se facciamo diventare dati aperti i dati delle amministrazioni pubbliche. Questo accade solo, tuttavia, se l’apertura è completa, cioè se non ci sono limitazioni (giuridiche, finanziarie o tecnologiche) al riutilizzo da parte di altri. Ogni restrizione impedirà a qualcuno di ri-utilizzare i dati pubblici, e renderà più difficile il trovare altri modi preziosi di farlo. Perché il potenziale si realizzi, i dati pubblici devono essere aperti. 10 Il Fenomeno Open Data 3. Cosa sono i dati aperti (open data)? Ma cosa sono questi open data di cui si occupa questo manuale? In particolare, cos’è che rende aperti i dati e di quale tipo di dati stiamo parlando? Il presente manuale si occupa dei dati aperti, ma cosa sono esattamente i dati aperti? Per i nostri fini i dati aperti sono quelli che rientrano nella Open Definition: I dati aperti sono dati che possono essere liberamente utilizzati, riutilizzati e ridistribuiti da chiunque, soggetti eventualmente alla necessità di citarne la fonte e di condividerli con lo stesso tipo di licenza con cui sono stati originariamente rilasciati. La full Open Definition spiega nei dettagli cosa questo significhi. Gli aspetti più importanti sono: • Disponibilità e accesso: i dati devono essere disponibili nel loro complesso, per un prezzo non superiore ad un ragionevole costo di riproduzione, preferibilmente mediante scaricamento da Internet. I dati devono essere disponibili in un formato utile e modificabile. • Riutilizzo e ridistribuzione: i dati devono essere forniti a condizioni tali da permetterne il riutilizzo e la ridistribuzione. Ciò comprende la possibilità di combinarli con altre basi di dati. • Partecipazione universale: tutti devono essere in grado di usare, riutilizzare e ridistribuire i dati. Non ci devono essere discriminazioni né di ambito di iniziativa né contro soggetti o gruppi. Ad esempio, la clausola ‘non commerciale’, che vieta l’uso a fini commerciali o Open data: un'introduzione 11 restringe l’utilizzo solo per determinati scopi (es. quello educativo) non è ammessa. La ragione fondamentale per cui è importante chiarire il significato di “aperto” e del perché utilizzare proprio questa definizione, può essere identificata in un termine: interoperabilità. L’interoperabilità è la capacità di diversi sistemi e organizzazioni di lavorare insieme (Inter-operare). In questo caso, è la capacità di combinare una base di dati con altre. L’interoperabilità è importante perché permette a componenti diverse di lavorare insieme. L’abilità di rendere ciascun dato un componente e di combinare insieme vari componenti è essenziale per la costruzione di sistemi sofisticati. In assenza di interoperabilità ciò diventa quasi impossibile – come nel mito della Torre di Babele, in cui l’impossibilità di comunicare (e quindi di Inter-operare) dà luogo a un fallimento sistemico della costruzione della torre. Nel caso dei dati ci troviamo in una situazione simile. Il punto cruciale di un bacino di dati (o linee di codice) accessibili e utilizzabili in modo condiviso è il fatto che potenzialmente possono essere liberamente “mescolati” con dati provenienti da fonti anch’esse aperte. L’interoperabilità è la chiave per realizzare il principale vantaggio pratico dell’apertura: aumenta in modo esponenziale la possibilità di combinare diverse basi di dati, e quindi sviluppare nuovi e migliori prodotti e servizi (questo tipo di vantaggi sono esaminati in dettaglio nella sezione sul ‘perché’ fare open data) Fornire una chiara definizione di apertura assicura che sia possibile combinare dataset aperti provenienti da fonti diverse, evitando una nostra “Torre di Babele”: molti dataset, ma senza la possibilità di combinarli insieme in sistemi più ampi, dove si trova il vero valore dell’operazione. 12 Il Fenomeno Open Data Abbiamo già visto esempi di dati che sono stati o che possono diventare aperti, e altri ne incontreremo in seguito. È comunque utile delineare per sommi capi quali tipi di dati sono aperti, o potrebbero diventarlo e, cosa altrettanto importante, quali non sono adatti per essere aperti. La questione centrale è che nel momento si decida di rilasciare dati in formato aperto, ci si concentri su dati non personali, quelli cioè che non contengono informazioni su singoli individui. Allo stesso modo altre categorie di dati pubblici non possono essere aperte per ragioni di sicurezza nazionale. 4. Come aprire i dati Questa sezione costituisce il nucleo centrale del manuale: fornisce consigli concreti e dettagliati ai detentori di dati che intendano aprirli. Sono esaminate le questioni fondamentali e i principali rischi. Saranno infine discusse anche le problematiche più complesse che si possono presentare. Ci sono tre regole fondamentali che si consiglia di seguire nell’apertura dei dati: • Scegliere la semplicità. Cominciare con un progetto piccolo, semplice e veloce. Non è necessario aprire tutti i dati in una sola volta. Inizialmente va bene aprire anche un solo dataset, o anche una sua parte – naturalmente, più dati si aprono, meglio è. • Da ricordare che è innovazione. Muoversi il più in fretta possibile è bene, perché significa prendere slancio e imparare dall’esperienza – innovare comporta successi ed errori, e non tutte le banche dati saranno utili. Open data: un'introduzione 13 • Coinvolgere gli utenti fin dall’inizio e coinvolgerli spesso. Cercare presto e spesso il confronto con i potenziali utilizzatori dei dati fra cittadini, imprese o sviluppatori Ciò aumenterà la rilevanza dell’iniziativa durante tutto il suo percorso. È essenziale tenere presente che gran parte dei dati non raggiungeranno gli utenti finali direttamente, ma tramite ‘info- intermediari’. Queste sono le persone che prendono i dati e li trasformano o li remixano per la presentazione. Ad esempio, la maggior parte di noi non vuole o non ha bisogno di un grande database di coordinate GPS, preferiamo decisamente una mappa. Così coinvolgete da subito gli info-intermediari, in modo che essi possano riutilizzare e riadattare i vostri dati. Affrontare i timori e le incomprensioni diffuse. Questo è importante soprattutto se lavori in o con grandi organizzazioni come le istituzioni governative. Nell’aprire i dati sorgeranno molte domande e timori. È importante (a) identificare le più rilevanti, e (b) darvi una risposta il più presto possibile. Ci sono quattro passi principali per rendere i dati aperti, saranno tutte affrontate in dettaglio di seguito. Le abbiamo elencate in un ordine molto approssimativo – molti passi possono essere fatti contemporaneamente. 1. Scegliere i dataset. Scegliere ciò che si intende rendere aperto, ricordando che si può (ovvero potrebbe essere necessario), rivedere questo passaggio se si incontrano problemi nelle fasi successive. 2. Utilizzare una licenza open. Determinare quali sono i diritti di proprietà intellettuale che insistono sui dati e applicare una adeguata licenza ‘open’ che copra tutti i 14 Il Fenomeno Open Data diritti identificati, compatibile con la definizione di apertura discussa nella precedente sezione ‘Cosa è Open Data’. Nota: se ciò non è possibile, si ritorni al punto 1 e riprovare con una banca dati diversa. 3. Rendere i dati disponibili, in gran quantità e in un formato utile. Si possono prendere in considerazione anche metodi alternativi come la distribuzione attraverso API. 4. Pubblicare il tutto sul web e possibilmente organizzare un catalogo centrale dove elencare l’insieme dei dati aperti. 4.1. Scegliere le banche dati La scelta dei dati che si prevede di rendere aperti è il primo passo da compiere – anche se è bene ricordare che l’intero processo di apertura dei dati è iterativo e pertanto rimane possibile tornare indietro qualora si presentino problemi. Se si ha già esattamente un’idea di quali dati si prevede di aprire si può passare direttamente alla sezione successiva. In molti casi, tuttavia, soprattutto nel caso delle grandi istituzioni, stabilire con quale insieme di dati cominciare è sempre una sfida. Come si dovrebbe procedere in questo caso? Creare una lista potrebbe aiutare a velocizzare il processo di identificazione dei dati con cui cominciare il processo di apertura. In un momento successivo sarà possibile poi verificare nel dettaglio se tutte le banche dati sono adatte allo scopo. Non vi è alcun obbligo di creare un elenco completo dei dataset. Il punto principale da considerare è se sia possibile Open data: un'introduzione 15 pubblicare questi dati o meno (qualsiasi sia l’approccio scelto, aperto o meno) – si veda la sezione. Consultare la comunità E’ consigliabile in primo luogo consultare la comunità. I soggetti che accederanno ed utilizzeranno i dati sono infatti nella migliore posizione per identificare quali dati siano di particolare valore. Si può preparare un breve elenco di dataset potenziali su cui si desidera avere un feedback. Non è indispensabile che questa lista coincida con le vostre aspettative, l’intento principale è quello di avere una prima idea delle esigenze. L’elenco potrebbe ad esempio ispirarsi a cataloghi di open data di altri paesi. Creare una richiesta per ottenere commenti Pubblicizzare la richiesta di commenti in una pagina web e assicurarsi che sia possibile accedere alla richiesta attraverso l’URL indicato. In questo modo, in caso di condivisione attraverso social media, la richiesta risulterà facilmente reperibile. Le risposte devono poter essere inviate attraverso una procedura semplice. É da evitare la richiesta di commenti previa registrazione perché ciò riduce il numero di risposte. Utilizzare mailing list, forum e soggetti rilevanti per far condividere la richiesta attraverso un link diretto alla pagina web. Si può organizzare uno speciale evento di consultazione. É importante riuscire a trovare un orario conveniente per chi lavora in ufficio, nell’area commerciale e per gli sviluppatori. Chiedi a un politico di parlare per conto della tua agenzia. Gli open data sono spesso parte di più ampie politiche dirette ad aumentare l’accesso all’informazione governativa. 16 Il Fenomeno Open Data Costi base Quanti soldi spendono le agenzie per la raccolta e manutenzione dei dati in loro possesso? Se passano molto tempo su un particolare insieme di dati, allora è molto probabile che altri utenti vorrebbero accedervi. Questo discorso potrebbe certo suscitare timori di freeriding. La domanda cui bisogna rispondere è: “Perché consentire ad altri di ottenere nere gratuita ente informa tanto costose?”. La risposta è che questo costo viene già sopportato dal settore pubblico, nello svolgimento di una funzione particolare. E il costo di trasmettere i dati a terzi, dopo averli raccolti, è all’incirca nullo. Perciò, non si dovrebbe esigere nulla. Facilità di rilascio A volte, piuttosto che decidere quali dati sarebbero di maggior valore, potrebbe essere utile controllare quali dati siano più semplici da presentare al pubblico. Semplici rilasci di dati in piccole quantità possono più facilmente cambiare i comportamenti all’interno delle organizzazioni. É comunque necessario usare cautela nell’applicare questo approccio. Questi piccoli e veloci rilasci di dati potrebbero essere di così scarso interesse che non permettano di costruire nulla di utile. Se succede, il destino dell’intero progetto potrebbe essere segnato. Osserva i tuoi pari Open data è un movimento in crescita. Probabilmente nella vostra zona molte persone sanno cosa si sta facendo in altri settori. Fate una lista sulla base di ciò che stanno facendo questi gruppi. Open data: un'introduzione 17 4.2. Applicare una licenza aperta (apertura giuridica) Nella maggior parte delle legislazioni nazionali ci sono diritti di proprietà intellettuale che incidono sui dati e che quindi impediscono a terzi l’uso, il riutilizzo e la ridistribuzione dei dati senza un’autorizzazione esplicita. Anche nei casi in cui l’esistenza di diritti è incerta, è importante applicare una licenza per motivi di chiarezza. Così, se stai progettando di rendere i tuoi dati disponibili, è opportuno preoccuparsi di applicarvi una licenza d’uso; e se volete che i vostri dati siano “aperti”, questo è ancora più importante. Sull’aspetto del licensing si rimanda ad apposito capitolo di questo libro e all’appendice. 4.3. Rendere i dati disponibili (Aspetti Tecnici) Gli Open data devono essere aperti, sia dal punto di vista tecnico che da quello legale. In particolare i dati devono essere disponibili in grande quantità in un formato machine-readable. Available I dati dovrebbero essere disponibili ad una tariffa non superiore al ragionevole costo per la loro riproduzione, e preferibilmente come download gratuito da Internet. Questo modello di tariffa è raggiunto qualora l’ente non sostenga alcun costo aggiuntivo nel fornire dati da utilizzare. In bulk I dati dovrebbero essere disponibili come insieme completo. Se ad esempio si dispone di un registro mantenuto per obblighi di legge, allora l’intero registro dovrebbe essere disponibile per il download. 18 Il Fenomeno Open Data Una API web o un servizio simile possono essere molto utili, ma non possono sostituire l’accesso diretto ai dati. In un formato aperto e machine-readable Il ri-uso dei dati in possesso del settore pubblico non dovrebbe essere soggetto a restrizioni di brevetto. E, ancora più importante, fornire i dati in formato “machine-readable” consente un loro maggior riutilizzo. Per chiarire ciò, si consideri il caso di statistiche pubblicate come documenti PDF, spesso utilizzati per la stampa di alta qualità. Anche se queste statistiche possono essere lette da esseri umani, è molto difficile renderle utilizzabili dai computer e questo limita pesantemente la capacità da parte di altri di riutilizzare quei dati. Di seguito una serie di politiche che possono essere di grande beneficio: • scegliere la semplicità, • rilasciare velocemente ed • essere concreti. In particolare, è meglio rilasciare dati grezzi subito piuttosto che dati perfetti dopo sei mesi. Ci sono molti modi per rendere i dati disponibili per gli altri. Il più naturale nell’era di Internet è la pubblicazione online. Ci sono molte varianti a questo modello. Nella sua forma elementare, gli enti pubblici rendono disponibili i loro dati attraverso i loro siti web e un catalogo centrale convoglia i visitatori verso la fonte appropriata. Tuttavia, esistono diverse alternative. Quando la connettività è limitata o la dimensione dei dati è enorme, può essere opportuno distribuire i dati in altri modi. Questa sezione illustra le varie alternative disponibili, tenendo conto della necessità di mantenere molto bassi i prezzi. Open data: un'introduzione 19 Attraverso un sito web esistente Il sistema più familiare per chi si occupa dei contenuti web di siti istituzionali pre-esistenti, è fornire file da scaricare dalle pagine web. Tali siti possono ospitare senza problemi i file di dati, visto che già forniscono accesso a documenti di discussione. Una problematicità di questa scelta consiste nella difficoltà per un soggetto esterno al sito di reperire le informazioni aggiornate. Questa opzione pone quindi un peso rilevante sulle spalle di quanti sviluppino strumenti con i dati offerti. Attraverso siti di terze parti Molti repository (archivi online) sono diventati luoghi di raccolta di dati relativi a particolari settori. Per esempio, pachube.com è progettato per connettere soggetti interessati ai dati generati tramite dispositivi e applicazioni dotati di sensori in ambienti interattivi. Siti come Infochimps.com e Talis.com consentono agli enti del settore pubblico di immagazzinare gratuitamente una enorme quantità di dati . I siti di terze parti possono risultare molto utili. Ciò per la principale ragione che già sono contemporaneamente un riferimento per una comunità di soggetti interessati e un punto di raccolta per altri insiemi di dati. Qualora i dati del sito istituzionale entrassero a far parte di tali piattaforme, si crea un tipo di integrazione positiva. Piattaforme per l’offerta in massa di dati già costituiscono un’infrastruttura in grado di supportare la potenziale domanda. Spesso forniscono strumenti di analisi e informazioni sul tipo di uso. Per gli enti del settore pubblico, inoltre, sono generalmente gratuite. Tali piattaforme possono avere due costi. Il primo è l’indipendenza. L’ente deve essere in grado di cedere il controllo 20 Il Fenomeno Open Data ad altri attori. Questo è spesso politicamente, legalmente o operativamente difficile. Il secondo tipo di costo riguarda l’apertura. Bisogna assicurarsi che la piattaforma scelta per depositare i dati sia neutrale rispetto a chi può accedervi. Gli sviluppatori di software e i ricercatori usano diversi sistemi operativi, dagli smartphone ai supercomputer. Tutti dovrebbero essere in grado di accedere ai dati. Attraverso server FTP Un metodo meno alla moda per fornire accesso ai file avviene tramite il File Transfer Protocol (FTP). Tale approccio può essere adatto se il pubblico è tecnico, come nel caso di sviluppatori di software e ricercatori. Il sistema FTP funziona in sostituzione del protocollo HTTP, ed è specificamente progettato per supportare il trasferimento di file. FTP è caduto in disuso. Non è visualizzabile come un sito web, ma l’accesso ad un server FTP è molto simile alla navigazione delle risorse e cartelle su un computer. Pertanto, anche se idoneo allo scopo, non offre molte possibilità per sviluppare visualizzazioni personalizzate per l’accesso ai dati. Come file torrent BitTorrent è un sistema divenuto familiare ai politici a causa della sua associazione con il concetto di violazione del diritto d’autore. BitTorrent utilizza dei file chiamati torrent, e funziona ripartendo la distribuzione di un file tra tutte le persone che lo stanno scaricando al momento. Invece di sovraccaricare i server, all’aumentare della domanda cresce anche l’offerta. Questa è la ragione del successo di questo sistema per la condivisione di film. Si tratta infatti di una soluzione meravigliosamente efficiente per distribuire grandi volumi di dati. Open data: un'introduzione 21 Attraverso una API I dati possono essere pubblicati attraverso una API (Application Programming Interface). Queste interfacce sono diventate molto popolari. Permettono ai programmatori di selezionare specifiche porzioni di dati, piuttosto che fornire tutti i dati in massa sotto forma di grandi file. Le API sono tipicamente collegate ad un database aggiornato in tempo reale. Ciò significa che rendere le informazioni disponibili tramite una API permette di garantire l’accesso a dati sempre aggiornati. Pubblicare dati grezzi in massa dovrebbe essere l’interesse principale di tutte le iniziative open data. Ci sono una serie di costi nel fornire una API: Il prezzo. Le API richiedono più sforzo di sviluppo e manutenzione rispetto all’offerta di semplici file. Le aspettative. Al fine di promuovere una comunità di utenti nell’ambito del sistema, è importante garantirne la sicurezza. Nel caso di problemi, si dovranno sostenere i costi per risolverli. L’accesso in massa ai dati assicura i seguenti aspetti: - nessuna dipendenza dal fornitore originale dei dati, vale a dire che i dati rimangono disponibili, anche in presenza di ristrutturazioni o tagli di bilancio; - chiunque può ottenere una copia e ridistribuirli. Ciò riduce e sposta i costi di distribuzione dall’ente di provenienza sorgenti e implica che non si crei un punto unico di fallimento; - altri soggetti possono sviluppare i propri servizi utilizzando i dati, perché hanno la certezza che i dati non saranno loro tolti. L’offerta in massa di dati permette ad altri soggetti di utilizzare i dati al di là del loro scopo originale. Ad esempio, possono essere convertiti in un nuovo formato, o collegati con altre risorse oppure offerti in versioni diverse o archiviati in più luoghi. Mentre la versione corrente dei dati sarà resa disponibile 22 Il Fenomeno Open Data attraverso API, i dati grezzi dovrebbero essere resi disponibili in massa a intervalli regolari. Ad esempio, il servizio statistico Eurostat ha un servizio che permette di scaricare oltre 4000 file di dati. È aggiornato due volte al giorno, offre dati in formato valori separati da tabulatore (TSV), e include documentazione sulle modalità di download e sui dati. Un altro esempio è il `Catalogo dati del distretto di Columbia`, che consente di scaricare i dati in formato CSV ed XLS in aggiunta ad un feed in tempo reale dei dati. 4.4. Rendere i dati individuabili Open data senza utenti è nulla. Si deve garantire che il pubblico possa rinvenire il materiale. Questa sezione vuole offrire diversi approcci in tal senso. La cosa più importante è fornire uno spazio neutrale in grado di superare sia le diverse politiche dei vari enti sia i futuri cicli di bilancio. Conflitti di competenza, sia settoriali che geografici, possono rendere difficile la cooperazione. Tuttavia, ci sono vantaggi significativi nell’unire le forze. Se sarà più facile per gli esterni scoprire i dati, più velocemente saranno costruiti nuovi strumenti utili. Strumenti esistenti Esistono una serie di strumenti già presenti sul web che sono specificamente progettati per rendere i dati facilmente trovabili. Uno di quelli di maggior successo è DataHub ed è un catalogo e deposito di dati di dataset provenienti da ogni parte del mondo. Il sito rende facile, per singole persone ed organizzazioni il modo di pubblicare il materiale e agli utenti di trovare i dati che a loro servono. Open data: un'introduzione 23 In aggiunta, ci sono decine di cataloghi specializzati per settori e luoghi differenti. Molte comunità scientifiche hanno creato un sistema di catalogo per i loro campi, visto che spesso è obbligatorio pubblicare i dati delle loro ricerche. Per le istituzioni di governo È diventata comune la pratica di avere un’ente capofila che crei un catalogo dei dati pubblici. Durante la creazione di questo catalogo, è opportuno creare una qualche struttura che consenta ai vari Dipartimenti di mantenere aggiornate le loro informazioni. Resistete alla tentazione di costruire il software per supportare il catalogo da zero. Ci sono soluzioni di software libero open source (come ad esempio CKAN) che sono state scelte da molti governi. Per tale motivo, investire in un’altra piattaforma potrebbe essere non necessario. Ci sono molte cose che mancano nella maggior parte dei cataloghi open data. La piattaforma da implementare dovrebbe considerare quanto segue: • Offrire la possibilità ai privati o comunità di aggiungere i propri dati. Può essere utile pensare al catalogo come il catalogo della regione, piuttosto che del Governo della Regione. • Facilitando il miglioramento dei dati permettendo derivati dei dataset da catalogare. Per esempio, qualcuno potrebbe geocodificare gli indirizzi e probabilmente voler condividere questo risultati con altri. Se si permettono versioni singoli di dataset, questi miglioramenti rimarranno nascosti. 24 Il Fenomeno Open Data • Essere tolleranti se i dati appaiono altrove. Questo vuol dire che il contenuto probabilmente si troverà duplicato nelle comunità di interesse. Se si dispone di dati sul monitoraggio dei livelli de fiume, è probabile che i dati appariranno in un catalogo per idrologi. • Garantire un accesso equo. Evitare di creare un livello privilegiato di accesso per funzionari pubblici o ricercatori di ruolo questo potrebbe mettere in difficoltà la partecipazione e la crescita della comunità. Per la società civile Bisogna considerare l’opportunità di creare un catalogo supplementare con dati non-ufficiali. È molto raro che i governi si associno a fonti non ufficiali o non autorevoli. I funzionari sostengono spesso spese considerevoli per essere sicuri di evitare l’imbarazzo politico o altri danni causati da un uso improprio o sovrastimato dei dati. Inoltre, è improbabile che i governi siano disposti a sostenere attività che mescolano le proprie informazioni con quelle provenienti da ambiti commerciali. I governi sono giustamente scettici sui moventi legati al profitto. Pertanto, un catalogo indipendente per i gruppi relativi a comunità, imprese e altri soggetti potrebbe essere giustificato. 2. Il particolare regime di tutela delle banche dati 1. Introduzione: dati e banche dati Come sappiamo, le tecnologie digitali permettono di gestire, archiviare e processare quantità enormi di informazioni. Ciò che pochi anni fa necessitava il contributo di molte persone può essere fatto da un semplice software automatizzato; ciò che pochi anni fa richiedeva intere stanze per la sua archiviazione, oggi può essere memorizzato in un supporto USB di pochi centimetri; ciò che pochi anni fa richiedeva intere giornate di lavoro oggi è facilmente risolvibile in pochi minuti. Tempo, spazio e fatica sono stati estremamente ridotti, a vantaggio di una sempre crescente disponibilità di dati e sempre più numerose possibilità di gestione degli stessi. Ma che cosa si intende di preciso per “dato”? Il vocabolario online Treccani fornisce una definizione alquanto efficace: “ciò che 25 26 Il Fenomeno Open Data è immediatamente presente alla conoscenza, prima di ogni forma di elaborazione”.1 Faccio una precisazione che a qualcuno potrà sembrare banale ma che ritengo importante per evitare pericolosi fraintendimenti. Il linguaggio comunemente usato in campo informatico spesso induce a creare confusione sul reale significato di “dati”. C’è infatti la tendenza a parlare genericamente di “dati” in riferimento a tutto il materiale memorizzabile su un disco fisso o su altro supporto digitale, indipendentemente che si tratti di film, brani musicali, documenti, immagini… Dal punto di vista del linguaggio giuridico (di cui è necessario tenere conto in una riflessione come questa) “dati” ha una portata semantica più ristretta e si riferisce appunto solo alle singole e isolate informazioni, non organizzate e non elaborate dall’ingegno umano. Queste, in quanto singole informazioni deducibili dalla natura delle cose, non sono sottoposte ad alcuna tutela e privativa diretta. Dunque la proprietà intellettuale non si occupa tanto di dati quanto piuttosto di banche dati (o di database nell’accezione inglese), ed è molto importante tenere sempre presente questa distinzione. Un’altra definizione può tornare utile, ovvero quella di database che si trova su Wikipedia: “in informatica, il termine database, banca dati o base di dati, indica un insieme di archivi collegati secondo un particolare modello logico (relazionale, gerarchico o reticolare) e in modo tale da consentire la gestione dei dati stessi (inserimento, ricerca, cancellazione ed aggiornamento) da parte di particolari applicazioni software dedicate”.2 1. Cfr. http://www.treccani.it/vocabolario/dato/. Più avanti la definizione riporta anche: “Con uso più generico, elemento, in quanto offerto o acquisito o risultante da indagini e utilizzato a determinati scopi”. 2. Cfr. http://it.wikipedia.org/wiki/Database. Il particolare regime di tutela delle banche dati 27 Pur trattandosi di una definizione rivolta al mondo informatico più che giuridico, essa è sufficiente a darci conferma che “dati” e “banca dati” sono effettivamente due concetti non sovrapponibili. Di conseguenza possiamo affermare che i “dati” sono oggetto di regolamentazione e tutela da parte del diritto della proprietà intellettuale solo quando si presentano come sistemi organizzati.3 Come vedremo più avanti, in Europa con l’avvento negli anni 90 di una normativa ad hoc per la tutela dei database, il concetto di database è stato ulteriormente precisato e approfondito da parte della scienza giuridica.4 Ovviamente non è casuale che l’esigenza di interrogarsi sull’opportunità di un particolare trattamento legale per i database sia emersa solo negli ultimi decenni: ciò è appunto strettamente connesso alle nuove possibilità di raccolta, organizzazione e fruizione di grandi quantità di dati derivanti dalle tecnologie digitali e alle opportunità commerciali basate su questo tipo di attività. 2. Il particolare trattamento legale per i database in Europa La tutela delle banche dati rappresenta uno degli aspetti di maggior disallineamento tra il sistema giuridico americano e quello europeo. Nel 1996 infatti una direttiva CE ha introdotto un particolare tipo di diritto non assimilabile né al concetto di copyright né a quello di diritto d’autore, e proprio per questo 3. Restano però sempre applicabili le tutele più strettamente relative all’ambito del segreto industriale e della concorrenza sleale. 4. Si veda a tal proposito la definizione fornita all’art. 1.2. dalla Direttiva 96/9/CE: “Ai fini della presente direttiva per ‘banca di dati’ si intende una raccolta di opere, dati o altri elementi indipendenti sistematicamente o metodicamente disposti ed individualmente accessibili grazie a mezzi elettronici o in altro modo”. 28 Il Fenomeno Open Data denominato dalla dottrina “diritto sui generis”. Tale diritto crea particolari problemi di gestione ed enforcement e permette agli operatori europei di vantare una tutela più forte sulle banche dati (e di riflesso quindi anche sui dati in esse contenuti) rispetto agli operatori statunitensi. Da ciò deriva anche il fatto che il dibattito sull’open data ha avuto origine ed è stato più sentito in Europa rispetto ad altri paesi. 2.1. Prima della direttiva del 1996 sui database La banca dati può essere in un certo senso equiparata alle opere collettive, categoria già nota al diritto d’autore prima ancora delle riforme degli anni novanta. In generale infatti la Convenzione di Berna e tutte le normative nazionali ad essa ispirate includono fra le tipologie di opere tutelate dal nostro ordinamento anche quelle realizzate attraverso la raccolta di altre opere autonome dall’opera collettiva. Questo è infatti il testo dell’art. 2(5) della Convenzione di Berna: “Le raccolte di opere letterarie o artistiche come le enciclopedie e le antologie che, per la scelta o la disposizione della materia, abbiano carattere di creazioni intellettuali sono protette come tali, senza pregiudizio del diritto d’autore su ciascuna delle opere che fanno parte delle raccolte stesse”.5 5. Cfr. http://www.interlex.it/testi/convberna.htm. A tal proposito si veda anche l’art. 5 del WIPO Copyright Treaty del 1996: “Compilations of Data (Databases) – Compilations of data or other material, in any form, which by reason of the selection or arrangement of their contents constitute intellectual creations, are protected as such. This protection does not extend to the data or the material itself and is without prejudice to any copyright subsisting in the data or material contained in the compilation”. Il particolare regime di tutela delle banche dati 29 Colui che effettua la selezione, la raccolta e la disposizione secondo specifici criteri creativi detiene quindi un diritto d’autore a sé stante rispetto a quello delle singole opere raccolte. Con l’avvento delle nuove modalità di memorizzazione e di gestione tecnologica delle informazioni, i database sono diventati una parte fondamentale dell’attività di produzione culturale e tecnica. Dunque il mondo del diritto ha iniziato ad interrogarsi se fosse necessario prevedere specifiche forme di tutela di questa nuova categoria di creazioni, o se al contrario fosse sufficiente applicarvi (in maniera estensiva) le categorie e i principi già esistenti nel diritto d’autore. 2.2. L’inadeguatezza della tutela di diritto d’autore in senso stretto Già da una prima lettura della norma si può afferrare agevolmente che la definizione di opere collettive (nel senso di collezioni di opere) si riferisce a fenomeni non sempre equiparabili ad una banca dati. Non tutte le banche dati possiedono il requisito della scelta e della disposizione del materiale secondo criteri creativi; “non in particolare quelle che, proponendosi di fornire tutte le informazioni disponibili su un dato argomento, non attuano alcuna selezione e che presentano le informazioni stesse secondo un ordine banale o imposto da esigenze informative”.6 Inoltre esiste un altro “tallone di Achille” del diritto d’autore nella sua applicazione ad opere atipiche come le banche dati: il principio per cui il diritto d’autore copre solo la forma espressiva di un’opera, cioè il modo con cui l’autore ha espresso la sua idea e non l’idea in sé. Dunque specialmente in questo caso, sulla base 6. P. AUTERI, Diritto d’autore, in AA.VV., “Diritto industriale. Proprietà intellettuale e concorrenza”, Torino, Giappichelli, 2005, parte VI, pp. 505-508. 30 Il Fenomeno Open Data del solo diritto d’autore, un altro soggetto potrebbe utilizzare i contenuti della banca dati modificandone il criterio di disposizione e organizzazione, realizzando a tutti gli effetti un’opera diversa dal punto di vista giuridico, ma ripetitiva e “parassitaria” nella sostanza. Con la sola applicazione del diritto d’autore un’ampia fetta di banche dati rimarrebbe priva di tutela giuridica; rimarrebbe solo la tutela derivante dai principi della concorrenza sleale o l’eventuale applicazione di sistemi tecnologici di protezione. Ciò è stato considerato insufficiente da parte del legislatore comunitario, il quale, dopo un acceso dibattito sull’opportunità di questa scelta, ha deciso di attivarsi con un’apposita direttiva. Tale scelta è stata sostenuta dall’idea secondo cui certi tipi di banche dati, che per loro natura sarebbero escluse dal campo d’azione del diritto d’autore, richiedono comunque un grande investimento da parte di soggetti specializzati e quindi questo investimento rimane di per sé meritevole di essere tutelato e di conseguenza incentivato.7 2.3. Un duplice livello di tutela: la direttiva del 1996 e il diritto sui generis Dunque il legislatore europeo nel 1996 ha deciso di delineare un particolare modello di tutela, secondo il quale le banche dati devono essere sottoposte a un duplice livello di protezione. Con la Direttiva n. 96/9/EC, da un lato le banche dati sono state 7. Si leggano a tal proposito i Considerando 7 e 12 della Direttiva: (7) considerando che per poter creare una banca di dati è necessario investire considerevoli risorse umane, tecniche e finanziarie, mentre è possibile copiarle o accedervi ad un costo molto più basso rispetto a quello richiesto per crearle autonomamente; (12) considerando che tale investimento nei moderni sistemi di memorizzazione e gestione delle informazioni non sarà effettuato all’interno della Comunità a meno che non venga introdotta una tutela giuridica stabile ed uniforme per tutelare i costitutori di banche di dati. Il particolare regime di tutela delle banche dati 31 formalmente inserite tra le categorie di opere dell’ingegno tutelate da diritto d’autore previste dalla normativa comunitaria; dall’altro lato sono stati creati appositi diritti per il costitutore della banca dati. Come fa notare Paolo Auteri “la prima tutela [copyright] ha ad oggetto la ‘forma espressiva’ e cioè il modo in cui il materiale informativo è selezionato e disposto; la seconda invece ha ad oggetto il contenuto informativo, o meglio l’insieme delle informazioni nella misura in cui la ricerca, la verifica e la presentazione abbia richiesto un investimento rilevante”.8 Il testo della direttiva consta in sedici articoli suddivisi in quattro Capitoli. Il Capitolo II è dedicato appunto alla protezione delle banche dati intese come creazione dell’ingegno propria del loro autore9 e da tutelare quindi con copyright. Fin qui la direttiva non fa altro che chiarire e sancire formalmente ciò che era facilmente già deducibile dai principi del copyright. La parte davvero innovativa (e anche la più criticata) della direttiva è invece il Capitolo III nel quale vengono istituiti nuovi diritti per la tutela delle banche dati prive di carattere creativo e quindi non considerate a pieno titolo opere dell’ingegno. Tali diritti (generalmente denominati con la locuzione latina “diritto sui generis”, proprio ad indicare la loro peculiarità rispetto ai diritti d’autore e ai diritti connessi) sono diritti esclusivi che sorgono in capo ad un soggetto definito dalla norma “costitutore della banca dati”, si riferiscono all’investimento sostenuto per la realizzazione del database (e non all’apporto creativo come nel caso dei diritti d’autore e dei diritti connessi) e durano 15 anni dalla costituzione della banca dati.10 I principi della direttiva sono poi stati recepiti dagli stati membri della UE e sono divenuti parte integrante nelle 8. P. AUTERI, Diritto d’autore, cit. 9. Art. 3.1: “A norma della presente direttiva, le banche di dati che per la scelta o la disposizione del materiale costituiscono una creazione dell’ingegno propria del loro autore sono tutelate in quanto tali dal diritto d’autore. Per stabilire se alle banche dati possa essere riconosciuta tale tutela non si applicano altri criteri”. 32 Il Fenomeno Open Data normative nazionali, rendendo così l’assetto normativo di tutta l’Unione europea abbastanza uniforme. Nel Capitolo III dedicato al diritto sui generis sono descritte due fondamentali attività di competenza del “costitutore” e sulle quali appunto vengono esercitati questi diritti: la estrazione dei dati dal database (intesa come “il trasferimento permanente o temporaneo della totalità o di una parte sostanziale del contenuto di una banca di dati su un altro supporto con qualsiasi mezzo o in qualsivoglia forma”) e il re-impiego dei dati (inteso invece come “qualsiasi forma di messa a disposizione del pubblico della totalità o di una parte sostanziale del contenuto della banca di dati mediante distribuzione di copie, noleggio, trasmissione in linea o in altre forme”).11 In altri termini, il costitutore ha il diritto esclusivo di controllare per 15 anni queste attività sul database (o su una sua parte sostanziale) da lui realizzato e messo a disposizione del pubblico. Ciò – appunto – avviene anche quando si tratti di un database senza carattere creativo, ma che abbia comunque richiesto un investimento rilevante sotto il profilo qualitativo o quantitativo. 2.4. Struttura e contenuti principali della direttiva del 1996 Riprendiamo in questa sede solo i suoi fondamenti come descritti dalla direttiva 96/9/CE che lo ha istituito. Il testo della direttiva consta di sedici articoli suddivisi in quattro capitoli. Il Capitolo II è dedicato appunto alla protezione delle banche dati intese come opera dell’ingegno di carattere 10. Per la precisione, l’art. 10.1 della direttiva recita: “Il diritto di cui all’articolo 7 produce i propri effetti non appena completata la costituzione della banca di dati. Esso si estingue trascorsi quindici anni dal 1° gennaio dell’anno successivo alla data del completamento”. 11. Si veda art. 7 – Oggetto della tutela. Il particolare regime di tutela delle banche dati 33 creativo e da tutelare quindi con copyright. Fin qui la Direttiva non fa altro che chiarire e sancire formalmente ciò che era facilmente già deducibile dai principi del copyright. Nel Capitolo III vengono invece istituiti nuovi diritti per la tutela delle banche dati prive di carattere creativo e quindi non considerate a pieno titolo opere dell’ingegno. Tali diritti (appunto denominati generalmente con la locuzione latina “diritto sui generis”, proprio ad indicare la loro peculiarità rispetto ai diritti d’autore e ai diritti connessi) sono diritti esclusivi che sorgono in capo ad un soggetto definito dalla norma “costitutore della banca dati”, si riferiscono all’investimento sostenuto per la realizzazione del database (e non all’apporto creativo come nel caso dei diritti d’autore e dei diritti connessi) e durano 15 anni dalla costituzione della banca dati. I principi della direttiva sono poi stati recepiti dagli stati membri della UE e sono divenuti parte integrante nelle normative nazionali, rendendo così l’assetto normativo di tutta l’Unione europea abbastanza uniforme. Sempre nel Capitolo III sono descritte due fondamentali attività riservate al “costitutore” e sulle quali appunto vengono esercitati questi diritti: l’estrazione dei dati dal database (intesa come “il trasferimento permanente o temporaneo della totalità o di una parte sostanziale del contenuto di una banca di dati su un altro supporto con qualsiasi mezzo o in qualsivoglia forma”) e il re-impiego dei dati (inteso invece come “qualsiasi forma di messa a disposizione del pubblico della totalità o di una parte sostanziale del contenuto della banca di dati mediante distribuzione di copie, noleggio, trasmissione in linea o in altre forme”). In altri termini, il costitutore ha il diritto esclusivo di controllare per 15 anni queste attività sul database (o su una sua parte sostanziale) da lui realizzato e messo a disposizione del pubblico. Ciò – appunto – avviene anche quando si tratti di un database senza carattere creativo, ma che abbia comunque 34 Il Fenomeno Open Data richiesto un investimento rilevante sotto il profilo qualitativo o quantitativo. Spostando il punto di vista dalla parte dell’utente della banca dati, la direttiva precisa che “il costitutore non può impedire all’utente legittimo della stessa di estrarre e reimpiegare parti non sostanziali, valutate in termini qualitativi o quantitativi, del contenuto di tale banca di dati per qualsivoglia fine.” Dal canto suo, l’utente legittimo non può eseguire operazioni che siano in contrasto con la normale gestione della banca di dati o che arrechino un eccessivo pregiudizio ai legittimi interessi del costitutore della stessa. 2.5. Categorie di database secondo i livelli di tutela Per effetto dei principi posti dalla direttiva e quindi dei diversi casi di sovrapposizione fra i due livelli di tutela, possiamo delineare queste categorie di database tutelati dalla normativa europea: Tipo 1. Database con carattere creativo contenente opere creative • protetto da copyright su due livelli indipendenti l’autore del database detiene i diritti d’autore in merito alla sua strutturazione e alla particolare organizzazione dei contenuti; gli autori dei singoli contenuti detengono il diritto d’autore sui singoli contenuti in modo totalmente indipendente. Tipo 2. Database con carattere creativo contenente semplici dati • protetto su due livelli diversi (diritto d’autore e diritto sui generis) Il particolare regime di tutela delle banche dati 35 l’autore del database detiene i diritti d’autore in merito alla sua strutturazione e alla particolare organizzazione dei contenuti; lo stesso autore veste anche il ruolo di costitutore e detiene il diritto sui generis per quanto riguarda l’estrazione e il reimpiego di parti sostanziali del database. Tipo 3. Database senza carattere creativo contenente semplici dati, ma che comunque ha richiesto un investimento rilevante • tutelato solo dal diritto sui generis il costitutore del database detiene il diritto sui generis per quanto riguarda l’estrazione e il reimpiego di parti sostanziali di dati.12 Da questa schematizzazione si coglie quanto sia importante aver sempre ben presenti i due livelli di tutela, specialmente quando ci si deve occupare del licenziamento di un database. Dovremo quindi avere le idee molto chiare su quali diritti e quali oggetti intendiamo licenziare; nello stesso tempo dovremo cercare di comunicare con la massima chiarezza le nostre intenzioni ai licenziatari, specificando espressamente se ci stiamo riferendo al database in sé, ai suoi contenuti, o ad entrambi. Il fattore determinante per la suddivisione in queste tre tipologie è – come spesso accade nel diritto d’autore – la presenza del carattere creativo. Non è possibile procedere a un approfondimento in questa sede; si rimanda quindi alla lettura 12. Potrebbero inoltre verificarsi casi ancor più complessi di database con caratteristiche ibride in cui ad esempio esso sia l’ensemble di altri database a sé stanti, oppure in cui al suo interno si trovino sia opere coperte da copyright che in pubblico dominio. 36 Il Fenomeno Open Data di fonti più specialistiche e allo studio della giurisprudenza in materia di tutela dei database.13 3. Banche dati e pubblico dominio L’art. 10 della direttiva sancisce che il diritto sui generis “produce i propri effetti non appena completata la costituzione della banca di dati e si estingue trascorsi quindici anni dal 1° gennaio dell’anno successivo alla data del completamento.” Trascorso questo termine, la banca dati cade nel pubblico dominio e non vi è più alcuno strumento giuridico di tutela che possa impedirne la ridistribuzione e l’estrazione dei dati. Questo principio viene scaltramente eluso dalle aziende che producono banche dati con il rilascio periodico di versioni aggiornate del database, in cui la parte aggiornata è spesso irrisoria (anche se l’art. 102-bis comma 8 Legge diritto d’autore richiede che per godere di un autonomo ulteriore periodo di protezione occorra che si siano operati sostanziali investimenti, simili a quelli effettuati in sede di prima costituzione); tuttavia, essendo essa integrata nel corpus del database e difficilmente scindibile, consente la ripartenza del periodo di tutelabilità. Ciò è facilmente attuabile con i database rilasciati online, che appunto vengono periodicamente aggiornati rendendoli di fatto costantemente lontani dalla caduta in pubblico dominio. Resta però il fatto che, qualora fossimo in possesso di una copia (sia essa fisica o digitale) di un database rilasciato più di 15 anni fa, essa sarebbe indiscutibilmente di pubblico dominio ed utilizzabile liberamente da chiunque liberamente, salvo non 13. “Questo carattere può essere ricercato alternativamente o cumulativamente nella scelta o nella disposizione dei materiali”. L.C. UBERTAZZI (a cura di), Diritto d’autore, estratto da “Commentario breve alle leggi su Proprietà Intellettuale e Concorrenza”, IV ed., Padova, Cedam, 2009, p. 185. Il particolare regime di tutela delle banche dati 37 eccedere in comportamenti stigmatizzabili come concorrenza sleale (ex art. 2598 c.c.). Ovviamente, l’interesse che può destare un database di età così avanzata è sicuramente marginale; tuttavia in alcuni casi esso può risultare un utile punto di partenza per fare confronti, integrazioni, rielaborazioni e analisi incrociate. E vi sono poi casi in cui la realtà fotografata dal database non è cambiata in modo rilevante nell’arco di 15 anni; si pensi proprio ai dati geo-referenziati, come nel caso ipotetico di un database contenente le altitudini delle principali vette delle Alpi, o le lunghezze dei fiumi… ma anche alle coordinate geografiche che descrivono i centri delle città italiane (che nella maggior parte dei casi non subiscono variazioni dal XIX secolo). In tema di pubblico dominio non si può non fare un cenno al principio fissato dall’art. 5 della legge italiana sul diritto d’autore (legge n. 633 del 1941) che esclude l’applicazione di forme di privativa sui testi degli atti ufficiali dello stato e delle pubbliche amministrazioni. Su questo tema, per il quale non si registrano opinioni unanimi nell’ambito della dottrina giuridica, torneremo più avanti in apposito paragrafo. 4. I soggetti in gioco: alcune considerazioni preliminari sul licensing dei database Abbiamo dunque visto che sulla base del diritto vigente in materia di tutela industriale delle banche dati, da un lato vi è il titolare dei diritti di tutela (chiamato “costitutore”, o “maker” in accezione inglese) e dall’altro lato vi è l’utente della banca dati. Il rapporto tipico sottostante alla pratica normale dei diritti di privativa vorrebbe che tra costitutore e utente vi sia un rapporto uno-a-uno, di licenza d’uso di una copia. Tuttavia il titolare dei diritti può concedere diritti d’uso e sfruttamento più ampi di quelli 38 Il Fenomeno Open Data normalmente previsti dalla normativa. In particolare, è possibile che il titolare offra termini di licenza a una pluralità indistinta di soggetti (“licenza pubblica”), senza richiedere né compensi, né formalità di accettazione. Tale meccanismo prende il nome di “licenza aperta” o “licenza libera” e viene correntemente definito “open licensing”, mutuando la nomenclatura usata nell’ambito del software (“open source”). Nell’open licensing, i due soggetti assumono sempre il ruolo rispettivamente di licenziante (ovvero colui che, detenendo i diritti sull’opera, vi applica la licenza) e di licenziatario (ovvero colui che, ricevendo l’opera, la utilizza sulla base dei permessi e nel rispetto delle eventuali condizioni espressi dalla licenza). Ai fini della realizzazione di best practices nell’ambito del licenziamento e riuso di dati è importante da un lato aver chiara la dicotomia tra questi due ruoli (licenziante e licenziatario), dall’altro essere consapevoli delle possibilità e degli oneri giuridici attinenti ad entrambi i ruoli. Questo perché, nell’attuale società dell’informazione, è molto frequente che un soggetto attivo nella produzione o implementazione di servizi informativi si trovi in situazioni ibride, in cui è da un lato produttore di servizi e quindi licenziante e dall’altro riutilizzatore di servizi e quindi licenziatario. Ciò è del tutto naturale nell’open licensing in quanto i diritti conferiti vanno solitamente al di là del mero utilizzo, ma si estendono al reimpiego, alla redistribuzione e allo sfruttamento economico (in molti casi) del bene giuridico oggetto di privativa, nella sua forma originale o a seguito di modifiche (estensioni, estrazioni, combinazioni, eccetera). Comunemente, con la locuzione anglosassone “database licensing” si indica proprio l’attività con cui i titolari dei diritti di privativa sulle banche dati rilasciano al pubblico i loro prodotti con applicazione di licenze pubbliche. Questa pratica richiede alcune particolari cautele dovute alla singolarità del diritto sui generis. Il particolare regime di tutela delle banche dati 39 Ad esempio, al contrario di quanto accade nelle opere dell’ingegno tutelate dal diritto d’autore classico, per le quali si parla spesso di “derivazioni”, “elaborazioni creative” e “opere derivate”, è dubbio che si possa applicare la categoria della derivazione ai database tutelati da mero diritto sui generis. Ciò è dovuto al fatto che tra i diritti esclusivi del costitutore di banca dati non vengono annoverati i diritti relativi alla derivazione tipici delle opere creative (come ad esempio la traduzione, il riassunto, l’adattamento ad altro media, il riarrangiamento musicale); bensì, più propriamente, viene annoverato solo un diritto di impedire attività di estrazione di dati dal database (e per la precisione di parti sostanziali di dati). Questi aspetti rendono sdrucciolevole il terreno per tutte le licenze contenenti clausole espressamente dedicate al concetto di “derivazione” tipico delle opere sotto diritto d’autore/copyright. Approfondiremo meglio questo specifico aspetto nei paragrafi seguenti. 5. Il caso specifico dei dati geografici Parlando del rapporto fra banche dati e open licensing, spendiamo qualche parola a proposito dell’ambito dei dati georeferenziati, anche denominati più semplicemente dati geografici. Essi rappresentano una categoria di non facile qualificazione giuridica, poiché toccano varie forme di creatività o di rappresentazione della realtà. Possiamo avere a che fare con dati “semplici”, come ad esempio le coordinate spaziali (longitudine, latitudine, altitudine, distanza rispetto a punti di interesse, etc.); e in questo caso il singolo dato non può certo ricadere sotto la tutela del diritto d’autore, poiché non sarebbe altro che un “fatto” naturale, una rilevazione della realtà, senza alcuna mediazione da parte 40 Il Fenomeno Open Data dell’ingegno umano. Come già spiegato, dati di questo tipo possono ricevere una tutela solo in quanto “sistema organizzato di dati”, attraverso il diritto sui generis. Se invece abbiamo a che fare con qualcosa di più elaborato e, soprattutto, che abbia richiesto un certo apporto creativo, la situazione si fa più complessa. In questo caso, per valutare quale grado di tutela attribuire a questi contenuti, bisogna di volta in volta verificare a quale tipo di opere dell’ingegno (fra quelle contemplate dai principi del diritto d’autore) il dato geografico rielaborato ed eventualmente rappresentato possa essere assimilato. Non è un’analisi sempre agevole da compiere, dato che questi contenuti a volte si presentano sotto forma di fotografie aeree o satellitari (tutelate da un diritto connesso); altre volte (ed è il caso attualmente più frequente) non si tratta di vere e proprie fotografie, ma di ricostruzioni grafiche vettoriali della realtà geografica (bidimensionali o tridimensionali), dunque assimilabili più verosimilmente ad opere di natura architettonica e ingegneristica (disegni, progetti, etc.) e perciò anch’esse tutelate da un diritto connesso. C’è anche chi ha puntualizzato che una rappresentazione cartografica contenente informazioni georeferenziate (ad esempio l’altitudine, le temperature medie, la frequenza di precipitazioni, la consistenza del terreno, etc.) rappresenti implicitamente anche un database su cui agisce anche un diritto sui generis. Acuta osservazione che però complica non poco il lavoro di qualificazione giuridica della cartografia. 3. I principali risvolti giuridici della public sector information Oltre all’ottica privatistica della titolarità dei diritti di proprietà intellettuale sulle banche dati e della relativa gestione dei diritti a mezzo di licenze (aspetto che verrà per altro approfondito nel capitolo successivo), è importante fornire un quadro delle norme sia nazionali sia transnazionali che si sono occupate del tema della gestione dei dati pubblici, ed in particolar modo dei dati pubblici territoriali e ambientali. 1. La direttiva PSI del 2003 e il decreto di attuazione del 2006 La direttiva 2003/98/CE relativa al riutilizzo dell’informazione del settore pubblico (“Public Sector Information”, “PSI”)1 rappresenta un’importante pietra miliare che inaugura una serie di provvedimenti normativi da parte dell’Unione Europea e degli 41 42 Il Fenomeno Open Data stati membri in materia di raccolta, gestione e rilascio di dati da parte degli enti pubblici. La direttiva è stata emessa con il precipuo scopo di incentivare il rilascio di informazioni in formato digitale da parte degli enti pubblici degli Stati Membri, per permettere così di riflesso lo sviluppo di servizi innovativi a vantaggio dei cittadini e in generale promuovere nuove forme di imprenditorialità e lavoro. Ciò emerge dal Considerando n. 5 della direttiva: Le informazioni del settore pubblico sono un’importante materia prima per i prodotti e i servizi imperniati sui contenuti digitali. Esse diventeranno una risorsa contenutistica ancora più importante con lo sviluppo dei servizi di contenuti via comunicazioni mobili. In tale contesto sarà fondamentale anche un’ampia copertura geografica oltre i confini nazionali. Più ampie possibilità di riutilizzo delle informazioni del settore pubblico dovrebbero, tra l’altro, consentire alle imprese europee di sfruttarne il potenziale e contribuire alla crescita economica e alla creazione di posti di lavoro. Come spesso accade, a spingere l’Unione Europea ad attivarsi con una direttiva è stata una crescente necessità di armonizzazione tra le legislazioni dei vari stati membri, che all’inizio degli anni 2000 si stavano sviluppando senza una direzione comune. Nel Considerando n. 6 si legge infatti: Le normative e le prassi seguite negli Stati membri in relazione allo sfruttamento delle risorse di informazione del settore pubblico sono caratterizzate da notevoli 1. Il testo integrale della direttiva 2003/98/CE è disponibile online all'indirizzo http://ec.europa.eu/information_society/policy/psi/docs/pdfs/directive/ psi_directive_it.pdf. I principali risvolti giuridici della public sector information 43 differenze costituenti delle barriere che impediscono a queste risorse essenziali di esprimere appieno il proprio potenziale economico. [...] Sarebbe opportuno quindi avviare un’armonizzazione minima delle normative e delle prassi nazionali relative al riutilizzo dei documenti del settore pubblico. Come corollario di tale esigenza di armonizzazione normativa, si pone la necessità innanzitutto di dirigersi definitivamente e inevitabilmente verso tecnologie digitali; ed inoltre di adottare standard tecnici di livello sovranazionale che garantiscano il più possibile l’interoperabilità dei sistemi informativi e dei servizi ad essi connessi.2 A scanso di pericolosi fraintendimenti, ovvero per evitare che i principi di condivisione e riutilizzo sanciti dalla Direttiva venissero interpretati come una sorta di riduzione delle privative di diritto industriale esistenti nelle legislazioni europee, è stata inserita una puntuale precisazione (che per altro ritroveremo quasi identica nella direttiva INSPIRE) con il Considerando n. 22: La presente direttiva non incide sui diritti di proprietà intellettuale dei terzi. Per evitare equivoci, con i termini “diritti di proprietà intellettuale” si indicano esclusivamente il diritto d’autore e i diritti connessi (comprese le forme di protezione sui generis). La presente direttiva non si applica ai documenti soggetti a diritti di proprietà industriale, quali brevetti, disegni e modelli registrati e marchi. La direttiva lascia impregiudicate 2. Nel Considerando n. 13 troviamo: «Le possibilità di riutilizzo possono essere migliorate riducendo la necessità di digitalizzare documenti cartacei oppure di manipolare documenti elettronici per renderli compatibili fra loro. Pertanto, gli enti pubblici dovrebbero mettere a disposizione i documenti in qualsiasi lingua o formato preesistente, ove possibile e opportuno per via elettronica.» 44 Il Fenomeno Open Data l’esistenza o la titolarità di diritti di proprietà intellettuale da parte degli enti pubblici e non limita in alcun modo l’esercizio dei diritti al di là di quanto da essa stabilito. Gli obblighi di cui alla presente direttiva si dovrebbero applicare soltanto nella misura in cui siano compatibili con le disposizioni degli accordi internazionali sulla protezione dei diritti di proprietà intellettuale, in particolare la convenzione di Berna per la protezione delle opere letterarie e artistiche (la convenzione di Berna) e l’accordo sugli aspetti dei diritti di proprietà intellettuale attinenti al commercio (l’accordo TRIPS). Gli enti pubblici dovrebbero comunque esercitare il proprio diritto di autore in maniera tale da agevolare il riutilizzo dei documenti. La direttiva PSI ha anche una importante funzione definitoria, dato che in essa all’articolo 2 si cristallizzano alcune importanti definizioni che poi ritroveremo nelle direttive successive in materie affini e, com’è prevedibile, negli atti normativi di attuazione adottati dagli stati membri. La prima di queste definizioni è quella di “documento”, inteso nello specifico senso dell’ambito di azione della direttiva. Il concetto di «documento» qui delineato comprende: a) qualsiasi contenuto, a prescindere dal suo supporto (testo su supporto cartaceo o elettronico, registrazione sonora, visiva o audiovisiva); b) qualsiasi parte di tale contenuto. La seconda definizione è invece quella di “riutilizzo”, definito dalla direttiva come «l’uso di documenti in possesso di enti pubblici da parte di persone fisiche o giuridiche a fini commerciali o non commerciali diversi dallo scopo iniziale nell’ambito dei compiti di servizio pubblico per i quali i documenti sono stati prodotti.»3 I principali risvolti giuridici della public sector information 45 Altro articolo degno di nota (specie in un’analisi come la nostra mirata all’individuazione di modelli di licenziamento ottimali) è l’articolo 8, dedicato appunto alle “Licenze”. Leggendo con attenzione il testo di tale norma4, possiamo notare che, se da un lato la direttiva vuole incoraggiare l’adozione di licenze standard per il rilascio dei contenuti, dall’altro rimane su un piano molto generico e non fornisce indicazioni specifiche sul modello di licenziamento da adottare. Su questo tema l’Unione Europea sembra preferire la scelta di passare la palla ai legislatori degli Stati Membri. E’ dunque utile confrontare come viene trattato l’aspetto del licensing da parte del Decreto legislativo n. 36 del 31 gennaio 2006 con cui appunto il Parlamento italiano ha recepito la direttiva.5 Emerge che il sistema di licenziamento delineato dall’art. 5 del decreto (articolo intitolato non a caso “Richiesta di riutilizzo di documenti”) è abbastanza lontano dal concetto di open licensing illustrato nei paragrafi precedenti e risulta macchinoso e quasi contraddittorio.6 Dapprima al comma 1 si stabilisce che «il titolare 3. L'articolo prosegue precisando che «lo scambio di documenti tra enti pubblici esclusivamente in adempimento dei loro compiti di servizio pubblico non costituisce riutilizzo». 4. Il testo integrale dell'art. 8 è: «Gli enti pubblici possono autorizzare il riutilizzo incondizionato di documenti o imporre condizioni, ove opportuno attraverso una licenza, che trattino le questioni pertinenti. Tali condizioni non limitano in maniera inutile le possibilità di riutilizzo dei documenti e non sono sfruttate per limitare la concorrenza. Negli Stati membri in cui si fa uso della licenza, gli Stati membri provvedono affinché le licenze standard per il riutilizzo di documenti del settore pubblico, che possono essere adattate per soddisfare particolari richieste di licenza, siano disponibili in formato digitale e possano essere elaborate elettronicamente. Gli Stati membri incoraggiano tutti gli enti pubblici a ricorrere alle licenze standard.» 5. Il testo integrale del Decreto legislativo n. 36 del 31 gennaio 2006 è disponibile online all'indirizzo http://www.camera.it/parlam/leggi/deleghe/06036dl.htm. 6. Si riporta il testo integrale dell'articolo 5 del d.lgs. 36/2006: 1. Il titolare del dato predispone le licenze standard per il riutilizzo e le rende disponibili, ove possibile in forma elettronica, sui propri siti istituzionali. 2. I soggetti che intendono riutilizzare dati delle pubbliche amministrazioni o degli organismi di diritto pubblico presentano 46 Il Fenomeno Open Data del dato predispone le licenze standard per il riutilizzo e le rende disponibili sui propri siti istituzionali». Successivamente ai commi 2 e 3 si parla di un procedimento di richiesta dei dati secondo cui i soggetti interessati a riutilizzare i dati pubblici devono farne «apposita richiesta secondo le modalità stabilite dal titolare del dato con proprio provvedimento; da parte sua, il titolare del dato esamina le richieste e rende disponibili i documenti al richiedente […] entro il termine di trenta giorni, prorogabile di ulteriori trenta giorni nel caso in cui le richieste siano numerose o complesse». Si può quindi dedurre che le licenze trattate dal comma 1 sono concepite unicamente con un ruolo di atto regolamentare della pubblica amministrazione, cioè come semplice dichiarazione delle condizioni d’uso applicate qualora la richiesta effettuata ex commi 2 e 3 venga accolta. Una prospettiva di certo inversa rispetto all’idea di libera disponibilità di dati e contenuti concessa a priori con il metodo dell’open licensing. Questa interpretazione restrittiva del concetto di “riutilizzo dei documenti” è confermata dal chiarissimo testo del comma 2 dell’art. 1 dello stesso d. lgs. 36/2006, che recita: Le pubbliche amministrazioni e gli organismi di diritto pubblico non hanno l’obbligo di consentire il riutilizzo dei documenti di cui al comma 1. La decisione di consentire o meno tale riutilizzo spetta all’amministrazione o apposita richiesta secondo le modalità stabilite dal titolare del dato con proprio provvedimento. 3. Il titolare del dato esamina le richieste e rende disponibili i documenti al richiedente, ove possibile in forma elettronica, entro il termine di trenta giorni, prorogabile di ulteriori trenta giorni nel caso in cui le richieste siano numerose o complesse. Il titolare del dato non ha l'obbligo di produrre o di continuare a produrre documenti al solo fine di permetterne il riutilizzo da parte di un soggetto privato o pubblico. 4. I poteri e le facoltà connessi al riutilizzo spettano unicamente al titolare del dato. I principali risvolti giuridici della public sector information 47 all’organismo interessato, salvo diversa previsione di legge o di regolamento. Come vedremo più avanti, questo sistema (a nostro avviso inutilmente complicato e burocratizzato) è stato superato solo di recente con le nuove riforme in materia di “Agenda digitale”. Solo un’ultima annotazione: il recepimento della Direttiva non è stato privo di problemi. La Commissione Europea nel marzo del 2009 ha infatti avviato una procedura di infrazione nei confronti dell’Italia per incompleto e scorretto recepimento. Come si legge nel comunicato stampa7 diffuso sul sito dell’Unione Europea, «la Commissione ha deciso di inviare una lettera di messa in mora (prima fase di una procedura d’infrazione a norma del trattato CE) all’Italia che non ha ancora recepito nella normativa nazionale tutte le disposizioni della direttiva PSI. Uno dei punti controversi è costituito dall’esclusione dei dati catastali e ipotecari – una preziosa fonte di informazioni riutilizzabili – dall’ambito di applicazione della direttiva». Simili procedure erano state avviate in precedenza contro Polonia e Svezia. Infine si segnala che la Commissione ha proceduto nel periodo giugno 2008 – 15 settembre 2008 a una consultazione on- line (IP/08/1017). Dai risultati ottenuti si evince che la direttiva PSI ha migliorato le condizioni in cui gli enti pubblici divulgano i rispettivi dati, li condividono e ne consentono il riutilizzo, e ha creato nuove opportunità per l’industria dei contenuti in Europa (cfr. la relazione concernente la consultazione degli Stati membri e la relazione relativa alla consultazione delle parti interessate).8 Tuttavia, esistono ancora barriere che impediscono un maggiore 7. Il testo integrale del comunicato è disponibile al sito http://europa.eu/rapid/press- release_IP-09-425_it.htm. 8. Si vedano la relazione concernente la consultazione degli Stati Membri e la relazione relativa alla consultazione delle parti interessate al sito http://ec.europa.eu/ digital-agenda/public-sector-information-raw-data-new-services-and-products. 48 Il Fenomeno Open Data riutilizzo transfrontaliero delle informazioni detenute dal settore pubblico. 2. La direttiva INSPIRE del 2007 Nel 2004 in seno alla Commissione Europea viene avanzata una proposta di direttiva che prosegua nel solco già tracciato dalla precedente direttiva PSI ma che sia più specificamente dedicata all’ambito delle informazioni di carattere ambientale e territoriale. La proposta di direttiva e la direttiva stessa verranno fin da subito identificate con l’acronimo INSPIRE che sta per Infrastructure for Spatial Information in Europe, cioè Infrastruttura per l’Informazione Territoriale in Europa. Il senso di tale iniziativa è ottimamente esplicato dalla relazione introduttiva alla proposta di direttiva9, che al paragrafo 2 recita: Tra gli obiettivi principali dell’iniziativa INSPIRE figura la possibilità di rendere disponibile una quantità di dati maggiore e di qualità più elevata ai fini dell’elaborazione delle politiche comunitarie e della loro attuazione negli Stati membri a qualsiasi livello. INSPIRE è incentrata in particolare sulla politica ambientale, ma è aperta o potrà essere estesa ad altri settori come l’agricoltura, i trasporti e l’energia. La proposta tratta in modo specifico i dati necessari per monitorare e migliorare lo stato dell’ambiente, e in particolare l’aria, l’acqua, il suolo e il paesaggio naturale. Gran parte di tali informazioni ha bisogno di essere sostenuta da dati territoriali “multiuso”. Nell’ambito di 9. Il testo della proposta di direttiva (con la relazione introduttiva) http://ec.europa.eu/information_society/policy/psi/docs/pdfs/inspire/it.pdf. I principali risvolti giuridici della public sector information 49 un’infrastruttura per l’informazione territoriale non tutte le categorie di dati devono essere armonizzate allo stesso modo, né è d’altronde necessario integrarle nell’infrastruttura alla stessa velocità. Ai fini di un’analisi più strettamente giuridica è utile invece soffermarsi sul paragrafo 7.1 della relazione, il quale appunto chiarisce quale sia la base giuridica di un intervento direttivo come INSPIRE. L’articolo 175, paragrafo 1 del trattato CE rappresenta la base giuridica adeguata, visto che i dati territoriali di cui tratta la proposta servono per la formulazione, l’attuazione, il monitoraggio e la valutazione delle politiche ambientali al fine di garantire un livello elevato di protezione dell’ambiente. L’articolo 174 impone inoltre alla Comunità di tener conto dei dati tecnici e scientifici disponibili. INSPIRE contribuisce all’osservanza di quest’obbligo aiutando la Comunità ad avere accesso e a utilizzare i dati territoriali disponibili. Alcuni dei dati territoriali in questione sono necessari anche nel contesto di altre politiche nazionali e comunitarie, ad esempio quella agricola, dei trasporti o la politica regionale. La scelta della base giuridica è in sintonia con la necessità di integrare le considerazioni ambientali nelle altre politiche citate al fine di promuovere lo sviluppo sostenibile. Dopo il compimento dell’ordinario iter di discussione e approvazione, la direttiva è entrata in vigore il 15 maggio del 2007 come Direttiva 2007/2/CE.10 50 Il Fenomeno Open Data Innanzitutto è il caso di rilevare che i contenuti di questa direttiva, rispetto alla precedente direttiva PSI del 2003, appaiono di carattere più tecnico-informatico che amministrativo- burocratico. Quello che preme di più al legislatore europeo non sembra tanto essere sottolineare e ribadire principi giuridici e amministrativi già fissati con la direttiva del 2003, quanto fissare degli standard tecnici per l’effettiva implementazione di un virtuoso sistema informativo-territoriale in tutta l’Unione Europea, con un dichiarato intento di incentivo dell’interoperabilità e condivisione reciproca delle informazioni tra gli enti pubblici degli stati membri. Si tenga presente che INSPIRE mira espressamente alla realizzazione di un’infrastruttura pubblica in materia di dati territoriali e ambientali, dunque l’obbiettivo principale di questa iniziativa non è quello di promuovere il rilascio ai cittadini dei dati territoriali, ma più precisamente quello di porre le condizioni affinché gli enti pubblici dei paesi UE possano scambiarsi correttamente ed efficacemente tali informazioni. Entrando più specificamente nei contenuti della Direttiva, notiamo innanzitutto che, per quanto riguarda l’aspetto della tutela e gestione dei diritti di privativa sui dati, all’art. 2 torna – come già accennato – la classica formula presente nella direttiva precedente: «la presente direttiva lascia impregiudicati l’esistenza o il possesso di diritti di proprietà intellettuale da parte di autorità pubbliche.» Inoltre, nucleo fondamentale della Direttiva è l’articolo 11 che definisce e descrive quali servizi a rete gli Stati Membri sono tenuti ad istituire e gestire a norma della direttiva. I successivi articoli 12, 13, 14 e 17 forniscono invece indicazioni puntuali sulle modalità con cui devono essere realizzati e su quali di questi servizi devono 10. Il testo integrale è disponibile all'indirizzo web http://eur-lex.europa.eu/ LexUriServ/LexUriServ.do?uri=OJ:L:2007:108:0001:0014:IT:PDF. I principali risvolti giuridici della public sector information 51 essere rilasciati al pubblico liberamente e quali invece devono essere disponibili su richiesta e dietro versamento di tariffa. INSPIRE è stata poi recepita ed attuata in Italia dal Decreto legislativo 27 gennaio 2010 n. 32, il quale ne ha riprodotto quasi pedissequamente i dettami. 3. Le riforme del Governo Monti: la legge 135/2012 Il Governo Monti (Novembre 2011 – Marzo 2013) si è fatto carico di una intensa attività di riforma dei meccanismi di funzionamento dell’apparato statale italiano, in una prospettiva di ammodernamento e di innovazione tecnologica. Alcuni di questi interventi hanno riguardato proprio l’ambito degli open data. Seguendo un ordine cronologico, il primo intervento che merita un commento è quello comunemente denominato come “spending review” (decreto legge 95/2012 convertito nella legge n. 135 del 7 agosto 2012); il suo campo d’azione è proprio quello dei dati territoriali. Il decreto ha inserito nel nostro ordinamento un principio da tempo atteso dai promotori degli open geodata, lasciando però ancora alcuni punti oscuri. Leggiamo il testo della norma in questione, ovvero il comma 12-quaterdecies dell’Articolo 23 (Fruibilità di dati geospaziali acquisiti con risorse pubbliche): Per sostenere lo sviluppo delle applicazioni e dei servizi basati su dati geospaziali e per sviluppare le tecnologie dell’osservazione della terra anche a fini di tutela ambientale, di mitigazione dei rischi e per attività di ricerca scientifica, tutti i dati e le informazioni, acquisiti dal suolo, da aerei e da piattaforme satellitari nell’ambito di attività finanziate con risorse pubbliche, sono resi disponibili per tutti i potenziali utilizzatori nazionali, 52 Il Fenomeno Open Data anche privati, nei limiti imposti da ragioni di tutela della sicurezza nazionale. A tale fine, la catalogazione e la raccolta dei dati geografici, territoriali ed ambientali generati da tutte le attività sostenute da risorse pubbliche è curata da ISPRA, che vi provvede con le risorse umane, strumentali e finanziarie disponibili a legislazione vigente. Con decreto del Presidente della Repubblica, sulla base di una intesa tra Presidenza del Consiglio – Dipartimento della protezione civile, Ministero della difesa, Ministero dell’ambiente e della tutela del territorio e del mare, Ministero dell’istruzione, dell’università e della ricerca e regioni, adottata dalla Conferenza permanente per i rapporti tra lo Stato, le regioni e le province autonome di Trento e di Bolzano, sono definite le modalità per la gestione della piattaforma e per l’accesso, l’interoperatività e la condivisione, anche in tempo reale, dei dati e delle informazioni in essa conservati, e gli obblighi di comunicazione e disponibilità dei dati acquisiti da parte di tutti i soggetti che svolgono tale attività con il sostegno pubblico, anche parziale. Dall’attuazione delle disposizioni del presente comma non devono derivare nuovi o maggiori oneri per la finanza pubblica. Il primo paragrafo è abbastanza limpido e fissa un principio in sé rivoluzionario, che va ben oltre quanto previsto dagli interventi legislativi che abbiano presentato sin qui. Semplificando, tutti i dati territoriali di origine pubblica (rectius: provenienti da iniziative finanziate con risorse pubbliche) sono resi disponibili pubblicamente a tutti i potenziali utilizzatori nazionali. Leggendo il paragrafo con un occhio più attento possiamo notare che la sua formulazione poteva essere più precisa. I principali risvolti giuridici della public sector information 53 Innanzitutto si fa riferimento a dati “acquisiti dal suolo, da aerei e da piattaforme satellitari” e inspiegabilmente non si contemplano invece tutti i dati provenienti dal mare e dalle coste e raccolti dalle imbarcazioni. Inoltre l’ultima frase (“nei limiti imposti da ragioni di tutela della sicurezza nazionale”) appare piuttosto criptica e non si percepisce con chiarezza la portata di questi limiti. Passando invece al secondo paragrafo, si trovano espressioni ancor meno cristalline a livello interpretativo. Infatti, nonostante gli ottimi richiami a concetti accessibilità, interoperabilità e massima possibilità di condivisione dei dati, ci sono alcune espressioni che attenuano pesantemente l’effettività del primo paragrafo della norma. Ad esempio compare un espresso riferimento alle competenze e agli obblighi formali di ISPRA (Istituto Superiore per la Protezione e la Ricerca Ambientale), che sono definite in altra indipendente fonte normativa; e si precisa tra l’altro che ISPRA debba provvedere «con le risorse umane, strumentali e finanziarie disponibili a legislazione vigente». Il dubbio che legittimamente sorge è che questa previsione possa rischiare di trasformarsi presto in un “alibi” a non svolgere adeguatamente questa attività. Si passa poi ad un elenco di istituzioni pubbliche che dovrebbero (il condizionale è d’obbligo) raggiungere un’intesa per definire (in un altro successivo decreto) le modalità di gestione e di accesso ai servizi descritti dalla norma. Ci si chiede a questo punto da un lato se tali enti riusciranno davvero a raggiungere questa intesa, e dall’altro che cosa succederà qualora questa intesa non venisse raggiunta mai. Infine, vi è la frase che più di tutte è foriera di incertezza e indeterminatezza sull’effettività di questa norma. Se dall’introduzione di questi innovativi servizi non devono derivare nuovi o maggiori oneri per la finanza pubblica, il sospetto che legittimamente sorge è che i vari enti coinvolti utilizzino la 54 Il Fenomeno Open Data mancanza di risorse economiche come pretesto per sentirsi autorizzate a non adeguarsi. D’altronde, è cosa nota che avviare nuovi servizi e adottare nuove procedure comporti sempre un investimento iniziale, ad esempio in termini di formazione, adeguamento degli organici e aggiornamento dei sistemi informativi. In conclusione, una norma concepita con uno slancio innovativo rischia – come spesso accade – di rimanere lettera morta per il prevalere di pretesti e di giustificazioni. 4. La riforma del CAD operata col decreto Crescita 2.0 e il principio “open by default” su dati e documenti Il Decreto Legislativo 80 del 2005 (anche noto come Codice dell’amministrazione digitale, o più brevemente CAD) è il testo normativo cardine su cui si fondano i principi di digitalizzazione dell’apparato pubblico italiano. Si tratta di un testo molto completo e opportunamente proiettato al futuro fin dalla sua adozione; tuttavia soffre di una diffusa disapplicazione di buona parte dei suoi precetti, sia per una cultura giuridica italiana resistente alle evoluzioni, sia per la mancanza di norme di attuazione ben precise e soprattutto di sanzioni specifiche per i funzionari della PA non zelanti. Trattandosi di un atto legislativo adottato nel 2005, il CAD già tiene conto, anche se solo a livello di principi generali e definizioni, delle indicazioni fornite dalla direttiva 2003/98/CE, nonostante appunto il recepimento formale della direttiva sia avvenuto per l’Italia nel 2006. Nel campo d’analisi che ci interessa, sono due le norme del CAD che meritano un focus specifico: l’articolo 52 (intitolato “Accesso telematico e riutilizzo dei dati delle pubbliche I principali risvolti giuridici della public sector information 55 amministrazioni”) e l’articolo 68, il quale da un lato si preoccupa di sottolineare l’importanza del concetto di interoperabilità (sia a livello di software sia a livello di dati), dall’altro chiarisce la definizione di “dato aperto”. Queste due norme sono state modificate in tal senso dal cosiddetto decreto “Crescita 2.0” (contenente le norme della tanto discussa “Agenda digitale”), in vigore dal 19 ottobre 2012 e convertito in legge il 13 dicembre 2012. L’art. 52, nella sua nuova formulazione, si pone come una norma davvero rivoluzionaria e di portata davvero ampia. In sostanza viene fissato il principio di una sorta di “dati aperti di default” secondo cui tutti i dati e documenti prodotti dalle pubbliche amministrazioni, qualora non rilasciati con specifici termini d’uso, vengono considerati alla stregua di dati licenziati in modalità aperta. Riportiamo i commi 2, 3 e 4 della norma. 1. L’accesso telematico a dati, documenti e procedimenti e il riutilizzo dei dati e documenti e’ disciplinato dai soggetti di cui all’articolo 2, comma 2, secondo le disposizioni del presente codice e nel rispetto della normativa vigente. Le pubbliche amministrazioni pubblicano nel proprio sito web, all’interno della sezione “Trasparenza, valutazione e merito”, il catalogo dei dati, dei metadati e delle relative banche dati in loro possesso ed i regolamenti che ne disciplinano l’esercizio della facoltà di accesso telematico e il riutilizzo, fatti salvi i dati presenti in Anagrafe tributaria. 2. I dati e i documenti che le amministrazioni titolari pubblicano, con qualsiasi modalità, senza l’espressa adozione di una licenza di cui all’articolo 2, comma 1, lettera h), del decreto legislativo 24 gennaio 2006, n. 36, si intendono rilasciati come dati di tipo aperto ai sensi all’articolo 68, comma 3, del presente Codice. L’eventuale 56 Il Fenomeno Open Data adozione di una licenza di cui al citato articolo 2, comma 1, lettera h), è motivata ai sensi delle linee guida nazionali di cui al comma 7. 3. Nella definizione dei capitolati o degli schemi dei contratti di appalto relativi a prodotti e servizi che comportino la raccolta e la gestione di dati pubblici, le pubbliche amministrazioni di cui all’articolo 2, comma 2, prevedono clausole idonee a consentire l’accesso telematico e il riutilizzo, da parte di persone fisiche e giuridiche, di tali dati, dei metadati, degli schemi delle strutture di dati e delle relative banche dati. 4. Le attività volte a garantire l’accesso telematico e il riutilizzo dei dati delle pubbliche amministrazioni rientrano tra i parametri di valutazione della performance dirigenziale ai sensi dell’articolo 11, comma 9, del decreto legislativo 27 ottobre 2009, n. 150. [omissis] Il nuovo testo della norma è da leggere in visione coordinata con quello dell’articolo 68, comma 3 del CAD anch’esso novellato dal decreto Crescita 2.0. Nel nuovo comma 3 si trova, oltre ad una nuova e finalmente completa definizione di “formato aperto”, una definizione ex lege di “dati di tipo aperto”. Agli effetti del presente decreto legislativo si intende per: a) formato dei dati di tipo aperto, un formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi; b) dati di tipo aperto, i dati che presentano le seguenti caratteristiche: I principali risvolti giuridici della public sector information 57 1) sono disponibili secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato; 2) sono accessibili attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera a), sono adatti all’utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati; 3) sono resi disponibili gratuitamente attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione. L’Agenzia per l’Italia digitale può stabilire, con propria deliberazione, i casi eccezionali, individuati secondo criteri oggettivi, trasparenti e verificabili, in cui essi sono resi disponibili a tariffe superiori ai costi marginali. Questo determinante intervento normativo richiede qualche puntuale considerazione. L’impianto normativo è abbastanza complesso, dato che, come detto, si basa su un riferimento incrociato tra due norme lunghe e dense di precetti e definizioni non sempre lineari. Si noti ad esempio che una parla di “dati e documenti” (art. 52) mentre l’altra parla unicamente di “dati” (art. 68). Inoltre, si introduce il concetto di “formato disaggregato” che sembra sovrapporsi al già citato concetto di formato aperto (ex lett. a) e che necessiterebbe una più chiara definizione. Infine il riferimento al concetto di “costi marginali” appare passibile di un’interpretazione troppo flessibile. Tuttavia, la ratio complessiva della norma risulta piuttosto chiara. 58 Il Fenomeno Open Data Sostanzialmente si inverte la situazione rispetto a quanto previsto nelle norme precedenti (cioè le due direttive citate e i relativi decreti di recepimento): l’opzione standard è che i dati vengano resi disponibili gratuitamente o ai costi marginali sostenuti per la loro riproduzione e divulgazione; per eccezioni a questa opzione standard è necessaria una specifica deliberazione di Agenzia per l’Italia digitale. Il coordinato dettato di queste due norme (art. 52 e art. 68 CAD) va sostanzialmente ed indirettamente ad incidere anche sui principi della legge italiana sul diritto d’autore in materia di diritti di privativa da parte degli enti pubblici (art. 5 e art. 11 della legge sul diritto d’autore). Di certo sarebbe stato auspicabile anche una modifica diretta della legge sul diritto d’autore, ma pare che ciò non rientri attualmente nelle intenzioni del legislatore. 5. Il cosiddetto Decreto Trasparenza: l’istituto della “pubblicazione obbligatoria” e il rafforzamento del principio “open by default” Dal 20 aprile 2013 è in vigore anche un’ulteriore testo normativo che influisce sull’ambito della disponibilità e fruibilità dei dati pubblici: il decreto legislativo n. 33 del 14 marzo 2013, anche noto come “Decreto Trasparenza”. Passiamo in rassegna le norme del decreto che risultano rilevanti per la nostra analisi. Innanzitutto, con l’articolo 2 viene introdotto e definito l’istituto giuridico della pubblicazione obbligatoria. Il che completa il quadro lasciato incompleto dalla modifica dell’Art. 68 CAD, il quale si occupava di cosa accade quando i dati sono pubblicati e non vi è applicata una licenza. L’articolo 2 del Decreto Trasparenza detta le regole di quali dati vanno pubblicati e come. I principali risvolti giuridici della public sector information 59 Le disposizioni del presente decreto individuano gli obblighi di trasparenza concernenti l’organizzazione e l’attività delle pubbliche amministrazioni e le modalità per la sua realizzazione. Ai fini del presente decreto, per pubblicazione si intende la pubblicazione [...] nei siti istituzionali delle pubbliche amministrazioni dei documenti, delle informazioni e dei dati concernenti l’organizzazione e l’attività delle pubbliche amministrazioni, cui corrisponde il diritto di chiunque di accedere ai siti direttamente ed immediatamente, senza autenticazione ed identificazione. Dunque, con questo decreto, il legislatore pone a carico delle PA un espresso ed inequivocabile obbligo di messa a disposizione del pubblico “delle informazioni e dei dati concernenti l’organizzazione e l’attività delle pubbliche amministrazioni”. A completamento di ciò, l’articolo 3 stabilisce chiaramente anche un diritto di conoscibilità dei dati oggetto di pubblicazione obbligatoria: Tutti i documenti, le informazioni e i dati oggetto di pubblicazione obbligatoria ai sensi della normativa vigente sono pubblici e chiunque ha diritto di conoscerli, di fruirne gratuitamente, e di utilizzarli e riutilizzarli ai sensi dell’articolo 7. Infine, con l’articolo 7, viene ribadito e rafforzato il principio “open by default” (descritto nei paragrafi precedenti), tra l’altro con un espresso richiamo alle norme sul riuso dell’informazione nel settore pubblico e sul trattamento dei dati personali: I documenti, le informazioni e i dati oggetto di pubblicazione obbligatoria ai sensi della normativa 60 Il Fenomeno Open Data vigente, resi disponibili anche a seguito dell’accesso civico di cui all’articolo 5, sono pubblicati in formato di tipo aperto ai sensi dell’articolo 68 del Codice dell’amministrazione digitale, di cui al decreto legislativo 7 marzo 2005, n. 82, e sono riutilizzabili ai sensi del decreto legislativo 24 gennaio 2006, n. 36, del decreto legislativo 7 marzo 2005, n. 82, e del decreto legislativo 30 giugno 2003, n. 196, senza ulteriori restrizioni diverse dall’obbligo di citare la fonte e di rispettarne l’integrità. Un’importante annotazione merita la frase finale di questo articolo, nella quale il legislatore fornisce un’indicazione più precisa sui termini d’uso (quindi sul modello di licenza) applicabili ai dati pubblici. Devono quindi essere escluse licenze che impongano eccessive restrizioni; uniche restrizioni ammesse sono la richiesta di citazione della fonte e quella di rispettare l’integrità del dataset. Tale deve a nostro parere essere interpretata la notazione “senza ulteriori restrizioni diverse”: non significa, di tutta apparenza, che le ulteriori restrizioni debbano essere imposte o che quello sia il modello di licenziamento che vada preferito, ma che ogni restrizione diversa da quelle consentite debba ritenersi vietata. 6. L’ipotesi del “danno erariale” in caso di rilascio di dati in maniera gratuita: alcune precisazioni Sovente è capitato, discutendo della necessità di un ente pubblico di rilasciare “open data” con una licenza che consentisse il riutilizzo dei dati per finalità commerciali, di sentirsi opporre l’obiezione che se un dirigente avesse seguito tale parere sarebbe incorso in responsabilità amministrativa. Il ragionamento, I principali risvolti giuridici della public sector information 61 indicativo di una mentalità non al passo con i tempi, era che, siccome l’amministrazione pubblica aveva investito per raccogliere tali dati, consentire ad altri di ricavare benefici commerciali senza remunerare gli investimenti costituiva un indebito arricchimento altrui con corrispondente impoverimento dell’amministrazione. A tale posizione si contrapponevano vari argomenti. Intanto la raccolta dei dati in questione era effettuata sì con dispendio di risorse pubbliche, ma in esecuzione di obblighi giuridici precisi dell’amministrazione stessa per fini propri e direttamente inerenti allo, o addirittura imprescindibilmente richiesti dallo, svolgimento dei propri fini istituzionali. Pertanto, l’attività di raccolta e archiviazione non era connessa e funzionale alla pubblicazione di dati o alla commercializzazione dei dati, dunque tale attività non costituiva un impoverimento, in quanto il ritorno dell’investimento era appunto nel consentire l’attività istituzionale. Per quanto riguarda invece l’arricchimento altrui, era ancora tutto da dimostrare che si trattasse di un arricchimento indebito, anche e soprattutto in quanto i dati sarebbero stati forniti su base paritaria a tutti coloro che ne avessero fatto richiesta (eventualmente accollandosi la spesa di estrazione e fissazione su un supporto). Taglia la testa al toro il nuovo assetto normativo, prevedendo che i dati resi pubblici siano di principio resi anche disponibili come dati aperti, espressamente vincolando tale apertura alla possibilità di sfruttamento economico senza ulteriori richieste da parte dell’ente. La valutazione di meritevolezza dell’interesse a fare ciò è quindi svolta una volta per tutte dal legislatore nazionale. Se vi era un’incertezza, ora tale incertezza è del tutto risolta. Anzi, comportarsi diversamente dal rilasciare i dati pubblicati secondo condizioni più restrittive comporta, nel caso tale restrizione sia ingiustificata, una possibile reprimenda amministrativa. 62 Il Fenomeno Open Data Addirittura, nei campi previsti dal Decreto Trasparenza, il solo ritardo nel rendere disponibili i dati potrebbe essere considerato fonte di responsabilità amministrativa. Sono indicativi a tal proposito la possibilità di ottenere l’accesso civico (simile all’accesso amministrativo previsto dalla Legge 241/1990) ma senza formalità o necessità di allegare un interesse legittimo. Anche se tale obbligo è limitato a particolari categorie di dati, esse sono decisamente ampie e generali (“l’organizzazione e l’attività delle pubbliche amministrazioni”). Deve comunque ritenersi che sebbene gli obblighi siano da individuarsi tramite norme secondarie, tale puntualizzazione rappresenta il “minimum set” oggetto di trasparenza, mentre ogni sforzo in più è da premiarsi, sicuramente non da punire. 7. Open data e tutela dei dati personali Nello studio del fenomeno open data, non si può tralasciare di tenere in debita considerazione l’aspetto della tutela della privacy e delle norme in materia di trattamento dei dati personali. E’ importante tener presente che i principi per la tutela giuridica delle banche dati dal punto di vista della proprietà intellettuale e i principi per la tutela della privacy (trattamento dei dati personali) viaggiano su binari separati; e il secondo dei due aspetti emerge solo nel momento in cui la banca dati contiene effettivamente dati personali e vi è un trattamento di tali dati, secondo le definizioni presenti nella normativa ad hoc (cioè principalmente il Decreto Legislativo n. 196 del 2003, Codice in materia di protezione dei dati personali). Fatta questa importante premessa, possiamo procedere segnalando che il rispetto della riservatezza degli individui e delle imprese è una condizione per assicurare l’approvazione da parte dei cittadini per le operazioni di apertura dei dati pubblici, oltre I principali risvolti giuridici della public sector information 63 che presupposto per conservare la fiducia degli individui nei confronti delle istituzioni. In materia di privacy, numerosi ed importanti principi che possono guidare le Amministrazioni nella definizione delle soluzioni e delle modalità con cui procedere alla pubblicazione sono contenuti in una Deliberazione dell’Autorità Garante per la protezione dei dati personali con le quali sono state adottate le “Linee guida in materia di trattamento di dati personali contenuti anche in atti e documenti amministrativi, effettuato da soggetti pubblici per finalità di pubblicazione e diffusione sul Web” (Deliberazione n. 88/2011).11 La Deliberazione n. 88/2011 ha lo scopo di definire un primo quadro unitario di misure e accorgimenti finalizzati a individuare opportune cautele che i soggetti pubblici sono tenuti ad applicare in relazione alle ipotesi di pubblicazione dei propri dati sul Web; come noto, questo documento indica tutti gli accorgimenti idonei ad assicurare che la pubblicazione delle informazioni sia conforme alla normativa dettata in materia di protezione dei dati personali. Tuttavia, la privacy non deve essere vissuta come un ostacolo insormontabile nel processo di apertura delle informazioni del settore pubblico. Infatti, la gran parte dei dati pubblici (basti pensare alle cartografie, oppure alle informazioni relative all’inquinamento) non possono essere classificati come personali, in quanto – cioè – non riconducibili ad un soggetto. In tutti gli altri casi, la privacy può essere efficacemente tutelata pubblicando i dati in forma anonima o comunque adottando tutte le cautele idonee a evitare che i soggetti cui i dati si riferiscono (siano essi individui, imprese, associazioni e Enti) possano essere identificati. Tale impostazione è confermata da quanto affermato dal Garante Privacy nel provvedimento n. 88/2011 nel quale è 11. Il testo integrale del documento è disponibile sul sito del Garante all'indirizzo www.garanteprivacy.it/web/guest/home/docweb/-/docweb-display/docweb/1793203. 64 Il Fenomeno Open Data confermato che il perseguimento della finalità di trasparenza dell’attività delle Pubbliche Amministrazioni può avvenire anche senza l’utilizzo di dati personali. Secondo il Garante, infatti, “non si ravvisa la necessità di adottare alcuna specifica cautela qualora le pubbliche amministrazioni ritengano di pubblicare sul sito web informazioni non riconducibili a persone identificate o identificabili (ad esempio dati quantitativi aggregati per uffici riguardanti i livelli retributivi ed accessori risultanti dai contratti collettivi o da atti interni di organizzazione; tassi di assenza e di maggiore presenza del personale; informazioni relative alla performance dell’amministrazione; obiettivi assegnati agli uffici insieme ai relativi indicatori e ai risultati complessivi raggiunti; l’ammontare complessivo dei premi collegati alla performance stanziati e di quelli effettivamente distribuiti; dati relativi al grado di differenziazione nell’utilizzo della premialità, informazioni concernenti la dimensione della qualità dei servizi erogati, notizie circa la gestione dei pagamenti e le buone prassi)”. Di conseguenza, è opportuno che le Amministrazioni – nell’attività di apertura dei dati che detengono – valutino quali accorgimenti porre in essere al fine di evitare la diffusione di dati personali non consentita dalla legislazione vigente, senza pregiudicare le finalità di trasparenza e di comunicazione alla base dell’Open Data. Nel caso dei dati territoriali intesi in senso neutro (e quindi non collegati né collegabili a situazioni personali), il problema della tutela della riservatezza e del trattamento di dati personali I principali risvolti giuridici della public sector information 65 tendenzialmente non sussiste, dato che i dati territoriali (come definiti dalla Direttiva INSPIRE) non rientrano nella definizione di “dato personale” fornita dal D. Lgs. 196/2003 all’art. 4 e ancor prima dalla Direttiva 95/46/CE. Solo qualora il dato territoriale compaia in una forma più complessa che gli permette di essere ricollegato in modo concreto ad una persona fisica sarebbe necessario porsi il problema del rispetto dei parametri in materia di trattamento dei dati personali. Ciò è ancor più vero ora che i dati relativi alle persone giuridiche non rientrano più nel novero dei dati personali, e quindi anche i dati relativi ad esempio alle localizzazioni di insediamenti produttivi, pur essendo in larga parte già pubblici, non sono, in radice, più rilevanti. I dati relativi ad esempio alla residenza degli individui, anche se pubblici (es: anagrafe) sono comunque soggetti alla normativa sulla privacy e quindi di regola non vanno diffusi in blocco, essendo tale tipo di trattamento fonte di possibili rischi (facilitando il data mining) e dunque potranno essere trattati e diffusi solo in forma anonima e/ o aggregata. 8) La nuova direttiva Open PSI (2013) Il 13 giugno 2013 il Parlamento europeo ha approvato la direttiva 2013/37/EU relativa alla revisione delle norme sull’utilizzo del patrimonio informativo del settore pubblico di cui alla direttiva 2003/98/CE12. Essa va a rafforzare e aggiornare i principi già stabiliti dalla precedente direttiva, in virtù delle evoluzioni legislative e tecnologiche avvenute nell’arco del decennio. La direttiva, che dovrà essere recepita dagli stati membri entro il 18 luglio 2015, ridefinisce e rafforza alcuni concetti chiave in materia di riuso dei dati pubblici, come ad esempio: il principio 12. Il testo definitivo della direttiva è disponibile all'indirizzo http://eur-lex.europa.eu/ LexUriServ/LexUriServ.do?uri=OJ:L:2013:175:0001:0008:EN:PDF. 66 Il Fenomeno Open Data del riutilizzo, quale valore aggiunto per qualsiasi utilizzatore finale (considerando 3); la necessità di liberare grandi quantità di dati da parte tutti i paesi, con previsione di standard normativi che rendano più facile la gestione transfrontaliera (considerando 6); l’opportunità che la Commissione Europea assista gli Stati membri nell’attuazione della direttiva, fornendo orientamenti sulle licenze raccomandate, le tipologie di dati de i corrispettivi in denaro imposti per il riutilizzo di documenti (considerando 36). Gli elementi centrali della nuova direttiva, sono i seguenti. All’articolo 3 viene sancito un generale principio di riutilizzabilità dei dati pubblici, nel caso essi non ricadano in una delle eccezioni previste dalla direttiva o risultino indisponibili ai sensi delle normative nazionali sul diritto di accesso. L’articolo 5 introduce un principio di disponibilità dei dati e documenti di matrice pubblica, al di là del formato o della lingua con cui sono stati redatti. L’articolo 6 prevede poi una disciplina per il contenimento dei cosiddetti costi marginali imposti in alcune legislazioni per la messa a disposizione e il riutilizzo dei dati, indicando esplicitamente i casi eccezionali. Ne consegue così per gli enti pubblici un obbligo a rendere trasparenti le regole e le metodologie di calcolo di tali costi; resta comunque la possibilità da parte degli Stati membri di non imporre alcun costo; Interessante appare la disposizione del comma 2 dell’articolo 3 che estende le norme sulla public sector information al patrimonio culturale di biblioteche, musei ed archivi: una disposizione dirompente e innovativa che non mancherà di generare dibattito scientifico e politico, vista l’estrema importanza e ricchezza del patrimonio culturale basato in Europa. A questo tema la direttiva dedica gli interi considerando da 14 a 18, dai quali emerge la consapevolezza da parte dell’UE del potenziale di tale patrimonio.13 I principali risvolti giuridici della public sector information 67 13. Sul tema cfr. Ragone, Dati aperti: l’Unione europea alla prova della nuova direttiva sul riutilizzo delle informazioni del settore pubblico, disponibile online sul sito MySolution Post (http://www.mysolutionpost.it/archivio/fisco-e-società/dati-pubblici- aperti.aspx) 4. Il licensing di dati in modalità open 1. Introduzione Chiarita la complessità del sistema di tutela previsto per le banche dati, possiamo procedere a riflettere sulle problematiche che emergono quando il detentore dei diritti su una banca dati decida di regolamentarne l’uso attraverso l’applicazione di una licenza di libera distribuzione o copyleft. Citiamo gli esempi più noti di licenze ai fini di maggiore incisività della nostra analisi: la GNU General Public License – GPL, normalmente utilizzata per opere software e licenza capostipite del software libero e open source; la GNU Free Documentation License – FDL, licenza “cugina” della GPL e pensata principalmente per opere testuali e di documentazione; le licenze Creative Commons – CC, ormai diffusissimo strumento utilizzato per applicare il modello “alcuni diritti riservati” ad opere creative di qualsiasi natura (al di fuori del software).1 69 70 Il Fenomeno Open Data Come più volte sottolineato, tutte queste licenze “vivono” e funzionano all’interno dei confini del diritto d’autore. Non sempre ciò implica che esse contemplino il diritto sui generis che si allontana in alcuni aspetti dal diritto d’autore in senso stretto. Dunque il loro utilizzo nel campo delle banche dati in ambito europeo rischia di lasciare scoperta la parte relativa al diritto sui generis. Cerchiamo di intenderci meglio. La funzione di queste licenze è quella di autorizzare, consentire, appunto “licenziare”, alcuni usi liberi dell’opera a cui la licenza è riferita; e per farlo il testo delle licenze fa esplicito riferimento ai singoli diritti coinvolti nella cessione. Ma non tutte queste licenze prendono in considerazione espressamente il cosiddetto diritto sui generis. C’è un motivo per tutto questo: gran parte di queste licenze, pur essendo state presto “esportate” in Europa, sono state concepite in seno all’ordinamento giuridico statunitense, nel quale non esiste questo duplice livello di tutela per le banche dati.2 Bisogna quindi riflettere su quale sia il modo più efficiente di gestire questa particolare tipologia di diritti e sostanzialmente ci troviamo ad una duplice via d’uscita: o si opta per una rinuncia all’esercizio di questi diritti, oppure si opta per un loro licenziamento specifico. Una precisazione fondamentale: le considerazioni esposte da qui in poi si riferiscono esclusivamente al licensing di database 1. Non si tratta di un’unica licenza, bensì di un set di licenze basato su quattro clausole base dalla cui combinazione nascono le sei licenze vere e proprie. 2. A conferma di questa differenza di impostazione fra ordinamento statunitense e altri or- dinamenti giuridici, si legga quanto emerge nell’interessante articolo “Database and Creative Commons” in http://sciencecommons.org/resources/faq/databases/, al par. Be Aware That Creative Commons Do Not License All Types of Legal Rights: “Database users should be aware, before they freely use the facts or database elements, of some possible limitations imposed by different types of laws that may restrict the extent of data that can be used and that are not licensed by the Creative Commons licenses”. Il licensing di dati in modalità open 71 non considerati opera dell’ingegno e quindi tutelati con il solo diritto sui generis (ovvero il Tipo 3 proposto al par. 2.5). 2. Tipi di licenze utilizzabili per l’open data Gli studiosi del settore, dopo aver compiuto una panoramica analitica delle principali licenze attualmente disponibili per il rilascio pubblico di dati geografici, sono giunti alla conclusione che le opzioni disponibili si articolano in tre modelli fondamentali: 1) licenze con clausola di attribuzione della paternità e con clausola di persistenza dei diritti concessi (cosiddetto “share alike”); 2) licenze con sola clausola di attribuzione della paternità; 3) dichiarazioni pubbliche di rinuncia all’esercizio dei diritti per il rilascio in un regime di pubblico dominio artificioso. Essendo questi i modelli generalmente perseguibili ed essendo le licenze già esistenti sufficienti a coprire tutti questi modelli, si è optato per la non redazione di una nuova apposita licenza e per la scelta di uno degli strumenti già esistenti. Ciò anche in un’ottica di non alimentazione del fenomeno comunemente detto “license proliferation”, in italiano pienamente traducibile con “proliferazione delle licenze”. Questo schema sintetizza le opzioni possibili. 72 Il Fenomeno Open Data 3. Il problema della proliferazione delle licenze Le licenze pubbliche di copyright sono strumenti di natura negoziale per il rilascio e la distribuzione di opere dell’ingegno e più in generale di beni immateriali tutelati da diritti di esclusiva. Benché il principio della libertà contrattuale preveda che ciascun detentore di diritti di di esclusiva su un bene immateriale sia libero di regolamentare gli usi della sua opera con qualsivoglia strumento atto a quello scopo, molti enti specializzati e autorevoli a livello internazionale si preoccupano di redigere testi di licenze resi pubblici e liberamente utilizzabili da coloro che non intendano scrivere una licenza ad hoc per ogni singolo caso. Tali licenze, sia per il livello di competenza degli enti che ne curano la redazione, l’aggiornamento e l’implementazione, sia per la loro diffusione su scala globale, diventano spesso dei modelli di riferimento molto utili e soprattutto atti a garantire una certa affidabilità. Il licensing di dati in modalità open 73 A ciò si aggiunga che le licenze attualmente disponibili per l’uso pubblico contemplano già più o meno tutte le ipotesi di regolamentazione dei diritti di privativa di beni immateriali. Di conseguenza la redazione di nuove licenze difficilmente è necessaria a tutti gli effetti, e anzi rischia solo di creare duplicazioni e sovrapposizioni che portano più che altro esternalità negative a livello di interpretazione da parte degli operatori del diritto (giudici, avvocati, consulenti) e di compatibilità tra progetti. Di contro, l’introduzione di nuove licenze, soprattutto in caso di licenze “share alike” (simile al “copyleft forte”, ovvero che pone come condizione per il riutilizzo che i prodotti “derivati” rispettino le stesse condizioni della licenza “inbound”), rischia di introdurre condizioni di licenza diverse e incompatibili con quelle di altre licenze, moltiplicando esponenzialmente la possibilità di creare aree di auto-esclusione dall’opportunità di riusare altri beni intellettuali rilasciati sì sotto licenze pubbliche, libere e aperte, ma incompatibili. La soluzione di introdurre clausole di compatibilità per risolvere questo rischio da un lato non risolve il problema intrinseco della molteplicità di strumenti giuridici – fonte comunque di confusione – dall’altro introduce nuove variabili circa il meccanismo di licenziamento e può anche portare a lunghe catene di “trasformazioni” attraverso diversi passaggi tra clausole di compatibilità, portando a conseguenze difficilmente predicibili. Dunque, è sempre sconsigliabile procedere alla redazione di nuovi testi di licenza, se non in quei casi specifici in cui emergano esigenze particolari che nessuna delle licenze disponibili possono soddisfare. 74 Il Fenomeno Open Data 4. Il cosiddetto “share alike” e il concetto di “derivazione” nell’ambito del database right Tra le licenze che possono essere utilizzate per il rilascio pubblico di dati geografici ve ne sono alcune con la cosiddetta clausola “share alike” (ad esempio la Creative Commons Attribution – Share Alike e la Open Dababase License); clausola che si ispira all’effetto propagativo della clausola “copyleft” utilizzata nella licenze di software libero. Lo spirito di questa clausola1 è infatti quello di creare una specie di effetto “macchia d’olio” virtuoso grazie al quale lo spirito di condivisione di un progetto “open” venga applicato anche a tutti i progetti che attingono da esso. A ben vedere, però, le licenze non ragionano per “progetti” bensì per “opere”; in altre parole una licenza è uno strumento giuridico applicato ad un’opera dal detentore dei diritti e non dev’essere confuso con una sorta di testo-manifesto di carattere filosofico-programmatico per cercare di diffondere la stessa filosofia di un progetto. La creazione di una licenza ad hoc a questo scopo può essere, a nostro avviso, foriera di equivoci. Andando nel dettaglio del senso tecnico-giuridico della clausole sul modello share alike, vediamo che esse si basano su un concetto originario degli ordinamenti giuridici anglo-americani: quello di opera derivata. Dunque, un’opera rilasciata con una licenza contenente tale clausola da un lato consente ai licenziatari/ utilizzatori di realizzare opere derivate da essa, dall’altro impone contestualmente di applicare la stessa licenza (o una licenza con gli stessi identici effetti) anche a tutte le opere derivate. Uno dei casi più noti di applicazione di questa tipo di licenze è Wikipedia, rilasciata con licenza Creative Commons Attribution – Share Alike 3.0. Infatti, chiunque realizza opere che derivano da Il licensing di dati in modalità open 75 una voce di Wikipedia, è tenuto a diffondere queste opere derivate con una licenza similare. Si pone però un interrogativo chiave: si può davvero parlare di “derivazione” quando abbiamo a che fare con un database non creativo, tutelato quindi dal mero diritto sui generis (o database right)? Se leggiamo attentamente i principi della direttiva 96/9/ CE che ha introdotto in Europa questa nuova singolare forma di tutela, capiamo facilmente che il diritto del costitutore di un database copre le attività di «estrazione e/o reimpiego della totalità o di una parte sostanziale del contenuto del database». Senza ora perdersi in elucubrazioni di carattere meramente dottrinale, ciò che ci interessa sottolineare è che l’idea di “derivazione” non sempre è applicabile in modo corretto e funzionale all’ambito del database licensing. Di conseguenza le licenze che fanno della “derivazione” uno dei loro elementi caratterizzanti, se applicate all’ambito dei database, rischiano di risultare problematiche a livello di implementazione e di tutela (specialmente se si tratta di progetti di respiro internazionale, che prevedibilmente coinvolgono anche paesi in cui non esiste il diritto sui generis). Inoltre, scegliendo una licenza con clausole share alike, si aumenta il rischio di incompatibilità e dunque di creare piccole enclave di libertà e apertura, reciprocamente incompatibili, sempre ammesso che la clausola in questione abbia gli effetti sperati. 5. La clausola di richiesta di attribuzione di paternità in materia di database licensing La clausola di attribuzione della paternità, presente in gran parte delle licenze per opere creative, è una clausola che rafforza 76 Il Fenomeno Open Data (esplicitandolo con una previsione contrattuale) il diritto ad essere riconosciuti come autori già presente in gran parte delle normative di diritto d’autore. Essa in sostanza richiede agli utilizzatori/licenziatari dell’opera licenziata di riconoscere pubblicamente la paternità dell’opera all’autore originario (o altro titolare dei diritti) non solo nei modi comunemente in uso ma anche secondo le specifiche indicazioni del licenziante (ad esempio riportando un apposito link). Di questa clausola sono dotate ad esempio tutte le licenze Creative Commons e altri strumenti similari come la Free Art License e la Open Data Commons Attribution License. Dal punto di vista dell’implementazione giuridica nell’ambito del database licensing, la clausola Attribuzione non pone le stesse problematiche poste dalla clausola share alike, dato che, soprattutto nel contesto digitale, si può facilmente ottemperare ad essa con la previsione di una sezione “credits” in cui riportare i nomi e i link dei licenzianti. Si pongono però alcuni rilievi più che altro di carattere funzionale che ci fanno interrogare sulla sua utilità e opportunità nell’ambito di rilascio di dati geografici, e ancor più specificamente di dati geografici da parte di entità pubbliche. Tale clausole nasce infatti per rispondere all’esigenza molto comune tra i creativi di vedere riconosciuto quanto meno dal punto di vista morale il loro contributo creativo e intellettuale. La maggior parte degli artisti (scrittori, musicisti, fotografi, videomaker…) che rilasciano le loro opere come open content lo fanno proprio per aumentare la visibilità delle loro creazioni; rinunciano ad alcuni diritti tipici del modello tradizionale di copyright in cambio di un riconoscimento più ampio del loro contributo creativo e intellettuale. Se da un punto di vista strettamente giuridico questo stesso principio può essere applicato anche al caso di un costitutore Il licensing di dati in modalità open 77 di database (titolare di mero diritto sui generis), dal punto di vista morale l’approccio cambia necessariamente. Innanzitutto il costitutore di un database raramente è una persona fisica; e se anche lo fosse, difficilmente l’attività di mera raccolta e organizzazione di dati sotto forma di database potrebbe definirsi artistica. Questa considerazione diventa a nostro avviso ancor più pregnante se il costitutore del database è un ente pubblico, che svolge l’attività di raccolta, organizzazione e gestione dei dati in risposta ad una sua specifica mission istituzionale o addirittura in ossequio a precisi obblighi di legge. In questi casi infatti una specifica richiesta di “attribuzione” rischierebbe di risultare superflua e ridondante, dato che è cosa nota e generalmente riconosciuta che certi tipi di dati provengano da questa o quella istituzione (si pensi ad esempio ai dati catastali, agli stradari comunali, ai dati sulle elezioni diffusi dal Ministero dell’Interno, etc.). Inoltre tali dati sono comunque costantemente disponibili, verificabili e confrontabili proprio negli archivi cartacei o digitali di tali enti, ed è quindi poco verosimile che si creino occasioni di confusione e di equivoco sulla loro provenienza e sulla loro versione originaria. 6. Il rilascio in pubblico dominio “artificiale” Come già introdotto nei capitoli precedenti e come compare già dal diagramma offerto poco sopra, esiste anche una soluzione per così dire più “radicale” per il rilascio pubblico di dati: si tratta di appositi strumenti giuridici che mirano a creare una situazione di pubblico dominio “artificiale”, ovvero un pubblico dominio che avvenga prima della naturale e definitiva scadenza dei termini previsti dalla legge per l’esercizio dei diritti di proprietà intellettuale. Nel caso di un database non creativo coperto da mero 78 Il Fenomeno Open Data diritto sui generis, ciò accade dopo quindici anni solari interi dalla pubblicazione del database; nel caso di un database con carattere creativo, ciò avviene invece dopo settant’anni solari interi dalla morte del suo creatore. Questi strumenti servono appunto per anticipare tali termini grazie ad una specifica scelta in tal senso del detentore dei diritti. L’autore o il costitutore di un database che volesse rilasciarlo immediatamente in un regime di massima libertà (appunto come se fosse già caduto nel pubblico dominio) deve sostanzialmente effettuare una dichiarazione pubblica in cui, in modo definitivo ed inequivocabile, si impegna a rinunciare all’esercizio dei diritti di privativa attribuitigli dalla legge. Lo strumento più diffuso di questo tipo è quello realizzato da Creative Commons e che prende il nome di Creative Commons Zero (CC0); sullo stesso modello il progetto Open Data Commons ha realizzato la ODC Public Domain Dedication and Licence (ODC PDDL). Tale soluzione “radicale”, per ovvi motivi, risulta quella meno problematica sia dal punto di vista giuridico che dal punto di vista pratico. Dal punto di vista giuridico, non trattandosi di una vera e propria licenza bensì di una dichiarazione pubblica di rinuncia (“waiver”), non pone problemi di compatibilità con altre licenze; dal punto di vista pratico, i dati sarebbero rilasciati nella più libera delle modalità di distribuzione, potendo quindi essere riutilizzati nella maniera più ampia possibile e integrati con dati provenienti da altri progetti senza che si creino conflitti tra licenze e termini d’uso. Ciò ha per certo un effetto – in un certo senso – tranquillizzante per gli utilizzatori/licenziatari e funge quindi anche da incentivo ad un effettivo riuso dei dati. Il licensing di dati in modalità open 79 7. Il principio “open by default” e la scelta di una licenza applicabile Il sopraggiungere del principio “open by default”, introdotto dell’ordinamento giuridico italiano proprio durante la stesura dei documenti di studio del Progetto FreeGIS.net, ha di certo modificato il quadro non solo dal punto di vista dell’analisi dello scenario teorico-giuridico ma anche dal punto di vista della scelta della licenza. Se infatti prima della riforma apportata dal Decreto Crescita 2.0 per “liberare” effettivamente un dataset era necessaria una specifica volontà da parte della pubblica amministrazione (sotto forma di scelta e applicazione di una licenza), ora l’inerzia della PA implica una situazione di apertura e libertà di riuso dei dati e dei documenti pubblici, ancor più nel caso di dati e documenti di pubblicazione obbligatoria ai sensi del d. lgs. 33/2013. Ne consegue che l’applicazione di una licenza non è più una questione così strategica e determinante. Tuttavia, la scelta e applicazione di una licenza rimane un atto foriero di chiarezza e di certo sollecitato dal legislatore. Questi infatti, con l’introduzione del principio “open by default”, così com’è stato concepito, non vuole sostituirsi alle singole PA titolari dei dati effettuando una sorta di “licenziamento a priori”, ma semplicemente porre le condizioni per sfruttare positivamente l’eventuale inerzia delle PA nel rilascio dei dati. D’altronde, il combinato disposto degli art. 52 e 68 CAD non crea una situazione di pubblico dominio generalizzato, ma piuttosto una sorta di “presunzione di licenziamento open”, grazie alla quale, in mancanza di specifica licenza, gli utenti possono considerare i dati come se fossero sotto licenza aperta. 80 Il Fenomeno Open Data Inoltre la presenza di una licenza, specie se si tratta di una tra le più note e utilizzate a livello internazionale, consente una maggiore chiarezza sugli effettivi termini d’uso del dataset, anche agli occhi di un utente straniero non informato sul funzionamento del principio “open by default” e in generale sui meccanismi del diritto della proprietà intellettuale. Con l’avvento del cosiddetto Decreto Trasparenza disponiamo di una prima indicazione a livello legislativo sulla tipologia di licenza utilizzabile per i dati oggetto di pubblicazione obbligatoria da parte delle pubbliche amministrazioni. L’art. 7 del Decreto infatti stabilisce che nel processo di rilascio e licenziamento dei dataset pubblici non siano applicate “ulteriori restrizioni diverse dall’obbligo di citare la fonte e di rispettarne l’integrità”. Ne consegue che, nel caso in cui il dataset rientri tra le categorie descritte dal Decreto (e la maggior parte dei dati territoriali prodotti e gestiti dalle PA vi rientrano), la cerchia di licenze utilizzabili si restringa, lasciando fuori dal novero tutte quelle ispirate al modello “share alike” nonché quelle ispirate al modello “non commercial”. Utilizzando come riferimento il set delle sei licenze Creative Commons, restano quindi utilizzabili la “Attribution” e la “Attribution – Non derivative works”, con la possibilità di un rilascio ancor più libero e radicale attraverso l’opzione del waiver “CC zero”. 8. Applicazione del public domain waiver CC0 Come per qualsiasi documento mirato alla gestione e regolamentazione dei diritti d’autore, il principio di fondo per la corretta applicazione è che vi sia un chiaro e inequivocabile collegamento tra opera e documento e, come presupposto, che colui che opera questo collegamento abbia titolo per farlo (ovvero disponga di tutti i diritti di utilizzazione sull’opera). Il licensing di dati in modalità open 81 Per la sussistenza del presupposto della titolarità dei diritti è necessario che il soggetto che intende disporre il rilascio pubblico dell’opera (a mezzo di licenza d’uso o di public domain waiver) si accerti che: a) all’interno dell’opera o della banca dati non vi siano contributi provenienti da altre fonti di cui non si ha traccia (con ragionevole certezza); b) all’interno dell’opera o della banca dati non vi siano contributi o parti i cui diritti esclusivi sono stati precedentemente ceduti ad altro soggetto. Effettuate tali verifiche, se nulla osta, il titolare dei diritti può pubblicare l’opera o la banca dati facendo in modo che i fruitori della stessa siano in grado conoscere nel dettaglio i termini d’uso. Ad esempio, nel caso di distribuzione dell’opera in copie materiali, è possibile allegare il testo della licenza o aggiungere una chiara nota informativa con l’indicazione del nome completo della licenza o waiver e di recapiti per recuperare il testo completo (un indirizzo web univoco, un indirizzo di posta elettronica, un indirizzo di posta ordinaria); nel caso (ormai più frequente) di pubblicazione online è comunemente ritenuto sufficiente, oltre all’indicazione del nome completo della licenza o waiver, effettuare un collegamento ipertestuale (link) univoco al testo del documento. 9. Profili di enforcement A titolo di premessa, si tenga presente che, se a livello di applicazione non vi sono sostanziali differenze tra il caso di un public domain waiver e il caso di una licenza di libera distribuzione, dal punto di vista dell’enforcement le differenze sono invece sostanziali e sono dipendenti dalla diversa natura e dal diverso spirito dei due diversi tipi di strumenti. Come si è già spiegato nei paragrafi precedenti, quella di applicare un public domain waiver è una scelta piuttosto radicale 82 Il Fenomeno Open Data e definitiva; si tratta infatti di un passo con il quale il titolare dei diritti su un’opera si impegna pubblicamente e irrevocabilmente a non esercitarli, così da immettere, di fatto, l’opera nel pubblico dominio fin da subito, cioè senza attendere la naturale scadenza dei termini di legge. Ne consegue che non si pongono particolari questioni di enforcement dato che lo stesso concetto di enforcement implica l’esistenza di diritti da tutelare e “azionare”. Unico baluardo di residua tutela potrebbe riscontrarsi nei cosiddetti diritti morali d’autore, i quali però difficilmente potrebbero seriamente entrare in gioco nel caso di rilascio di database privi di carattere creativo e rilasciati da enti pubblici per loro specifica mission istituzionale. Quindi, una volta applicato e reso pubblico il waiver, il titolare dei diritti perde di fatto la possibilità di revocarlo e di esercitare i diritti oggetto della rinuncia. Appendice - Open Data Licensing (presentazione a slides) Titolo completo: Open Data Licensing (With Emphasis on the Italian Public Sector): Guidelines for Choosing and Applying the Most Suitable License Presentazione a slides a cura di Carlo Piana e Simone Aliprandi, utilizzata per il convegno “Open data in transition” tenutosi presso l’Università degli studi di Trento il 19 dicembre 2013. All’indirizzo http://openisfree.blogspot.com/2014/01/ opendata-licensing-presentation-trento.html è disponibile anche il video integrale dell’intervento al convegno. Slide 1 83 84 | Il Fenomeno Open Data Slide 2 Slide 3 Appendice - Open Data Licensing (presentazione a slides) | 85 Slide 4 Slide 5 86 | Il Fenomeno Open Data Slide 6 Slide 7 Appendice - Open Data Licensing (presentazione a slides) | 87 Slide 8 Slide 9 88 | Il Fenomeno Open Data Slide 10 Slide 11 Appendice - Open Data Licensing (presentazione a slides) | 89 Slide 12 Slide 13 90 | Il Fenomeno Open Data Slide 14 Slide 15 Appendice - Open Data Licensing (presentazione a slides) | 91 Slide 16 Slide 17 92 | Il Fenomeno Open Data Slide 18 Slide 19 Appendice - Open Data Licensing (presentazione a slides) | 93 Slide 20 Slide 21 94 | Il Fenomeno Open Data Slide 22 THE END Per approfondire In generale Agnoloni, Tommaso; Sagri, Maria-Teresa.; Tiscornia, Daniela (2009): Open data: nuova frontiera della libertà informatica?, in Informatica e diritto, 2-2009. Berners-Lee, Tim (2009): Putting Government Data online; disponibile online su http://www.w3.org/DesignIssues/ GovData.html. Fioretti, Marco (2010): Open Data, Open Society. A research project about openness of public data in EU local administration, Scuola Superiore Sant’Anna di Pisa; available at www.dime- eu.org/node/907. Krabina, Bernhard; Prorok, Thomas; Lutz, Brigitte (2012): Implementation of Open Government (version 2.0), KDZ Centre for Public Administration Research; disponibile online all’URL http://www.kdz.eu/en/webfm_send/1537. Murillo, Martin J. (2012) Including all audiences in the government loop: From transparency to empowerment through open government data; disponibile online all’URL www.w3.org/2012/06/ pmod/pmod2012_submission_18.pdf Nguyen, Thinh (2008): Freedom to Research: Keeping Scientific Data Open, Accessible, and Interoperable; disponibile online su http://sciencecommons.org/wp-content/uploads/freedom-to- research.pdf. OECD Organization for Economic co-operation and development (2007): Principles and Guidelines for Access to Research 95 96 | Il Fenomeno Open Data Data from Public Funding, OECD; disponible online su www.oecd.org/dataoecd/9/61/38500813.pdf. Ragone, Morena (2012): I dati aperti nella normativa italiana: dalle leggi regionali ad una prospettiva nazionale, in IGED n. 3/ 2012 (pagg. 30-33); disponibile online su http://issuu.com/ stefanoforesti/docs/iged312_light/30. Ricolfi, Marco; Drexl, Josef; van Eechoud, Mireille; Janssen, Katleen; Maggiolino, Maria Teresa; Morando, Federico; Sappa, Cristiana; Torremans, Paul; Uhlir, Paul ; Iemma, Raimonto; de Vries, Marc (2011): The “Principles Governing Charging” for Re-use of Public Sector Information, in Informatica e diritto, 2-2009. Sulla tutela e sul licensing dei database Aliprandi, Simone (2011): Open licensing e banche dati, in Informatica e diritto, fasc. 1-2, 2011; disponibile online all’URL http://aliprandi.blogspot.it/2013/02/open-licensing-e-banche- dati.html. Aliprandi, Simone (2012): Open licensing and databases, in Free and open source software law review, Vol 4, No 1, 2012; disponibile online all’URL http://www.ifosslr.org/ifosslr/article/ view/62. Derclaye, Estelle (2008), The Legal Protection of Databases. A Comparative Analysis, Edward Elgar. Morando, Federico (2013): Legal interoperability: making Open Government Data compatible with businesses and communities, in JLIS, Vol. 4, No. 1, 2013; disponibile online all’URL http://leo.cilea.it/index.php/jlis/article/view/5461. Ricolfi, Marco; van Eechoud, Mireille; Morando, Federico; Tziavos, Prodromos; Ferrao, Luis (2011): The “Licensing” of Public Sector Information, in Informatica e diritto, fasc. 1-2, 2011. Per approfondire | 97 Rovati, Angelo Maria (2011): Prime note su proprietà intellettuale e riutilizzo dei dati pubblici, in Informatica e diritto, fasc. 1-2, 2011. Sappa, Cristiana (2011): Diritti di proprietà intellettuale e dati pubblici nell’ordinamento italiano, in Informatica e diritto, fasc. 1-2, 2011. Solda-Kutzmann, Donatella (2011): Public Sector Information Commons, in Informatica e diritto, fasc. 1-2, 2011. Vander Sande, Miel; Portier, Marc; Mannens, Erik; Van de Walle, Rik (2012): Challenges for open data Usage: Open Derivatives and Licensing; disponibile online all’URL www.w3.org/2012/06/ pmod/pmod2012_submission_4.pdf. Sulla public sector information Aliprandi, Simone (2013): Il principio “open by default” su dati e documenti, presentazione a slides utilizzata per “L’open source in tour 2013” (Vicenza, 16 maggio 2013); disponibile online all’URL http://www.slideshare.net/simonealiprandi/vicenza-lopen-source- in-tour-2013-16-maggio-2013. Aliprandi, Simone; Piana, Carlo (2013): FOSS in the Italian public administration: fundamental law principles, in International Free and Open Source Software Law Review, Vol. 5, No. 1; disponibile online su http://www.ifosslr.org/ifosslr/article/view/ 84. Ricolfi, Marco; Drexl, Josef; van Eechoud, Mireille; Salmeron, Manuel; Sappa, Cristiana; Txiavos, Prodromos; Valero, Julian; Pavoni, Francesca; Patrito, Paolo (2011): The Exclusion of “Public Undertakings” from the Re-use of Public Sector Information Regime, in Informatica e diritto, fasc. 1-2, 2011. Ragone, Morena (2012): Open data: dal decreto ‘Sviluppo′ alla legge ‘Anticorruzione’, passando per il ‘Crescita 2.0′, in IGED n. 98 | Il Fenomeno Open Data 4/2012 (p. 37-40); disponibile online su http://issuu.com/ stefanoforesti/docs/iged412_light/37. Sulle questioni di privacy Alovisio, Mauro (2011): Criticità Privacy nel riuso dei dati pubblici, in Informatica e diritto, fasc. 1-2, 2011. Bassi, Eleonora (2011): PSI, protezione dei dati personali, anonimizzazione, in Informatica e diritto, fasc. 1-2, 2011. Pennazio, Rossana; Rossi, Piercarlo (2011): Open Data e tutela della riservatezza tra uniformazione europea e approcci nazionali, in Informatica e diritto, fasc. 1-2, 2011. Van der Sloot, Bart (2011): Public Sector Information & Data Protection: A Plea for Personal Privacy Settings for the Re-use of PSI, in Informatica e diritto, fasc. 1-2, 2011. Sul tema dei dati geografici Chilton, S. (2009): Crowdsourcing Is Radically Changing the Geodata Landscape: Case Study of Openstreetmap, disponibile online su http://icaci.org/documents/ICC_proceedings/ICC2009/ html/nonref/22_6.pdf. Druetta, Corrado; Leucci, Stefano (2011): Open Pedestrian Maps: un “riutilizzo ecologico”, in Informatica e diritto, fasc. 1-2, 2011 Haklay M. (Muki); Weber P. (2008): OpenStreetMap: User- Generated Street Maps, IEEE, disponibile online su http://eprints.ucl.ac.uk/13849/1/13849.pdf. National Research Council of the National Academies (2004), Licensing geographic data and services, The National Academies press. Per approfondire | 99 Pagina del sito DigitPA dedicata al tema dei dati territoriali: http://www.digitpa.gov.it/fruibilita-del-dato/dati-territoriali. Peruginelli, Ginevra; Bright, Mariya Badeva (2011): Open Model as Instruments of an Effective Knowledge Ecology: Some Reflections with a Focus on the African Environment, in Informatica e diritto, fasc. 1-2, 2011. Principali progetti italiani dedicati all’open data Dati.Gov.it: portale del Governo Italiano sugli open data prodotti e gestiti dalla istituzioni pubbliche. Sito ufficiale: www.dati.gov.it. Spaghettiopendata: iniziativa italiana che aggrega tutte le iniziative italiane sul tema di dati aperti e riuso delle informazioni pubbliche. Sito ufficiale: www.spaghettiopendata.org. Opendatahub.it: un ampio catalogo con i dati aperti di organizzazioni pubbliche e private. Include un motore di ricerca trasversale e specializzato che consente di individuare i dati aperti attraverso le principali organizzazioni che hanno pubblicato dati aperti. Sito ufficiale: www.opendatahub.it. DatiOpen.it: iniziativa indipendente italiana per promuovere la divulgazione, pubblicazione e condivisione dei dati aperti da parte di organizzazioni pubbliche e private. Sito ufficiale: www.datiopen.it. Linked Open Data Italia: associazione italiana che promuove diversi progetti tra cui l’Open bilancio (in collaborazione con l’Associazione Openpolis) sulla trasparenza dei bilanci di tutti gli oltre 8.000 comuni italiani. Sito ufficiale: www.linkedopendata.it. OpenGeoData Italia: associazione italiana nata con lo scopo di diffondere la cultura dei dati geografici e del loro libero riutilizzo. Sito ufficiale: www.opengeodata.it. Gfoss.it: Associazione Italiana per l’Informazione Geografica Libera. Sito ufficiale: www.gfoss.it. 100 | Il Fenomeno Open Data FreeGIS.net: progetto di ricerca e divulgazione con lo scopo di consentire alle pubbliche amministrazioni l’efficace pubblicazione dei dati geografici, utilizzando applicazioni libere, licenze per i dati e standard aperti. Sito ufficiale: www.freegis.net. Nato nel 2009 come gruppo informale di avvocati indipendenti (da cui il nome), Array si ricostituisce nel 2014 come studio legale con struttura a rete, dedicato alla consulenza e assistenza specialistica, anche giudiziale, nei campi delle Tecnologie dell’Informazione, dei Media e delle Telecomunicazioni, in controversie civili, penali, amministrative e procedure ADR. Array opera in tutto il mercato Europeo offrendo consulenza a clienti che variano da singoli e piccole startup a larghe comunità di sviluppo, da piccole e medie imprese a società nel Fortune 500, organizzazioni internazionali e pubbliche amministrazioni. Array è un gruppo di IT lawyers, sulla frontiera degli sviluppi legali nel settore delle Tecnologie dell’Informazione, dei Media e delle Telecomunicazioni. I professionisti di Array possiedono una particolare esperienza e un profilo internazionale per le questioni giuridiche legate al Software Libero e Open Source, che negli ultimi anni è definitivamente uscito dalla percezione di ambito informatico non redditizio e poco imprenditoriale, per diventare una delle più 101 102 | Il Fenomeno Open Data importanti tendenze nel settore IT. Array non è un network. Array è un array! Maggiori dettagli sul sito www.array.eu, oppure sui seguenti canali social: https://twitter.com/arraylaw http://www.linkedin.com/company/array-law https://www.facebook.com/arraylawfirm Dello stesso autore Capire il copyright. Percorso guidato nel diritto d’autore (di Simone Aliprandi) E’ la versione rivisitata e aggiornata di uno dei libri di maggior successo per coloro che si approcciano al mondo del diritto d’autore senza provenire da studi specialistici. Si tratta infatti di un libro che, quando fu pubblicato nella sua prima versione (2007), fu appositamente pensato per essere rivolto ad un pubblico di operatori del settore comunicazione e produzione culturale (sviluppatori, designer, bibliotecari, archivisti, docenti, giornalisti…), i quali, pur non avendo un background giuridico necessitano di una solida alfabetizzazione su questi temi. Il linguaggio utilizzato è accessibile e i concetti vengono esplicati in modo chiaro ed efficace anche grazie all’ausilio di appositi schemi e diagrammi. Inoltre questo è il primo manuale di diritto d’autore in Italia a tenere in considerazione anche gli aspetti critici (o – per così dire – 103 104 | Il Fenomeno Open Data gli “anelli deboli”) del sistema classico della proprietà intellettuale, e quindi a riportare le impostazioni dottrinali alternative e a dedicare la giusta rilevanza alle nuove istanze dovute alla rivoluzione digitale e ai nuovi modelli di gestione dei diritti d’autore (copyleft, open licensing, Creative Commons). In questa nuova edizione, l’autore è riuscito a rendere l’opera ancor più completa e utile, arricchendola con nuove riflessioni e nuove rappresentazioni grafiche che aiutano la comprensione anche dei concetti più tecnici. Tutti i dettagli su www.aliprandi.org/capire-copyright. Creative Commons: manuale operativo. Una guida pratica e un’introduzione teorica al mondo CC Un manuale operativo che guida passo a passo autori, editori e utilizzatori nel mondo delle licenze Creative Commons, le più famose e diffuse licenze di libera distribuzione per opere creative. Senza tralasciare fondamentali chiarimenti di natura concettuale e terminologica, l’autore entra nei dettagli tecnici del Dello stesso autore | 105 funzionamento degli strumenti proposti dal progetto Creative Commons, così da renderli comprensibili anche per i totali neofiti. Un’opera fondamentale per tutti coloro che sono interessati al mondo dell’opencontent e del copyleft, giunta già alla sua terza edizione e arricchita ora da un’utile appendice di casi di studio. Tutti i dettagli su www.aliprandi.org/manuale-cc. Maggiori informazioni ed altri titoli della stessa collana su www.ledizioni.it
Authors Simone Aliprandi
License CC-BY-3.0 CC-BY-SA-3.0