Dades d'investigació

Repositori de dades

El repositori de dades de recerca de la Universitat de les Illes Balears, consorciat amb amb el CSUC, és el CORA.RDR.

Cora RDR

 

1. Què es un repositori de dades?

Un repositori de dades és una plataforma digital dissenyada per emmagatzemar, gestionar, compartir i preservar conjunts de dades de recerca. Per considerar que un repositori és de confiança, ha de complir amb els principis FAIR (Findable, Accessible, Interoperable, Reusable), que garanteixen que les dades siguin fàcils de trobar, accessibles, compatibles amb altres sistemes i reutilitzables per la comunitat científica.
Habitualment, es distingeixen tres tipus de repositoris:

  • Repositoris institucionals: els gestiona una institució, com una universitat, centre de recerca, o una altra entitat acadèmica o corporativa, amb la finalitat de reunir, preservar i difondre la producció intel·lectual d'aquesta institució.
    • Per exemple, CORA RDR, gestionat pel CSUC.
  • Repositoris temàtics: se centren en una disciplina o camp de coneixement específic, i solen estar oberts a contribucions de diferents institucions i investigadors.
    • Per exemple, GBIF per als treballs sobre biodiversitat, o ARCES per a conjunts de dades procedents d'enquestes en investigació social, etc.
  • Repositoris multidisciplinaris: emmagatzemen, gestionen i difonen dades de múltiples disciplines o camps d'estudi. Generalment, no tenen supervisió, i, de vegades, són de companyies comercials.

 

2. Per què dipositar les dades d’investigació a un repositori?

Els repositoris de dades compleixen una doble funció, ja que serveixen tant per dipositar les dades finals que avalen el resultat de la recerca, donar visibilitat i assegurar la preservació, com per localitzar dades per reutilitzar en recerques futures.

Així mateix, les dades de recerca generades en els projectes finançats amb fons públics han d'estar dipositades i, sempre que sigui possible, disponibles en accés obert. Per complir amb aquest mandat, es recomana que es dipositin en repositoris de confiança a fi de garantir-ne l'accés, l’emmagatzematge i la preservació a llarg termini.

 

3. Com triar el repositori per dipositar les dades?

En el moment de triar un repositori per dipositar les dades d'una recerca, cal tenir en compte diferents aspectes. En primer lloc, s'ha de comprovar si l'agència finançadora obliga a dipositar les dades en algun repositori en concret.

Si no és així, per a les disciplines que tenen repositoris temàtics consolidats es recomana optar per aquests, ja que les dades obtindran més visibilitat entre els investigadors de l'àrea.
En cas de no existir un repositori temàtic de confiança, les dades s'hauran de dipositar al repositori institucional.
Si la institució no té un repositori propi, se’n pot utilitzar un de multidisciplinari, sempre que compleixi amb una sèrie de requisits mínims de qualitat.
Triar repositori

 Per triar un repositori de confiança convé tenir en compte les característiques següents:

  1. Que el repositori estigui gestionat per algú de confiança, que se’n pugui identificar correctament el responsable i que s’hi pugui contactar.
  2. Que la pàgina web del repositori sigui navegable i que contengui tota la informació necessària per identificar les polítiques de dipòsit i accés a les dades.
  3. Que compleixi amb els principis FAIR, per tal d'assegurar que les dades siguin trobables, accessibles, interoperables i reutilitzables.
  4. Que s'assigni un identificador únic i persistent (per exemple, DOI o Handle).
  5. Que asseguri la preservació de les dades a llarg termini.
  6. Que es puguin assignar llicències per a la reutilització de les dades.
  7. Que permeti l'emmagatzematge de diferents formats i tipus de fitxers.
  8. Que permeti establir un període d'embargament de les dades, si és necessari.
  9. Que es faci curació de les dades.
ERC Informe Com a guia, es pot consultar l’estudi de l’ERC amb els repositoris que compleixen la normativa de ciència oberta de la Unió Europea, com, per exemple, el CORA.RDR.
També es pot tenir en compte el segell Core Trust Seal, que certifica els repositoris que compleixen amb els principis FAIR. Core Trust Seal

  

4. Documentar les dades

Documentar adequadament les dades en garanteix la correcta comprensió, interpretació i reutilització, ja sigui dels mateixos membres del grup de recerca en una data posterior com d’altres investigadors.

Hi ha diverses maneres de documentar les dades:

  • Qüestionaris
  • Llibre de codis
  • Diccionaris de dades (més informació).
  • Quaderns de laboratori…

A més, a l’hora de dipositar les dades a un repositori, la manera més habitual de documentar-les és amb un fitxer README en format .txt, que s’adjunta amb la resta d’arxius del conjunt de dades (dataset). Aquest document moltes vegades és obligatori i ha de contenir la informació següent:

Readme.txt
  • Informació general:
    • Títol del conjunt de dades
    • Nom, afiliació, direcció i adreça electrònica de l'investigador principal i els coautors
    • Data de creació i localització de les dades
    • Informació sobre fonts de finançament
    • Descripció breu del conjunt de dades
    • Paraules clau
  • Llicències i restriccions d'ús de les dades
  • Informació sobre els arxius: nom i descripció dels arxius, versió, grandària del conjunt de dades, etc.
  • Informació sobre la metodologia: descripció de la metodologia per a la creació i processament de les dades.
  • Informació específica sobre les dades:
    • Llistat de variables: noms complets i encapçalaments en les columnes per a dades tabulades
    • Unitats de mesura
    • Definició de codis o símbols utilitzats per registrar dades que falten

Generalment, els fitxers README es redacten en anglès o en la llengua del conjunt de dades. Es poden consultar instruccions i plantilles a l’hora de preparar el README:

 

CORA.RDR

El repositori de dades de recerca de la Universitat de les Illes Balears, en col·laboració amb les universitats i centres de recerca catalans (i gestionat pel CSUC), és el CORA.RDR.

CORA_UIB 

Com accedir-hi?

  • Seleccioneu «Altres opcions: Nom d'usuari / Correu electrònic».
  • Per accedir la primera vegada us heu de crear un compte a la plataforma, utilitzant el correu institucional.

Accés a CORA

Qui hi pot dipositar dades?

  • Almenys un dels autors del conjunt de dades ha de ser un investigador amb afiliació a la UIB.
  • Almenys un dels autors del conjunt de dades ha de tenir un identificador ORCID i posar-lo a les metadades.
  • La publicació al repositori requerirà la validació de la Biblioteca.

Què es permet de dipositar-hi?

  • Dades de recerca.
  • Codi.
  • La documentació que acompanyi el conjunt de dades: diccionari de dades, tesaurus, scripts, etc. (el readme.txt és obligatori).
  • Els fitxers poden tenir qualsevol format, però s’aconsella emprar formats lliures. Es recomanen i es preserven els formats indicats a la taula: «Formats recomanats i acceptats».

Mida dels conjunts de dades

  • Fins a 500 GB o 5.000 arxius per defecte.
  • Si es necessita més espai, cal seguir un procés específic i s’ha de tramitar a través de la Biblioteca.

Nivell d’obertura

  • Dades en obert: no hi ha restriccions en l’accés, cosa que permet que qualsevol persona pugui veure-les i descarregar-les. Aquesta és l’opció més adequada per publicar dades que no són confidencials, sensibles, comercials o amb altres restriccions legals.
  • Dades embargades: hi ha restriccions temporals en l’accés a les dades. Aquest embargament pot aplicar-se a la totalitat o a part del conjunt de dades, perquè no siguin accessibles durant un termini màxim de dos anys. Tot i així, les metadades del conjunt de dades sempre seran visibles. Cal tenir en compte que, si es fixa un període d’embargament, aquest no es pot modificar, ni per allargar-lo ni per escurçar-lo.
  • Dades restringides: s’hi restringeix l’accés per raons de copyright, temes ètics o confidencialitat. Cal subratllar que el principi bàsic de les dades de la investigació finançada amb fons públics és que han de ser tan accessibles com sigui possible i estar tan protegides com sigui necessari. Tot i així, les metadades del conjunt de dades sempre seran visibles.

Dades personals

  • No es poden dipositar dades personals que no estiguin anonimitzades i amb un consentiment que ho permeti.

Amb aquests enllaços podeu accedir a:  

També teniu disponible una checklist que us ajudarà a seguir tots els passos per publicar el vostre conjunt de dades al repositori.

CORA

La Biblioteca amb els ODS