De acuerdo con la OCDE, “datos de investigación” son los registros factuales (datos numéricos, textuales, imágenes y sonidos) utilizados como fuentes primarias para la investigación científica y que están aceptados por la comunidad investigadora como medios para validar conclusiones. Un conjunto de datos de investigación o dataset constituye una representación sistemática y parcial del tema u objeto investigado.
NO SON "datos de investigación" cuadernos de laboratorio, análisis preliminares, borradores de artículos, planes para futuros desarrollos, revisiones por Fuente: OECD Principles and Guidelines for Access to Research Data from Public Funding y Biblioteca UCM.
Antes de la finalización del proyecto de investigación es muy probable que existan tres tipos de datos:
La elección de los datos a preservar va a depender principalmente de la finalidad que se persiga:
En ambos casos, la documentación que acompaña a los datos debe ser lo suficientemente clara para cumplir con los criterios anteriores.
Por lo general es obligatorio hacer públicos los datos de las investigaciones financiadas con fondos públicos. No obstante, hay casos que pueden tener restricciones de acceso
Mandatos
Para conocer los mandatos y normativa aplicable al depósito en abierto de los datos de investigación vaya a la pestaña Marco Legal.
Políticas editoriales
La mayoría de los editores científicos exigen que los datos en los que se basan los resultados de investigación estén disponibles en abierto en repositorios de datos con el objeto de facilitar el proceso de revisión por pares, facilitar la reproducibilidad, aumentar la confianza en la ciencia, etc.
A continuación se puede consultar la política de acceso a datos de investigación de las siguientes editoriales:
Los datos de investigación abiertos son uno de los pilares sobre los que se sustenta el movimiento conocido como ciencia abierta para abrir todo el proceso y los resultados a la sociedad sin trabas. La apertura de los datos implica indudables beneficios tales como:
El acrónimo FAIR hace referencia a las cuatro cualidades que deben tener los datos de investigación abiertos y sus metadatos (información sobre un objeto digital):
Más información en:
La Ley de Propiedad Intelectual, que ha sido adaptada a la normativa europea, recoge dos aspectos muy importantes aplicables a los datos de investigación:
El derecho “sui generis” sobre una base de datos tiene las siguientes características:
Más información: OpenAIRE. OpenAIRE Legal Policy Webinar: Data, Data Ownership and Open Science
Licencias
Tal y como se recoge en las Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, es conveniente añadir licencias de uso a los sets de datos que se generen.
Para indicar el tipo de uso permitido, se pueden utilizar licencias Creative Commons 4.0, como las CC0 y CC-BY. También es posible utilizar licencias específicas para datos Open Data Commons:
Para programas informáticos se recomienda el uso de licencias de la Free Software Foundation y la Open Source Iniciative, que se pueden localizar desde https://tldrlegal.com/
Para la selección de licencias, tanto de datos como de programas informáticos, se recomienda la utilización de la herramienta License selector.
No hay que olvidar la idea general “Tan abierto como sea posible, tan cerrado como sea necesario” que se declara en las Guidelines on FAIR Data Managemenet in Horizon 2020. Cumpliendo esta premisa, no se difundirán en abierto los datos de investigación en determinadas situaciones: existencia de cláusulas de confidencialidad, posible explotación comercial o industrial, etc.
Otros aspectos sobre desechos de autor y propiedad intelectual
Un Plan de Gestión de Datos (PGD), es un documento formal que describe la gestión que se aplicará a los datos de investigación a lo largo del proyecto.
Aspectos que puede incluir un PGD (Fuente: Biblioteca CEPAL):
El Plan es un documento vivo que evoluciona con el proyecto; debe actualizarse a mitad del proyecto, a su finalización y siempre que haya cambios significativos.
¿Por qué realizar un PGD?
Horizonte Europa establece la obligatoriedad de redactar un PGD y actualizarlo regularmente, para todos aquellos proyectos subvencionados con fondos de la Unión Europea.
10 pasos para elaborar un Plan de Gestión de Datos según REBIUN
1. Revisa los requerimientos de la entidad financiadora.
2. Identifica los datos: tipología, procedencia, volumen, formatos y ficheros.
3. Define cómo se organizarán y gestionarán los datos: nombre de los ficheros, control de versiones, software necesario...
4. Explica cómo se documentarán los datos: identifica la información a procesar, consulta si hay estándares o esquemas de metadatos, identifica herramientas que permitan gestionarlos.
5. Describe los procesos que aseguran una buena calidad de los datos.
6. Prepara una estrategia de almacenamiento (durante el proceso) y de preservación de datos (repositorio).
7. Define las políticas de datos del proyecto: cuestiones sobre propiedad intelectual y cómo se tratarán los datos sensibles y personales.
8. Describe cómo se difundirán los datos: dónde, cuáles, cuándo se van a difundir. Si publicarás los datos en un repositorio, como información suplementaria del artículo o como un "data paper".
9. Asigna roles y responsabilidades para las personas y organizaciones participantes en el proyecto.
10. Prepara un presupuesto realista: la gestión de datos cuesta tiempo y dinero en términos de software, hardware, servicios y personal.
Existen varias plantillas y plataformas de apoyo para cumplimentar el PGD; se basan en un cuestionario donde explicar la gestión durante el ciclo de vida de los datos, desde su creación hasta la finalización del proyecto de investigación.
Plantillas y guías:
Herramientas:
Ejemplos de PGD
Un repositorio de acceso abierto almacena y permite el acceso libre a una colección digital de resultados de investigación. Un repositorio te puede proveer con un identificador persistente que facilita el hallazgo de las publicaciones. Muchos repositorios de datos también aceptan publicaciones y permiten establecer vínculos entre estas y sus datos subyacentes. Este es el caso de Helvia, Repositorio Institucional de la Universidad de Córdoba que tiene una de sus colecciones dedicadas a albergar los datos de investigación generados por los investigadores/as de nuestra comunidad universitaria. Para depositar datos de investigación en Helvia puede dirigirse a repositorio@uco.es.
Cuando los investigadores no disponen de un repositorio temático o institucional para depositar sus datos de investigación pueden usar el repositorio Zenodo, proporcionado por la Comisión Europea y alojado en el CERN. No olviden describir los conjuntos de datos con el mayor detalle posible para su posterior localización y reutilización.
También existen recolectores de datos, es decir, sistemas que permiten buscar en los metadatos pero no alojan los conjuntos de datos propiamente dichos, sino que los enlazan al repositorio que los guarda.
Repositorios de datos
Dryad es un repositorio de datos de investigación orientado a facilitar su descubrimiento, libre reutilización y citables. Surgió de la iniciativa de un grupo de importantes revistas sociedades científicas de adoptar una política conjunta de archivo de datos para sus publicaciones y del reconocimiento de que era necesaria una infraestructura de datos abierta, fácil de usar, sin ánimo de lucro y gestionada por la propia comunidad.
eCiencia Datos. Repositorio que reúne los conjuntos de datos del Consocio Madroño (universidad públcias madrilenas y UNED).
Figshare es un repositorio digital en línea donde los investigadores pueden preservar y compartir todos los datos y resultados que genera un proceso de investigación, incluyendo figuras, bases de datos, imágenes y vídeos. También permite a los investigadores publicar los datos negativos de una investigación.
Harvard Dataverse es un repositorio de datos gratuito abierto a todos los investigadores de cualquier disciplina, tanto dentro como fuera de la comunidad de Harvard, donde se puede compartir, archivar, citar, acceder y explorar los datos de investigación.
Mendeley Data es un repositorio comunitario gratuito y seguro basado en la nube donde puedes almacenar tus datos, asegurando que sea fácil compartirlos, acceder a ellos y citarlos, estés donde estés.
UK Data Archive. Colección de datos sociales, económicos y de población del Reino Unido desde hace más de 50 años. UK Data Service adquiere, conserva, publica y preserva datos primarios de investigación en nombre del Servicio de Datos del Reino Unido.
Zenodo es un repositorio de acceso abierto de propósito general desarrollado bajo el programa europeo OpenAIRE y operado por CERN.
Recolectores de metadatos y directorios de repositorios
Repositorios recomendados por PLOS One por disciplinas
Por qué es importante citar los datos:
Buenas prácticas para citar datos:
Elaboración de la cita:
Existen elementos mínimos obligatorios y otros recomendados que se combinan para elaborar la cita en cualquier estilo estándar (ALA, MLA, Chicago, etc.) o los propuestos por los principales repositorios de datos (Dataverse, Dryad, etc.).