PLOS ONE y los datos brutos

_

Me hago eco hoy de un notición bastante relevante, a mi parecer.

PLOS’ New Data Policy: Public Access to Data

Para quien le de pereza leer el artículo en inglés, lo resumo aquí: PLOS ONE, una de las revistas Open Access con más prestigio, ha decidido que los datos en bruto deben ser publicados junto con los resultados del artículo, con el fin de facilitar los procesos de replicación y validación por parte de laboratorios colegas.

Esto supone varias cosas. La primera, creo yo que no cabe duda, es un paso de gigante hacia la transparencia en la ciencia. Lo cual, dicho sea de paso, hace falta. En muchas ocasiones se publican artículos cuyos resultados no sólo son sorprendentes, sino que llegan a ser incluso sospechosos, y que cualquier investigador pueda tener acceso a los datos en bruto que han sido analizados es apostar por la credibilidad de los autores.

_

PLOS ONE liderando el cambio en las políticas editoriales

_

Ahora bien, aunque estoy convencido de que a grandes rasgos esta medida es positiva, no está exenta de problemas. Algunos que puedo pensar a simple vista…

Un proceso de publicación mucho más lento.

Es la asignatura pendiente de la mayoría de las revistas: los tiempos de publicación. En un mundo en el que los avances científicos están a la orden del día, es ilógico que un artículo tarde varios meses de media en publicarse. Por este motivo, añadir que a un revisor se le antoje repasar los datos brutos antes de decidir si un paper en cuestión puede/debe/merece ser publicado, añade más tiempo al proceso.

En este sentido, me pregunto si no será una cuestión de solicitar los datos una vez el artículo esté aceptado para publicación. Algunas veces ocurre que los artículos se eliminan de revistas tras procesos de evaluación posteriores a la publicación. Siendo así, no me parece mal; le publicamos el artículo, pero luego le pedimos los resultados. De este modo, no tendría nada que objetar.

Privacidad

Al fin y al cabo, datos en bruto son datos privados, de investigadores, laboratorios, grupos o instituciones. Que cualquiera tenga acceso a ellos es sinónimo de abrir la puerta de tu casa. Aparte, la probabilidad de que esos datos caigan en malas manos aumenta, en mi opinión, muchísimo.

Robo de datos

Lamentablemente, vivimos en un mundo donde la ciencia, sino la gran parte, mucha parte, está corrupta. Y no me refiero a resultados manipulados, sino a politiqueos y amiguismos dentro del mundo editorial; el «si yo te publico aquí, tú me publicas allá»; o el «vamos a aceptar el paper de esta persona sin mirar porque mira qué respetado es en el campo». Esto, por desgracia, está a la orden del día. Que un editor mala persona pueda acceder a los datos en crudo aumenta la probabilidad de que advierta a algún colega, ralentice o pare la publicación de determinado paper porque su grupo o el grupo de un amigo tiene resultados parecidos (o diferentes), y los quiere publicar antes. Aunque, siendo sinceros, esto pasa ahora sin acceso a los datos crudos.

Manipulación de datos

Al final, quien manipula, manipula. Estoy seguro de que existen algoritmos y herramientas para descubrir cuándo una tabla de Excel ha sido manipulada, o cuándo unos datos presentan una distribución sospechosamente específica. Pero realmente no existe diferencia entre mentir a la hora de informar de resultados, siendo otros los datos originales que modificar esos datos originales antes de entregarlos.

A este respecto sé que existen protocolos que permiten reflejar todos los movimientos de una persona en cada sesión de ordenador. Esto sería una forma de detectar prácticas fraudulentas, pero limitaría la libertad de los investigadores el tener que trabajar siempre desde el mismo ordenador, etc. De todas formas, quizá valdría la pena.

_

No sé. A mí, todo lo que sea transparencia me parece bien. Y más después de los episodios que he sufrido en las últimas semanas. Creo que un científico vale tanto como su reputación y la respetabilidad de su trabajo. Cosa que, sin duda, pasa por ser honesto con los resultados, independientemente de cuáles sean estos.

Supongo que el tiempo dirá si esta medida se populariza. O si las ventajas y beneficios compensan los posibles problemas. ¡Estaremos atentos!

_

Anuncios

4 pensamientos en “PLOS ONE y los datos brutos

  1. Pingback: PLOS ONE y los datos brutos

  2. Me parece una buenísima noticia, aunque más por facilitar la reinterpretación de los datos que la repetibilidad de los experimentos. Dar acceso a los datos en crudo hace trivial la producción de nuevas gráficas y estudios, los cuales pueden aportar un enfoque diferente.

    La cuestión es que si los datos están manipulados desde la fuente, ya puedes regalarlos que no nos van a servir de nada. En mi opinión el camino no es usar “herramientas de excel” para controlar las revisiones, ni grabar las sesiones de trabajo; porque además de ser medidas muy fáciles de evitar, son problemáticas para los investigadores. Creo que la única forma con posibilidades de ser efectiva es implantar un sistema de arbitraje por parte de las propias publicaciones.

    Otra medida menor que se me ocurre es hacer que los fabricantes de los aparatos usados en los laboratorios generen datos firmados con un certificado digital. De esta manera, aunque los datos sean falsificados al pasarse al estudio en sí, podrían verse las discrepancias en las lecturas reales de las máquinas.

    Me gusta

  3. Pingback: Magapsine (25/02/2014) | dronte.es

  4. Uhmm… Yo de primeras, no lo veo.
    Es demasiado grande el trabajo que supone la recogida de datos (tiempo, dinero, personal, recopilación, creación de bases, diseño de experimentos, etc.). En animales lo es, en personas ya ni te cuento.
    De forma puntual, por ejemplo, al revisor que está evaluando tu artículo, o a un grupo que trabaja en lo mismo y te lo pide, ya que tiene resultados completamente opuestos; pues quizá, pero al igual que en cualquier profesión, la ciencia trabaja con sus principios y la veracidad de sus resultados, es uno de ellos. La privacidad de los datos me parece de los más relevante y puede que esta práctica aumentaría el nivel de transparencia, o quizá no, ya que se podrían manipular los datos también…
    Desde mi punto de vista, el trabajo que se hace a nivel científico es bastante transparente, y la publicación de datos, aunque desconozco las razones que se dan para decir que debería hacerse, la veo compleja. Además, podría favorecer que científicos no se encargaran de plantear estudios, diseñar sus experimentos y recoger sus muestras, ya que tendrían acceso a datos con los que podrían trabajar y evolucionar en su carrera, sin el esfuerzo que otros emplean.
    Igual soy demasiado confiada (que sé que lo soy), pero opino que manipular un trabajo no tiene sentido, y que la gran, gran mayoría, es transparente en su trabajo.

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s