Les eines digitals ofereixen oportunitats cada cop més creixents per a la ciència col·laborativa per afrontar reptes globals, però massa sovint es necessiten dades valuoses per informar que el treball continua fora de l'abast dels investigadors.
Les dades poden estar enterrades en una col·lecció inexplorable, codificades amb terminologia idiosincràtica o d'una manera que no es pot fer funcionar fàcilment amb altres dades, o que no es puguin utilitzar fàcilment perquè els científics no poden verificar detalls sobre les dades en si, com ara els seus orígens o condicions d'ús.
"Aquest és un problema que en realitat és tan antic com la pròpia ciència", explica Simon Hodson, el director executiu de la Comitè de dades (CODATA) de l'International Science Council (ISC), que treballa per millorar la disponibilitat i usabilitat de les dades.
Aquests problemes de dades poden limitar les oportunitats de recerca i perdre temps i diners. Segons investigació publicat per la Comissió Europea l'any 2018, netejar les dades de mala qualitat per fer-les útils és, amb diferència, la tasca que consumeix més temps per a un projecte mitjà d'anàlisi de dades i pot suposar el 80% de l'esforç total.
La FIRA MUNDIAL El projecte, una col·laboració entre CODATA i l'International Science Council (ISC), va assumir aquest problema. El projecte tenia com a objectiu "fer que les dades funcionin" fomentant l'adopció del FIRA Principis de dades (Trobable, Accessible, Interoperable, Reutilitzable), fomentant una millor gestió de dades i investigació recolzada per l'anàlisi assistida per màquina.
Amb el projecte acabat, CODATA pretén continuar i ampliar la iniciativa amb WorldFAIR+, que inclourà nous socis i estudis de casos internacionals que posaran en pràctica les lliçons apreses al llarg del projecte WorldFAIR de dos anys.
La nova fase s'estructurarà com una "federació" de projectes, proporcionant un marc de col·laboració on els científics poden compartir coneixements tècnics i aprofitar el treball dels altres. CODATA convida a possibles socis a suggerir casos pràctics i a participar.
El treball inicial de CODATA que va servir de base per a WorldFAIR va començar el 2017, amb el suport de l'ISC i el finançament de la Associació de la Xina per a la Ciència i la Tecnologia. Aquest treball formatiu va incloure tallers que van donar lloc al desenvolupament de tres casos pràctics, cadascun dels quals es va centrar en l'ús de dades en un camp específic: malalties infeccioses, urbanisme i reducció del risc de desastres. En les etapes inicials del projecte, CODATA també va desenvolupar una associació clau amb la Data Documentation Initiative (IDD).
A partir d'aquests esforços, CODATA s'ha assegurat finançament de la Comissió Europea per WorldFAIR. El projecte va donar suport a 11 estudis de cas que examinaven l'ús de dades en una àmplia gamma d'àmbits, com ara el patrimoni cultural, els nanomaterials i la ciència oceànica. Els estudis de cas van abastar 13 països, inclosos el Brasil, Kenya, Nova Zelanda i els EUA
Les lliçons apreses del projecte van formar la base d'11 recomanacions de polítiques millorar l'ús i la disponibilitat de dades per a la ciència, i va conduir al desenvolupament de la Marc d'interoperabilitat entre dominis (CDIF), que pretén fer més interoperables les dades de diferents àmbits científics.
Paral·lelament, CODATA ha publicat noves Terminologia de gestió de dades de recerca, que proporciona definicions clares dels termes utilitzats en el camp; aquests termes s'han publicat ara com un llibre llegible per màquina "Vocabulari FAIR”, i aviat estarà disponible en línia en un format més fàcilment llegible pels humans.
Cadascun dels 11 estudis de cas també va generar el seu propi informes i orientació per a l'ús de dades, amb l'objectiu de fer recomanacions rellevants en diferents dominis de la ciència.
Un dels estudis de cas examinats biodiversitat agrícola, centrat en la pol·linització, un camp on encara s'està definint el model per descriure i categoritzar les dades. A partir de dades i aportacions de col·legues de tot el món, investigadors de mitja dotzena de països (Brasil, Kenya, Argentina, EUA, Regne Unit i Països Baixos) van desenvolupar un guia completa i conjunt d'eines per obtenir dades relacionades amb com interactuen les plantes i els pol·linitzadors.
És un tema extremadament específic, però que és rellevant gairebé a tot arreu, per als científics de diferents camps, que ara poden beneficiar-se d'una manera estàndard i unificada d'aproximar-se a les dades, fent que sigui més fàcil basar-se en el treball dels col·legues i accelerar la seva recerca pròpia.
"Passar d'enfocaments diversos i iniciatives aïllades a dades d'interaccions FAIR-pol·linització de plantes àmpliament disponibles per als científics i els responsables de la presa de decisions permetrà el desenvolupament d'estudis integradors que millorin la nostra comprensió de la biologia, el comportament, l'ecologia, la fenologia i l'evolució de les espècies". escriure investigadors que han treballat en l'estudi de cas.
En un altre estudi de cas, els investigadors van mirar la reducció del risc de desastres. "Com que el canvi climàtic i l'augment de la població és probable que augmentin tant la gravetat com la freqüència dels desastres, la necessitat de dades fiables per informar les nostres respostes es fa cada cop més crítica", escriuen.
Els científics i les agències nacionals i internacionals que treballen en el risc de desastres miren el passat per estimar l'impacte de possibles esdeveniments futurs i entendre com mitigar i recuperar-se després. També es basen en dades que produeixen constantment sensors de la Terra i dels satèl·lits, gestionats per fonts públiques i privades.
Però en l'estudi de cas, els investigadors van trobar difícil obtenir el tipus d'informació necessària per fer avaluacions precises, perquè bona part de les dades rellevants no s'ajusten als principis de dades FAIR. Sovint falta informació vital, com ara el nombre de persones ferides en un desastre o la rapidesa amb què es va desenvolupar l'esdeveniment. En altres casos, les autoritats nacionals utilitzen els seus propis mètodes per calcular punts de dades clau sense mostrar el seu treball, cosa que dificulta la comparació per a altres.
A partir de la seva àmplia investigació, l'equip d'estudi de cas va fer una sèrie de recomanacions per a pràctiques que haurien de facilitar la presa de decisions polítiques basades en l'evidència en aquest camp cada cop més urgent: "un pas fonamental per construir comunitats i nacions més segures i resilients". escriuen.
Investigadors de la Unió Internacional de Química Pura i Aplicada (IUPAC) va fer un estudi de cas sobre com les dades i la terminologia relacionades amb els productes químics es poden fer més fàcilment utilitzables tant per a persones com per a màquines.
La IUPAC té més d'un segle d'experiència convocar químics per definir i estandarditzar la manera com els científics del camp treballen i parlen sobre els productes químics. Però a mesura que les eines digitals, i cada cop més l'IA i la tecnologia relacionada, ofereixen noves maneres de treballar, l'estudi de cas de la IUPAC va analitzar com aquests estàndards es podrien fer més eficients i facilitar que altres científics reutilitzin les dades de la química.
Un dels productes de l'estudi de cas va ser un "llibre de cuina”, un recurs obert de directrius per ajudar els científics, inclosos estudiants, professors i professionals que treballen, a entendre com treballar amb dades de química i com fer que les seves pròpies dades siguin més accessibles per als altres.
El projecte també va descriure un nou protocol digital obert ambiciós que podria connectar moltes bases de dades químiques globals diferents, permetent als científics trobar i accedir a les dades amb una sola consulta i, igualment, comprovar si les seves pròpies dades són llegibles per màquina.
Hodson explica que reunir científics per parlar sobre les dades que produeixen i intentar entendre com treballen els altres amb les seves pròpies dades ha estat revelador.
I en establir estàndards i definicions clares, els científics no només ajuden a la investigació actual, sinó que també faciliten que les generacions successives puguin construir el seu treball, potser d'una manera que els autors originals mai no haurien considerat, afegeix.
"Alguna cosa que vam trobar a WorldFAIR va ser el fascinant i útil que era simplement tenir aquestes converses, tenir tots els casos pràctics en una sala i fer-los parlar sobre les seves dades i què fan i com funciona i com ho descriuen. – i, en alguns casos, identificar connexions que no necessàriament havíem imaginat per endavant”, diu.
Imatge de Taylor Vick on Unsplash.
renúncia
La informació, opinions i recomanacions que es presenten als nostres blogs de convidats són les dels col·laboradors individuals i no reflecteixen necessàriament els valors i creences de l'International Science Council.