Cadastrar

De dados isolados ao conhecimento compartilhado: como o WorldFAIR está moldando o futuro da pesquisa

Cientistas frequentemente enfrentam desafios no acesso e uso de dados de pesquisa devido à terminologia inconsistente, formatos não estruturados e detalhes ausentes. O projeto WorldFAIR aborda essas questões promovendo os princípios FAIR (Findable, Accessible, Interoperable, Reusable) para melhorar a acessibilidade de dados e promover a colaboração entre disciplinas. No centro do projeto estão 11 estudos de caso que abrangem uma ampla gama de campos científicos e comunidades globais.

As ferramentas digitais oferecem oportunidades cada vez maiores para a ciência colaborativa enfrentar desafios globais, mas, com muita frequência, dados valiosos necessários para informar esse trabalho permanecem fora do alcance dos pesquisadores.

Os dados podem estar enterrados em uma coleção impossível de pesquisar, codificados com terminologia idiossincrática ou de uma forma que não pode ser facilmente combinada com outros dados — ou não podem ser facilmente utilizados porque os cientistas não conseguem verificar detalhes sobre os dados em si, como suas origens ou termos de uso.

“Este é um problema que é tão antigo quanto a própria ciência”, explica Simon Hodson, o diretor executivo da Comitê de Dados (CODATA) do Conselho Internacional de Ciências (ISC), que trabalha para melhorar a disponibilidade e a usabilidade dos dados.

Esses problemas de dados podem limitar as oportunidades de pesquisa e desperdiçar tempo e dinheiro. De acordo com pesquisa publicado pela Comissão Europeia em 2018, a limpeza de dados de baixa qualidade para torná-los utilizáveis ​​é de longe a tarefa que mais consome tempo em um projeto médio de análise de dados, podendo chegar a 80% do esforço total.

A Feira mundial projeto, uma colaboração entre CODATA e o International Science Council (ISC), enfrentou esse problema. O projeto tinha como objetivo “fazer os dados funcionarem” encorajando a adoção do FAIR Princípios de dados (Findable, Accessible, Interoperable, Reusable), promovendo melhor gerenciamento de dados e pesquisa apoiada por análise assistida por máquina. 

Com o encerramento do projeto, a CODATA pretende dar continuidade e expandir a iniciativa com MundoFAIR+, que incluirá novos parceiros e estudos de caso internacionais colocando em prática as lições aprendidas ao longo do projeto WorldFAIR de dois anos. 

A nova fase será estruturada como uma “federação” de projetos, fornecendo uma estrutura para colaboração onde cientistas podem compartilhar expertise técnica e desenvolver o trabalho uns dos outros. A CODATA está convidando potenciais parceiros para sugerir estudos de caso e se envolver.

Estudos de caso de interoperabilidade de dados

O trabalho inicial da CODATA que forneceu a base para a WorldFAIR começou em 2017, com o apoio do ISC e o financiamento do Associação Chinesa de Ciência e Tecnologia. Esse trabalho formativo incluiu workshops que levaram ao desenvolvimento de três estudos de caso, cada um focado no uso de dados em um campo específico: doenças infecciosas, planejamento urbano e redução de risco de desastres. Nos estágios iniciais do projeto, a CODATA também desenvolveu uma parceria-chave com a Data Documentation Initiative (IDD).

Com base nestes esforços, a CODATA garantiu financiamento da Comissão Europeia para a WorldFAIR. O projeto apoiou 11 estudos de caso que examinaram o uso de dados em uma ampla gama de campos – incluindo patrimônio cultural, nanomateriais e ciência oceânica. Os estudos de caso abrangeram 13 países, incluindo Brasil, Quênia, Nova Zelândia e EUA.

As lições aprendidas com o projeto formaram a base de 11 recomendações de políticas para melhorar o uso e a disponibilidade de dados para a ciência, e levou ao desenvolvimento da Estrutura de interoperabilidade entre domínios (CDIF), que visa tornar dados de diferentes campos científicos mais interoperáveis. 

Ao mesmo tempo, a CODATA publicou novas Terminologia de gerenciamento de dados de pesquisa, que fornece definições claras de termos usados ​​no campo; esses termos foram agora publicados como um “Vocabulário FAIR”, e em breve estará disponível on-line em um formato mais facilmente legível. 

Cada um dos 11 estudos de caso também gerou seu próprio relatórios e orientações para uso de dados, com o objetivo de fazer recomendações relevantes em diferentes domínios da ciência. 

Um dos estudos de caso analisou biodiversidade agrícola, com foco na polinização – um campo onde o modelo para descrever e categorizar dados ainda está sendo definido. Com base em dados e contribuições de colegas ao redor do mundo, pesquisadores de meia dúzia de países – Brasil, Quênia, Argentina, EUA, Reino Unido e Holanda – desenvolveram um guia completo e conjunto de ferramentas para dados relacionados à forma como plantas e polinizadores interagem. 

É um tópico extremamente específico, mas relevante em quase todos os lugares, para cientistas de diversas áreas diferentes, que agora podem se beneficiar de uma maneira unificada e padronizada de abordar os dados, facilitando o desenvolvimento do trabalho dos colegas e acelerando suas próprias pesquisas. 

“A mudança de abordagens diversas e iniciativas isoladas para dados de interações entre plantas e polinização FAIR amplamente disponíveis para cientistas e tomadores de decisão permitirá o desenvolvimento de estudos integrativos que melhoram nossa compreensão da biologia, comportamento, ecologia, fenologia e evolução das espécies”, escrever pesquisadores que trabalharam no estudo de caso

Em outro estudo de caso, os pesquisadores analisaram redução do risco de desastres. “Como as mudanças climáticas e o aumento populacional provavelmente aumentarão tanto a gravidade quanto a frequência dos desastres, a necessidade de dados confiáveis ​​para informar nossas respostas se torna cada vez mais crítica”, eles escrevem. 

Cientistas e agências nacionais e internacionais que trabalham com risco de desastres olham para o passado para estimar o impacto de possíveis eventos futuros e entender como mitigar e se recuperar depois. Eles também se baseiam em dados produzidos constantemente por sensores na Terra e em satélites, executados por fontes públicas e privadas.

Mas no estudo de caso, os pesquisadores acharam difícil obter o tipo de informação necessária para fazer avaliações precisas, porque muitos dos dados relevantes não se encaixam nos princípios de dados FAIR. Informações vitais geralmente estão faltando – como o número de pessoas feridas em um desastre ou a rapidez com que o evento se desenrolou. Em outros casos, as autoridades nacionais usam seus próprios métodos para calcular pontos de dados importantes sem mostrar seu trabalho, dificultando a comparação por outros.

Com base em sua extensa pesquisa, a equipe do estudo de caso fez uma série de recomendações para práticas que devem facilitar a tomada de decisões políticas baseadas em evidências neste campo cada vez mais urgente – “um passo fundamental para a construção de comunidades e nações mais seguras e resilientes”, eles escrevem. 

Pesquisadores da União Internacional de Química Pura e Aplicada (IUPAC) realizou um estudo de caso analisando como dados e terminologia relacionados a produtos químicos podem ser mais facilmente utilizáveis ​​por humanos e máquinas. 

A IUPAC tem mais de um século de experiência convocando químicos para definir e padronizar a maneira como cientistas no campo trabalham e falam sobre produtos químicos. Mas como ferramentas digitais – e cada vez mais IA e tecnologia relacionada – oferecem novas maneiras de trabalhar, o estudo de caso da IUPAC analisou como esses padrões poderiam ser tornados mais eficientes e tornar mais fácil para outros cientistas reutilizar dados de química. 

Um dos produtos do estudo de caso foi um “livro de receitas”, um recurso aberto de diretrizes para ajudar cientistas – incluindo estudantes, professores e profissionais – a entender como trabalhar com dados de química e como tornar seus próprios dados mais acessíveis a outros. 

O projeto também descreveu um novo e ambicioso protocolo digital aberto que poderia conectar muitos bancos de dados químicos globais diferentes, permitindo que cientistas encontrassem e acessassem dados com uma única consulta – e igualmente, verificassem se seus próprios dados são legíveis por máquinas. 

Construindo uma linguagem compartilhada para dados científicos

Reunir cientistas para falar sobre os dados que produzem e tentar entender como outros trabalham com seus próprios dados tem sido esclarecedor, explica Hodson. 

E ao estabelecer padrões e definições claros, os cientistas não estão apenas ajudando a pesquisa atual, mas também tornando mais fácil para as gerações futuras desenvolverem seu trabalho — talvez de maneiras que os autores originais nunca teriam considerado, ele acrescenta. 

“Algo que descobrimos na WorldFAIR foi o quão fascinante e útil era simplesmente ter essas conversas, reunir todos os estudos de caso em uma sala e fazê-los falar sobre seus dados, o que eles fazem, como funcionam e como os descrevem — e, em alguns casos, identificar conexões que não tínhamos necessariamente imaginado com antecedência”, diz ele. 


Você também pode estar interessado em

blog
24 de Julho de 2024 - 5 min read

WorldFAIR: Continuando a transformar dados para enfrentar desafios complexos em um projeto de acompanhamento

Saiba Mais Saiba mais sobre WorldFAIR: Continuando a transformar dados para enfrentar desafios complexos em um projeto de acompanhamento
Ciência dos dados blog
07 de Junho de 2022 - 11 min read

Implementando os princípios de dados FAIR – o que está por trás da sigla?

Saiba Mais Saiba mais sobre a implementação dos princípios de dados FAIR – o que está por trás da sigla?

Imagem por Taylor Vick on Unsplash.


Aviso Legal
As informações, opiniões e recomendações apresentadas em nossos blogs convidados são de contribuidores individuais e não refletem necessariamente os valores e crenças do Conselho Científico Internacional.


Ative o JavaScript em seu navegador para preencher este formulário.

Mantenha-se atualizado com nossos boletins