Criar conta

Resumo da ciência aberta: julho de 2024

Nesta edição trazemos uma notícia de Wellett Potter, Professor de Direito pela Universidade da Nova Inglaterra, Estados Unidos. É republicado de A Conversação através do Creative Commons CC-BY-ND.

Uma editora acadêmica fechou um acordo de dados de IA com a Microsoft – sem o conhecimento de seus autores

Em maio, uma multinacional multibilionária sediada no Reino Unido chamada Informa anunciou em um comunicado atualização de negociação que assinou um acordo com a Microsoft envolvendo “acesso a conteúdos e dados de aprendizagem avançados e uma parceria para explorar aplicações especializadas em IA”. A Informa é a controladora da Taylor e Francis, que publica uma ampla gama de livros e revistas acadêmicas e técnicas, portanto os dados em questão podem incluir o conteúdo desses livros e revistas.

De acordo com o relatórios publicados em julho, os autores do conteúdo não parecem ter sido questionados ou mesmo informados sobre o negócio. Além do mais, eles dizem que não tiveram oportunidade de cancelar o acordo e não receberão nenhum dinheiro com isso.

Os académicos são apenas os mais recentes de vários grupos daquilo a que poderíamos chamar criadores de conteúdos que se ofendem por terem o seu trabalho ingerido pelos modelos generativos de IA que actualmente correm para absorver os produtos da cultura humana. Jornalartistas visuais e a  gravadoras já estão levando empresas de IA a tribunal.

Embora não esteja claro como a Informa reagirá aos rumores de descontentamento, o acordo é um lembrete aos autores para estarem cientes dos termos contratuais dos acordos de publicação que assinam.

O que há no acordo da Informa?

A atualização da Informa declarou quatro áreas de foco do acordo com a Microsoft:

  • aumentando a produtividade da própria Informa
  • desenvolvendo uma ferramenta de citação automatizada
  • desenvolver software assistente de pesquisa baseado em IA (talvez como um sistema sendo testado por biblioteca acadêmica on-line JSTOR)
  • dar acesso aos dados da Microsoft para “ajudar a melhorar a relevância e o desempenho dos sistemas de IA”.

A Informa receberá mais de £ 8 milhões (A$ 15.5 milhões) pelo acesso inicial aos dados, seguido de pagamentos recorrentes de um valor não especificado pelos próximos três anos.

Não sabemos exatamente o que a Microsoft planeja fazer com seu acesso a dados, mas um cenário provável é que o conteúdo de livros e artigos acadêmicos seja adicionado aos dados de treinamento de modelos de IA generativos do tipo ChatGPT. Em princípio, isto deveria tornar os resultados dos sistemas de IA mais precisos, embora os modelos de IA existentes tenham enfrentado fortes críticas, não só por regurgitando dados de treinamento sem citação (o que pode ser visto como uma espécie de plágio), mas também para inventando informações falsas e a  atribuindo para fontes reais.

No entanto, a atualização também diz que “o acordo protege os direitos de propriedade intelectual, incluindo limites para extratos textuais literais e alinhamento sobre a importância de referências de citações detalhadas”.

Os “limites para extratos textuais literais” mencionados provavelmente dizem respeito ao Doutrina dos EUA de uso justo, que permite determinados usos de material protegido por direitos autorais.

Muitas empresas de IA generativa estão atualmente enfrentando ações judiciais por violação de direitos autorais sobre o uso de dados de treinamento, e suas defesas provavelmente se basearão na alegação de uso justo.

A “importância das referências de citação detalhadas” pode estar relacionada ao conceito de atribuição em direitos autorais. Isto é um direito moral possuída pelos autores. Dispõe que o criador da obra seja conhecido e atribuído como autor quando sua obra for reproduzida.

Como geralmente funciona a publicação acadêmica?

A maioria dos acadêmicos não recebe pagamento nem obtém lucro com a maior parte de suas publicações acadêmicas. Em vez disso, escrever artigos para periódicos e conferências é geralmente considerado parte do escopo do trabalho em um cargo efetivo de tempo integral. A publicação constrói a credibilidade de um acadêmico e promove suas pesquisas.

O processo básico geralmente é assim: um autor pesquisa e escreve um artigo original e o envia a um editor de periódico para revisão por pares. A maioria dos revisores e membros do conselho editorial também não recebe pagamento pelo seu trabalho.

Na verdade, alguns periódicos podem exigir que os autores paguem uma “taxa de processamento do artigo”Para cobrir edição e outros custos. Isso pode custar milhares de dólares por um acesso aberto publicação. De um modo geral, quanto mais prestigiada for a publicação, maior será o preço.

Se um artigo for aprovado na revisão por pares, o autor será solicitado a assinar um contrato de publicação. Os termos podem abranger providências logísticas como quando o artigo será publicado, o formato (impresso, online ou ambos) e a divisão dos royalties (se aplicável). Haverá também acordos relativos aos direitos autorais e propriedade do artigo.

Um autor geralmente também deve conceder direitos exclusivos ao editor para distribuir e publicar o artigo. Isso pode significar que o autor não pode publicar o artigo em outro lugar, e o editor também pode sublicenciar o artigo a terceiros, como uma empresa de IA.

Às vezes, os editores exigem que um autor lhes atribua os direitos autorais do artigo por meio de um documento permanente. acordo de transferência de direitos autorais.

Essencialmente, isso significa que o autor concede todos os seus direitos autorais como detentor dos direitos autorais da obra ao editor. O editor pode então reproduzir, comunicar, distribuir ou licenciar a obra a terceiros como desejar.

É possível atribuir apenas direitos limitados, em vez de todos os direitos, e isto é algo que os autores devem considerar.

Mineração de conteúdo

É vital que os autores compreendam as implicações do licenciamento e da cessão e considerem precisamente o que estão a concordar quando assinam um contrato. À luz da tendência recente de editores celebrando acordos com empresas de IA generativa, as políticas de IA dos editores também devem ser examinadas de perto.

Nos EUA, um padrão solução de licenciamento coletivo para uso de conteúdo em sistemas internos de IA foi lançado recentemente, que estabelece direitos e remunerações aos detentores de direitos autorais. Licenças semelhantes para o uso de conteúdo para sistemas de IA provavelmente entrarão no mercado australiano muito em breve.

Os tipos de acordos alcançados entre editores acadêmicos e empresas de IA suscitaram preocupações mais amplas para muitos acadêmicos. Queremos que a pesquisa acadêmica seja reduzida a conteúdo para Mineração de conhecimento de IA? Não há respostas claras sobre a ética e a moral de tais práticas.

Sobre o autor:

Dr. Wellett Potter é professor da Faculdade de Direito da Universidade da Nova Inglaterra, Armidale. Orgulhosa ex-aluna da UNE, ela se tornou funcionária em tempo integral em 2022, após receber seu doutorado em direito em março de 2021. Antes de 2022, ela passou onze anos como acadêmica na Faculdade de Direito da UNE, estando envolvida em mais de 25 unidades jurídicas.


Grandes histórias em Ciência Aberta

CERN fornece um “como fazer” do seu escritório de ciência aberta

O Escritório de Ciência Aberta do CERN, liderado por Anne Gentil-Beccot, oferece orientação sobre publicação em acesso aberto, gerenciamento de dados de pesquisa e software de código aberto para tornar a pesquisa científica mais acessível e eficiente. Estabelecido em 2023, o escritório fornece recursos, organiza reuniões de governação e planeia futuros cursos de formação, com o objetivo de apoiar o compromisso de longa data do CERN com a ciência aberta. Para obter mais detalhes sobre como a comunidade acadêmica e de pesquisa pode contribuir e se beneficiar, confira o artigo completo.

Meta colabora com pesquisadores para estudar saúde mental de adolescentes

Meta anunciou um novo programa piloto para dar aos pesquisadores do Centro de Ciência Aberta (COS) acesso aos dados do Instagram por seis meses. O programa tem como objetivo pesquisar e analisar o impacto das plataformas de mídia social na saúde mental dos adolescentes. Kumar Hemant, editor-adjunto da Candid.Technology e Emma Roth no Verge, explore o assunto.

Leitura adicional: O Conselho Científico Internacional lançou recentemente um programa sobre saúde mental para jovens como parte de um memorando de entendimento com a Organização Mundial da Saúde https://council.science/our-work/mental-wellbeing-young-people/

Anúncio da Global Diamond Open Access Alliance

A UNESCO organizou um evento online no dia 10 de julho para apresentar e anunciar oficialmente a Aliança Global para o Acesso Aberto aos Diamantes, destacando a sua visão, missão e objetivos, e para envolver as partes interessadas num esforço colaborativo para promover o Acesso Aberto aos Diamantes.

Assista a gravação do evento aqui.

Integridade em jogo: confrontando “publique ou pereça”No mundo em desenvolvimento e nas economias emergentes

O Plano de Ação Global para Saúde Mental da "publique ou pereça" a cultura levou a desafios éticos significativos na publicação científica, especialmente nas economias em desenvolvimento. Práticas antiéticas como a venda de autorias, a proliferação de “fábricas de papel” e a utilização indevida da IA ​​para produzir investigação fraudulenta estão a minar a integridade da investigação científica e a distorcer as métricas académicas. Este estudo, publicado na revista Frontiers in Medicine, destaca casos de fraude académica, especialmente em países de baixos rendimentos, e recomenda uma verificação mais rigorosa da autoria, medidas disciplinares para a fraude científica e políticas que promovam a transparência e a responsabilização na investigação.

O Structural Genomics Consortium explora um roteiro de ciência de dados para organizações de ciência aberta envolvidas na descoberta de medicamentos em estágio inicial.

disponível a partir de Natureza das Comunicações, a organização de pesquisa científica aberta que se concentra em discutir as oportunidades que a inteligência artificial (IA) pode trazer como principal acelerador no campo, argumentando que o gerenciamento robusto de dados requer ontologias precisas e vocabulário padronizado, enquanto uma arquitetura de banco de dados centralizada entre laboratórios facilita a integração de dados em alta- conjuntos de dados de valor.


Eventos e oportunidades de Ciência Aberta 


Nossas cinco principais leituras de Ciência Aberta


Aviso Legal

As informações, opiniões e recomendações apresentadas por nossos convidados são de seus colaboradores individuais e não refletem necessariamente os valores e crenças do International Science Council.


Foto por CHUTTERSNAP on Unsplash

Ir para o conteúdo