Contractar

Resum de ciència oberta: juliol de 2024

En aquest número us presentem una notícia de Wellett Potter, Professor de Dret per la Universitat de Nova Anglaterra, Estats Units. Es reedita des de La conversa a través de Creative Commons CC-BY-ND.

Un editor acadèmic ha arribat a un acord de dades d'IA amb Microsoft, sense que els seus autors ho sàpiguen

Al maig, una multinacional multimilionària amb seu al Regne Unit anomenada Informa va anunciar en a actualització comercial que havia signat un acord amb Microsoft que implicava "accés a contingut i dades d'aprenentatge avançat i una associació per explorar aplicacions expertes en IA". Informa és l'empresa matriu de Taylor i Francis, que publica un ampli ventall de llibres i revistes acadèmics i tècnics, de manera que les dades en qüestió poden incloure el contingut d'aquests llibres i revistes.

D'acord amb informes publicats al juliol, els autors del contingut no semblen haver estat preguntats ni tan sols informats sobre l'acord. A més, diuen que no van tenir cap oportunitat de renunciar a l'acord i que no hi veuran diners.

Els acadèmics són només l'últim d'uns quants grups del que podríem anomenar creadors de contingut a sentir-se ofensiu perquè el seu treball s'ingereix pels models d'IA generativa que actualment corren per aspirar els productes de la cultura humana. Diarisartistes visuals i segells discogràfics ja estan portant empreses d'IA als tribunals.

Tot i que no està clar com reaccionarà Informa als rumors de descontentament, l'acord és un recordatori als autors que coneguin els termes contractuals dels acords de publicació que signen.

Què hi ha a l'acord Informa?

L'actualització d'Informa va indicar quatre àrees d'enfocament de l'acord de Microsoft:

  • augmentant la productivitat pròpia d'Informa
  • desenvolupament d'una eina de citació automàtica
  • desenvolupament de programari d'assistent de recerca impulsat per IA (potser com un sistema que està provant biblioteca acadèmica en línia JSTOR)
  • donant accés a les dades de Microsoft per "ajudar a millorar la rellevància i el rendiment dels sistemes d'IA".

Informa rebrà més de 8 milions de lliures (15.5 milions de dòlars australians) per l'accés inicial a les dades, seguit de pagaments recurrents d'una quantitat no especificada durant els propers tres anys.

No sabem exactament què planeja fer Microsoft amb el seu accés a les dades, però un escenari probable és que el contingut dels llibres i articles acadèmics s'afegeixi a les dades d'entrenament dels models d'IA generativa semblants a ChatGPT. En principi, això hauria de fer que la sortida dels sistemes d'IA sigui més precisa, tot i que els models d'IA existents s'han enfrontat a fortes crítiques, no només per regurgitant dades d'entrenament sense citació (que es pot veure com una mena de plagi), però també per inventar informació falsa i atribuint a fonts reals.

Tanmateix, l'actualització també diu que "l'acord protegeix els drets de propietat intel·lectual, inclosos els límits als extractes de text textuals i l'alineació sobre la importància de les referències detallades de les citacions".

Els "límits dels extractes de text textuals" esmentats probablement pertanyen a Doctrina nord-americana de l'ús legítim, que permet certs usos de material protegit per drets d'autor.

Actualment hi ha moltes empreses d'IA generativa davant de demandes per infracció dels drets d'autor sobre el seu ús de les dades de formació, i és probable que les seves defenses es basen en reclamar un ús legítim.

La "importància de les referències de cites detallades" pot pertànyer al concepte d'atribució en els drets d'autor. Això és un dret moral posseït pels autors. Disposa que el creador de l'obra ha de ser conegut i atribuït com a autor quan es reprodueixi la seva obra.

Com funciona normalment l'edició acadèmica?

La majoria dels acadèmics no reben cap pagament ni obtenen cap benefici de la majoria de les seves publicacions acadèmiques. Més aviat, escriure articles de diaris i conferències es considera generalment part de l'abast del treball dins d'una posició permanent a temps complet. La publicació construeix la credibilitat d'un acadèmic i promou la seva recerca.

El procés bàsic sovint és així: un autor investiga i escriu un article original i l'envia a l'editor d'una revista per a la seva revisió per parells. La majoria dels revisors i membres del consell editorial tampoc reben cap pagament pel seu treball.

De fet, algunes revistes poden exigir als autors que paguin un "càrrec de processament d'articles” per cobrir les despeses d'edició i altres. Això pot ser milers de dòlars per un accés Obert publicació. En termes generals, com més prestigiosa sigui la publicació, més gran serà el càrrec.

Si un article supera la revisió per parells, se li demanarà a l'autor que signi a conveni de publicació. Els termes poden incloure arranjaments logístics com ara quan es publicarà l'article, el format (impressió, en línia o tots dos) i la divisió de drets d'autor (si escau). També hi haurà acords pel que fa als drets d'autor i la propietat de l'article.

Un autor normalment també ha de concedir drets exclusius a l'editor per distribuir i publicar l'article. Això pot significar que l'autor no pot publicar l'article en un altre lloc i que l'editor també pugui sublicenciar l'article a un tercer, com ara una empresa d'IA.

De vegades, els editors requereixen que un autor els assigni els drets d'autor de l'article mitjançant un permanent acord de transferència de drets d'autor.

Bàsicament, això significa que l'autor concedeix tots els seus drets d'autor com a titular dels drets d'autor de l'obra a l'editor. L'editor pot reproduir, comunicar, distribuir o llicenciar l'obra a altres com vulgui.

Només és possible assignar drets limitats, en lloc de tots els drets, i això és una cosa que els autors haurien de tenir en compte.

Mineria de continguts

És vital que els autors entenguin les implicacions de la llicència i la cessió i que reflexionin amb precisió en què accepten quan signen un contracte. A la vista de la tendència recent de editors que signen acords amb empreses d'IA generativa, les polítiques d'IA dels editors també s'han de revisar de prop.

Als EUA, un estàndard solució de llicència col·lectiva per a l'ús de contingut en sistemes d'IA interns s'ha publicat recentment, que estableix els drets i la remuneració dels titulars dels drets d'autor. Llicències similars per a l'ús de contingut per a sistemes d'IA probablement entraran al mercat australià molt aviat.

Els tipus d'acords que s'estan arribant entre editorials acadèmiques i empreses d'IA han despertat preocupacions generals per a molts acadèmics. Volem que la investigació acadèmica es redueixi a contingut per a? Mineria de coneixement d'IA? No hi ha respostes clares sobre l'ètica i la moral d'aquestes pràctiques.

Sobre l'autor:

Dr Wellett Potter és professor de la Facultat de Dret de la Universitat de Nova Anglaterra, Armidale. Orgullosa alumna de la UNE, es va convertir en membre del personal a temps complet l'any 2022, després de rebre el seu doctorat en dret el març de 2021. Abans de 2022, va passar onze anys com a acadèmica de sessions a la Facultat de Dret de la UNE, participant en més de 25 unitats de dret.


Grans històries en ciència oberta

El CERN ofereix un "com fer" de la seva oficina de ciència oberta

L'Oficina de Ciència Oberta del CERN, dirigida per Anne Gentil-Beccot, ofereix orientació sobre la publicació d'accés obert, la gestió de dades de recerca i el programari de codi obert per fer que la investigació científica sigui més accessible i eficient. Fundada el 2023, l'oficina proporciona recursos, organitza reunions de govern i planifica futurs cursos de formació, amb l'objectiu de donar suport al compromís de llarga data del CERN amb la ciència oberta. Per obtenir més detalls sobre com la comunitat investigadora i acadèmica pot contribuir i beneficiar-se, consulteu el article complet.

Meta col·labora amb investigadors per estudiar la salut mental dels adolescents

Meta ha anunciat un nou programa pilot per oferir als investigadors del Centre de Ciència Oberta (COS) accés a les dades d'Instagram durant sis mesos. El programa pretén investigar i analitzar l'impacte de les plataformes de xarxes socials en la salut mental dels adolescents. Kumar Hemant, editor adjunt de Candid.Technology i Emma Roth al Verge, explora el tema.

Més lectura: El Consell Internacional de la Ciència ha llançat recentment un programa sobre salut mental per a joves com a part d'un memoràndum d'entesa amb l'Organització Mundial de la Salut https://council.science/our-work/mental-wellbeing-young-people/

Anunci de la Global Diamond Open Access Alliance

La UNESCO va organitzar un esdeveniment en línia el 10 de juliol per presentar i anunciar oficialment l'Aliança Global d'Accés Obert al Diamant, destacant la seva visió, missió i objectius, i per implicar les parts interessades en un esforç col·laboratiu per promoure l'Accés Obert al Diamant.

Mira la gravació de l'esdeveniment aquí.

Integritat en joc: enfrontar-se "publicar o morir” al món en desenvolupament i a les economies emergents

La "publicar o morir" La cultura ha donat lloc a importants reptes ètics en la publicació científica, especialment a les economies en desenvolupament. Pràctiques poc ètiques, com ara la venda d'autoria, la proliferació de "fàmines papereres" i l'ús indegut de la IA per produir investigacions fraudulentes, estan soscavant la integritat de la investigació científica i distorsionant les mètriques acadèmiques. Aquest estudi, publicat a Frontiers in Medicine, destaca els casos de frau acadèmic, especialment en països de baixos ingressos, i recomana una verificació més estricta de l'autoria, mesures disciplinàries per al frau científic i polítiques que promoguin la transparència i la responsabilitat en la investigació.

El Consorci de Genòmica Estructural explora un full de ruta de ciència de dades per a organitzacions de ciència oberta que es dediquen al descobriment de fàrmacs en fase inicial.

disponible des de Nature Communications, l'organització de recerca en ciència oberta que se centra en discuteix les oportunitats que la intel·ligència artificial (IA) pot aportar com a principal accelerador en el camp, argumentant que la gestió de dades robusta requereix ontologies precises i vocabulari estandarditzat, mentre que una arquitectura de bases de dades centralitzada als laboratoris facilita la integració de dades en conjunts de dades de valors.


Esdeveniments i oportunitats de Ciència Oberta 


Les nostres cinc millors lectures de ciència oberta


renúncia

La informació, opinions i recomanacions presentades pels nostres convidats són les dels col·laboradors individuals i no reflecteixen necessàriament els valors i creences del Consell Internacional de la Ciència.


Foto: XATINA on Unsplash

Anar al contingut