Contractar

Document de treball

Dades i IA per a la ciència: consideracions clau

Aquest document ofereix una visió general dels factors tècnics, ètics i ambientals a tenir en compte a l'hora de preparar dades científiques per a la intel·ligència artificial (IA), i com aquests factors s'alineen amb el moviment de "ciència oberta". La informació presentada és rellevant per a investigadors, professionals de les dades, organismes científics i responsables polítics per a la ciència.

Aquest article forma part d'una sèrie de tres manuals que exploren diverses dimensions tècniques de la IA i el seu impacte en la ciència:

  1. Tipus d'IA en la ciència
  2. Consideracions sobre l'impacte ambiental de la IA en la ciència
  3. Dades per a la IA en la ciència

La primera secció introdueix els conceptes fonamentals i analitza els avantatges i els reptes de preparar les dades científiques per a la IA.

La segona secció examina les consideracions clau per a la preparació de dades per a la IA i, a l'inrevés, la IA per seleccionar dades. Ens basem en els estàndards de dades alhora que discutim consideracions específiques de la IA, com ara la llegibilitat per màquina i la mitigació del biaix, alhora que destaquem les consideracions ètiques i ambientals al voltant de la preparació de dades per a la IA en la ciència.

La tercera secció analitza la preparació de les dades en el marc de la ciència oberta i presenta dos estudis de cas que il·lustren com les pràctiques de ciència oberta poden donar suport a la preparació per a la IA per a la recerca científica.

Recomanacions

  • Convergència amb els marcs i estàndards de dades existents, per exemple, FAIR-R i Croissant, haurien de ser utilitzats pels científics i els administradors de dades.
  • Estructures de governança de dades hauria d'anar més enllà dels estàndards tècnics per promoure l'equitat, l'accés als recursos informàtics i el desenvolupament de capacitats.
  • Inversió en infraestructura de dades i desenvolupament de competències és un requisit previ per a un ús eficient i competitiu de la IA en la ciència.
  • Reconeixement de carreres de gestió de dades en ciència, i els incentius per fomentar aquestes habilitats, és una via d'implementació fonamental de la inversió esmentada.

Dades i IA per a la ciència: consideracions clau

setembre 2025

DOI: 10.24948 / 2025.11


Aquest treball s'ha dut a terme amb l'ajuda d'una beca del Centre Internacional de Recerca per al Desenvolupament (CRDI), Ottawa, Canadà. Les opinions expressades aquí no representen necessàriament les del CRDI ni les del seu Consell de Govern.