INNOVACIÓ

Google Dataset Search, el somni dels investigadors es fa realitat

Temps de Lectura: 5 minutos

Google Dataset Search, el somni dels investigadors es fa realitat
Avatar

CaixaBank

13 Març, 2019


Imaginem que un dia entrem en un cercador d’Internet i teclegem «dades sobre Espanya». El més probable és que ens ofereixi una gran quantitat de resultats amb titulars plens de clickbaiting, com ara «20 dades sobre Espanya que possiblement no sabies». Sens dubte, tota una decepció si el que estàvem cercant era algun conjunt de dades que poguéssim utilitzar per a una investigació.

Imaginem ara que ho fem en un cercador especialitzat: teclegem «dades sobre Espanya» i ens torna resultats amb conjunts de dades oberts, llestos per reutilitzar, procedents d’institucions com el CIS o Harvard. Amb la seva data d’actualització, una descripció i informació sobre la llicència, entre altres detalls.

El que abans era només un somni per a economistes, investigadors, científics, data scientists o periodistes de dades és ja una realitat i ha arribat amb Google Dataset Search. Es tracta d’una nova eina que permet cercar conjunts de dades relacionades amb pràcticament qualsevol temàtica. I no només això: a més, proporciona fitxers cartogràfics o geoespacials, i imatges aèries i de satèl·lit, entre altres possibilitats.

Com fer visibles les dades

Després del seu llançament el setembre passat, Google Dataset Search neix com el complement perfecte de Google Acadèmic, el motor de cerca per a estudis i informes acadèmics.

L’objectiu principal d’aquesta eina consisteix a fer visibles desenes de milers de repositoris de dades que estan presents a Internet, però que són difícils de trobar. La raó no és una altra que la gran fragmentació de la seva publicació: aquests repositoris es troben al domini de l’entitat que els publica, i per aquest motiu localitzar-los no és fàcil. Gràcies a Google Dataset Search, els conjunts de dades de les institucions que així ho vulguin estaran accessibles en un sol lloc per a tots aquells que els vulguin reutilitzar.

Per fer-ho, les entitats que publiquen les dades han d’incloure a les seves pàgines web una etiqueta amb metadades que descriguin els seus conjunts de dades, qui els ha creat, quan s’han publicat o com s’han recollit, entre altres detalls. També hauran de tenir disponibles els datasets en format Json-LD, Microdata o RDFa, a més d’etiquetar-los segons Schema.org o DCAT. Google Dataset Search indexarà llavors aquesta informació per mostrar-la després als usuaris que facin les seves cerques.

El funcionament d’aquesta eina és molt similar al del cercador tradicional: una simple barra de cerca permet introduir un terme per obtenir-ne resultats relacionats.

Avui dia, Google Dataset Search fa servir desenes de milers de conjunts de dades, una quantitat que pot multiplicar-se exponencialment gràcies a la popularitat creixent de les dades obertes i de la seva reutilització. Es tracta d’una pràctica que augmenta la transparència i ens ajuda a interpretar millor el món que ens envolta.

Descripció

Encara que el servei més conegut de Google és el seu cercador, aquesta empresa no ha deixat de diversificar i millorar les seves eines de cerca, entre les quals destaquen Google Data Search, una ajuda inestimable per a professionals de nombrosos camps que necessiten accés a tota mena de dades.

Accepto les condicions d'ús.