INNOVACIÓN

Google Dataset Search, el sueño de los investigadores se hace realidad

Tiempo de Lectura: 5 minutos

Google Dataset Search, el sueño de los investigadores se hace realidad
Avatar

CaixaBank

13 Marzo, 2019


Imaginemos que un día entramos en un buscador de internet y tecleamos «datos sobre España». Lo más probable es que nos ofrezca una gran cantidad de resultados con titulares rendidos al clickbaiting como «20 datos sobre España que posiblemente no sabías». Sin duda, toda una decepción si lo que estábamos buscando era algún conjunto de datos que pudiéramos utilizar para una investigación.

Imaginemos ahora que lo hacemos en un buscador especializado: tecleamos «datos sobre España» y nos devuelve resultados con conjuntos de datos abiertos, listos para su reutilización, procedentes de instituciones como el CIS o Harvard. Con su fecha de actualización, descripción y licencia, entre otros detalles.

Lo que antes era solo un sueño para economistas, investigadores, científicos, data scientists o periodistas de datos es ya una realidad y ha llegado de la mano de Google Dataset Search. Se trata de una nueva herramienta que permite buscar conjuntos de datos relacionados con prácticamente cualquier temática. Y no solo eso: además, devuelve archivos cartográficos, geoespaciales, imágenes aéreas y de satélite, entre otras posibilidades.

Cómo hacer visibles los datos

Tras su puesta en marcha el pasado mes de septiembre, Google Dataset Search nace como el complemento perfecto a Google Académico, el motor de búsqueda para estudios e informes académicos.

El objetivo principal de esta herramienta consiste en hacer visibles decenas de miles de repositorios de datos que están presentes en internet, pero que resultan difíciles de encontrar. La razón no es otra que la elevada fragmentación de su publicación: cada uno se encuentra en el dominio de la entidad que lo publica, por lo que su localización no resulta sencilla. Gracias a Google Dataset Search, los conjuntos de datos de las instituciones que así lo deseen estarán accesibles en un solo lugar para todos aquellos que los quieran reutilizar.

Para ello, las entidades que publican los datos deben incluir en sus páginas web una etiqueta con metadatos que describan sus conjuntos de datos, quién los ha creado, cuándo se han publicado o cómo se han recogido, entre otros detalles. También deberán tener disponibles los datasets en formato Json-LD, Microdata o RDFa, además de etiquetarlos según Schema.org o DCAT. Google Dataset Search indexará entonces esta información para mostrarla después a los usuarios que realicen sus búsquedas.

El funcionamiento de esta herramienta es muy similar al del buscador tradicional: una simple barra de búsqueda permite introducir un término para obtener los resultados relacionados con él.

En la actualidad, Google Dataset Search maneja decenas de miles de conjuntos de datos, cantidad que puede multiplicarse exponencialmente gracias a la creciente popularidad de los datos abiertos y de su reutilización. Se trata de una práctica que aumenta la transparencia y nos ayuda a interpretar mejor el mundo que nos rodea.

Descripción

Aunque el servicio más conocido de Google es su buscador, esta empresa no ha parado de diversificar y mejorar sus herramientas de búsqueda, entre las que destacan Google Data Search, una ayuda inestimable para profesionales de numerosos campos que necesitan acceso a todo tipo de datos.

Acepto las condiciones de uso.