GUÍA PARA COMPARTIR CONJUNTOS
DE DATOS ABIERTOS EN LA MINERÍA

Publicado: 2022-04-21
Grupo de Trabajo: Inteligencia Artificial
Estado: Actual

RESUMEN

El objetivo de esta guía es brindar a las partes interesadas de la industria minera las mejores prácticas para compartir datos basadas en iniciativas existentes, de modo que puedan beneficiarse de las oportunidades que ofrecen los datos abiertos. Esta guía está dirigida a los lectores que desean compartir datos con otros, aquellos que participan en el proceso de aprobación y a los usuarios que desean utilizar los datos abiertos compartidos por la industria minera.

Consideraciones sobre la gestión

Antes de compartir y publicar datos, se suele utilizar una licencia de datos para describir el uso previsto de los proveedores de datos y, al mismo tiempo, ofrecerles protección. También proporciona claridad a los consumidores de datos, ya que evita que infrinjan potencialmente los derechos de los propietarios. Existen distintos tipos de licencias para diferentes fines. Los tipos de licencia suelen dividirse en abiertas (sin restricciones técnicas o legales), no comerciales, parcialmente abiertas o de uso restringido y cerradas. Los marcos existentes, como Creative Commons y Montreal Data License, pueden utilizarse para abarcar los requerimientos generales.

Compartir datos aporta beneficios, entre los que se incluyen apoyar la innovación y la investigación y permitir que el público acceda a la información para ayudar a mejorar la toma de decisiones en las operaciones. Antes de la implementación, es fundamental abordar los desafíos de costo, cuestiones legales, almacenamiento, privacidad y lenguaje común asociados con la recopilación, la administración, la comunicación interna y el mantenimiento de los datos abiertos para minimizar los desafíos y maximizar los beneficios de compartir los datos.

Consideraciones sobre la implementación

Antes de la implementación, es muy importante determinar qué datos deben compartirse y cuáles no. El conjunto de datos debe estar bien documentado, ser confiable, utilizable, preciso, relevante y estar en un formato accesible. Si un conjunto de datos es confidencial desde el punto de vista comercial, contiene información personal identificable (PII) o datos confidenciales, o supone un riesgo para la seguridad, se debe evitar compartir los conjuntos de datos, a menos que estos riesgos puedan mitigarse. Debe realizarse una evaluación de riesgos basada en las políticas y las tolerancias al riesgo de la organización.

Cuando un conjunto de datos se vuelve abierto, se deberá enviar en un formato legible por máquina que sea abierto y lógico. Si es posible, se debe priorizar cualquier consenso comunitario sobre el formato o los formatos de los datos existentes. También es importante identificar los requerimientos y las técnicas de anonimización adecuados.

Se recomienda adoptar un proceso de aprobación formal cuando se divulguen los datos. En la documentación proporcionada para la aprobación de la divulgación de datos, se suele incluir información en la que se ofrece una descripción general de los datos originales y su estructura, una descripción de los procedimientos de anonimización, una descripción general de los datos resultantes y una certificación o aprobación de las principales partes interesadas de que el conjunto de datos se puede compartir. La selección de la plataforma de alojamiento y listado adecuada es el último paso antes de abrir el conjunto de datos.

SEGUIR COLABORANDO

¿Historia de éxito? ¿Alguna aportación para mejorar esta guía? Háganoslo saber.

Para compartir su experiencia sobre el uso de la guía, complete este formulario de estudio de caso.

Para comentarios más generales, complete el siguiente formulario:

    X