By | octubre 20, 2015

Data binaryEn la recolección de datos podemos contar con distintos métodos. Entre ellos, disponemos de uno llamado data scraping, un método muy peculiar que normalmente se usa cuando no hay otra alternativa para recolectar datos de la fuente original.

Una fuente de datos puede ser una página web, nuestro entorno virtual de aprendizaje, una hoja de cálculo online, un foro, un artículo en un blog, una página web de productos educativos… o cualquier otro medio digital que contenga información que nos sea interesante y que queramos descargar.

Por ejemplo, podemos utilizar data scraping para:

  • Extraer datos de una página del entorno virtual de aprendizaje (Moodle, Edmodo…) que no tenga un informe de datos disponible para obtenerlos de forma estándar.
  • Extraer datos de una página web que no permita la descarga de datos en un archivo de tipo conocido (Excel, csv…).

O sea, que vamos a utilizar esta técnica cuando no haya más remedio. Para una definición más correcta podemos utilizar la siguiente:

 

Hacer data scraping consiste en extraer datos digitales legibles por el ser humano de forma automática.

 

Para explicar la anterior definición voy a utilizar los siguientes puntos que describen las características de la técnica en sí:

  • La información a extraer está en formato digital y es legible por el ser humano.
  • Se utiliza un programa para extraer los datos de forma automática.
  • El programa puede ser de otros o creado por nosotros mismos mediante un lenguaje de programación.
  • Es muy útil cuando no hay una alternativa disponible para conseguir los datos de forma fácil.

En definitiva, esta técnica del data scraping nos aporta un método para recolectar datos de un origen digital (página web, Moodle, Edmodo, Schology…) con información legible por el ser humano pero que no tenemos alternativa directa para descargarla.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *