lunes, 17 de octubre de 2016

Madrid-GUG Noviembre 2016: Arañas, Webbots y Scrapers con Geb

Después de haber tenido una introducción a Geb en el pasado meetup, en esta ocasión Sergio del Amo (@sdelamo) nos contará cómo scrappear páginas web utilizando Geb:
Geb es una fantastica herramienta de automatización de navegador. Se usa a menudo para crear test funcionales para páginas HTML. Sin embargo, Geb brilla también como herramienta para crear Arañas y Scrapers.
En esta charla, a través de varios ejemplos, aprenderás como:
  • Scrapear páginas HTML con Geb Pages y Geb Modules
  • Páginar dentro de una Web y guardar los datos creados como una base de datos SQLite o un archivo Plist
  • Cambiar el user agent
  • Superar dificultades de scrapeo como contenido escondido.