Web Scraping PRACT1
收藏NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://zenodo.org/record/14062325
下载链接
链接失效反馈官方服务:
资源简介:
Dataset obtenido de realizar webscraping en el sitio web del periódico El Pais.
El dataset consiste en dos campos incluidos en una misma columna, ambos en formato texto:
Titular: título de la noticia
Fecha: fecha en que dicha noticia fue publicada.
El dataset se genera a partir de la extracción de titulares de varios días. En primer lugar, se recorre de forma iterativa el rango de fechas indicado en el código para la hemeroteca. Posteriormente, y una vez concluido con el rango de fechas pasadas, se llama nuevamente a la función que extrae los titulares, pero en la URL principal (la que no corresponde a la hemeroteca) y con la fecha actual del sistema cuando se ejecuta el web scraping.
创建时间:
2024-11-11



