five

Web Scraping PRACT1

收藏
Zenodo2024-11-11 更新2026-05-26 收录
下载链接:
https://zenodo.org/doi/10.5281/zenodo.14062325
下载链接
链接失效反馈
官方服务:
资源简介:
Dataset obtenido de realizar webscraping en el sitio web del periódico El Pais. El dataset consiste en dos campos incluidos en una misma columna, ambos en formato texto: Titular: título de la noticia Fecha: fecha en que dicha noticia fue publicada. El dataset se genera a partir de la extracción de titulares de varios días. En primer lugar, se recorre de forma iterativa el rango de fechas indicado en el código para la hemeroteca. Posteriormente, y una vez concluido con el rango de fechas pasadas, se llama nuevamente a la función que extrae los titulares, pero en la URL principal (la que no corresponde a la hemeroteca) y con la fecha actual del sistema cuando se ejecuta el web scraping.
提供机构:
Zenodo
创建时间:
2024-11-11
二维码
社区交流群
二维码
科研交流群
商业服务