five

Arquivo.pt - the Portuguese web-archive

收藏
re3data.org2024-05-31 收录
下载链接:
https://www.re3data.org/repository/r3d100012704
下载链接
链接失效反馈
官方服务:
资源简介:
Arquivo.pt is a research infrastructure that preserves millions of files collected from the web since 1996 and provides a public search service over this information. It contains information in several languages. Periodically it collects and stores information published on the web. Then, it processes the collect data to make it searchable, providing a “Google-like” service that enables searching the past web (English user interface available at https://arquivo.pt/?l=en). This preservation workflow is performed through a large-scale distributed information system and can also accessed through API (https://arquivo.pt/api).

Arquivo.pt 是一项研究基础设施,自1996年以来,它保存了数百万份从网络中收集的文件,并提供了基于此信息的公共搜索服务。该系统包含多种语言的信息。定期地,它收集并存储网络上的发布信息。随后,对收集的数据进行处理,使其可搜索,提供类似谷歌的“Google-like”服务,允许用户搜索过去的网络内容(提供英文用户界面,访问链接为 https://arquivo.pt/?l=en)。这一数据保存工作流程是通过一个大规模分布式信息系统执行的,并且可以通过API访问(访问链接为 https://arquivo.pt/api)。
提供机构:
Arquivo.pt - pesquise páginas do passado
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作