nlphuji/beyond_web_scraping
收藏Hugging Face2023-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlphuji/beyond_web_scraping
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过众包方式收集的地理多样性图像数据集,旨在超越传统的网络爬虫方法,提供更广泛的地理覆盖和多样性。
# 超越网页抓取(Beyond web-scraping)
原始论文:[超越网页抓取:众包(Crowd-sourcing)构建地理多样化图像数据集](https://arxiv.org/abs/2301.02560)
项目主页:https://geodiverse-data-collection.cs.princeton.edu/
测试子集(test split)由论文作者提供。
Bibtex引用:
@inproceedings{ramaswamy2022geode,
author = {Vikram V. Ramaswamy and Sing Yu Lin and Dora Zhao and Aaron B. Adcock and Laurens van der Maaten and Deepti Ghadiyaram and Olga Russakovsky},
title = {超越网页抓取:{C}众包构建地理多样化数据集},
booktitle = {arXiv预印本},
year = {2023}
}
提供机构:
nlphuji
原始信息汇总
数据集概述
- 数据集名称: Beyond web-scraping
- 原始论文: Beyond web-scraping: Crowd-sourcing a geographically diverse image dataset
- 作者: Vikram V. Ramaswamy, Sing Yu Lin, Dora Zhao, Aaron B. Adcock, Laurens van der Maaten, Deepti Ghadiyaram, Olga Russakovsky
- 论文标题: Beyond web-scraping: Crowd-sourcing a geodiverse dataset
- 发表年份: 2023
- 发表平台: arXiv preprint



