five

nlphuji/beyond_web_scraping

收藏
Hugging Face2023-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlphuji/beyond_web_scraping
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过众包方式收集的地理多样性图像数据集,旨在超越传统的网络爬虫方法,提供更广泛的地理覆盖和多样性。

# 超越网页抓取(Beyond web-scraping) 原始论文:[超越网页抓取:众包(Crowd-sourcing)构建地理多样化图像数据集](https://arxiv.org/abs/2301.02560) 项目主页:https://geodiverse-data-collection.cs.princeton.edu/ 测试子集(test split)由论文作者提供。 Bibtex引用: @inproceedings{ramaswamy2022geode, author = {Vikram V. Ramaswamy and Sing Yu Lin and Dora Zhao and Aaron B. Adcock and Laurens van der Maaten and Deepti Ghadiyaram and Olga Russakovsky}, title = {超越网页抓取:{C}众包构建地理多样化数据集}, booktitle = {arXiv预印本}, year = {2023} }
提供机构:
nlphuji
原始信息汇总

数据集概述

  • 数据集名称: Beyond web-scraping
  • 原始论文: Beyond web-scraping: Crowd-sourcing a geographically diverse image dataset
  • 作者: Vikram V. Ramaswamy, Sing Yu Lin, Dora Zhao, Aaron B. Adcock, Laurens van der Maaten, Deepti Ghadiyaram, Olga Russakovsky
  • 论文标题: Beyond web-scraping: Crowd-sourcing a geodiverse dataset
  • 发表年份: 2023
  • 发表平台: arXiv preprint
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作