Yelp Open Dataset Challenge|用户评价数据集|数据分析数据集
收藏数据集概述
数据来源
- Yelp Open Dataset Challenge (https://www.yelp.com/dataset/challenge)
- 第13轮:2019年1月15日至2019年12月31日
数据应用
- Yelp Rating Prediction API (http://br-yelp-predict-rating.herokuapp.com)
-
功能:基于特定类别的评论预测用户评分
-
输入:包含“category”和“review”的JSON字符串
-
输出:基于类别和评论的预测评分
-
示例输入: python {"category": "Auto Repair", "review": "Service is the worst and the wait time is too long."}
-
示例输出: python {Category: Auto_Repair, Review: Service is the worst and the wait time is too long., Predict rating: 1}
-
数据集类别
- Active Life
- Auto Repair
- Automotive
- Beauty Spas
- Contractors
- Doctors
- Event Planning Services
- Fashion
- Fast Food
- Hair Salons
- Health Medical
- Home Garden
- Home Services
- Local Services
- Professional Services
- Real Estate
- Shopping
数据可视化
- Scattertext Visualization

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录
LFW (Labeled Faces in the Wild)
Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。
OpenDataLab 收录