goodreads|用户行为分析数据集|书籍数据数据集
收藏数据集概述
数据集名称
liyucheng/goodreads
数据集配置
- behavior
- books
- experiment
数据集特征
behavior 配置
- user_id: 字符串类型
- book_id: 字符串类型
- is_read: 布尔类型
- rating: 整数类型
- date_added: 字符串类型
- date_updated: 字符串类型
- read_at: 字符串类型
- started_at: 字符串类型
- reading_duration_days: 浮点数类型
- review_text: 字符串类型
- n_votes: 整数类型
- n_comments: 整数类型
books 配置
- book_id: 字符串类型
- title: 字符串类型
- isbn13: 字符串类型
- isbn: 字符串类型
- author_ids: 字符串序列
- author_names: 字符串序列
- average_rating: 字符串类型
- ratings_count: 字符串类型
- text_reviews_count: 字符串类型
- publication_year: 字符串类型
- publication_month: 字符串类型
- publication_day: 字符串类型
- publisher: 字符串类型
- language_code: 字符串类型
- description: 字符串类型
- genres: 字符串序列
- num_pages: 字符串类型
- format: 字符串类型
- work_id: 字符串类型
- original_title: 字符串类型
- original_publication_year: 字符串类型
- original_language_id: 字符串类型
experiment 配置
- index: 整数类型
- uid: 字符串类型
- bid: 字符串类型
- click: 整数类型
数据集划分
behavior 配置
- 训练集: 33005444975 字节, 228648342 条数据
books 配置
- 训练集: 3178524774 字节, 2360655 条数据
experiment 配置
- 训练集: 38758817 字节, 620078 条数据
- 验证集: 4257572 字节, 68022 条数据
- 测试集: 4448193 字节, 71021 条数据
数据集大小
- behavior: 33005444975 字节
- books: 3178524774 字节
- experiment: 47464582 字节
下载大小
- behavior: 7677575403 字节
- books: 1738145867 字节
- experiment: 13580410 字节
数据文件路径
behavior 配置
- 训练集: behavior/train-*
books 配置
- 训练集: books/train-*
experiment 配置
- 训练集: experiment/train-*
- 验证集: experiment/dev-*
- 测试集: experiment/test-*

陸委會新聞稿
本會發布之新聞稿
台湾省政府资料开放平台 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)
地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。
国家青藏高原科学数据中心 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录