有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
RecFlow
RecFlow是由中国科学技术大学和快手公司联合创建的工业级全流程推荐系统数据集,旨在弥合离线推荐系统基准与真实在线环境之间的差距。该数据集包含3800万次用户交互和19亿次阶段样本,涵盖了从曝光空间到未曝光项目的多阶段推荐流程。数据集的创建过程包括从42,000名用户中收集的在线请求日志,记录了每个推荐请求的详细信息。RecFlow的应用领域广泛,支持多任务推荐、用户行为建模、选择偏差估计等研究,旨在提升推荐系统的整体性能和效果。
arXiv 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录