Clifton's Cafeteria torn down (6th and Olive Street), 1960
收藏China Health and Retirement Longitudinal Study
中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)是一个全国性的、具有代表性的老年人调查项目,旨在收集有关中国45岁及以上人群的健康、经济和社会状况的数据。该数据集包括个人和家庭层面的信息,涵盖健康状况、医疗使用、经济状况、社会支持等多个方面。
charls.pku.edu.cn 收录
R dataframes of annotated behaviour data and accelerometer data
Annotated data (anno_data.RDATA) is a dataframe containing scored behaviours per second for individual cats. Accelerometer data (accel_data_RDATA) is a dataframe that contains feature engineered accelerometer data in 1 second epochs.
Mendeley Data 收录
RecFlow
RecFlow是由中国科学技术大学和快手公司联合创建的工业级全流程推荐系统数据集,旨在弥合离线推荐系统基准与真实在线环境之间的差距。该数据集包含3800万次用户交互和19亿次阶段样本,涵盖了从曝光空间到未曝光项目的多阶段推荐流程。数据集的创建过程包括从42,000名用户中收集的在线请求日志,记录了每个推荐请求的详细信息。RecFlow的应用领域广泛,支持多任务推荐、用户行为建模、选择偏差估计等研究,旨在提升推荐系统的整体性能和效果。
arXiv 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录