MovieLens Dataset|电影推荐数据集|用户行为分析数据集
收藏
- MovieLens Dataset首次发布,由美国明尼苏达大学的GroupLens研究小组创建,旨在为推荐系统研究提供数据支持。
- MovieLens Dataset首次应用于学术研究,成为推荐系统领域的重要基准数据集。
- MovieLens Dataset更新至MovieLens 1M版本,包含100万条用户评分数据,进一步提升了数据集的规模和多样性。
- MovieLens Dataset发布MovieLens 10M版本,数据量达到1000万条,为大规模推荐系统研究提供了更丰富的数据资源。
- MovieLens Dataset推出MovieLens 20M版本,包含2000万条用户评分数据,标志着数据集在规模和应用广度上的显著提升。
- MovieLens Dataset发布MovieLens Latest Datasets,包括MovieLens 100K、1M、10M和20M版本,为不同研究需求提供了多样化的选择。
- 1The MovieLens Datasets: History and ContextUniversity of Minnesota · 2015年
- 2A Survey on Recommendation System: From Collaborative Filtering to Content-Based and Hybrid ApproachesUniversity of Science and Technology of China · 2020年
- 3Deep Learning based Recommendation System: A Survey and New PerspectivesUniversity of California, Berkeley · 2019年
- 4Matrix Factorization Techniques for Recommender SystemsAT&T Labs Research · 2009年
- 5Evaluating Recommendation SystemsUniversity of Minnesota · 2010年
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录