云浮市住房和城乡建设局行政强制类权责清单信息|行政管理数据集|住房建设数据集
收藏万博荟电商业务用户行为日志数据
该数据集合为万博荟电商平台运营过程中用户行为日志等相关操作信息数据,主要包括访问时间、时区、客户端ip地址、请求时间、连接序列号、请求状态、用户浏览器其他信息、来源页面、用户ID、当前页面地址、页面标题、商品ID、来源网站、入口页面、事件类别。该数据用于运营部门对用户的需求分析,支撑业务用户流量域数据分析,商品推荐算法用户喜好捕捉,应用板块点击情况分析等。
广东省数据知识产权存证登记平台 收录
laion/open-access-papers
该数据集包含从CORE(core.ac.uk)收集的开放获取学术论文,涵盖不同学科的出版物。每个数据实例代表一篇学术论文,包含唯一标识符、URL、详细的元数据(如DOI、标题、作者、出版日期等)以及全文的路径(如果可用)。数据集的主要语言是英语,但也可能包含其他语言的论文。数据集以WebDataset格式提供,便于流式处理。
hugging_face 收录
ArXiv
ArXiv数据集包含了来自arXiv.org的学术论文元数据,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学等多个领域的研究论文。数据集包括论文的标题、作者、摘要、提交日期、修改日期、DOI(数字对象标识符)等信息。
www.kaggle.com 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录