底栖动物影像数据库|水生生物数据集|生物分类影像数据集
收藏万博荟电商业务用户行为日志数据
该数据集合为万博荟电商平台运营过程中用户行为日志等相关操作信息数据,主要包括访问时间、时区、客户端ip地址、请求时间、连接序列号、请求状态、用户浏览器其他信息、来源页面、用户ID、当前页面地址、页面标题、商品ID、来源网站、入口页面、事件类别。该数据用于运营部门对用户的需求分析,支撑业务用户流量域数据分析,商品推荐算法用户喜好捕捉,应用板块点击情况分析等。
广东省数据知识产权存证登记平台 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Chinese-Poetry-Corpus
本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。
github 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录