Endoscapes2023|腹腔镜手术数据集|医学图像处理数据集
收藏数据集概述
数据集名称
Endoscapes2023
数据集目的
用于外科解剖和工具分割、对象检测以及安全视角(CVS)评估的综合腹腔镜视频数据集。
数据集内容
数据集分为三个子数据集:
- Endoscapes-CVS201: 包含11090帧,来自201个视频,由3位专家标注CVS。这些帧均匀分布,每5秒一帧,总共有58813帧(1fps)。
- Endoscapes-BBox201: 包含1933帧,来自201个视频,标注了5个解剖结构/区域和1个工具类(共6类)的边界框。这些帧每30秒一帧。
- Endoscapes-Seg50: 包含493帧,来自50个视频,标注了6个类的实例和语义分割掩码。这是Endoscapes-BBox201的一个子集,选择了约25%的视频,每30秒一帧。
文件结构
数据集的文件结构如下:
- 所有注释采用COCO格式,CVS标签作为图像级标签编码。
- 训练、验证和测试集分别包含相应的图像和注释文件。
- 训练集分割为12.5%和25%的官方分割,各有三个折叠。
- 包含所有元数据的CSV文件和用于实例和语义分割的额外文件。
注释格式
- 所有注释文件采用COCO格式。
- CVS标签表示三位注释者对每个标准的平均值,小数表示注释者之间的分歧。
使用许可
数据集遵循CC BY-NC-SA 4.0许可,仅供非商业科学研究使用。

GAOKAO-Bench
GAOKAO-Bench是由复旦大学计算机科学与技术学院创建的数据集,涵盖了2010至2022年间中国高考的所有科目题目,共计2811题。该数据集包含1781道客观题和1030道主观题,题型多样,包括单选、填空、改错、开放性问题等。数据集通过自动化脚本和人工标注将PDF格式的题目转换为JSON文件,数学公式则转换为LATEX格式。GAOKAO-Bench旨在为大型语言模型提供一个全面且贴近实际应用的评估基准,特别是在解决中国高考相关问题上的表现。
arXiv 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Cultural Dimensions Dataset
该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。
geerthofstede.com 收录
微博与抖音评论数据集
数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。
github 收录
CHFS中国家庭金融调查数据
中国家庭金融调查(China Household Finance Survey, CHFS)是中国家庭金融调查与研究中心(以下简称“中心”)在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:人口特征与就业、资产与负债、收入与消费、社会保障与保险以及主观态度等相关信息,对家庭经济、金融行为进行了全面细致刻画。 CHFS基线调查始于2011年,目前已分别在2011、2013、2015、2017和2019年成功实施五轮全国范围内的抽样调查项目,2021年第六轮调查还在进行中。CHFS最新公开的2019年第五轮调查数据,样本覆盖全国29个省(自治区、直辖市),343个区县,1360个村(居)委会,样本规模达34643户,数据具有全国及省级代表性。
CnOpenData 收录