有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
id
: 字符串类型transcription
: 字符串类型frames
: 图像序列train
: 35,090,755,574 字节, 5,672 个样本validation
: 3,294,869,318 字节, 540 个样本test
: 3,935,898,314 字节, 629 个样本id
: 字符串类型transcription
: 字符串类型train
: 744,118 字节, 5,672 个样本validation
: 63,848 字节, 540 个样本test
: 75,329 字节, 629 个样本id
: 字符串类型transcription
: 字符串类型frames
: 图像序列train
: 26,933,922,764 字节, 4,376 个样本validation
: 720,569,029 字节, 111 个样本test
: 1,175,797,903 字节, 180 个样本ChemBL
ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。
www.ebi.ac.uk 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
HIT-UAV
HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录