Exercise Addiction, Passion, Perfectionism in Team and Individual Sports during COVID-19: An International Study|运动成瘾数据集|完美主义数据集
收藏Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
Twitter15 and Twitter16
Twitter15和Twitter16是用于谣言检测的数据集,包含了2015年和2016年Twitter上的推文及其相关信息。数据集包括推文的文本内容、用户信息、时间戳以及推文是否为谣言的标签。
github.com 收录
DeepLesion
美国国立卫生研究院临床中心公开了一个大规模的 CT 图像数据集,以帮助科学界提高病变检测的准确性。虽然大多数公开可用的医学图像数据集只有不到一千个病灶,但这个名为 DeepLesion 的数据集在 CT 图像上识别出超过 32,000 个带注释的病灶 (220GB)。 DeepLesion,一个数据集,包含 32,120 个 CT 切片中的 32,735 个病灶,来自 4,427 名独特患者的 10,594 项研究。该数据集中有多种病变类型,例如肺结节、肝脏肿瘤、淋巴结肿大等。它具有用于各种医学图像应用的潜力
OpenDataLab 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录