World Bank Gender Statistics|性别统计数据集|社会经济指标数据集
收藏
- 世界银行首次发布性别统计数据集,旨在提供全球性别相关指标的数据,以支持性别平等和女性赋权的政策制定和研究。
- 数据集进行了重大更新,增加了更多国家和地区的性别统计数据,并引入了新的指标,如教育、劳动力市场和健康等领域的性别差异。
- 世界银行推出了在线性别数据门户,使得用户可以更方便地访问和分析性别统计数据,进一步推动了性别数据的应用和研究。
- 数据集再次更新,增加了关于数字经济和气候变化等新兴领域的性别统计数据,反映了全球性别议题的扩展和深化。
金庸语料库
从金庸15部小说中收集了1373个人名、292个地名、384个武功名称、119种武器名称、97个门派名称。
github 收录
UCF-Crime
UCF-犯罪数据集是128小时视频的新型大规模第一个数据集。它包含1900年长而未修剪的真实世界监控视频,其中包含13个现实异常,包括虐待,逮捕,纵火,殴打,道路交通事故,入室盗窃,爆炸,战斗,抢劫,射击,偷窃,入店行窃和故意破坏。之所以选择这些异常,是因为它们对公共安全有重大影响。这个数据集可以用于两个任务。首先,考虑一组中的所有异常和另一组中的所有正常活动的一般异常检测。第二,用于识别13个异常活动中的每一个。
OpenDataLab 收录
NIST Thermochemical Database
NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。
webbook.nist.gov 收录
simon3000/genshin-voice
Genshin Voice数据集包含来自热门游戏《原神》的语音台词,涵盖多种语言(中文、英文、日文、韩文)。这些语音台词由游戏中的角色说出,内容广泛,包括问候、战斗和故事对话等。数据集包含音频、转录文本、语言、说话者、说话者类型、类型和游戏内文件名等特征。
hugging_face 收录
Chinese-Poetry-Corpus
本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。
github 收录