GenderStats|性别统计数据集|社会经济数据集
收藏
- GenderStats数据集首次由世界银行发布,旨在提供全球性别相关统计数据,以支持性别平等和女性赋权的研究与政策制定。
- GenderStats数据集首次应用于联合国千年发展目标(MDGs)的监测与评估,成为全球性别平等指标的重要数据来源。
- 随着联合国可持续发展目标(SDGs)的启动,GenderStats数据集被广泛用于监测SDG5(性别平等)的进展情况,进一步提升了其在全球政策制定中的重要性。
- GenderStats数据集进行了重大更新,增加了更多国家和地区的性别统计数据,并引入了新的指标,以更好地反映全球性别平等的现状和挑战。
- 1Gender Statistics DatabaseUnited Nations · 2014年
- 2Gender Equality and Economic Growth: A Review of the EvidenceWorld Bank · 2019年
- 3Gender Inequality and Economic Development: Evidence from the GenderStats DatabaseUniversity of California, Berkeley · 2020年
- 4The Impact of Gender Inequality on Economic Growth: A Cross-Country AnalysisUniversity of Oxford · 2021年
- 5Gender Disparities in Education and Labor Market Outcomes: Evidence from the GenderStats DatabaseHarvard University · 2022年
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
ReferCOCO数据集
ReferCOCO数据集包括refcoco、refcoco+和refcocog三个子集,用于视觉定位任务。数据集包含图像和对应的描述性文本,用于训练和测试模型识别图像中特定对象的能力。
github 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
yahoo-finance-data
该数据集包含从Yahoo! Finance、Nasdaq和U.S. Department of the Treasury获取的财务数据,旨在用于研究和教育目的。数据集包括公司详细信息、高管信息、财务指标、历史盈利、股票价格、股息事件、股票拆分、汇率和每日国债收益率等。每个数据集都有其来源、简要描述以及列出的列及其数据类型和描述。数据定期更新,并以Parquet格式提供,可通过DuckDB进行查询。
huggingface 收录