Nexdata/chinese_dialect|语音识别数据集|方言研究数据集
收藏数据集概述
数据集名称
- 名称: chinese_dialect
数据集描述
- 摘要: 包含25,000小时的汉语方言语音数据,采集自多个方言区域的本地方言说话者,覆盖福建话、广东话、四川方言、河南方言、东北方言、上海方言、维吾尔语和藏语等。数据格式为16kHz, 16bit, 单声道wav格式,句子准确率超过95%。
- 任务支持: 自动语音识别(ASR)、音频说话人识别。
- 语言: 汉语方言。
数据集结构
- 数据实例: 待补充。
- 数据字段: 待补充。
- 数据分割: 待补充。
数据集创建
- 来源数据: 待补充。
- 注释: 待补充。
- 个人和敏感信息: 待补充。
使用数据注意事项
- 社会影响: 待补充。
- 偏见讨论: 待补充。
- 其他已知限制: 待补充。
附加信息
- 许可证: 商业许可证。
- 引用信息: 待补充。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
安徽新能源汽车产业链图谱企业名单数据
根据安徽新能源产业链上下游特点。将安徽新能源产业分为发、储、送、 运共计95个产业链节点。依托佰腾专利大数据资源,将涉及节点的企业进行分类上链,产业链节点上显示的是涉及节点产品的所有企业的详情,通过产业链图谱企业数据集可以精准把握产业链上下游产品节点及链主、伙伴角色,深度挖掘产业链中企业、高校、专家、专利的关联关系,精准匹配产业链产品�
安徽省数据知识产权登记平台 收录
ai-hub2
本项目所使用的数据集名为“ai-hub2”,其主要目的是为改进YOLOv11的工地工程车辆装置检测系统提供高质量的训练数据。该数据集包含五个类别,分别是:钻孔机(boring_machine)、混凝土车(concrete_truck)、起重机(crane)、自卸车(dump_truck)和挖掘机(excavator)。这些类别涵盖了工地上常见的重型机械设备,能够有效支持车辆检测系统在复杂环境中的应用。
github 收录
NCEP/NCAR Reanalysis
NCEP/NCAR Reanalysis数据集是一个全球气候再分析数据集,涵盖了从1948年至今的大气、海洋、陆地和海冰数据。该数据集通过结合观测数据和数值模型输出,提供了高分辨率的气候变量,如温度、风速、湿度、气压等。
psl.noaa.gov 收录