five

四川话方言朗读数据库|方言识别数据集|语音数据数据集

收藏
苏州大数据交易所2024-03-23 更新2024-04-26 收录
方言识别
语音数据
下载链接:
https://jy.suzhou.com.cn/#/product-detail/736
下载链接
链接失效反馈
资源简介:
一、基本信息 【产品名称】 四川话方言朗读数据库 【系列名称】CDT-ASR-SC_DIALECT-2022-0005 【供方名称】 苏州核数聚信息科技有限公司 【应用领域】 数字金融、数字医疗、工业互联、能源互联、智慧出行、信息技术等 【来源行业】 人工智能 【数据主题】 方言数据 【产品类型】 语音数据包 【产品描述】 该数据为四川方言朗读数据,可用于语音识别系统训练、测试、语音分析、口音研究等多种用途。 主要采集人群为:主要采集人群为:重庆、成都、乐山、南充、广元等地。 字正:98%以上。 【关键词】方言、四川话、朗读数据 二、物理信息 【更新频率】一年 【覆盖范围】 重庆、成都、乐山、南充、广元 【存储大小】 34G 【存储格式】 语音(采样率 16k Hz,采样精度是 16bit,单通道,未压缩 wav) 【底层数据维度】共有2个标签字段,分别为:语料、标注 序号 参数名称 字段名称 字段描述 示例值 1 语料 ref 音频采集语料 2 标注 lab 语音内容的实际标注结果 三、内容说明 【样例地址】https://pan.baidu.com/s/1IDaBOK2j8iaKaR1umYrHgQ?pwd=apsj 【有效时长】 300小时 【录制人数】 890人 【音频格式】 采样率 16k Hz,采样精度 16bit,单通道,未压缩 wav 【人群比例】男女比例(6:4) 【采集设备】智能手机,基于 Android 、IOS 系统的多种品牌型号手机进行录制 【录音人地域分布】重庆、成都、乐山、南充、广元 【数据字典】 序号 参数名称 显示值 描述 1 四川方言 注音 每个字词对应相应的注音,如:巴适 ba si 输出各具体字段内容及其含义说明 【数据名称】 四环方言朗读数据库 【样例数据】 序号 参数名称 字段名称 字段描述 示例值 1 角色id 角色序号 音频名第一列为角色序号 2 音频id 音频 音频名第二列为音频id,同一角色不同id 【数据条数】 291249条 四、使用案例 家电项目 1、语音识别模型训练:这批音频数据可以用于训练语音识别模型,以使产品能够准确地识别和理解四川话的语音指令和对话。通过收集大量的四川话音频数据,并使用机器学习和深度学习技术进行模型训练,可以提高语音识别的准确性和稳定性。 2、语音命令和控制:利用四川话指令音频数据,家电产品可以开发语音命令和控制功能。这意味着用户可以使用方言话与电视进行对话,并通过语音指令控制电视、音箱等的各种功能,如调整音量、切换频道、打开特定应用程序等。这种语音控制的功能提供了一种更直观和便捷的方式来操作电视。 3、语音搜索和推荐:四川餐饮、银行等客户服务可以利用这批音频数据实现语音搜索和推荐功能。用户用方言进行内容等搜索,并获得相关的结果。基于这些数据,还可以分析用户的喜好和兴趣,提供个性化的推荐内容,以改善用户的观看体验。 五、使用说明 【交付方式】:方式一:云端介质(网盘、ftp等); 【使用方式】:可直接使用; 六、使用条件 【使用目的】: 智能产品训练验证 【使用主体】: 无 【使用者资质】: 无 【时间限制】: 无 【转让限制】: 限制客户二次销售本数据库 【其它限制】: 无 七、来源描述 【来源方式】: 自行生产,300小时有效数据 【采集说明】: 音频格式 采样率16k Hz,采样精度是16bit,单通道,未压缩wav 人群比例 男女比例(6:4) 采集设备 智能手机,基于 Android、IOS 系统的多种品牌型号手机进行录制 环境 相对安静室内环境,无回声 语料领域 涵盖售车、时政、直播、课堂、餐饮 录音人地域分布 重庆、成都、乐山、南充、广元 标签 无 【敏感数据脱敏】:是 八、产品价格 购买方式 价格/计费方式 使用次数 按小时数据计算购买价格 600元/小时 不限
提供机构:
苏州核数聚信息科技有限公司
创建时间:
2024-03-23
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

arXiv 收录

GHCN

GHCN(Global Historical Climatology Network)是一个全球历史气候网络数据集,包含了全球各地气象站记录的每日气象数据,如温度、降水、风速等。该数据集用于研究气候变化和天气模式。

www.ncei.noaa.gov 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

MECCANO

MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。

arXiv 收录