东莞市麻涌镇镇街和社区与街道信息|行政区划数据集|城市管理数据集
收藏Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
RDD2022
RDD2022是一个多国图像数据集,用于自动道路损伤检测,由印度理工学院罗凯里分校交通系统中心等机构创建。该数据集包含来自六个国家的47,420张道路图像,标注了超过55,000个道路损伤实例。数据集通过智能手机和高分辨率相机等设备采集,旨在通过深度学习方法自动检测和分类道路损伤。RDD2022数据集的应用领域包括道路状况的自动监测和计算机视觉算法的性能基准测试,特别关注于解决多国道路损伤检测的问题。
arXiv 收录
校园防欺凌 AI语音预警
校园防欺凌 AI语音预警系统特点1、敏感词检测 可端侧进行分析,如区域内出现风险预示词语,如骂人、霸凌、呼救等词语,接直接触发预警到中心。2、分贝强声检测 实时采集并上传分贝值,不对语音音频进行采集,尊重学生的隐私权。另外,降低常规声音(如雷声、雨声、打鼾声等)的分贝值。3、异常声检测 可独立识别音频特性及类型通过对环境内不同声音进行分析比对,确定其声源类型,区分出有风险的声音(如砸玻璃声、人员尖叫、哭声等)并自动触发报警。4、内置语音播报可自定义语音文件,随时随地进行全局广播。语音合成芯片支持多种语音模式,例如文字转语音,真人声录制,特定音效定制等。
郑州数据交易中心 收录
腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)
这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。
OpenDataLab 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录