five

茂名市信宜市教育局行政给付服务事项信息|教育行政数据集|数据分析数据集

收藏
开放广东2023-01-30 更新2024-02-29 收录
教育行政
数据分析
下载链接:
https://gddata.gd.gov.cn/opdata/base/collect?chooseValue=collectForm
下载链接
链接失效反馈
资源简介:
该数据包含2022年信宜市教育局行政给付服务事项信息,指对其变动情况进行跟踪、采集、分析、预测、公布的活动,从而提高时效性和准确性。
提供机构:
茂名市
创建时间:
2023-01-30
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

WenetSpeech

WenetSpeech是一个大规模的多领域普通话语音数据集,总时长超过22400小时,包括10000+小时高质量标注语音、2400+小时弱标注语音和约10000小时未标注语音。数据来源于YouTube和Podcast,覆盖多种说话风格、场景、领域、话题和噪声条件。通过光学字符识别(OCR)方法和高质量自动语音识别(ASR)转录系统生成音频/文本分割候选,并采用端到端标签错误检测方法进行验证和过滤。此外,提供三个手动标注的高质量测试集用于评估。WenetSpeech是目前最大的开源普通话语音语料库,适用于生产级语音识别研究。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

Drone-detection-dataset

包含红外、可见光和音频数据的数据集,用于训练和评估无人机检测传感器和系统。数据集包含90个音频片段和650个视频(365个红外和285个可见光),如果从所有视频中提取所有图像,数据集共有203328个带标注的图像。

github 收录