汕头市龙湖区人社局政务服务事项实施目录基本信息|政务服务数据集|数据记录数据集
收藏AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face2024-03-04 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github2024-05-31 收录
animelist-dataset
一个基于JSON的动漫数据集,包含了最重要的元数据以及与其他多个动漫网站(如MAL、ANIDB、ANILIST、KITSU等)的交叉引用。数据集每周更新,涵盖了从10K到100K条记录的规模,主要语言为英语和日语,标签为'anime'。
huggingface2024-12-12 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org2024-10-27 收录
肺癌科研数据集
本数据集是由我司构建的一个医疗文本数据集,可用于大模型预训练、监督微调等场景。该数据集汇聚了大量的真实肺癌患者临床数据,通过知识抽取技术,系统化整理肿瘤大小、肿瘤转移情况、吸烟史、吸烟时长等肺癌专病库字段,为医疗研究、智能诊断、辅助决策提供坚实的数据支撑,加速医学领域的创新应用。数据集规模达到60专病库字段,涵盖1万次就诊数据。
山东省数据知识产权存证登记平台2024-12-20 收录