有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
diegopdlv5/test_dataset_0049c
该数据集主要包含音频数据,分为训练集,共有135个样本,总大小为51580253字节。下载大小为51573551字节。
hugging_face 收录
Global Forest Watch (GFW)
Global Forest Watch (GFW) 是一个全球森林监测平台,提供关于森林覆盖变化、火灾、森林砍伐、土地利用变化等实时和历史数据。数据集包括全球森林覆盖地图、森林砍伐警报、火灾热点、土地覆盖变化等信息。
globalforestwatch.org 收录
Chinese-Poetry-Corpus
本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。
github 收录
Global Burden of Disease Study (GBD)
全球疾病负担研究(GBD)数据集提供了全球范围内疾病、伤害和风险因素的详细统计数据。该数据集包括了各种健康指标,如死亡率、发病率、伤残调整生命年(DALYs)等,涵盖了多个国家和地区。数据集还提供了不同年龄组、性别和时间段的详细分析。
ghdx.healthdata.org 收录
FGRC-SCD
基于CCF23-EVAL任务6的电信网络诈骗案件数据集合成了风险短信与对话数据集,并基于多样性、任务相关性和是否满足人类偏好进行筛选,可用于风险细粒度分类任务和风险摘要生成任务测评。
huggingface 收录