PTCG-CHS-Datasets|宝可梦卡牌数据集|游戏数据数据集
收藏数据集概述
名称: PTCG-CHS-Datasets
描述: 该数据集包含宝可梦交易卡游戏简体中文版的卡片信息。数据集以JSON格式提供,包含每个系列中每张卡片的信息、卡片描述和图像。
数据集内容
- 格式: JSON
- 包含信息:
- 卡片信息
- 卡片描述
- 图像
使用条件
- 所有权: 数据集不属于分发者,所有权利、所有权或利益归官方机构所有。
- 使用目的: 仅供非商业、学术或研究目的使用。
- 商业用途: 未经官方所有人或授权实体许可,不得用于商业或盈利目的。
- 归属: 用户应承认数据来自官方来源,分发者不对其内容或使用负责。
- 不得再分发: 未经官方所有者或授权实体的明确书面同意,不得再分发或向第三方提供数据集。
- 遵守法律: 用户在使用数据集时必须遵守所有适用的法律、法规和道德准则。
- 无担保: 数据集按“原样”提供,不提供任何明示或暗示的担保。
联系方式
- 问题咨询: 上海宝可梦

MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录