Chinese-Roleplay-Novel|角色扮演数据集|游戏开发数据集
收藏中文角色扮演小说数据集
概述
- 数据集名称: Chinese-Roleplay-Novel
- 许可证: Apache 2.0
- 语言: 中文
数据集描述
- 数据来源: 基于4500条小说文本,使用GPT4o构建。
- 数据量: 约260条酒馆风格的多轮对话数据。
- 数据特点: 每轮对话包含状态数据,如时间、角色状态、任务进度等。
数据结构
- world: 当前故事的世界观,可用于system prompt。
- scence: 当前故事发生的场景,包括时间、地点、环境、任务目标。
- character: 当前故事中可能出现的角色及其简介。
- field: 每轮对话中需要生成的状态信息。
- conversations: 对话内容,包括问候语、主角(user)和系统(assistant)。
- fields_format: 状态信息的填充格式prompt,可能是列表、表格、JSON等各种形式。
- format_list: 状态信息的填充结果。
状态信息示例
健康状态: 🌿 良好,身体颤抖 精神状态: 🌟 恐惧,极度紧张 任务进度: 📈 遇到老头和王八 物品栏: 🎒 无特殊物品

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录