One-Long-Ass-Genshin-Roleplay|原神数据集|角色扮演对话数据集
收藏ERP/RP 数据集
详细信息
- 许可证: Apache 2.0
- 语言: 英语
- 标签: not-for-all-audiences
- 名称: ERP/RP Dataset
- 数据量: 100K<n<1M
描述
该数据集混合了合成数据和人类数据,主要来源于与《原神》不同角色的长时间角色扮演对话。这是一个持续进行的长篇故事,适合用于训练模型处理较长上下文以教授连续性,还包括群聊内容。数据已经过尽可能的清理,去除了大部分GPT痕迹,但可能仍有一些残留。特别感谢@SicariusSicariiStuff进行格式化。
重要提示
- 完成数据按字母顺序排序,而指令数据按时间顺序排序,通常建议使用后者。

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
FSDD
FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。
github.com 收录
ST-EVCDP
这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录