five

CampAIgn/DDD_French_version

收藏
Hugging Face2024-09-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CampAIgn/DDD_French_version
下载链接
链接失效反馈
官方服务:
资源简介:
Deep Dungeons and Dragons数据集包含长篇多回合和多角色协作的RPG故事,每个回合包含从特定角色视角出发的故事延续,包括对话和散文。该数据集是2018年由Annie Louis和Charles Sutton发布的Deep Dungeons and Dragons的清理和重新格式化版本,原始数据来自roleplayerguild.com的公共游戏记录。处理过程中移除了图像和链接,并匿名化了用户名。
提供机构:
CampAIgn
原始信息汇总

数据集详情

数据集描述

Deep Dungeons and Dragons 是一个包含长篇多轮和多角色协作角色扮演游戏故事的数据集,附带相关角色卡片。该数据集包含 56,000 个回合,分布在 1544 个故事中,涉及 9771 个角色,总计 5000 万个 Llama 令牌。每个回合包含从定义角色角度出发的多段故事延续,包括对话和散文。

数据集特征

  • index: 索引,数据类型为 int64
  • thread_id: 线程 ID,数据类型为 int64
  • message_id: 消息 ID,数据类型为 int64
  • author_id: 作者 ID,数据类型为 int64
  • author_num_posts: 作者发帖数量,数据类型为 int64
  • message: 消息内容,数据类型为 string
  • character: 角色,数据类型为 string

数据集分割

  • train: 训练集,包含 26401 个样本,总大小为 216610832 字节

数据集大小

  • 下载大小: 58427511 字节
  • 数据集大小: 216610832 字节

配置

  • default: 默认配置,包含训练集文件路径 data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作