chargoddard/rpguild
收藏Hugging Face2023-12-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chargoddard/rpguild
下载链接
链接失效反馈官方服务:
资源简介:
数据集是从roleplayerguild网站抓取的,包含对话历史和角色简介的提示。由于用户名可能与多个角色简介相关联,角色分配有些模糊。`char_confidence`特征反映了这种分配正确的可能性。并非所有对话历史中的帖子都有相关的角色名称,`has_nameless`列反映了这一点。数据集有多个配置选项,包括默认配置、高置信度配置、修剪配置和语法过滤配置,建议使用语法过滤配置以获得更高质量的数据。
提供机构:
chargoddard
原始信息汇总
数据集概述
语言
- 英语
许可证
- CC BY-NC 4.0
数据集大小
- 100K<n<1M
任务类别
- 对话
- 文本生成
数据集配置
默认配置
- 特征:
- username: string
- char_name: string
- bio: string
- context: list
- text: string
- username: string
- char_name: string
- reply: string
- has_nameless: bool
- char_confidence: float64
- 分割:
- train
- num_bytes: 1921588254
- num_examples: 140469
- train
- 下载大小: 764073630
- 数据集大小: 1921588254
语法过滤配置
- 特征:
- username: string
- char_name: string
- bio: string
- context: list
- char_name: string
- text: string
- username: string
- reply: string
- char_confidence: float64
- 分割:
- train
- num_bytes: 371438765
- num_examples: 27053
- train
- 下载大小: 166606326
- 数据集大小: 371438765
高置信度配置
- 特征:
- username: string
- char_name: string
- bio: string
- context: list
- text: string
- username: string
- char_name: string
- reply: string
- has_nameless: bool
- char_confidence: float64
- 分割:
- train
- num_bytes: 949419370.7676569
- num_examples: 69403
- train
- 下载大小: 386317057
- 数据集大小: 949419370.7676569
修剪配置
- 特征:
- username: string
- char_name: string
- bio: string
- context: list
- text: string
- username: string
- char_name: string
- reply: string
- has_nameless: bool
- char_confidence: float64
- 分割:
- train
- num_bytes: 782484734.2032762
- num_examples: 57200
- train
- 下载大小: 326987882
- 数据集大小: 782484734.2032762
配置文件
- 默认配置:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
- 语法过滤配置:
- 数据文件:
- 分割: train
- 路径: grammar_filtered/train-*
- 数据文件:
- 高置信度配置:
- 数据文件:
- 分割: train
- 路径: high_confidence/train-*
- 数据文件:
- 修剪配置:
- 数据文件:
- 分割: train
- 路径: pruned/train-*
- 数据文件:
标签
- 角色扮演
- 不适合所有观众



