bai-roleplay/evol-character-200
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bai-roleplay/evol-character-200
下载链接
链接失效反馈官方服务:
资源简介:
Evol-character数据集是一个由GPT3.5和GPT4生成的角色扮演数据集,包含200个角色的详细设定及对话。数据集分为三个子集:evol-character-gpt3.5.json、evol-character-male-gpt3.5.json和evol-character-gpt4.json。每个角色的数据包括角色信息和对话内容,GPT4版本的数据更为详细和精细。该数据集的特点是角色设定精细、角色性格多样、语言和动作描述生动,并提供了一个通用的角色扮演数据生成框架。
Evol-character数据集是一个由GPT3.5和GPT4生成的角色扮演数据集,包含200个角色的详细设定及对话。数据集分为三个子集:evol-character-gpt3.5.json、evol-character-male-gpt3.5.json和evol-character-gpt4.json。每个角色的数据包括角色信息和对话内容,GPT4版本的数据更为详细和精细。该数据集的特点是角色设定精细、角色性格多样、语言和动作描述生动,并提供了一个通用的角色扮演数据生成框架。
提供机构:
bai-roleplay
原始信息汇总
Evol-character 数据集
概述
Evol-character 数据集是一个用于角色扮演和文本生成的数据集,包含由GPT3.5和GPT4生成的角色设定和对话。数据集旨在提供精细化的角色设定和多样性的角色性格,以增强角色扮演体验。
数据集下载
数据集目前只公开了部分数据,公开的数据由三份文件组成,每份文件包含200个角色的设定以及对话。可在Huggingface中下载已公开数据或申请获取全部数据:下载链接
数据生成框架
数据集使用OpenAI API接口基于特定框架生成,该框架包括种子特征集和基础设定、角色设定的进化、反馈循环以及角色扮演和对话生成等步骤。
数据结构
数据集包含三个文件:
evol-character-gpt3.5.json:包含200个女性角色,每个角色包含instruction和dialog两部分。evol-character-male-gpt3.5.json:包含200个男性角色,数据结构与evol-character-gpt3.5.json相同。evol-character-gpt4.json:包含200个角色,数据更加详细和精细,每个角色包含setting和iqa两部分。
与现有数据集对比
现有角色扮演数据集
现有数据集包括:
- character AI open
- BelleGroup/generated chat 0.4M
- Traditional Chinese roleplay chat Dataset
- Haruhi Zero RolePlaying movie PIPPA
我们的优势
- 精细化的角色设定数据:提供详尽的角色身份、语言风格、背景故事等信息。
- 多样性的角色性格:涵盖广泛的二次元角色性格,保证低重复性和高丰富度。
- 生动的语言和动作描述:包含角色的动作描述,使对话更加生动和真实。
- 通用角色扮演数据生成框架:提供一个通用的角色扮演数据生成框架,释放OpenAI API的角色扮演能力。
联系我们
如有需要或任何疑问,请联系邮箱:info@bauhiniaai.com
项目使用与免责声明
本项目遵循Apache 2.0许可协议。使用数据时请遵守OpenAI的相关规定,并对数据的真实性、准确性以及安全性进行谨慎考虑。开发者不对使用本数据集可能引起的任何形式的损害或纠纷承担责任。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个中文角色扮演对话数据集,包含200个由GPT3.5和GPT4生成的角色的详细设定和对话,特点是角色设定精细、语言风格多样且包含动作描述。数据集在生成过程中存在列不匹配的问题,导致部分数据无法正常预览。
以上内容由遇见数据集搜集并总结生成



