five

Aratako/Rosebleu-1on1-Dialogues-RP

收藏
Hugging Face2024-07-21 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/Aratako/Rosebleu-1on1-Dialogues-RP
下载链接
链接失效反馈
官方服务:
资源简介:
Rosebleu-1on1-Dialogues-RP数据集是基于Aratako/Rosebleu-1on1-Dialogues数据集加工而成,增加了角色和作品设定,并针对角色扮演任务进行了优化。该数据集主要用于大型语言模型(LLM)的微调,特别是角色扮演任务的学习。数据格式类似于OpenAI API的`role`和`content`对,可以轻松转换为各模型的聊天模板。数据集包含三个版本,分别处理对话中的描述文本不同。数据集来源于成人向美少女游戏的剧本,包含不适合所有受众的内容。

The Rosebleu-1on1-Dialogues-RP dataset is based on the Aratako/Rosebleu-1on1-Dialogues dataset, with added character and work settings, and optimized for role-playing tasks. This dataset is primarily used for fine-tuning large language models (LLMs), especially for learning role-playing tasks. The data format is similar to OpenAI APIs `role` and `content` pairs, and can be easily converted into chat templates for various models. The dataset includes three versions, each handling the descriptive text in dialogues differently. The dataset originates from scripts of adult-oriented bishoujo games and contains content not suitable for all audiences.
提供机构:
Aratako
原始信息汇总

数据集概述

数据集名称

  • Rosebleu-1on1-Dialogues-RP

发布日期

  • 2025/05/17

数据集来源

数据集目的

  • 用于LLM的微调,特别是针对角色扮演任务的学习。

数据集格式

  • 采用rolecontent的配对形式,支持通过tokenizer.apply_chat_template()转换为各种模型的聊天模板数据集。

数据集内容

  • 包含角色设定、作品世界观和概述等信息,这些信息从Wikipedia和Niconico大百科整理而来,并嵌入到系统消息中以适应角色扮演。

数据集版本

  1. Rosebleu-1on1-Dialogues-RP-v1.jsonl
    • 地の文(背景描述)总是放在用户侧,助手侧仅包含对话。
  2. Rosebleu-1on1-Dialogues-RP-v2.jsonl
    • 地の文放在各自作品的主角侧,如果主角是助手侧,则地の文也放在助手侧。
  3. Rosebleu-three-persons-Dialogues-RP.jsonl
    • 三人对话,用户侧包含两人,助手侧包含一人,地の文处理与v2相同。

数据集限制

  • 缺乏特定场景的情景设置信息,角色设定和世界观在所有场景中使用相同内容,可能不适用于特定场景。
  • 地の文处理方法可能不是最佳,存在改进空间。

数据集内容注意事项

  • 包含成人向美少女游戏的场景,可能含有性描述文本。

数据集许可证

  • Apache-2.0

数据集使用

  • 适用于任何不违反许可证的用途,包括营利和非营利目的。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作