five

Tarklanse/Traditional_Chinese_roleplay_chat_Dataset

收藏
Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tarklanse/Traditional_Chinese_roleplay_chat_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
這個資料集是以繁體中文為主,將各種由ChatGPT生成與極小部分個人撰寫的對話內容整理為alpaca dataset format的格式。以一層一層堆疊的方式,將一則對話紀錄拆成數筆資料(共約1000則對話),在幾次嘗試性的訓練中能夠讓llama2重現原本英文那種很活躍的對話風格,並且能夠維持善於扮演各種角色的能力。目前個人有以這個資料集製作一個lora。2023年09月07日更新,為資料集加入一些中英翻譯的句子,以期AI能以更好的文字去描寫他的動作,並增加了一些與食物有關的對話,希望能降低AI生出奇怪食物名的機率。

這個資料集是以繁體中文為主,將各種由ChatGPT生成與極小部分個人撰寫的對話內容整理為alpaca dataset format的格式。以一層一層堆疊的方式,將一則對話紀錄拆成數筆資料(共約1000則對話),在幾次嘗試性的訓練中能夠讓llama2重現原本英文那種很活躍的對話風格,並且能夠維持善於扮演各種角色的能力。目前個人有以這個資料集製作一個lora。2023年09月07日更新,為資料集加入一些中英翻譯的句子,以期AI能以更好的文字去描寫他的動作,並增加了一些與食物有關的對話,希望能降低AI生出奇怪食物名的機率。
提供机构:
Tarklanse
原始信息汇总

Traditional_Chinese_roleplay_chat_Dataset 概述

数据集基本信息

  • 任务类别
    • 文本生成
    • 文本到文本生成
  • 语言:繁體中文
  • 许可证:CC-BY-SA-4.0

数据集描述

  • 该数据集主要包含由ChatGPT生成及极小部分个人撰写的繁體中文对话内容,整理成alpaca dataset format格式。
  • 数据集通过将每则对话记录拆分为多笔数据(约1000则对话),以层叠方式组织。
  • 在初步训练中,该数据集能使llama2模型重现活跃的对话风格,并保持扮演多种角色的能力。

数据集更新

  • 2023年9月7日更新内容:
    • 增加了中英翻译的句子,以提升AI描述动作的文字质量。
    • 增加了与食物相关的对话,旨在降低AI生成奇怪食物名的概率。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作