Tarklanse/Traditional_Chinese_roleplay_chat_Dataset
收藏Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tarklanse/Traditional_Chinese_roleplay_chat_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
這個資料集是以繁體中文為主,將各種由ChatGPT生成與極小部分個人撰寫的對話內容整理為alpaca dataset format的格式。以一層一層堆疊的方式,將一則對話紀錄拆成數筆資料(共約1000則對話),在幾次嘗試性的訓練中能夠讓llama2重現原本英文那種很活躍的對話風格,並且能夠維持善於扮演各種角色的能力。目前個人有以這個資料集製作一個lora。2023年09月07日更新,為資料集加入一些中英翻譯的句子,以期AI能以更好的文字去描寫他的動作,並增加了一些與食物有關的對話,希望能降低AI生出奇怪食物名的機率。
這個資料集是以繁體中文為主,將各種由ChatGPT生成與極小部分個人撰寫的對話內容整理為alpaca dataset format的格式。以一層一層堆疊的方式,將一則對話紀錄拆成數筆資料(共約1000則對話),在幾次嘗試性的訓練中能夠讓llama2重現原本英文那種很活躍的對話風格,並且能夠維持善於扮演各種角色的能力。目前個人有以這個資料集製作一個lora。2023年09月07日更新,為資料集加入一些中英翻譯的句子,以期AI能以更好的文字去描寫他的動作,並增加了一些與食物有關的對話,希望能降低AI生出奇怪食物名的機率。
提供机构:
Tarklanse
原始信息汇总
Traditional_Chinese_roleplay_chat_Dataset 概述
数据集基本信息
- 任务类别:
- 文本生成
- 文本到文本生成
- 语言:繁體中文
- 许可证:CC-BY-SA-4.0
数据集描述
- 该数据集主要包含由ChatGPT生成及极小部分个人撰写的繁體中文对话内容,整理成alpaca dataset format格式。
- 数据集通过将每则对话记录拆分为多笔数据(约1000则对话),以层叠方式组织。
- 在初步训练中,该数据集能使llama2模型重现活跃的对话风格,并保持扮演多种角色的能力。
数据集更新
- 2023年9月7日更新内容:
- 增加了中英翻译的句子,以提升AI描述动作的文字质量。
- 增加了与食物相关的对话,旨在降低AI生成奇怪食物名的概率。



