dialogue
收藏魔搭社区2024-12-23 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/nlcvcln/dialogue
下载链接
链接失效反馈官方服务:
资源简介:
license: Apache License 2.0
#用户自定义标签
tags:
- conversational
languages:
- en
configs: # 配置数据集的子数据集和划分
- config_name: default
data_files:
- split: train
path: "train_data.csv"
- split: test
path: "test_data.csv"
---
<!--- 以上YAML section提供属性/tags描述--->
<!--- 以下为markdown格式的dataset描述--->
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
## 数据集描述
本数据是使用llama3 70b 根据traits生成的英文对话数据集
### 数据集简介
提供对于数据集的介绍,支持的使用场景(包括支持的语言等)。
### 数据集支持的任务
英文多轮对话,角色扮演
## 数据集的格式和结构
### 数据格式
压缩的jsonl文件
## 数据集生成的相关信息
### 原始数据
根据从traits中抽样随机生成
### 生成过程
首先根据traits,让llm生成角色的profile
而后让llm根据角色的profile生成多轮对话
#### 标注者
标注者相关信息,尤其是当标着和原始数据提供者有所区别时。
license: Apache License 2.0
# Custom user tags
tags:
- conversational
languages:
- en
configs: # Configure sub-datasets and dataset splits
- config_name: default
data_files:
- split: train
path: "train_data.csv"
- split: test
path: "test_data.csv"
---
<!--- The above YAML section provides attribute/tags description --->
<!--- The following is the dataset description in markdown format --->
#### Download Methods
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
## Dataset Description
This is an English conversational dataset generated by LLaMA-3 70B based on traits.
### Dataset Overview
Provides an introduction to the dataset and supported usage scenarios (including supported languages, etc.).
### Supported Tasks
English multi-turn conversation, role-playing
## Dataset Format and Structure
### Data Format
Compressed JSONL files
## Related Information on Dataset Generation
### Raw Data
Randomly sampled and generated from traits
### Generation Process
First, generate the character profile using the LLM based on traits, then generate multi-turn conversations via the LLM based on the character profile.
#### Annotator Information
Relevant information about annotators, especially when the annotator differs from the original data provider.
提供机构:
maas
创建时间:
2024-11-01



