five

dialogue

收藏
魔搭社区2024-12-23 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/nlcvcln/dialogue
下载链接
链接失效反馈
官方服务:
资源简介:
license: Apache License 2.0 #用户自定义标签 tags: - conversational languages: - en configs: # 配置数据集的子数据集和划分 - config_name: default data_files: - split: train path: "train_data.csv" - split: test path: "test_data.csv" --- <!--- 以上YAML section提供属性/tags描述---> <!--- 以下为markdown格式的dataset描述---> #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} ## 数据集描述 本数据是使用llama3 70b 根据traits生成的英文对话数据集 ### 数据集简介 提供对于数据集的介绍,支持的使用场景(包括支持的语言等)。 ### 数据集支持的任务 英文多轮对话,角色扮演 ## 数据集的格式和结构 ### 数据格式 压缩的jsonl文件 ## 数据集生成的相关信息 ### 原始数据 根据从traits中抽样随机生成 ### 生成过程 首先根据traits,让llm生成角色的profile 而后让llm根据角色的profile生成多轮对话 #### 标注者 标注者相关信息,尤其是当标着和原始数据提供者有所区别时。

license: Apache License 2.0 # Custom user tags tags: - conversational languages: - en configs: # Configure sub-datasets and dataset splits - config_name: default data_files: - split: train path: "train_data.csv" - split: test path: "test_data.csv" --- <!--- The above YAML section provides attribute/tags description ---> <!--- The following is the dataset description in markdown format ---> #### Download Methods :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} ## Dataset Description This is an English conversational dataset generated by LLaMA-3 70B based on traits. ### Dataset Overview Provides an introduction to the dataset and supported usage scenarios (including supported languages, etc.). ### Supported Tasks English multi-turn conversation, role-playing ## Dataset Format and Structure ### Data Format Compressed JSONL files ## Related Information on Dataset Generation ### Raw Data Randomly sampled and generated from traits ### Generation Process First, generate the character profile using the LLM based on traits, then generate multi-turn conversations via the LLM based on the character profile. #### Annotator Information Relevant information about annotators, especially when the annotator differs from the original data provider.
提供机构:
maas
创建时间:
2024-11-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作