five

larryvrh/belle_resampled_78K_CN

收藏
Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/larryvrh/belle_resampled_78K_CN
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: conversations list: - name: from dtype: string - name: value dtype: string - name: id dtype: string - name: category dtype: string splits: - name: train num_bytes: 197491538 num_examples: 78000 download_size: 108247334 dataset_size: 197491538 configs: - config_name: default data_files: - split: train path: data/train-* task_categories: - text-generation - conversational language: - zh size_categories: - 10K<n<100K --- # Dataset Card for "belle_resampled_78K_CN" 通过启发式方法过滤后的[BelleGroup/train_3.5M_CN](https://huggingface.co/datasets/BelleGroup/train_3.5M_CN),移除了语料中明显的错误和低质量内容。 之后进行了均匀采样,从每个类别中提取出6000条最长的对话。 ## 样例 ``` { "id":"66623028", "conversations":[ { "from":"human", "value":"归纳介绍三种不同类型的电影题材" }, { "from":"assistant", "value":"1. 动作片:动作片通常强调动作和战斗场面,故事情节紧凑,充满了紧张和兴奋的氛围。主角一般是具有超凡实力或特殊技能的英雄人物,往往会与反派角色进行一系列激烈的格斗,追逐和爆破等酷炫场面。例如《速度与激情》和《复仇者联盟》等。\n2. 爱情片:爱情片是以爱情为主题的电影,着重呈现角色之间的感情纠葛,展现了爱情的美好和悲壮。情节与角色之间的发展令人深思,增加了观众的感性体验。这种电影的故事情节主要以人类与人类之间的情感变化为主题。例如《泰坦尼克号》和《让子弹飞》等。\n3. 科幻片:科幻片是以未来科技和未知世界为主题的电影,通常包括时间旅行、外星人、虚拟现实、未来社会等各种奇幻的元素。这种电影描绘了一种比现实更加宏伟、更加神秘和惊奇的世界。例如《星际穿越》和《发条橙》等。" } ] } { "id":"18205437", "conversations":[ { "from":"human", "value":"根据给定的食材,编写一道美食菜谱。\n鸡腿肉、蘑菇、洋葱" }, { "from":"assistant", "value":"鸡肉炒蘑菇洋葱\n食材:\n- 鸡腿肉 400克,去骨去皮切成小块\n- 蘑菇 200克,切片\n- 洋葱 1个,切丝\n- 生姜 适量,切丝\n- 酱油 2勺\n- 料酒 1勺\n- 盐 适量\n- 白胡椒粉 适量\n- 植物油 适量\n做法:\n1. 在一个碗里放入切好的鸡腿肉块,加入酱油、料酒和适量的白胡椒粉,搅拌均匀,腌制10分钟。\n2. 热锅凉油,加入姜丝翻炒,放入腌好的鸡肉块翻炒至变色。\n3. 加入洋葱丝和蘑菇,翻炒2-3分钟至蘑菇变软。\n4. 加入适量的盐和少量的水,盖上锅盖焖煮5分钟直至鸡肉熟透。\n5. 最后翻炒几下,使汤汁变浓稠即可。\n温馨提示:\n1. 在腌制鸡肉时,如果想让肉质更嫩滑,可以加入少量的淀粉和蛋清。\n2. 可以根据个人口味加入其他调料,如蒜末、辣椒等。\n3. 洋葱和蘑菇可以用其他蔬菜代替,如青椒、胡萝卜等。" }, { "from":"human", "value":"太好了,我会试着照着你教的做一次,但是我最近买了一部新相机,想让你推荐一些好的拍照地点。" }, { "from":"assistant", "value":"当地的风景区、公园、景点等等都是比较适合拍照的地点。如果你想要一些特别的地方,可以考虑一些建筑群,街道巷子、咖啡馆、书店等具有文艺气息的地方。" }, { "from":"human", "value":"嗯,这些地方都很不错,但是我还想找一些可以体验当地文化和风俗的地点,你有什么好的建议吗?" }, { "from":"assistant", "value":"如果你想要更深入地了解当地文化和风俗,可以考虑参加一些游学活动,比如参观当地的博物馆、参加民俗节庆、尝试当地美食等等。此外,也可以去一些小城镇,感受那里的古朴风情。" } ] } ``` ### 字段: ``` id: 数据id conversations: 数据内容,以对话形式给出,包括多轮和单轮对话的数据 category: 数据类别 ```
提供机构:
larryvrh
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • conversations: 对话内容,包含以下子字段:
      • from: 对话来源,数据类型为字符串
      • value: 对话内容,数据类型为字符串
    • id: 数据ID,数据类型为字符串
    • category: 数据类别,数据类型为字符串
  • 分割:

    • train: 训练集,包含78000个样本,总大小为197491538字节
  • 下载大小: 108247334字节

  • 数据集大小: 197491538字节

配置

  • 默认配置:
    • 数据文件路径: data/train-*

任务类别

  • 文本生成
  • 对话系统

语言

  • 中文

数据集大小类别

  • 10K < n < 100K

样例

json { "id": "66623028", "conversations": [ { "from": "human", "value": "归纳介绍三种不同类型的电影题材" }, { "from": "assistant", "value": "1. 动作片:动作片通常强调动作和战斗场面,故事情节紧凑,充满了紧张和兴奋的氛围。主角一般是具有超凡实力或特殊技能的英雄人物,往往会与反派角色进行一系列激烈的格斗,追逐和爆破等酷炫场面。例如《速度与激情》和《复仇者联盟》等。 2. 爱情片:爱情片是以爱情为主题的电影,着重呈现角色之间的感情纠葛,展现了爱情的美好和悲壮。情节与角色之间的发展令人深思,增加了观众的感性体验。这种电影的故事情节主要以人类与人类之间的情感变化为主题。例如《泰坦尼克号》和《让子弹飞》等。 3. 科幻片:科幻片是以未来科技和未知世界为主题的电影,通常包括时间旅行、外星人、虚拟现实、未来社会等各种奇幻的元素。这种电影描绘了一种比现实更加宏伟、更加神秘和惊奇的世界。例如《星际穿越》和《发条橙》等。" } ] } { "id": "18205437", "conversations": [ { "from": "human", "value": "根据给定的食材,编写一道美食菜谱。 鸡腿肉、蘑菇、洋葱" }, { "from": "assistant", "value": "鸡肉炒蘑菇洋葱 食材:

  • 鸡腿肉 400克,去骨去皮切成小块
  • 蘑菇 200克,切片
  • 洋葱 1个,切丝
  • 生姜 适量,切丝
  • 酱油 2勺
  • 料酒 1勺
  • 盐 适量
  • 白胡椒粉 适量
  • 植物油 适量 做法:
  1. 在一个碗里放入切好的鸡腿肉块,加入酱油、料酒和适量的白胡椒粉,搅拌均匀,腌制10分钟。
  2. 热锅凉油,加入姜丝翻炒,放入腌好的鸡肉块翻炒至变色。
  3. 加入洋葱丝和蘑菇,翻炒2-3分钟至蘑菇变软。
  4. 加入适量的盐和少量的水,盖上锅盖焖煮5分钟直至鸡肉熟透。
  5. 最后翻炒几下,使汤汁变浓稠即可。 温馨提示:
  6. 在腌制鸡肉时,如果想让肉质更嫩滑,可以加入少量的淀粉和蛋清。
  7. 可以根据个人口味加入其他调料,如蒜末、辣椒等。
  8. 洋葱和蘑菇可以用其他蔬菜代替,如青椒、胡萝卜等。" }, { "from": "human", "value": "太好了,我会试着照着你教的做一次,但是我最近买了一部新相机,想让你推荐一些好的拍照地点。" }, { "from": "assistant", "value": "当地的风景区、公园、景点等等都是比较适合拍照的地点。如果你想要一些特别的地方,可以考虑一些建筑群,街道巷子、咖啡馆、书店等具有文艺气息的地方。" }, { "from": "human", "value": "嗯,这些地方都很不错,但是我还想找一些可以体验当地文化和风俗的地点,你有什么好的建议吗?" }, { "from": "assistant", "value": "如果你想要更深入地了解当地文化和风俗,可以考虑参加一些游学活动,比如参观当地的博物馆、参加民俗节庆、尝试当地美食等等。此外,也可以去一些小城镇,感受那里的古朴风情。" } ] }

字段说明

  • id: 数据ID
  • conversations: 数据内容,以对话形式给出,包括多轮和单轮对话的数据
  • category: 数据类别
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作