five

heegyu/korquad-chat-v1

收藏
Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/heegyu/korquad-chat-v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含9619个韩语知识库对话,基于KorQuAD 1.0数据中的文档,通过ChatGPT生成。对话内容涉及特定的知识领域,如医学和生物学,用户和机器人分别用<usr>和<bot>标签标识。数据集展示了用户和机器人之间的对话,对话内容基于文档中的信息,机器人根据用户的问题提供准确的回答。

该数据集包含9619个韩语知识库对话,基于KorQuAD 1.0数据中的文档,通过ChatGPT生成。对话内容涉及特定的知识领域,如医学和生物学,用户和机器人分别用<usr>和<bot>标签标识。数据集展示了用户和机器人之间的对话,对话内容基于文档中的信息,机器人根据用户的问题提供准确的回答。
提供机构:
heegyu
原始信息汇总

数据集概述

数据集基本信息

  • 名称: 한국어 지식기반 대화 데이터셋
  • 数量: 9619个数据样本
  • 许可证: MIT

数据集来源与生成

  • 来源: 基于KorQuAD 1.0数据集
  • 生成方式: 使用ChatGPT对KorQuAD 1.0中的文档进行处理和生成

数据样本结构

  • 示例结构:
    • : korquad-chat
    • 文本: 包含系统提示、用户和机器人的对话内容

对话处理规则

  • 对话格式: 用户和机器人之间的对话,使用特定的标签如<|bot|>和<|user|>来标识对话角色
  • 对话内容限制:
    • 每个发言最多3个句子
    • 对话中不得包含对文本的评价或提及
    • 对话双方需使用“A씨”和“B씨”进行称呼
    • 对话总长度不超过200词
    • 对话双方需进行8轮交流
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作