heegyu/korquad-chat-v1
收藏Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/heegyu/korquad-chat-v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含9619个韩语知识库对话,基于KorQuAD 1.0数据中的文档,通过ChatGPT生成。对话内容涉及特定的知识领域,如医学和生物学,用户和机器人分别用<usr>和<bot>标签标识。数据集展示了用户和机器人之间的对话,对话内容基于文档中的信息,机器人根据用户的问题提供准确的回答。
该数据集包含9619个韩语知识库对话,基于KorQuAD 1.0数据中的文档,通过ChatGPT生成。对话内容涉及特定的知识领域,如医学和生物学,用户和机器人分别用<usr>和<bot>标签标识。数据集展示了用户和机器人之间的对话,对话内容基于文档中的信息,机器人根据用户的问题提供准确的回答。
提供机构:
heegyu
原始信息汇总
数据集概述
数据集基本信息
- 名称: 한국어 지식기반 대화 데이터셋
- 数量: 9619个数据样本
- 许可证: MIT
数据集来源与生成
- 来源: 基于KorQuAD 1.0数据集
- 生成方式: 使用ChatGPT对KorQuAD 1.0中的文档进行处理和生成
数据样本结构
- 示例结构:
- 源: korquad-chat
- 文本: 包含系统提示、用户和机器人的对话内容
对话处理规则
- 对话格式: 用户和机器人之间的对话,使用特定的标签如<|bot|>和<|user|>来标识对话角色
- 对话内容限制:
- 每个发言最多3个句子
- 对话中不得包含对文本的评价或提及
- 对话双方需使用“A씨”和“B씨”进行称呼
- 对话总长度不超过200词
- 对话双方需进行8轮交流



