4n3mone/komuchat
收藏Hugging Face2024-04-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/4n3mone/komuchat
下载链接
链接失效反馈官方服务:
资源简介:
KOMUChat是一个用于人工智能学习的在线社区对话数据集,包含从에펨코리아和인스티즈两个在线社区收集的约3万条句子对。每个数据条目包括标签(tag)、问题(Q)、答案(A)和来源(src)。问题(Q)是社区帖子标题的提问句子,答案(A)是帖子中第一个评论的回复句子。标签(tag)是社区板块内的详细标签/选项卡,来源(src)是数据来源的网站。
KOMUChat是一个用于人工智能学习的在线社区对话数据集,包含从에펨코리아和인스티즈两个在线社区收集的约3万条句子对。每个数据条目包括标签(tag)、问题(Q)、答案(A)和来源(src)。问题(Q)是社区帖子标题的提问句子,答案(A)是帖子中第一个评论的回复句子。标签(tag)是社区板块内的详细标签/选项卡,来源(src)是数据来源的网站。
提供机构:
4n3mone
原始信息汇总
数据集概述
- 名称: KOMUChat
- 描述: 由에펨코리아和인스티즈收集的大约3万条句子对数据,用于人工智能学习。
数据集特征
- tag: 社区板块内的详细标签/选项卡,字符串类型。
- Q: 利用社区帖子标题的提问句子,字符串类型。
- A: 利用帖子中第一个评论的回答句子,字符串类型。
- src: 数据来源网站,字符串类型。
数据集划分
- 训练集: 包含24613个例子,总大小为3252658字节。
- 验证集: 包含6154个例子,总大小为814917字节。
数据集大小
- 下载大小: 2438607字节。
- 数据集总大小: 4067575字节。
数据文件配置
- 默认配置:
- 训练数据路径:
data/train-* - 验证数据路径:
data/validation-*
- 训练数据路径:



