NeSTudio/NestQuad
收藏Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NeSTudio/NestQuad
下载链接
链接失效反馈官方服务:
资源简介:
NestQuad数据集是一个结合了Sberquad和通过wizard方法创建的数据集,专门用于问答系统。该数据集包含75300个条目,具有5.48的上下文增强,2023年更新,评估客观性为70%,结构客观性为95%,完整性为90%,相关性为60%,兼容性为90%。数据集包含49161个独特答案和13728个独特上下文。数据集的结构包括id、cluster、title、context、question、answers、answers_start和answers_end字段。数据来源包括Sberquad和旅游信息网站。
提供机构:
NeSTudio
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 问答
- 语言: 俄语
- 数据集名称: NestQuad
- 数据集大小: 10K<n<100K
详细属性
- 维度: 75300
- 上下文增强: 5.48
- 更新时间: 2023年
- 客观性评估: 70%
- 结构客观性: 95%
- 完整性: 90%
- 相关性: 60%
- 兼容性: 90%
- 唯一答案数量: 49161
- 唯一上下文数量: 13728
数据集结构
- 字段: id, cluster, title, context, question, answers, answers_start, answers_end
- 描述: 包含唯一ID、相关主题集合、具体主题、上下文、问题、答案及其在上下文中的起始和结束位置。
数据来源
- Sberquad: 来自Hugging Face (https://huggingface.co/datasets/sberquad)
- 旅游信息: 来自tour-poisk.com/articles/ 和 sravni.ru/enciklopediya/turizm/oteli/



