five

NeSTudio/NestQuad

收藏
Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NeSTudio/NestQuad
下载链接
链接失效反馈
官方服务:
资源简介:
NestQuad数据集是一个结合了Sberquad和通过wizard方法创建的数据集,专门用于问答系统。该数据集包含75300个条目,具有5.48的上下文增强,2023年更新,评估客观性为70%,结构客观性为95%,完整性为90%,相关性为60%,兼容性为90%。数据集包含49161个独特答案和13728个独特上下文。数据集的结构包括id、cluster、title、context、question、answers、answers_start和answers_end字段。数据来源包括Sberquad和旅游信息网站。
提供机构:
NeSTudio
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 问答
  • 语言: 俄语
  • 数据集名称: NestQuad
  • 数据集大小: 10K<n<100K

详细属性

  • 维度: 75300
  • 上下文增强: 5.48
  • 更新时间: 2023年
  • 客观性评估: 70%
  • 结构客观性: 95%
  • 完整性: 90%
  • 相关性: 60%
  • 兼容性: 90%
  • 唯一答案数量: 49161
  • 唯一上下文数量: 13728

数据集结构

  • 字段: id, cluster, title, context, question, answers, answers_start, answers_end
  • 描述: 包含唯一ID、相关主题集合、具体主题、上下文、问题、答案及其在上下文中的起始和结束位置。

数据来源

  • Sberquad: 来自Hugging Face (https://huggingface.co/datasets/sberquad)
  • 旅游信息: 来自tour-poisk.com/articles/ 和 sravni.ru/enciklopediya/turizm/oteli/
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作