wentingzhao/couldask
收藏Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/wentingzhao/couldask
下载链接
链接失效反馈官方服务:
资源简介:
CouldAsk基准测试用于评估语言模型在检测和重新表述无法回答的问题方面的表现。数据集包含多个配置,每个配置具有不同的特征,如问题、主题、方面、上下文、实体和可回答性。数据集的分割信息、下载大小和数据集大小也提供了详细信息。数据集的许可证为MIT,任务类别为问答,语言为英语,规模类别为1K<n<10K。
CouldAsk基准测试用于评估语言模型在检测和重新表述无法回答的问题方面的表现。数据集包含多个配置,每个配置具有不同的特征,如问题、主题、方面、上下文、实体和可回答性。数据集的分割信息、下载大小和数据集大小也提供了详细信息。数据集的许可证为MIT,任务类别为问答,语言为英语,规模类别为1K<n<10K。
提供机构:
wentingzhao
原始信息汇总
数据集概述
1. Bandit_QA
- 特征:
- question: 字符串
- topic: 字符串
- aspect: 字符串
- context: 字符串
- entities: 字符串序列
- answerable: 整数64位
- 分割:
- test: 2070个样本,3133012字节
- 下载大小: 1766780字节
- 数据集大小: 3133012字节
2. BBC
- 特征:
- context: 字符串
- question: 字符串
- answers: 字符串序列
- answerable: 整数64位
- entities: 字符串序列
- 分割:
- test: 278个样本,808483字节
- 下载大小: 450092字节
- 数据集大小: 808483字节
3. QA2
- 特征:
- question: 字符串
- answerable: 整数64位
- entities: 字符串序列
- context: 字符串
- 分割:
- test: 506个样本,2169649字节
- 下载大小: 1327255字节
- 数据集大小: 2169649字节
4. Reddit
- 特征:
- context: 字符串
- question: 字符串
- answers: 字符串序列
- answerable: 整数64位
- entities: 字符串序列
- 分割:
- test: 313个样本,743298字节
- 下载大小: 407391字节
- 数据集大小: 743298字节
5. Squad_V2
- 特征:
- context: 字符串
- question: 字符串
- entities: 字符串序列
- answerable: 整数64位
- 分割:
- test: 1000个样本,915893字节
- 下载大小: 426736字节
- 数据集大小: 915893字节
6. Yelp
- 特征:
- context: 字符串
- question: 字符串
- answers: 字符串序列
- answerable: 整数64位
- entities: 字符串序列
- 分割:
- test: 165个样本,346086字节
- 下载大小: 215983字节
- 数据集大小: 346086字节
通用信息
- 许可证: MIT
- 任务类别: 问答
- 语言: 英语
- 大小类别: 1K<n<10K



